胡侠 作品数:15 被引量:56 H指数:4 供职机构: 杭州市科技信息研究院 更多>> 发文基金: 浙江省软科学研究计划 国家科技支撑计划 杭州市科技发展计划项目 更多>> 相关领域: 自动化与计算机技术 经济管理 文化科学 自然科学总论 更多>>
一种基于HITS和随机跳转的网页标签排序方法 2011年 Web 2.0应用的兴起,推进了情报学科由"文献组织"向"知识组织"演化。网页标签作为重要的Web2.0应用之一,已经成为大众组织知识的常用途径。然而,现有的标签排序方法难以有效满足知识组织的需求。本文在三核协同标签模型的基础上,充分考虑标签和用户、标签和标签、标签和文档之间的关系,提出了一种结合HITS和随机跳转的标签排序方法。该方法利用高质量标签和高质量用户之间的相互加强关系,根据标签之间的相似性来找出高质量相关标签,有效提高标签排序的质量。在Delicious数据集上的实验结果表明,该方法能较大提高标签排序的准确度。 汪兆鹏 胡侠 倪宁 王灿关键词:标签 排序 HITS 杭州市医药企业信息资源建设情况和需求调查 2008年 为全面了解杭州市医药企业信息资源的建设情况和需求情况。课题组对全市有代表性的医药企业进行了调研。根据杭州市医药企业规模的大小.从全市医药企业中选择了综合实力排名靠前的13家企业。被调研的医药企业行业分布状况为:化学药类企业6家,中药类企业7家,生物医药类企业6家,医疗器械类企业2家。 侯公林 汪亮 胡侠关键词:信息资源建设 企业信息资源 企业规模 生物医药 加快产业转型升级步伐推进创新型城市建设 林晔 施勇峰 陆敏 宦静 罗如意 倪芝青 沈悦林 俞钧 胡侠 钱赛波 《加快产业转型升级步伐推进创新型城市建设》是2010年杭州市软科学计划项目重点课题(编号:20100834M40),由杭州市科技信息研究院为主完成。该课题从产业转型升级的角度探讨创新型城市建设,对产业转型升级的意义和内涵...关键词:关键词:城市建设 汽车工业发展 基于谱聚类的多文档摘要新方法 被引量:4 2010年 提出一种基于谱聚类的多文档摘要方法。在将文档中主题相关的句子进行聚类的基础上,同时考虑不同主题类别的重要性,综合句子位置、长度等因素以得到句子的重要性得分。根据重要性从高到低抽取满足字数要求的句子作为最终摘要。实验结果表明,该方法相较于传统摘要方法有更好的性能,能够有效地提高摘要的质量。 林立 胡侠 朱俊彦关键词:多文档摘要 谱聚类 信息检索 杭州医药产业信息导航平台(杭州医药产业信息数据库) 林晔 汪亮 周恺秉 胡侠 钱野 倪芝青 徐克庄 王灿 樊小柯 沈悦林 陆敏 罗如意 吴其川 该平台应用心理分析方法,对杭州市医药企业的信息资源需求进行了研究。开展基于信息资源导航的网络信息资源标准化分类模式的研究,形成针对企业信息需求的分类方法。开展专业信息资源及网站的群体识别技术研究,形成"基于WEB COM...关键词: 浙江省高新技术企业发展研究及对策建议 被引量:2 2020年 2016年,国家修订出台了了新版《高新技术企业认定管理办法》,标志着一个新的高新技术企业发展时代正在到来。本文对比分析新办法的认定条件,研究浙江省高新技术企业发展周期、产出水平和区域综合实力,指出存在的问题,并给出持续推进发展的对策建议。 潘扬 吕月珍 胡侠 杨瑾网页文本信息自动提取技术综述 被引量:13 2009年 对W eb网页文本信息自动提取技术提供了一个较为全面的综述。通过分析在这个领域常用到的三种信息提取模型和四类机器学习算法的发展,较为全面地阐述了当前主流的网页文本信息自动提取技术,对比了各种方法的应用范围,最后对于该领域当前的热点问题和发展趋势进行了展望。 张俊英 胡侠 卜佳俊关键词:信息提取 网页 人造肉:探索未来食物变革 被引量:1 2022年 “人造肉”是一种肉类替代品,可定义为人工制造出来的肉类,而不是通过养殖动物来提供的肉类。2013年8月,荷兰马斯特里赫特大学的马克·波斯特宣布利用干细胞技术成功培育出全球首块实验室牛肉。之后,人造肉引起世界各国政府、科技界和产业界的高度重视,并被《麻省理工科技评论》评选为2019年十大突破性技术之一。 胡侠关键词:干细胞技术 实验室 国内城市人工智能政策梳理 被引量:1 2019年 目前,全国各地围绕人工智能,相继出台了一些政策鼓励和促进人工智能产业的发展(见表1)。这些政策包括对人工智能产业发展的指导性意见和推动人工智能发展的落地政策。课题组梳理了各地在推动人工智能产业发展中的各项政策举措,选取上海、广州、成都、湖州德清政策进行详细对比,以供参考。企业研发费用补助上海项目支持额度一般不超过项目总投资的30%。总投资在1500万元及以下的一般项目,单个项目支持金额不超过300万元;总投资在1500万元以上的重点项目,单个项目支持金额不超过2000万元。 胡侠 杨瑾关键词:企业研发费用 人工智能 项目总投资 基于树距离规范化的专利聚类方法 被引量:2 2012年 专利数据包含了各种丰富的信息。通过对专利数据聚类,可以将它们划分为语义或结构上相似的子集,从而为发现数据中所蕴含的有用模式和知识提供更为深入的洞察力。传统的专利数据聚类方法通常只是利用专利数据的某项属性实现聚类,没有充分利用专利数据所包含的多种丰富信息。本文针对现有专利数据聚类方法的不足,提出了一种综合利用专利摘要文本和IPC分类号的专利聚类方法PDICluster。该方法通过解析IPC分类号中包含的树型结构信息,利用树距离度量专利数据之间的相似性,并综合专利摘要文本相似性和IPC分类号相似性信息来实现专利数据聚类。实际专利数据上的聚类实验结果验证了PDICluster方法的有效性。 胡侠 林晔 汪亮 盛夏 王灿关键词:IPC