北京拓尔思信息技术股份有限公司
- 作品数:180 被引量:336H指数:10
- 相关作者:都云程王弘蔚房祥林春雨付成睿更多>>
- 相关机构:北京信息科技大学北京大学中国电子技术标准化研究院更多>>
- 发文基金:国家自然科学基金北京市教委科技发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学经济管理哲学宗教更多>>
- 走出报业新闻信息服务的困境
- 2004年
- 施水才高建国
- 关键词:中国报业新闻信息服务跨媒体外资
- TRS文本挖掘软件
- 肖诗斌王洪俊孙丽华肖锋吕学强范彦革王弘蔚
- 在当今信息爆炸式增长的态势下,国际上很多国家都抓紧对文本处理技术的研究,以期能对“堆积如山”的信息进行有效的过滤、开发和利用,提取和发现具有指导意义的知识。在中国,北京拓尔思信息技术有限公司(简称TRS公司)有效结合自然...
- 关键词:
- 关键词:中文文本信息处理
- 建设新闻数据库 构造核心竞争力
- 2006年
- 报业发展格局及竞争趋势
中国报业的发展,各报业集团、传媒集团的成立,使报社更加贴近市场贴近生活,也使得报社的改革必须按照市场规律展开相关工作,即如何有效降低成本,如何生产大众喜爱的新闻文化产品,如何打造有竞争力的品牌.
- 施水才郭军
- 关键词:核心竞争力新闻数据库文化产品报业报社
- 企业竞争情报系统中的跨界合作被引量:15
- 2006年
- 从企业竞争情报系统的应用现状分析出发,指出企业竞争情报系统需要在多方协作的环境下才能真正有效发挥作用。提出由企业、竞争情报系统提供商、情报信息提供商、图书馆、顾问咨询公司、高校等联合建立企业竞争情报协作环境,描述该环境下竞争情报工作各环节的合作模式,并分析用于支撑跨界合作的CCIS软件系统的实现要求。
- 倪金松贺兆辉
- 关键词:跨界合作企业竞争情报系统
- 一种文本数据的聚类方法、装置和系统
- 本发明的实施例提供了一种文本数据的聚类方法、装置和系统。其中,所述方法包括:子节点接收主节点针对海量文本数据进行拆分得到的待聚类的文本子集合;所述子节点将所述文本子集合中的每个文本分别与所有子节点的文本子集合中的每个文本...
- 孙辛博王洪俊李渝勤
- 图像处理方法、装置、电子设备和存储介质
- 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个...
- 程涛肖诗斌李渝勤
- 基于特征补偿的视频字幕识别研究被引量:2
- 2010年
- 视频中的字幕对多媒体检索技术提供了重要的信息,主要介绍视频字幕识别技术中的特征提取方法。根据字幕不同于印刷体和手写体中常出现的问题,提出了字符位置特征和字符区域笔画分布特征、字符笔画密度特征两种修改过的特征提取方法与传统的字符外围特征结合使用,并进行了实验测试,结果表明这些方法对字幕识别是可行的。
- 梁松涛吕学强施水才王涛
- 关键词:视频字幕特征相似度
- 中文专利文献术语抽取被引量:10
- 2013年
- 为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。
- 徐川施水才房祥吕学强
- 基于多尺度条件随机场的文本图像二值化
- 2009年
- 提出一种基于多尺度条件随机场(简称mCRF)的图像二值化算法。该算法将对图像的二值化看作一个标注过程,利用mCRF模型对图像中每个像素点进行标记,从而实现对整幅图像的二值化。mCRF模型属于判别式模型,可以容纳任意的非独立特征,从而充分利用图像本身信息。实验结果表明,本算法比常用的阈值法效果有很大提高。
- 刘坤吕学强王涛施水才
- 关键词:文本图像二值化特征函数
- 基于特征分选策略的中文共指消解方法被引量:2
- 2011年
- 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。
- 李渝勤甘润生杨永红施水才
- 关键词:共指消解自然语言处理支撑向量机数据词典