刘金晶
- 作品数:6 被引量:19H指数:2
- 供职机构:北京锐安科技有限公司更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种IP分区方法
- 本发明属于计算机网络领域,具体涉及一种海量数据存储中的IP分区方法。本发明通过将世界IP逐层划分为不同层级数,对每个层级中的IP采用均匀等分的方式进行分区,实现了根据地区内IP数量的不同进行适应性分区,使得当IP分区产品...
- 刘金晶
- 文献传递
- 大数据下的数据质量评价指标构建实践被引量:15
- 2019年
- 大数据下的数据特点决定了对其数据价值的萃取犹如沙里淘金,需要进行大量的数据处理、分析和挖掘才能获得其背后的价值。而进行数据分析与挖掘,且获得真正有价值的信息与知识,良好的数据质量得到保障是前提。因此,数据质量的量化评估成为这个过程中很重要的一环。通过综合国内外对数据质量评价体系的研究成果,结合所在行业和大数据系统的特点,提出了一个评价指标的框架,不仅包含数据本身的质量,而且包括数据处理过程与数据效能的质量。全面对大数据处理平台下的数据质量进行量化评估,是对数据质量评价体系在大数据生产系统进行实践的第一步,为大数据下的数据治理提供了新的研究和实践经验,也为后续进行持续的数据改进、数据治理、数据价值到信息价值的提炼提供借鉴。
- 刘金晶王梅
- 关键词:大数据数据质量评价指标
- 数据库的分区维护方法和装置
- 本发明实施例公开了一种数据库的分区维护方法和装置,涉及数据处理领域,用于解决现有技术中在已有的表空间中无法创建新的分区导致分区创建失败的问题。本发明中,在已创建的表空间中不包含任何分区时,删除该表空间以释放该表空间占用的...
- 刘金晶
- 文献传递
- 基于本体论的多源异构数据集成方法研究被引量:4
- 2018年
- 大数据时代信息呈指数级爆炸式增长,不同的数据采集、处理和存储方式使得这些海量数据具有来源复杂、结构异构的特点,难以共享和互操作。传统的数据集成方式已经不能适应企业获取信息、使用信息需求。为解决多源异构的数据集成效率和质量问题,基于本体论概念和语言,借鉴本体识别和表达方式,设计了一种领域内表达数据属性与关系的元模型。基于该元模型,对领域内数据建立相应的模型并形成规则,规范和约束了多源异构数据集成过程和质量,提高了数据集成的效率和数据利用率。
- 刘金晶曹文洁
- 关键词:异构数据集成本体
- 数据库的分区维护方法和装置
- 本发明实施例公开了一种数据库的分区维护方法和装置,涉及数据处理领域,用于解决现有技术中在已有的表空间中无法创建新的分区导致分区创建失败的问题。本发明中,在已创建的表空间中不包含任何分区时,删除该表空间以释放该表空间占用的...
- 刘金晶
- 文献传递
- 一种通过自适应的Range分区存储海量数据的方法
- 本发明涉及一种通过自适应的Range分区存储海量数据的方法,包括:获取海量数据的不同层级的范围信息并确定层级个数n,n为大于2的整数;确定进行分区的总层级数m,设定第i层分区的取值标准数目pi0和第i层每个分区段最多容许...
- 张志远刘金晶
- 文献传递