您的位置: 专家智库 > >

孙琦

作品数:2 被引量:4H指数:1
供职机构:北京市计算中心更多>>
发文基金:国家自然科学基金北京市科学技术研究院萌芽计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 1篇期刊文章
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 1篇电子电信

主题

  • 2篇可视化
  • 2篇DEEP_W...
  • 2篇HADOOP
  • 1篇数据采集

机构

  • 2篇北京市计算中...

作者

  • 2篇刘彤
  • 2篇袁翀
  • 2篇张阳
  • 2篇孙琦

传媒

  • 1篇计算机工程与...

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
基于Hadoop的可视化Deep Web采集平台设计被引量:4
2016年
随着信息技术的发展,互联网信息资源变得越来越丰富,大数据技术的发展使得我们能够从互联网复杂的信息数据中获得相应的知识。这其中最基本的技术就是大数据采集技术,它使我们能够将互联网数据快速采集下来并结构化存储。设计的基于Hadoop的可视化Deep Web采集平台是一种简单易操作的高效深度采集平台,运用Webkit技术作为核心引擎实现可视化配置和深度采集功能,同时通过优化采集算法,调整Hadoop任务分配策略提升效率。实验结果表明,设计的数据采集平台获得了较好的效果。
刘彤张阳孙琦袁翀
关键词:数据采集HADOOP可视化
基于Hadoop的可视化Deep Web采集平台设计
随着信息技术的发展,互联网信息资源变得越来越丰富,大数据技术的发展使得我们能够从互联网复杂的信息数据中获得相应的知识。这其中最基本的技术就是大数据采集技术,使我们能够将互联网数据采集并结构化存储下来。本文设计的基于Had...
刘彤张阳孙琦袁翀
共1页<1>
聚类工具0