搜索到914篇“ PDF文档“的相关文章
一种PDF文档检测的方法和装置
本发明实施例公开了一种PDF文档检测的方法和装置。本发明实施例中,通过获取PDF文档的交叉引用表,其中,所述交叉引用表包括多个文裆对象在所述PDF文档中的位置;根据所述交叉引用表确定多个文档对象;根据所述多个文档对象确定...
刘先进曾吉申杨锐
一种PDF文档提取处理文本数据的方法
本发明公开了一种PDF文档提取处理文本数据的方法,包括文字处理,将PDF文档中文字对象的数据内容分为字符、纸张坐标和打印大小三种属性,根据三种属性区分处理从而获取到文字在文章中的规范数据;从PDF文档中提取出文字对象,提...
卫沈傲谢淮东蔡伟黄家志吴礼贵黄真懿
一种PDF文档的差异比对方法及相关装置
本申请公开了一种PDF文档的差异比对方法及相关装置,涉及文档处理技术领域,包括:获取待比对的第一PDF文档和第二PDF文档的内容块集合。针对目标PDF文档,分别计算内容块集合中各个内容块的评估难度得分和重要性得分。基于各...
兰勇田魁王强
一种PDF文档转换效果的评价方法及系统
本发明属于文档转换评价技术领域,提供一种PDF文档转换效果的评价方法及系统。其方法包括:识别PDF文档中重要元素的特征区域并进行显著性区域检测,得到区域特征图和显著特征图;对区域特征图赋予权重,并与显著特征图进行叠加,得...
龙逸翔
一种将DocuWorks文档转换为PDF文档的方法
本发明公开了一种将DocuWorks文档转换为PDF文档的方法,读取图纸清单通过队列方式依次等待转换;通过DocuWorks软件操作SDK中提供的接口获取DocuWorks文档的页面数,循环所有页面并获取所有DocuWo...
李杰朱懿
PDF文档的多维度比对方法、装置及电子设备
本申请提供了一种PDF文档的多维度比对方法、装置及电子设备,方法包括:针对待比对的第一PDF文档和第二PDF文档,均划分为多个对象区域;对多个对象区域进行解析,得到待比对的对象内容;针对第一PDF文档中的每个第一对象内容...
尹真王盛华安文康李艳红尤科冉徐鼎藩何海军
一种基于绘图的PDF文档中对象识别方法及装置
本发明公开了一种基于绘图的PDF文档中对象识别方法及装置。该方法包括:分别读取PDF文档中每一页面的绘制信息,得到每一页面对应的页面流;对每一所述页面流进行分类,得到对应的画笔数据和缓存数据;所述缓存数据至少包括文字、图...
郭钟李刚吴文君蒋克成王华史永彬
一种基于KNN算法的PDF文档拆分方法、介质及系统
本发明涉及一种基于KNN算法的PDF文档拆分方法、介质及系统,所述方法包括以下步骤:获取待拆分的PDF文档,通过KNN分类模型对待拆分的PDF文档中的文本进行分类预测,识别PDF文档中的标题页,收集标题页文本所在页码,得...
金伟宇赵莉
一种适用于RAG场景下的pdf文档中表格解析方法
本发明属于电数字数据处理技术领域,特别是涉及一种适用于RAG场景下的pdf文档中表格解析方法,包括解析pdf文档,逐页提取pdf文档中的表格并保存为Excel文件和定位信息,将Excel文件转换为Markdown格式表格...
赵祯李刚杨建光乔辉
一种PDF文档中知识点的标注方法、装置、设备和存储介质
本发明公开了一种PDF文档中知识点的标注方法、装置、设备和存储介质。该方法包括:响应于用户创建与待知识点标注的PDF资源相关联的新增知识点的标注操作,基于新增知识点构建PDF资源对应的知识图谱;将知识图谱中的新增关联节点...
隋明君蔡新玮孟浩王东闫腾泽蒲伟婷周群峰汪洋

相关作者

张文德
作品数:218被引量:945H指数:15
供职机构:福州大学公共管理学院信息管理研究所
研究主题:网络信息资源 著作权 数字图书馆 知识产权 风险评估
宋艳娟
作品数:12被引量:39H指数:4
供职机构:福建农林大学计算机与信息学院
研究主题:XML 信息抽取 PDF文档 PDF 基于XML
熊水斌
作品数:32被引量:175H指数:8
供职机构:《水利水电科技进展》编辑部
研究主题:科技期刊 科技期刊插图 PDF文档 PHOTOSHOP 期刊编辑部
朱丹红
作品数:51被引量:89H指数:7
供职机构:福州大学
研究主题:网络 特征提取 防御 网络测量 迁移
谭毓安
作品数:193被引量:244H指数:8
供职机构:北京理工大学
研究主题:硬盘 隐蔽性 后门 硬盘数据 小写