Acrobat生成PDF文件时自动添加文件路径,怎么nginx 去掉路径

利用Acrobat软件生成文本型PDF文件
&&&&来源:&&&&
&&&&&&字号
摘 要:我国网络期刊文献大都采用PDF格式,且以文本型(矢量模式)为主,但也有部分为图片型(光栅模式)PDF文献。图片型PDF文献无法复制、搜索、取词,也不支持在线实时检索、学术不端检测等功能。利用Adobe Acrobat Professional 10.0可对扫描或其他方式生成的图片型PDF文献进行页面裁剪、OCR文本识别及页面校正,从而可以获得页面整洁、端正的文本型PDF文献。
关键词:Adobe Acrobat Professional 10.0;OCR文本识别;文本型;图片型
我国网络期刊出版采用的文件格式主要有CAJ、PDF和HTML三种[1],其中大多数为PDF格式[2]。PDF是世界上期刊网络版通用格式[3],我国的中国知网(CNKI)和国家科技图书文献中心(NSTL)也都提供PDF格式的期刊文献。生成PDF文档的常用方法包括通过其他软件中转和通过虚拟打印机。目前期刊编辑部广泛使用北大方正书版排版软件,可以直接或间接生成文本型PDF文献,其文字为矢量模式,可以进行选择复制、搜索查找、金山词霸取词等操作。但在缺少原始电子文件时,则需以扫描样刊的方式生成图片型PDF文献。图片型PDF文件整个页面为一个光栅图像,其中的文字不能被选中 [4-5],不仅无法复制、搜索、取词,也不支持在线实时检索、学术不端检测等功能,也常会出现边缘有多余文字以及页面不正等情况,从而影响到读者对文献的阅读利用和数据库系统的正常运行。本文利用Adobe Acrobat Professional 10.0,以自国家科技图书文献中心(NSTL)下载的英文文献“Relative measure index: a metric to measure the quality of journals”作为示例,对扫描(也可以是其他方式转换)生成的图片型(光栅模式)PDF文献进行裁剪,通过OCR文本识别转换为文本型(矢量模式),并同步对页面进行校正。
一、PDF文件页面裁剪
用Adobe Acrobat Professional 10.0打开所处理文献,首先对页面进行裁剪,裁剪需要逐页进行,而对于文本识别、启动注释等,可以整篇同时完成。
图1为所处理文献的首页,该文献为扫描生成的图片型PDF文件,无法进行文字选中、复制、搜索(查找)、翻译取词等操作,整篇文献页面横置,页面边缘有多余文字。
点击右上角“工具”按钮,打开“工具”窗格,选择“页面”→“裁剪”路径(如图2所示)。用出现的十字形光标选择裁剪区域(如图3所示),在选择区域内双击鼠标右键,出现“设置页面框”对话框(如图4所示),确定即可完成裁剪;这一步也可以单击鼠标右键,点击“设置页面框”命令,这时即直接将裁减框外的页面裁剪掉。
图1 所处理的扫描生成PDF文献(首页)
& & & & & & & & & & & & & & & & 图2 工具―页面―裁剪 & & & & & & & &图3 选择裁减区域
工具窗格也可以通过菜单栏中的“视图”→“工具”路径打开,但不如通过工具窗格打开操作便捷、界面友好。
图4 “设置页面框”对话框二、将图片型PDF文件转换成文本型PDF文件
打开“工具”窗格,通过“识别文本”→“在本文件中”路径(如图5所示),打开“识别文本”对话框(如图6所示),点击“编辑”按钮,出现“识别文本-一般设置”对话框(如图7所示),设置OCR识别的主要语言,根据笔者观察选择中文或英文对识别效果没有影响,识别准确率都很高,但对生成的文本型PDF进行复制、粘贴操作中,如果设置语言与转换语言不一致,则可能出现乱码。分辨率选择300dpi,设置完成后确定,即可将图片型转换为文本型,并同步进行页面校正,将倾斜的页面转正,也可将横置页面转换为竖立;通过菜单“文件”→“另存为”→“PDF”,设置路径、重命名后加以保存。
& & & & & & & & & & & & & & & & & & & &图5 工具窗格―识别文本 & & &图6 “识别文本”对话框
图7 “识别文本-一般设置”对话框
(责编:王立娟(实习生)、赵光霞)
使用其他账号登录:
恭喜你,发表成功!
请牢记你的用户名:,密码:,立即进入修改密码。
s后自动返回
5s后自动返回
恭喜你,发表成功!
5s后自动返回
最新评论热门评论
传媒推荐|精彩博客
24小时排行&|&
人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright &
by .cn all rights reserved
人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright &
by .cn. all rights reserved查看: 5686|回复: 5
AutoCAD2010版本用Acrobat虚拟打印机批量转PDF问题
主题帖子积分
技工, 积分 114, 距离下一级还需 186 积分
技工, 积分 114, 距离下一级还需 186 积分
AutoCAD2010版本用Acrobat虚拟打印机批量转PDF时,多个文件生成在一个PDF文件中。比如批量转20张dwg格式图纸到PDF格式,生成的20张PDF格式的图纸在同一个PDF文件中了。怎样才能每一张dwg图纸生成一张PDF格式的图纸而不是多张图纸生成在同一个PDF文件中呢?请教高手
主题帖子积分
技工, 积分 146, 距离下一级还需 154 积分
技工, 积分 146, 距离下一级还需 154 积分
这个简单,不要用Adobe PDF打印机,而用pdfFactory Pro就不会了上述问题了。
主题帖子积分
技工, 积分 146, 距离下一级还需 154 积分
技工, 积分 146, 距离下一级还需 154 积分
打印完用Adobe pdf 专业版的合并成一个文件就可以了,注意合并时的顺序啊!
主题帖子积分
技工, 积分 168, 距离下一级还需 132 积分
技工, 积分 168, 距离下一级还需 132 积分
那些还都好解决,就线宽问题最不好解决了,设置挺麻烦的。
主题帖子积分
限制会员, 积分 -2, 距离下一级还需 2 积分
限制会员, 积分 -2, 距离下一级还需 2 积分
用页面设置可以吗?
主题帖子积分
中级工程师, 积分 1748, 距离下一级还需 3252 积分
中级工程师, 积分 1748, 距离下一级还需 3252 积分
pdf虚拟打印机软件下载
主题帖子积分
副教授, 积分 13401, 距离下一级还需 36599 积分
副教授, 积分 13401, 距离下一级还需 36599 积分
AutoCAD2010点击菜单文件〉〉发布,将文件发布为pdf文件,在发布选项中,可选择多页文件或单页文件,方便快捷,效果比虚拟打印机好得多。
郑重声明:本论坛属技术交流,非赢利性论坛。 本论坛言论纯属发表者个人意见,与“中国机械CAD论坛”立场无关。 涉及政治言论涉黄涉枪涉毒一律删除,请所有会员注意. 论坛资源由会员从网上收集整理所得,版权属于原作者. 论坛所有资源是进行学习和科研测试之用,请在下载后24小时删除, 本站出于学习和科研的目的进行交流和讨论,如有侵犯原作者的版权, 请来信告知,我们将立即做出整改,并给予相应的答复,谢谢合作!我们的邮件地址是QQ:PDF文件用Adobe Acrobat 8 Professional这款软件可以自动生成目录吗?_百度知道
PDF文件用Adobe Acrobat 8 Professional这款软件可以自动生成目录吗?
建议搂主使用PDFtoWord先转换为Word文档在Word中生成目录
其他类似问题
为您推荐:
pdf文件的相关知识
其他3条回答
不会的!但可以记忆到文件 下次打开时就会记忆到上次打开的文件了 就像UC影音一样
生成不了的噢。。
生成不了的噢。。
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁热门搜索:
热门专题:
pdf文档第一页到最后一页去了,最后一页到第一页那了,就是排序位置倒了,怎调阅读
提问者:| 浏览次数:1532次 |问题来自:全国
输入内容已经达到长度限制
您还可以输入
验证码错误
已被 <span id="Reward 人打赏
TA回答得不错,我决定赏
注:每次只能打赏1积分哦~
用Adobe Reader只可以读取而无法修改文档,亦即无法修改业已生成的PDF文档,出现错序很无奈。你可以从网上下载软件,我用的是Adobe Acrobat 7.0 professional. 用这个软件可以将其它文档如WORD、JPG图片等生成PDF文档,也可以将PDF文档生成图片或WORD。要修改文档中各页的次序,只需在打开文档后,在左侧的目录将各页的缩略图用鼠标拖拉,然后保存,之后再打开就是你拖拉之后的次序,这是最简单的方法。或者将文档转变成WORD,然后自己编辑,之后再重新生成PDF,不过也有点过于繁琐了。
登录并提交回答
登录回答可获积分奖励
还没有账号?
如果您发现不正当的内容或行为,请及时联系我们!
举报内容:
举报原因:
(可多选)
含有反动的内容
含有人身攻击的内容
含有广告性质的内容
涉及违法犯罪的内容
含有违背伦理道德的内容
含色情、暴力、恐怖的内容
含有恶意无聊灌水的内容
Copyright &
Soufun Holdings Limited, All Rights Reserved
北京搜房科技发展有限公司 版权所有
文明办网文明上网 举报电话:010- 举报邮箱:

我要回帖

更多关于 ueditor去掉元素路径 的文章

 

随机推荐