PDF内容是不是文本格式?教你一步确认

标签:
pdf文档杂谈it文档发布文档交换 |
分类: PDF应用 |
现在的PDF文档门类多种多样,拿到手的文档,往往不能立刻分辨出是否是文本格式?能否在其中直接提取文本?能否修改和编辑文本内容?
有些PDF文档是直接生成的,有些从Office文件转换过来,又从图片转换过来的,还有从扫描仪得到的.......这林林总总的PDF文档,你是否能分辨出?
- 一般来说,直接生成的和从Office文件转换过来PDF文档是可以直接提取文档中的文本的,还可以对他进行文字和段落的编辑。(只要你的电脑里安装了PDF的编辑工具,比如福昕的风腾PDF套件(Foxit PhantomPDF)。
- 而从图片转换过来的,还有从扫描仪扫描得到PDF文档是不能直接进行文本的提取或者编辑的,它的文字也不是文本格式,需要经过OCR出来后才能进行这些相关操作。(当然,福昕风腾PDF套件也可以对其进行OCR处理哦!)
那么,问题来了,如何确认PDF内文字内容是文本格式?
用免费福昕阅读器就可以进行文本的确认哦,方法超级简单!
只需一步,就能确认文本格式
第一种方式:
在“主页”菜单下选择文本选择工具或使用其快捷键Alt+6。如果内容为文本格式,则可被选择工具选中,还可对文本进行复制,并粘贴到Word里面哦。

第二种方式:
在“视图”菜单下选择文本查看器或使用其快捷键Ctrl+6,如果内容为文本格式,则文件可在文本查看器窗口中显示。

是不是非常简单,上面两种方法都能确认文本格式!
确认完,接下来,你就可以直接提取文本内容,或者经过OCR处理在进行编辑和修改。