互联网 频道

如何提取PDF文件中的文字和图片?

    【IT168 应用技巧】PDF是Adobe公司开发的电子文件格式,也是Internet上进行电子文档发行和数字化信息传播的理想文档格式。现在互联网上越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件很多使用PDF格式文件。

    PDF文件一个弊端就是用户不能直接提取该文档中的文字或图片信息,给大家查找和使用资料带来麻烦。如果你使用了下面的两款小工具,就可以轻松提取PDF文件中的文字和图片信息了。

    一、提取文本信息

    提取PDF文件中的文本信息时,需先将PDF文件转换为文本文档,随后只要用Word等文本编辑工具将转换的文本文件打开。

    “VeryPDF PDF2Word”可以将PDF文件转换为Word文档文件,能用Word打开转换后的PDF文件,即可轻松提取文档中的文字信息。

软件名称 VeryPDF PDF2Word
软件版本 v3.0
软件大小 3.77KB
软件分类 应用软件(文件管理)
软件语言 英文
应用平台 Win9x/NT/2000/XP/2003
软件作者 Intelligent Converters, Co.
高速下载地址

    使用PDF2Word转换PDF文件时,在程序主界面中单击“file→Open”(打开)按钮,选择需要打开的PDF文件,随后单击“打开”按钮,弹出文件保存对话框,在此选择转换后文件保存的文件名和路径。

    并在下面的“保存类型”项中选择保存方式“Word files(*.rtf)”,这样该文件将会被转换为rtf格式,然后单击“保存”按钮。

    还可对选中的PDF文件进行分析,分析后并开始转化,在程序主界面下面弹出一个转换进度条。

分析转换

    文件转换后,就可以使用Word打开转换后的文件了。

打开转换后的文件

    怎么样文字信息和图片就可以在Word中随便修改了。

    二、将PDF中的图片一网打尽

    若想提取文档中的图片,在word中非常麻烦,可使用一款名为“PDF Extract TIFF”,将PDF文档中的所有图标提取出来并保存为TIFF图片格式。

软件名称 PDF Extract TIFF
软件版本 V2.0
软件大小 1.36MB
软件分类 图形图像(图像其它)
软件语言 英文
应用平台 Windows 95/98/Me/NT/2000/XP
软件作者 Verypdf.com, Inc
高速下载地址

    用PDF Extract TIFF提取PDF中图片时,启动PDF Extract TIFF,在主界面中单击“open”(打开)按钮,在弹出的窗口中选择需提取图片的PDF文件。

PDF Extract TIFF主界面

    随后打开“另存为”对话框,在此选择好图片文件保存的路径和图片文件名。

    通过上面的设置,单击“保存”按钮,对PDF文件中的所有图片进行提取,并保存的指定的文件夹中。怎么样,PDF文档中的图片是不是被一网打尽了。

0
相关文章