乔山办公网我们一直在努力
您的位置:乔山办公网 > word文档 > 如何将图片格式的pdf转化为word?-图片版pdf转换成word,怎么用pdf把图片转化为word

如何将图片格式的pdf转化为word?-图片版pdf转换成word,怎么用pdf把图片转化为word

作者:乔山办公网日期:

返回目录:word文档


方法/步骤

  • 由于我使用的是foxit reader.所以我就以此软件为例,讲述把PDF转换成word并手动排版的过程。首先介绍一下PDf文字有如下两种情况,一种放大文字显得不是很规范,一种则是标准字体排版的,现在的阅读器的文字选取功能基本上都能进行大概的识别,但是第二种的准确率是明显高于第一种的。所以首先推荐你使用第二种效果的PDf做转换。

  • 新建一个word文档。设置好格式(在转换过程中建议一步步的来尤其是有图片的情况下,图片多的情况word排版容易出问题所以建议一段段的来,至于怎么一步步,接着看)

  • 点击这个T字按钮,这是文本选择工具,点击之后用鼠标选取文段就会高亮显示。然后右键可以选择复制该段内容。(可以先把文字都复制,但是公式之类的会成乱码建议多次复制或者复制之e79fa5e98193e4b893e5b19e363后再删除)

  • 把文字都粘贴到word中。粘贴之后你会发现文档格式很乱,有很多回车键怎么处理呢。首先点击替换按钮,输入^P。如果输入不了可能是输入法的半角全角没切换(请切换到英语输入法半角)替换里面全不填,然后全部替换。

  • 现在回车是没了,整个文档没了段落变成了一整团。这时候点击替换,在上面输入两个空格,下面输入^P和两个空格(如果你不知道输入^P那么点击更多在特殊格式里面找到段落标记选定它就可以了)

    如果替换的结果是没有被替换,在输入空格的时候就把输入法的半角改成全角。

    还有注意我说的这次的^P后面有两个空格。然后选择全部替换。

  • 然后段落就出来了,然后设置字体格式,文字阶段就设置好了。

  • 然后是处理文档中的图片,在阅读器中点击照相机工具,然后框选图片,右键复制图片(比较复杂的公式建议使用保存图片的方法复制直接用文本识别没有格式而且容易乱码)。然后在word中的对应位置粘贴图片。(按顺序来从头到尾,一次完成,不然就会很麻烦)

  • 双击图片,在图片的排列方式里面修改一下成为四周密排就可以自由设置图片的位置了。如果你不想图片左右有字则要输入一系列回车,直到回车超过图片区域。然后逐步就可以把文档做成word了

  • 虽然工作量大很多,但是保证比软件转成的要实用的多。当然具体情况具体分析,排版很简单的pdf,用工具一样可以很快很简单的完成。



批量处理是有办法的

一、“选择文字工具,选好了贴到word里”
如果你的PDF文件是用文字制做而不是图片制做的,可以“在Adobe Acrobat 7.0中有选择文字的工具,可以选好了贴到word里”。但是根据你介绍的情况,你的PDF文件是用图片做的,所以不能用这种方法。

二、批量截图
截图的办法对于不是很清楚的图片来说,并不可取,因为它要么会损失信息,要么会如楼主所说加大工作量。

我建议你先用Adobe Acrobat中的导出功能,将这个文件导出为图像。做法:7a64e4b893e5b19e337在上面菜单上选文件>导出>提取图像为>JPEG文件(其他二种也行,JPEG文件比较小),再按提示,选择一个适当的文件夹,保存图像 。
这种方法保存下来的一张张图片,比你一页页截图省力多了,而且保留了原文件的全部信息。不过500页可不一个小数,会很慢,但至少不用你亲自动手干预了。

三、批量识别
如果你想进行编辑,就必须进行OCR识别。关键在于你如何能够批量进行这个工作。

好一点的OCR软件都可以一次导入多幅图片进行识别,然后输出。不过,好像500页的确有点多了,我从来也没有超过50页的记录,通常也就是二、三十页。就算50页,也比一页一页强,是吧?

我用过不少OCR软件,觉得汉王文本王、清华紫光TH比较好用。它们的识别率都非常高,还可以识别表格、繁体字、英文、竖排文字等;输出方式也很灵活,可以只输出文字,也可以按原稿排版格式输出WORD文件;使用起来也都不复杂。 不知你用的是什么版本的汉王,识别率会那么低。我有的时候识别质量很次的报纸上的文章,它的识别率也还是可以接受的。

四、提高识别率
如果你的底图质量非常差的话,建议你先在图片处理软件中将导出的图片进行放大、去点、锐化等处理,然后再送到OCR中识别。

我估计,你可能还是送入OCR的图片损失了部分原文的信息,造成识别率下降。因为你既然能放大,放大后截图的识别率还可以,那就说明原图的信息足够OCR识别了。只是你在操作过程中损失了部分东西。

所以,我建议你:
1)先将你的PDF文件导出5-10页图片出来
2)用汉王等OCR软件进行批量识别(识别中注意将不规则的部分框除)
3)输出成word文档

如果它们能很顺利地被识别出来,那后面的事就不用我说了。如果不行,那就真的是你的底图的问题了,这就需要对导出的图片进行批量修正处理。

如果还不行,那、那……我也没辙了。

在WPS软件中打开word文档,然后另存为XML文件即可。具体操作请参照以下步骤。

1、在电脑上用wps软件打开目标word文件,进入主编辑界面。

2、然后点击软件左上角的WPS文字字样,会弹出一个下拉菜单。

3、接着在下拉菜单中依次点击选项“文件/另存为”。

4、然后会进入到保存的对话框中,在文件类型选项栏中选择“Word XML”的格式。

5、最后点击保存即可。完成以上设置后,即可将word文档转化为XML格式的文件。



方法一:通过键盘的prscrn键或者QQ等截图功能将pdf转换成图片,然后在复制到word中即可。此方法适合页数较少的pdf文件,对于页数较多的pdf文件就需要利用方法二了。
方法二:利用Adobe acrobat X将pdf文件转换成图片。用Adobe acrobat X打开相应的pdf软件,点击菜单栏中的“文件”选择“另存为”中的“图像”,接着选择保存类型“PNG”或者其他图片格式都可以,点击确定即可。转换结束后将图片再复制到word中就好了。

相关阅读

关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网