返回目录:word文档
像一些直接网上下载来的PDF文件,譬如下图的这个PDF文档,它的原始格式就是word。
其实也就是跟图片差不多吧,无法复制不可编辑。
一般像这种文字居多的或者掺杂图片较少的PDF文档,要转换成可编辑的word文档还是比较容易也比较多方法可以实现的。
新版的office是支持直接打开并转换PDF的,不过往往会有这个提示。超出word支持的页面大小,无法打开。你可以先试试。
word打开不行,那用acrobat的文字识别功能。先识别一下文档。
基本上这种都能直接识别出文字,识别率还是蛮高(因为文档文字居多,也没啥难度)咱们直接复制到记事本去一下格式,再粘贴到word里面。效果还是蛮不错。
但就不要识别后直接用acrobat直接另存为word了,这样没有效果。
会出现一些识别错误的现象,这当然也在所难免的。还是需要对比原文档来修改更正一下。另外字体原格式和排版肯定是要牺牲了。
我们来将难度提高一下。扫描件PDF。
一样还是上面的识别文档再到word。然后是下图这样子。
文档复杂时acrobat便不行了,毕竟OCR文字识别并不是acrobat的强项。
这里我们可以用ABBYY这个软件来进行PDF转换,就目前来说它可算是OCR文字识别界中的佼佼者。
直接拖拽进来让它自动识别就可以了,有三百多页,过程有点久。它会直接扫描PDF文档的图片识别出文字。并且此工具还较大程度上保留原始格式的样式和编排。
识别完成后直接将它另存为word文档下。
效果还是非常的好。
感谢邀请。
在回答您的问题之前,我们首先要搞清楚一个事情,就是你需要转换的PDF文件时怎么来的?
PDF文件的生成其实就是一个转化的过程,一般工作过程中就由下列三种途径:
①word文档自接转化(导出)生成;
②多个pdf合并成一个pdf文档;
③图片(单张或者多张)合并成pdf文档。
PDF转化成可编辑的Word文档,针对上述三种情况就有两种解决办法:
一、直接转化
由word转化而来的pdf文档,一般通过软件(比如:adobe acrobat等)逆转化可以直接转化可以编辑的Word文档。
二、识别再编辑
多个pdf合并成一个pdf文档或图片(单张或者多张)合并成pdf文档不能直接转化成可编辑Word文档,因为这两种情况转化出的word文档内容都是不可编辑的图片。所以,在这种情况下就需要采用文字识别(OCR技术),然后再将内容复制到word中进行再编辑。推荐使用cencrack识别图片转文字工具[转化率准确率很高]。
常用的思路就是这两种,希望我的回答能够帮助到您。
如果您觉得我们的回答对您有所帮助,不妨点击关注、收藏、转发。您的支持是我们前进的动力,我们会因此更加努力地做好服务。