乔山办公网我们一直在努力
您的位置:乔山办公网 > word文档 > 如何用纯java代码实现<em>word</em>转<em>pdf</em&g

如何用纯java代码实现<em>word</em>转<em>pdf</em&g

作者:乔山办公网日期:

返回目录:word文档


如果只是文字的话,直接读出来,然后用07的存回去,poi能实现。但是有目录什么的就麻烦了,03的读出来目录是一行代码,就容易出问题
我用的poi正好在纠结,最后没办法,用按键精灵一个个转的。有个word文档批处理貌似能做到,但是要收费。
下面的是我读取word文字的代码
03读取:
InputStream is = new FileInputStream(docfile);
WordExtractor ex = new WordExtractor(is);
text = ex.getText();
System.out.println(text);
07读取:
OPCPackage opcPackage = POIXMLDocument.openPackage(docxfile.getAbsolutePath());
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
text = extractor.getText();
System.out.println(text);
最后:doc不一定是03的,7a64e58685e5aeb9363也可能是07的

几种方案:
方法一:用apache pio 读取doc文件,然后转成html文件用Jsoup格式化html文件,最后用itext将html文件转成pdf。

方法2:使用jdoctopdf来实现,这是一个封装好的包,可以把doc转换成pdf,html,xml等格式,调用很方便
地址:
需要注意中文字体的写入问题。

方法3:使用jodconverter来调用openOffice的服务来转换,openOffice有个各个平台的版本,所以这种方法跟方法1一样都是跨平台的。
jodconverter的下载地址
首先要安装openOffice,下载地址:
安装完后要启动openOffice的服务,具体启动方法请自行google

方法4:效果最好的一种方法,但是需要window环境,而且速度是最慢的需要安装msofficeWord以及SaveAsPDFandXPS.exe(word的一个插件,用来把word转化为pdf)
Office版本是2007,因为SaveAsPDFandXPS是微软为office2007及以上版本开发的插件
SaveAsPDFandXPS下载地址:
jacob 包下载地址:

有个pdf库,Free Spire.PDF for Java,可以直接调用方法saveToFile("ToWord.docx",FileFormat.DOCX)转成Word,方法很简单。

可参考原文



itext等等,可以方便转换的了
~
~
~
~

相关阅读

  • 如何用纯java代码实现<em>word</em>转<em>pdf</em&g

  • 乔山办公网word文档
  • 如果只是文字的话,直接读出来,然后用07的存回去,poi能实现。但是有目录什么的就麻烦了,03的读出来目录是一行代码,就容易出问题我用的poi正好在纠结,最后没办法,用按键精灵
  • -convert word to pdf,pdf to word

  • 乔山办公网word文档
  • Convert DOC to PDF For Word v1.0 keygen by ORiON Convert Doc to PDF For Word v2.00 keygen by ACME Convert DOC to PDF For Word v2.00 010905 serial by C
  • <em>网页</em>版<em>pdf</em>怎么转换成<em&

  • 乔山办公网word文档
  • 一、首先,打开百谷歌浏览器,打开要保存成PDF格式的网页,在右上角点击“三点标志度”,点击打开。二、然后,在问下拉菜单中选择“打印”,点击打开。答三、然后,在窗口选择
关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网