乔山办公网我们一直在努力
您的位置:乔山办公网 > word文档 > Java中如何用I/O流读取一个Word文档的内容-读取word文件,word文档无法读取内容

Java中如何用I/O流读取一个Word文档的内容-读取word文件,word文档无法读取内容

作者:乔山办公网日期:

返回目录:word文档


请贴出代码,谢谢。
请关闭输入流,释放资源,谢谢。调用close()方法。
其他貌似没有发现什么问题。

public static String run(String filename){
WordExtractor extractor=null;
String text=null;
try{
FileInputStream in = new FileInputStream (filename);
extractor = new WordExtractor();
text=extractor.extractText(in);
}catch(Exception ex){
//log
return null;
}
return text;
}
public static void main(String[] args){
try{
FileOutputStream out=new FileOutputStream("result.txt");
out.write(WordProcess.run(args[0]).getBytes());
out.flush();
out.close();
}catch(Exception ex){
System.out.println(ex.toString());
}
}

看看这个。模范这样写,试试看。这个代码我试过,没问题,如果这样写还是有问题,那就不e799bee5baa6e997aee7ad94e78988e69d83331是代码的问题了。

添加spire.doc.jar为依赖,zhidao使用下面的代码可以读取word文档内容到txt文档

  1. import com.spire.doc.Document;

  2. import com.spire.doc.FileFormat;

  3. import java.io.IOException;


  4. public class ConvertWordToOtherFormats {


  5.     public static void main(String[] args) throws IOException {


  6.         //创建Document对象

  7.         Document doc = new Document();

  8.         //加载Word文档

  9.         doc.loadFromFile("C:\\Users\\Administrator\\Desktop\\test.docx");

  10.         //将Word保存为TXT格式

  11.         doc.saveToFile("ToTXT.txt",FileFormat.Txt);

  12.     }


java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估
计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作
方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关
于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表
面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。

WordExtractor的用法错了,你用下面的方法试试:

......
File file = new File(doc);
FileInputStream fileInputStream = getFileInputStream(file);
WordExtractor wordExtractor = new WordExtractor(fileInputStream);
String text = wordExtractor.getText();

......

相关阅读

关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网