作者:乔山办公网日期:
返回目录:word文档
请贴出代码,谢谢。
请关闭输入流,释放资源,谢谢。调用close()方法。
其他貌似没有发现什么问题。
public static String run(String filename){
WordExtractor extractor=null;
String text=null;
try{
FileInputStream in = new FileInputStream (filename);
extractor = new WordExtractor();
text=extractor.extractText(in);
}catch(Exception ex){
//log
return null;
}
return text;
}
public static void main(String[] args){
try{
FileOutputStream out=new FileOutputStream("result.txt");
out.write(WordProcess.run(args[0]).getBytes());
out.flush();
out.close();
}catch(Exception ex){
System.out.println(ex.toString());
}
}
看看这个。模范这样写,试试看。这个代码我试过,没问题,如果这样写还是有问题,那就不e799bee5baa6e997aee7ad94e78988e69d83331是代码的问题了。
添加spire.doc.jar为依赖,zhidao使用下面的代码可版以读取word文档内容到txt文档
import com.spire.doc.Document;
import com.spire.doc.FileFormat;
import java.io.IOException;
public class ConvertWordToOtherFormats {
public static void main(String[] args) throws IOException {
//创建Document对象
Document doc = new Document();
//加载Word文档
doc.loadFromFile("C:\\Users\\Administrator\\Desktop\\test.docx");
//将Word保存为TXT格式权
doc.saveToFile("ToTXT.txt",FileFormat.Txt);
}
java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估
计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报知错找不到注册,比较诡异,我曾经在道不同的机器上试过,操作
方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有版点玄;itxt好像写很方便但是我查了好久资料没有见到过关
于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表
面看来和doc没啥区权别,都可以用word打开,各种格式都可以设定。
WordExtractor的用复法错了,制你用下面百的方法试试:度
......
File file = new File(doc);
FileInputStream fileInputStream = getFileInputStream(file);
WordExtractor wordExtractor = new WordExtractor(fileInputStream);
String text = wordExtractor.getText();
......