作者:乔山办公网日期:
返回目录:word文档
java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估
计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作
方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关
于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表
面看来和doc没啥区别,都e799bee5baa6e59b9ee7ad94364可以用word打开,各种格式都可以设定。
----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。
----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。
1、采用字节的形式读取rtf模板内容
2、将可变的内容字符串转为rtf编码
3、替换原文中的可变部分,形成新的rtf文档
主要程序如下:
public String bin2hex(String bin) {
char[] digital = "0123456789ABCDEF".toCharArray();
StringBuffer sb = new StringBuffer("");
byte[] bs = bin.getBytes();
int bit;
for (int i = 0; i < bs.length;i++) {
bit = (bs[i] & 0x0f0)
>> 4;
sb.append("\\'");
sb.append(digital[bit]);
bit = bs[i] & 0x0f;
sb.append(digital[bit]);
}
return sb.toString();
}
public String readByteRtf(InputStream ins, String path){
String sourcecontent =
"";
try{
ins = new
FileInputStream(path);
byte[] b
= new byte[1024];
if (ins == null) {
System.out.println("源模板文件不存在");
}
int bytesRead = 0;
while (true) {
bytesRead = ins.read(b, 0, 1024); // return final read bytes
counts
if(bytesRead == -1) {// end of InputStream
System.out.println("读取模板文件结束");
break;
}
sourcecontent += new String(b, 0, bytesRead); // convert to string
using bytes
}
}catch(Exception e){
e.printStackTrace();
}
报什么异常?
先去了解一下STA、MTA的概念,如果使用了来STA,就不能用线程自B来访问线程A创建的COM组件。
并发度不高的话,可以使用一个服务线程,服务线程初始化COM组件,所有百使用者向此服务线程提交Word操作请求,由此线程进行处理。
每创建一个度COM组件实例,就会有一个Word进程出现,用不了多少个服务器就翘了。
现在新版本jacob-1.16-M1,里面有com.jacob.com.DispatchProxy 可能对你有帮助,看看文档吧。
至于其他方法,问我所了解的基本都是“java操作com组件”这种方式,如javatoword、jcom,纯Java的实现有POI,但是操作word价值不答大。
可以不用office,用wps也是一样的,前提是有能处理word的工具
这就是读取事先搞好的word模版(里面有事先设置好的书签位置),然后给里面填空修改等操作,是吗?
抱歉,我只用过jacob