作者:乔山办公网日期:
返回目录:word文档
http://wenku.baidu.com/link?url=vnoxWaruXsk1SyFLvIBkmrtjoI3S6o7mCSGLMO0V_XGBtHpq3XubKfs61uzYRyYEhuiV4pP7_k81Dnab3J0O4kByfpiQHv-RLZeXYTzhPFq
你去看来看这篇源,这篇讲的知比道较细
1、实现富文本中样式代码的分离;
2、保留CSS样式;
其实以上两个步骤是相互矛盾的处理过程,无法通过Jacob或POI组件加正百则表达式过滤解决,于是进行了以下步骤的实验:
1、首先创建了一个空白word文档,格式(office 2003格式或office 2007格式)不限;度
2、将word格式保存为html格式,通过Edit Plus打开,发现代码中使用问了office的命名空间,同时使用了office命名空间的标签定义了CSS样式,自己测试了一下,将生成的html文件头和尾拷贝出来:代码如下:
以上HTML头是office的命名空间定义。
3、将使用富文本代答码粘贴到红色标识的<!-- 富文本代码区 -->中,并以doc或docx格式保存文件;
4、大功告成,打开文件时,Word将会版以“Web版视图”完美显示了富文本样式,成功解决了富文本代码中样式代码,并同时保留了格式;
目前研究的仅能保存文字,未处理有图片的代码,朋友们可以再权研究一下带图片的富文本代码的转换;
问题没说清楚。
对于word的操作,如果是 docx 可以把 docx当做zip来解压缩,解开后会得到文档的xml文件,稍加琢磨可以理解其中的含义,修改后,再更新回原zip
两种方式:zhidao
1、纯Java,用POI来做
2、用JNA调用word接口,根据office api来做 第一种呢对于java开发来说相对简单专,但是需要学POI,而且估计有些格式控制不好属。第二种要学习JNA,而且需要边做变差word的office api。