乔山办公网我们一直在努力
您的位置:乔山办公网 > word文档 > 求助怎么把<em>HTML</em>以<em>WORD</em>格式导出

求助怎么把<em>HTML</em>以<em>WORD</em>格式导出

作者:乔山办公网日期:

返回目录:word文档


1、实现富文本中样式代码的分离;

2、保留zhidaoCSS样式;

其实以上两个步骤是相互矛盾的处理过程,无法通过Jacob或POI组件加正则表达式过滤解决,于是进行了以下步骤的实验:

1、首先创建了一个空白word文档,格式(office 2003格式或office 2007格式)不限;

2、将word格式保存为html格式,通过Edit Plus打开,发现代码中使用了office的命名空间,同时使用了office命名空间的标签定义了CSS样式,自己测试了一下,将生成的html文件头和尾拷贝出来:代码如下:

以上HTML头是office的命名空间定义。

3、将使用富文本代码粘贴到红色标识的<!-- 富文本代码区 -->中,并以doc或docx格式保存文件;

4、大功告成,打开文件时,Word将会以“Web版视图”完美显示了富文本样式,成功解决了富文本代码中样式代码,并同时保留了格式;

目前研究的仅能保存文字,未处理有图片的代码,朋友们可以再研究一下带图片的富文本代码的转换;



从来没有这么做过,个人有个想法:
在后台读取相关HTML页面的源代码,然后解析。将解析后的结果对应成Word的格式,然后生成Word。
你用IE浏览器打开你的HTML文件,然后点击菜单栏 文件→使用 Microsoft Office Word 编辑,之后系统会自动打开 Word 并显示HTML文件的内容,这是保存即可

如果找不到“使用 Microsoft Office Word 编辑”的话,点击菜单栏 工具→Internet 选项→程序→ HTML 编辑器 → Microsoft Office Word → 确定。

word可以直接打开html好吧,~~在存一遍就行了。。。。那么麻烦干嘛???

相关阅读

  • 求助怎么把<em>HTML</em>以<em>WORD</em>格式导出

  • 乔山办公网word文档
  • 1、实现富文本中样式代码的分离;2、保留zhidaoCSS样式;其实以上两个步骤是相互矛盾的处理过程,无法通过Jacob或POI组件加正则表达式过滤解决,于是进行了以下步骤的实验:1、首先创
  • <em>poi</em>的<em>word</em>转<em>

  • 乔山办公网word文档
  • 实现代码如下:public class Word2Html { public static void main(String argv[]) { try { //word 路径 html输出路径 e5a48de588b6e799bee5baa6e997aee7ad94365convert2Html(
关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网