作者:乔山办公网日期:
返回目录:word文档
'word文档转换成html格式
'**********************************************************
'
' 调用方法:doc2html c:\doc2html c:\doc2html
' 调用方法:doc2html -s c:\doc2html\a.doc c:\doc2html
'
'**********************************************************
Dim Objword
Dim Objdoc
Dim Objfso
Dim Strsource
Dim Strtarget
Dim Bbatch
'得到命令行参数,有三种7a64e59b9ee7ad94364可能的格式:[-s] 要进行转换的源文件目录或文件 转换成Html文件后保存的目录
Function Getparams()
Dim Objarg
If Wscript.Arguments.Count >= 2 Then
If Wscript.Arguments.Item(0) = "-s" Or Wscript.Arguments.Item(0) = "-S" Then
Strsource = Wscript.Arguments.Item(1)
Strtarget = Wscript.Arguments.Item(2)
Bbatch = False
Else
Strsource = Wscript.Arguments.Item(0)
Strtarget = Wscript.Arguments.Item(1)
Bbatch = True
End If
Else
Wscript.Quit(1)
End If
End Function
Function Batchprocessing()
Dim Objfolder
Dim Objfile
Dim Lpos
Dim Strfilename
Lpos = 0
Set Objfolder = Objfso.Getfolder(Strsource)
For Each Objfile In Objfolder.Files
Lpos = Instr(1,Mid(Objfile.Path,Len(Objfile.Path) - 3,4),"Doc",1)
If Lpos > 0 Then
Strfilename = Objfso.Getbasename(Objfile.Path)
Wordinterface Objfile.Path,Strfilename
End If
Next
End Function
看过网上很多创建word文件的办法,大都会要求客户段浏览器设置安全性,有很大的局限性。
经过本人摸索,找到一条目前本人认为最简易的办法,不敢独享,请朋友们点评。
1 利用word生成相应的word文件,如固定格式的表格等,然后用“另存为”功能存成htm格式。
2 使用记事本等打开,可看见html源码。
3 将代码开始处的以下内容:
<html xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns="http:///TR/REC-html40";>
<head>
<meta http-equiv=Content-Type content="text/html; charset=gb2312">
<meta name=ProgId content=Word.Document>
<meta name=Generator content="Microsoft Word 11">
<meta name=Originator content="Microsoft Word 11">
改为基本html代码:
<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=gb2312">
4 在页面最开始处添加以下语句:
<% Response.ContentType = "application/msword"
response.AddHeader "content-disposition", "inline; filename=测试.doc"
' 此处可添加变量处理等语句,如打开数据库获取记录集等。
'
%>
5 在html代码中找到表格中相应位置填入asp变量或数据库字段值。如以下代码代表一个单元格:
<td width=114 valign=top style='width:85.2pt;border:solid windowtext 1.0pt;
border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
<p class=MsoNormal><span lang=EN-US><o:p> </o:p></span></p>
</td>
可修改为:
<td width=114 valign=top style='width:85.2pt;border:solid windowtext 1.0pt;
border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
<p class=MsoNormal><span lang=EN-US><o:p> </o:p></span></p> <%=trim(.fields("奖金").value)%>
</td>
注意<%...%>中的内容即是要输出的变量或字段值,(废话,ASP人都知道)
6 保存,扩展名由htm改为asp即可。
运行看看,浏览器自动弹出下载对话框,文件名为“测试.doc”,也可直接打开!
此法最大的优点在于多么复杂的word格式表格也能轻松搞定。
缺点是html代码稍有点复7a64e59b9ee7ad94331杂,表格位置不好找。其实在做word文件时在单元格里输入特殊字符,然后在htm代码中查找该字符就可轻松定位。
网上找的答案,我试过了,可行。
1 利用word生成相应的word文件,如固定格式的表格等,然后用“另存为”功能存成htm格式。
2 使用记事本等打开,可看见html源码。
3 将代码开始处的以下内容:
<html xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns="http:///TR/REC-html40";>
<head>
<meta http-equiv=Content-Type content="text/html; charset=gb2312">
<meta name=ProgId content=Word.Document>
<meta name=Generator content="Microsoft Word 11">
<meta name=Originator content="Microsoft Word 11">
改为基本html代码:
<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=gb2312">
4 在页面最开始处添加以下语句:
<% Response.ContentType = "application/msword"
response.AddHeader "content-disposition", "inline; filename=测试.doc"
' 此处可添加变量处理等语句,如打开数据库获取记录集等。
'
%>
5 在html代码中找到表格中相应位置填入asp变量或数据库字段值。如以下代码代表一个单元格e799bee5baa6e997aee7ad94e58685e5aeb9366:
<td width=114 valign=top style='width:85.2pt;border:solid windowtext 1.0pt;
border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
<p class=MsoNormal><span lang=EN-US><o:p> </o:p></span></p>
</td>
可修改为:
<td width=114 valign=top style='width:85.2pt;border:solid windowtext 1.0pt;
border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
<p class=MsoNormal><span lang=EN-US><o:p> </o:p></span></p> <%=trim(.fields("奖金").value)%>
</td>
注意<%...%>中的内容即是要输出的变量或字段值,(废话,ASP人都知道)
6 保存,扩展名由htm改为asp即可。
运行看看,浏览器自动弹出下载对话框,文件名为“测试.doc”,也可直接打开!
此法最大的优点在于多么复杂的word格式表格也能轻松搞定。
缺点是html代码稍有点复杂,表格位置不好找。其实在做word文件时在单元格里输入特殊字符,然后在htm代码中查找该字符就可轻松定位。
复制上述代码到新建文本文档,另知存为-保存类型为“所有文件”,文件名为“*.caa”
,然后用道CAJViewer打开上述caa文件,
需要联网,等待文件下载完成,即可文件另存为“*.hn”文件,nh文件是中回国知网的文档格式,类似于pdf,一般可以复制其中文本,答如果不能复制可以尝试文字识别