乔山办公网我们一直在努力
您的位置:乔山办公网 > excel表格制作 > Excel 获取这个网页源代码怎么出现中文乱码-excel抓取网页数据,excel实时抓取网站数据

Excel 获取这个网页源代码怎么出现中文乱码-excel抓取网页数据,excel实时抓取网站数据

作者:乔山办公网日期:

返回目录:excel表格制作


我以前也遇到过类似情况,是不是你的计算机除了安装OFFICE2007,还安装了WPS相关的软件。如果安装了WPS,请卸载WPS,再重新导出。或许能解决你的问题。

出现乱码的几种原因和解636f7079e799bee5baa6e79fa5e98193339决办法:
一、出现乱码的原因:
1、网站头部设定的编码和网页本身的编码不一致导致的,html网页头部代码:<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />是告诉浏览器该用什么编码来读取网页的内容,然后浏览器就会启用相应的解码来程序内容,同时,网站本身还存在一个编码的机制,中国人一般使用gbk、gb2312、utf-8编码,如果网站制作者将网页文件存储为了gbk格式,然后在网页头部却设置了utf-8的格式,那么浏览器在读取网页的时候就会将中文或其他非英文和数字的字符解析成乱码;
如果是这种编码错误,解决办法很简单,将解码方式和文件存储的编码修改成一致即可,浏览者在遇到此类情况,可以在网页空白处右键-编码种选择多种编码方式试试,就可以看到乱码的文字了。
2、不合理的字符串截取造成个别字符乱码,在gbk和gb2312编码下,中文是占用两个字节,而在utf-8编码模式下,中文字符占用三个字节,而英文和数字都是占用一个字节,如果用英文的一些截取方式去截取中文字符的话,就可能出现将一个中文截断的现象,网页就会出现中文乱码,而gbk和utf-8的中文截取手段也不一样。
二、解决办法:
1、首先打开Excel 2007工作表,点击想要把数据导入的位置,然后在菜单栏找到第五项"数据“,点击,在“获取外部数据”项下找到“自网站”并点击。
可以尝试先复制到文档,然后再导入

用powerquery大法吧

简单e799bee5baa6e997aee7ad94e59b9ee7ad94337来说就是引入网页源,提取表格数据。然后对表格里的base64编码进行转化。转化的代码是:

= Table.TransformColumns(源{0}[Data],{

{"序号",each Text.FromBinary(Binary.FromText(_),BinaryEncoding.Base64)},

{"期数",each Text.FromBinary(Binary.FromText(_),BinaryEncoding.Base64)},

{"时间",each Text.FromBinary(Binary.FromText(_),BinaryEncoding.Base64)},

{"在线人数",each Text.FromBinary(Binary.FromText(_),BinaryEncoding.Base64)},

{"计算结果",each Text.FromBinary(Binary.FromText(_),BinaryEncoding.Base64)},

{"波动值",each Text.FromBinary(Binary.FromText(_),BinaryEncoding.Base64)}

})

提供一个示例文件供参考:链接: https://pan.baidu.com/s/1fN6fihneR-picZuaV0-tnA 提取码: x8jm


用法:在Excel2016及以上版本,在Sheet1中修改要抓取的页码数量,然后点击【数据】选项卡,点击【查询和链接】,选择【全部刷新】,最新结果就加载到名为“结果”的sheet了。

相关阅读

关键词不能为空
极力推荐

ppt怎么做_excel表格制作_office365_word文档_365办公网