乔山办公网我们一直在努力
您的位置:乔山办公网 > excel表格制作 > excel 网抓

excel 网抓

作者:乔山办公网日期:

返回目录:excel表格制作

不学网络爬虫,用Excel抓取数据,可以吗?


当然是可以的,但是使用起来不是很灵活,没有python等语言抓取数据好处理,下面我大概介绍一下excel抓取数据的过程,实验环境win7+office2013,主要内容如下:

1.新建一个excel文件,双击打开这个文件,分别选择“数据”->“自网络”,如下:

2.在弹出的子窗口输入所要抓取的页面,这里以抓取http://www.pm25.in/rank页面的数据为例,分别点击“转到”->“导入”,如下:

3.成功导入后,数据如下,已经成功抓取到我们所需要的数据:

4.如果想定时刷新数据的话,这里可以点击“全部刷新”->“连接属性”,自定义刷新的频率,默认是60分钟:

在弹出的“选择属性”窗口,设计刷新频率,定时刷新数据:

至此,我们就完成了利用excel抓取数据。总的来说,整个过程挺简单的,只不过灵活性不是很高,而且如果页面比较复杂,抓取的数据量又比较多,后期直接在excel处理起来不是很方便,题主已经都会python了,建议还是用python直接抓取,更灵活,python提供了许多爬虫包和框架,像requests,bs4,lxml,scrapy等,可以快速的抓取数据,也方便后期的处理(像pandas,numpy等),学的话,很快就能上手,网上也有相关资料和教程,希望以上分享的内容能对你有所帮助吧。

Excel怎么抓取网络数据?


Excel抓取并查询网络数据可以使用“获取和转换”+“查找引用函数”的功能组合来实现。


例:下图是百度百科“奥运会”网页中的一个表格,我们以此为例实现抓取该表格至Excel中,并且能够通过输入第几届来查询对应的举办城市。


Step1:使用“获取和转换”功能将网络数据抓取至Excel中

依次点击“数据选项卡”、“新建查询”、“从其他源”、“从Web”。


弹出如下窗口,手动将百度百科“奥运会”的网址复制粘入URL栏,并点击确定。

Excel与网页连接需要一定时间,稍等片刻后会弹出如下窗口,左边列表中的每个Table都代表该网页中的一个表格,挨个点击预览后发现,Table3是我们所需的数据。

点开下方的“加载”旁边的下拉箭头,选择“加载到”。


在弹出的窗口中,在“选择想要在工作薄中查看此数据的方式”下选择“表”,并点击加载。

如图,网页表格中的数据已被抓取至Excel中。

依次点击“表格工具”、“设计”,将“表名称”改为奥运会。


Step2:使用“查找与引用”函数实现数据查询


建立查询区域,包含“届数”和“主办城市”,在届数中随意选取一届输入,下图输入“第08届”,在主办城市下输入vlookup函数,可以得到第08届奥运会的主办城市是巴黎,当更改届数时,对应的主办城市也随之变动。

公式:=VLOOKUP([届数],奥运会[#全部],4,0)

注意点:若网页中的数据变动较频繁,则可以设置链接网页的数据定时刷新:

①将鼠标定位于导入的数据区域中,切换到【设计】选项卡,点击【刷新】下拉箭头→【链接属性】

②在弹出的【链接属性】对话框中,设置【刷新频率】,比如设置为10分钟进行刷新。这样,每隔10分钟数据就会刷新一次,时刻保证获取的数据位最新的。


「精进Excel」系头条签约作者,关注我,如果任意点开三篇文章,没有你想要的知识,算我耍流氓!

本文标签:

相关阅读

  • excel 网抓

  • 乔山办公网excel表格制作
  • 不学网络爬虫,用Excel抓取数据,可以吗? 当然是可以的,但是使用起来不是很灵活,没有python等语言抓取数据好处理,下面我大概介绍一下excel抓取数据的过程,实验环境win7+office20
关键词不能为空
极力推荐
  • 如何在EXCEL中自动算出男生数及女生数?

  • 对于这种情况您可以使用countif函数。首先选中您想要将其结果显示的单元格,点击如图所示的FX字样。打开后请在“或选择类别”的下拉栏里找到统计。往下滑动就能看到一个叫做coun

ppt怎么做_excel表格制作_office365_word文档_365办公网