Excel抓取网页数据,超简单,实时更新,再也不用一个个复制啦!
哈喽,大家好呀!
今天来教大家如何快速从网站上抓取数据并自动更新。
俗称“爬虫”。
很多人是不是第一反应就是Python
啊,那真的好难好难好难。
没关系,今天这个小技巧,只需要你有个Excel就行,不用安装插件,也不用付费。
今天介绍最简单的一种:用“自网站”命令抓取数据。
1. Excel“自网站”命令抓取数据的操作方法
最近比较关心房价的跌幅,所以下面以房价爬取为例介绍“自网站”命令的使用。
版本说明:Excel 2016及以上就有该命令,WPS或低版本可能会存在差异。
Step1:新建一个空白的表格,在数据选项卡中找到“自网站”按钮。如下图所示:
![](https://i.zz5.net/images/article/2023/07/29/111537162.jpg)
Step2:接着用浏览器打开需要抓取数据的网址,我们复制一下当前网页的网址。
![](https://i.zz5.net/images/article/2023/07/29/111537271.png)
Step3:接着回到Excel中,从数据选项卡中打开自网页按钮,软件会弹出一个“从web”对话框,选择高级,URL部分处粘贴刚刚固执的网址,单击确认后会提示正在连接。随后会出现一个导航器。
![](https://i.zz5.net/images/article/2023/07/29/111537381.gif)
Step4:导航器如下图所示,其中抓取的会有两个表格的数据,Table0是房价涨幅数据,Table1是房价跌幅数据。
现在我们选中Table1在表视图中就能预览看到数据,接着选择转换数据即可。
![](https://i.zz5.net/images/article/2023/07/29/111537474.png)
Step5:转换数据后会跳转到Power Query编辑器界面,因为这个网页的数据相对比较规整的,所以不需要我们做额外的操作,只需要选择关闭并上载即可。
![](https://i.zz5.net/images/article/2023/07/29/111537568.png)
Step6:上载到Excel中的数据如下图所示,查询&连接会提示已经加载了10行。此时的表格数据也是默认套用的超级表样式。
![](https://i.zz5.net/images/article/2023/07/29/111537662.png)
Step7:我们可以光标定位在表格数据中,在表设计中找到快速样式进行更改一个我喜欢的表格样式,当需要刷新数据时可以单击一下刷新中的全部刷新按钮,表格的左下角就会提示在后台运行查询数据。
![](https://i.zz5.net/images/article/2023/07/29/111537771.gif)
Step8:如果我们想自定义一下刷新的时间,也可以通过查询选项卡中找到查询属性,设置一下刷新控件中的刷新频率,这里我们可以以分钟进行自定义刷新的时间。
![](https://i.zz5.net/images/article/2023/07/29/111537865.png)
2. Excel“自网站”命令无法抓取数据的原因
很多朋友随意打开一个网页,看到网页中好像存在数据,就采用自网站命令进行抓取,但往往不成功,只得到一个名为Document的空表格,如下。
![](https://i.zz5.net/images/article/2023/07/29/111537959.jpg)
这是“自网站”命令抓取数据的局限性造成的。它只能抓取符合以下两个特征的网页数据:
(1)支持GET请求。
GET请求指客户向服务器申请获取某个资源。通过Excel“自网站”命令爬数据,实际就是你向服务器发出得到资源请求。如果该资源服务接口不支持GET请求,那就无法爬取。
(2)数据位于网页的table(表格)标签
![](https://i.zz5.net/images/article/2023/07/29/111538053.png)
中。
在浏览器中打开网页后按F12打开网页调试器,单击调试器左上角第一个图标“选取页面元素”图标
![](https://i.zz5.net/images/article/2023/07/29/111538146.png)
,然后移动鼠标到网页中的数据上,即可在“查看器”栏目中查看数据所在标签,如下图。如果数据不在
![](https://i.zz5.net/images/article/2023/07/29/111538240.png)
中则无法爬取。
![](https://i.zz5.net/images/article/2023/07/29/111538334.png)
以上就是今日分享的Excel“自网站”命令抓取数据。它只能爬取位于
![](https://i.zz5.net/images/article/2023/07/29/111538240.png)
标签中的数据,最大的优点是操作简单。
对于其他类型的网页数据,则需要采用其他方法来爬取。有兴趣的伙伴可以留言。我们下期再来分享。
好的,以上就是今天的内容,感谢大家的观看。扫码进群学习Excel。
另外,Excel训练营今晚开班,1元报名,课程长期观看学习,有练习课件!
泰酷啦!这才是最强的Excel数据整理方法
哈喽,大家好。今天来教大家一招,快速处理不规范的数据。如下图所示,我们需要根据开票时间来统计不同交费渠道的开票金额。这是数据原表,在交费渠道那一列,乱七八糟地填写了许多数据。这是我们想要的效果图:如何来操作呢?一起来看看吧,方法还是很简单的:首先,将鼠标放到表格区域,点击数据-来自表格/区域,进入到PQ页面。我们将开票日期这一列的格式改成日期格式。站长网2023-07-28 17:26:310003我曾使用过最干净的电脑,那是我的黑客师傅的电脑 现在我来分享一些
我曾使用过最干净的电脑,那是我的黑客师傅的电脑。现在我来分享一些小技巧,让你的电脑也能像黑客的一样干净。首先,按下win加R键,打开运行模式,输入“%temp%”,然后点击确定。这里存放的都是无用的缓存垃圾,我们可以直接清理掉。接着,再次按下win加R键,打开运行框,输入“MRT”,然后点击确定。站长网2023-07-30 13:11:030000ps调色教程
让你一秒钟变成调色高手,就是——PS调色!🎨👩🎨👨🎨看着那些颜值爆表的照片,你一定会想:“我也想拍出这样的照片!”,那么,就来学学PS调色吧!第一步,打开PS软件,打开需要调色的图片。📷💻第二步,进入图像调整,根据个人喜好,调整亮度、对比度、饱和度等参数,不断尝试,直到你满意为止。🎨👍站长网2023-07-27 14:26:130000SAP ERP系统PP模块控制BOM的变更是否需要ECN的三种解决方法
BOM简称物料清单,它是PC和MC部门编制生产计划,物料采购和生产计划的依据,也是财务成本核算的基础,它的重要性不言而喻。一个公司的生产管理模块(PP)应用的好坏很大程度上取决于它的BOM管理,不少公司就因BOM管理不规范,导致MRP都运行不起来。站长网2023-07-27 09:37:160000微信忘了登录密码,手机号也不用了,教你一招快速找回,一键登录
站长网2023-07-29 11:50:210001