王柯团队

创业项目
当前位置:王柯团队 > 网络营销 >

2024年搜索引擎如何制作?(Excel居然可以做搜索引擎)

2024-02-26 王柯团队

心血来潮在知乎里面搜索一下 Excel,想学习一些高点赞文章的写作方法。

看到这些标题,完了,一下子勾起下载和收藏的欲望啦!

怎么样把所有高点赞的文章全部都抓下来呢?

开始的时候我想的是用 Python。

后来想一想,用 Power query 好像也可以实现,于是就做出了下面这个效果。

在表格里面输入搜索词,然后右键刷新,就可以得到搜索结果。

你能明白我一定要抓到表格里吗?

因为 Excel 里可以根据「点赞数量」直接排序啊!

那种感觉就跟排队一样,到哪里排队,我都是第 1 个,挑最好的!

好了,闲话少说,我们来看一看这个表格是怎么做出来的。

大致可以分为 4 个步骤:

? 获取 JSON 数据连接;

? Power query 处理数据;

? 配置搜索地址;

? 添加超链接

01

操作步骤

获取 JSON 数据连接

平常在浏览网页的时候,是一个单纯的网页地址。

而网页里所看到的数据,实际上也有一个单独的数据链接,这个可以在浏览器里面查找到。

我们需要的数据链接,对应的通常是 JSON 格式的数据,就像下面这样。

查找的方法,需要进入到开发者模式,然后查看数据的 Network 变化,找到 xhr 类型的链接,其中一个就是数据的传输连接。

把这个链接复制下来,这就是 Power query 要抓取数据的链接。

Power query 处理

你可能不知道,Power Query 除了可以抓取 Excel 当中的数据之外,

还可以抓取 SQL、Access 等多个类型的数据:

网站数据也是其中一个:

把前面我们获取的链接,粘贴到 PQ 里面,链接就可以抓取数据了。

然后得到的是网页的数据格式,怎么把具体的文章数据获取到呢?

Power Query 强大的地方就在于,它可以自动识别 json 的数据格式,并解析提取具体的内容。

整个过程,我们不需要做任何的操作,只是鼠标点点就可以完成。

这个时候我们获得的数据,会有一些不需要的多余的数据。

比如说:thumbnail_info(缩略图信息),relationship,question,id.1 等等。

把它们删掉,只保留可需要的文章的标题、作者、超链接等等就可以了。

数据处理完成后,在开始选卡,点击「关闭并上载」,就完成了数据的抓取,非常简单。

配置搜索地址

不过这个时候,我们所抓取到的数据是固定的,没办法根据我们输入的关键词来更新。

微信扫码上方二维码,可领取2025年最新互联网创业项目!

项目收款截图

最新文章
咨询客服 领取项目