2024年搜索引擎如何制作?(Excel居然可以做搜索引擎)

心血来潮在知乎里面搜索一下 Excel,想学习一些高点赞文章的写作方法。
看到这些标题,完了,一下子勾起下载和收藏的欲望啦!
怎么样把所有高点赞的文章全部都抓下来呢?
开始的时候我想的是用 Python。
后来想一想,用 Power query 好像也可以实现,于是就做出了下面这个效果。
在表格里面输入搜索词,然后右键刷新,就可以得到搜索结果。
你能明白我一定要抓到表格里吗?
因为 Excel 里可以根据「点赞数量」直接排序啊!
那种感觉就跟排队一样,到哪里排队,我都是第 1 个,挑最好的!
好了,闲话少说,我们来看一看这个表格是怎么做出来的。
大致可以分为 4 个步骤:
? 获取 JSON 数据连接;
? Power query 处理数据;
? 配置搜索地址;
? 添加超链接
01
操作步骤
? 获取 JSON 数据连接
平常在浏览网页的时候,是一个单纯的网页地址。
而网页里所看到的数据,实际上也有一个单独的数据链接,这个可以在浏览器里面查找到。
我们需要的数据链接,对应的通常是 JSON 格式的数据,就像下面这样。
查找的方法,需要进入到开发者模式,然后查看数据的 Network 变化,找到 xhr 类型的链接,其中一个就是数据的传输连接。
把这个链接复制下来,这就是 Power query 要抓取数据的链接。
? Power query 处理
你可能不知道,Power Query 除了可以抓取 Excel 当中的数据之外,
还可以抓取 SQL、Access 等多个类型的数据:
网站数据也是其中一个:
把前面我们获取的链接,粘贴到 PQ 里面,链接就可以抓取数据了。
然后得到的是网页的数据格式,怎么把具体的文章数据获取到呢?
Power Query 强大的地方就在于,它可以自动识别 json 的数据格式,并解析提取具体的内容。
整个过程,我们不需要做任何的操作,只是鼠标点点就可以完成。
这个时候我们获得的数据,会有一些不需要的多余的数据。
比如说:thumbnail_info(缩略图信息),relationship,question,id.1 等等。
把它们删掉,只保留可需要的文章的标题、作者、超链接等等就可以了。
数据处理完成后,在开始选卡,点击「关闭并上载」,就完成了数据的抓取,非常简单。
? 配置搜索地址
不过这个时候,我们所抓取到的数据是固定的,没办法根据我们输入的关键词来更新。

微信扫码上方二维码,可领取2025年最新互联网创业项目!
项目收款截图








推荐阅读: