AnyPapa插件,抖音/微信公众号/知乎/淘宝数据爬虫工具
AnyPapa插件,中文“爬爬”,是国内知名社交媒体数据分析平台TooBigData制作的浏览器插件,是一个简单易用的免费数据爬虫工具。可在Chrome浏览器,和360浏览器、QQ 浏览器、搜狗浏览器等Chromium内核的浏览器中使用。
AnyPapa插件,中文“爬爬”,是国内知名社交媒体数据分析平台TooBigData制作的浏览器插件,是一个简单易用的免费数据爬虫工具。可在Chrome浏览器,和360浏览器、QQ 浏览器、搜狗浏览器等Chromium内核的浏览器中使用。
如今短视频和微信公众号的大火,令越来越多的内容营销都转移到了移动端上进行。
那么,为了更好地分析整理统计短视频和公众号的各种数据,比如标题、内容、评论、点赞等,就需要靠爬虫技术手段来实时爬取内容。
AnyPapa插件,你的个人数据助手,能够帮你在浏览器中爬到一些需要的数据。
功能介绍
AnyPapa的功能非常简单明了,就是爬取页面上的内容,无需写代码,所见即所爬。主要包括以下几方面:
1、自动采集页面可见数据
安装好插件后,只要在浏览器中打开一篇公众号、知乎话题,或者短视频,浏览器顶部会弹出相关提示,然后便在后台自动爬取相关数据。
然后点击插件图标,【本地数据】按钮,选择相关数据源,即可查看刚才爬取到的内容了。
2、在网页上显示微信文章的阅读点赞评论打赏数据
爬取到的公众号文章数据包括阅读数、点赞数、评论数、图片数,还有内链数等等。
3、支持多个数据源
AnyPapa插件支持的数据源包括微信文章、今日头条文章、知乎、豆瓣电影、大众点评、京东/天猫/淘宝商品、微博用户信息、抖音小视频、火山小视频等等。
一个插件,解决多个平台的数据爬取问题。
4、懒人按钮,无限下翻
安装插件后,当浏览到相关页面的时候,右侧还会出现一个爬爬懒人工具按钮,可以无限下翻、爬取,或者滚动页面,解放你的双手。
5、辅助自动爬数
内置通用的URL打开器,可辅助自动爬数。
点击插件菜单上的【队列】按钮,可以选择从服务器获取任务,或者在文本框中输入需要采集的URL,每行一个。
6、浏览器书签
AnyPapa插件还可以自动同步你的浏览器书签,但不会上传到服务器中。
注意事项
采集微信数据需要特定微信版本的支持(Windows版确认支持1.x,Mac版确认支持2.2.8及以下,Windows上QQ浏览器自带的微信也支持)。
请务必在微信客户端中打开微信文章链接,无论是纯文本的链接或是图文样式的链接。
启动分钟监测后,文章大约每分钟刷新一次,自动采集数据。最多持续2小时。监测约2小时后,请重新在微信对话框中点击文章链接。
开发者介绍
TooBigData是一个致力于分享各种社交媒体数据的平台,通过官方的数据爬虫,用户可以获取国内各大知名媒体的数据资料,如微博、豆瓣电影、淘宝众筹、东京商品、抖音等等。
AnyPapa插件是一个开源工具,如果你有需要,值得下载尝试。
AnyPapa插件,抖音/微信公众号/知乎/淘宝数据爬虫工具 - Extfans”