python
-
知乎爬虫:爬取知乎公众收藏中的文字内容(视频和图片以链接的形式保存)
图片和视频是以链接的形式保存,需要联网才能查看,所以保存到本地的内容其实只有文字。之所以爬取公开收藏夹是因为私密收藏夹需要登陆知乎后才有权限访问,但我了解到爬取内容过多的话有封号的风险,所以就没有尝试做登陆的功能。更改后的值的话,先随便打开一个收藏夹的网址,选中一个回答的内容...
图片和视频是以链接的形式保存,需要联网才能查看,所以保存到本地的内容其实只有文字。之所以爬取公开收藏夹是因为私密收藏夹需要登陆知乎后才有权限访问,但我了解到爬取内容过多的话有封号的风险,所以就没有尝试做登陆的功能。更改后的值的话,先随便打开一个收藏夹的网址,选中一个回答的内容...