求教有关python爬虫如何爬取多种不同类型网站的方法

本人因为毕设需要,在新浪舆情通上下载了一些数据,但都只含有网址,所以需要自己进行爬取。然而在网上了解过后,只学会了爬取同一种类型的网站,面对非常复杂的信息来源有些束手无措,恳请各位前辈能传授一些方法或者推荐一些课程,不胜感激!

讨论数量: 1

页面嵌套的话就一个一个取爬取,拿到需要的链接继续请求就行,爬虫提取的技术:re,beautifulshop,xpath,pyquery,随便那一个都可以解决复杂的数据提取任务

2个月前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!