本书未发布
1.1. 爬虫能做什么?
爬虫是一个在网上工作的机器人。当然,爬虫也可以称之为网络蜘蛛。为什么爬虫可以称之为网络蜘蛛呢?我们可以把以下这张网比作整个互联网,然后我们再把这只蜘蛛比作我们的爬虫(网络机器人),爬虫就会像这只蜘蛛一样,在互联网上不知疲倦地工作。
爬虫可以做什么
爬取数据
在互联网上重复人为操作
ddos,犯法行为
爬取数据(网络爬虫诞生原因)
爬取数据可以说是爬虫的本质,因为爬取数据就是爬虫诞生的原因。在早期的互联网时代,网站只有少数几个。但是到了后来,互联网越来越发达,于是,更多的网站也开发了出来。随着网站增多,搜索引擎也诞生了,而搜索引擎也就是基于爬虫。爬取数据可以爬哪些呢?可以爬文字,图片,音频等数据。在互联网上重复人为操作
爬虫不仅可以爬取数据,还可以像一个机器人在互联网上重复人为操作。爬虫可以实现自动下单,自动评论,自动为朋友投票…… 让一些繁琐操作变得自动化。
3.ddos
相信大家都对 ddos 不陌生。没错,ddos 就是网络攻击的一种方法。但是当你毫无节制地对一个网站进行爬虫,这个网站就会遭受类似于 ddos 的网络攻击,严重的话就要坐牢。关于爬虫的法律规制,下一篇会讲到。
《Python爬虫 从入门到入狱》原作者:Learnku用户@Coolest
推荐文章: