本书未发布

1.1. 爬虫能做什么?

未匹配的标注

爬虫是一个在网上工作的机器人。当然,爬虫也可以称之为网络蜘蛛。为什么爬虫可以称之为网络蜘蛛呢?我们可以把以下这张网比作整个互联网,然后我们再把这只蜘蛛比作我们的爬虫(网络机器人),爬虫就会像这只蜘蛛一样,在互联网上不知疲倦地工作。

爬虫可以做什么
爬取数据

在互联网上重复人为操作

ddos,犯法行为

  1. 爬取数据(网络爬虫诞生原因)
    爬取数据可以说是爬虫的本质,因为爬取数据就是爬虫诞生的原因。在早期的互联网时代,网站只有少数几个。但是到了后来,互联网越来越发达,于是,更多的网站也开发了出来。随着网站增多,搜索引擎也诞生了,而搜索引擎也就是基于爬虫。爬取数据可以爬哪些呢?可以爬文字,图片,音频等数据。

  2. 在互联网上重复人为操作
    爬虫不仅可以爬取数据,还可以像一个机器人在互联网上重复人为操作。爬虫可以实现自动下单,自动评论,自动为朋友投票…… 让一些繁琐操作变得自动化。

3.ddos
相信大家都对 ddos 不陌生。没错,ddos 就是网络攻击的一种方法。但是当你毫无节制地对一个网站进行爬虫,这个网站就会遭受类似于 ddos 的网络攻击,严重的话就要坐牢。关于爬虫的法律规制,下一篇会讲到。

《Python爬虫 从入门到入狱》原作者:Learnku用户@Coolest

本文章首发在 LearnKu.com 网站上。

上一篇 下一篇
讨论数量: 0
发起讨论 只看当前版本


暂无话题~