requests 函数对百度链接代码的抓取问题

问答 / 0 / 6 / 创建于 6年前

图一是百度链接，图二是搜狗链接，requests函数没有抓取到百度的代码，请教问题出在哪里？

woodee99

6 声望

暂无个人描述~

0 人点赞

推荐文章：

更多推荐...

置顶

[进度 100.00%] Python Masonite 4.0 中文翻译召集（Python 中的类 Laravel 框架） 15 / 20 |

公告

Python Masonite 框架中文翻译召集（Python 中的类 Laravel 框架） 24 / 25 |

博客

收集了一些各大网站 python 的登陆方式,希望对学习 python 的小白，和想写爬虫的你们有所帮助,,本项目用于研究和分享各大网站的模拟登陆方式 17 / 5 |

翻译

Python 3.7 的一些新特性 10 / 2 |

链接

快速掌握一个语言最常用的 50% 11 / 1 |

翻译

使用 Python 一步步搭建自己的区块链 22 / 1 |

讨论数量: 6

pardon110

862 声望 / 开发者 @ 社科大

普通的静态页面，你那样操作没问题。但百度有自己的反爬机制，你想要的目标页面是被js动态渲染后的页面。
换而言之，百度会分析你的请求特征点，根据一定模型算法来裁定你是否人为的真实有效的请求，然后给出不同页面响应。
建议想达到浏览器打开的效果，python需要借助Selenium，golang的话ferret+fql可解决。

6年前评论

Jason990420

1.9k 声望 / 個人 @ 個人

这给的图片不都抓取到 html 页面了吗?!

6年前评论

fuckandshit

1 声望

需要加请求头

5年前评论

Mr_Han_

1 声望

不加headers的请求都是在裸奔，当然不会给你后台代码，加上请求头和里面的ua就行了

5年前评论

bamboo_

0 声望

其实你打印的内容就是百度的页面html，只不过你用的text，导致编码错误，中文没有显示出来

import requests

url = "https://www.baidu.com"
resp = requests.get(url).content
print(resp.decode("utf-8"))

5年前评论

Snakekeeper

4 声望

r.text返回的是Unicode型的数据。使用r.content返回的是bytes型的数据。也就是说，如果你想取文本，可以通过r.text。如果想取图片，文件，则可以通过r.content。

5年前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

requests 函数对百度链接代码的抓取问题

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

requests 函数对百度链接代码的抓取问题

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录