为什么postman能访问，而python无法爬取该网站

问答 / 0 / 9 / 创建于 3年前

会返回403错误，headers我换了好几次了，还去手机上chrome的去取headers还是没用，但是postman和浏览器是可以访问，这是用了啥反爬虫机制？

url = 'https://yydstxt234.com/'

headers = {
    'User-Agent': 'Mozilla/5.0 (Linux;Android 12;M2011K2C) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/107.0.0.0 Mobile Safari/537.36',
    'sec-ch-ua': '"Chromium";V="107","Not=A?Brand";V="24"',
    'sec-ch-ua-mobile': '?1',
    'sec-ch-ua-platform': "Android",
    'sec-fetch-dest': 'document',
    'sec-fetch-mode': 'navigate',
    'sec-fetch-site': 'same-origin',
    'sec-fetch-user': '?1',
    'upgrade-insecure-requests': '1'
}

r = requests.get(url, headers=headers, timeout=15)
print(r)

python 爬虫 requests

293 声望

暂无个人描述~

推荐文章：

更多推荐...

置顶

[进度 100.00%] Python Masonite 4.0 中文翻译召集（Python 中的类 Laravel 框架） 15 / 20 |

2021年python库大全 30 / 5 |

Python Masonite 框架中文翻译召集（Python 中的类 Laravel 框架） 24 / 25 |

收集了一些各大网站 python 的登陆方式,希望对学习 python 的小白，和想写爬虫的你们有所帮助,,本项目用于研究和分享各大网站的模拟登陆方式 17 / 5 |

Python 3.7 的一些新特性 10 / 2 |

一起学 Python 《Python 最佳实践指南》翻译召集 16 / 2 |

讨论数量: 9

miusa166

21 声望

网站有问题吧 404了

3年前评论

zmxyzmxy1234 （楼主）

网站判断了UA，如果是PC就跳转404，不用我代码里的UA就可以了

zmxyzmxy1234 （楼主）

greasyfork.org/zh-CN/scripts/45910...

Jason990420

1.9k 声望 / 個人 @ 個人

yydstxt234.com/
file

3年前评论

zmxyzmxy1234 （楼主）

这个就是403了，被拒绝访问了，但是浏览器和postman可以

Jason990420 （作者）

@zmxyzmxy1234 这就是我的浏览器或手机的结果

zmxyzmxy1234 （楼主）

@Jason990420 把UA改成手机的就行了，屏蔽了PC的UA

PeeKab0o

9 声望

浏览器F12看下有没有300多的码，有的话就是被重定向了，postman和requests调用都可以设置是否支持重定向。另外https的链接可以试试跳过证书验证。
我这边直接用你的代码调用正常的。反而浏览器访问报404了。

Python

3年前评论

zmxyzmxy1234 （楼主）

好的，我现在在用js爬取，我下次再试试看支持重定向

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助