2345天气网站爬虫报错反馈403

各位专家好,最新试图在2345天气网站爬虫获取北京历史天气数据–基础学习。

之前已经成功实现爬虫了,提取了数据,但多次爬虫后,status_code反馈403,多种方案均未解决问题,请各位大佬提提可行的意见:IP代理或者headers设置。非常感谢。

代码如下

import requests
url = "https://tianqi.2345.com/Pc/GetHistory"
info = {
    "areaInfo[areaId]": 54511,
    "areaInfo[areaType]": 2,
    "date[year]": 2022,
    "date[month]": 12
}
headers = {
    "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Mobile Safari/537.36",
    'Referer': f'https://tianqi.2345.com/wea_history/54511.htm',
    'X-Requested-With': 'XMLHttpRequest'
}

r = requests.get(url, params=info,headers=headers,timeout=10)

print(r.status_code)
最佳答案

自己去买IP。基本百度上随便一搜就有,有长效的有短效的。看你自己需求。 买了代理IP后发起请求的时候带上proxy就可以了。

3周前 评论
讨论数量: 3

上午换了个电脑,IP更换了,status_code就变成200了,如何给自己电脑设置动态IP呢?

3周前 评论

自己去买IP。基本百度上随便一搜就有,有长效的有短效的。看你自己需求。 买了代理IP后发起请求的时候带上proxy就可以了。

3周前 评论

换一个网站继续爬

2周前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!