scrapy 中的 headers，Resquest，response

lizhiqiang666 的个人博客 / 1 / 0 / 创建于 6年前

1.为了让程序请求模仿的更像浏览器，需要在headers请求头上添加一些参数

2.headers请求头的部分重要参数：
Host (主机和端口号)
Connection (链接类型)
Upgrade-Insecure-Requests (升级为HTTPS请求)
User-Agent (浏览器名称)
Accept (传输文件类型)
Referer (页面跳转处)
Accept-Encoding（文件编解码格式）
Cookie （Cookie）
x-requested-with :XMLHttpRequest (是Ajax 异步请求)

3.# 请求一个url,创建了一个Request对象
scrapy.Resquest(
url,
callback=xxx,
headers=xxx
)

3.scrapy的Resquest对象具有的实例属性
这些参数为None时(创建Request对象未传入)，会使用配置中默认的参数
def init(self, url, callback=None, method=’GET’, headers=None, body=None,
cookies=None, meta=None, encoding=’utf-8’, priority=0,
dont_filter=False, errback=None, flags=None):
1.headers为None时采用默认的请求头信息
默认的请求头信息在配置文件中(可以在这里打开注释修改请求头,也可以在创建Request对象时传入headers,形式为键值对
但是headers不能定义cookie)

#DEFAULT_REQUEST_HEADERS = {

‘Accept’: ‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,

‘Accept-Language’: ‘en’,

#}
在请求中传入headers
scrapy.Request(
self.start_urls[0],
callback=self.parse,
headers={xx:xx,xx:xx} # 这些参数会和默认请求头的参数进行合并，然后请求时带上合并后的请求头
)

4.获取请求头和响应头的参数（参数名不确定时可以打开浏览器开发者工具查看）

获取请求头

response.request.headers.getlist(参数名)

获取响应头

response.headers.getlist(参数名)

5.response响应对象
response.url：当前响应的url地址
response.request.url：当前响应对应的请求的url地址
response.headers：响应头
response.body：响应体，也就是html代码，默认是byte类型
response.requests.headers：当前响应的请求头

本作品采用《CC 协议》，转载必须注明作者和本文链接

311 声望

技术负责人 @ 某某

那么近，这么远

《L02 从零构建论坛系统》

以构建论坛项目 LaraBBS 为线索，展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。

《G01 Go 实战入门》

从零开始带你一步步开发一个 Go 博客项目，让你在最短的时间内学会使用 Go 进行编码。项目结构很大程度上参考了 Laravel。

推荐文章：

更多推荐...

价值千万的诊所saas项目正式开源 15 / 26 |

Dcat-Plus-Admin：dcat-admin框架的超级增强版，开发效率提升200%！ 18 / 17 |

用 Laravel12 Startkit 做了一个 composer 私有包托管平台 😂 点赞超过 20 个开源，看看需要的人多不多 29 / 21 |

如何打造令后端面试官印象深刻的简历？ 16 / 10 |

花了四个月打磨的 Laravel Plus 开源 35 / 104 |

冯老师的困惑 —— 一个跑了两年的 BUG 22 / 18 |

讨论数量: 0

(=￣ω￣=)··· 暂无内容！

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

技术负责人 @ 某某

私信

文章归档

3 篇 2021 年 1 月 6 篇 2020 年 12 月 3 篇 2020 年 11 月 1 篇 2020 年 9 月 1 篇 2020 年 7 月 1 篇 2020 年 6 月 1 篇 2020 年 5 月 4 篇 2020 年 4 月 3 篇 2020 年 3 月 2 篇 2020 年 1 月 5 篇 2019 年 12 月 14 篇 2019 年 11 月 2 篇 2019 年 10 月 6 篇 2019 年 9 月 6 篇 2019 年 8 月 4 篇 2019 年 7 月 2 篇 2019 年 6 月 2 篇 2019 年 5 月 1 篇 2019 年 4 月 3 篇 2019 年 3 月 5 篇 2019 年 1 月 15 篇 2018 年 12 月

5年前 gitlab的安装与修改端口配置 5年前 gitlab中文版安装 5年前完全卸载删除gitlab 5年前 JAVA使用poi导出Excel，合并单元格，设置自动列宽 5年前使用java的HTML解析器 jsoup来防止XSS攻击

347 PHP 高级工程面试题汇总 282 在面试前必须要知道的 Redis 面试内容 136 Laravel 中的 Event 和事件的概念 48 ThinkPHP 5.x 远程命令执行漏洞分析与复现 20 总结 XSS 与 CSRF 两种跨站攻击

博客标签

Apache ActiveMQ

Spring Security Oauth2.0

spring boot 2.0

security oauth2 password

亿级流量高并发

成为赞助商