Python实现Request Headers参数格式化(添加引号和逗号)
在使用 Python 爬虫时,需要将浏览器复制下来的 Request Headers 参数给它加上引号和逗号,如果参数过多,手动添加的效率就会很低。本文使用字符串的 splitlines() 和 replace() 方法一键格式化
说明
这是浏览器复制下来的 Request Headers:
1 | Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9 |
给它格式化成以下效果:
1 | 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9', |
变化的地方有:
- 每行首尾分别添加
'
、',
:
替换为': '
代码
1 | headers_str = ''' |
输出如下:
1 | 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9', |
使用Web服务
格式化更方便的方式是使用 Web 服务,这是 Django 框架搭建的web:
返回的结果如下: