requests.gPython 用requests.get获取网页内容为空 ’ ’问题

继续运行，发现返回空值，在请求网页爬取的时候，输出的text信息中会出现抱歉，无法访问等字眼，这就是禁止爬取，需要通过反爬机制去解决这个问题。headers是解决requests请求反爬的方法之一，相当于我们进去这个网页的服务器本身，假装自己本身在爬取数据。对反爬虫网页，可以设置一些headers信息，模拟成浏览器取访问网站。

一、如何设置headers

拿两个常用的浏览器举例：

1、QQ浏览器

界面 F12

requests.gPython 用requests.get获取网页内容为空 ’ ’问题

点击network 键入 CTRL+R

requests.gPython 用requests.get获取网页内容为空 ’ ’问题

单击第一个最下边就是我门需要的把他设置成headers解决问题

2、Miscrosft edge

二、微软自带浏览器

同样 F12 打开开发者工具

requests.gPython 用requests.get获取网页内容为空 ’ ’问题

点击网络，CTRL+R

requests.gPython 用requests.get获取网页内容为空 ’ ’问题

前文代码修改：

import requests
ur="http://data.10jqka.com.cn/financial/yjyg/"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3880.400 QQBrowser/10.8.4554.400 '}
result = requests.get(ur, headers=headers)
result.text

成功解决不能爬取问题

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

requests.gPython 用requests.get获取网页内容为空 ’ ’问题

目录

一、如何设置headers

1、QQ浏览器

2、Miscrosft edge

二、微软自带浏览器

评论(0)

提示：请文明发言取消回复

作者信息

本站推荐

青云老师服装人必学的Ai短视频带货实操高阶课

保姆级教学Python爬虫Selenium移动端Appium

某维网校苹果手机维修远程培训录像(38期)

零基础极简JAVA学习专题（价值2382元）

高效工作跟七君学时间管理（价值596元）

李述铜从0到1手把手教你用嵌入式操作系统

热门资源

苹果cms海螺影视模板/大橙子模板/仿B站模板/v7模板/带手机移动端+详细安装使用说明

【已测】修复版H5骰子微信竞猜游戏骰宝免公众号版修复登录ID相同完美全套源码对接免签支付

网页游戏卧龙吟一键服务端加远程工具带架设教程

邪风曲单机版 2D回合制网络游戏源码一键安装即玩服务端公益服+GM工具

完整可用版本去水印小程序源码带教程源码

仙侠H5【苍穹剑诀】一键即玩端+授权后台+外网教程

requests.gPython 用requests.get获取网页内容为空 ’ ’问题

目录

一、如何设置headers

1、QQ浏览器

2、Miscrosft edge

二、微软自带浏览器

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

本站推荐

热门资源

提示：请文明发言取消回复