python3中requests库重定向获取URL

前言：

有时候我们抓取一些页面，发现一些url 有重定向，返回 301 ，或者302 这种情况。那么我们如何获取真实的URL呢？或者跳转后的URL呢？

这里我使用 requests 作为演示

假设我们要访问某东的电子商务网站，我只记得网站好像是 http://jd.com

import requests

def request_jd():
    url = 'http://jd.com/'
    #allow_redirects= False 这里设置不允许跳转
    response = requests.get(url=url, allow_redirects=False)

    print(response.headers)
    print(response.status_code)

看结果返回response header 中有一个属性 Location ，代表重定向了 'Location': 'https://www.jd.com'

python3中requests库重定向获取URL

我们在浏览器中 chrome network 面板，抓包观察。注意把 preserve log 这个选项勾选上。

从浏览器的response header 中我们可以看到 Location，从 General 我们可以看到 status code 301 ，发生了跳转。

python3中requests库重定向获取URL

方法1：

你现在知道如何获取跳转后的URL了吗，直接从response header，获取 Location 即可。

在request.header 中返回header 的key是不区分大小写的，所以全小写也是可以正确取值的。

import requests

def request_jd():
    url = 'http://jd.com/'
    response = requests.get(url=url, allow_redirects=False)
    #return response.headers.get('location')
    return response.headers.get('Location')

方法2：

其实默认情况下， requests 会自动跳转，如果发生了重定向，会自动跳到location 指定的URL，我们只需要访问URL，获取response，然后 response.url 就可以获取到真实的URL啦。

import requests

def request_jd():
    url = 'http://jd.com/'
    response = requests.get(url=url)
	
    return response.url

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

python3中requests库重定向获取URL

评论(0)

提示：请文明发言取消回复

作者信息

本站推荐

OpenCV全攻略C++计算机视觉项目实践含源码

何伟元素流瑜伽系统基础师资培训67GB

移动端APP渗透测试（价值199元）网络攻防

Python高级编程实战及应用[前后端开发]

清栀老师AI风景短视频剪辑自学课入门到进阶

阿炳老师·2026Coze平台搭建智能体课程

热门资源

苹果cms海螺影视模板/大橙子模板/仿B站模板/v7模板/带手机移动端+详细安装使用说明

【已测】修复版H5骰子微信竞猜游戏骰宝免公众号版修复登录ID相同完美全套源码对接免签支付

网页游戏卧龙吟一键服务端加远程工具带架设教程

邪风曲单机版 2D回合制网络游戏源码一键安装即玩服务端公益服+GM工具

完整可用版本去水印小程序源码带教程源码

仙侠H5【苍穹剑诀】一键即玩端+授权后台+外网教程

python3中requests库重定向获取URL

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

本站推荐

热门资源

提示：请文明发言取消回复