Python 测开27期 - WL - 学习笔记 - 常用第三方库 urllib3

常用第三方库 urllib3

urllib3 概述

  • 内置模块
    ** urllib
  • 第三方库
    ** requests
    ** urllib3
  • 线程安全
  • 连接池管理
  • 客户端 SSL/TLS 验证
  • 支持 HTTP 和 SOCKS 代理
  • 官方文档:https://urllib3.readthedocs.io/stable/

urllib3 安装

  • 通过 pip 安装:pip install urllib3

urllib3 发送 http 请求

import urllib3

def test_HTTP():
    # 创建 线程池 对象
    pm = urllib3.PoolManager()
    resp = pm.request(method='GET',url='http://httpbin.org/get')
    print(type(resp))

urllib3 HTTPResponse 对象

  • status 属性:请求响应状态码,200成功,301重定向,404请求资源不存在,500服务端错误
  • headers 属性:响应头部信息
  • data 属性:响应正文

urllib3 解析响应内容

import urllib3
import json

def test_response():
    # 创建 线程池 对象
    pm = urllib3.PoolManager()
    # 发送请求
    resp = pm.request(method='GET', url='http://httpbin.org/get')
    print(type(resp))

    # 获取 二进制 响应内容
    raw = resp.data
    print(type(raw), raw)
    # 将 二进制 解码成 字符串
    content = raw.decode('utf-8')
    print(type(content), content)
    # json 解析成字典对象
    obj = json.loads(content)
    print(type(obj), obj)
    print(obj["origin"])
    print(obj['headers'])

urllib3 request 请求参数

  • 语法:request(method, url, fields, headers, **)
  • 必填项
    ** method:请求方式,POST、GET、PUT等,必须大写
    ** url:请求地址
  • 选填项
    ** headers:请求头信息
    ** fields:请求体数据
    ** body:指定请求体类型
    ** timeout:设置超时时间

urllib3 定制请求数据

  • 定制请求头信息
  • 使用headers参数
    image
import urllib3
import json

def test_headers():
    # 创建 线程池 对象
    pm = urllib3.PoolManager()
    url = 'http://httpbin.org/get'
    # 定制请求头信息
    headers = {"School": "hogwars", "newsa": 33}
    # 发送请求
    resp = pm.request('GET', url, headers=headers)
    # 查看响应信息
    content = json.loads(resp.data.decode('utf-8'))
    print(content)
    print(content['headers']['School'])

urllib3 定制请求数据

  • 定制查询字符串参数
    ** firlds 参数:适用于 GET,HEAD,DELETE 请求
    ** 拼接 url :适用于 POST、PUT 请求
import urllib3
import json

#  get \ head \ delete 请求
def test_reqs():
    pm = urllib3.PoolManager()
    url = 'http://httpbin.org/get'
    # 设定 查询字符串
    fields = {"school": "china"}
    # 发送请求
    aaa = pm.request('GET', url, fields=fields)
    # 查看响应信息
    ss = json.loads(aaa.data.decode('utf-8'))
    print(ss)
# post \ put 请求
def test_post():
    pm = urllib3.PoolManager()
    url = 'http://httpbin.org/post'
    # 从内置库 urllib 的 parse 模块导入编码方法
    from urllib.parse import urlencode
    # 定义编码对象
    encode_str = urlencode({'school': 'china'})
    # 拼接到 url 中
    resd = pm.request('POST', url=url + '?' + encode_str)
    # 查看响应信息
    dd = json.loads(resd.data.decode('utf-8'))
    print(dd)

urllib3 定制请求体数据

提交 form 表单数据

  • 类型: ‘Content-Type’:‘multipart/form-data’
  • 请求方式:POST、PUT
    image
import urllib3
import json

# post \ put 请求
def test_post():
    pm = urllib3.PoolManager()
    url = 'http://httpbin.org/post'
    fields = {'school': 'china'}
    # 使用 fields 参数 发起请求
    red = pm.request('POST', url, fields=fields)
    # 解析报文信息
    ddd = json.loads(red.data.decode('utf-8'))
    print(ddd)
    print(ddd['form'])

提交 JSON 格式数据

import urllib3
import json

# post \ put 请求
def test_post():
    pm = urllib3.PoolManager()
    url = 'http://httpbin.org/post'
    # 设定请求头数据
    headers = {'Content-Type':'application/json'}
    # 格式化json文本数据
    json_str = json.dumps({'school':'china'})
    # 使用 fields 参数 发起请求
    red = pm.request('POST', url, headers=headers, body=json_str)
    # 解析报文信息
    ddd = json.loads(red.data.decode('utf-8'))
    print(ddd)
    print(ddd['data'])

urllib3 设置超时时间

  • timeout:设置超时时间
  • 时间单位:秒
  • 值的格式:float类型
    image
import urllib3

def test_timeout():
    pm = urllib3.PoolManager()
    url = 'http://httpbin.org/delay/3'
    # 设定超时时间4秒
    # 使用 fields 参数 发起请求
    red = pm.request('GET', url, timeout=4.0)
    print(red.status)
    print(red.data)

urllib3 发送 HTTPS 请求

*. HTTPS 请求默认需要校验证书

  • PoolManage 的 cert_reqs 参数
    ** ”CRET_REQUIRED“:需要校验
    ** “CRET_NONE”:取消校验
    image
import urllib3
import json

def test_httpshttps():
    url = 'http://httpbin.ceshiren.com/get'
    # 创建一个不要校验证书的连接池对象
    pm_https = urllib3.PoolManager(cert_reqs='CERT_NONE')
    # 发起请求
    red = pm_https.request('GET', url)
    content = json.loads(red.data.decode('utf-8'))
    print(content)