在网站中,http请求是无状态的,也就是说第一次与服务器连接后并且接收到服务器的返回值的时候,就断开连接,等第二次连接的时候,又是一个新的连接,服务器并不知道之前连接过。cookie的出现就是解决这个问题.主要原理:

在爬虫中使用cookie的主要作用是用来模拟登录后才能访问的网站

1、CookieJar: 管理Http cookie的值,存储http请求生成的cookie、向传出的http的请求添加cookie的对象.整个cookie都存储在内存中,对cookieJar实例进行辣椒回收后cookie也丢失
2、FileCookieJar: 从CookieJar派生而来,用来创建FileCookieJar实例,检索cookie信息并且将cookie存储到文件中,filename是存储的cookie的文件名,delayload为True的时候支持延迟访问文件,即只有在需要时才读物文件或在文件中存储数据.
3、MozillaCookieJar:从FileCookieJar派生而来,创建与火狐浏览器cookie.txt兼容的FileCookieJar实例

1、使用requests请求库

response = requests.get(url='')
response.cookies # 获取全部的cookie
response.cookies.get_dict() # 将cookie以字典的方式展开

3.关于cookie的认识

results matching ""