【Python】爬虫详解（一看就懂）_python爬虫详解一看就懂

作者：酷酷是懒虫 | 2024-08-09 19:54:51

踩

python爬虫详解一看就懂

爬虫是什么
爬虫简单的来说就是用程序获取网络上数据这个过程的一种名称。

爬虫的原理
如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的爬虫），爬虫再进行数据解析、保存等一系列操作。

流程
爬虫可以节省我们的时间，比如我要获取豆瓣电影 Top250 榜单，如果不用爬虫，我们要先在浏览器上输入豆瓣电影的 URL ，客户端（浏览器）通过解析查到豆瓣电影网页的服务器的 IP 地址，然后与它建立连接，浏览器再创造一个 HTTP 请求发送给豆瓣电影的服务器，服务器收到请求之后，把 Top250 榜单从数据库中提出，封装成一个 HTTP 响应，然后将响应结果返回给浏览器，浏览器显示响应内容，我们看到数据。我们的爬虫也是根据这个流程，只不过改成了代码形式。
请添加图片描述

HTTP请求

HTTP 请求由请求行、请求头、空行、请求体组成。
请添加图片描述
请求行由三部分组成：

    1.请求方法，常见的请求方法有 GET、POST、PUT、DELETE、HEAD
    2.客户端要获取的资源路径
    3.是客户端使用的 HTTP 协议版本号
1
2
3

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/954941