当前位置:   article > 正文

【Python学习笔记3】体验第三方库“requests”和“lxml”,简化网页读取和字段匹配的代码_# pip install requests,pip install lxmlimport requ

# pip install requests,pip install lxmlimport requestsfrom lxml import e

【介绍】

requests:requests 是用Python语言编写,基于自带库urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便

lxml:XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。对应插件名为lxml

 

【安装】

在命令行分别执行如下命令

  1. python -m pip install --upgrade pip
  2. pip install requests
  3. pip install lxml

 

【体验】

1、使用requests可以执行多种网页访问命令,如get、put、post、head等,详细可参考https://www.cnblogs.com/mrchige/p/6409444.html

2、体验使用python自带urllib+正则表达式提取内容;体验使用第三放库 lxml+xpath来提取内容。

  1. #!/usr/bin/python3
  2. #-*- coding: utf-8 -*-
  3. import re #python自带插件
  4. import requests #第三方插件
  5. from lxml import etree #第三方插件 使用xpath要用
  6. #爬取阿里文学的页面
  7. ret = requests.get("http://www.aliwx.com.cn
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/728878
推荐阅读
相关标签
  

闽ICP备14008679号