赞
踩
爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。爬虫, 又称网页蜘蛛或网络机器人。爬虫是 模拟人操作客户端(浏览器, APP) ,向服务器发起网络请求,抓取数据的自动化程序或脚本。
正则表达式(regular expression),又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一些过滤逻辑。在Python中正则表达式通过re模块来实现。
1.爬取百度页面
import requests
# 1.确定url, 向服务器发送请求
url =
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。