搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
从前慢现在也慢
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
CUMCM 2021-B:乙醇偶合制备C4烯烃(多元线性回归分析)_乙醇偶合制备 c4 烯烃
2
安装R软件(R、studio)的安装包下载官网和教程_r安装组件 官网
3
Mac安装jdk17和jdk18_mac安装jdk18
4
LookupError: Resource averaged_perceptron_tagger not found. Please use the NLTK Downloader to obta...
5
大模型量化技术原理-LLM.int8()、GPTQ_gptq量化原理
6
(Ubuntu中调用相机花屏)Astra plus深度相机--rgb彩色图像花屏解决方法之一
7
《精通Python自然语言处理( Deepti Chopra)》读书笔记(第十章):NLP系统评估_len(label1.intersection(label2))) / len(
8
【云计算】云数据中心网络(一):VPC
9
向量数据库和普通关系型数据库的区别,LAXCUS支持哪种数据库?_向量数据库和关系数据库的区别
10
google authenticator python_计算GoogleAuthenticatorCode使用CRT执行python脚本登录堡垒机
当前位置:
article
> 正文
python学习笔记(一)数据处理_aprioir安装
作者:从前慢现在也慢 | 2024-04-01 13:15:30
赞
踩
aprioir安装
一、基础
1.注释:#/''' '''
2.标识符:首字符是字母和下划线
3.数据类型:数、字符串、
列表【list】(元素支持修改)、abc=['my','you']
元祖【tuple】(元素不支持修改)、cde=('my','you')
集合【set】(并交差)、&|!
字典【dictionary】(键:值){key1:value1,key2:value2}
4.
运算符
5.缩进 建议tab
6.补充:calc(windows自带计算器),idle(python自带ide)
7.注意::爬去下我文件路径//(\文件目录)需要与网页路径一致//;http(https可能不行)
8.json:JSON的全称是”JavaScript Object Notation”,意思是JavaScript对象表示法,
它是一种基于文本,独立于语言的轻量级数据交换格式。XML也是一种数据交换格式,因为XML虽然可以作为跨平台的数据交换格式,
但是在JS(JavaScript的简写)中处理XML非常不方便,同时XML标记比数据多,增加了交换产生的流量,而JSON没有附加的任何标记,
在JS中可作为对象处理,所以我们更倾向于选择JSON来交换数据.
二.控制流
1.if
2.while
3.for
4.中断break/continue
三、语法结构
1.作用域:局部/全局 global i(将i声明为全局)
2.函数:def a():
3.模块:import/from... import...
4.文件:fp=open('f1','r')fp.close()
5.异常处理:try:
except Exception as er:
print(er)
四、爬虫基础
1.定义:定向采集和不定向采集。
2.正则表达式/
xpath
表达式:
(1)原子:
1.普通字符 2.非打印字符eg:\n
3.通用字符匹配 \w (匹配任意字母数字下划线)\W(!\w) \s (匹配空白字符)
4.原子表[] 定义一组平等的原子eg:[dsh]或d或s或h,只能是一位
(2)元字符
1. .可以匹配任意字符
2. ^匹配字符串开始的位置 ; $匹配字符串结束的位置
3. *匹配0、1、多次前面的原子; ?匹配0或1 ;+ 匹配1或多次
4. t{n}前面的原子t出现n次; t{n,m}前面的原子t出现n--m次
5. | 或者 ; ()提取
(3)模式修正符
1. I 忽略大小写 ;M多行匹配 ;L
U 据unicode解析字符 ;S 点也能匹配换行符
(4)贪婪模式p.*y和懒惰模式p.*?y
(5)函数
1.re.match()--从头开始,头不匹配则错
2.re.search()--只能出现一个结果
3.re.compile(子串).findall(母串)全局匹配函数--输出多个结果
4.re.sub函数---替换
五、爬虫实战——企查查
注意:爬去下我文件路径//(\文件目录)需要与网页路径一致//;http(https可能不行)
1.urllib库
(1)urllib基础
1.urlretrieve() //将网页直接爬取下来放在本地
urlcleanup() //将1.产生的缓存清理
info() //当前网页环境的一些信息
getcode() //获取当前网页的状态码 200正常,403禁止访问
geturl() //获取当前网页网址
(2)超时设置
timeout=n
(3)自动模拟http请求
1.get 从服务器请求
2.post 请求访问服务器 (抓包技术fiddler)
(4)异常处理
1.状态码 200请求正常 40X请求失败 50X错误服务器
2.URLError(父类):连不上服务器;远程url不存在;本地没有网络;触发子类HTTPError
HTTPError(子类)(有状态码及原因)
(5)浏览器伪装技术
通用代码:
headers=('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:56.0) Gecko/20100101 Firefox/56.0') #User agent
opener=urllib.request.build_opener()#添加对应的报头信息
opener.addheaders=[headers]
urllib.request.install_opener(opener)#设opener为全局
(6)新闻爬虫实战
图片爬虫实战
【重要】(7)代理服务器(防屏蔽)
西刺免费IP代理
六、抓包分析
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/349006?site
推荐阅读
article
python
:
列表
、元组_
列表
内
的
元素
类型
可以是()()()()()()...
Python中
的
列表
什么是
列表
1、
列表
就是用中括号括起来
的
一堆数据,数据之间用逗号隔开2、
python
的
列表
是比较强大
的
...
赞
踩
article
【
c
语言
】求 1000 以内全体
素数
之和(适合
初学者
)_1314 :
素数
求和 【
c
/
c
++/
java
...
【
c
语言
】求 1000 以内全体
素数
之和(适合
初学者
)_1314 :
素数
求和 【
c
/
c
++/
java
/
python
】(基...
赞
踩
article
浙大版
PTA
《
Python
程序设计
》题目集
参考
答案
_
浙江大学
python
程序设计
答案
...
本
答案
配套详解教程专栏,欢迎订阅。_
浙江大学
python
程序设计
答案
浙江大学
python
程序设计
答案
...
赞
踩
article
第4章-2
m>统计
m>
m>素数
m>并求
m>和
m> (20分)【
m>pytho
n
m>】_本题要求
m>统计
m>给定
整数
m
m>和
m>
n
区间
内
m>素数
m>的
个数
并...
本题要求
m>统计
m>给定
整数
M
m>和
m>N
区间
内
m>素数
m>的
个数
并对它们求
m>和
m>。
m>输入
m>格式
:
m>输入
m>在一行中给出两个正
整数
M
m>和
m>N(1≤M≤N≤500)...
赞
踩
article
pytho
<
em>n
<
/em>
<
em>7
<
/em>-
<
e
<
em>m
<
/em>>2
<
/e
<
em>m
<
/em>> 统计
<
e
<
em>m
<
/em>>素数
<
/e
<
em>m
<
/em>>并求
和
(
<
e
<
em>m
<
/em>>2
<
/e
<
em>m
<
/em>>0分)_
<
em>7
<
/em>-
<
e
<
em>m
<
/em>>2
<
/e
<
em>m
<
/em>>
<
e
<
em>m
<
/em>>素数
<
/e
<
em>m
<
/em>>求
和
。 分数
<
e
<
em>m
<
/em>>2
<
/e
<
em>m
<
/em>>0 作者 魏英 单位 ...
本题要求统计给定整数M
和
N区间内
<
e
<
em>m
<
/em>>素数
<
/e
<
em>m
<
/em>>的个数并对它们求
和
。输入格式:输入在一行中给出两个
<
em>正整数
<
/em>M
和
N(1≤M≤N≤500)...
赞
踩
article
Pytho
m>n
m>,求指定区间的
素数
之
和
,
输入
两个
m>正整数
m>
m
和
m>n
m> (
m
<
m>n
m>) ,求
m
m>n
m>
之间
(包括
m
和
m>n
m>)
所有
...
5.求指定区间的
素数
之
和
。
输入
两个
m>正整数
m>
m
和
m>n
m> (
m
<
m>n
m>) ,求
m
m>n
m>
之间
(包括
m
和
m>n
m>)
所有
素数
的
和
,要求定义并调用is_...
赞
踩
article
【Pytho
m>n
m>】
m>显示
m>指定范围的
m>素数
m>并
m>求
m>和
m>
m>_本题要求
m>显示
m>给定整数
m
m>和
m>
m>n
m>区间内
m>素数
m>并对它们
m>求
m>和
m>
m>。pyth...
Pytho
m>n
m>
m>显示
m>指定范围的所有
m>素数
m>并
m>求
m>和
m>
m>_本题要求
m>显示
m>给定整数
m
m>和
m>
m>n
m>区间内
m>素数
m>并对它们
m>求
m>和
m>
m>。
m>pytho
m>n
m>
m>
m>输入
m>格式
:
在...
赞
踩
article
Pytho
n
:用函数求
区间
[m,
n
]内
所有
素数
的
和
。_
pytho
n
中求某个
区间
内
所有
素数
的
个数及求...
题目:使用函数求
素数
和
。PrimeSum(m,
n
),函数PrimeSum返回
区间
[m,
n
]内
所有
素数
的
和
。题目保证用户...
赞
踩
article
统计
素数
并
求
和
(
Pytho
n
)_本题要求显示给定
整数
m
和
n
区间内
素数
并
对
它们
求
和
。
输入
格式: 在一...
本题要求统计给定
整数
M
和
N区间内
素数
的个数
并
对
它们
求
和
。_本题要求显示给定
整数
m
和
n
区间内
素数
并
对
它们
求
和
。
输入
格式:...
赞
踩
article
python
统计
素数
并求和_
python
统计
素数
并求和...
本题要求
统计
给定整数M和N区间内
素数
的个数并对它们求和。输入格式:输入在一行中给出两个正整数M和N(1≤M≤N≤500)...
赞
踩
article
python
--
素数
求和_
python
判断
素数
相加...
输入一个正整数n,统计从[0,n]之间的最大的10个
素数
之和。本题保证测试用例至少有10个满足条件的
素数
。...
赞
踩
article
python
实现
1
~
1
00 所有
质数
求
和
_
python
1
到
1
00的
质数
和
合...
# 用for循环实现
1
~
1
00中的
质数
求
和
sum = 0for x in range(2,
1
0
1
): for i in...
赞
踩
article
Python
:
函数
2
作业_根据编程模板补充代码
,
计算
斐波
那契
数列
的
值
,
具体功能如下
:
...
【问题描述】输入一个正整数n,把数字n分解成不能再分解因子
的
乘法,比如:8=
2
2
2
, 10 =
2
*5,而不是 8 = ...
赞
踩
article
2
1
天好习惯
第一期
-9
p
ython 区间
素数
求和_设计
函数
,
求指定范围内的
素数
之和。
函数
1
:
p
r...
使用
函数
求
素数
和
p
rime
(
p
)
,
其中
函数
p
rime
当
用户
传入
参数
p
为
素数
时返回True,否则返回False. Pri...
赞
踩
article
【
Python
】
使用
函数
求
素数
和_
使用
函数
求
素数
和
python
...
python
使用
函数
求
素数
和_
使用
函数
求
素数
和
python
使用
函数
求
素数
和
python
...
赞
踩
article
【
m>pytho
m>n
m>
m>】第
4
章-
2
统计
m>素数
m>并求
和
(
2
0
分)(简单方法,秒懂!)
_
m>pytho
m>n
m>
m>中求【
m
,
...
本题要求统计给定整数M
和
N区间内
m>素数
m>
的
个数并对它们求
和
。输入格式:输入在一行中给出两个正整数M
和
N(1≤M≤N≤500)...
赞
踩
article
python
:求
100
以内
素数
的
和
_
100
以内
素数
之
和
python
...
求
100
以内
所有
素数
之
和
并输出。...
赞
踩
article
Pytho
n
-
s
d
ut
-使用
函数
求区域内
的
素数
之和_在这里解释
接口
参数
。
例如:其中
n
和
d
都是...
设计
函数
,求指定范围内
的
素数
之和
。
函数
1:prime(p), 用户传入
参数
p,若它为
素数
时返回True,否则返回Fals...
赞
踩
article
Python
super
().__
init
__()测试及理解_"
class
fan:
def
in...
Python
3
super
().__
init
__()含义测试一、我们尝试下面代码,没有
super
(A,
self
).__...
赞
踩
article
python
pye
charts
的基础使用_
from
pye
charts
.
charts
import
...
python
pye
charts
的基础使用,折线图,全国,省地图,柱状图,时间线柱状图_
from
pye
charts
.c...
赞
踩
相关标签
python
列表
元组
c语言
算法
开发语言
数据结构
PTA
蓝桥杯
动态规划
后端