赞
踩
目录
3. readlines() -用于一次性逐行读取特定的文件
3.1 readlines() -读取整个文件所有行,保存在一个列表中
Python读取文件一般是利用open()函数以及read()函数来完成,但该方式仅适合读取小文件。因为调用read()会一次性读取文件的全部内容,调用readlines()一次读取所有内容并按行返回list。如果文件过大,如10G,会造成MemoryError 内存溢出,正确的做法:可以反复调用read(size)法,每次指定读取size个字节的内容。
处理大文件核心思路:通过参数指定每次读取的大小长度,这样就避免了因为文件太大读取出问题。
用于打开一个文件,并返回文件对象。如果文件无法打开,会抛出OSError。
注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法
open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。
open(file, mode='r')
完整的语法格式为:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数说明:
mode 参数有:
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
+ | 打开一个文件进行更新(可读可写)。 |
U | 通用换行模式(不推荐)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
with open('pi_digits.txt') as file_object:
contents = file_object.read()
print(contents)
在这个程序中,第1行代码做了大量的工作。我们先来看看函数open()。要以任何方式使用
文件——哪怕仅仅是打印其内容,都得先打开文件,这样才能访问它。函数open()接受一个参数:
要打开的文件的名称。 Python在当前执行的文件所在的目录中查找指定的文件。在这个示例中,
当前运行的是file_reader.py,因此Python在file_reader.py所在的目录中查找pi_digits.txt。函数open()
返回一个表示文件的对象。在这里, open('pi_digits.txt')返回一个表示文件pi_digits.txt的对
象; Python将这个对象存储在我们将在后面使用的变量中。
关键字with在不再需要访问文件后将其关闭。在这个程序中,注意到我们调用了open(),但
没有调用close();你也可以调用open()和close()来打开和关闭文件,但这样做时,如果程序存
在bug,导致close()语句未执行,文件将不会关闭。这看似微不足道,但未妥善地关闭文件可能
会导致数据丢失或受损。如果在程序中过早地调用close(),你会发现需要使用文件时它已关闭
(无法访问),这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机,但通
过使用前面所示的结构,可让Python去确定:你只管打开文件,并在需要时使用它, Python自会
在合适的时候自动将其关闭。
有了表示pi_digits.txt的文件对象后,我们使用方法read()(前述程序的第2行)读取这个文
件的全部内容,并将其作为一个长长的字符串存储在变量contents中。这样,通过打印contents
的值,就可将这个文本文件的全部内容显示出来:
read()-读取文件
用于从文件读取指定的字节数,如果未给定或为负则读取所有。
file.read([size])
size 作为一个可选参数,用于指定一次最多可读取的字符(字节)个数,如果省略,则默认一次性读取所有内容。
test.txt文件中内容:
2.1 read(size)
通过使用 size 参数,指定 read() 每次可读取的最大字符(或者字节)数
read([size])
方法从文件当前位置起读取size个字节
注意:size ,包括换行符
代码:
- A=open('test.txt')
- print 'Aname:'+A.name
- size=A.read(8)
- print 'size:'+size
- print (type(size))
- A.close()
输出结果:
- Aname:test.txt
- size:a1
- bb2
- c
- <type 'str'>
从文件当前位置起读取
第一次read(8)读取到c字母,再接着读,就输出c2
代码:
- A=open('test.txt')
- print 'Aname:'+A.name
- size=A.read(8)
- print 'size:'+size
- print (type(size))
- # A.close()
-
- read =A.read()
- print 'read():' +read
- print (type(read))
输出:
- Aname:test.txt
- size:a1
- bb2
- c
- <type 'str'>
- read():c3
-
- <type 'str'>
则表示读取至文件结束为止,它返回为字符串对象。
代码:
- A = open('test.txt')
- read =A.read()
- print 'read():' +read
- print (type(read))
输出:
- read():a1
- bb2
- cc3
-
- <type 'str'>
readline([size]) 用于一次性逐行读取特定的文件
读取所有行并返回列表,若给定sizeint>0,则是设置一次读多少字节,这是为了减轻读取压力。
readlines()
函数只从给定文件中读取一个完整的行;读取后,它以列表的形式返回包含所有元素的整行。readlines()
函数最适合小文件,包含的数据较少,可以在更短的时间内轻松读取整个文件。strip()
函数,我们可以遍历由 readline()函数生成的整个列表,通过使用 strip()
函数,我们可以剥离换行符' \n '字符。readlines() 方法用于读取所有行(直到结束符 EOF)并返回列表,该列表可以由 Python 的 for... in ... 结构进行处理。
如果碰到结束符 EOF 则返回空字符串。
读取整个文件所有行,保存在一个列表(list)变量中,每行作为一个元素,但读取大文件会比较占内存
- #readlines() ,逐行读取,每一行作为1个元素,返回一个列表
- """
- 15:28 c4a1连接ap1 密码输入错误
- 15:33 me 0226正常下线
- """
- file = "..\data\pi_digits.txt"
- files = open(file, mode="r", encoding="UTF-8")
- file1=files.readlines()
- print("file1:", file1)
size:指读取多少字节的内容
如果size不够一行,也要输出一行的全部内容
例如 文件中第一行字节数是24,但是 size 是1 ,意思是读取1字节的内容,但因为是按行读取,所以第一行的数据全部读取
若size=25,则读取前两行内容
- #readlines(size) ,逐行读取,每一行作为1个元素,返回一个列表
- """
- 15:28 c4a1连接ap1 密码输入错误
- 15:33 me 0226正常下线
- """
- file = "..\data\pi_digits.txt"
- files = open(file, mode="r", encoding="UTF-8")
- count=len(files.readline())
- print("count:",count)
- file1=files.readlines(1)
- print("file1:", file1)
readline() 函数用于读取文件中的一行,包含最后的换行符“\n”
由于 readline() 函数在读取文件中一行的内容时,会读取最后的换行符“\n”,再加上 print() 函数输出内容时默认会换行,所以输出结果中会看到多出了一个空行。
- #readline()
- """
- 123456789
- 123
- 456
- """
- file = "..\data\pi_digits.txt"
- files = open(file, mode="r", encoding="UTF-8")
- # count=len(files.readline())
- # print("count:",count)
- file1=files.readline()
- print("file1:", file1)
指读取的行数中 size字符的内容,当size大于读取行内容字符时,也只是输出该行全部内容
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。