[TOC]
文件处理
流程
- 打开文件
open()
f = open(filename,mode = '') - 操作文件
- 关闭文件
close()
模式:
常用模式
以下这三种模式,和+模式相比,就是+号模式可以读写文件,而这里的模式只能读或者写
r:如果未制定mode,默认为‘r’模式
w:只写,会把原先存在的文件覆盖,如果制定文件不存在,会创建文件
a:追加模式,写数据的时候,会自动添加到(已存)文件的末尾
如果在a模式下,需要在文件中添加一段内容,但是不是在末尾,a模式是否可以用?
字节模式(二进制操作):
rb wb ab
获取字节数据,不需要进行解码,但在写入数据的时候,需要对数据(二进制)进行制定编码
范例代码:
>>> s = 'this is a test'
>>> b = bytes(s,encoding = 'utf-8')
>>>
>>> f = open('test.txt','w')
>>> f.write(s)
14
>>> f = open('test.txt','wb')
>>> f.write(s)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: a bytes-like object is required, not 'str'
>>> f = open('test.txt','wb')
>>> f.write(b)
14
上述代码中,首先输入的内容s为一个str类型,b是一个将s转制成byte类型之后的字节串
第一段代码正常输入字符串s
反馈回来是正常写入文件结果:14(?为什么是14)
第二段代码是输入字符串s
但是文件打开方式为wb(字节串类型写入)
反馈回来报错:需要一个字节串类型对象,而不是str类型
第三段代码是输入字节串b
文件打开方式为wb
正确输入
因此,在使用b模式的时候一定要注意传入的数据类型。非b模式下,以字符为单位进行读写,有b模式下,以字节为单位读写。
可读可写模式:
r+追加写
默认光标在开始位置,写的话一定是追加写
相对来说最好的读写模式,配合seek(),tell()方法可以实现大部分操作w+覆盖写
如果要读取,f.seek()指定光标位置,按照字节走,如果字节读取不全,就会报错
这种模式在读写之前都会清空文件内容,尽量不要使用!a+追加写
读取内容也需要通过seek调整,光标默认在文件最后位置,不论光标位置,总是在最后位置添加
操作文件
文件是可迭代对象,按行进行迭代
f = open(filename,mode = '')
常用文件操作方法
read():读指定个数的字符,f.read(10)。如果打开方式有b,那么以字节为单位进行读取,如果没有b,就以字符为单位进行读取
其中,for line in f:
表示按行读取,这个叫做文件的逐行迭代,文件是一种可以迭代类型write():根据上面的范例可以看出,如果打开方式没有b,则接受普通字符串为参数,如果有b,就需要传入bytes类型的对象
readline():读入一行,b模式下返回bytes类型,非b模式下返回一行字符串,可以指定数量参数
readlines():按行读取数据,并且返回的行被存在列表中,可以指定数量参数
seek():将指针指向制定的下标处,此处要注意使用的模式,在某些模式下,指针指定在哪些位置都只能影响读取的位置,但是写入只能写在固定的位置。比如w+或者是a+模式。以字节为单位进行计数
tell():用于获取当前指针的位置,和seek()一样永远以字节为单位进行计数
flush():将刚写入的内容刷新到本地文件。默认情况下,在文件关闭后,缓存内的数据才会写入本地文件,这样可能会造成数据访问不一致。
seek详解:
seek的三种模式:
- f.seek(p,0)移动到当前文件第p个字节处,绝对位置
- f.seek(p,1)移动到相当于当前位置后的p个字节
- f.seek(p.2)移动到文章尾后的p个字节
with————上下文管理器
with open('test.txt','w')as f:
f.write('str')
在python2.7版本后,with支持同时打开多个文件
with open('log1') as obj1, open('log2') as obj2
with 不但能管理文件,还能管理别的对象