09-python文件I/O-基础

概述

我们用python或其他语言编写的应用程序若想要把数据永久保存下来，必须要保存于硬盘中，这就涉及到应用程序要操作硬件，众所周知，应用程序是无法直接操作硬件的，这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用，其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念，用户或应用程序通过操作文件，可以将自己的数据永久保存下来。

有了文件的概念，我们无需再去考虑操作硬盘的细节，只需要关注操作文件的流程：

#1. 打开文件，得到文件句柄并赋值给一个变量
#2. 通过句柄对文件进行操作
#3. 关闭文件

一、打开和关闭文件

Python 提供了必要的函数和方法进行默认情况下的文件基本操作。你可以用 file 对象做大部分的文件操作。

open 函数

你必须先用Python内置的open()函数打开一个文件，创建一个file对象，相关的方法才可以调用它进行读写。语法：

file object = open(file_name [, access_mode][, buffering])
各个参数的细节如下：

file_name：file_name变量是一个包含了你要访问的文件名称的字符串值。
access_mode：access_mode决定了打开文件的模式：只读，写入，追加等。所有可取值见如下的完全列表。这个参数是非强制的，默认文件访问模式为只读(r)。
buffering:如果buffering的值被设为0，就不会有寄存。如果buffering的值取1，访问文件时会寄存行。如果将buffering的值设为大于1的整数，表明了这就是的寄存区的缓冲大小。如果取负值，寄存区的缓冲大小则为系统默认。

不同模式打开文件的完全列表：

image.png

image.png

File对象的属性

一个文件被打开后，你有一个file对象，你可以得到有关该文件的各种信息。

以下是和file对象相关的所有属性的列表：

image.png

如下实例：

#!/usr/bin/python
# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "w")
print "文件名: ", fo.name
print "是否已关闭 : ", fo.closed
print "访问模式 : ", fo.mode
print "末尾是否强制加空格 : ", fo.softspace

以上实例输出结果：

文件名:  foo.txt
是否已关闭 :  False
访问模式 :  w
末尾是否强制加空格 :  0

close()方法

File 对象的 close（）方法刷新缓冲区里任何还没写入的信息，并关闭该文件，这之后便不能再进行写入。

当一个文件对象的引用被重新指定给另一个文件时，Python 会关闭之前的文件。用 close（）方法关闭文件是一个很好的习惯。

语法：

fileObject.close()
例子：

#!/usr/bin/python
# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "w")
print "文件名: ", fo.name
 
# 关闭打开的文件
fo.close()

以上实例输出结果：

文件名: foo.txt

读写文件：
file对象提供了一系列方法，能让我们的文件访问更轻松。来看看如何使用read()和write()方法来读取和写入文件。

write()方法

write()方法可将任何字符串写入一个打开的文件。需要重点注意的是，Python字符串可以是二进制数据，而不是仅仅是文字。

write()方法不会在字符串的结尾添加换行符('\n')：

语法：

fileObject.write(string)
在这里，被传递的参数是要写入到已打开文件的内容。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "w")
fo.write( "www.runoob.com!\nVery good site!\n")
 
# 关闭打开的文件
fo.close()

上述方法会创建foo.txt文件，并将收到的内容写入该文件，并最终关闭文件。如果你打开这个文件，将看到以下内容:

$ cat foo.txt 
www.runoob.com!
Very good site!

read()方法

ead（）方法从一个打开的文件中读取一个字符串。需要重点注意的是，Python字符串可以是二进制数据，而不是仅仅是文字。

语法：

fileObject.read([count])
在这里，被传递的参数是要从已打开文件中读取的字节计数。该方法从文件的开头开始读入，如果没有传入count，它会尝试尽可能多地读取更多的内容，很可能是直到文件的末尾。
例子：
这里我们用到以上创建的 foo.txt 文件。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "r+")
str = fo.read(10)
print "读取的字符串是 : ", str
# 关闭打开的文件
fo.close()

以上实例输出结果：

读取的字符串是 : www.runoob

文件定位

tell()方法告诉你文件内的当前位置, 换句话说，下一次的读写会发生在文件开头这么多字节之后。

seek（offset [,from]）方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。

如果from被设为0，这意味着将文件的开头作为移动字节的参考位置。如果设为1，则使用当前的位置作为参考位置。如果它被设为2，那么该文件的末尾将作为参考位置。
例子：

就用我们上面创建的文件foo.txt。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
 
# 打开一个文件
fo = open("foo.txt", "r+")
str = fo.read(10)
print "读取的字符串是 : ", str
 
# 查找当前位置
position = fo.tell()
print "当前文件位置 : ", position
 
# 把指针再次重新定位到文件开头
position = fo.seek(0, 0)
str = fo.read(10)
print "重新读取字符串 : ", str
# 关闭打开的文件
fo.close()

以上实例输出结果：

读取的字符串是 :  www.runoob
当前文件位置 :  10
重新读取字符串 :  www.runoob

案例2：seek()方法使用案例

my_open = open(file_name3, 'w+')  
#打开fie_name3路径下的my_test.txt文件,以读写方式  
#若文件不存在,创建，若存在，覆盖  
#实际上我们的确没有这个文件  
print('position_1 : ', my_open.tell())  
#返回当前在文件中的位置  
my_open.write('line_1\n')  
print('position_2 : ', my_open.tell())  
my_open.write('line_2\n')  
print('position_3 : ', my_open.tell())  
  
try:  
    my_open.seek(-len('line_2\n'), 1)  
    '''''seek()可以在文件中移动文件指针指针 
    从whence(0 代表文件开始 1 代表当前位置 2 代表文件末尾)偏移off字节 
    off为正往结束方向移动，为负往开始方向移动 
    这里表示从当前位置往开始方向移动8字节'''  
    print('position_4 : ', my_open.tell())  
    read1 = my_open.readline()  
    #从文件中读取并返回一行  
    print(read1, '\nposition_5 : ', my_open.tell())  
    my_open.seek(off = 0, whence = 0)  
    #回到最开始  
    read2 = my_open.readline()  
    print(read2, '\nposition_6 : ', my_open.tell())  
except IOError as e:  
    print(e,'\n',   
    '意为:对于非二进制的文本文件，不允许使用偏移定位。')  
    print('position_4 : ', my_open.tell())  
  
my_open.close()

输出结果如下：

position_1 :  0

position_2 :  8

position_3 :  16

can't do nonzero cur-relative seeks

 意为:对于非二进制的文本文件，不允许使用偏移定位。

position_4 :  16

---------------为了解决这种情况，我们建立一个二进制文件------------------------

my_open = open(file_name3, 'wb+')  
#读写打开或建立一个二进制文件，允许读和写  
print('position_1 : ', my_open.tell())  
  
try:  
    my_open.write('line_1\n')  
    print('position_2 : ', my_open.tell())  
    my_open.write('line_2\n')  
    print('position_3 : ', my_open.tell())  
    my_open.seek(-len('line_2\n'), 1)  
    print('position_4 : ', my_open.tell())  
    read1 = my_open.readline()  
    print(read1, '\nposition_5 : ', my_open.tell())  
    my_open.seek(off = 0, whence = 0)  
    read2 = my_open.readline()  
    print(read2, '\nposition_6 : ', my_open.tell())  
except TypeError as e:  
    print(e, '\n',  
          '意为:需要的是一个字节的对象，不是“str”')  
my_open.close()

输出结果如下：

D:\python\venv\Scripts\python.exe D:/python/file02-seek方法.py
position_1 :  0
a bytes-like object is required, not 'str' 
 意为：需要的是一个字节的对象，不是str

Process finished with exit code 0

说明：

Python文件使用“wb+”方式打开，写入字符串会报错，因为这种打开方式为：以二进制格式打开一个文件只用于写入。
如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。所以写入的字符类型需为二进制格式，如：
f.write("hello".encode('ascii'))
写入的编码范围不为128以内，就不能使用ascii了
如：
fh.write("汉字".encode('UTF-8'))

my_open = open(file_name3, 'wb+')  
print('position_1 : ', my_open.tell())  
my_open.write('line_1\n'.encode('ascii'))  
print('position_2 : ', my_open.tell())  
my_open.write('line_2\n'.encode('ascii'))  
print('position_3 : ', my_open.tell())  
my_open.seek(-len('line_2\n'), 1)  
print('position_4 : ', my_open.tell())  
read1 = my_open.readline()  
print(read1, '\nposition_5 : ', my_open.tell())  
my_open.seek(0, 0)  
read2 = my_open.readline()  
print(read2, '\nposition_6 : ', my_open.tell())  
my_open.close()  
##检查是否正确写入  
my_open = open(file_name3, 'r')  
#读取file_name3路径下的my_test.txt文件  
my_infor = my_open.readlines()  
my_open.close()  
print(my_infor)

输出结果如下：

D:\python\venv\Scripts\python.exe D:/python/file02-seek方法.py
position_1 :  0
position_2 :  7
position_3 :  14
position_4 :  7
b'line_2\n' 
position_5 :  14
b'line_1\n' 
position_6 :  7
['line_1\n', 'line_2\n']

Process finished with exit code 0

Python File(文件) 方法

file 对象使用 open 函数来创建，下表列出了 file 对象常用的函数：

image.png

补充内容

在 write 内容后，直接 read 文件输出会为空，是因为指针已经在内容末尾。
两种解决方式: 其一，先 close 文件，open 后再读取，其二，可以设置指针回到文件最初后再 read

# -*- coding: UTF-8 -*-

import os;

document = open("testfile.txt", "w+");
print "文件名: ", document.name;
document.write("这是我创建的第一个测试文件！\nwelcome!");
print document.tell();
#输出当前指针位置
document.seek(os.SEEK_SET);
#设置指针回到文件最初
context = document.read();
print context;
document.close();

为了保证无论是否出错都能正确地关闭文件，我们可以使用 try ... finally 来实现：

try:
    f = open('/path/to/file', 'r')
    print f.read()
finally:
    if f:
        f.close()

但是每次都这么写实在太繁琐，所以，Python 引入了 with 语句来自动帮我们调用 close() 方法：

with open('/path/to/file', 'r') as f:
    print f.read()

强调

#强调第一点：
打开一个文件包含两部分资源：操作系统级打开的文件+应用程序的变量。在操作完毕一个文件时，必须把与该文件
的这两部分资源一个不落地回收，回收方法为：
1、f.close() #回收操作系统级打开的文件
2、del f #回收应用程序级的变量

其中del f一定要发生在f.close()之后，否则就会导致操作系统打开的文件还没有关闭，白白占用资源，
而python自动的垃圾回收机制决定了我们无需考虑del f，这就要求我们，在操作完毕文件后，
一定要记住f.close()

刚开始的时候很容易忘记f.close()方法去关闭，推荐傻瓜式操作方式：使用with关键字来帮我们管理上下文
with open('a.txt','w') as f:
    pass
 
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)

#强调第二点：
f=open(...)是由操作系统打开文件，那么如果我们没有为open指定编码，那么打开文件的默认编码很明显是操作
系统说了算了，操作系统会用自己的默认编码去打开文件，在windows下是gbk，在linux下是utf-8。
若要保证不乱码，文件以什么方式存的，就要以什么方式打开。

f=open('a.txt','r',encoding='utf-8')

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,602评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,442评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,878评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,306评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,330评论 5赞 373
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,071评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,382评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,006评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,512评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,965评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,094评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,732评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,283评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,286评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,512评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,536评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,828评论 2赞 345

09-python文件I/O-基础

概述

一、打开和关闭文件

open 函数

File对象的属性

close()方法

write()方法

read()方法

文件定位

案例2：seek()方法使用案例

Python File(文件) 方法

补充内容

强调

推荐阅读更多精彩内容