1.文件的使用:文件打开、关闭和读写
1.文件
文件是存储在辅助存储器上的一组数据序列,可以包含任何数据内容。概念上,文件是数据的集合和抽象。文件包括两种类型:文本文件和二进制文件。
2.文件的类型
1)、文本文件一般由单一特定编码的字符组成,如UTF-8编码,内容容易统一展示和阅读。
2)、二进制文件直接由比特0和比特1组成,文件内部数据的组织格式与文件用途有关。二进制是信息 按照非字符但特定格式形成的文件,例如,png格式的图片文件、avi格式的视频文件。
3)、二进制文件和文本文件最主要的区别在于是否有统一的字符编码。
4)、无论文件创建为文本文件或者二进制文件,都可以用“文本文件方式”和“二进制文件方式”打开,但打开后的操作不同。
采用文本方式读入文件,文件经过编码形成字符串,打印出有含义的字符;采用二进制方式打开文件,文件被解析为字节流。
3.文件的打开和关闭
1、Python对文本文件和二进制文件采用统一的操作步骤,即“打开-操作-关闭”
2、Python通过open()函数打开一个文件,并返回一个操作这个文
件的变量,语法形式如下:
<变量名>=open(<文件路径及文件名>,<打开模式>)
4.文件的读取
1、通过以下几种方式可以读取文件指定的内容。
f.seek(offset,whence)方法能够移动读取指针的位置。
offset:开始的偏移量,也就是代表需要移动偏移的字节数,如果是负数表示从倒数第几位开始。
whence:可选,默认值为0。给offset定义一个参数,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件未尾算起。
5.文件的写入
通过以下方法可以将数据写入指定的文件
2.数据组织的维度:一维数据和二维数据
数据的组织维度
一组数据在被计算机处理前需要进行一定的组织,表明数据之间的基本关系和逻辑,进而形成“数据的维度”。根据数据的关系不同,数据组织可以分为:一维数据、二维数据和高维数据。
一维数据的存储
一维数据是最简单的数据组织类型,由于是线性结构,在Python语言中主要采用列表形式表示。
3.一维数据的处理:表示、存储和处理
一维数据的文件存储有多种方式,总体思路是采用特殊字符分隔各数据。常用存储方法包括4种。
(1)采用空格分隔元素,例如:北京 上海 天津 重庆
(2)采用逗号分隔元素,例如:北京,上海,天津,重庆
(3)采用换行分隔包括,例如:
北京
上海
天津
重庆
(4)其他特殊符号分隔,以分号分隔为例,例如:北京;上海;天津;重庆
1、逗号分割的存储格式叫做CSV格式(Comma-Separated Values,即逗号分隔值),它是一种通用的、相对简单的文件格式,在商业和科学上广泛应用,大部分编辑器都支持直接读入或保存文件为CSV格式
2、列表对象输出为CSV格式文方法如下,采用字符串的join()方法最为方便。
s=['北京’,’上海’,’天津’,’重庆’]
f = open('city. csv', 'w' )
f.write(','.join(1s)+'\n')
f. close ()
3、对一维数据进行处理首先需要从CSV格式文件读入一维数据,并将其表示为列表对象。
f = open('city.csv','r')
ls = f. read (). strip('\n'). split (',')
print (1s)
f. close ()
4.二维数据的处理:表示、存储和处理
2.二维数据的存储
二维数据
s = [
[’学校’,’报考人数’,’往年录取人数’,’理科人数’],
['xx中学’,’100',’60',’60'],
['xx实验中学’,’150',’30',’80'],
['xx高级中学’,’200',’140',’160']
]
1、二维数据由一维数据组成,用CSV格式文件存储。CSV文件的每一行是一维数据,整个CSV文件是一个二维数据。
2、二维列表对象输出为CSV格式文件方法如下,采用遍历循环和字符串的
join()方法相结合。
1s = [
['学校’,’报考人数’,’往年录取人数’,’理科人数’],
['xx实验中学’,’100',’60',’60'],
['xx中学’,’150',’30',’80'],
['xx高级中学’,’200',’140',’160']
]
f=open('school.csv','w')
for row in 1s:
f.write(','.join(row)+'\n')
f. close ()
二维数据处理等同于二维列表的操作,与一维列表不同,二维列表一般需要借助循环遍历实现对每个数据的处理,基本代码格式如下:
for row in Is:
for item in row:
<对第row行第item列元素进行处理>