python数据分析之文件读取

1 txt文件读取

    一:读取全部内容

        #打开文件

        txt_filename = "./files/python_.txt"

        file_obj = open(txt_filename, 'r',encoding='utf-8')

        #读取整个文件内容

        all_content = file_obj.read()

        # 逐行读取

        line1 = file_obj.readline()

        #如果想要读取下一行,则继续 readline

        line2 = file_obj.readline()

        #读取全部内容,返回列表

        lines = file_obj.readlines()

        for i,line in enumerate(lines):

                print('第{}行:{}'.formart(i,line))

        #读取完后要关闭文件

        file_obj.close()

        #写操作

        file_obj.write("《Python 数据分析》")

        #写入字符串列表

        lines = ['这是第%i 行\n' %n for n in range(100)]

        file_obj.writelines(lines)

        #换行  \n

        file_obj.write("《Python 数据分析》" + "\n")

        file_obj.close()


2  csv文件读取

        #csv操作使用pandas,打开文件,读取前5条数据

        import pandas as pd

        file_name = './files/test.csv'

        #这里编码格式选择csv文件的编码格式,如果不知道的话,把csv文件使用Notepad++打开,然后选择编码——转为UTF-8 无BOM编码格式

        df = pd.read_csv(filename,encoding='utf-8')

        #head()默认显示前5条数据;pandas读取csv文件的数据,可以认为是一个二维数组

        print(df.head())

        #显示全部数据

        print(df)

        #读取某一列数据

        country_se = df[u'国家']

        #读取多列数据

        dataset_path = './starcraft.csv'

         df_data = pd.read_csv(dataset_path, usecols=['LeagueIndex', 'Age', 'HoursPerWeek',

                                            'TotalHours', 'APM'])

        #写CSV

        df.to_csv(file_name,index=None,encoding='utf-8')

3  JSON操作

        #打开文件,读取json(load)        

        import json

        filename = './files/global_temperature.json' 

        with open(filename,'r') as f_obj:

                json_data = json.load(f_obj)

        #获取json中所有的key

        print(json_data.keys())

        #key对应的值

         print(json_data['data'])

         print(json_data['data'].keys())

         print(json_data['data'].values())

        #使用列表推导式 转换key的值

        str_lst = json_data['data'].keys()

        lst = [int(str)  for  str  in  str_lst ]

        #写JSON数据

        book_dict = [{'书名':'无声告白', '作者':'伍绮诗'}, {'书名':'我不是潘金莲', '作者':'刘震云'}, {'书名':'沉默的大多数 (王小波集)', '作者':'王小波'}]

        with open(filename, 'w', encoding='utf-8') as f_obj:

                f_obj.write(json.dumps(book_dict, ensure_ascii=False))

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,820评论 0 10
  • Python 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对...
    顺毛阅读 4,238评论 4 16
  • 八月的最后一周,草原上的风已经开始变得萧瑟了,许是昨天下了雨的缘故吧,今天傍晚的风特别的冷,可想着今晚的聚会,我不...
    王爷万安阅读 334评论 2 8
  • MENU Git 快速使用 之 配置并获取SSH公钥Git 快速使用 之 Git 分支 branchGit 快速使...
    mm_cuckoo阅读 345评论 0 3
  • 从内容上讲,觉得有几点挺难理解的。 一是电影中阿道想把尾巴送人然后逃走,出现这种情况后,很难理解后来他会为了尾巴而...
    花渐醒阅读 734评论 0 1