一、导入csv文件
pd.read_csv(open('E:/2020年/06学习/python学习/guomai账号创建的网站.csv'))
细节:横杠打反,代码里的横杠和文件路径显示横杠是相反的
####更改索引:
pd=pd.read_csv(open('E:/2020年/06学习/python学习/guomai账号创建的网站.csv'),names=list('abcde'))
二、注意查询的注意点(斜体字部分)
query查询:
df.query("网站情况 =='未嵌码'&编号>700") 字段名
结果是一个数据框,还可以对这个数据库进行数据查询:
df.query("网站情况 =='未嵌码'&编号>700")[["主域名","名称"]]
直接查询:
df[(df.网站情况 =='未嵌码')&(df.编号>700)]
也可以对这个数据框进行相应的查询:
df[(df.网站情况 =='未嵌码')&(df.编号>700)][["主域名","名称"]]
某个字段满足条件,得出来的是布尔类型
(df.网站情况 =='未嵌码')&(df.编号>700)
####数据库再查找某一列等价形式
df[(df.网站情况 =='未嵌码')&(df.编号>700)] ["主域名"]
等价于
df.query("网站情况 =='未嵌码'&编号>700").主域名
####还可以继续作过滤
df.query("网站情况 =='未嵌码'&编号>700").主域名=='www.cpad.gov.cn'
其中 df[df.query("网站情况 =='未嵌码'&编号>700").主域名=='www.cpad.gov.cn']外面加一个切片报错,因为里面的数据库的条数少,df数据库条数多,所以必须内部的切片与外部的数据框两者要对应上
三、iloc、loc、ix的练习
ix
df.ix[0:2]
iloc
df.iloc[0:2,1:3]
loc可用于标签
df.loc[0:1,['编号','名称']]