1.切片(Slice)#
python提供了切片(Slice)操作符,能大大简化取数据操作
L = ['aa','bb','cc','dd','ee']
L[0:3]#取下标[0--3)的元素.如果第一个索引为0,可以省略. 写成 L[:3]
L[-1] 取倒数第一个元素.同样支持倒数切片.
语法:[开始:结束:迭代步骤]
比如:[0:10:2],从索引0开始,取到索引9,每个两个取一个.
[:] 什么都不写,就可以复制一个list
2.迭代(Iteration)#
可以迭代的对象list,tuple,dict,str
对于dict对象如果要迭代key,则是默认 dict, 如果要得到value,则是 dict.values(),如果是key-value 同时 则是,dict.items()
d={"a":1,"b":2}
for k in d:
print(d)
for v in d.values():
print(v)
for k,v in d.items():
print(k,v)
如果要判断一个对象是否是可迭代对象呢?方法是通过collections模块的Iterable类型判断:
> from collections import Iterable
>isinstance('abc', Iterable) # str是否可迭代
>True
> isinstance([1,2,3], Iterable) # list是否可迭代
>True
> isinstance(123, Iterable) # 整数是否可迭代
>False
如果要对list实现类似Java那样的下标循环怎么办?Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身
> for i, value in enumerate(['A', 'B', 'C']):
... print(i, value)
...
0 A
1 B
2 C
3.列表生成式#
list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]可以用list(range(1, 11))
list[aa,bb...]可以用[x * x for x in range(1, 11)]
如果要加条件则可以用
[x * x for x in range(1, 11) if x % 2 == 0]就可以筛选出仅偶数的平方
[m + n for m in 'ABC' for n in 'XYZ']可以使用两层循环,可以生成全排列
4.生成器#
如果直接生成100W个数据,同时又只要访问前面几个元素,那么不用的元素也将占用内存,会很浪费. 那么生成器就是推算出后面的元素,而不是生成完整的list,从而节省大量的空间.
使用方法,1.把生成list 的[] 改为()
>g = (x * x for x in range(10))
注意:如果要访问,不能直接打印,而需要调用next(g) 方法. generator保存的是算法,每次调用next(g),就计算出g的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误
正确的方法是使用for循环,因为generator也是可迭代对象
果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator
比如:著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到
def fib(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a + b
n = n + 1
return 'done'
最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行