Python科学计算神器之numpy-1

这个系列主要集中在python做科学计算的Numpy、Scipy等库，当然原汁原味的知识才是最好的，请查看https://docs.scipy.org/
Numpy系列包含ndarray、ufunc、矩阵运算和文件存取

Numpy主要包含两种数据结构：Array和Matrix，以及对应的的Ufunc函数

1. 安装numpy

#终端命令 或用canda，以包含numpy、scipy等
sudo pip install numpy

2. 导入numpy

import numpy as np

3. 创建对象

Numpy最主要的对象是均匀的多维数组，我们可以通过给array函数传递Python的序列对象创建数组，如果传递的是多层嵌套的序列，将创建多维数组。Numpy的array类叫做ndarray，也就是通常说的array，numpy.array与python的array.array是不同的，它仅提供一维数组和少量函数。

3.1 ndarray最常用的属性

ndarray.ndim
--array的维数，及数组维数，python中被称为秩rank
ndarray.shape
--array的每个维度的长度，及各个维度数组的长度，是一个tuple，eg:(4, 5),tuple的长度即为rank
ndarray.size
--array的元素个数
ndarray.dtype
--array元素的类型，常见的numpy.int64, numpy.int32, numpy.int16, numpy.float64, Numpy默认数据类型为numpy.int64(不同版本会有区别)
ndarray.itemsize
--array元素的字节长，例如，float64为8字节（=64/8），complex32为4字节 (=32/8). 它等同于ndarray.dtype.itemsize.
ndarray.data
--缓存中存有的实际array元素，一般不用这个属性对array进行索引取值

# 采用python list, numpy默认dtype为int64，默认的dtype不显示
>>>a = np.array([[1, 2, 3], [4, 5, 6]])  
>>>a
array([[1, 2, 3],
        [4, 5, 6]])

# 下面返回一个tuple
>>>a.ndim, a.shape, a.size, a.dtype, a.itemsize
(2, (2, 3), 6, dtype('int64'), 8)

 >>>a.data
<read-write buffer for 0x7f79d8655c60, size 48, offset 0 at 0x7f79d8647e30>

# 利用reshape函数可以修改array尺寸产生新array，总elements不变
>>>a.reshape(3,2)
array([[1, 2],
        [3, 4],
        [5, 6]])

3.2 创建array对象—根据python序列对象和数据类型创建

# 一种参考3.1的例子，第二种是python对象： list + float
>>>b = np.array([[1, 2, 3], [4, 5, 6.0]])  
>>>b
array([[ 1.,  2.,  3.],
        [ 4.,  5.,  6.]])

# python tuple + float
>>>np.array((1, 2, 3.1))   
array([ 1. ,  2. ,  3.1])

# python 混合对象 list+tuple
>>>np.array(([1, 2, 3], (4, 5, 6)))  
array([[1, 2, 3],
        [4, 5, 6]])

# 创建2维array对象，Minimum dimensions 2，等同 np.array([[1, 2, 3]])
>>>np.array([1, 2, 3], ndmin=2)   
array([[1, 2, 3]])

# 复数类型
>>>np.array([1, 2, 3], dtype=complex)
array([ 1.+0.j,  2.+0.j,  3.+0.j])

# 自定义数据类型 字节顺序：>为big-edian <为little-endian， i4:int32,及4个字节
>>>x = np.array([(1, 2), (3, 4), (5, 6)],dtype=[('a','<i4'),('b','<i8')])
>>>x['a']
array([1, 3, 5], dtype=int32)

# Numpy默认类型为int64
>>>x['b']
array([2, 4, 6])

>>>x['b'].dtype
dtype('int64')

3.3 创建matrix对象 / matrix转为array对象

# 同样可以用 python对象来创建
>>>np.mat([(1,2),(3,4)])
matrix([[1, 2],
        [3, 4]])

# ！可以用数值字符串创建matrix， 并将其转为array对象
>>>np.array(np.mat('1 2; 3 4'))
array([[1, 2],
        [3, 4]])

# 用数值字符串创建array,整体仍为字符类型的一个元素
>>>np.array(('1 2;3 4', 'a'))
array(['1 2;3 4', 'a'], dtype='|S7')

# 仍为matrix对象
>>>np.array(np.mat('1 2; 3 4'), subok=True)
matrix([[1, 2],
        [3, 4]])

3.4 利用函数创建array对象

Numpy专门提供了很多函数来创建数组，常用的有arange、linspace、logspace、zeros、ones、empty等函数通过数值创建数组(类同matlab)，以及frombuffer, fromstring, fromfile等函数可以从字节序列创建数组，还可以通过fromfunction来通过函数创建数组.

3.4.1 通过arange、linspace、logspace等函数创建数组

arange与linspace最主要的区别是，arange第三个参数为step，linspace/logspace第三个参数为元素个数

arange函数类似于python的range函数，通过指定开始值、终值和步长来创建一维数组，注意数组不包括终值:

>>>np.arange(0, 1, 0.1)
array([ 0. ,  0.1,  0.2,  0.3,  0.4,  0.5,  0.6,  0.7,  0.8,  0.9])

linspace函数通过指定开始值、终值和元素个数来创建一维数组，可以通过endpoint关键字指定是否包括终值，缺省设置是包括终值:

# linspace在生成数组需计算好数组的size，生成类似range步长的数组通常size比range()的大1,
# 或者将终值设为range()终值-step. 最后一个等同于 np.arange(0, 1, 0.1)
>>>np.linspace(0, 1, 10), np.linspace(0, 1, 11), np.linspace(0, 0.9, 10)
(array([ 0.        ,  0.11111111,  0.22222222,  0.33333333,  0.44444444,
        0.55555556,  0.66666667,  0.77777778,  0.88888889,  1.        ]),
array([ 0. ,  0.1,  0.2,  0.3,  0.4,  0.5,  0.6,  0.7,  0.8,  0.9,  1. ]),
array([ 0. ,  0.1,  0.2,  0.3,  0.4,  0.5,  0.6,  0.7,  0.8,  0.9]))

logspace函数和linspace类似，不过它创建等比数列，下面的例子产生1(10^0)到100(102)、有20个元素的等比数列:

>>>np.logspace(0, 2, 20)
array([   1.        ,    1.27427499,    1.62377674,    2.06913808,
       2.6366509 ,    3.35981829,    4.2813324 ,    5.45559478,
       6.95192796,    8.8586679 ,   11.28837892,   14.38449888,
       18.32980711,   23.35721469,   29.76351442,   37.92690191,
       48.32930239,   61.58482111,   78.47599704,  100.        ])

# 可以指定dtype
>>>np.zeros( (3,4) )
array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

>>>np.ones( (2,3,4), dtype=np.int16 )
array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],
    
        [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int16)

>>>np.empty( (2,3) ) 
array([[  6.92492661e-310,   6.92492661e-310,   9.01700787e+223],
        [  3.42702482e-062,   1.12958007e+277,   7.28193369e+223]])

3.4.2 通过frombuffer, fromstring, fromfile等函数从字节序列创建array，以fromstring为例

# Python的字符串实际上是字节序列，每个字符占一个字节，
# 因此如果从字符串s创建一个8bit的整数数组的话，所得到的数组正好就是字符串中每个字符的ASCII编码
s = 'abcdefgh'
>>>>np.fromstring(s, dtype=np.int8),  np.fromstring(s, dtype=np.int64), 
np.fromstring(s, dtype=np.float64)
(array([ 97,  98,  99, 100, 101, 102, 103, 104], dtype=int8),
 array([7523094288207667809]),
 array([  8.54088322e+194]))

3.4.3 通过fromfunction创建array

# 创建 9×9 乘法表， 是不是很类似与 装饰器？
>>>def multi_2(i, j):
        return (i+1) * (j+1)
>>>c = np.fromfunction(multi_2, (9,9))
>>>c
array([[  1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.],
        [  2.,   4.,   6.,   8.,  10.,  12.,  14.,  16.,  18.],
        [  3.,   6.,   9.,  12.,  15.,  18.,  21.,  24.,  27.],
        [  4.,   8.,  12.,  16.,  20.,  24.,  28.,  32.,  36.],
        [  5.,  10.,  15.,  20.,  25.,  30.,  35.,  40.,  45.],
        [  6.,  12.,  18.,  24.,  30.,  36.,  42.,  48.,  54.],
        [  7.,  14.,  21.,  28.,  35.,  42.,  49.,  56.,  63.],
        [  8.,  16.,  24.,  32.,  40.,  48.,  56.,  64.,  72.],
        [  9.,  18.,  27.,  36.,  45.,  54.,  63.,  72.,  81.]])

Numpy弥补了Python自身的array的大量不足，为Python提供了数值计算的基础库，衍生出了大量做大数据分析的库，这奠定了Python做大数据分析的地位，也是在机器学习、深度学习逐渐进入应用领域中最常用的语言，赶快搂起袖子加油干！

Enjoy it～

Python科学计算神器之Numpy-2

最后编辑于：2017.12.09 01:35:36

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,884评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,347评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,435评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,509评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,611评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,837评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,987评论 3赞 408
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,730评论 0赞 267
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,194评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,525评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,664评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,334评论 4赞 330
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,944评论 3赞 313
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,764评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,997评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,389评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,554评论 2赞 349