numpy

核心数据结构 ndarray 多维数组,
TIM截图20200406171028.png

注意 n维的顺序

  1. ndarray的属性

  • ndarray.ndim
    数组的轴(维度)的个数。维度的数量被称为rank。
  • ndarray.shape
    数组的形状。返回一个元组表示各个维度中数组的大小。
  • ndarray.size
    数组中元素的总数。等于shape各个元素的乘积。
  • ndarray.dtype
    一个描述数组中元素类型的对象。
  • ndarray.itemsize
    数组中每个元素的字节大小。
  • ndarray.real
    数组的实部
  • ndarray.imag
    数组的虚部
  1. ndarray的创建方式

  • data = [[1,2,3], [4,5,6]]
    arr1 = np.array(data)

  • arr2 = np.asarray(arr1) #不占用内存

  • arr3 = np.zeros([3, 4])

  • arr4 = np.zeros_like(data)

  • arr5 = np.ones([2, 3])

  • arr6 = np.ones_like(data)

  • arr7 = np.empty([2, 2])

  • arr8 = np.empty_like(data)

  • arr9 = np.full([2,3], fill_value=3)

  • arr10 = np.full_like(data, 8)

  • arr11 = np.identity(5) # \ 对角线

  • arr12 = np.eye(5,6) #\ 对角线

  • arr13 = np.random.randn(2, 3) # 正态分布随机 期望值为0,标准差为1
    np.random.normal(mu, sigma, 10) # 期望mu,标准差sigma自定义,生成10个数
    np.random.binomial(n,p,k) # 一组做n次,成功概率p , 看k次的结果,生成k个数,每个数是n里面几次成功
    np.random.beta(a,b,n) #a次成功,b次失败,生产n个数
    np.random.randint(2,10,size= (3,4)) # 随机整数
    np.random.uniform(1,100,20) #随机float数,20是生产的个数
    np.random.rand()
    np.random.random(size = (2,2)) #好像和上个类似
    np.random.choice(a,3,replace =False) a为1维数组,也可以为整数,等同于 np.arange(5)
    np.random.seed() #使随即数据可预测,对于同一个seed,生成的随机数相同
    np.random.shuffle(a) @给a随机打乱

  • arr14 = np.arange(start=0, stop=10, step=2) # [0,10)的数,步长为2

  • arr15 = np.linspace(0, 10,6) # array([ 0., 2., 4., 6., 8., 10.]) [0,10]分6份

  • np.fromfunction() 通过对每个坐标执行函数来构造数组
    np.fromfunction(lambda i,j:i+j,(2, 3))
    array([[0., 1., 2.],
    [1., 2., 3.]])

  • np.fromfile(file, dtype=float, count=-1, sep='') #从文件读取生成 array

  1. ndarray 数据类型

  • a.astype(np.int32) #转换a的数据类型
  • 自定义数据类型
    my_dtype = np.dtype([('name', 'S10'), ('age', int), ('city', 'S10')]) # 按关键字排序my_dtype
    temp_arr = [('zhangsan', 20, 'BJ'), ('lisi', 22, 'CD'), ('wangwu', 21, 'SH')]
    my_arr = np.array(temp_arr, dtype=my_dtype)
  1. 数组运算

arr= np.array([[1,2,3], [4,5,6]])

  • arr * 2 简单数字运算, 针对array内部每个元素
  • arr + arr / arr * arr / arr - arr / arr / arr +-*/运算
  • arr2 = arr + 1
  • arr2 > arr 两array比较 ,结果是bool
    array([[ True, True, True],
    [ True, True, True]])
  • arr1 = np.array([1, 2, 3]) 广播运算
    arr2 = np.array([1, 2, 3, 4])
    arr1 + arr2 会报错, operands could not be broadcast together with shapes (3,) (4,)
  1. array 拷贝

  • 完全不拷贝
    a = np.arange(12)
    b = a 实际 b 就是 a
  • 浅拷贝
    a = np.arange(12)
    c = a.view() 修改c纬度不影响a , 修改数据会影响
  • 完全拷贝
    切片 或者 a.copy()
  1. 切片和索引

  • 切片
    切片的基本语法 ndarray[i : j : k],其中i为起始下标,j为结束下标(不包括j),k为步长(默认为1)
    arr = np.arange(10) #1维
    arr[9:4:-2] #array([9, 7, 5])
    ndarr = np.arange(16).reshape((4, 4)) #2维 ,中间用逗号隔开
    ndarr[:2, :2]#array([[0, 1],
    [4, 5]])

  • 索引
    arr = np.arange(10)
    ndarr = np.arange(16).reshape((4, 4))
    ndarr[:3, [0,1]] #
    结果: 类似切片
    array([[0, 1],
    [4, 5],
    [8, 9]])

  • 布尔索引
    cities = np.array(['bj', 'cd', 'sh', 'gz', 'cd'])
    data = np.arange(20).reshape(5, 4)
    data[cities == 'cd', :1]
    结果:array([[ 4],
    [16]])

  • 花式索引 —— 指的是利用整数数组进行索引 array[[n],[m]]
    arr3 = np.arange(36).reshape(6,6)
    arr3[1,1] 取一个元素
    arr3[[1, 2, 3], [1, 2, 3]] 取出下标为(1, 1), (2, 2), (3, 3)的元素
    arr3[[1, 2, 3]][:, [1, 2, 3]] 同时在行和列上进行花式索引,先选取123行,再选择对应的123 列。

  1. 数学和统计方法

amin(a[, axis, out, keepdims]) 返回数组的最小值或沿轴的最小值

amax(a[, axis, out, keepdims])返回数组的最大值或沿轴的最大值

nanmin(a[, axis, out, keepdims])返回数组的最小值或沿轴的最小值,忽略任何NAN

nanmax(a[, axis, out, keepdims])返回数组的最大值或沿轴方向的最大值,忽略任何NAN

median(a[, axis, out, overwrite_input, keepdims])沿指定轴计算中值

average(a[, axis, weights, returned])计算沿指定轴的加权平均

mean(a[, axis, dtype, out, keepdims])沿指定的轴计算算术平均值

std(a[, axis, dtype, out, ddof, keepdims])计算沿指定轴的标准偏差

var(a[, axis, dtype, out, ddof, keepdims])计算沿指定轴的方差

nanmedian(a[, axis, out, overwrite_input, …])在忽略NAS的情况下,沿指定的轴计算中值

nanmean(a[, axis, dtype, out, keepdims])计算沿指定轴的算术平均值,忽略NAN

nanstd(a[, axis, dtype, out, ddof, keepdims])计算指定轴上的标准偏差,而忽略NAN

nanvar(a[, axis, dtype, out, ddof, keepdims])计算指定轴上的方差,同时忽略NAN

  1. 数组形状变换

ndarray.reshape(shape, order='C') 函数返回修改后的新对象
ndarray.resize() ndarray.resize 方法修改数组本身
ndarray.flatten() ‘c' 按行扁平,’f' 按列扁平
np.concatenate((a, b), axis=0) 轴向必须同纬度
np.vstack((a, b)) 以追加行的方式对数组进行连接(沿轴0)
np.row_stack((a, b)) 以追加行的方式对数组进行连接(沿轴0)
np.hstack((a, b)) 以追加列的方式对数组进行连接(沿轴1)
np.column_stack((a, b)) 类似于hstack,但是会先将一维数组转换为二维列向量
np.dstack((a, b)) 以面向“深度”的方式对数组进行叠加
np.split(ary, indices_or_sections, axis=0) :把一个数组从左到右按顺序切分

 参数: ary:要切分的数组    indices_or_sections:如果是一个整数,就用该数平均切分,如果是一个数          
组,为沿轴切分的位置(从0到-1全部分完)(左开右闭) axis:沿着哪个维度进行切向,默认为0,横向切分。为1时,纵向切分

np.repeat(arr, [2, 3, 4, 5]) # 0重复2次,1重复3次,2重复4次,3重复5次
np.repeat(ndarr, 2) # 不指定轴会被扁平化
np.repeat(ndarr, 2, axis=0) #横向复制
np.tile(ndarr, (2,3)) # 0轴复制2次,1轴复制3次

  1. 通用函数 np.xxx , 不是方法

np.abs(arr1) 绝对值
np.sqrt(arr2) 求平方
np.sign(arr1) 看正负号
np.isnan(arr3) 是否是NAN的布尔值
np.add(arr4, arr5) 加减乘除
np.mod(arr2, 3) # 求模
ceil 计算各元素的ceiling值,即大于等于该值的最小整数
floor 计算各元素的floor值。即小于等于该值的最大整数
rint 将各元素值四舍五入到最接近的整数,保留dtype
modf 将数组的小数和整数部分以两个独立数组的形式返回
cos、cosh、sin、sinh、tan、tanh 普通型和双曲型三角函数
power 对第一个数组中的元素A,根据第二个数组中的相应元素B,计算A的B次方
logical_and、logical_or、logical_xor 执行元素级的真值逻辑运算。相当于中缀运算符&、| 、^

  1. 排序

np.sort(arr1) sort函数,返回副本
arr1.sort() sort方法,改变arr1
np.sort(arr2, axis=0) # 按行排序
np.sort(arr3, order='age')

  1. 搜索和计数

np.argmax(arr) # axis默认为None,返回flatten之后的索引
np.argmax(arr, axis=0) 沿0轴 最大值,维度与列一样
np.nanargmax(arr2, axis=0) 忽略NAN
np.argwhere(arr > 12) # 返回的是元素的坐标
np.nonzero(arr) # 返回array的元组 ,两个array组合就是对应的非0索引

 arr = np.arange(6).reshape(2,3)
        array([[0, 1, 2],
               [3, 4, 5]])
 np.nonzero(arr)
(array([0, 0, 1, 1, 1], dtype=int64), array([1, 2, 0, 1, 2], dtype=int64))

np.flatnonzero(arr) # 返回array的flatten版索引
np.where(condition, x, y)满足条件(condition),输出x,不满足输出y。

np.where(arr3 > 3, -3, arr3)# arr3中大于3的都变成-3 

np.searchsorted([1,2,3,4,5], [-10, 10, 2, 3]) 插入序列,维持顺序的索引array([0, 5, 1, 2])
extract(condition, arr) 返回满足某些条件的数组元素
count_nonzero(a[, axis]) 计算数组a中的非零值的数量

np.count_nonzero([[0,1,7,0,0],[3,0,0,2,19]], axis=0)  #array([1, 1, 1, 1, 1])
  1. 线性代数

diag(v, k=0) #以一维数组的形式返回方阵v的对角线(或非对角线)元素,或将一维数组v转换为方阵(非对角线元素为0)
dot(a, b[, out]) #两个数组的点积
trace(a[, offset, axis1, axis2, dtype, out]) 计算对角线元素的和

  1. 广播

广播是指不同形状的数组之间的算术运算的执行方式。受限于某些约束,较小的数组依据较大数组“broadcasting”,使得它们具有兼容的形状。
如果两个数组的后缘维度(即从末尾开始算起的维度)的轴长度相符或其中一方的长度为1,则认为它们是广播兼容的。广播会在缺失和(或)长度为1的维度上进行
自动扩展小纬度的去满足大纬度的 来做运算。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,657评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,889评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,057评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,509评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,562评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,443评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,251评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,129评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,561评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,779评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,902评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,621评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,220评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,838评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,971评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,025评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,843评论 2 354

推荐阅读更多精彩内容

  • import numpy as np 创建ndarray data1 = [6,7.5, 8, 0, 1]arr1...
    陆文斌阅读 646评论 0 1
  • 一、numpy概述 numpy(Numerical Python)提供了python对多维数组对象的支持:ndar...
    L_steven的猫阅读 3,464评论 1 24
  • 介绍 NumPy是Python数值计算最重要的基础包,大多数提供科学计算的包都是用NumPy的数组作为构建基础。N...
    无味之味阅读 7,778评论 0 3
  • NumPy是Python中关于科学计算的一个类库,在这里简单介绍一下。 来源:https://docs.scipy...
    灰太狼_black阅读 1,228评论 0 5
  • 一、数据类型简介 Numerical Python:底层代码为C,支持处理大量数据所有 Numpy 数据类型都是 ...
    DDuncan阅读 535评论 0 0