【numpy基础】--数组简介
NumPy
(Numerical Python)是一个Python
库,主要用于高效地处理多维数组和矩阵计算。它是科学计算领域中使用最广泛的一个库。
在NumPy
中,数组是最核心的概念,用于存储和操作数据。
NumPy
数组是一种多维数组对象,可以存储相同类型的元素,它支持高效的数学运算和线性代数操作。
1. 数据类型
numpy
数组要求其中的元素必须是同一个类型的,虽然丧失了一些灵活性,却带来的性能的极大提升。
numpy
的数组中如果有字符串,那么所有的值都变成字符型了。
再进行数学运算时会报错,如下所示
import numpy as np
arr = np.array([1, "abc", 3.1])
arr + 1
#错误信息
UFuncTypeError: ufunc 'add' did not contain a loop with signature matching types ...
numpy
的标准数据类型主要是各类数值类型,毕竟这个库主要就是用来做数值运算的。
numpy
支持如整数(int8、int16、int32、int64)、浮点数(float32、float64)、复数(complex64、complex128)等类型。
此外,numpy
还支持一些特殊类型,如布尔型(bool)、无类型(void)等。
具体请参考文档:https://numpy.org/doc/stable/user/basics.types.html
选择数据类型时,注意考虑数据类型的内存占用和计算效率,以选择最优的数据类型。
2. 维,秩和轴
numpy
数组的维度,秩和轴这三个概念经常用到。
其中维度和轴是同样的,维度是编程中常用说法,轴是线性代数中常用说法。
numpy
中维度或轴的信息通过shape
属性获取,比如:
import numpy as np
arr = np.array([[[1, 2, 3], [1, 2, 3]]])
arr.shape
#结果:
(1, 2, 3)
这个数组有3个维度(轴),但是每个维度(轴)方向的长度不一样,分别是1,2,3
秩是指轴的个数,也就是维度的数量,比如上面的数组,秩就是3。
numpy
中秩的信息都过ndim
属性来获取,比如:
arr.ndim
#结果:
3
3. 创建方式
学习numpy
的数组,最重要的目的就是掌握如何运用numpy
的数组来进行数值计算。
学习numpy
数组的各类运算操作之前,掌握numpy
提供的各种数组创建方法必不可少。
numpy
提供了多种数组创建方式,每种方式都有其优点和意义。
根据实际需求选择合适的创建方式可以方便地创建具有特定形状和大小的数组,并为其分配内存空间,方便后续高效的学习各种数学运算和线性代数操作。
3.1. zeros
zeors
方法可以创建指定维度和类型的数组,数组的每个元素都是0。
一维,类型分别为int
和float
的数组。
import numpy as np
np.zeros(5, dtype=int)
#>>> array([0, 0, 0, 0, 0])
np.zeros(5, dtype=float)
#>>> array([0., 0., 0., 0., 0.])
不同维度的数组。
import numpy as np
np.zeros((3,3), dtype=float)
#>>>
array([[0., 0., 0.],
[0., 0., 0.],
[0., 0., 0.]])
np.zeros((2,4), dtype=float)
#>>>
array([[0., 0., 0., 0.],
[0., 0., 0., 0.]])
3.2. ones
ones
方法可以创建指定维度和类型的数组,数组的每个元素都是1。
一维,类型分别为int
和float
的数组。
import numpy as np
np.ones(5, dtype=int)
#>>> array([1, 1, 1, 1, 1])
np.ones(5, dtype=float)
#>>> array([1., 1., 1., 1., 1.])
不同维度的数组。
import numpy as np
np.ones((3,3), dtype=float)
#>>>
array([[1., 1., 1.],
[1., 1., 1.],
[1., 1., 1.]])
np.ones((2,4), dtype=float)
#>>>
array([[1., 1., 1., 1.],
[1., 1., 1., 1.]])
3.3. linspace
linspace
函数用来构建均匀分布的数组。
比如,创建一个均匀分布在0~1
之间的5
个值的数组。
import numpy as np
np.linspace(0, 1, 5)
#>>> array([0. , 0.25, 0.5 , 0.75, 1. ])
linspace
函数有个endpoint
属性,用来控制是否包含最后一个元素。
下面看看这个属性设置之后的区别:
import numpy as np
np.linspace(0, 1, 5, endpoint=False)
#>>> array([0. , 0.2, 0.4, 0.6, 0.8])
#其结果相当于不加endpoint属性时,
#平均分割成6份后取前5份
np.linspace(0, 1, 6)
#>>> array([0. , 0.2, 0.4, 0.6, 0.8, 1. ])
3.4. random
random
函数是随机生成numpy
数组,也是使用最多的函数。
随机生成值在0~1
之间的数组,可以指定任意维度:
import numpy as np
np.random.random((3, 3))
#>>>
array([[0.53058991, 0.72007309, 0.44017494],
[0.83616085, 0.65746936, 0.56416387],
[0.56300549, 0.63187035, 0.87307415]])
随机生成值在 0~100
之间整数的数组,可以指定任意维度,
随机值的范围通过第一个和第二个参数指定。
import numpy as np
np.random.randint(0, 100, (3, 3))
#>>>
array([[24, 55, 62],
[79, 86, 3],
[14, 7, 63]])
随机生成一个均值为0
,标准差为1
的符合正态分布的数组,可以指定任意维度,
均值和标准差通过第一个和第二个参数指定。
np.random.normal(0, 1, (4, 3))
#>>>
array([[ 1.65321113, 1.19167512, -0.13037245],
[ 1.16451259, -0.58080834, 0.34491977],
[-0.77054092, -0.95344105, -0.12393142],
[-0.05896611, -1.25108846, -1.21772507]])
3.5. eye
eye
函数是用来创建单位矩阵的。
如果只有一个参数,创建的就是方阵。
np.eye(4)
#>>>
array([[1., 0., 0., 0.],
[0., 1., 0., 0.],
[0., 0., 1., 0.],
[0., 0., 0., 1.]])
如果创建行列不一样的矩阵,那么,行和列哪个轴短,就以哪个为准生成方阵,其他值都是0
。
np.eye(2, 4)
#>>>
array([[1., 0., 0., 0.],
[0., 1., 0., 0.]])
np.eye(4, 2)
#>>>
array([[1., 0.],
[0., 1.],
[0., 0.],
[0., 0.]])
4. 总结回顾
本篇介绍了numpy
中最重要的概念--数组的相关知识。
包括数组的数据类型,主要是各种数值类型,
以及各类常用的创建方式(zeros,ones,linspace,random,eye)。
这些虽然简单,却是后续学习各种数组操作的基础。