【numpy基础】--通用计算

2023-06-21 12:41 由 wang_yb 发表于 #后端开发

numpy提供了简单灵活的接口，用于优化数据数组的计算。
通用计算最大的优势在于通过向量化操作，将循环推送至numpy之下的编译层，从而取得更快的执行效率。

numpy的通用计算让我们计算数组时就像计算单独一个变量一样，
不用写循环去遍历数组中的各个元素。
比如，对于一般的python二维数组，我们要给数组中每个值加1：

l = [[1, 2], [3, 4]]
print(l)
#运行结果
[[1, 2], [3, 4]]

for i in range(len(l)):
    for j in range(len(l[i])):
        l[i][j] += 1

print(l)
#运行结果
[[2, 3], [4, 5]]

如果用numpy的通用计算的话：

import numpy as np

l = np.array([[1,2], [3,4]])
print(l)
#运行结果
[[1, 2], [3, 4]]

l = l + 1
print(l)
#运行结果
[[2, 3], [4, 5]]

1. 算术计算

算术计算是最基本的，numpy数组支持直接用运算符或者通用函数来进行运算。

运算符	通用函数	说明
+	np.add	加法运算
-	np.subtract	减法运算
*	np.multiply	乘法运算
/	np.divide	除法运算
//	np.floor_divide	向下整除运算
**	np.power	指数运算
%	np.mod	模运算

算术运算比较简单，就不一一演示各个运算符了。

需要注意的一点是，当numpy数组和单一数字运算时，数组中每个元素都单独和此数字运算。

arr = np.array([[1,2], [3, 4]])
print(arr)
#运行结果
[[1 2]
 [3 4]]

print(arr * 2)
#运行结果
[[2 4]
 [6 8]]

arr * 2 相当于arr中每个元素都 * 2。

当numpy数组和另一个numpy数组运算时，是两个数组对应位置的元素进行运算。
这就要求两个数组的 shape 要一样，否则会出错。

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[1, 0], [0, 1]])
print(arr1, arr2)
#运行结果
[[1 2]
 [3 4]]

[[1 0]
 [0 1]]

print(arr1 * arr2)
#运行结果
[[1 0]
 [0 4]]

对应元素相乘，所以只保留了对角线上的元素。

2. 三角函数

除了常用的算术运算，numpy的数组支持各类三角函数运算。
下面演示几个常用的三角函数：

arr = np.array([0, np.pi/6, np.pi/4, np.pi/2])

print("sin(arr)     = ", np.sin(arr))
print("cos(arr)     = ", np.cos(arr))
print("tan(arr)     = ", np.tan(arr))
#运行结果
sin(arr)     =  [0.         0.5        0.70710678 1.        ]
cos(arr)     =  [1.00000000e+00 8.66025404e-01 7.07106781e-01 6.12323400e-17]
tan(arr)     =  [0.00000000e+00 5.77350269e-01 1.00000000e+00 1.63312394e+16]

arr = np.array([-1, 0, 1])
print("arcsin(arr)  = ", np.arcsin(arr))
print("arccos(arr)  = ", np.arccos(arr))
print("arctan(arr)  = ", np.arctan(arr))
#运行结果
arcsin(arr)  =  [-1.57079633  0.          1.57079633]
arccos(arr)  =  [3.14159265 1.57079633 0.        ]
arctan(arr)  =  [-0.78539816  0.          0.78539816]

3. 指数和对数

常用的指数和对数如下：

x = np.array([1, 2, 4, 10])

print("e^x = ", np.exp(x))
print("2^x = ", np.exp2(x))
print("3^x = ", np.power(3, x))
#运行结果
e^x =  [2.71828183e+00 7.38905610e+00 5.45981500e+01 2.20264658e+04]
2^x =  [   2.    4.   16. 1024.]
3^x =  [    3     9    81 59049]

print("ln(x)    = ", np.log(x))
print("log2(x)  = ", np.log2(x))
print("log10(x) = ", np.log10(x))
#运行结果
ln(x)    =  [0.         0.69314718 1.38629436 2.30258509]
log2(x)  =  [0.         1.         2.         3.32192809]
log10(x) =  [0.         0.30103    0.60205999 1.        ]

4. 通用特性

除了通用的计算方法，还有一些特性也很有用。
下面介绍两个常用的特性，一个可以节约内存，提高程序的运行效率；另一个可以简化编码，提高程序的编写效率。

4.1. 指定输出位置

进行两个数组的计算时，比如x数组和y数组，计算的结果常常要用新的数组（比如z数组）来保存。

如果计算之后x数组或y数组不再需要的话，我们可以把运算结果保存在x数组或y数组中，这样就不用申请信的内存。

x = np.random.randint(1, 10, (3,3))
y = np.random.randint(1, 10, (3,3))

print(x)
print(y)
#运行结果
[[3 9 3]
 [8 6 9]
 [9 7 4]]
[[4 4 5]
 [1 6 6]
 [2 5 6]]

np.multiply(x, y, out=y)
print(x)
print(y)
#运行结果
[[3 9 3]
 [8 6 9]
 [9 7 4]]
[[12 36 15]
 [ 8 36 54]
 [18 35 24]]

设置参数 out=y，可以看到计算结果保存在了y数组中。

4.2. 简单的聚合

对于任意一个数组，按行或者列聚合合计值时：

x = np.random.randint(1, 10, (3,3))
print(x)
#运行结果
[[8 6 5]
 [4 8 4]
 [9 2 3]]

#每列的合计值
print(np.add.reduce(x))
#运行结果
[21 16 12]

#每行的合计值
print(np.add.reduce(x, axis=1))
#运行结果
[19 16 14]

上面是用np.add来聚合的，也可以使用 np.multiply，np.divide等等前面介绍的各种算术计算。

除了聚合合计值，numpy还提供了一个可以计算合计过程中每步计算结果的方法accumulate。

x = np.random.randint(1, 10, 5)
print(x)
#运算结果
[6 1 6 9 7]

print(np.add.accumulate(x))
#运算结果：[x[0], x[0]+x[1], x[0]+x[1]+x[2]...]
[ 6  7 13 22 29]

print(np.multiply.accumulate(x))
#运算结果：[x[0], x[0]*x[1], x[0]*x[1]*x[2]...]
[6    6   36  324 2268]

5. 总结回顾

本篇主要介绍了 numpy数组的通用计算方法，通用计算把数组元素循环的复杂度封装起来，让我们用直观的方式计算数组，更容易实现各种数学公式和定理。

本篇介绍的算术计算，三角函数，以及指数和对数等常用的方法，但不是全部的通用计算方法，更加复杂的微分和积分计算请参考官方的文档。

热门相关：洪荒二郎传豪门重生盛世闲女年轻的妻子绯闻III 美味的邂逅