# 张量 >原文: 张量如同数组和矩阵一样, 是一种特殊的数据结构。在`PyTorch`中, 神经网络的输入、输出以及网络的参数等数据, 都是使用张量来进行描述。 张量的使用和`Numpy`中的`ndarrays`很类似, 区别在于张量可以在`GPU`或其它专用硬件上运行, 这样可以得到更快的加速效果。如果你对`ndarrays`很熟悉的话, 张量的使用对你来说就很容易了。如果不太熟悉的话, 希望这篇有关张量`API`的快速入门教程能够帮到你。 ```python import torch import numpy as np ``` ## 张量初始化 张量有很多种不同的初始化方法, 先来看看四个简单的例子: **1. 直接生成张量** 由原始数据直接生成张量, 张量类型由原始数据类型决定。 ```python data = [[1, 2], [3, 4]] x_data = torch.tensor(data) ``` **2. 通过Numpy数组来生成张量** 由已有的`Numpy`数组来生成张量(反过来也可以由张量来生成`Numpy`数组, 参考[张量与Numpy之间的转换](#jump))。 ```python np_array = np.array(data) x_np = torch.from_numpy(np_array) ``` **3. 通过已有的张量来生成新的张量** 新的张量将继承已有张量的数据属性(结构、类型), 也可以重新指定新的数据类型。 ```python x_ones = torch.ones_like(x_data) # 保留 x_data 的属性 print(f"Ones Tensor: \n {x_ones} \n") x_rand = torch.rand_like(x_data, dtype=torch.float) # 重写 x_data 的数据类型 int -> float print(f"Random Tensor: \n {x_rand} \n") ``` 显示: ```python Ones Tensor: tensor([[1, 1], [1, 1]]) Random Tensor: tensor([[0.0381, 0.5780], [0.3963, 0.0840]]) ``` **4. 通过指定数据维度来生成张量** `shape`是元组类型, 用来描述张量的维数, 下面3个函数通过传入`shape`来指定生成张量的维数。 ```python shape = (2,3,) rand_tensor = torch.rand(shape) ones_tensor = torch.ones(shape) zeros_tensor = torch.zeros(shape) print(f"Random Tensor: \n {rand_tensor} \n") print(f"Ones Tensor: \n {ones_tensor} \n") print(f"Zeros Tensor: \n {zeros_tensor}") ``` 显示: ```python Random Tensor: tensor([[0.0266, 0.0553, 0.9843], [0.0398, 0.8964, 0.3457]]) Ones Tensor: tensor([[1., 1., 1.], [1., 1., 1.]]) Zeros Tensor: tensor([[0., 0., 0.], [0., 0., 0.]]) ``` ## 张量属性 从张量属性我们可以得到张量的维数、数据类型以及它们所存储的设备(CPU或GPU)。 来看一个简单的例子: ```python tensor = torch.rand(3,4) print(f"Shape of tensor: {tensor.shape}") print(f"Datatype of tensor: {tensor.dtype}") print(f"Device tensor is stored on: {tensor.device}") ``` 显示: ```python Shape of tensor: torch.Size([3, 4]) # 维数 Datatype of tensor: torch.float32 # 数据类型 Device tensor is stored on: cpu # 存储设备 ``` ## 张量运算 有超过100种张量相关的运算操作, 例如转置、索引、切片、数学运算、线性代数、随机采样等。更多的运算可以在这里查看。 所有这些运算都可以在GPU上运行(相对于CPU来说可以达到更高的运算速度)。如果你使用的是Google的Colab环境, 可以通过 `Edit > Notebook Settings` 来分配一个GPU使用。 ```python # 判断当前环境GPU是否可用, 然后将tensor导入GPU内运行 if torch.cuda.is_available(): tensor = tensor.to('cuda') ``` 光说不练假把式, 接下来的例子一定要动手跑一跑。如果你对Numpy的运算非常熟悉的话, 那tensor的运算对你来说就是小菜一碟。 **1. 张量的索引和切片** ```python tensor = torch.ones(4, 4) tensor[:,1] = 0 # 将第1列(从0开始)的数据全部赋值为0 print(tensor) ``` 显示: ```python tensor([[1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.]]) ``` **2. 张量的拼接** 你可以通过`torch.cat`方法将一组张量按照指定的维度进行拼接, 也可以参考`torch.stack`方法。这个方法也可以实现拼接操作, 但和`torch.cat`稍微有点不同。 ```python t1 = torch.cat([tensor, tensor, tensor], dim=1) print(t1) ``` 显示: ``` tensor([[1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.], [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.], [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.], [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.]]) ``` **3. 张量的乘积和矩阵乘法** ```python # 逐个元素相乘结果 print(f"tensor.mul(tensor): \n {tensor.mul(tensor)} \n") # 等价写法: print(f"tensor * tensor: \n {tensor * tensor}") ``` 显示: ```python tensor.mul(tensor): tensor([[1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.]]) tensor * tensor: tensor([[1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.]]) ``` 下面写法表示张量与张量的矩阵乘法: ```python print(f"tensor.matmul(tensor.T): \n {tensor.matmul(tensor.T)} \n") # 等价写法: print(f"tensor @ tensor.T: \n {tensor @ tensor.T}") ``` 显示: ```python tensor.matmul(tensor.T): tensor([[3., 3., 3., 3.], [3., 3., 3., 3.], [3., 3., 3., 3.], [3., 3., 3., 3.]]) tensor @ tensor.T: tensor([[3., 3., 3., 3.], [3., 3., 3., 3.], [3., 3., 3., 3.], [3., 3., 3., 3.]]) ``` **4. 自动赋值运算** 自动赋值运算通常在方法后有 `_` 作为后缀, 例如: `x.copy_(y)`, `x.t_()`操作会改变 `x` 的取值。 ```python print(tensor, "\n") tensor.add_(5) print(tensor) ``` 显示: ```python tensor([[1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.], [1., 0., 1., 1.]]) tensor([[6., 5., 6., 6.], [6., 5., 6., 6.], [6., 5., 6., 6.], [6., 5., 6., 6.]]) ``` > 注意: > > 自动赋值运算虽然可以节省内存, 但在求导时会因为丢失了中间过程而导致一些问题, 所以我们并不鼓励使用它。 ## Tensor与Numpy的转化 张量和`Numpy array`数组在CPU上可以共用一块内存区域, 改变其中一个另一个也会随之改变。 **1. 由张量变换为Numpy array数组** ```python t = torch.ones(5) print(f"t: {t}") n = t.numpy() print(f"n: {n}") ``` 显示: ```python t: tensor([1., 1., 1., 1., 1.]) n: [1. 1. 1. 1. 1.] ``` 修改张量的值,则`Numpy array`数组值也会随之改变。 ```python t.add_(1) print(f"t: {t}") print(f"n: {n}") ``` 显示: ```python t: tensor([2., 2., 2., 2., 2.]) n: [2. 2. 2. 2. 2.] ```