Add files via upload

2a4ab4ca · lizhiTech · GitHub · 035020b7 · 2a4ab4ca · 2a4ab4ca
隐藏空白更改
内联并排

Showing with 216 addition and 0 deletion

demo_infer.py demo_infer.py +62 -0

demo_train.py demo_train.py +154 -0

未找到文件。
--- a/demo_infer.py
+++ b/demo_infer.py
+import torch
+from torch import nn
+from torchvision import datasets
+from torchvision.transforms import ToTensor
+
+
+# ----------加载模型----------
+
+# 定义模型
+class NeuralNetwork(nn.Module):
+    def __init__(self):     # 初始化，实例化模型的时候就会调用
+        super(NeuralNetwork, self).__init__()
+        self.flatten = nn.Flatten()     # [64, 1, 28, 28] -> [64, 1*28*28]
+        self.linear_relu_stack = nn.Sequential(
+            nn.Linear(28*28, 512),      # [64, 1*28*28] -> [64, 512]
+            nn.ReLU(),
+            nn.Linear(512, 512),        # [64, 512] -> [64, 512]
+            nn.ReLU(),
+            nn.Linear(512, 10)          # [64, 512] -> [64, 10]
+        )
+
+    def forward(self, x):   # 前向传播，输入数据进网络的时候才会调用
+        x = self.flatten(x)                     # [64, 1*28*28]
+        logits = self.linear_relu_stack(x)      # [64, 10]
+        return logits
+
+if __name__ == '__main__':
+    # 加载MNIST数据集的测试集
+    test_data = datasets.FashionMNIST(
+        root="data",
+        train=False,
+        download=True,
+        transform=ToTensor(),
+    )
+
+    # 加载模型
+    model = NeuralNetwork()
+    model.load_state_dict(torch.load("model.pth"))
+
+    # 种类名称
+    classes = [
+        "T-shirt/top",
+        "Trouser",
+        "Pullover",
+        "Dress",
+        "Coat",
+        "Sandal",
+        "Shirt",
+        "Sneaker",
+        "Bag",
+        "Ankle boot",
+    ]
+
+    # 切换到测试模式
+    model.eval()
+
+    # 取第一个图像和对应的标签
+    image, label = test_data[0][0], test_data[0][1]
+    with torch.no_grad():
+        pred = model(image)     # 输入进网络得到输出
+        predicted, actual = classes[pred[0].argmax(0)], classes[label]      # 得到预测值和标签值
+        print(f'Predicted: "{predicted}", Actual: "{actual}"')
\ No newline at end of file
--- a/demo_train.py
+++ b/demo_train.py
+import torch
+from torch import nn
+from torch.utils.data import DataLoader
+from torchvision import datasets
+from torchvision.transforms import ToTensor
+
+
+# 定义模型
+class NeuralNetwork(nn.Module):
+    def __init__(self):  # 初始化，实例化模型的时候就会调用
+        super(NeuralNetwork, self).__init__()
+        self.flatten = nn.Flatten()  # [64, 1, 28, 28] -> [64, 1*28*28]
+        self.linear_relu_stack = nn.Sequential(
+            nn.Linear(28 * 28, 512),  # [64, 1*28*28] -> [64, 512]
+            nn.ReLU(),
+            nn.Linear(512, 512),  # [64, 512] -> [64, 512]
+            nn.ReLU(),
+            nn.Linear(512, 10)  # [64, 512] -> [64, 10]
+        )
+
+    def forward(self, x):  # 前向传播，输入数据进网络的时候才会调用
+        x = self.flatten(x)  # [64, 1*28*28]
+        logits = self.linear_relu_stack(x)  # [64, 10]
+        return logits
+
+
+# 训练函数
+def train(train_dataloader, model, loss_fn, optimizer):
+    """
+        训练网络
+
+        输入:
+            train_dataloader:   训练集的dataloader
+            model:              网络模型
+            loss_fn:            损失函数
+            optimizer:          优化器
+        """
+    # 切换到train模式
+    model.train()
+    # 遍历dataloader
+    for images, labels in train_dataloader:
+        # 将数据和标签加载到device上
+        images, labels = images.to(device), labels.to(device)
+        # 输入数据到模型里得到输出
+        pred = model(images)
+        # 计算输出和标签的loss
+        loss = loss_fn(pred, labels)
+        # 反向推导
+        optimizer.zero_grad()
+        loss.backward()
+        # 步进优化器
+        optimizer.step()
+
+
+# 测试函数
+def test(test_dataloader, model, loss_fn):
+    """
+        测试网络
+
+        输入:
+            test_dataloader:    测试集的dataloader
+            model:              网络模型
+            loss_fn:            损失函数
+        """
+    # 测试集大小
+    size = len(test_dataloader.dataset)
+    # 测试集的batch数量
+    num_batches = len(test_dataloader)
+    # 切换到测试模型
+    model.eval()
+    # 记录loss和准确率
+    test_loss, correct = 0, 0
+    # 梯度截断
+    with torch.no_grad():
+        for images, labels in test_dataloader:  # 遍历batch
+            # 加载到device
+            images, labels = images.to(device), labels.to(device)
+            # 输入数据到模型里得到输出
+            pred = model(images)
+            # 累加loss
+            test_loss += loss_fn(pred, labels).item()
+            # 累加正确率
+            correct += (pred.argmax(1) == labels).sum().item()
+    # 计算平均loss和准确率
+    test_loss /= num_batches
+    correct /= size
+    print(f"Test Error: \n Accuracy: {(100 * correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")
+
+
+if __name__ == '__main__':
+
+    # ----------数据集----------
+
+    # 加载MNIST数据集的训练集
+    training_data = datasets.FashionMNIST(
+        root="data",
+        train=True,
+        download=True,
+        transform=ToTensor(),
+    )
+    # 加载MNIST数据集的测试集
+    test_data = datasets.FashionMNIST(
+        root="data",
+        train=False,
+        download=True,
+        transform=ToTensor(),
+    )
+
+    # batch大小
+    batch_size = 64
+
+    # 创建dataloader
+    train_dataloader = DataLoader(training_data, batch_size=batch_size)
+    test_dataloader = DataLoader(test_data, batch_size=batch_size)
+
+    # 遍历dataloader
+    for images, labels in test_dataloader:
+        print("Shape of X [N, C, H, W]: ", images.shape)     # 每个batch数据的形状
+        print("Shape of y: ", labels.shape)                  # 每个batch标签的形状
+        break
+
+    # ----------模型----------
+
+    # 使用gpu或者cpu进行训练
+    device = "cuda" if torch.cuda.is_available() else "cpu"
+    # 打印使用的是gpu/cpu
+    print("Using {} device".format(device))
+    # 实例化模型
+    model = NeuralNetwork().to(device)
+    # 打印模型结构
+    print(model)
+
+    # ----------训练参数设置----------
+
+    loss_fn = nn.CrossEntropyLoss()                             # 损失函数设置
+    optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)    # 学习率设置
+    epochs = 5                                                  # 训练迭代次数设置
+
+    # ----------训练/测试----------
+
+    # 开始训练
+    for t in range(epochs):     # 迭代epochs次
+        print(f"Epoch {t+1}\n-------------------------------")
+        # 训练
+        train(train_dataloader, model, loss_fn, optimizer)
+        # 当次训练完后测试目前模型在测试集上的表现
+        test(test_dataloader, model, loss_fn)
+    print("Done!")
+
+    # ----------保存模型----------
+
+    # 保存模型
+    torch.save(model.state_dict(), "model.pth")
+