从头实现一个自己的汽车识别分类器（中）--训练模型篇

目录：
爬取数据篇
训练模型篇
汽车识别篇

训练模型篇

数据已经爬取完毕，接下来开始训练模型，先来看一下项目结构，如下图

all_cars：已经介绍过，存放所有类别的车型图片
cars：其实我训练的是此文件夹数据，此文件夹包含的是从上个文件夹挑选出来的十个车型，因为直接训练十多万的数据太耗时了。所以我只选择了十个车型，大概包含一万多张图片，顺便还能解决数据不平很问题，不亏～
test_img：是从汽车之家论坛里随便保存的几张图片，用来检验训练后模型的识别效果。
two_cars：此文件夹存放两类车型，大概一千多张图片，用于挑选模型和初步调参之用。
car.py和clear_data.py：爬虫和数据清理脚本，上一篇已经介绍过了。
config .py：配置文件，用于调整超参数和更改文件路径。
dataset.py：用于数据增强、读取等。
main.py：核心文件，用于训练模型。
models.py: 提供各种模型（如VGG，ResNet等）选择。
test.py：测试模型识别效果。

首先需要介绍一下config.py，代码如下：

class Config(object):
    batch_size = 32 # 根据gpu适当增大或减小
    lr = 0.0002 # 学习率
    # lr_decay = None 学习衰减系数
    # step_size = None 学习率衰减步长
    root = './cars' # 数据集位置
    use_gpu = True # 是否使用GPU训练
    epochs = 100 # 迭代次数
    weight_decay = 0.001 # 正则化系数
    num_classes = 10 # 分类别数

这里写了一个Config类，里面设置了各种需要调解的超参数，训练模型时只需要讲此类实例化即可设置一些参数。比如学习率的设置，当然这样只是为了将超参数写一块，方便修改，也可以直接把参数直接设置到mian.py里。

opt = Config()
for epoch in opt.epochs:
      .......

接着是dataset.py文件，用于读取数据，并进行数据增强和随机打乱等操作，并为模型提供可迭代的batch_size数据。代码如下

from config import Config
from torch.utils.data import DataLoader, random_split
from torchvision.datasets import ImageFolder
from torchvision import transforms as tfs


opt = Config()
data_tfs = tfs.Compose([tfs.Resize([160,160]),
                         tfs.RandomHorizontalFlip(),
                         tfs.RandomRotation(45),
                         tfs.ToTensor(),
                         tfs.Normalize(mean = [0.485, 0.456, 0.406],
                                        std = [0.229, 0.224, 0.225])
                        ])


data_set = ImageFolder(opt.root, transform=data_tfs)
train_size = int(0.7 * len(data_set))
val_size = len(data_set) - train_size
train_set, val_set = random_split(data_set, [train_size, val_size])

train_loader = DataLoader(train_set, batch_size=opt.batch_size, shuffle=True, num_workers=4)
val_loader = DataLoader(val_set, batch_size=opt.batch_size, shuffle=False, num_workers=4)
# for x, y in val_loader:
#     print(x,y)
#     break
print('训练集:{}, 验证集:{}'.format(len(train_loader.dataset), len(val_loader.dataset)))
print('类别：', data_set.classes)

再接着就是models.py文件，此文件很简单，就是改写一些经典的卷积神经网络，使其适应我们的分类。另外还写了一个精简版的10层VGG网络，本次用的就是次网络。

n.Linear(512, num_classes)
        )

    def forward(self, x):
        x = self.features(x)
        x = x.view(x.size(0), -1)
        x = self.classifier(x)

        return x

    def _make_layers(self, cfg):
        layers = []
        in_channels = 3
        for v in cfg:
            if v == 'M':
                layers += [nn.MaxPool2d(2, 2)]
            else:
                layers += [nn.Conv2d(in_channels, v, kernel_size=3, padding=1),
                           nn.BatchNorm2d(v),
                           nn.ReLU(True)]
                in_channels = v
        return nn.Sequential(*layers)

def resnet(num_calsses):
    net = resnet(num_calsses)
    net.fc = nn.Linear(2048, num_calsses)
    # print(net)
    return net

def Alexnet(mun_classes):
    net = alexnet()
    net.classifier[6] = nn.Linear(4096, mun_classes)
    # print(net)
    return net

def squeezenet(num_classes):
    net = squeezenet1_0()
    net.classifier[1] = nn.Conv2d(512, num_classes, 1, 1)
    # print(net)
    return net

# x = torch.randn(1,3,160,160)
# net = VGG10('VGG10', 10)
# y = net(x)
# print(y.shape)

最后是训练文件mian.py，这里定义一个main函数，它对网络进行训练，然后保存一个验证集准确率最高的模型权重文件，返回训每个epoch下的训练集和测试集的loss以及准确率，并可视化。

import copy
import torch
import torch.nn as nn
from torch import optim
from config import Config
from models import VGG10, resnet, Alexnet, squeezenet
from dataset import train_loader, val_loader
import time
import os
import matplotlib.pyplot as plt

opt = Config()
device = torch.device('cuda' if opt.use_gpu else 'cpu')

net = VGG10('VGG10', opt.num_classes)
model = net.to(device)

optimizer = optim.Adam(model.parameters(), lr=opt.lr, weight_decay=opt.weight_decay)
# scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[5, 10], gamma=opt.lr_decay)
criterion = nn.CrossEntropyLoss()
train_loader = train_loader
val_loader = val_loader

def main():
    train_loss_list = []
    train_acc_list = []
    val_loss_list = []
    val_acc_list = []

    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0
    for epoch in range(opt.epochs):
        since = time.time()
        print('epoch {}/{}'.format(epoch+1, opt.epochs))
        print('-' * 10)

        model.train()
        train_loss = 0.0
        train_corrects = 0.0
        for inputs, labels in train_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = criterion(outputs, labels)

            loss.backward()
            optimizer.step()

            _, pred = torch.max(outputs, 1)
            train_loss += loss.item() * labels.size(0)
            train_corrects += (pred == labels).sum().item()
        epoch_train_loss = train_loss / len(train_loader.dataset)
        epoch_train_acc = train_corrects / len(train_loader.dataset)

        train_loss_list.append(epoch_train_loss)
        train_acc_list.append(epoch_train_acc)

        print('train loss:{}, acc:{}'.format(epoch_train_loss, epoch_train_acc))

        model.eval()
        val_loss = 0.0
        val_corrects = 0.0
        for inputs, labels in val_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            outputs = model(inputs)
            loss = criterion(outputs, labels)
            _, pred = torch.max(outputs, 1)

            val_loss += loss.item() * labels.size(0)
            val_corrects += (pred == labels).sum().item()
        epoch_val_loss = val_loss / len(val_loader.dataset)
        epoch_val_acc = val_corrects / len(val_loader.dataset)

        val_loss_list.append(epoch_val_loss)
        val_acc_list.append(epoch_val_acc)

        print('val loss:{}, acc:{}'.format(epoch_val_loss, epoch_val_acc))

        if epoch_val_acc > best_acc:
            best_acc = epoch_val_acc
            best_model_wts = copy.deepcopy(model.state_dict())
        time_elapsed = time.time() - since
        print('time: {:.0f}m {:.0f}s'.format(time_elapsed // 60, time_elapsed % 60))
        print()
    if not os.path.isdir('checkpoint'):
        os.makedirs('checkpoint')
        torch.save(best_model_wts, './checkpoint/weights.pkl')

    print('Best val acc:{:.4f}'.format(best_acc))

    return train_loss_list, train_acc_list, val_loss_list, val_acc_list



if __name__ == '__main__':
    train_loss_list, train_acc_list, val_loss_list, val_acc_list = main()
    plt.plot(range(1, opt.epochs+1), train_loss_list, label='train_loss')
    plt.plot(range(1, opt.epochs+1), train_acc_list, label='train_acc')
    plt.plot(range(1, opt.epochs+1), val_loss_list, label='val_loss')
    plt.plot(range(1, opt.epochs+1), val_acc_list, label='val_acc')
    plt.legend()
    plt.show()

以上就是截止到模型训练篇的所有代码。

分享一下训练经历吧：
由于是第一次训练自己的数据，用了好多模型，调节的好多超参数，模型要么不收敛，要么严重过拟合。再加上硬件原因，那些很深的模型很吃显存，只能把batch_size设置成16甚至更小，并且训练一个epoch都需要很长时间。于是就先提取了一个二分类的小数据集，尝试各种模型，和参数。最终resnet50和VGG，效果比较好。于是直接上resnet50，奈何训练了大半天（每个epoch大概4-5分钟，100个epoch，电脑成了暖气片～。～），严重过拟合。我感觉到一万多的数据对这种体量的网络还是太小了。那就做一个精简版的VGG吧，层数减少到10，每层通道数减半。这样可以将batch_size增加到32了，并且每个epoch缩减为1m50s，最终训练效果还是不太理想。炼丹果然是门手艺活～

附上最终绘制的loss和acc曲线。

从图可以看到，大概训练至70次左右，val_loss不再下降，说明网络还是过拟合了。从头训练一次模型实在是很耗时间和电费～
暂且就用这个模型来识别汽车吧！

图片来自汽车之家论坛

最后编辑于：2019.08.28 16:48:29

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,590评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 86,808评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,151评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,779评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,773评论 5赞 367
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,656评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,022评论 3赞 398
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,678评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,038评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,659评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,756评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,411评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,005评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,973评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,053评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,495评论 2赞 343

从头实现一个自己的汽车识别分类器（中）--训练模型篇

训练模型篇

推荐阅读更多精彩内容