轻量模型与识别准确率的博弈

昨晚睡前开始琢磨做个猫咪塔罗实体牌的识别模型。考虑到后续想做到网站上，那么模型就得足够轻量，所以选择的是MobileNet。没办法拍摄大量的训练集，所以随手拍了家里25张背景图，然后通过贴原图的方式产生了将近2万张规模的训练集，其中包括视角转换，大小缩放，旋转，饱和度变化，亮度变化等干扰。不过倒是忘记加随机遮挡。

因为吃过药也有些困了，开始训练后就去睡觉了。醒来后实拍了22张大阿卡纳用于验证模型准确率，效果不太好，只有36.36%的识别成功率。今天没主要忙这事，就是重新生成了一些训练集(把带外框的也加进去)，挂着微调，几次训练后的实拍验证虽然有提升，但都很差。

晚上刚刚决定先放弃MobileNet而是选用EfficientNet-V2-S试试。这个更换起来也就改两行代码，打算重新训练个80轮。结果我看其实10轮后就已经比较稳定了，就打断直接试试。实拍的大阿卡纳22张全对。

接下来就是想办法把这个78兆的权重压缩，然后搭个网站试试了。

方法虽然“老”，但是有用就行。