昨晚睡前开始琢磨做个猫咪塔罗实体牌的识别模型。考虑到后续想做到网站上,那么模型就得足够轻量,所以选择的是MobileNet。没办法拍摄大量的训练集,所以随手拍了家里25张背景图,然后通过贴原图的方式产生了将近2万张规模的训练集,其中包括视角转换,大小缩放,旋转,饱和度变化,亮度变化等干扰。不过倒是忘记加随机遮挡。
因为吃过药也有些困了,开始训练后就去睡觉了。醒来后实拍了22张大阿卡纳用于验证模型准确率,效果不太好,只有36.36%的识别成功率。今天没主要忙这事,就是重新生成了一些训练集(把带外框的也加进去),挂着微调,几次训练后的实拍验证虽然有提升,但都很差。
晚上刚刚决定先放弃MobileNet而是选用EfficientNet-V2-S试试。这个更换起来也就改两行代码,打算重新训练个80轮。结果我看其实10轮后就已经比较稳定了,就打断直接试试。实拍的大阿卡纳22张全对。
接下来就是想办法把这个78兆的权重压缩,然后搭个网站试试了。
方法虽然“老”,但是有用就行。