← 返回首页

轻量模型与识别准确率的博弈

发布时间: 2026-03-11 21:23(北京时间)

摘要: 作者描述了一个从轻量模型MobileNet转向EfficientNet-V2-S以提升猫咪塔罗牌识别准确率的实验过程。初始训练集通过数据增强生成,但验证效果不佳;模型更换后准确率显著提高至100%。整体语调务实、反思,强调实用主义与迭代优化。

标签: 机器学习, 模型优化, 数据增强, 实验记录, 实用主义, 反思, 冷静

字数: 442

原文链接: /7402396589/QvDl7omG0

昨晚睡前开始琢磨做个猫咪塔罗实体牌的识别模型。考虑到后续想做到网站上,那么模型就得足够轻量,所以选择的是MobileNet。没办法拍摄大量的训练集,所以随手拍了家里25张背景图,然后通过贴原图的方式产生了将近2万张规模的训练集,其中包括视角转换,大小缩放,旋转,饱和度变化,亮度变化等干扰。不过倒是忘记加随机遮挡。

因为吃过药也有些困了,开始训练后就去睡觉了。醒来后实拍了22张大阿卡纳用于验证模型准确率,效果不太好,只有36.36%的识别成功率。今天没主要忙这事,就是重新生成了一些训练集(把带外框的也加进去),挂着微调,几次训练后的实拍验证虽然有提升,但都很差。

晚上刚刚决定先放弃MobileNet而是选用EfficientNet-V2-S试试。这个更换起来也就改两行代码,打算重新训练个80轮。结果我看其实10轮后就已经比较稳定了,就打断直接试试。实拍的大阿卡纳22张全对。

接下来就是想办法把这个78兆的权重压缩,然后搭个网站试试了。

方法虽然“老”,但是有用就行。