目录
有关mAP值和loss值为什么会不同
- mAP聚焦于最重要解决的问题,大于一定的阈值才能算是正确匹配,更多考量了匹配程度而非数值距离,有时候少量的loss增加是可以提升mAP的。
- loss函数考虑的更多是模拟拟合训练的程度,越小表示更加契合训练数据
mAP更能代表模型的性能(比起损失函数的值)
loss和mAP的权衡
过长的哈希码
,在哈希码长度为128的情况下,模型存在一定程度的过拟合还比较正常。
原因有几个:
128bit 的哈希码有非常大的表示空间,模型容易泄漏训练数据信息。
当哈希码很长时,出现约有相同哈希码的训练样本的概率比较小。
对于相同数量的数据,更长的哈希码需要学习更多的参数,模型难度更高。
长哈希码需要更复杂的模型来学习,更易过拟合。
因此在哈希码长度为128bit时,模型存在一点点过拟合是可接受的。
长哈希码虽然可以获得更高的利用信息率,但也带来更高的模型复杂度。
两个平衡点需要考虑:
通过增加正则项、Dropout等方式,合理控制模型复杂度来降低过拟合。
尽量提高mAP值弥补长哈希码带来的信息损失。
只要mAP已经很高,且通过合理手段降低过拟合,这种情况是可以接受的。
您提及的情况符合这些特点,所以是比较正常的。