当前位置:   article > 正文

图像长尾分布(Long-Tail Distribution)问题_图像分类的尾部概率

图像分类的尾部概率

图像长尾分布(Long-Tail Distribution)问题

Long-tail distribution problem in image datasets.

ImageNetCOCO等常用视觉数据集中,由于经过人工预筛选,图像中的不同目标类别的数量是接近的。而在实际的视觉应用中,数据集大多服从长尾分布(long-tail distribution),即少数类别(称为head class)占据绝大多数样本,多数类别(称为tail class)仅有少量样本。一个典型的长尾分布数据集(Open Brands商标数据集)如下图所示。

定义数据集的**不平衡率(imbalance ratio)**为类别的最大数量和最小数量之比。目前常用的一些长尾分布数据集如下:

  • CIFAR100-LT:对CIFAR100的每类训练样本下采样得到的,不平衡率可以取 10 , 50
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/350407
推荐阅读
相关标签
  

闽ICP备14008679号