Class-Balanced Loss Based on Effective Number of Samples

URL

本文提出一种在 不平衡数据分类 场景使用的 Loss —— Class-Balanced Loss
提出一个理论模型，对每类的 有效样本数量 进行估计，从而对每类设计损失权重
理论可概括为：对某一类的所有样本（样本容量为 n）进行采样，每一次采样，有 p 的概率和之前采样过的样本 重复，有 1-p 的概率不重复，n 越大，冲突可能越大，所以 p 越大
该理论模型简化后可用数学归纳法证明，Class-Balanced Loss 最终化简为包含一个超参 $\beta$ 的权重系数

本文提出一种类中有效样本的计算方式，类中样本容量用 $n \in \mathbb Z_{>0}$ 表示，有效样本量用 $N \in \mathbb Z_{>0}$ 表示，有效样本的期望用 $E_n \in \mathbb Z_{>0}$ 表示
$E_n = \frac{1-\beta^n}{1-\beta},\ \ \ \ \beta=\frac{N-1}{N}$
实际使用时， $\beta$ 为一个超参，取值范围：{0.9, 0.99, 0.999, 0.9999}

理论模型只提供一个权重，实际使用时还需要结合其他的分类损失函数，例如 [Softmax Loss（交叉熵）, Sigmoid Loss, Focal Loss]

$CB(p, y) = \frac{1}{E_{n_y}} L(p, y)=\frac{1-\beta}{1-\beta^{n_y}}L(p, y)$

其中， $p \in [0, 1]$ 表示输入样本 x 后模型输出的各类的概率分布， $y$ 表示样本 x 的 label， $\beta$ 是一个超参数， $L(p, y)$ 是分类常用损失函数
class-balanced softmax cross-entropy loss
$CB_{softmax}(z, y) = -\frac{1-\beta}{1-\beta^{n_y}}log(\frac{exp(z_y)}{\sum_{j=1}^C exp(z_j)})$
class-balanced sigmoid cross-entropy loss
$CB_{sigmoid}(z, y) = -\frac{1-\beta}{1-\beta^{n_y}}\sum_{i=1}^C log(\frac{1}{1+exp(-z_i^t)})$
class-balanced focal loss
$CB_{focal}(z, y) = -\frac{1-\beta}{1-\beta^{n_y}}\sum_{i=1}^C (1-p_i^t)^\gamma log(p_i^t)$
$\gamma \in \{0.5, 1, 2\}$

其中 $Imbalanced\ factor = \frac{Sample\ size\ for\ largest\ class}{Sample\ size\ for\ least\ class}$