如何解决类别不平衡问题? 对大类欠采样,或者对小类过采样; 设置不同的学习率,大类权值小,小类权值大; 使用一些对样本分布不敏感的评价指标,F1,ROC等 尝试不同的算法,尤其是决策树类(对不平衡数据表现不错),还有就是集成方法; 可以对模型进行惩罚,加正则项; 如果小类很小,可将问题转化为异常点检测;