登录注册写文章

BCEWithLogitsLoss参数pos_weight样本不均衡问题

BCEWithLogitsLoss参数pos_weight样本不均衡问题

下面是具体的参数：

1. pos_weight:

处理样本不均衡问题
torch.nn.BCEWithLogitsLoss(weight=None, size_average=None, reduce=None, reduction='mean', pos_weight=None)
其中* pos_weight (Tensor*, *optional) – a weight of positive examples. Must be a vector with length equal to the number of classes.
pos_weight里是一个tensor列表，需要和标签个数相同，比如现在有一个多标签分类，类别有200个，那么 pos_weight 就是为每个类别赋予的权重值，长度为200，官方给出的例子是：

target = torch.ones([10, 64], dtype=torch.float32)  # 64 classes, batch size = 10
output = torch.full([10, 64], 1.5)  # A prediction (logit)
pos_weight = torch.ones([64])  # All weights are equal to 1
criterion = torch.nn.BCEWithLogitsLoss(pos_weight=pos_weight)
criterion(output, target)  # -log(sigmoid(1.5))

如果现在是二分类，只需要将正样本loss的权重写上即可，比如我们有正负两类样本，正样本数量为100个，负样本为400个，我们想要对正负样本的loss进行加权处理，将正样本的loss权重放大4倍，通过这样的方式缓解样本不均衡问题：

criterion = nn.BCEWithLogitsLoss(pos_weight=torch.tensor([4]))

-- pos_weight (Tensor, optional): a weight of positive examples.
--Must be a vector with length equal to the number of classes.

参考：
BCEWithLogitsLoss样本不均衡的处理

最后编辑于：2021.12.12 21:54:47

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

如何解决机器学习中样本不均衡问题？
样本不均衡：正样本和负样本的数目相差很大。在一个极度不平衡的样本中，由于机器学习会每个数据进行学习，那么多数数据...
冬天都会过去阅读 5,061评论 0赞 3
目标检测中的样本不均衡问题详述
样本不均衡问题：指在训练的时侯各个类别的样本数量不均衡，由于检测算法和数据集之间的差异，可能会存在正负样本，难易样...
百分之一的碳阅读 3,020评论 0赞 1
0-5 样本不均衡、特征不均衡、样本缺失三个问题
本分析基于GBDT系的算法和个人信用模型 1. 样本不均衡（标签不均衡） 1.1 问题描述假设x∈Rn，y∈{0...
迪丽娜扎阅读 13,784评论 0赞 10
缓解多分类的样本不均衡问题
利用深度学习做多分类在工业或是在科研环境中都是常见的任务。在科研环境下，无论是NLP、CV或是TTS系列任务，数据...
行者AI阅读 2,054评论 0赞 1
机器学习超详细实践攻略(11)：三板斧干掉样本不均衡问题之1——过（欠）采样
想象一下，假如今天是你作为数据分析师入职的第一天，老板交给你一个数据分析任务：通过公司已经有的信用卡用户和交易信息...
东写西读1阅读 1,715评论 0赞 2

2赞3赞

手机看全文