9-6

背景:

某个论坛的帖子评论分成positive和negative两种,你已经拿到了sample(影评)和label(评价)两个集合,现在你想知道:

词汇 --- 评价

之间的关系,即情感倾向词汇。

这时候很容易想到的方法是:计算某个词汇的positive/negative的比例,就可以知道词汇的情感倾向,而不需要借助情感词典,假设:ratio = positive/negative,很明显ratio是一个以1为中心的评价指标,ratio=1可以将词汇看成中性词汇。如下图抽取影评结果:


around 1


而你会发现后期的计算尝尝要求指标以0为中心的,像这样:


around 0

这时候怎么办呢,答案就是对数变换!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容