事件抽取中应用小样本,即信息抽取的小样本应用。小样本的贡献定位是实现“多面智能体”。初入小样本,一通入门了解,做个笔记。
1、从"小样本"这个名词开始,小样本学习例子阐述:人类未见过澳大利亚的鸭嘴兽,给我们一张鸭嘴兽的图片后,人类就认识了。我们要通过机器学习实现这样的效果。
2、小样本学习是Mate learning在监督学习领域的应用,mate learning 又称为learning to learn.
3、接下来是对其他博客总结的元学习进行学习。
A、元学习,如何学习,这篇博客从元学习如何学习讲了一下元学习。
基于度量计算的方法:用5篇论文进行了阐述,第一篇论文2015 Convolutional Siamese Neural Network,one-shot 的度量计算;第二篇论文2016Matching Networks,one-shot 的度量计算,不同于第一篇的地方是度量计算公式复杂了些,利用注意力机制的权值进行相似类别的打分;第三篇2017原型网络,few-shot 的度量计算,第四篇Relation Networks2018,又回到了one-shot的度量计算,与之前方法不同的是度量计算是通过神经网路学习的一个更适合各类别进行度量的函数。第五篇
2019感知网络(Few-Shot Text Classification with Induction Network论文出自阿里小蜜),此篇论文解析不是出自此篇博客,而是出自另外一篇博客“小样本学习在文本分类中的应用”,此篇是few-shot的度量计算的论文,不同于先前的方法的地方是对于类的特征向量不再是简单的相加而是通过一个神经网络将其进行融合。
基于模型的方法:没有太认真关注着个反面,待后续....
基于优化的方法:一类是2017Mate learning,还有一类是LSTM Meta-Learner2017
4、还看了一个zero-shot learning 的综述介绍和一个小样本学习综述。对于这两个综述,看的是云里雾里。不知道有没有拨开云雾的那一天,待后续.....
小样本针对的问题是:样本少
小样本的贡献或亮点:快速应对未知新样本
小样本被关注:有了一定的可解释性。
所以不管基于什么的方法,测试过程和训练过程的类别不能重合,这才是小样本。
++===============================华丽的分割线=================================++
不知道大家有没有关注过事件抽取,不了解的想了解的可以看HERE。事件抽取任务和NER相似,所以使用了大量NER任务中成功的模型,如BiLSTM+softmax、BILSTM+CRF、BERT+softmax、BERT+CRF,基本都是序列标注的,最近尝试了一种新的方法也是《在百度AI Studio 2020语言与智能技术竞赛:事件抽取任务》中其他参赛选手使用过的,MRC阅读理解形式的序列标注方法。
深度学习算法模型进行样本的编码,后面跟一个Softmax进行分类,元学习度量计算式的方法通过计算相似度进行分类。分类的方式有很多,上述是两种方式。在元学习中怎样实现序列标注的learning to learn,2020年的ACL会议中出现了一篇小样本进行序列标注的实现,侯宇泰的《Few-shot SlotTagging with Collapsed Dependency Transfer and Label-enhanced Task-adaptiveProjection Network》,作者本人还对自己的论文进行了讲解从HERE进入视频观看
研究生毕业论文需要创新点,事件抽取任务应用小样本,创新的着力点有两个,一个是在小样本这种解决问题的方式进行创新,创新出一种新形势的Learning to learn。另外一个着力点是立足本方向,在现有的小样本学习方法中怎样契合的应用于事件抽取。