Li Y, Sun B, Feng S, et al. Stop Filtering: Multi-View Attribute-Enhanced Dialogue Learning[J]. arXiv preprint arXiv:2205.11206, 2022.
写在前面:这里只对两种Fusion方法进行记录。如果想了解两种全文内容,请移步https://arxiv.org/pdf/2205.11206.pdf
Two Multi-View Attributes Fusion
-
Pre-Training Base Model
这里Base Model作为前置模型,这里给出文本生成中的负对数目标函数:,最大化其对应的生成概率
。
-
Adaptive Fusion (AF)
是一个重要性的衡量,利用了输入和每个view-specific层的输出的
距离。该距离越大,越说明模型需要从对应的adapter中提取特征,以提高整体特征的质量。使用
的原因在于:其具有更高的计算效率,也有更高的辨别能力。AF可以使各个adapter之间保持独立,并且这种逐层融合会比集成学习更有效。
- Progressive Fusion (PF)
是新adapter的参数,
是之前的adapters的冻结参数,
是单词表的长度。对于训练一个新的adapter来说,是先前的生成损失和当前KD(用来量化数据中包含的信息)的叠加:
通俗意义上来讲,该适配器也适用于不同的多视图场景,但是不知道多视图的排列顺序会不会影响最终的容融合结果。
emmmm 第一种融合方式比较常见,第二种则以顺序的方式进行多视图的融合,相对来说在多视图融合任务中比较少见,因为多视图之间不存在顺序之说。 如果有问题请指正!