在迁移学习中,一个热门的研究方向是领域自适应(Domain Adaptation)。在领域自适应的定义中,涉及到条件概率分布与边缘概率分布,先就其定义解释如下。
首先定义联合概率。假设有随机变量与,此时用于表示且的概率。这类包含多个条件且所有条件同时成立的概率称为联合概率。联合概率一览表被称为联合概率分布。
接下来定义边缘概率。边缘概率与联合概率相对应,当或,这类仅与单个随机变量有关的概率称为边缘概率。边缘概率一览表被称为边缘概率分布。
条件概率表示在条件成立的情况下,的概率,记作或。它具有如下性质:在条件下,穷举的可取值之后,所有这些值对应的概率之和为1,即:
联合概率、边缘概率、条件概率的关系如下:,以离散型概率分布为例,我们举出如图1所示的概率分布表来说明联合分布与边缘分布。
在迁移学习中,不同的学习方法可以通过特征空间的异同、类别空间的异同、条件概率分布的异同以及边缘概率分布的异同来区分(如图二所示)。根据《迁移学习简明手册》给出的领域自适应定义,假定源域和目标域的特征空间、类别空间以及条件概率分布均相同,但是这两个域的边缘分布不同,我们的目标是利用有标记的数据去学习分类器来预测目标域的标签。为了完成迁移学习,我们需要以度量为准则,通过我们所要采用的学习手段,来增大两个领域之间的相似性。因此我们需要定量度量两个领域的相似性,下文中将对度量领域相似性的经典方法(MMD)与其他在具体问题上的相似性度量方法进行介绍。
参考文献
1.https://en.wikipedia.org/wiki/Marginal_distribution