原文章为scikit-learn中"用户指南"-->"监督学习的第八节:Generalized Linear Models"######
交叉分解模型包含了两个主要的算法族:偏最小二乘法(PLS)和规范相关分析(CCA)。
这些算法族擅长于在两个多变量数据集之间寻找出他们的线性关系。其fit方法里的X和Y参数都是二维向量。
交叉分解算法寻找两个矩阵(X和Y)的基本关系。他们这种隐含的可变方法会尝试对这两个空间的协方差结构进行建模。会试图找出在X空间内解释Y空间中最大多维方差的多维方向。PLS-回归非常适用于预测结果的矩阵比观察值(输入)有着更多变量,并且X之间存在为多重共线性。相对地,对于这类情况,标准回归将会无法应对这类情况。
包含此模块的类有 PLSRegression PLSCanonical, CCA 和PLSSVD
引用
示例
(在尝试翻译这篇文档的时候难免会因为各种问题而出现错翻,如果发现的话,烦请指出,谢谢> <)