t-SNE是一种降维后可视化算法,但降维后的数据是无法放入模型中的,仅仅是起到肉眼评估作用。
PCA的降维方式是线性的,而t-SEN的降维方式是非线性的。
t-SEN的距离是欧式距离,因此也无法避免高维诅咒。
首先,SEN对高维空间中距离相近的数据构建一个分布,同时对这些点在低维空间构建一个分布,使得这两个分布尽可能相似。SEN用高斯分布将距离转化为概率概率分布,t-SEN则是在低维空间映射一个t分布,因为t分布更加偏重长尾分布并且受异常值影响较小。
t-SNE是一种降维后可视化算法,但降维后的数据是无法放入模型中的,仅仅是起到肉眼评估作用。
PCA的降维方式是线性的,而t-SEN的降维方式是非线性的。
t-SEN的距离是欧式距离,因此也无法避免高维诅咒。
首先,SEN对高维空间中距离相近的数据构建一个分布,同时对这些点在低维空间构建一个分布,使得这两个分布尽可能相似。SEN用高斯分布将距离转化为概率概率分布,t-SEN则是在低维空间映射一个t分布,因为t分布更加偏重长尾分布并且受异常值影响较小。