单细胞-基于核方法的相似性学习
S表示相似度矩阵,L为对$S \in R^{N \times C}$进行低秩约束的辅助矩阵,N为单细胞个数,C为单细胞类别数量。优化模型(2)的第一项表示,如果两个单细胞的距离大,两者对应的相似性则要小;第二项为正则项,防止得到一个S的平凡解,即单位矩阵;如果,这些单细胞有C个子类,那么它们同属一个之类的单细胞应该具有较高的相似度,(ideally the effective rank of S should be C,也就是block matrix, 同一个block的取值差别不会太大,最好的状况就是全取1),因而模型的第三项以及对L的约束保证了S具有底秩结构。