通俗理解:MNN互近邻搜索算法校正scRNA-seq批次效应

MNN来源:Batch effects in single-cell RNA sequencing data are corrected by matching mutual nearest neighbors


我本人也是刚接触scRNA-seq,所以写的东西可能比较小白,还请大家多指导。最近阅读的一篇nb上的文章,写一点东西,一方面给自己,一方面大家一起交流,闷着肯定不行。

MNN,英文全称mutual nearest neighbor,互近邻,互就是互相的,近邻就是最近的邻居。这个MNN用在这里还是非常的贴切。MNN主要思想就是找到不同批次中相同的细胞类型,然后计算同种细胞类型的基因表达的差异,这部分东西就是当作批次效应了。文中提到的表达谱信息就是表达矩阵了,通常行为基因,列为细胞。

MNN主要实现步骤:


假如我们有两个批次:批次1(m个细胞)和批次2(n个细胞)的scRNA-seq的基因表达数据

(1)将不同批次的基因表达谱信息按细胞进行余弦标准化(cosine normalization);

(2)依次计算批次1中每个细胞B1i到批次2中所有细胞的欧式距离,其实际等同于表达数据标准化前的余弦距离。这样我们就得到m个向量存放欧式距离,每个向量里存放了n个欧式距离,再保存每个向量中ki个具有最小欧式距离的细胞对(nearest neighbor,NN)。比如批次1中细胞1,计算出n个欧式距离,里面有10个细胞具有最小欧式距离,我们就保存这10个细胞对(NNs)。再依次保存剩下的m-1个中具有最小欧式距离的细胞对(k1_1, k1_2, k1_3, k1_i..., k1_m)。k1_i表示每个欧式距离向量中具有最小的欧式距离的细胞对的数量。

(3)接下来,反过来对批次2,执行相同的步骤(2)。计算批次2中每个细胞到批次1中所有细胞的欧式距离,得到n个向量,每个向量里存放了m个欧式距离。然后,再保存每个欧式距离向量中具有最小欧式距离的细胞对(k2_1, k2_2, k2_3, k2_i, ..., k2_n)。k2_i表示具有最小的欧式距离的细胞对的数量。

(4)这样,我们比较这些配对的细胞,如果发现批次1和批次2中细胞互相配对的时候,那么,嘿嘿嘿,我们就保存这种细胞对,也称作互为邻接对(MNNs)。这种MNN的细胞,在本文中就被认为是同一类型的细胞了。

(5)利用MNN细胞对的表达信息,计算两两细胞间的基因表达差值,得到表达差异向量,也称为配对特异的批次效应校正向量(pair-specific batch convection vector)。同一种细胞,基因的表达模式应该相同或接近,那么这种表达差异向量就源于批次效应了。

(6)计算出来的所有的pair-specific 批次效应校正向量,利用高斯核函数,计算它们的加权平均数作为最后的批次效应校正向量,该向量就是唯一一个,长度为基因的个数。最后将其应用到批次2的所有细胞(不管属不属于MNNs的细胞)中进行批次效应的校正。



最后附上文章的示意图。


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容

  • 单细胞测序有着漫长的过去,却只有短暂的历史---谁说的! 说她漫长是因为到如今也有十几年的历史了,说她段短暂是因为...
    周运来就是我阅读 56,642评论 45 123
  • 不知从什么时候开始,我们过起了各种各样的节日,中国的、外国的,没有一个节日是我们不想过的,为什么,因为我们是女生,...
    团子的仙人球阅读 172评论 0 0
  • 残落的影追随月光的美 裙子摆动的纱遮羞缺月 修长的睫毛盖着微眯的眼 殊不知躲下的泪水 早阳的闯入害得窗关上帘 刺透...
    落夜随凝阅读 260评论 2 9