如何快速地从单细胞数据中观察HLA基因表达模式

在我们分析单细胞数据的时候,想要反映细胞每一个特征往往是选择这个特征对应的基因,所以一般想要讲故事先找基因集。今天,我们就来用正则表达式来匹配一类比较特殊的基因:HLA基因。

人类白细胞抗原(Human leukocyte antigen ,HLA),参与人体主要组织相容性复合体(,major histocompatibility complex,MHC)的众多抗原中的任何一种(能够刺激免疫反应的物质)。HLA基因编码的细胞表面蛋白质是MHC的一部分。HLA 是编码人类主要组织相容性复合体(MHC)蛋白的基因复合体,而MHC是脊椎动物获得性免疫系统识别外来分子所必需的一组细胞表面蛋白,这些蛋白决定了组织相容性。因此,这是HLA和MHC之间的根本区别。另外,HLA和MHC之间的主要区别是,HLA是出现在人类身上的MHC复合体形式,而MHC复合体出现在所有脊椎动物身上。

那他们的相似之处在哪呢?

  • HLA和MHC是发生在脊椎动物所有有核细胞中的两种表面抗原。
  • 它们的主要功能是将外来抗原呈现给T细胞。
  • HLA和MHC的三个基因家族分别为I、II和III。
  • 此外,这些抗原出现在脊椎动物的所有有核细胞中。

HLA(人类白细胞抗原)是一种存在于人类体内的MHC基因复合体。它由大约200个紧密排列在6号染色体上的基因组成。这些基因在所有有核细胞上都有表达。HLA分子的主要功能是将细胞内产生的抗原呈现在细胞表面,以便被T细胞识别。因此,T细胞可以在自身抗原上识别外来抗原,启动获得性免疫应答。另一方面,T细胞将抗原识别为自身可以决定组织相容性。但是,免疫系统将自身抗原识别为非自身抗原,导致自身免疫性疾病的发生。

HLA全长约3.6M, 含有220多种功能不同的基因,是目前已知的人类染色体中基因密度最高,多态性最为丰富的区域,同时也是人体固有免疫系统的重要组成部分,位置示意图如下:


Mining Clinical, Immunological, and Genetic Data of Solid Organ Transplantation

HLA是主要组织相容性复合体(MHC)的人类版本,一个发生在许多物种的基因组。在人类中,MHC复合体由位于6号染色体上紧密相连的200多个基因组成。这个复合体中的基因可分为三大类:第一类(class I)、第二类(class II)和第III类(class III)。

HLA复合体是人类基因组中最具多态性的基因座。HLA复合物主要有两类:一类包含HLA- a、HLA- b和HLA- c基因,另一类包含HLA- d基因。HLA- b是最具多态性的HLA- b基因,目前已识别出425个等位基因。HLA-DRB1基因识别出的等位基因为289个,HLA-A基因识别出的等位基因为214个。IPD-IMGT/HLA数据库包含了迄今为止所有已报道和命名的HLA等位基因序列。根据基本的遗传学原理,儿童从父母那里遗传HLA等位基因。

随着人们对HLA认识的深入,我们观察到人类主要的MHC I类基因,即HLA-A、HLA-B和HLA-C。由这些基因产生的蛋白质存在于几乎所有细胞的表面。在细胞表面,这些蛋白质与从细胞内输出的蛋白质片段(肽段)结合。MHC I类蛋白向免疫系统显示这些肽。如果免疫系统识别出这些多肽是外来的(如病毒或细菌的多肽),它就会通过触发受感染的细胞自毁来作出反应。

人类主要有6个MHC II类基因:HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DQB1、HLA-DRA和HLA-DRB1。MHC II类基因提供指令来制造几乎只存在于某些免疫系统细胞表面的蛋白质。像MHC I类蛋白质一样,这些蛋白质向免疫系统呈递多肽。


具体解释可以看:人类白细胞抗原-HLA简介

由MHC III类基因产生的蛋白质有不同的功能;它们参与炎症和其他免疫系统活动。一些MHC基因的功能尚不清楚。

组织相容性复杂基因有许多可能的变异,使每个人的免疫系统对各种各样的外来入侵者作出反应。一些组织相容性复杂基因有数百个已识别的版本(等位基因),每一个都有一个特定的数量(如HLA-B27)。密切相关的等位基因被分类在一起;例如,至少有40个非常相似的等位基因是HLA-B27的亚型。这些子类型被指定为HLA-B*2701到HLA-B*2743。

超过100种疾病与组织相容性复杂基因的不同等位基因有关。例如,HLA-B27等位基因会增加患一种叫做强直性脊柱炎的炎症性关节病的风险。许多其他疾病包括免疫功能异常和一些癌症也与特定的HLA等位基因有关。然而,组织相容性复杂基因在发生这些疾病的风险中所扮演的角色往往并不清楚。

那在我们单细胞转录组数据中如何观察HLA基因的表达呢?三行代码够不够?

还是请出被我们玩坏了的PBMC数据集。

library(Seurat)
library(SeuratData)
DotPlot(pbmc3k.final, features =grep("^HLA",rownames(pbmc3k.final),value = T) )+ myth

我们看到不同PBMC细胞类型中HLA表达模式是不同的,当然这个Identity可以在groupby中指定临床分类指标,如用药不用药。

其实了解了基因名的关系,这样的图我们可以做一个G,这就要求我们深谙基因集的关系。正则表达式你学会了吗?


人类白细胞抗原 (HLA) 系统
人类白细胞抗原-HLA简介
hla
what-is-the-difference-between-hla-and-mhc

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 207,248评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,681评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,443评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,475评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,458评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,185评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,451评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,112评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,609评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,083评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,163评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,803评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,357评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,357评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,590评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,636评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,925评论 2 344