2020/5/25 今天给大家带来一篇Cell 2019年的文章 "Intra- and Inter-cellular Rewiring of the Human Colon during Ulcerative Colitis" 的全文翻译,后续我会复现全文并公开代码,欢迎关注!
重要缩写:
(1)DE gene:differentially expressed gene,差异表达基因
(2)CAFs:cancer-associated fibroblasts,癌症相关成纤维细胞
(3)IAFs:inflammation-associated fibroblasts,炎症相关成纤维细胞
(4)Mcell:Microfold (M) cells,微折叠样细胞
(5)CRC:结直肠癌
(6)UC:Ulcerative Colitis,溃疡性结肠炎
Intra- and Inter-cellular Rewiring of the Human Colon during Ulcerative Colitis
人类结肠在溃疡性结肠炎期间出现了细胞内与细胞间的重构
全文逻辑结构:
1. 绘制结肠组织的单细胞表达谱
2. 细胞亚群鉴定,介绍有意义的新的功能细胞亚群
3. 与健康组织相比,疾病期间结肠组织的细胞亚群比例的改变以及特有细胞亚群的出现
4. 细胞亚群在不同疾病状态(健康、非炎症、炎症)下表达谱的改变(主要是上皮、免疫细胞群的改变)
5. 分析UC患者介导抗TNF治疗的细胞亚群的种类和抗药性机制
6. 通过分析细胞间相互作用网络,发现随疾病状态改变,细胞亚群的区室化作用如何改变
7. 利用配-受体关系,建立预测模型预测细胞亚群数量关系
亮点:
①分析19名溃疡性结肠炎(UC)患者和12名健康人结肠粘膜中近37万个单细胞转录组,鉴定出51种细胞亚群,主要是上皮、基质和免疫细胞;
②M样细胞、炎性单核细胞、炎性成纤维细胞(IAF)、CD8+IL-17+T细胞,在UC中增多,是细胞间互作的核心;
③炎性单核细胞和IAF可能分别通过表达抑瘤素M(OSM)及其受体,介导抗TNF治疗的耐药性;
④许多UC风险基因具有细胞类型特异性,根据基因共表达情况,可将过半数的风险基因归于10个模块(基因调控通路);
⑤基因在细胞内的共表达允许推断风险基因之间的潜在的因果性基因。
摘要:全基因组关联研究(GWAS)已经发现了溃疡性结肠炎(UC)的风险等位基因。为了解它们的细胞类型特异性和作用途径,我们从18个UC患者和12个健康人的结肠粘膜中获取了366,650个细胞的图集,揭示51种细胞,主要分上皮细胞、基质细胞和免疫细胞三大类,包括BEST4 +肠上皮细胞,微折叠样细胞和IL13RA2 + IL11 +炎性成纤维细胞,这与抗TNF治疗的抗药性相关。共表达CD8 and IL-17的IAF、炎症单核细胞、微折叠样细胞和T细胞随着疾病的发展而扩增,形成细胞间相互作用的枢纽。许多UC风险基因是细胞类型特异性的,并且受到相对较少的基因调控通路的共同调控。在这些观察的基础上,我们提名并推断了GWAS基因座中特定风险基因的功能。这项工作不仅鉴定出在炎症性肠病(IBD)这个疾病模型中一些已知的风险基因在不同细胞类型和信号通路的分布,同时为今后利用单细胞测序技术去寻找疾病的成因以及治疗方法提供了一个很好的技术框架。
关键词:炎症性肠病;溃疡性结肠炎;炎症;抗TNF抵抗;大肠;结肠;单细胞RNA-seq;单细胞基因组学;细胞间相互作用;全基因组关联研究.
1. Introduction
组织通过多种上皮细胞、免疫细胞和基质细胞的协同作用发挥功能。由于原发的细胞功能障碍或其他试图重建体内稳态的细胞的代偿作用,任何区室的破坏都可能导致疾病。这种相互作用关系可能使人们很难确定疾病基础的因果机制。在结肠粘膜的特殊情况下,破坏会导致溃疡性结肠炎(UC)发生,这是一种炎症性肠病(IBD)。
已知的疾病风险等位基因突出了IBD发病机理的关键通路,包括先天性的和适应的免疫,即肠道屏障功能以及病原体感知和反应。然而,潜在的风险位点的基因尚未被对应到其细胞亚群和作用路径。此外,尽管内镜检查后的组织病理学分析是当前的护理标准,但它未能捕获到疾病的精细细节,例如细胞比例、特定细胞类型的表达、细胞间的相互作用,并且不能区分慢性炎症和疾病的恢复。
单细胞RNA测序 (scRNA-seq) 通过全面绘制组织中的细胞类型和状态,从细胞频率的变化中解开(溃疡性结肠炎期间的)基因程序表达的变化,并通过细胞间相互作用(细胞微环境)连接细胞频率的变化和基因程序表达的变化,从而帮助促进我们对人类疾病的理解。在这里,我们将单细胞RNA测序应用在UC上,使用从健康人和溃疡性结肠炎患者中收集的活检肠道样本生成和查询健康和患病结肠的单细胞图谱。
2. Results
2.1 scRNA-Seq Atlas of Colon Biopsies from Healthy Individuals and UC Patients
我们从18名治疗方案各异的UC患者和12名健康人的结肠镜检查中获取了68份活检样本(每份~2.4mm2),进而获得了366,650个高质量的单细胞转录组 (Figure 1A; STAR Methods; Table S1)。我们分两个阶段进行了研究:从7例UCC患者和10例健康人身上收集到的34例结肠活检样本及相应的115,517例单细胞谱作为训练集(Figure 1A; STAR Methods; Table S1),从另外的11例UC患者和2例健康人身上收集到的34例结肠活检样本及相应的251,133例单细胞谱作为测试集。
为研究健康粘膜和发炎粘膜的过渡,同时减少患者个体特异性的变异,我们收集了每名受试者的配对样本。对于UC患者,配对样本是指内窥镜下评估为邻近正常组织的(非发炎)组织和发炎或溃疡的组织(发炎)(Figure 1A; STAR Methods)。为了估计这种变异,我们从12名健康受试者以及3名UC患者的非发炎和发炎区域分别获得了两个位置匹配的样本(距离约为1-2 cm)。然后,我们从每个样本中分离出“上皮”(EPI)和“固有层”(LP)成分,并进行了scRNA-seq(STAR Methods)。我们证实,炎症相关基因集的表达在健康样本、非发炎样本和发炎样本间逐渐增加(Figure 1B)。
2.2 A Comprehensive Census of 51 Cell Subsets and Their Molecular Signatures
51个细胞亚群及其分子特征的全面普查
经过scRNA-seq,单细胞测序图谱通过聚类将所有的细胞划分为51个细胞亚群(图1C,经过技术和生物变异校正后;STAR方法),并用已知的Markers进行了标注(图1D)。我们聚类的细胞亚群的结果是鲁棒的且具有可重复性的,这是因为几乎所有的细胞亚群都由全部的样本所代表(图1E),并且各种细胞亚群的细胞数按比例分布在患者个体之间(Figures S1A and S1B)。发现队列和验证队列是高度一致的(图S1B-S1D),从相同疾病状态下的相同甚至不同个体收集的重复数据也是如此(图S1E;STAR方法)。
这51个子集包括15个上皮细胞亚群,沿着从肠道干细胞(ISC)到成熟细胞命运的分化轨迹排序(Haber等人,2017年 ; 图1 F; STAR方法)。除此之外,还包括8个成纤维细胞,4个内皮细胞,1个神经胶质细胞,7个髓样细胞,4个B细胞,10个T细胞(CD4 +传统T辅助细胞[Tconv ],调节性T [T reg ],CD8 +和γδ) ,1个先天淋巴样细胞(ILC)和1个自然杀伤(NK)细胞亚群(图1 C)。缺少的细胞类型包括粘膜下肠神经元,需要通过单核RNA-seq进行分离(Habib等人,2016),浆细胞样树突状细胞(DC)和中性粒细胞(Schelker等,2017)。每个亚群都有已知和新颖的markers(图1 D;表S2)支持,包括转录因子(TF),G蛋白偶联受体(GPCR)和细胞因子(图S2 A–S2C;表S3)。在大多数样本的单细胞测序聚类下,试图在已有的51种细胞亚群下进一步聚类为更少的群组的尝试不会成功。例外情况包括,免疫球蛋白A(IgA)和IgG浆细胞,以及共表达TN FRS F4/OX40和RSF18/GITR的Treg细胞,Treg细胞的共表达可能反映活化的Treg细胞与静止的Treg细胞。
2.3 Characterization of BEST4+ Epithelial Cells and RSPO3+ Fibroblasts in the Healthy Colon
健康结肠中BEST4 +上皮细胞和RSPO3 +成纤维细胞的表征
我们的全面调查显示,表达BEST4的肠上皮细胞不同于其他上皮细胞(Parikh等,2019),富含与pH感应和电解质平衡有关的基因(原位验证;图1 G,1H和S1D)。基因包括了Otopetrins 2和Otopetrins3 (OTOP2/3),这些质子通道可检测pH值并构成酸味感知的基础(Tu等人,2018年); 碳酸酐酶VII(CA7),可催化碳酸氢盐的形成;和Bestrophin-4(BEST4),它们可能排出碳酸氢盐(Qu和Hartzell,2008)。BEST4 +肠上皮细胞约占两名克罗恩病(CD)患者回肠上皮的1%(11,473个细胞;数据未显示)。
多个成纤维细胞亚群因WNT/骨形态发生蛋白(BMP)信号基因的表达而不同,可能反映了沿隐窝-绒毛轴的不同位置(Powell等人,2011 ; Shoshkes-Carmel等人,2018)。一些富含WNT2B,WNT4和DKK3,表明它们位于隐窝附近,而另一些富含BMP4,BMP5和WNT5A / B并可能靠近绒毛(图1 I)。据报道,这些基因中有许多是上皮下上皮细胞的标志物,上皮下的上皮细胞是支持上皮的罕见成纤维细胞群体(Shoshkes-Carmel等人,2018); 但是,在我们的数据中,这些基因表达产物广泛分布在所有细胞亚群中(例如FOXL1,DKK3和WNT5B;图1 I)。
表达WNT2B +的成纤维细胞的一个亚群可能通过与ISC受体LGR5相互作用的R-spondin-3(原位验证,图1 G-1I)表达来支持ISC生态位(de Lau等,2011)。RSPO3 +成纤维细胞表达其他WNT / BMP信号基因和几种不同的趋化因子(图1 G和1I),这些因子可能将免疫细胞募集到ISC生态位(Biton等人,2018年)。它们还富含预测结直肠癌(CRC)预后不良的基因(Calon等人,2015年),并可能通过促进干细胞样微环境来支持肿瘤生长(图S5A)。
2.4 Remodeling of the Colon’s Cellular Composition during Disease
疾病期间结肠细胞组成的重塑
通过使用考虑成分依赖关系的多变量测试(图2 A)和单变量测试(图S3 A和S3B;STAR方法),发现在非发炎或发炎样本中,许多细胞亚群的比例与健康对照组相比差异显着。例如肥大细胞(King等,1992),CD8 + IL-17 + T细胞(Tom等,2016)和Treg细胞(Holmén等人,2006。 ; 图2 A,S3 A,和S3B)比例的增加。
微褶(M)细胞通常与人小肠的淋巴样组织相关,在这里,它们对于识别肠道菌群很重要(Mabbott等,2013)。在结肠中,在健康个体中很少发现M样细胞,但在炎症过程中扩增了17倍(原位验证;图S3 A和S3D)。它们高度表达几种趋化因子(例如,CCL20和CCL23;图1 G),表明参与了将免疫细胞募集到炎症部位的进程。
粘液层缺陷(Xavier和Podolsky,2007年)无法通过表达的变化来解释,表明它们可能在转录后出现。尽管杯状细胞的频率没有变化,但杯状细胞祖细胞在炎症过程中减少了,既是离散的细胞亚群(图2 A),又是分化的连续体(图1 F和2 D;STAR方法)。
尽管免疫细胞的总数随疾病而增加(Danese和Fiocchi,2011年),但在B细胞谱系内,从浆细胞向滤泡(FO)细胞转移(原位验证;图2 A和2B)。在浆细胞中,相对于IgG+细胞,IgA +细胞频率降低(图S3 C),这表明炎症与免疫球蛋白类别转换有关(Scott等,1986)。
2.5 An Inflammation-Associated Fibroblast Subset Is Unique to the UC Colon
炎症相关的成纤维细胞IAF亚群是UC结肠所特有的
虽然大多数成纤维细胞亚群均存在于健康个体和UC患者中,一种被称为炎症相关成纤维细胞(IAFS)的亚群的细胞数在部分患者发炎组织中扩增了189倍(>固有层细胞数的1%,原位验证, 图2A和图2C)。IAFs在许多与结肠炎、纤维化和癌症相关的基因上活跃表达,包括 IL11, IL24, and IL13RA2 (Figure 1G). 白细胞介素-11 (IL-11)是小鼠和潜在的人类纤维化的调节剂(Schafer等人,2017)。IAFs包括了WNT2B+ and WNT5B+亚群(图S3E),表明它们可能沿隐窝-绒毛轴反映了不同的状态。
IAF表达与癌症相关的成纤维细胞(CAF)的标志物,包括FAP,TWIST1和WNT2。 IAF标记物的表达水平与414个二代测序的RNA-seq 大肠癌样本之间的相关性高于对照(Cancer Genome Atlas, 2012; Figure S5B; Spearman’s ρ = 0.67),这表明IAFs在肿瘤中的扩展Figure S5B。
二、炎症与非炎症组织的表达谱变化
2.6 Most Expression Changes during Disease Are Shared by Non-Inflamed and Inflamed Tissue
疾病过程中大多数表达变化是由非炎症和炎症组织共同分担的
为了确定与疾病相关的表达变化,我们将表达建模为反映1细胞亚群,2疾病状态(健康,非发炎或发炎)和,3校正环境RNA污染的技术协变量的总和。我们区分了上皮,先天或适应性区室中跨细胞亚群共享的变化 (Figures 3A–3C and S4A–S4C, Table S4) 与每个亚群所独有的变化(Figures 3D–3F and S4D–S4F; Table S4; STAR Methods)。
内窥镜评估下的未发炎和发炎的组织具有相似的差异表达(DE)基因特征(Figure 3G; Table S4),表明UC的转录特征在发炎之前或在消退后持续存在。在整个上皮细胞中,DE基因反映了通过激活先天免疫力来恢复体内稳态的尝试(例如抗微生物和抗氧化防御途径,粘蛋白生物合成以及主要组织相容性复合物(MHC)II类机制)(validatedin situ; Figures 3A, 3D, and 3H; Biton et al., 2018, McDonald and Jewell, 1987)。在基质内,成纤维细胞诱导炎症,纤维化和组织修复的基因,而内皮细胞的变化支持组织血管形成(Figures 3B and 3E).。在免疫细胞中,髓样和T细胞激活了共刺激和共抑制基因,而B细胞上调了IgG类转换(上文中,相对于IgG+细胞,IgA +细胞频率降低)和亲和力成熟的基因(Figures 3C and 3F)。
2.7 Concerted Metabolic Shifts in Epithelial Cells during Inflammation
炎症过程中上皮细胞的协同代谢变化
比较未发炎和发炎的UC组织(Figures S4A–S4F; Table S4),可以发现伴随着发炎而来的一些上皮细胞的代谢改变。例如,嘌呤代谢的改变(例如XDH和URAD)可能会产生尿酸,与上皮损害相关 (Chiaro et al., 2017)。上皮细胞诱导犬尿氨酸途径 (Figure 4A),与疾病严重程度有关(Sofia et al., 2018)。犬尿酸受体GPR35是一个推定的风险基因(Huang et al., 2017)。
在炎症过程中对239个KEGG通路的变化作图(Figures 4B and S5C; STAR Methods)揭示了肠上皮细胞的其他代谢变化,包括从氧化磷酸化到糖酵解的转变,精氨酸生物合成酶的诱导(例如,NOS2和ASS1),以及用于降解支链氨基酸的酶的下调,尤其是AUH(一种推定的风险基因)(Liu等,2015)。肠上皮细胞还诱导了HIF1途径,这是单核细胞糖酵解转变的一个原因(Kelly和O'Neill,2015年)。这些变化可能是由于肠道细菌短链脂肪酸生产受损所致(den Besten et al.,2013),因为上皮细胞下调了β-氧化途径以及丁酸和丙酸的代谢途径,但上调了膳食脂肪酸的途径(例如,α-亚油酸)。
2.8 Induction of a Pro-Inflammatory IL-17 Response and Immune Checkpoints in T Cell Subsets
T细胞亚群中诱导促炎性IL-17反应和免疫检查点
在T细胞中,几个CD4 +亚群上调了IL17A(图4 C),可能反映了IL17A表达的每细胞增长以及Th17细胞的扩增。出乎意料的是,在两种疾病状态下(炎症和非炎症),CD8 +亚群对IL17A的诱导最强(图4 C-4E)。原位分析揭示这两个CD4 -和CD4 +细胞共表达CD8和IL17A(图4 d和4E)。尽管CD8 + IL-17 +T细胞已经被报道了(Cortez等人,2014,Srenathan等人,2016),CD4+ CD8 + IL-17 + T细胞在很大程度上未表征。这些细胞还激活了小鼠Th17致病性相关的细胞毒性程序和基因(例如RBPJ和IL23R;图3 F和4 C;Gaublomme等人,2015),这可能会加剧组织损伤。T细胞的大多数亚群诱导了共刺激和共抑制程序(图4 C),与抑制免疫激活的尝试一致(Attanasio和Wherry,2016)。
三、耐药性
2.9 TNF Expression Shifts to Treg, FO B, and CD8+IL-17+ T Cells during Inflammation
炎症期间TNF表达转移至T reg,FO B和CD8 + IL-17 + T细胞(耐药性)
单克隆抗TNF抗体是IBD的突破性疗法,但是30%的IBD患者无反应,并且许多人获得了耐药性(Rutgeerts等,2004)。肿瘤坏死因子(TNF)的表达在UC期间发生了变化,Treg细胞成为TNF表达的关键角色。在CD8 + LP和活化的CD4 + Fos hi T细胞中,每细胞TNF的基线表达最高,但在发炎的组织中,TNF在Treg和FO B细胞中被诱导(原位验证;图5 B和S5 D)。当估算由每个细胞亚群表达的TNF总量时(图5 A)T reg细胞,在健康组织中占TNF表达的1%,但在炎症过程中占14%以上(仅次于活化的CD4 + T细胞)。
2.10 IAFs and Inflammatory Monocytes Are Associated with Resistance to Anti-TNF Therapy
IAF和炎性单核细胞与抗TNF治疗的耐药性相关
IAF中表达最活跃的基因之一是推定的风险基因OSMR(Liu等人,2015),以及预测抗TNF反应的细胞因子抑瘤素 M(OSM)的受体(West等人,2017)。OSM和OSMR过去被认为分别由未知的髓样和基质细胞表达(West等,2017)。OSM最富于炎性单核细胞和DC2,而OSMR最富于IAF(原位验证;图5C)。伴随着炎症过程中这些亚群的扩增,上述发现使我们假设结肠的细胞重塑可能部分解释了OSM与耐药性之间的关系。
因此,基于对60位有反应者和57位无反应者对治疗的bulk表达数据的荟萃分析(Wang等人,2016年 ; STAR方法),我们对各个细胞亚群的抗TNF的耐药性和敏感性的基因信号进行了评分。药物抗性信号在IAF、炎性单核细胞和DC2细胞中大量富集(图5 D和5E),而在上皮细胞中则具有药物敏感性信号(图5 D)。与耐药性最相关的三个基因IL13RA2,TNFRSF11B和IL11是 IAF的marker,在其他细胞中很少表达(图5E)。一项逆向分析使用IAF基因信号,推断了来自20个药物反应者和27个非反应者的治疗前的IAF的整体(bulk)表达数据水平(图5 F; STAR方法),证实了IAFs丰富的患者会对抗TNF治疗产生抵抗。因此,IAF可能与West等(2017)报道的OSM介导的抗性有关。
潜在的耐药机制是OSM与TNF协同作用(West等,2017)或表型复制。为了检验这些假设,我们研究了跨细胞亚群的TNF与OSM信号之间的关系。签名在细胞亚群之间紧密相关(即使在删除共享基因后也是如此),并且两者均与耐药性签名相关(图5 G)。这表明OSM表型为TNF,激活了IAF中的下游靶标。因此,IAF和炎性单核细胞可能会在TNF阻滞期间补偿,从而导致耐药性。
2.11 Rewiring of Cell-Cell Interactions via Inflammation-Associated Cell Subsets during Disease
疾病期间基于炎症相关细胞亚群的细胞间相互作用的重构
为了更普遍地描述结肠炎期间细胞与细胞相互作用的重塑,我们将受体-配体对(Ramilowski等,2015)映射到细胞亚群上,以构建跨疾病状态的假定的细胞-细胞相互作用网络(图6 A-6C),识别出细胞亚群对对具有比空模型明显更多的受体-配体连接(STAR方法)。
健康的相互作用描绘了不同的细胞区室(图6 A),而疾病期间的DE基因靶向谱系间的串扰和减少的区室化(图6 B和6C),其中UC相关的细胞亚群充当关键网络中心(图6 D)。在健康的粘膜中,相互作用在很大程度上反映了肠道稳态(例如,DC1细胞和T细胞;图6 A; p <0.05)。相反,上皮细胞与成纤维细胞和T细胞之间的非炎症相互作用更为丰富(图6 B;所有p <10 -4),而炎症组织显示B细胞、T细胞、巨噬细胞和CD8 + IL-17 +T细胞之间相互作用的重新连接(图6 C;所有p <10 -4)。UC相关亚群(例如M样细胞,IAF和炎性单核细胞)是网络中最中心的节点(图6 D),表明它们在不同细胞亚群之间介导信号。
2.12 Cell-Cell Interactions Predict the Infiltration, Proliferation, and Differentiation of Cell Subsets during Inflammation
细胞间相互作用预测炎症过程中细胞亚群的浸润,增殖和分化
我们假设细胞亚群比例的变化可以用其他细胞表达的细胞-细胞相互作用基因的变化来解释。为了测试这一点,我们查询了所有细胞亚群对,对于每个受体-配体对,检查样品中一个细胞亚群中配体的表达水平是否与样品中表达其受体的细胞亚群的比例(包括自分泌相互作用)相关。该分析发现了数百种重要的相互作用(图6 E;表S5;STAR方法)。
例如,炎症过程中肠上皮细胞对IL18的上调与表达其受体IL18R1的T reg细胞比例增加相关(图6 E; Spearman’s ρ= 0.68)。在小鼠中,IL-18既抑制Th17分化,又允许T reg细胞介导的肠道炎症控制(Harrison等,2015)。但是,上皮细胞在将Treg细胞募集到结肠中的作用尚不清楚。表达IL22RA1的肠上皮细胞的频率与调节肠再生的IL22的CD4 +激活的Foshi T细胞的表达相关(Pelczar等人,2016 ; 图6 E; Spearman的p = 0.55)。我们在人类结肠球体培养中验证了这种相互作用,其中与IL-22的孵育诱导了表达程序,该表达程序与ISC相比在肠细胞中显着丰富(图S6 A; p <10 -10;Wilcoxon测试)。
其他因素会促进免疫细胞的募集(例如CXCL12促进B细胞)和基质细胞的扩增(例如PDGFD对于周皮细胞;OSM对于IAF),或者是可能调节细胞存活,增殖或死亡的自分泌信号(例如MST1对BEST4 +肠上皮细胞;TNFSF10对毛细血管后小静脉)(图6 E)。最后,我们开发了最小绝对收缩和选择算子(LASSO)回归模型,以识别跨越多种细胞亚群的数目关系(图6 F,6G,S6 B和S6C;STAR方法)。例如,CD8 + IL-17+ T细胞的比例由上皮细胞,T细胞,成纤维细胞和神经胶质的自分泌和旁分泌相互作用共同解释(图6 F)。
2.13 Many IBD Risk Genes Are Cell Type or Lineage Specific and Differentially Expressed in Disease
许多IBD风险基因是细胞类型或谱系特异性的,并且在疾病中差异表达
为了使用scRNA-seq询问IBD遗传学,我们研究了跨越346个候选风险基因的151个IBD和UC风险位点(STAR方法)。对于大多数基因座,关联信号背后的基因是未知的。但是,在某些情况下,可能暗示单个基因,因为它包含精细映射或非同义的编码变体,或被解析为没有其他基因的连锁不平衡区域。使用这种方法,我们编制了一组57个与GWAS相关的风险基因,这些基因很可能与IBD因果相关(表S6;STAR方法)。
将这57个与GWAS相关的风险基因定位到我们的图集上, 揭示了在疾病期间,29个风险基因富集在特定谱系(图7A),36个风险基因显著DE(图 S7A和S7B)。除了已知的关联(例如,NKX2-3在微血管细胞富集表达和HNF4A在肠上皮细胞富集表达)(Stegmann et al., 2006, Wang et al., 2000),我们发现了几个新的关系(表S6)。例如,intelectin 1(ITLN1),一种脂筏蛋白,定位于上皮刷状缘(Wrackmeyer等,2006),在不成熟的杯状细胞中富集。一些细胞亚群被富集用于表达几个GWAS相关的风险基因(图7 B)。值得注意的是,M样细胞以比其他细胞更高的水平表达许多风险基因(例如,NR5A2,CCL20和JAK2;图7A;表S6),表明M样细胞功能障碍可能在疾病中起重要作用。
2.14 Co-variation of Gene Expression within a Cell Type Helps Predict Functions for IBD Risk Genes
同一细胞类型内基因表达的共改变有助于预测IBD风险基因的功能
我们假设相同亚组的单个细胞之间基因表达的变化可以使我们推断IBD风险基因的功能。过去的方法通常在整个组织样本中使用“guilt by association”,但无法区分表达的变化和细胞比例的变化。相比之下,我们测量了细胞亚群内单个细胞之间基因的共变,从而使我们能够分离出这些细胞中的共同调控过程(Tanay和Regev,2017年 ; STAR方法)。
通过这种方式,我们为所有表达的细胞亚群中的57个GWAS涉及的IBD风险基因构建了基因模块,并用推定功能对其进行了注释(表S6;STAR方法)。例如,在健康的上皮细胞内,C1orf106模块富含紧密连接和粘附连接基因(分别为q <10 -6和10-2;Fisher精确检验)。我们最近表明C1orf106参与细胞-细胞连接(Mohanan等人,2018)。
2.15 Multiple IBD Risk Genes Co-localize in Shared Gene Modules, Revealing Key Pathways in IBD
多个IBD风险基因共定位于共享基因模块中,揭示了IBD中的关键途径
在许多情况下,多个推定的IBD风险基因是同一基因模块的成员,这使我们能够定义10个“元模块”,跨越GWAS涉及的IBD风险基因的50%以上,这可能反映了关键的疾病途径(经验q <0.05 ;图7 C;表S7;STAR方法)。例如,健康巨噬细胞中的PRKCB元模块包含5个其他风险基因(GPR65,ADCY7,PTGER4,PTPRC和SH2B3),并可通过循环AMP(cAMP)信号调节巨噬细胞的激活。另外,JAK2UC相关M样细胞中的元模块包含4个其他风险基因(CCL20,PTGER4,SH2B3和AHR),并可能调节M样细胞中的TNF信号传导。
2.16 Single-Cell Expression and Co-expression Help Nominate Causal Genes across GWAS Loci
单细胞表达和共表达有助于在GWAS基因座上提名因果基因
IBD风险基因的功能一致性表明,单细胞表达或共表达可以帮助查明与多个候选基因在基因座处缔合信号基础的基因。为此,我们确定了20个IBD和UC风险区域(每个区域都跨越一个以上的基因),其候选基因集包含GWAS牵连的风险基因,我们将其称为该区域的“正确”基因(STAR方法)。然后,对于每个这样的区域,我们测试(1)表达,(2)差异表达或(3)与其他候选基因(在基因座上迭代定义;STAR方法)共表达的程度是否可以恢复“正确”的风险相对于其中随机选择基因的无效模型的区域基因(STAR Methods)。无效模型具有33%的准确性,当我们选择在任何一种疾病状态下具有最大DE系数的基因时,准确性都不会提高(图7 D)。但是,当我们选择在任何细胞亚群中表达最高的基因(图7 D;准确度55%,经验值p = 0.03)或属于其他候选基因的最大模块(图7 D; 63%)时,我们的预测会大大改善。准确度,经验值p = 0.001)。对于CD基因座,没有任何方法能明显优于无效模型(图7 D),这表明UC和CD的独特风险基因在不同位置或仅在患病组织中有活性。
最后,我们使用这种共表达方法在所有IBD / UC风险基因座中提名了因果基因,其中包括56个驱动该关联的基因未知的基因(图7 E;表S7)。我们回收了许多已知的IBD和UC危险因素(例如HNF4A,IFIH1和GPR35),但未能识别其他危险因素(例如RNF186;图7 E),突出了我们方法的局限性(讨论)。此外,该分析对53个不在GWAS涉及的基因中的基因产生了预测,包括RORC,ITGAV和SMURF1(图7 E)。
Discussion
通过在临床环境中利用scRNA-seq,我们评估了肠道活检中特定细胞亚群中的细胞组成,基因表达,细胞间相互作用以及IBD风险基因途径。尽管区分成因和挑战具有挑战性,但将单细胞数据与临床反应(例如IAF),细胞-细胞相互作用(例如肠上皮细胞和T细胞)或风险基因表达(例如M样细胞)相关可以帮助告知疾病的病因学,并突出了治疗干预的新机会。
M样细胞在基线时很少被检测到,但在炎症过程中会扩展并在细胞-细胞相互作用网络中充当枢纽(图6D; S3A和S3D)。 这种扩张可能反映了第三级淋巴组织或前哨细胞(Mabbott等,2013)。 M样细胞具有GWAS风险基因的最高表达(图7A和7B),包括CCL20,其表达与样品中Treg细胞的频率相关(表S6)。他们具有最大的预测风险基因模块(表S7),富含内吞作用和Th17分化基因(q <10-3,Fisher精确检验),这可能反映了抗原的转胞吞作用和传递。
CD8 + IL-17 + T细胞和Treg从健康组织扩张到非发炎组织(图2A),并在炎症过程中分别成为IL-17(图4C)和TNF(图5A,B)的主要来源。前者可能有助于T细胞的致病性和组织损伤(图4D和4E; 66%共表达CD4)。 尽管后者可能采取了类似效应子的状态,但与TNF-Treg细胞相比,它们对Treg细胞标志物(例如FOXP3,CTLA4和IL10)的富集程度更高(数据未显示)。未来的工作将确定TNF + Treg细胞是否有助于疾病病理或抗TNF抵抗(Atreya et al。,2011),以及CD8 + T细胞可塑性在肠道炎症中的作用。
OSM信号传导通过未知的髓样和基质细胞类型参与抗TNF抵抗(West et al。,2017)。 在这里我们显示出炎性单核细胞和IAFs可能分别通过OSM和OSMR的表达介导耐药性(图5D)。 尤其是,IAF富含抗TNF无反应者的预处理样品(图5F)。 此外,我们确定OSM表型为TNF,这可以解释抗TNF的耐药性。 未来的工作将确定IAF是否是药物反应的有力生物标志物,或者将抗TNF药物与抑制IAF细胞因子和/或受体结合可以降低UC患者的抗TNF耐药性。
IAFs独特表达IL11,这是纤维化的潜在治疗靶点(Schafer et al。,2017),表明参与了肠纤维化。 因为它们表达了隐窝相关(WNT2B +)和绒毛相关(WNT5B +)标记(图1I和S3E),所以IAF可能反映了不同的成纤维细胞状态。 IAFs表达了几种CAF标记,并且IAF标记在CRC肿瘤中富集(图5S5B),表明有共同的起源和/或状态。 癌症相关炎症期间IAF的扩张可能会影响肿瘤的微环境。 最后,IAF和炎性单核细胞均在细胞-细胞相互作用网络中形成集线器,并可能影响其他细胞的比例(图6E;表S5)。
通过利用单细胞共表达,我们将超过50%的风险基因定位到10个元模块上(图7C),并使用这些元模块在各个基因座上提名因果风险基因(图7E)。但是,这种方法可能无法识别低表达,在未分析或未与其他风险基因共表达的细胞和/或组织中活跃的风险基因。 当多个风险基因作用于同一基因座时,它也可能失败。 但是,我们发现即使在对基因进行评分时,无论区域如何(而不是每个区域选择一个基因),它都能改善预测结果(图S7D; STAR方法)。 我们希望这些分析将为人类遗传学和单细胞基因组学的结合铺平道路,以便通过将风险基因模块与多基因风险评分相关联,将变体映射到单细胞表型以及将非编码变体映射到细胞来更好地了解多基因疾病。 单细胞等位基因特异性表达和表达定量性状基因座(eQTL)分析。
我们的工作为使用scRNA-seq了解人类疾病及其治疗反应提供了框架。 我们确定与疾病状态有关的细胞比例和基因表达的变化,并将其整合以了解细胞信号传导和药物敏感性的机制。 最后,我们在各个基因座上提名风险基因,预测它们的作用细胞和推定功能,并将它们组装到构成疾病基础的核心途径中。