本周最新文献速递20211121
一、精细解读文献 一
文献题目: COVID-19 genetic risk variants are associated with expression of multiple genes in diverse immune cell types
不想看英文题目: COVID-19 遗传风险位点与免疫细胞中多个基因的表达有关
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
研究意义: 遗传变异对基因表达的影响具有细胞类型特异性,目前 COVID-19 遗传风险位点对基因表达的研究基于 GTEx 数据,但 GTEx 组织具有细胞异质性,可能无法有效检测细胞类型特异性的变异位点。基于此,作者利用 DICE 数据库 13 种不同免疫细胞类型解析 COVID-19 遗传风险位点对基因表达的影响
结论:
- 纳入三种 COVID-19 GWAS summary数据:(A)严重的 COVID-19 疾病;(B)中度至重度 COVID-19 疾病;(C)被SARS-CoV-2 感染。在三种表型中达到显著的变异位点有 19 个;
- 整合 DICE 数据库的 eQTL 位点和 GWAS summary 数据进行共定位分析,发现了 5 个共定位的基因座(PP4> 0.5 且 PP4 / PP3 ≥5)、9个 COVID-19 相关的基因( eGenes);
- 共定位分析发现了 OAS1 与 COVID-19 风险基因座共定位,OAS1 编码寡聚腺苷酸合成酶,可降解 RNA 病毒并激活抗病毒反应;
- 通过全转录组关联分析(TWAS)同样支持 OAS1 与 COVID-19 相关: 在非经典型单核细胞( NCM )中 OAS1 表达降低与 COVID-19 疾病的严重程度相关;
- 为了进一步探索 OAS1 基因座中 COVID-19 风险变异位点的分子机制,作者对 DICE 所有免疫细胞类型和两种激活条件进行了 ATAC-seq 分析, 观察到与 COVID-19 相关的 OAS1 eQTL 位点富集在 H3K27ac 峰区域,推测其可能通过干扰维甲酸 X 受体 α (RXRα)的结合调控 OAS1 在 NCM 中特异性表达;
- 除了上面发现的 NCM 中 OAS1 的特异性表达,作者还发现 OAS1 / OAS3 / OAS2 基因座中的 COVID-19 风险位点也与 T 细胞亚群 OAS3 的表达降低有关以及 B 细胞中的 DTX1 特异性表达相关;
文章链接:
https://www.nature.com/articles/s41467-021-26888-3
公开的资料:
- dbGaP 登录号:phs001703.v4.p1
- 共定位分析、TWAS 分析和 GWAS 分析代码:https://github.com/vijaybioinfo
- ATAC-seq 和 HiChIP 数据分析的代码:https://github.com/ay-lab
二、精细解读文献 二
文献题目: Cis-regulatory architecture of human ESC-derived hypothalamic neuron differentiation aids in variant-to-gene mapping of relevant complex traits
不想看英文题目: 人类胚胎干细胞衍生的下丘脑神经元分化的顺式调节结构有助于解析疾病的发病机制
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
研究意义: 下丘脑通过行为和内分泌系统调节代谢稳态,其在控制体重和生殖时间等具有重要作用。了解下丘脑发育和功能的遗传调控可以深入了解疾病的发病机制。
结论:
- 从一名女性供体上收集了三个阶段的细胞:1) 0 天的胚胎干细胞(ESC);2)12天的下丘脑祖细胞(HPs);3)27天的下丘脑样神经元细胞 (HN)。并对它们进行RNA-seq、ATAC-seq、Capture C 测序;
- RNA-seq 和 ATAC-seq 显示 NKX2-1 启动子可及性与 NKX2-1 表达变化模式一致,在 HP 中高表达,在 ESC 和 HN 中低表达。随着 NKX2-1 表达降低,Capture C 检测到的相互作用变少;
- 通过基因表达特征鉴定不同时期特异表达基因,总共发现了 15,808 个基因在至少一个阶段( ESC 或 HP 或 HN)差异表达,根据分化过程中的表达模式变化可将这些基因分为 6 个簇,每个簇富集了与祖细胞增殖和神经元分化相关的生物过程;
- 为了将 HN 分化过程中的基因表达变化与染色质可及性以及构象相关联,作者使用 ATAC-seq 检测染色质开放区域 (OCR) ,发现 404,691 个 OCR 出现在至少一个时期中。根据位置和功能将 OCR 分为三大类:1)“启动子 OCRs”;2)“启动子相互作用区(PIR)-OCRs”;3)“非 PIR-OCR”,并把第一类和第二类归为顺式调控元件( cRE )。与 ESC 或 HN 相比,HP 中的 cRE 数量较少,此外还观察到表达越高的基因,与 cRE 相互作用就越多;
- 随后比较了三个阶段的染色质可及性,从 ESCs 到 HPs 产生 87,761 个差异可及区域(43,170 个更封闭;44,591 个更开放)。从 HPs 到 HNs 产生 48,522 个差异可及区域(33,642 个更封闭;14,880 个更开放)。说明 ESCs 分化为 HPs 的过程当中,开放染色质可及性区域增多,当 HPs 分化为 HN时,开放染色质可及性区域减少,这一规律在ATAC-seq 以及 Capture C 数据中均能观察到;
- 转录因子( TF ) 通过与特定的 DNA 序列(例如增强子和沉默子)结合调控基因表达,而局部染色质可及性是决定 TF 何时与 DNA 序列结合的关键因素,为了识别与下丘脑 cRE 结合的 TF,作者使用 PIQ 预测 TF 的结合位点。观察到与 ESC 或 HP 相比,在 HN 中检测到更多的结合位点。按家族对 TF 进行分组后,发现与 ESC 或 HP 相比,HN 中的 AP-1 家族结合位点更少,而这些 TF 在细胞发育早期调节细胞周期;
- 为了探究下丘脑控制的特征相关的遗传变异,作者使用分区连锁不平衡评分回归 (LDSR)评估 cRE 相关位点富集的特征,发现主要富集了 BMI、成年身高、初潮年龄 (AAM)、重度抑郁症 (MDD)、双相情感障碍、多种睡眠指标相关的表型;
- 对于 LDSR 检测到富集的性状,作者整合 ATAC-seq、Capture C 数据将 SNP 位点映射到基因中以探究影响性状的因果基因。对于不同的表型,检测到 ABCC8、BDNF 和PPARG 可能为 BMI 的因果基因,FEZF1 为 AAM 潜在的因果基因,此外有四个基因(BSN / FAM212A和FEZF1 / FEZF1-AS1)对 BMI、身高、AAM 和睡眠均有贡献;
- 联合 GTEx eQTL 鉴定的基因以及变异基因映射方法鉴定的基因可以提高 GWAS 因果基因的检测能力。例如 AAM 表型,GTEx显示有 13 个基因与 eQTL 共定位,变异基因映射方法则显示在这 13 个基因中,有两个基因[RPS26 (PP = 0.951) 和 SUOX (PP = 0.942)] 也为 AAM 的因果基因;
文章链接:
https://www.nature.com/articles/s41467-021-27001-4
公开的资料:
- ATAC-seq、Capture C 和 RNA-seq:GSE152098
三、其他文献推荐
下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);
文献题目: Single-cell transcriptomic characterization of a gastrulating human embryo
不想看英文题目: 人类原肠胚的单细胞转录组特征
杂志和影响因子: Nature (IF: 42.778; Q1)
文章链接:
https://www.nature.com/articles/s41586-021-04158-y
文献题目: Chromothripsis followed by circular recombination drives oncogene amplification in human cancer
不想看英文题目: 循环重组伴随染色体碎裂驱动人类癌症中的癌基因扩增
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
文章链接:
https://www.nature.com/articles/s41588-021-00951-7
文献题目: scPower accelerates and optimizes the design of multi-sample single cell transcriptomic studies
不想看英文题目: scPower 加速和优化多样本单细胞转录组研究的设计
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-021-26779-7
文献题目: The genetic architecture of DNA replication timing in human pluripotent stem cells
不想看英文题目: 人类多能干细胞 DNA 复制时间的遗传结构
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-021-27115-9
文献题目: A selection pressure landscape for 870 human polygenic traits
不想看英文题目: 870 个人类多基因性状的选择压力图谱
杂志和影响因子: Nat Hum Behav (IF: 13.66; Q1)
文章链接:
https://pubmed.ncbi.nlm.nih.gov/34782732/
四、工具或资源类介绍
文献题目: DISCO: a database of Deeply Integrated human Single-Cell Omics data
不想看英文题目: DISCO:深度集成的人类单细胞组学数据库
杂志和影响因子: Nucleic Acids Res (IF: 16.97; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1020/6430491
文献题目: ProteomicsDB: toward a FAIR open-source resource for life-science research
不想看英文题目: ProteomicsDB:面向生命科学研究的开源数据库
杂志和影响因子: Nucleic Acids Res (IF: 16.97; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1026/6430496
文献题目: UFold: fast and accurate RNA secondary structure prediction with deep learning
不想看英文题目: UFold:通过深度学习快速准确预测 RNA 二级结构
杂志和影响因子: Nucleic Acids Res (IF: 16.97; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1074/6430845
文献题目: TF-Marker: a comprehensive manually curated database for transcription factors and related markers in specific cell and tissue types in human
不想看英文题目: TF-Marker:人类特定细胞和组织类型中转录因子和相关markers的数据库
杂志和影响因子: Nucleic Acids Res (IF: 16.97; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1114/6431821
文献题目: m5C-Atlas: a comprehensive database for decoding and annotating the 5-methylcytosine (m5C) epitranscriptome
不想看英文题目: m5C-Atlas:用于解码和注释 5-甲基胞嘧啶 (m5C) 表观转录组的综合数据库
杂志和影响因子: Nucleic Acids Res (IF: 16.97; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1075/6431823
致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感谢小可爱们多年来的陪伴, 我与你们一起成长~