开门见山,直接上图
TCGA barcode 是TCGA项目中生物样本数据的主要标识符,接触过TCGA数据的人想必对这一串由数字、字母和短横线所组成的字符并不陌生,那么这一串数字的每一部分到底代表着什么呢?
接下来结合上下这两张图我们来看一下每一部分到底代表什么?
TSS
样本机构来源,大学或其他研究组织,详见 Tissue Source Site Codes。
BCR
BCR Batch Codes (BCR: Biospecimen Core Resource),有点像项目类型或者说癌症类型,一个编号对应一个项目类型的样本集。
Participant
项目参与者,指样本来源于该项目的哪个人,每个人都有唯一的编号,所以TCGA-xx-xxxx
就是代表病人水平的ID。取任何字母数字值。
Sample
代表样本组织来源类型,肿瘤类型为01-09,正常类型为10-19,对照组为20-29。有关示例代码的完整列表,请参见 Sample type。
Vial
应该是把样原始本分成了若干份,每份也都有编号。取 A 到 Z。
Portion
100-120毫克样品份的顺序,额。。可能又把每份样本又分为几份吧,之后就用于具体的测序了。取01-99。
Analyte
分析物,是分析DNA还是RNA等,详见 Portion / Analyte Codes。
Plate
96孔板序列中板的顺序。取4位字母数字值
Center
将接收等分样品进行分析的测序或表征中心,详见 Center Codes
觉得有用的老铁麻烦点个小爱心~😏