来自中国农大孙东晓教授的报告(2021/12/6),题目:“基于多组学鉴定奶牛生产性状关键基因及育种应用”。 其对中国农大在奶牛育种中十几年的工作,进行了非常好的总结和介绍。
提纲:
第一部分: 采用多组学策略鉴定奶牛产奶性状关键基因
第二部分:成功案例:EEF1D基因的发现与功能验证
第三部分:功能基因的创新应用:育种芯片研发
全部工作思路及其工作的主要方法
第一部分: 采用多组学策略鉴定奶牛产奶性状关键基因
(一)GWAS工作
1. 奶牛产奶性状的GWAS
产奶量,脂肪率等
我国最早在2010发表:
数据和方法(两种):
找出对应及其附近基因(注意DGAT1和GHR)
与牛的QTLdb(5cM)进行overlap,
做了8个组织的基因表达。
2. 牛奶脂肪酸的GWAS
又增加丹麦的数据
3. 初乳IgG的GWAS
出生48小时进行的初乳和血液采样。
4. 全基因组重测序
2014年完成,选用经过后裔测定的8头种牛,四个同胞,但是8头牛育种值差别非常大。
10x二代测序
需要找出高低方向一致的基因,外显子:
对基因进行富集分析:
(二) 转录组分析
1 乳腺上皮
RNA-seq
2012年完成,泌乳中后期,4头牛,2头乳脂率非常高,另一头非常低
miRNA
ATC-se与rna-seq分析
2 肝脏组织
lnc-RNA
三个方法的CE竞争:
宏基因组,蛋白质,代谢组也均进行了分析,但是没有进行
第二部分 怎么鉴定“主效基因”
EEF1D基因的发现与功能验证,乳脂性状具有较大影响
EEF1D基因发现
28个显著SNP,其中一个位于EEF1D基因的内含子。采集8个组织进行验证,(PED9A基因与产奶性状不关联)
其他新群体验证,对EEF1D进行全部分析,3‘调控的有3个SNP,具有错意突变:
进行3中软件进行转录因子结果突变预测。
细胞水平验证(RNA水平干扰)
个体水平验证
在小鼠进行敲出EEF1D基因(杂合子),纯合子致死
配种,进行乳汁收集和验证
RNA-seq数据也非常一致
第三部分 怎么应用到育种
2009年美国率先开始,我国2012全部启动:全部后备公牛的育种。
国外的芯片利用LD位点,使SNP尽量均匀分布在染色体上,为固相;但是增加显著突变位点的可能更好。
新增加的位点,适合我国奶牛群体的SNP位点,目前,我国奶牛参考群体为1.5W。
85K的液相芯片目前正在验证:
问答
找到显著基因后,需要再次在其他群体扫描整个基因进行验证。
可能进行过表达的验证(如转基因小鼠),其结果可能能进一步得到验证。
需要多组学进行相互验证,可能更好确定候选基因,来进行后续的试验验证
后续:从汇报中的的一些胡思乱想和寻找答案(2021/12/6)
问题
为什么我国GS建立近10年,还是只涉及产奶性状?没有加入一些重要的功能性状(产犊难易,繁殖特性,长寿性状,体型评分,代谢疾病),最后猜想可能是表型数据无法收集。
那问题又来了,连建立的参考群,都不能保证这些基础数据的收集,那应该怎么相信这些参考群的管理(其他信息)呢?
如果有了新的指标,是否需要新的育种综合指数?
答案
两个大联盟在收集(需要时间)
指定采集数据的规范,有一定标准:
新的综合指数(UTPI),对于抗病性状应该增加指标:
初步成果
- 正在建立的“龙牛”芯片,85K,这个只是在基础50K数据中,又加入了一些产奶性状筛选到的SNP位点和已知的重大疾病的位点。但是没有考虑我刚才所述的功能信息的位点,或者说直接与繁殖相关的位点。
解决方案:
新芯片位点覆盖:
在找答案的同时,看到一个问题,冷冻精液进口占比60%+
那我就在想,我国目前的奶牛产奶量的提高是自己育种的结果,还是借助了国外的育种结果呢?一般来看,应该两者都会有,但是两者各自的占比就要打一个大大的问号了。