动物育种中,我们通常使用的是混合线性模型,但是对于最后的多个性状的EBV总和为一个总和育种值,我们往往使用选择指数算法。
我们先以回归表型的genetic value开始,最后再说其在综合育种值上的使用。
1 基于动物自己单个记录预测育种值
假设一头牛的305-d的产奶量符合正太分布(一般模型前提假设):
3头牛加性育种值(y)对表型(x)对进行回归
PS:群体E(y) = 均值
实际中,我们是知道表型,但是不知道加性育种值(a),所以将其表型(如产奶量)作为y值,需要求得为a值
将上述说的进行公式转换:
上式需要假设常数的前两项(E(a) 和bE(y))和为0
但是a我们是不知道的, 需要假设a已知(来自一个随机群体的动物):
上式 根据OLS公式求得(不懂的请查看以前的博客)
其中a代表‘真实’加性育种值; a 和 x 定义为deviations, 则x'x 则可以替换为表型方差; x'a替换为表型与加性育种值的协方差
b = cov(x,y)/ var(y)
需要的方差和协方差可以先验知道,可以用不同的策略估计(如REML法)
一个证明例子:假设有4个动物有表型
y = [11 12 13 14]' 和E(y) = 10;
x = y - E(y) = [1 2 3 4]' 这是对表型进行校正(固定效应)
则对应的遗育种值:a = [0 -2 0 +2]'; 但是在实际情况中我们不会有a,
则估计b:
另一代替模型-基于遗传力
自己也不是很理解
h2= 遗传方差对表型方差的解释
2 基于动物自己多个重复记录预测育种值
对方差进行划分(partitioning)
重复性(repeatability):衡量来自一个动物具有重复记录的相似性:
估计育种值b的公式:
3 基于动物半同胞后代记录预测育种值
同样需要先对方差进行划分:
通过后代记录求b:
b = 2n/(n + k)
b = 回归动物(公牛)全同胞后代平均偏差的系数
它显示了“神奇”的方面,就像计算平均值一样,但除以更大数(n+k)
4 基于动物一个性状预测另一个性状的育种值
假设动物 i 的y性状来选择x性状:
X与y性状的遗传相关为:
则b为:
5 选择指数理论:一般解b公式(aggregative 值)
选择指数是可以结合个体及其亲属所有信息来估计个体育种值的一种方法。
将几个性状的育种值综合在一起,计算一个综合育种值:
eg: 选择目标为T(总育种目标):
当预测公式= 选择指数(这里为性状)
y可以是来自不同的动物, 性状作为a
得到b有三种方法:
- 类似于最小二乘法:最小E(T-I)2(误差方差最小)
b = P-1c = P-1Cw = P-1Gw
-
最大化I与T的相关 rTI(真实育种值与选择指数间的相关最大)
-
最大化使用 I 让选择的组的平均(汇总)遗传值(对动物个体进行排序正确的概率最大)
6 准确性(accuracies)是可靠性(reliablities)的开方
与估计准确性相关的 T (I) 估计; 准确性的开方为可靠性
从各种亲属的记录中预测加性遗传值的权重和准确性
一个简答的练习:
将根据奶牛的产犊年龄,预测其产奶量:
为什么这样做:
需注意:
-
表型来自不同动物的观察值:对祖代进行选择; 公式
会改变, 如通过母亲的表现选择女儿, 则变为: