0
点赞
收藏
分享

微信扫一扫

从数量遗传学角度介绍为何结婚要拿彩礼钱

caoxingyu 2022-02-16 阅读 45


彩礼钱,是结婚时男方给女方的钱。这里有两点:


  • 男方给女方

俗话说:“父挫,挫一个;母挫,挫一窝”,意思是父亲影响子女,是单个影响的,而母亲影响子女,是成窝影响的。

因为,从遗传的角度,子女各继承父母一半的遗传物质,但是由于是母亲细胞质(比如线粒体)也携带遗传物质,所以母亲传递给后代的遗传物质要多于父亲。所以,想要改良家族的基因和性格,男性找一个好的女性做配偶,比女性找一个好的男性做配偶,影响要更大。想到这里,忽然感觉结婚时,给女方大量的彩礼,也可以理解了。

母亲对后代影响大,不只是从遗传的角度(生),还有环境的作用(育),还有遗传和环境的互作(生育)。从数量遗传学上的性质剖分来看:

初级公式:

个体表现 = 遗传物质 + 环境(误差)

进阶公式:

个体表现 = 父亲遗传物质+ 母亲遗传物质 + 环境(误差)

再进阶公式:

个体表现 = 父亲遗传物质 + 母亲遗传物质 + 母体遗传效应(比如线粒体遗传)+ 母体永久环境效应(比如育儿环境)+ 环境(误差)

上面公式中,母亲提供了三个:


  • 母亲遗传物质
  • 母体遗传效应(比如线粒体遗传)
  • 母体环境效应(比如育儿环境)

​个体永久环境效应​​​,​​母体遗传效应​​​,​​母体永久环境效应​​​,在构建模型时,要知其然而不知其所以然,不然​​一瓶子不满半瓶子咣当​​的状态显然不是一个段子说得好的数据分析师应该具备的素养。

1. 几个概念


  • 个体永久环境效应(Individual permanent environmental effect),也称为永久环境效应,一般是个体有重复值时可以将其剖分出来,比如鸡产蛋,猪产仔等。
  • 母体遗传效应(Maternal genetic effect),一般我们将个体加性效应称为个体加性遗传效应,因为它会考虑个体间亲缘关系矩阵(A或者G或者H矩阵),如果母体作为随机因子,也考虑亲缘关系矩阵,就称为母体遗传效应。
  • 母体环境效应(Maternal permanent environmental effect),也称为母体永久环境效应,在分析时作为随机因子,但是不考虑亲缘关系矩阵。

2. 母体效应包括两种

第一种:母体遗传效应,这里母体遗传效应也分为两种,一种是考虑母体遗传效应和个体加性效应协方差,一种是不考虑,不过默认都是考虑的。

第二种:母体环境效应,就是不考虑情缘关系矩阵,作为随机因子的那种模型。

3. 第一种:母体遗传效应

3.1 考虑母体遗传效应和个体加性效应协方差

模型书写:

y = X b + Z a + Z m g + e y = Xb + Za + Zm_g + e y=Xb+Za+Zmg​+e

这里:


  • Xb为固定因子
  • Za为随机因子,个体加性效应
  • Zm_g为随机因子,母体遗传效应
  • e为残差

方差协方差结构:

G = V a r [ a m g ] = [ A σ a 2 A σ a m A σ a m A σ m g 2 ] G = Var\begin{bmatrix} a\\m_g \end{bmatrix} = \begin{bmatrix} A\sigma_a^2 & A\sigma_{am} \\ A\sigma_{am} & A\sigma_{m_g}^2\end{bmatrix} G=Var[amg]=[Aσa2AσamAσamAσmg2]

这里A为亲缘关系矩阵,可以看出加性和母体存在协方差,而且加性和母体都要考虑A矩阵。

示例数据+示例代码+示例结果

数据和代码:

# 载入软件包
# devtools::install_github("dengfei2013/learnasreml")
library(learnasreml)
# asreml属于商业版软件,需要购买,购买请联系:http://www.vsnc.com.cn/
library(asreml)

data("animalmodel.dat")
data("animalmodel.ped")

head(animalmodel.dat)
head(animalmodel.ped)

# m1 单性状动物模型
dat = animalmodel.dat
ped = animalmodel.ped
dat[dat==0] = NA
str(dat)
# 计算亲缘关系逆矩阵
ainv = ainverse(ped)

# m1 单性状动物模型 + 母体遗传效应 + 加性效应和母体遗传效应互作
m1 = asreml(BWT ~ SEX + BYEAR, random= ~ str(~vm(ANIMAL,ainv) + vm(MOTHER,ainv), ~us(2):vm(ANIMAL,ainv)),
residual = ~ idv(units),data = dat)
summary(m1)$varcomp
vpredict(m1,h2 ~ V1/(V1+2*V2+V3+V4))

注意,这里的V2为加性和母体的协方差,因为协方差有两个,所以遗传力计算时分母要2*V2

结果:

> summary(m1)$varcomp
component std.error z.ratio bound %ch
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!us(2)_1:1 1.66469827 0.9069349 1.8355213 P 0.0
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!us(2)_2:1 0.01602755 0.4968458 0.0322586 P 0.8
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!us(2)_2:2 1.35818328 0.4194201 3.2382408 P 0.0
units!units 2.19186868 0.6632651 3.3046644 P 0.0
units!R 1.00000000 NA NA F 0.0
> vpredict(m1,h2 ~ V1/(V1+2*V2+V3+V4))
Estimate SE
h2 0.3172785 0.1965149

从结果可以看出:


  • 加性方差组分:1.665
  • 加性和母体遗传协方差组分:0.016
  • 母体遗传方差组分:1.35
  • 残差方差组分:2.19

由此计算的遗传力为0.317

3.2 不考虑母体遗传效应和个体加性效应协方差

这里两个写法,第一种是用diag函数,不考虑协方差。第二种是分开写加性和母体遗传效应。

模型书写:

y = X b + Z a + Z m g + e y = Xb + Za + Zm_g + e y=Xb+Za+Zmg​+e

这里:


  • Xb为固定因子
  • Za为随机因子,个体加性效应
  • Zm_g为随机因子,母体遗传效应
  • e为残差

方差协方差结构:

G = V a r [ a m g ] = [ A σ a 2 0 0 A σ m g 2 ] G = Var\begin{bmatrix} a\\m_g \end{bmatrix} = \begin{bmatrix} A\sigma_a^2 & 0\\ 0 & A\sigma_{m_g}^2\end{bmatrix} G=Var[amg]=[Aσa200Aσmg2]

这里A为亲缘关系矩阵,可以看出,不考虑加性和母体协方差,而且加性和母体都要考虑A矩阵。

示例数据+示例代码+示例结果

这里,将​​us​​​变为​​diag​​,即不考虑协方差。

m2.1 = asreml(BWT ~ SEX + BYEAR, random= ~ str(~vm(ANIMAL,ainv) + vm(MOTHER,ainv), ~diag(2):vm(ANIMAL,ainv)),
residual = ~ idv(units),data = dat)
summary(m2.1)$varcomp
vpredict(m2.1,h2 ~ V1/(V1+V2+V3))

结果:

> summary(m2.1)$varcomp 
component std.error z.ratio bound %ch
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!diag(2)_1 1.689122 0.5291361 3.192225 P 0.0
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!diag(2)_2 1.366709 0.3151848 4.336215 P 0.1
units!units 2.174346 0.3932961 5.528523 P 0.0
units!R 1.000000 NA NA F 0.0
> vpredict(m2.1,h2 ~ V1/(V1+V2+V3))
Estimate SE
h2 0.3229569 0.09621066

从结果可以看出:


  • 加性方差组分:1.68
  • 母体遗传方差组分:1.36
  • 残差方差组分:2.17

由此计算的遗传力为0.32

另外一种写法:

可以和加性方差组分写法类似,直接用​​vm​​函数,这种写法比较简单,但是没有考虑加性和母体遗传效应的协方差。

# m2 单性状动物模型 + 母体遗传效应
m2.2 = asreml(BWT ~ SEX + BYEAR, random= ~ vm(ANIMAL,ainv) + vm(MOTHER,ainv),
residual = ~ idv(units),data = dat)
summary(m2.2)$varcomp
vpredict(m2.2,h2 ~ V1/(V1+V2+V3))
> summary(m2.2)$varcomp 
component std.error z.ratio bound %ch
vm(ANIMAL, ainv) 1.689188 0.5292161 3.191868 P 0
vm(MOTHER, ainv) 1.366777 0.3153196 4.334578 P 0
units!units 2.174264 0.3932864 5.528448 P 0
units!R 1.000000 NA NA F 0
> vpredict(m2.2,h2 ~ V1/(V1+V2+V3))
Estimate SE
h2 0.3229663 0.09621819

可以看到结果完全一样。

4. 第二种:母体环境效应

模型书写:

y = X b + Z a + Z m + e y = Xb + Za + Zm + e y=Xb+Za+Zm+e

这里:


  • Xb为固定因子
  • Za为随机因子,个体加性效应
  • Zm为随机因子,母体环境效应
  • e为残差

方差协方差结构:

G = V a r [ a m g ] = [ A σ a 2 0 0 I σ m g 2 ] G = Var\begin{bmatrix} a\\m_g \end{bmatrix} = \begin{bmatrix} A\sigma_a^2 & 0\\ 0 & I\sigma_{m_g}^2\end{bmatrix} G=Var[amg]=[Aσa200Iσmg2]

这里A为亲缘关系矩阵,可以看出,不考虑加性和母体协方差,而且加性和考虑A矩阵,母体不考虑A矩阵。

这里的母体环境效应,不考虑亲缘关系矩阵,将其作为随机因子即可。

# m3 单性状动物模型 + 母体环境效应
m3 = asreml(BWT ~ SEX + BYEAR, random= ~ vm(ANIMAL,ainv) + MOTHER,
residual = ~ idv(units),data = dat)
summary(m3)$varcomp
vpredict(m3,h2 ~ V1/(V1+V2+V3))

结果:

> summary(m3)$varcomp 
component std.error z.ratio bound %ch
MOTHER 1.104038 0.2398000 4.603997 P 0
vm(ANIMAL, ainv) 2.277785 0.4970861 4.582274 P 0
units!units 1.656900 0.3734446 4.436803 P 0
units!R 1.000000 NA NA F 0
> vpredict(m3,h2 ~ V1/(V1+V2+V3))
Estimate SE
h2 0.2191107 0.04364284

5. 同时考虑母体遗传效应和母体环境效应

这个模型,是考虑母体效应最完整的模型,他包括


  • 母体遗传效应
  • 加性和母体遗传效应协方差
  • 母体永久环境效应

模型书写:

y = X b + Z 1 a + Z 2 m g + Z 3 m e + e y = Xb + Z_1a + Z_2m_g +Z_3m_e + e y=Xb+Z1a+Z2mg+Z3me+e

这里:


  • Xb为固定因子
  • Za为随机因子,个体加性效应
  • Zm_g为随机因子,母体遗传效应
  • Zm为随机因子,母体环境效应
  • e为残差

方差协方差结构:

G = V a r [ a m g m e ] = [ A σ a 2 A σ a m 0 A σ a m A σ m g 2 0 0 0 I σ m e 2 ] G = Var\begin{bmatrix} a\\m_g \\m_e \end{bmatrix} = \begin{bmatrix} A\sigma_a^2 & A\sigma_{am} & 0 \\ A\sigma_{am} & A\sigma_{m_g}^2 & 0 \\0 & 0 & I\sigma_{m_e}^2\end{bmatrix} G=Var⎣⎡amgme⎦⎤=⎣⎡Aσa2Aσam0AσamAσmg2000Iσme2⎦⎤

# m4 单性状动物模型 + 母体遗传效应 + 加性效应和母体遗传效应互作 + 母体环境效应
m4 = asreml(BWT ~ SEX + BYEAR, random= ~ str(~vm(ANIMAL,ainv) + vm(MOTHER,ainv), ~us(2):vm(ANIMAL,ainv)) + MOTHER,
residual = ~ idv(units),data = dat)
summary(m4)$varcomp
vpredict(m4,h2 ~ V1/(V1+2*V2+V3+V4+V5))

结果:

> summary(m4)$varcomp 
component std.error z.ratio bound %ch
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!us(2)_1:1 1.688055506 0.9091111 1.85681974 P 0.0
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!us(2)_2:1 0.006385884 0.4954503 0.01288905 P 4.0
vm(ANIMAL, ainv)+vm(MOTHER, ainv)!us(2)_2:2 1.057027088 0.4405431 2.39937292 P 0.1
MOTHER 0.497693182 0.3694028 1.34729116 P 0.6
units!units 2.157268745 0.6628453 3.25455845 P 0.0
units!R 1.000000000 NA NA F 0.0
> vpredict(m4,h2 ~ V1/(V1+2*V2+V3+V4+V5))
Estimate SE
h2 0.3118627 0.1907149

6. 模型筛选:最优模型LRT检验

是否考虑母体永久环境效应:m4 VS m1

是否考虑加性效应和母体遗传效应协方差:m1 VS m2.1

# LRT检验
lrt.asreml(m4,m1,boundary = T)

lrt.asreml(m1,m2.1,boundary = T)

从数量遗传学角度介绍为何结婚要拿彩礼钱_人工智能

可以看到,母体永久环境效应和协方差都不显著,模型中可以不加。

哪个模型最好?使用BIC判断:

summary(m1)$bic
summary(m2.1)$bic
summary(m3)$bic
summary(m4)$bic

从数量遗传学角度介绍为何结婚要拿彩礼钱_协方差_02

可以看到,m3的BIC最小,它的模型为:只考虑加性效应和母体永久环境效应。

从数量遗传学角度介绍为何结婚要拿彩礼钱_方差_03

7. 基因组选择的应用母体遗传效应?

GBLUP或者SSGBLUP(一步法)的好处是,传统动物模型能用的模型,基因组选择都可以使用。一些性状在分析时,需要考虑重复力模型,母体遗传,母体环境等模型,分析结果会更准确。

8. 上面的方差组分和母体遗传大小有什么关系?

我们将母体遗传多于父亲,也是要有数据支撑的,对于特定的性状,比如智商IQ,比如身高,比如体重等等,这些性状哪些影响大一些,哪些影响小有点,就需要用群体遗传评估的方法进行计算,然后才能得到结论。比较我们不是算命大仙,我们是用科学的方法评估和预测。

9. 参考文献


Lawrence R. Schaeffer, Linear Models and Animal Breeding, 2010
A R Gilmour, ASReml User Guide Release 4.1 Structural Specification, 2015
D G Butler, ASReml-R Reference Manual Version, 2018





举报

相关推荐

0 条评论