正态分布检验
雅克-贝拉检验(Jarque-Bera test)——JB检验(大样本)
对于一个随机变量(Xi),假设其偏度为S,峰度为K,那么我们可以构造JB统计量:
 
     
      
       
        
         J
        
        
         B
        
        
         =
        
        
         
          n
         
         
          6
         
        
        
         [
        
        
         
          S
         
         
          2
         
        
        
         +
        
        
         
          
           (
          
          
           K
          
          
           −
          
          
           3
          
          
           
            )
           
           
            2
           
          
         
         
          4
         
        
        
         ]
        
       
       
         JB=\frac{n}{6}[S^2+\frac{(K-3)^2}{4}] 
       
      
     JB=6n[S2+4(K−3)2]
 可以证明:如果(Xi)是正态分布,那么在大样本的情况下(样本量>30)
    
     
      
       
        J
       
       
        B
       
       
        −
       
       
        
         χ
        
        
         2
        
       
       
        (
       
       
        2
       
       
        )
       
      
      
       JB-\chi^2(2)
      
     
    JB−χ2(2)(自由度为2的卡方分布)
 注:正态分布的偏度为0,峰度为3
那么进行假设检验的步骤如下:
 H0:该随机变量服从正太分布,H1:该随机变量不服从正态分布
然后计算该变量的偏度和峰度,得到检验值 J B ∗ JB^* JB∗,并计算出其对应的p值,将p值于0.05进行比较,如果小于0.05则可拒绝原假设,否则我们不能拒绝原假设。
偏度:
 
     
      
       
        
         E
        
        
         [
        
        
         (
        
        
         
          
           X
          
          
           −
          
          
           μ
          
         
         
          σ
         
        
        
         
          )
         
         
          3
         
        
        
         ]
        
       
       
         E[(\frac{X-\mu}{\sigma})^3] 
       
      
     E[(σX−μ)3]
 正态分布的偏度为0,左偏为偏度>0,正偏态;右偏为偏为<0,负偏度。
skewness(x) %偏度
峰度:
 
     
      
       
        
         E
        
        
         [
        
        
         (
        
        
         
          
           X
          
          
           −
          
          
           μ
          
         
         
          σ
         
        
        
         
          )
         
         
          4
         
        
        
         ]
        
        
         或
        
        
         E
        
        
         [
        
        
         (
        
        
         
          
           X
          
          
           −
          
          
           μ
          
         
         
          σ
         
        
        
         
          )
         
         
          4
         
        
        
         ]
        
        
         −
        
        
         3
        
       
       
         E[(\frac{X-\mu}{\sigma})^4]或E[(\frac{X-\mu}{\sigma})^4]-3 
       
      
     E[(σX−μ)4]或E[(σX−μ)4]−3正态分布的偏度为3(有些地方定义的正态分布偏度为0)Matlab软件中使用的是第一种定义。
 高于标准正态分布的为峰度大于3,高尖;低于标准正态分布的为峰度小于3,矮胖。
kurtosis(x) %峰度
使用matlab进行正态分布检验
% 检验第一列数据是否为正态分布
[h,p] = jbtest(Test(:,1),0.05)
% matlab中进行JB检验的语法:[h,p]=jbtest(x,alpha)
% 当输出h=1时,表示拒绝原假设,当h=0时表示不能拒绝原假设。
% alpha就是显著性水平,一般取0.05,此时置信水平为1-0.05=0.95
% x就是我们要检验的随机变量,注意这里的x只能是向量。
% 检验第一列数据是否为正态分布
[h,p] = jbtest(Test(:,1),0.05)
当检验所有列数据时,需要用到循环进行JB检验
% 用循环检验所有列的数据
n_c = size(Test,2);  % number of column 数据的列数
H = zeros(1,6);  % 初始化节省时间和消耗
P = zeros(1,6);
for i = 1:n_c
    [h,p] = jbtest(Test(:,i),0.05);
    H(i)=h;
    P(i)=p;
end
disp(H)
disp(P)
Shapiro–wilk夏皮洛-威尔克检验(小样本)
    
     
      
       
        
         H
        
        
         0
        
       
       
        :
       
       
        该
       
       
        随
       
       
        机
       
       
        变
       
       
        量
       
       
        服
       
       
        从
       
       
        正
       
       
        态
       
       
        分
       
       
        布
       
      
      
       H_0:该随机变量服从正态分布
      
     
    H0:该随机变量服从正态分布
 
    
     
      
       
        
         H
        
        
         1
        
       
       
        :
       
       
        该
       
       
        随
       
       
        机
       
       
        变
       
       
        量
       
       
        不
       
       
        服
       
       
        从
       
       
        正
       
       
        态
       
       
        分
       
       
        布
       
      
      
       H_1:该随机变量不服从正态分布
      
     
    H1:该随机变量不服从正态分布
计算出威尔克统计量后,得到相应的p值
 将p值与0.05比较,如果小于0.05则可拒绝原假设,否则我们不能拒绝原假设。
这里我们使用spss就可以得到p值:
首先选择分析——描述统计——探索
 
 点击图——勾选含检验的正态图,就可以看到通过夏皮洛-威尔克检验得到的p值。
 
Q-Q图(要求数据量非常大)
在统计学中,Q-Q图(Q代表分位数Quantile)是一种通过比较两个概率的分位数对这两个概率分别进行比较的概率图方法。
首先选定分位数的对应概率区间集合,在此概率区间上,点(x,y)对应于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分位数。
这里,我们选择正态分布和要检验的随机变量,并对其做出Q-Q图,可想而这,如果要检验的随机变量是正态分布,那么Q-Q图就是一条直线。
要利用Q-Q图鉴别样本数据是否近似于正态分布,只需要看Q-Q图上的点是否近似地在一条直线附近。
% Q-Q图
qqplot(Test(:,1))









