假设检验(Hypothesis Testing):某一给定的观测或发现与某声称的假设是否相符?进行统计假设检验,就是要制定一套步骤和规则,以使决定接受或拒绝一个虚拟假设(原假设)。
虚拟假设(null hypothesis) H0
指定或声称的假设,如 H0:β2=0
它是一个等待被挑战的“靶子”!“稻草人”!
备择假设(alter hypothesis) H1
简单备择假设 H1:β2=1.5
复合备择假设 H1:β2≠1.5
假设检验的具体方法:
置信区间检验(confidence interval)
显著性检验(test of significance)
假设检验(Hypothesis Testing):某一给定的观测或发现与某声称的假设是否相符?进行统计假设检验,就是要制定一套步骤和规则,以使决定接受或拒绝一个虚拟假设(原假设)。
虚拟假设(null hypothesis) H0
指定或声称的假设,如 H0:β2=0
它是一个等待被挑战的“靶子”!“稻草人”!
备择假设(alter hypothesis) H1
简单备择假设 H1:β2=1.5
复合备择假设 H1:β2≠1.5
假设检验的具体方法:
置信区间检验(confidence interval)
显著性检验(test of significance)
课堂讨论:参数的置信区间检验和显著性检验有什么区别和联系?
双侧或双尾检验(Two-sided or Two-Tail Test)
H0:β2=0;H1:β2≠0
假设检验目的:估计的是否与上述相容?
决策规则:
构造一个 β2的 100(1−α)%置信区间。
如果 β2在 H0假设下落入此区间,就不拒绝 H0。
如果它落在此区间之外,就要拒绝 H0。
对于斜率参数 β2的置信区间检验法。
Yi=β1+β2Xi+ui
H0:β2=0.5;H1:β2≠0.5
步骤2:给定 α=0.05,(1−α)100%=95%
步骤3:根据前述计算结果,计算斜率参数 β2的95%置信区间为:
ˆβ2−tα/2⋅Sˆβ2≤β2≤ˆβ2+tα/2⋅Sˆβ20.5709≤β2≤0.8772
对于截距参数 β1的置信区间检验法。
Yi=β1+β2Xi+ui
H0:β1=0;H1:β1≠0
步骤2:给定 α=0.05,(1−α)100%=95%
步骤3:根据前述计算结果,计算截距参数 β1的95%置信区间为:
ˆβ1−tα/2⋅Sˆβ1≤β1≤ˆβ1+tα/2⋅Sˆβ1−1.9395≤β1≤1.9106
步骤4:那么我们可以对截距参数 β1做出如下检验判断:
显著性检验方法( test-of-significance approach):是一种用样本结果来证实 H0真伪的检验程序。
关键思路:
找到一个适合的检验统计量(test statistic) 。例如t统计量 χ2统计量、F统计量等。
知道该统计量在 H0下的抽样分布(pdf)。往往与待检验参数有关系。
计算样本统计量的值。也即能用样本数据快速计算出来,例如 t∗^β2=ˆβ2Sˆβ2。
查表找出给定显著性水平 α下的理论统计量的临界值。例如 t1−α/2(n−2)=t0.975(11)= 2.2010
比较样本统计量值和该临界值的大小。例如,比较 t∗^β2与 t0.975(11)
对于截距参数 β1的显著性检验(t检验)。
Yi=β1+β2Xi+ui
H0:β1=0;H1:β1≠0
T=ˆβ1−β1Sˆβ1←T∼t(n−2)
T=ˆβ1−β1Sˆβ1←T∼t(n−2)t∗ˆβ1=ˆβ1Sˆβ1←H0:β1=0t∗ˆβ1=−0.01450.8746=−0.0165
t1−α/2(n−2)=t1−0.05/2(13−2)=t0.975(11)= 2.2010
步骤5:得到显著性检验的判断结论。
若 |t∗ˆβ1|>t1−α/2(n−2),则 β1的t检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为截距参数 β1≠0。
若 |t∗ˆβ1|<t1−α/2(n−2),则 β1的t检验结果不显著。换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为截距参数 β1=0。
本例中, |t∗ˆβ1|= 0.0165 小于 t0.975(11)= 2.2010。因此,认为 β1的t检验结果不显著。
换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为截距参数 β1=0。
对于斜率参数 β2的显著性检验(t检验)。
Yi=β1+β2Xi+ui
H0:β2=0;H1:β2≠0
T=ˆβ2−β2Sβ2←T∼t(n−2)
T=ˆβ2−β2Sˆβ2←T∼t(n−2)t∗ˆβ2=ˆβ2Sˆβ2←H0:β2=0t∗ˆβ2=0.72410.0696=10.4064
t1−α/2(n−2)=t1−0.05/2(13−2)=t0.975(11)= 2.2010
步骤5:得到显著性检验的判断结论。
若 |t∗ˆβ2|>t1−α/2(n−2),则 β2的t检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β2≠0。
若 |t∗ˆβ2|<t1−α/2(n−2),则 β2的t检验结果不显著。换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为斜率参数 β2=0。
本例中, |t∗ˆβ2|= 10.4064 大于 t0.975(11)= 2.2010。因此,认为 β2的t检验结果显著。
换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β2≠0。
我们可以回顾犯错误类型:
第I类错误:弃真错误 α=P(Z>Z0|H0=True)
第II类错误:取伪错误 β=P(Z≤Z0|H1=True)
[给定样本容量时]如果我们要减少犯第I 类错误, 第II类错误就要增加;反之亦然。
为什么选择显著性水平 α通常固定在0.01、0.05、0.1水平上?
约定而已,并非神圣不可改变!
如何改变??
精确的显著性概率水平p值:
对给定的样本算出一个检验统计量(如t统计量),查到与之对应的概率:p值(p value)或概率值(probability value)
不约定 α,而是直接求出犯错误概率p值,由读者自己去评判犯错误的可能性和代价!!因人而异!!
关于统计显著性与实际显著性。
不能一味追求统计显著性,有时候还需要考虑“实际显著性”的现实意义。
举例说明:
边际消费倾向(MPC)是指GDP每增加1美元带来消费的增加数;宏观理论表明收入乘数为:1/(1-MPC)。
若MPC的95%置信区间为(0.7129,0.7306),当样本表明MPC的估计值为 ^MPC=0.74(此时,即乘数为3.84),你怎样抉择!!!
关于置信区间方法和显著性检验方法的选择。
一般来说,置信区间方法优于显著性检验方法!
例如:假设MPC H0:β2=0显然荒谬的!
(Yi−ˉY)=(ˆYi−ˉY)+(Yi−ˆYi)yi=ˆyi+ei∑y2i=∑ˆy2i+∑e2iTSS=ESS+RSS
∑y2i=∑(ˆyiei)2=∑(ˆy2i+2ˆyiei+e2i)=∑ˆy2i+2∑ˆyiei+∑e2i=∑ˆy2i+2∑(^(β2xi)ei)+∑e2i=∑ˆy2i+2^β2∑(xiei)+∑e2i←[∑xiei=0]=∑ˆy2i+∑e2i
对于一元线性回归(双变量),方差分解的理论值如下:
变异来源 | 平方和符号SS | 平方和计算公式 | 自由度df | 均方和符号MSS | 均方和计算公式 |
---|---|---|---|---|---|
回归平方和 | ESS | ∑(ˆYi−ˉYi)2=∑ˆy2i | 1 | MSSESS | ESS/dfESS=ˆβ22∑x2i |
残差平方和 | RSS | ∑(Yi−ˆYi)2=∑e2i | n-2 | MSSRSS | RSS/dfRSS=∑e2in−2 |
总平方和 | TSS | ∑(Yi−ˉYi)2=∑y2i | n-1 | MSSTSS | TSS/dfTSS=∑y2in−1 |
一元回归模型下:
Yi=β1+β2Xi+ui
H0:β2=0;H1:β2≠0
多元回归模型下:
Yi=β1+β2X2i+β3X3i+⋯+βkXki+ui
H0:β2=β3=⋯=βk=0;H1:not allβj=0,j∈2,3,⋯,k
χ21=(ˆβ2−β2σ^β2)2=(ˆβ2−β2√σ2/∑x2i)2=(ˆβ2−β2)2∑x2iσ2←χ21∼χ2(1)
χ22=(n−2)ˆσ2σ2=∑e2iσ2←χ22∼χ2(n−2)
F=χ21/1χ22/n−2=((ˆβ2−β2)2∑x2iσ2)/(∑e2i(n−2)σ2)=(ˆβ2−β2)2∑x2i∑e2i/(n−2)F∼F(1,n−2)
F∗=(ˆβ2−β2)2∑x2i∑e2i/(n−2)←H0:β2=0=ˆβ22∑x2i∑e2i/(n−2)=ESS/dfESSRSS/dfRSS=MSSESSMSSRSS=ˆβ22∑x2iˆσ2
步骤4:给定显著性水平 α=0.05下,查出统计量的理论分布值。 F1−α(1,n−2)
步骤5:得到显著性检验的判断结论。
若 F∗>F1−α(1,n−2),则 模型整体显著性的F检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β2≠0。
若 F∗<F1−α(1,n−2),则 模型整体显著性的F检验结果不显著。换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为斜率参数 β2=0。
F检验与t检验的联系:
在一元回归模型中,t检验与F检验的结论总是一致的。
对于检验斜率参数 β2的显著性,两者可相互替代!在一元回归分析中,若假设 H0:β2=0,则 F∗≃(t∗)2
F检验与t检验的不同:
检验目的不同。F检验是检验模型的整体显著性;t检验是检验各个回归参数的显著性。
假设的提出不同:
F检验:斜率系数联合假设 H0:β2=0;H1:β2≠0
t检验:回归系数分别假设 H0:βi=0;H1:βi≠0;i∈1,2
检验原理的不同:F检验需要构造F统计量;t检验需要构造t统计量
根据前述理论计算公式,可以算出具体的ANOVA分析表:
变异来源 | 平方和SS | 自由度df | 均方和MSS |
---|---|---|---|
回归平方和ESS | 95.4 | 1 | 95.42 |
残差平方和RSS | 9.7 | 11 | 0.88 |
总平方和TSS | 105.1 | 12 | 7.09 |
步骤1:给出模型 Yi=β1+β2Xi+ui,提出假设: H0:β2=0;H1:β2≠0
步骤2:构造合适检验的分布:
F=(ˆβ2−β2)2∑x2i∑e2i/(n−2)←F∼F(1,n−2)
F∗=ˆβ22∑x2i∑e2i/(n−2)=ESS/dfESSRSS/dfRSS=MSSESSMSSRSS=95.42530.8812=108.2924
步骤4:给定 α=0.05下,查出F理论值 F1−α(1,n−2)=F0.95(1,11)= 4.8443
步骤5:得到显著性检验的判断结论。因为 F∗= 108.2924 大于 F0.95(1,11)= 4.8443,所以模型整体显著性的F检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β2≠0。
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |