Loading [MathJax]/jax/output/CommonHTML/jax.js
+ - 0:00:00
Notes for current slide
Notes for next slide

统计学原理(Statistic)

胡华平

西北农林科技大学

经济管理学院数量经济教研室

huhuaping01@hotmail.com

2021-05-18

1 / 30

假设检验:原理和思路

假设检验(Hypothesis Testing):某一给定的观测或发现与某声称的假设是否相符?进行统计假设检验,就是要制定一套步骤和规则,以使决定接受或拒绝一个虚拟假设(原假设)。

虚拟假设(null hypothesis) H0

  • 指定或声称的假设,如 H0:β2=0

  • 它是一个等待被挑战的“靶子”“稻草人”

备择假设(alter hypothesis) H1

  • 简单备择假设 H1:β2=1.5

  • 复合备择假设 H1:β21.5

假设检验的具体方法:

  • 置信区间检验(confidence interval)

  • 显著性检验(test of significance)

4 / 30

假设检验:原理和思路

假设检验(Hypothesis Testing):某一给定的观测或发现与某声称的假设是否相符?进行统计假设检验,就是要制定一套步骤和规则,以使决定接受或拒绝一个虚拟假设(原假设)。

虚拟假设(null hypothesis) H0

  • 指定或声称的假设,如 H0:β2=0

  • 它是一个等待被挑战的“靶子”“稻草人”

备择假设(alter hypothesis) H1

  • 简单备择假设 H1:β2=1.5

  • 复合备择假设 H1:β21.5

假设检验的具体方法:

  • 置信区间检验(confidence interval)

  • 显著性检验(test of significance)

课堂讨论:参数的置信区间检验和显著性检验有什么区别和联系?

4 / 30

假设检验:置信区间检验法(双侧检验)

双侧或双尾检验(Two-sided or Two-Tail Test)

H0:β2=0;H1:β20

  • 假设检验目的:估计的是否与上述相容?

  • 决策规则:

    • 构造一个 β2100(1α)%置信区间。

    • 如果 β2H0假设下落入此区间,就不拒绝 H0

    • 如果它落在此区间之外,就要拒绝 H0

5 / 30

(示例)教育程度与时均工资回归

对于斜率参数 β2的置信区间检验法。

  • 步骤1:给出模型,并提出假设:

Yi=β1+β2Xi+ui

H0:β2=0.5;H1:β20.5

  • 步骤2:给定 α=0.05,(1α)100%=95%

  • 步骤3:根据前述计算结果,计算斜率参数 β2的95%置信区间为:

ˆβ2tα/2Sˆβ2β2ˆβ2+tα/2Sˆβ20.5709β20.8772

  • 步骤4:那么我们可以对斜率参数 β2做出如下检验判断:拒绝原假设 H0,接受 H1。认为,长期来看很多个区间 [0.5709,0.8772] 有95%的可能性不包含0.5( β20.5)。
6 / 30

(示例)教育程度与时均工资回归

对于截距参数 β1的置信区间检验法。

  • 步骤1:给出模型,并提出假设:

Yi=β1+β2Xi+ui

H0:β1=0;H1:β10

  • 步骤2:给定 α=0.05,(1α)100%=95%

  • 步骤3:根据前述计算结果,计算截距参数 β1的95%置信区间为:

ˆβ1tα/2Sˆβ1β1ˆβ1+tα/2Sˆβ11.9395β11.9106

  • 步骤4:那么我们可以对截距参数 β1做出如下检验判断:

    • 不能拒绝原假设 H0,暂时接受 H0。认为,长期来看很多个区间[-1.9395,1.9106] 有95%的可能性包含0( β1=0)。
7 / 30

假设检验:显著性检验法

显著性检验方法( test-of-significance approach):是一种用样本结果来证实 H0真伪的检验程序。

关键思路

  • 找到一个适合的检验统计量(test statistic) 。例如t统计量 χ2统计量、F统计量等。

  • 知道该统计量在 H0下的抽样分布(pdf)。往往与待检验参数有关系。

  • 计算样本统计量的值。也即能用样本数据快速计算出来,例如 t^β2=ˆβ2Sˆβ2

  • 查表找出给定显著性水平 α下的理论统计量临界值。例如 t1α/2(n2)=t0.975(11)= 2.2010

  • 比较样本统计量值和该临界值的大小。例如,比较 t^β2t0.975(11)

  • 做出拒绝还是接受 H0的判断。
8 / 30

假设检验:截距参数的t检验

对于截距参数 β1的显著性检验(t检验)。

  • 步骤1:给出模型,并提出假设:

Yi=β1+β2Xi+ui

H0:β1=0;H1:β10

  • 步骤2:构造合适的检验统计量

T=ˆβ1β1Sˆβ1Tt(n2)

9 / 30

假设检验:截距参数的t检验

  • 步骤3:基于原假设 H0计算出样本统计量。

T=ˆβ1β1Sˆβ1Tt(n2)tˆβ1=ˆβ1Sˆβ1H0:β1=0tˆβ1=0.01450.8746=0.0165

  • 步骤4:给定显著性水平 α=0.05下,查出统计量的理论分布值

t1α/2(n2)=t10.05/2(132)=t0.975(11)= 2.2010

10 / 30

假设检验:截距参数的t检验

  • 步骤5:得到显著性检验的判断结论。

    • |tˆβ1|>t1α/2(n2),则 β1的t检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为截距参数 β10

    • |tˆβ1|<t1α/2(n2),则 β1的t检验结果不显著。换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为截距参数 β1=0

本例中, |tˆβ1|= 0.0165 小于 t0.975(11)= 2.2010。因此,认为 β1的t检验结果不显著

换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为截距参数 β1=0

11 / 30

假设检验:斜率参数的t检验

对于斜率参数 β2的显著性检验(t检验)。

  • 步骤1:给出模型,并提出假设:

Yi=β1+β2Xi+ui

H0:β2=0;H1:β20

  • 步骤2:构造合适的检验统计量

T=ˆβ2β2Sβ2Tt(n2)

12 / 30

假设检验:斜率参数的t检验

  • 步骤3:基于原假设 H0计算出样本统计量。

T=ˆβ2β2Sˆβ2Tt(n2)tˆβ2=ˆβ2Sˆβ2H0:β2=0tˆβ2=0.72410.0696=10.4064

  • 步骤4:给定显著性水平 α=0.05下,查出统计量的理论分布值

t1α/2(n2)=t10.05/2(132)=t0.975(11)= 2.2010

13 / 30

假设检验:斜率参数的t检验

  • 步骤5:得到显著性检验的判断结论。

    • |tˆβ2|>t1α/2(n2),则 β2的t检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β20

    • |tˆβ2|<t1α/2(n2),则 β2的t检验结果不显著。换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为斜率参数 β2=0

本例中, |tˆβ2|= 10.4064 大于 t0.975(11)= 2.2010。因此,认为 β2的t检验结果显著

换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β20

14 / 30

假设检验:显著性水平VS显著性概率

我们可以回顾犯错误类型:

  • 第I类错误:弃真错误 α=P(Z>Z0|H0=True)

  • 第II类错误:取伪错误 β=P(ZZ0|H1=True)

  • [给定样本容量时]如果我们要减少犯第I 类错误, 第II类错误就要增加;反之亦然。

为什么选择显著性水平 α通常固定在0.01、0.05、0.1水平上?

  • 约定而已,并非神圣不可改变!

  • 如何改变??

15 / 30

假设检验:显著性水平VS显著性概率

精确的显著性概率水平p值:

  • 对给定的样本算出一个检验统计量(如t统计量),查到与之对应的概率:p值(p value)或概率值(probability value)

  • 不约定 α,而是直接求出犯错误概率p值,由读者自己去评判犯错误的可能性和代价!!因人而异!!

16 / 30

假设检验:实际操作中的若干问题

关于统计显著性实际显著性

  • 不能一味追求统计显著性,有时候还需要考虑“实际显著性”的现实意义。

  • 举例说明:

    • 边际消费倾向(MPC)是指GDP每增加1美元带来消费的增加数;宏观理论表明收入乘数为:1/(1-MPC)。

    • 若MPC的95%置信区间为(0.7129,0.7306),当样本表明MPC的估计值为 ^MPC=0.74(此时,即乘数为3.84),你怎样抉择!!!

关于置信区间方法显著性检验方法的选择。

  • 一般来说,置信区间方法优于显著性检验方法!

  • 例如:假设MPC H0:β2=0显然荒谬的!

17 / 30

方差分解(ANOVA):Y变异的分解

(YiˉY)=(ˆYiˉY)+(YiˆYi)yi=ˆyi+ei

18 / 30

方差分解(ANOVA):平方和分解

(YiˉY)=(ˆYiˉY)+(YiˆYi)yi=ˆyi+eiy2i=ˆy2i+e2iTSS=ESS+RSS

  • 其中: TSS表示总离差平方和; ESS表示回归平方和; RSS表示残差差平方和
19 / 30

(附录):平方和分解证明过程

y2i=(ˆyiei)2=(ˆy2i+2ˆyiei+e2i)=ˆy2i+2ˆyiei+e2i=ˆy2i+2(^(β2xi)ei)+e2i=ˆy2i+2^β2(xiei)+e2i[xiei=0]=ˆy2i+e2i

20 / 30

方差分解(ANOVA):双变量分解表

对于一元线性回归(双变量),方差分解的理论值如下:

变异来源 平方和符号SS 平方和计算公式 自由度df 均方和符号MSS 均方和计算公式
回归平方和 ESS (ˆYiˉYi)2=ˆy2i 1 MSSESS ESS/dfESS=ˆβ22x2i
残差平方和 RSS (YiˆYi)2=e2i n-2 MSSRSS RSS/dfRSS=e2in2
总平方和 TSS (YiˉYi)2=y2i n-1 MSSTSS TSS/dfTSS=y2in1
21 / 30

模型整体显著性检验:F检验

  • 步骤1:给出模型,并提出假设:

一元回归模型下:

Yi=β1+β2Xi+ui

H0:β2=0;H1:β20

多元回归模型下:

Yi=β1+β2X2i+β3X3i++βkXki+ui

H0:β2=β3==βk=0;H1:not allβj=0,j2,3,,k

22 / 30

模型整体显著性检验:F检验

  • 步骤2:构造合适的检验统计量

χ21=(ˆβ2β2σ^β2)2=(ˆβ2β2σ2/x2i)2=(ˆβ2β2)2x2iσ2χ21χ2(1)

χ22=(n2)ˆσ2σ2=e2iσ2χ22χ2(n2)

F=χ21/1χ22/n2=((ˆβ2β2)2x2iσ2)/(e2i(n2)σ2)=(ˆβ2β2)2x2ie2i/(n2)FF(1,n2)

23 / 30

模型整体显著性检验:F检验

  • 步骤3:基于原假设 H0计算出样本统计量。

F=(ˆβ2β2)2x2ie2i/(n2)H0:β2=0=ˆβ22x2ie2i/(n2)=ESS/dfESSRSS/dfRSS=MSSESSMSSRSS=ˆβ22x2iˆσ2

24 / 30

模型整体显著性检验:F检验

  • 步骤4:给定显著性水平 α=0.05下,查出统计量的理论分布值F1α(1,n2)

  • 步骤5:得到显著性检验的判断结论。

    • F>F1α(1,n2),则 模型整体显著性的F检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β20

    • F<F1α(1,n2),则 模型整体显著性的F检验结果不显著。换言之,在显著性水平 α=0.05下,不能显著地拒绝原假设 H0,只能暂时接受原假设 H0,认为斜率参数 β2=0

25 / 30

模型整体显著性检验:比较

F检验与t检验的联系

  • 在一元回归模型中,t检验与F检验的结论总是一致的。

  • 对于检验斜率参数 β2的显著性,两者可相互替代!在一元回归分析中,若假设 H0:β2=0,则 F(t)2

F检验与t检验的不同

  • 检验目的不同。F检验是检验模型的整体显著性;t检验是检验各个回归参数的显著性。

  • 假设的提出不同:

    • F检验:斜率系数联合假设 H0:β2=0;H1:β20

    • t检验:回归系数分别假设 H0:βi=0;H1:βi0;i1,2

  • 检验原理的不同:F检验需要构造F统计量;t检验需要构造t统计量

26 / 30

(案例)教育程度与时均工资:计算ANOVA表

根据前述理论计算公式,可以算出具体的ANOVA分析表:

教育程度与时均工资案例的ANOVA分析表
变异来源 平方和SS 自由度df 均方和MSS
回归平方和ESS 95.4 1 95.42
残差平方和RSS 9.7 11 0.88
总平方和TSS 105.1 12 7.09
27 / 30

(案例)教育程度与时均工资:F检验

  • 步骤1:给出模型 Yi=β1+β2Xi+ui,提出假设: H0:β2=0;H1:β20

  • 步骤2:构造合适检验的分布:

F=(ˆβ2β2)2x2ie2i/(n2)FF(1,n2)

  • 步骤3:基于原假设 H0:β2=0,可以计算出样本统计量。

F=ˆβ22x2ie2i/(n2)=ESS/dfESSRSS/dfRSS=MSSESSMSSRSS=95.42530.8812=108.2924

28 / 30

(案例)教育程度与时均工资:F检验

  • 步骤4:给定 α=0.05下,查出F理论值 F1α(1,n2)=F0.95(1,11)= 4.8443

  • 步骤5:得到显著性检验的判断结论。因为 F= 108.2924 大于 F0.95(1,11)= 4.8443,所以模型整体显著性的F检验结果显著。换言之,在显著性水平 α=0.05下,应显著地拒绝原假设 H0,接受备择假设 H1,认为斜率参数 β20

29 / 30

本节结束

30 / 30
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow