滞后变量(lag variable):对某个时间序列变量进行滞后变换后得到的新变量。
例如对时间序列变量 Z2,t(t∈1,2,⋯,T)进行滞后变换可以得到多个滞后变量: Z2,t−1;Z2,t−2;⋯;Z2,t−p;⋯;Z2,t−(T−1)。
时间序列数据的两种相关关系:
cor(Z2,t,Z3,t)cor(Z2,t,Z3,t−1);⋯;cor(Z2,t,Z3,t−p).p∈1,2,⋯,T−1cor(Z2,t−1,Z3,t);⋯;cor(Z2,t−p,Z3,t).p∈1,2,⋯,T−1
cor(Z2,t,Z2,t−1);cor(Z2,t,Z2,t−2);⋯;cor(Z2,t,Z2,t−p).p∈1,2,⋯,T−1
k变量总体回归模型(PRM)
Yt=β1+β2X2t+β3X3t+⋯+βkXkt+ut
经典线性回归模型假定(CLRM)在随机干扰项 ui之间不存在自相关,也即:
E(utut−p)=0;p∈1,2,⋯,T−1
如果随机干扰项 ui出现自相关时,则意味着违背了CLRM假设(其他假设仍旧成立):
E(utut−p)≠0;p∈1,2,⋯,T−1
随机干扰项 ut的几种自相关模式和非自相关模式可以表示为:
产生自相关的原因1:时间惯性的普遍存在。大多数经济时间序列变量都有时间惯性。
产生自相关的原因2-1:模型设定偏误——应含而未含某些重要变量(excluded variables) 。
Yt=β1+β2X2t+β3X3t+β4X4t+ut
Yt=α1+α2X2t+α3X3t+vt
产生自相关的原因2-2:模型设定偏误——不正确的函数形式。
Costt=β1+β2Outputt+β3Output2t+ut
Costt=α1+α2Outputt+vt
产生自相关的原因3:蛛网现象(Cobweb phenomenon)的存在。
Supplyt=β1+β2Pt−1+ut
产生自相关的原因4:滞后效应的普遍存在。
Consumptiont=β1+β2Incomet+β3Consumptiont−1+ut
产生自相关的原因5:数据的“编造”。
-从月度数据计算得出季度数据,会减小波动,引进匀滑作用,使扰动项出现系统性模式
数据的内插(interpolation):人口普查10年一次
数据的外推(extrapolation)
产生自相关的原因6:数据的“变换”。
Yt=β1+β2Xt+utYt−1=β1+β2Xt−1+ut−1ΔYt=β2ΔXt+ΔutΔYt=β2ΔXt+vt
产生自相关的原因7:时间序列非平稳性的广泛存在。
Yt=β1+β2Xt+ut
直接观察视角:我们可以从随机干扰项 ut与其滞后变量 ut−1,ut−2,⋯,ut−p,⋯,ut−(T−1)的散点图来观察自相关模式(比较容易理解)。
“幸福的家庭大抵类似,不幸的家庭各不相同!”——列夫托尔斯泰
“随机干扰项不相关只有一种情形(理想状态),而自相关则可以有各种千奇百怪的情形(普遍现实)”。
间接观察视角:我们可以从随机干扰项 ut随时间t的散点图变化来观察自相关模式(不太好理解)。
“幸福的家庭大抵类似,不幸的家庭各不相同!”——列夫托尔斯泰
“随机干扰项不相关只有一种情形(理想状态),而自相关则可以有各种千奇百怪的情形(普遍现实)”。
下面给出自相关情形为马尔可夫1阶自回归模式:
Yt=β1+β2Xt+utut=ρut−1+εt←[−1<ρ<1]
ρ=E[(ut−E(ut))(ut−1−E(ut−1))]√var(ut)√var(ut−1)=E(utut−1)var(ut−1)
E(εt)=0var(εt)=σ2cov(εt,εt+s)=0;s≠0
态度1:忽视自相关性,坚持错误地使用CLRM假设下OLS方法的各种公式。
Yt=β1+β2Xt+utut=ρut−1+εt←[−1<ρ<1]
在自相关性存在的情形下(马尔科夫1阶自相关),却坚持使用OLS方法下的方差公式:
ˆβ2∥CLRMOLS=∑xtyt∑x2t=n∑XtYt−∑Xt∑Ytn∑X2t−(∑Xt)2
var(ˆβ2)∥CLRMOLS=σ2∑x2t
态度2:承认“自相关性”这一事实,但仍旧使用OLS方法。
Yt=β1+β2Xt+utut=ρut−1+εt←[−1<ρ<1]
在自相关性存在的情形下(马尔科夫1阶自相关),仍旧使用OLS方法,得到估计量及其方差的“新公式”(细节见下一页slide):
ˆβ2∥AR1OLS=∑xtyt∑x2t=n∑XtYt−∑Xt∑Ytn∑X2t−(∑Xt)2
var(ˆβ2)∥AR1OLS=σ2∑x2t1+rρ1−rρ=var(ˆβ2)∥CLRMOLS⋅1+rρ1−rρ
系数估计量仍是一致的;方差公式是有偏的,可能高估或低估其真实方差 var(ˆβ2)。
请验证 r=0.6,ρ=0.8时,二者的大小关系?
给定马尔科夫1阶自相关情形(AR(1)):
Yt=β1+β2Xt+utut=ρut−1+εt←[−1<ρ<1]
var(ut)=E(u2t)=σ2ε1−ρ2cov(ut,ut−s)=cov(ut,ut+s)=E(utut−s)=ρsσ2ε1−ρ2cor(ut,ut−s)=cor(ut,ut+s)=ρs
var(ˆβ2)AR1OLS=σ2∑x2t[1+2ρ∑xtxt−1∑x2t+2ρ2∑xtxt−2∑x2t+⋯+2ρn−1x1xn∑x2t]=σ2∑x2t1+rρ1−rρ←[ifXt=rXt−1+vt]
态度3:在自相关性存在情形下,首先想办法消除自相关性,再使用OLS方法。广义最小二乘法(GLS)下(如广义差分方程法),估计量及其方差公式可写成:
ˆβ2∥AR1GLS=∑nt=2(xt−ρxt−1)(yt−ρyt−1)∑nt=2(xt−ρxt−1)2+C←[C is a correction factor]
var(ˆβ2)AR1GLS=σ2∑nt=2(xt−ρxt−1)2+D←[D is a correction factor]
系数估计量是一致的
方差公式是无偏的,其期望将等于真实方差 var(ˆβ2)。
此时,GLS得到的才是BLUE!(证明过程略)
提示:GLS中我们通过变量变换把额外的信息(异方差性或自相关性)包括到估计程序中去,而在OLS 中我们并不直接考虑这种附加信息。
var(ˆβ2)∥CLRMOLS=σ2∑x2t
var(ˆβ2)∥AR1OLS=σ2∑x2t1+rρ1−rρ=var(ˆβ2)∥CLRMOLS⋅1+rρ1−rρ
var(ˆβ2)AR1GLS=σ2∑nt=2(xt−ρxt−1)2+D←[D is a correction factor]
在自相关出现时,OLS 估计量仍是线性的、无偏的和一致性的,但不再是有效的(亦即最小方差)。那么,如果我们继续使用OLS估计量,我们平常的假设检验程序会遇到什么问题呢?主要有:
参数估计不再是有效估计量(亦即不再是方差最小)
参数的显著性检验失去意义
模型的预测失效
下面分两种情形来讨论其后果:
态度1:忽视自相关,采用OLS估计
态度2:考虑自相关,采用OLS估计
对于态度1和态度2,执意采用OLS估计,将会:残差方差可能低估真实方差;高估可绝系数;或低估考虑一阶自回归的方差;检验无效,得出错误的结论。
Yt=β1+β2Xt+utut=ρut−1+εt←[−1<ρ<1]
CLRM条件下采用OLS估计:
ˆβ2∥CLRMOLS=∑xtyt∑x2tvar(ˆβ2)∥CLRMOLS=σ2∑x2tˆσ2∥CLRMOLS=∑e2in−2E(ˆσ2∥CLRMOLS)=σ2
AR(1)情形下使用OLS估计:
ˆβ2∥AR1OLS=∑xtyt∑x2tvar(ˆβ2)∥AR1OLS=σ2∑x2t1+rρ1−rρˆσ2∥AR1OLS=σ2{n−[2(1−ρ)−2ρr]}n−2E(ˆσ2∥AR1OLS)<σ2
实际经济分析中,正自相关性一般更为普遍,也即 (0<ρ<1;0<r<1)。此时:
var(ˆβ2)∥AR1OLS=σ2∑x2t1+rρ1−rρ=var(ˆβ2)∥CLRMOLS⋅1+rρ1−rρvar(ˆβ2)∥AR1OLS>var(ˆβ2)∥CLRMOLS←[if0<ρ<1;0<r<1]
事实上,在AR(1)情形下采用广义最小二乘法(GLS)才能得到BLUE,意味着:
var(ˆβ2)∥AR1OLS>var(ˆβ2)∥CLRMOLS>var(ˆβ2)∥AR1GLS
同时,也将意味着GLS方法下斜率系数的置信区间也将更窄:
如果一个对斜率参数 β2的点估计值为 b2,并给定显著性水平为 α=0.05
那么则有可能出现如下结果:在OLS方法下,95%置信区间检验不显著(接受原假设 H0);但是在GLS方法下,95%置信区间检验却可以是显著的(拒绝原假设 H0,接受备择假设 H1)
启示:尽管OLS 估计量是无偏的和一致性的,但为了构造置信区间并检验假设,要用GLS而不用OLS!
给定如下存在自相关情形AR(1)的模拟数据表(观测数 T= 9):
Yt=1+0.8Xt+utut=0.7ut−1+εt←[u0=5]εt∼N(0,1)←[ε0=0]
存在自相关情形AR(1)的模拟数据,随机干扰项 ut的分布模式如下:
对以上存在AR(1)的模拟数据,我们构建如下的回归模型,并坚持采用OLS方法得到估计结果:
Yt=+β1+β2Xt+ut
^Yt=+4.30+0.51Xt(t)(6.7249)(4.4750)(se)(0.6389)(0.1135)(fitness)R2=0.7410;¯R2=0.7040F∗=20.03;p=0.0029
对OLS方法下的样本回归线(SRL1)绘图,并与真实的总体回归线(PRL)进行对比:
E(Y|Xt)=1+0.8Xt(PRL/PRF)
如果我们使用符合CLRM假设的模拟数据 (Y∗t,Xt),其中:
Y∗t=1+0.8Xt+εtεt∼N(0,1)←[ε0=0]
符合CLRM假设的模拟数据,随机干扰项 εt的分布模式如下:
对以上符合CLRM假设模拟数据,我们构建如下的回归模型,并采用OLS方法得到估计结果:
^NewYt=+0.48+0.73Xt(t)(0.6331)(5.4323)(se)(0.7569)(0.1345)(fitness)R2=0.8083;¯R2=0.7809F∗=29.51;p=0.0010
注意:此处的 ^NewYt表示 ˆY∗t
对OLS方法下的样本回归线(SRL2)绘图,并与真实的总体回归线(PRL)进行对比:
E(Y|Xt)=1+0.8Xt(PRL/PRF)
1960-2005年间美国商业部门工资与生产率数据(T= 46 )
Yt表示时均真实工资指数;
Xt表示生产效率指数
对以上数据,我们可以分别构建如下的经典线性回归模型和双对数模型,并坚持采用OLS方法得到估计结果:
Yt=+β1+β2Xt+ut
^Yt=+4.30+0.51Xt(t)(6.7249)(4.4750)(se)(0.6389)(0.1135)(fitness)R2=0.7410;¯R2=0.7040F∗=20.03;p=0.0029
log(Yt)=+β1+β2log(Xt)+ut
^log(Yt)=+1.45+0.31log(Xt)(t)(15.6171)(5.2716)(se)(0.0930)(0.0590)(fitness)R2=0.7988;¯R2=0.7700F∗=27.79;p=0.0012
思考:
我们的数据是否受到自相关问题的困扰?
我们如何发现自相关问题并加以纠正?
图示法重点关注模型残差序列( et)是否存在某种系统化模式。总体回归模型PRM中随机干扰项 ut是不能直接观测到,所以可通过观察样本回归模型SRM中残差的行为模式,间接诊断随机干扰项是否存在自相关性问题。
图形1:残差序列 et时序图(serial plot,也即残差 et随时期 t的变化图)。
图形2:残差序列 et与残差1阶滞后序列 et−1的散点图(scatter plot)。
图形3:残差序列 et与残差p阶滞后序列 et−p,p∈(2,3,⋯,T−1)的散点图(scatter plot)。
首先构建如下双对数主回归模型:
log(Yt)=+ˆβ1+ˆβ2log(Xt)+ei
双对数主回归模型回归结果为:
^log(Yt)=+1.61+0.65log(Xt)(t)(29.3680)(52.7996)(se)(0.0547)(0.0124)(fitness)R2=0.9845;¯R2=0.9841F∗=2787.80;p=0.0000
作为对照,下面给出的是主模型的EViews报告:
得到主回归模型的残差序列 et、残差1阶滞后序列 et−1,以及标准化变换的残差序列 e∗t=etSet:
Yt | Xt | ˆYt | et | et−1 | e∗t | e∗t/100 |
---|---|---|---|---|---|---|
60.8 | 48.9 | 4.1437 | -0.0361 | -1.6521 | -0.0165 | |
62.5 | 50.6 | 4.1659 | -0.0308 | -0.0361 | -1.4099 | -0.0141 |
64.6 | 52.9 | 4.1949 | -0.0267 | -0.0308 | -1.2241 | -0.0122 |
66.1 | 55 | 4.2203 | -0.0292 | -0.0267 | -1.3357 | -0.0134 |
67.7 | 56.8 | 4.2413 | -0.0262 | -0.0292 | -1.2022 | -0.0120 |
69.1 | 58.8 | 4.2639 | -0.0283 | -0.0262 | -1.2985 | -0.0130 |
提示: Yt表示时均真实工资指数; Xt表示生产效率指数; e∗t=etSet=et∑e2t/(T−1)
残差序列( et)和1/100标准化残差( 0.01e∗t)时序图(serial plot)如下:
提示:et
表示残差序列(
et);et.std/100
表示1/100标准化残差序列(
e∗t/100)。
残差序列 et与残差1阶滞后序列 et−1的散点图(scatter plot)为:
提示:因为残差滞后1期序列 et−1的观测数只有45,所以此处只显示45个观测点。
思路:利用样本数据,构建并分析残差 et序列对 et−1,et−2,⋯序列的辅助回归方程,从而间接判断随机干扰项 ut的自相关性模式。
考虑如下的对应关系:
ut=ρ1ut−1+ρ2ut−2+⋯+ρput−pp∈(1,2,⋯,T−1)et=ˆρ1et−1+ˆρ2et−2+⋯+ˆρpet−p+vip∈(1,2,⋯,T−1)
步骤:
构建主回归模型,并进行OLS估计,得到残差序列(及其滞后p阶序列);
根据残差图模式,构建相应的残差辅助回归方程(无截距模型),根据回归报告,得到主模型是否存在自相关性问题的初步结论。
诊断依据:
如果残差辅助回归方程的F检验显著,则表明主模型存在残差辅助回归方程所示的自相关性问题。
如果残差辅助回归方程的F检验不显著,则表明主模型不存在残差辅助回归方程所示的自相关性问题。
利用主回归模型的残差序列 et,我们可以构建如下的辅助回归模型:
et=ˆρ1et−1+vi
OLS估计的简要报告如下:
^et=+0.87et.l1(t)(12.7360)(se)(0.0681)(fitness)R2=0.7866;¯R2=0.7818F∗=162.21;p=0.0000
提示:
et
表示残差序列 et,et.l1
表示残差序列的1阶滞后变量 et−1。
思路:分析残差 et序列对 et−1,et−2,⋯序列的自相关和偏相关统计图表报告(注意滞后阶数的选择)。
步骤:
对主模型进行OLS估计,得到残差 et序列
利用统计软件(EViews
或R
等)绘制残差序列的自相关和偏相关图表
观察和比对残差序列的自相关和偏相关图表,得到主模型是否存在自相关性问题的初步结论。
诊断依据:
et=ˆρ1et−1+ˆρ2et−2+⋯+ˆρpet−p+vip∈(1,2,⋯,T−1)
对于工资和劳动率案例,残差 et序列的自相关图(ACF)为:
残差序列et的自相关图(ACF)
对于工资和劳动率案例,残差 et序列的偏自相关图(PACF)为:
残差序列et的偏自相关图
残差自相关和偏相关分析的Eviews操作
残差自相关和偏相关的Eviews报告
假设总体回归模型PRM存在如下1阶自相关,则可以认为存在::
Yt=β1+β2Xt+utut=ρut−1+εt←[−1<ρ<1]
Yt=ˆβ1+ˆβ2Xt+etet=ˆρet−1+vi
那么就可以构造得到如下的样本Durbin-Watson的d统计量:
d=∑T2(et−et−1)2∑T1e2t
它其实是用相继残差的差异的平方和与“残差平方和RSS”之比。
由于取相继差异时损失1个观测值,德宾-沃森d统计量的分子只有 T−1次观测值。
d=∑T2(et−et−1)2∑T2e2t=∑e2t+∑e2t−1−2∑etet−1∑e2t←[∑e2t≈∑e2t−1]≐2(1−∑etet−1∑e2t)←[ˆρ=∑etet−1∑e2t]=2(1−ˆρ)
因为 0≤ˆρ≤1,所以德宾-沃森d统计量 0≤d≤4,并具有如下特征:
如果 ˆρ=+1,则 d=0,此时残差序列存在完全1阶正自相关性。
如果 ˆρ=0,则 d=2,此时残差序列不存在自相关性。
如果 ˆρ=−1,则 d=4,此时残差序列存在完全1阶负自相关性。
德宾-沃森检验法的步骤:
对主模型进行OLS估计,得到残差 et序列
得到主回归方程分析报告中的德宾-沃森d统计量(Durbin-Watson)
查找德宾-沃森统计量(Durbin-Watson)理论表,找到理论下界值 dL和理论上界值 dU。
比较德宾-沃森d统计量与查表值之间的关系,根据诊断依据,得到主模型是否存在自相关性问题的初步结论。
Durbin-Watson统计量服从 χ2(n,k,α) 分布,具体可以参看Eviews在线帮助文档
下界值 dL和上界值 dU的理论值使用bootstrap方法仿真计算得到,与 (n,k,α)有关
下界值 dL和上界值 dU的理论查表值可以参考在线文档
德宾-沃森检验法的诊断依据(后视镜法则):
如果 0<d<dL,则表明主模可能存在的1阶正自相关问题。
如果 4−dL<d<4,则表明主模型可能存在的1阶负自相关问题。
德宾-沃森检验法的诊断依据(后视镜法则):
德宾-沃森检验法的适用条件:
回归模型含有截距项,如果没有截距项,就必须重新做带有截距的回归
解释变量 X2t,X3t,⋯,Xkt是非随机的,或者说,在反复抽样中是被固定的.
随机干扰项 ut是按1阶自回归模式产生的:
Yt=β1+β2X2t+β3X3t+⋯+βkXkt+utut=ρut−1+εt←[−1<ρ<1]
Yt=β1+β2X2t+β3X3t+⋯+βkXkt+γYt−1+ut
工资-劳动率案例中,双对数主回归模型及其OLS回归结果为:
^log(Yt)=+1.61+0.65log(Xt)(t)(29.3680)(52.7996)(se)(0.0547)(0.0124)(fitness)R2=0.9845;¯R2=0.9841F∗=2787.80;p=0.0000
我们可以利用残差序列,采用R
软件计算得到德宾-沃森d统计量:
Durbin-Watson testdata: lm.mainDW = 0.21756, p-value < 2.2e-16alternative hypothesis: true autocorrelation is not 0
主回归模型Eviews操作
主回归模型Eviews报告
拉格朗日乘数检验(LM test),也称为布罗施-戈弗雷检验(Breusch-Goldfrey,BG test)。
拉格朗日乘数检验假定随机干扰项 ut服从如下的p阶自回归模式AR(p):
Yt=β1+β2X2t+β3X3t+⋯+βkXkt+utut=ρ1ut−1+ρ2ut−2+⋯+ρput−p+εt
拉格朗日乘数检验的原假设为: H0:ρ1=ρ2=⋯=ρp=0
拉格朗日乘数检验的适用条件:
可以对高阶自相关模式[AR(p)]进行检验
允许非随机回归元
允许随机干扰项为自回归异动平均ARMA(p,q)模式。也即:
Yt=β1+β2X2t+β3X3t+⋯+βkXkt+utut=ρ1ut−1+ρ2ut−2+⋯+ρput−p+εt+λ1εt−1+λ2ε2+⋯+λqεt−qεt∼iidN(0,1)
拉格朗日乘数检验的步骤:
对主模型进行OLS估计,得到残差 et序列
再利用主回归模型的残差序列,做如下的LM辅助回归:
residt=ˆα1+ˆα2X2t+ˆα3X3t+⋯+ˆαkXkt+ˆρ1et−1+ˆρ2et−2+⋯+ˆρpet−p+vt
LM≡χ2∗=(n−p)R2∼χ2(p)
拉格朗日乘数检验的诊断依据:
如果LM辅助回归方程的卡方检验显著,也即 LM≡χ2∗>χ21−α(p)(对应的概率值P< 0.1),则表明主模型是存在LM辅助回归方程形式的自相关性问题。
如果LM辅助回归方程的卡方检验不显著,也即 LM≡χ2∗<χ21−α(p)(对应的概率值P>0.1),则表明主模型是不存在LM辅助回归方程形式的自相关性问题。
工资-劳动率案例中,双对数主回归模型及其OLS回归结果为:
^log(Yt)=+1.61+0.65log(Xt)(t)(29.3680)(52.7996)(se)(0.0547)(0.0124)(fitness)R2=0.9845;¯R2=0.9841F∗=2787.80;p=0.0000
我们可以利用残差序列构建 p=1的LM辅助回归方程:
et=ˆα1+ˆα2X2t+ˆρ1et−1+vt
采用R
软件的拉格朗日乘数检验结果为:
Breusch-Godfrey test for serial correlation of order up to 1data: lm.mainLM test = 34.02, df = 1, p-value = 5.456e-09
residt=+0.0063−0.0015log(Xt)+0.8687lag(resid)1
根据LM辅助方程的计算结果,LM统计量为 LM=χ2∗= 34.0196,其对应的概率值p为0.0000。
查表也可知在当 n= 46, k= 2, α=0.05时, χ21−α(p)=χ20.95( 1 )= 3.841459要远远小于样本LM统计量值。
因此认为主模型可能存在自相关性问题。
提示: residt表示 et; lag(resid)1表示 et−1。
拉格朗日自相关检验的Eviews操作
拉格朗日自相关检验的Eviews报告
广义差分方程法 :对主回归方程进行合适的广义差分变换,使得变换以后的新模型不再有自相关问题,然后再使用OLS方法估计,从而得到参数估计的BLUE。
广义差分法变换法属于广义最小二乘法(GLS)的一种,专门用来处理随机干扰项出现自相关性问题的一种常用方法。
广义差分方程法的原理:如果主模型随机干扰项的自相关系数 ρ已知,则可以直接用差分变换得到新模型,容易证明新模型将不再有自相关问题。
下面将说明1阶自相关情形AR(1)下的广义差分变换的理论过程:
Yt=β1+β2X2t+ut(PRM)ut=ρut−1+εt(AR(1))ρYt−1=ρβ1+β2ρX2t−1+ρut−1(Lag 1 Model)(Yt−ρYt−1)=β1(1−ρ)+β2(X2t−ρX2t−1)+(ut−ρut−1)(Δ Model)Y∗t=β∗1+β∗2X∗2t+εt(Adjusted Model)
其中,AR(1)模型中的 εt∼i.i.d N(0,σ2ε)。
矫正思路:如果主模型随机干扰项的自相关系数未知,则可以直接用基于残差辅助方程估计得到 ˆρ;再根据 ρ≃ˆρ用广义差分变换得到新模型,容易证明新模型将不再有自相关问题。
如下将展示1阶自相关AR(1)情形下的广义差分变换的理论过程:
Yt=β1+β2X2t+utPRMut=ρut−1+εtAR(1)Yt=ˆβ1+ˆβ2X2t+etSRMet=ˆρet−1+vtAuxiliary Modelρ≃ˆρρYt−1=ρβ1+β2ρX2t−1+ρut−1Lag 1 Model(Yt−ρYt−1)=β1(1−ρ)+β2(X2t−ρX2t−1)+(ut−ρut−1)Δ1 ModelY∗t=β∗1+β∗2X∗2t+εtAdjusted Model
其中,AR(1)模型中的 εt∼i.i.d N(0,σ2ε)。
基于残差辅助方程近似计算自相关系数
基于残差辅助方程的广义差分矫正操作
基于残差辅助方程的广义差分矫正报告
矫正思路:如果主模型随机干扰项的自相关系数未知,则可以基于Durbin-Waston检验的d统计量计算得到 ˆρ,再根据 ρ≃ˆρ用广义差分变换得到新模型,容易证明新模型将不再有自相关问题。
如下将展示一阶自相情形下的广义差分变换的理论过程
Yt=β1+β2X2t+utPRMut=ρut−1+εtAR(1)d≃2(1−ˆρ)Durbin-Wastonˆρ≃1−d/2ρ≃ˆρρYt−1=rhoβ1+β2ρX2t−1+ρut−1Lag 1 Model(Yt−ρYt−1)=β1(1−ρ)+β2(X2t−ρX2t−1)+(ut−ρut−1)Δ1 ModelY∗t=β∗1+β∗2X∗2t+εtAdjusted Model
其中,AR(1)模型中的 εt∼i.i.d N(0,σ2ε)。
基于Durbin-Waston统计量近似计算自相关系数
基于Durbin-Waston统计量的广义差分模型矫正操作
基于Durbin-Waston统计量的广义差分模型矫正报告
矫正思路:
如果主模型随机干扰项的自相关系数未知,而且存在高阶自相关情形,则可以使用基于迭代的可行广义最小二乘法(FGLS)计算得到 ^ρ1,^ρ2,⋯,^ρp p∈(1,2,⋯),再根据 ρ≃ˆρ用广义差分变换得到新模型,容易证明新模型将不再有自相关问题。
这些迭代方法主要包括:
科克伦-奥克特迭代法(Cochrane-Orcutt iterative procedure) ;
科克伦-奥克特两步法(Cochrane-Orcutt two-step procedure) ;
德宾两步法(Durbin two-step procedure) ;
希尔德雷思-卢扫描或搜寻程序(Hildreth-Lu scanning or search procedure) 等
如下将展示科克伦-奥克特迭代法下对二阶自相关( AR(p),p=2)情形下的广义差分变换的理论过程
Yt=β1+β2X2t+utPRMut=ρ1ut−1+ρ2ut−2+εtAR(2)⋯Cochrane-Orcutt iterativeρp≃^ρpρ1Yt−1=ρ1β1+β2ρ1X2t−1+ρ1ut−1Lag 1 Modelρ2Yt−2=ρ2β1+β2ρ2X2t−2+ρ2ut−2Lag 2 Model
(Yt−ρ1Yt−1−ρ2Yt−2)=β1(1−ρ1−ρ2)+β2(X2t−ρ1X2t−1−ρ2X2t−2)+(ut−ρ1ut−1−ρ2ut−2)Δ2 ModelY∗t=β∗1+β∗2X∗2t+εtAdjusted Model
基于科克伦-奥克特迭代法的FGLS模型矫正Eviews操作
基于科克伦-奥克特迭代法的FGLS模型矫正Eviews报告
基于科克伦-奥克特迭代法近似计算的自相关系数
目标:直接用尼威-威斯特(Newey-West)一致性标准误矫正流程方法,构建回归分析模型,此时模型的自相关问题将会有所缓解。
矫正思路:利用统计软件(Eviews或R等),进行基于尼威-威斯特(Newey-West)一致性标准误矫正程序的建模分析。
理论提示:(数学表达和证明过程略)
异方差-自相关一致性标准误(heteroscedasticity-autocorralation consistent standard errors,HAC)也被简称为尼威-威斯特一致性标准误(Newey-West consistent standard errors)
尼威-威斯特(Newey-West)一致性标准误矫正程序或菜单,在主流的统计软件里都会配置
尼威-威斯特(Newey-West)一致性标准误矫正程序,严格意义上对于大样本数据是有效的,因此不太适合于小样本数据的情形。
尼威-威斯特(Newey-West)矫正法的操作
尼威-威斯特(Newey-West)矫正法的Eviews报告
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |