background-image: url("../pic/slide-front-page.jpg") class: center,middle # 计量经济学(Econometrics) ### 胡华平 ### 西北农林科技大学 ### 经济管理学院数量经济教研室 ### huhuaping01@hotmail.com ### 2023-02-15
--- class: center, middle, duke-orange,hide_logo name: chapter05 # 第5章:一元回归:模型形式扩展 .pull-left[ [5.1 过原点回归](#no-intercept) [5.2 尺度与测量单位](#scale) [5.3 标准化变量回归](#standard) ] .pull-right[ [5.4 对数线性模型](#log-log) [5.5 半对数模型](#semi-log) [5.6 倒数模型](#reciprocal-mod) [5.7 函数模型的选择](#options) ] --- layout: false class: center, middle, duke-softblue,hide_logo name: no-intercept # 5.1 过原点回归 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter05">第5章:一元回归:模型形式扩展</a>                             <a href="#no-intercept">5.1 过原点回归</a> </span></div> --- ## 过原点回归的模型形式 **过原点回归**(regression through the origin):没有截距项的线性模型 在实践中,双变量PRM过原点回归采取如下的形式: `$$\begin {align} Y_{i}=\beta_{2} X_{i}+u_{i} \end {align}$$` 适用于这种模型的例子: - 弗里德曼的持久收入假说(permanent income hypothesis); - 资本资产定价模型( the capital Asset Pricing Model, CAPM )等。 --- ## 资本资产定价模型(CAPM) 资本资产定价模型( the capital Asset Pricing Model, CAPM ): `$$\begin {align} \left(E R_{i}-r_{f}\right)=\beta_{i}\left(E R_{m}-r_{f}\right) \end {align}$$` 其中: - `\(ER_i\)`证券 `\(i\)`的期望回报率; - `\(ER_m\)`市场证券组合的期望回报率(如标准普尔S&P500综合股票指数); - `\(r_f\)`为无风险回报率(90天国债回报率)。 - `\(\beta_i\)`为系数,表明第 `\(i\)`种证券回报率与市场互动程度的度量。(注:不要把这个 `\(\beta_i\)`和双变量回归的斜率系数 `\(\beta_2\)`混同起来。) 一个大于1的 `\(\beta_i\)`意味着证券 `\(i\)`是一种易波动或进攻型证券;一个小于1的 `\(\beta_i\)`意味着证券 `\(i\)`是一种防御型证券。 --- ## 资本资产定价模型(CAPM) `$$\begin {align} R_{i}-r_{f} &=\beta_{i}\left(R_{m}-r_{f}\right)+u_{i} \\ R_{i}-r_{f} &=\alpha_{i}+\beta_{i}\left(R_{m}-r_{f}\right)+u_{i} \end {align}$$` - 如果CAPM成立,则预期 `\(\alpha_i\)`为0。 - 这样的模型如何估计呢? --- ## 资本资产定价模型(CAPM) 这类模型的SRM可以写成: `$$\begin {align} Y_{i} & =\hat{\beta}_{2} X_{i}+\mathrm{e}_{i} \\ \end {align}$$` OLS方法下求解回归系数: `$$\begin {align} \sum \mathrm{e}_{i}^{2} & =\sum\left(Y_{i}-\hat{\beta}_{2} X_{i}\right)^{2} \end {align}$$` `$$\begin {align} \frac{\partial \sum \mathrm{e}_{i}^{2}}{\partial \hat{\beta}_{2}} &=2 \sum\left(Y_{i}-\hat{\beta}_{2} X_{i}\right)\left(-X_{i}\right)=0 \\ \hat{\beta}_{2}&=\frac{\sum X_{i} Y_{i}}{\sum X_{i}^{2}}=\frac{\sum X_{i}\left(\beta_{2} X_{i}+u_{i}\right)}{\sum X_{i}^{2}}=\beta_{2}+\frac{\sum X_{i} u_{i}}{\sum X_{i}^{2}} \\ E\left(\hat{\beta}_{2}\right)&=\beta_{2} \end {align}$$` --- ## 资本资产定价模型(CAPM) OLS方法下求解得到的方差: `$$\begin{align} Var\left(\hat{\beta}_{2}\right)&=E\left(\hat{\beta}_{2}-\beta_{2}\right)^{2} \\ &= E\left[\frac{\sum X_{i} u_{i}}{\sum X_{i}^{2}}\right]^{2} \\ &= \frac{\sigma^{2}}{\sum X_{i}^{2}} \end{align}$$` `$$\begin {align} \hat{\sigma}^{2}=\frac{\sum e_{i}^{2}}{n-1}; \quad \mathrm{E}\left(\hat{\sigma}^{2}\right)=\sigma^{2} \end {align}$$` --- ## 资本资产定价模型(CAPM) OLS估计量对比:无截距和有截距的差异: .pull-left[ `$$\begin {align} Y_{i} & =\hat{\beta}_{2} X_{i}+\mathrm{e}_{i} \\ \end {align}$$` `$$\begin {align} \hat{\beta}_{2}=\frac{\sum X_{i} Y_{i}}{\sum X_{i}^{2}} \\ Var\left(\hat{\beta}_{2}\right)=\frac{\sigma^{2}}{\sum X_{i}^{2}} \\ \hat{\sigma}^{2}=\frac{\sum \mathrm{e}_{i}^{2}}{n-1} \end {align}$$` ] .pull-right[ `$$\begin {align} Y_{i} & =\hat{\beta}_{1} +\hat{\beta}_{2} X_{i}+\mathrm{e}_{i} \\ \end {align}$$` `$$\begin {align} \hat{\beta}_{2} &=\frac{\sum x_{i} y_{i}}{\sum x_{i}^{2}} \\ Var\left(\hat{\beta}_{2}\right) &=\frac{\sigma^{2}}{\sum x_{i}^{2}} \\ \hat{\sigma}^{2} &=\frac{\sum \mathrm{e}_{i}^{2}}{n-2} \end {align}$$` ] > 第一,对有截距项的模型来说,总有 `\(\sum{e_i}=0\)`;对无截距项的模型来说, `\(\sum{e_i}=0\)`不一定成立,只有 `\(\sum{e_iX_i}=0\)`成立。 > 第二,对有截距项的模型,判定系数 `\(r^2 \geq 0\)`;但是,对无截距模型来说, `\(r^2\)`时可能出现负值。 --- ## 资本资产定价模型(CAPM) 过原点回归的判定系数 `\(r^2\)`的计算公式如下: `$$\begin {align} TSS &=\sum y_{i}^{2}=\sum Y_{i}^{2}-n \overline{Y}^{2} \\ RSS &=\sum e_{i}^{2}=\sum Y_{i}^{2}-\hat{\beta}_{2}^{2} \sum X_{i}^{2}\\ r^2 &= 1- \frac{RSS}{TSS} >0; \quad r^2 = 1- \frac{RSS}{TSS} <0; \end {align}$$` 因此,对于无截距模型,我们给出拟合优度指标为**毛判定系数**(Raw `\(r^2\)`): `$$\begin {align} Raw \quad r^{2} = \frac{\sum\left(X_{i} Y_{i}\right)^{2}}{\sum X_{i}^{2} \sum Y_{i}^{2}} \end {align}$$` --- ## 资本资产定价模型(CAPM) **启示**: - 第一,尽管模型含有截距项,但若该项的出现是统计上不显著的(即统计上等于零) ,则从任何实际方面考虑,都可认为这个结果是一个过原点回归模型。 - 第二,如果在模型中确实有截距,而我们却执意拟合一个过原点回归,我们就犯了**设定错误**。 --- ### 资本资产定价模型(CAPM):数据 1980.01-1999.12年间104 种股票构成的一个指数的超额回报率 `\(Y_t\)`(%)和英国总体股票指数的超额回报率 `\(X_t\)`(%)的月度数据共n=240个月观测。其中超额回报率指的是超过无风险资产回报率的部分。
--- ### 资本资产定价模型(CAPM):散点图 下面先直接给出二者的散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-3-1.png" style="display: block; margin: auto;" /> --- ### 资本资产定价模型(CAPM):回归结果 两类模型回归结果对比: .pull-left[ **无截距模型**: `$$\begin {align} Y_{i} & =\hat{\beta}_{2} X_{i}+\mathrm{e}_{i} \end {align}$$` `$$\begin{equation} \begin{alignedat}{999} &\widehat{Y}=&&+1.16X\\ &\text{(t)}&&(15.5320)\\&\text{(se)}&&(0.0744)\\&\text{(fitness)}&& R^2=0.5023;&& \bar{R^2}=0.5003\\& && F^{\ast}=241.24;&& p=0.0000 \end{alignedat} \end{equation}$$` ] .pull-right[ **有截距模型**: `$$\begin {align} Y_{i} & =\hat{\beta}_{1} +\hat{\beta}_{2} X_{i}+\mathrm{e}_{i} \end {align}$$` `$$\begin{equation} \begin{alignedat}{999} &\widehat{Y}=&&-0.45&&+1.17X\\ &\text{(t)}&&(-1.2329)&&(15.5350)\\&\text{(se)}&&(0.3629)&&(0.0754)\\&\text{(fitness)}&& R^2=0.5035;&& \bar{R^2}=0.5014\\& && F^{\ast}=241.34;&& p=0.0000 \end{alignedat} \end{equation}$$` ] --- layout: false class: center, middle, duke-softblue,hide_logo name: scale # 5.2 尺度与测量单位 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter05">第5章:一元回归:模型形式扩展</a>                             <a href="#scale">5.2 尺度与测量单位</a> </span></div> --- ## 案例数据 回归分析中,因变量Y和解释变量X的测量单位不同会造成回归结果的差异吗?
> - GPDIB = 以2000年**10亿**(Billions)美元计国内私人总投资; GPDIM = 以2000年**百万**(millions)美元计国内私人总投资; - GDPB = 以2000年**10亿**(Billions)美元计GDP总值; GDPM = 以2000年**百万**(millions)美元计GDP总值。 --- ## 尺度变换 把某一测量单位下的回归模型,变换为另一测量单位的回归模型: `$$\begin {align} Y_{i} & =\hat{\beta}_{1} +\hat{\beta}_{2} X_{i}+\mathrm{e}_{i}\\ Y^{\ast}_{i} & =\hat{\beta}^{\ast}_{1} +\hat{\beta}^{\ast}_{2} X_{i}+\mathrm{e}^{\ast}_{i} \end {align}$$` **尺度因子**: `\(\omega_1;\omega_2\)`分别表示为Y和X的尺度因子。 `$$\begin {align} Y_{i}^{*}=\omega_{1} Y_{i} \quad X_{i}^{*}=\omega_{2} X_{i} \end {align}$$` 如果 `\((Y_i;X_i)\)`都是以**10亿**(billion)美元计量的,我们把它们改为用**百万**(million)美元去度量,就会有: `$$\begin {align} Y_{i}^{*}=1000 Y_{i}; \quad X_{i}^{*}=1000 X_{i}; \quad \omega_{1}=\omega_{2}=1000 \end {align}$$` --- ## OLS估计 进行数据转换,新模型的OLS估计量如下: `$$\begin {align} Y_{i} & =\hat{\beta}_{1} +\hat{\beta}_{2} X_{i}+\mathrm{e}_{i}\\ Y^{\ast}_{i} & =\hat{\beta}^{\ast}_{1} +\hat{\beta}^{\ast}_{2} X_{i}+\mathrm{e}^{\ast}_{i} \\ Y_{i}^{*}&=\omega_{1} Y_{i} ; \quad X_{i}^{*}=\omega_{2} X_{i} ; \quad e_{i}^{*}=\omega_{1} e_{i} \end {align}$$` `$$\begin {align} \hat{\beta}_{2} * &=\frac{\sum x_{i}^{*} y_{i}^{*}}{\sum x_{i}^{* 2}} \quad && \Leftarrow \operatorname{var}\left(\hat{\beta}_{2}^{*}\right)=\frac{\sigma^{* 2}}{\sum x_{i}^{* 2}}\\ \hat{\beta}_{1}^{*}&=\overline{Y}^{*}-\hat{\beta}_{2}^{*} \overline{X}^{*} \quad && \Leftarrow \operatorname{var}\left(\hat{\beta}_{1}^{*}\right)=\frac{\sum X_{i}^{* 2}}{n \sum x_{i}^{* 2}} \cdot \sigma^{* 2}\\ \hat{\sigma}^{* 2} &=\frac{\sum e_{i}^{* 2}}{n-2} \end {align}$$` --- ## OLS估计 进行数据转换,两个模型下OLS估计量有如下关系: `$$\begin {align} Y_{i} & =\hat{\beta}_{1} +\hat{\beta}_{2} X_{i}+\mathrm{e}_{i}\\ Y^{\ast}_{i} & =\hat{\beta}^{\ast}_{1} +\hat{\beta}^{\ast}_{2} X_{i}+\mathrm{e}^{\ast}_{i} \\ Y_{i}^{*}&=\omega_{1} Y_{i} ; \quad X_{i}^{*}=\omega_{2} X_{i} ; \quad e_{i}^{*}=\omega_{1} e_{i} \end {align}$$` `$$\begin {align} \hat{\beta}_{1}^{*} &=\left(\omega_{1}\right) \hat{\beta}_{1} ; && \hat{\beta}_{2}^{*} =\left(\frac{\omega_{1}}{\omega_{2}}\right) \hat{\beta}_{2} \\ \operatorname{var}\left(\hat{\beta}_{2}^{*}\right) &=\left(\frac{\omega_{1}}{\omega_{2}}\right)^{2} \operatorname{var}\left(\hat{\beta}_{2}\right) ; && \operatorname{var}\left(\hat{\beta}_{1}^{*}\right) =\omega_{1}^{2} \operatorname{var}\left(\hat{\beta}_{1}\right) \\ \hat{\sigma}^{* 2} & =\omega_{1}^{2} \hat{\sigma}^{2} \\ r_{x y}^{2} & =r_{x * y^{*}}^{2} \end {align}$$` --- ## 相关结论 `$$\begin {align} Y_{i} & =\hat{\beta}_{1} +\hat{\beta}_{2} X_{i}+\mathrm{e}_{i}\\ Y^{\ast}_{i} & =\hat{\beta}^{\ast}_{1} +\hat{\beta}^{\ast}_{2} X_{i}+\mathrm{e}^{\ast}_{i} \\ Y_{i}^{*}&=\omega_{1} Y_{i} ; \quad X_{i}^{*}=\omega_{2} X_{i} ; \quad e_{i}^{*}=\omega_{1} e_{i} \end {align}$$` 模型对比,得出如下主要结论: - `\(\omega_1=\omega_2\)` ,即尺度因子相等时,**斜率系数**及其**标准误**不受尺度从( `\(Y_i,X_i\)`)到( `\(Y_i^{\ast},X_i^{\ast}\)`)的影响。**截距**及其**标准误**却放大或缩小至 `\(\omega_1\)`倍。 - `\(X_i\)`尺度不变 `\(\omega_2=1\)`, `\(Y_i\)`尺度因子 `\(\omega_1\)`变化,那么,斜率和截距系数以及它们各自的标准误都要乘以同样的因子 `\(\omega_1\)`。 - `\(Y_i\)`尺度不变 `\(\omega_1=1\)` ,而 `\(X_i\)`尺度因子 `\(\omega_2\)`变化,那么,斜率系数及其标准误都要乘以因子 `\(1/\omega_1\)`,而截距系数及其标准误不变。 --- ### 案例分析结果 -- .pull-left[ GPDI和GDP都以十亿美元计算: `$$\begin{equation} \begin{alignedat}{999} &\widehat{GPDIB}=&&-926.09&&+0.25GDPB\\ &\text{(t)}&&(-7.9590)&&(19.5824)\\&\text{(se)}&&(116.3577)&&(0.0129)\\&\text{(fitness)}&& R^2=0.9648;&& \bar{R^2}=0.9623\\& && F^{\ast}=383.47;&& p=0.0000 \end{alignedat} \end{equation}$$` GPDI和GDP都以百万美元计算: `$$\begin{equation} \begin{alignedat}{999} &\widehat{GPDIM}=&&-926090.39&&+0.25GDPM\\ &\text{(t)}&&(-7.9590)&&(19.5824)\\&\text{(se)}&&(116357.6965)&&(0.0129)\\&\text{(fitness)}&& R^2=0.9648;&& \bar{R^2}=0.9623\\& && F^{\ast}=383.47;&& p=0.0000 \end{alignedat} \end{equation}$$` ] -- .pull-right[ GPDI以十亿美元,而GDP以百万美元: `$$\begin{equation} \begin{alignedat}{999} &\widehat{GPDIB}=&&-926.09&&+0.00GDPM\\ &\text{(t)}&&(-7.9590)&&(19.5824)\\&\text{(se)}&&(116.3577)&&(0.0000)\\&\text{(fitness)}&& R^2=0.9648;&& \bar{R^2}=0.9623\\& && F^{\ast}=383.47;&& p=0.0000 \end{alignedat} \end{equation}$$` GPDl以百万美元而GDP 以十亿美元: `$$\begin{equation} \begin{alignedat}{999} &\widehat{GPDIM}=&&-926090.39&&+253.52GDPB\\ &\text{(t)}&&(-7.9590)&&(19.5824)\\&\text{(se)}&&(116357.6965)&&(12.9465)\\&\text{(fitness)}&& R^2=0.9648;&& \bar{R^2}=0.9623\\& && F^{\ast}=383.47;&& p=0.0000 \end{alignedat} \end{equation}$$` ] --- layout: false class: center, middle, duke-softblue,hide_logo name: standard # 5.3 标准化变量回归 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter05">第5章:一元回归:模型形式扩展</a>                             <a href="#standard">5.3 标准化变量回归</a> </span></div> --- ## 标准化变量回归 假设如下双变量回归: `$$\begin {align} Y_{i} & =\hat{\beta}_{1} +\hat{\beta}_{2} X_{i}+\mathrm{e}_{i} \end {align}$$` 对Y和X作如下标准化变换,得到相应的**标准化变量**: `$$\begin {align} Y_{i}^* & =\frac{Y_{i}-\overline{Y}}{S_{Y}}; \quad X_{i}^ *=\frac{X_{i}-\overline{X}}{S_{X}} \end {align}$$` - 标准化变量的特征是:其均值总是0 和标准差总是1。 --- ## 标准化变量回归 得到如下新的双变量回归模型: `$$\begin {align} Y_{i}^* & =\hat{\beta}_{1}^{*}+\hat{\beta}_{2}^{*} X_{i}+e_{i}^{*} \\ &=\hat{\beta}_{2}^{*} X_{i}+e_{i}^{*} \end {align}$$` - 对标准化的回归子和回归元做回归,截距项总是零! - 实际上变成了过原点回归模型! --- ## 标准化变量回归 模型比较与结论: - 第一,由于标准化回归本质上是一个过原点回归,而我们在已经指出通常过原点回归的不能使用 `\(r^2\)`,所以我们就没有给出其 `\(r^2\)`值。 - 第二,传统模型的系数与这里的系数之间存在一种有趣的关系。在双变量情形中,这种关系如下(证明过程略:自学练习题!): `$$\begin {align} \hat{\beta}_{2}^{*}=\frac{\mathrm{S}_{X}}{\mathrm{S}_{\mathrm{Y}}} \hat{\beta}_{2} \end {align}$$` - 第三,在多元回归中,变量标准化可以去除多个自变量之间数量尺度(量纲)的差别,因而具有一定的优点! --- ### 标准化数据变换 下面我们对以十亿美元计的GPDIB和GDPB进行标准化数据变换:
--- ### OLS比较 GPDI和GDP都以十亿美元计算: `$$\begin{equation} \begin{alignedat}{999} &\widehat{GPDIB}=&&-926.09&&+0.25GDPB\\ &\text{(t)}&&(-7.9590)&&(19.5824)\\&\text{(se)}&&(116.3577)&&(0.0129)\\&\text{(fitness)}&& R^2=0.9648;&& \bar{R^2}=0.9623\\& && F^{\ast}=383.47;&& p=0.0000 \end{alignedat} \end{equation}$$` 标准化变量后的模型估计: `$$\begin{equation} \begin{alignedat}{999} &\widehat{GPDIB_std}=&&+0.98GDPB_{std}\\ &\text{(t)}&&(20.2697)\\&\text{(se)}&&(0.0485)\\&\text{(fitness)}&& R^2=0.9648;&& \bar{R^2}=0.9624\\& && F^{\ast}=410.86;&& p=0.0000 \end{alignedat} \end{equation}$$` --- layout: false class: center, middle, duke-softblue,hide_logo # 回归模型的函数形式 ### 对数线性模型 ### 半对数模型 ### 倒数模型 --- layout: false class: center, middle, duke-softblue,hide_logo name:log-log # 5.4 对数线性模型 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter05">第5章:一元回归:模型形式扩展</a>                             <a href="#log-log">5.4 对数线性模型</a> </span></div> --- ## 对数线性模型的形式 **指数回归模型**(exponential regression model) `$$\begin {align} Y_{i}=\beta_{1} X_{i}^{\beta_{2}} e^{u_{i}} \end {align}$$` 可化为: `$$\begin {align} \ln Y_{i} &=\ln \beta_{1}+\beta_{2} \ln X_{i}+u_{i} \\ \ln Y_{i} &=\alpha+\beta_{2} \ln X_{i}+u_{i} && \Leftarrow \alpha=\ln \beta_{1} \end {align}$$` 这种模型被称为对数-对数(log-log),双对数(double-log)或对数一线性(log-linear)模型。进而有: `$$\begin {align} Y_{i}^{*}&=\alpha+\beta_{2} X_{i}^{*}+u_{i} &&\Leftarrow \left[ Y_{i}^{*}=\ln Y_{i} ; \quad X_{i}^{*}=\ln X_{i} \right] \end {align}$$` 从而可用OLS方法可以得到BLUE估计量: `$$\begin {align} Y_{i}^{*}=\hat{\alpha}+\hat{\beta}_{2} X_{i}^{*}+\mathrm{e}_{i} \end {align}$$` --- ## 对数线性模型:学会如何测度弹性 双数线性模型: `$$\begin {align} \ln Y_{i}&=\alpha+\beta_{2} \ln X_{i}+u_{i} \\ Y_{i}^{*}&=\hat{\alpha}+\hat{\beta}_{2} X_{i}^{*}+\mathrm{e}_{i} && \Leftarrow \hat{\alpha}=\ln \hat{\beta}_{1} \end {align}$$` `$$\begin {align} \beta_{2}=\frac{d(\ln Y)}{d(\ln X)}=\frac{\frac{1}{Y} d Y}{\frac{1}{X} d X}=\frac{d Y / Y}{d X / X} \end {align}$$` 斜率就是Y对X的弹性!如果Y代表商品需求量Q,X代表商品价格P,则就表示该商品的需求价格弹性。 --- ## 学会如何测度弹性 双数线性模型有如下性质: - Y对X的弹性在整个研究范围内是常数,一直为 `\(\beta_2\)`,因此这种模型也称为不变弹性模型(constant elasticity model)。 - 虽然 `\(\hat{\alpha}\)`和 `\(\hat{\beta}_2\)`是无偏估计量,但是进入原始模型的参数 `\(\beta_1\)`的估计值 `\(\hat{\beta}_1\)`却是有偏估计,而且 `\(\beta_{1}=antilog\hat{\alpha}\)`。 <img src="../pic/chpt5-elasticity.png" width="536" style="display: block; margin: auto;" /> --- ### 耐用品消费案例 耐用品支出与个人消费总支出的关系:
其中:PCEXP=个人消费支出, EXPDUR=耐用品消费支出,单位10亿美元(按2000年价格计) --- ### 耐用品消费案例 假设我们想求出耐用品支出对个人消费总支出的**斜率**。 将耐用品支出相对于个人消费总支出做散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-18-1.png" style="display: block; margin: auto;" /> --- ### 耐用品消费案例 假设我们想求出耐用品支出对个人消费总支出的**弹性**。 将耐用品支出的**对数**相对于个人消费总支出的**对数**做散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-19-1.png" style="display: block; margin: auto;" /> --- ### 耐用品消费案例 耐用品消费案例中,我们可以实证得到如下的**双对数模型**: `$$\begin{equation} \begin{alignedat}{999} &\widehat{log(EXPDUR)}=&&-7.54&&+1.63log(PCEXP)\\ &\text{(t)}&&(-10.5309)&&(20.3152)\\&\text{(se)}&&(0.7161)&&(0.0801)\\&\text{(fitness)}&& R^2=0.9695;&& \bar{R^2}=0.9671\\& && F^{\ast}=412.71;&& p=0.0000 \end{alignedat} \end{equation}$$` --- layout: false class: center, middle, duke-softblue,hide_logo name: semi-log # 5.5 半对数模型 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter05">第5章:一元回归:模型形式扩展</a>                             <a href="#semi-log">5.5 半对数模型</a> </span></div> --- ## 线性到对数模型 怎样测量增长率?经济学家、企业人员与政府常常对于求出某些经济变量的增长率感兴趣,如人口、GNP、货币供给、就业、生产力、贸易赤字等。 `$$\begin {align} Y_{t}=Y_{0}(1+r)^{t} \end {align}$$` `\(Y_t\)`=时期t的劳务实际支出; `\(Y_0\)`=劳务实际支出的初始值(为2002年第四季度末的值);r是Y的复合增长率。
--- ## 线性到对数模型 半对数模型(semilog models): - 线性到对数模型(log-lin model):只有回归子Y取对数 - 对数到线性模型(lin-log model):只有回归元X取对数 --- ## 线性到对数模型 半对数模型的形式: `$$\begin {align} Y_{t} &=Y_{0}(1+r)^{t} \\ \ln Y_{t} &=\ln Y_{0}+t \ln (1+r) \\ \ln Y_{t} &=\beta_{1}+\beta_{2} t && \Leftarrow \left[ \beta_{1}=\ln Y_{0}; \quad \beta_{2}=\ln (1+r) \right]\\ \ln Y_{t} &=\beta_{1}+\beta_{2} t+u_{t} \end {align}$$` 斜率 `\(\beta_2\)`的经济学含义: `$$\begin {align} \beta_{2}=\frac{d \ln Y}{d t}=\frac{d Y / Y}{d t} \end {align}$$` **恒定相对增长率模型**:上述模型描述了因变量Y的恒定相对增长率 - 恒定相对增长模型: `\(\beta_2 > 0\)` - 恒定相对衰减模型: `\(\beta_2 < 0\)` --- ### 散点图1 <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-22-1.png" style="display: block; margin: auto;" /> --- ### 散点图2 <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-23-1.png" style="display: block; margin: auto;" /> --- ### OLS估计 半对数模型:线性到对数模型 `$$\begin {align} \ln Y_{t} &=\beta_{1}+\beta_{2} t+u_{t} && \Leftarrow \left[ \beta_{1}=\ln Y_{0}; \quad \beta_{2}=\ln (1+r) \right] \end {align}$$` `$$\begin{equation} \begin{alignedat}{999} &\widehat{log(EXPSERVICES)}=&&+8.32&&+0.01t\\ &\text{(t)}&&(5186.2999)&&(39.9648)\\&\text{(se)}&&(0.0016)&&(0.0002)\\&\text{(fitness)}&& R^2=0.9919;&& \bar{R^2}=0.9913\\& && F^{\ast}=1597.18;&& p=0.0000 \end{alignedat} \end{equation}$$` .pull-left[ `$$\begin {align} \begin{aligned} \hat{\beta}_{2} &=\ln (1+r)=0.00705 \\ r &=\operatorname{antilog}\left(\hat{\beta}_{2}\right)-1 \\ &=\operatorname{antilog}(0.00705)-1 \\ &=0.00708 \end{aligned} \end {align}$$` ] .pull-right[ - `\(\hat{\beta}_{2}=0.00705\)`表示**瞬时增长率** - `\(r=0.00708\)`表示**复合增长率** ] --- ### 回归结果比较 下面做一个对比模型。线性趋势模型:Y直接对时间t回归: `$$\begin {align} Y_{t}=\beta_{1}+\beta_{2} t+u_{t} \end {align}$$` `$$\begin{equation} \begin{alignedat}{999} &\widehat{EXPSERVICES}=&&+4111.54&&+30.67t\\ &\text{(t)}&&(655.5628)&&(44.4671)\\&\text{(se)}&&(6.2718)&&(0.6898)\\&\text{(fitness)}&& R^2=0.9935;&& \bar{R^2}=0.9930\\& && F^{\ast}=1977.32;&& p=0.0000 \end{alignedat} \end{equation}$$` **解释如下**:在2003年第1季度至2006年第3季度期间,劳务支出以每季度约300 亿美元的绝对速度(注意不是相对速度)增加,即劳务支出有上涨的趋势。 --- ## 对数到线性模型(lin-log model) 如果我们的目的是测量X的一个百分比变化时,Y的绝对变化量,则要用**对数到线性模型**(lin-log model)。 `$$\begin {align} Y_{t}=\beta_{1}+\beta_{2} \ln X_{i}+u_{i} \end {align}$$` `$$\begin {align} \beta_2 & =\frac{d Y}{d \ln X}=\frac{d Y}{d X / X}=\frac{\Delta \mathrm{Y}}{\Delta \mathrm{X} / X} \\ \Delta \mathrm{Y} & =\beta_{2} \frac{\Delta \mathrm{X}}{\mathrm{X}} \end {align}$$` 例如:恩格尔支出(Engel expenditure) 模型: - “用于食物的总支出以算术级数增加,而总支出以几何级数增加。” --- ### 家庭食物支出案例 食物支出(`foodexp`)与家庭总支出(`totalexp`)的关系:
--- ### 家庭食物支出案例 原始数据作散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-28-1.png" style="display: block; margin: auto;" /> --- ### 家庭食物支出案例 对家庭总支出取对数`ln(totalexp)`,再做散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-29-1.png" style="display: block; margin: auto;" /> --- ### 家庭食物支出案例 .pull-left[ 构建如下对数到线性模型: `$$\begin {align} Y_{t}=\beta_{1}+\beta_{2} \ln X_{i}+u_{i} \end {align}$$` 家庭食物支出案例的OLS估计结果如下: `$$\begin{equation} \begin{alignedat}{999} &\widehat{foodexp}=&&-1283.91&&+257.27log(totalexp)\\ &\text{(t)}&&(-4.3848)&&(5.6625)\\&\text{(se)}&&(292.8105)&&(45.4341)\\&\text{(fitness)}&& R^2=0.3769;&& \bar{R^2}=0.3652\\& && F^{\ast}=32.06;&& p=0.0000 \end{alignedat} \end{equation}$$` ] .pull-right[ 对比构建如下经典线性模型及其OLS估计结果: `$$\begin {align} Y_{t}=\beta_{1}+\beta_{2} X_{i}+u_{i} \end {align}$$` `$$\begin{equation} \begin{alignedat}{999} &\widehat{foodexp}=&&+94.21&&+0.44totalexp\\ &\text{(t)}&&(1.8524)&&(5.5770)\\&\text{(se)}&&(50.8563)&&(0.0783)\\&\text{(fitness)}&& R^2=0.3698;&& \bar{R^2}=0.3579\\& && F^{\ast}=31.10;&& p=0.0000 \end{alignedat} \end{equation}$$` ] --- layout: false class: center, middle, duke-softblue,hide_logo name: reciprocal-mod # 5.6 倒数模型 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter05">第5章:一元回归:模型形式扩展</a>                             <a href="#reciprocal-mod">5.6 倒数模型</a> </span></div> --- ## 倒数模型 .pull-left[ **形式**: `$$\begin {align} Y_{i}=\beta_{1}+\beta_{2}\left(\frac{1}{X_{i}}\right)+u_{i} \end {align}$$` **特征**:总有一条内在的渐近线! - a.平均固定成本(AFC)曲线 - b.菲利普斯曲线(Phillips curve) - c.恩格尔曲线(the Engel expenditure curve) ] .pull-right[ <img src="../pic/chpt4-reciprocal-model.png" width="567" style="display: block; margin: auto;" /> `$$\begin {align} X \rightarrow \infty ; \quad \beta_{2}\left(\frac{1}{X}\right) \rightarrow 0 ; \quad Y \rightarrow \beta_{1} \end {align}$$` ] --- ### 儿童死亡率案例 儿童死亡率(`CM`,千分数)与人均GNP(`PGNP`,1980年的人均GNP)的关系:
--- ### 儿童死亡率案例 原始数据作散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-35-1.png" style="display: block; margin: auto;" /> --- ### 儿童死亡率案例 把PGNP取倒数 `\(1/PGNP\)`再作散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-36-1.png" style="display: block; margin: auto;" /> --- ### 儿童死亡率案例 .pull-left[ 构建如下倒数模型: `$$\begin {align} Y_{i}=\beta_{1}+\beta_{2}\left(\frac{1}{X_{i}}\right)+u_{i} \end {align}$$` 儿童死亡率案例倒数模型的OLS估计结果如下: `$$\begin{equation} \begin{alignedat}{999} &\widehat{CM}=&&+81.79&&+27273.17rep_{PGNP}\\ &\text{(t)}&&(7.5511)&&(7.2535)\\&\text{(se)}&&(10.8321)&&(3759.9992)\\&\text{(fitness)}&& R^2=0.4591;&& \bar{R^2}=0.4503\\& && F^{\ast}=52.61;&& p=0.0000 \end{alignedat} \end{equation}$$` ] .pull-right[ 对比构建如下经典线性模型: `$$\begin {align} Y_{t}=\beta_{1}+\beta_{2} X_{i}+u_{i} \end {align}$$` 其OLS估计结果如下: `$$\begin{equation} \begin{alignedat}{999} &\widehat{CM}=&&+157.42&&-0.01PGNP\\ &\text{(t)}&&(15.9893)&&(-3.5157)\\&\text{(se)}&&(9.8456)&&(0.0032)\\&\text{(fitness)}&& R^2=0.1662;&& \bar{R^2}=0.1528\\& && F^{\ast}=12.36;&& p=0.0008 \end{alignedat} \end{equation}$$` ] --- ### 菲利普斯曲线 通货膨胀率(`infrate`,%)与失业率(`unrate`,%)的关系:
--- ### 菲利普斯曲线 原始数据作散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-41-1.png" style="display: block; margin: auto;" /> --- ### 菲利普斯曲线 把失业率`unrate`取倒数 `\(1/unrate\)`再作散点图: <img src="05-simple-reg-eq-forms-slide_files/figure-html/unnamed-chunk-42-1.png" style="display: block; margin: auto;" /> --- ### 菲利普斯曲线 .pull-left[ 构建如下倒数模型: `$$\begin {align} Y_{i}=\beta_{1}+\beta_{2}\left(\frac{1}{X_{i}}\right)+u_{i} \end {align}$$` 菲利普斯曲线案例倒数模型的OLS估计结果如下: `$$\begin{equation} \begin{alignedat}{999} &\widehat{infrate}=&&+7.37&&-17.37rep_{unrate}\\ &\text{(t)}&&(4.1723)&&(-1.8212)\\&\text{(se)}&&(1.7670)&&(9.5364)\\&\text{(fitness)}&& R^2=0.0686;&& \bar{R^2}=0.0479\\& && F^{\ast}=3.32;&& p=0.0752 \end{alignedat} \end{equation}$$` ] .pull-right[ 对比构建如下经典线性模型及其OLS估计结果: `$$\begin {align} Y_{t}=\beta_{1}+\beta_{2} X_{i}+u_{i} \end {align}$$` `$$\begin{equation} \begin{alignedat}{999} &\widehat{infrate}=&&+0.81&&+0.59unrate\\ &\text{(t)}&&(0.4642)&&(2.0377)\\&\text{(se)}&&(1.7347)&&(0.2874)\\&\text{(fitness)}&& R^2=0.0845;&& \bar{R^2}=0.0641\\& && F^{\ast}=4.15;&& p=0.0475 \end{alignedat} \end{equation}$$` ] --- layout: false class: center, middle, duke-softblue,hide_logo name: options # 5.7 函数形式的选择 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@ <a href="#chapter05">第5章:一元回归:模型形式扩展</a>                             <a href="#options">5.7 函数形式的选择 </a></span></div> --- ## 技巧和经验 选择适当模型时,需要一些技巧和经验: 1. 模型背后的理论(如菲利普斯曲线〉可能给出了一个特定的函数形式。 2. 最好能求出回归子相对回归元的变化率〈即斜率〉和回归子对回归元的弹性(见下页ppt)。 3. 所选模型的系数应该满足一定的先验预期。 4. 有时多个模型都能相当不错地拟合一个给定的数据集。 5. 通常不应该过分强调这个指标 6. 在有些情形中,确定一个特定的函数形式不是那么容易,此时我们或许可以使用所谓的博克斯-考克斯变换(Box-Cox transformations) --- ## 计算表一览 <table class="table" style="margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:center;"> 模型 </th> <th style="text-align:center;"> 方程 </th> <th style="text-align:center;"> 斜率 </th> <th style="text-align:center;"> 点弹性 </th> <th style="text-align:center;"> 平均弹性 </th> </tr> </thead> <tbody> <tr> <td style="text-align:center;"> models </td> <td style="text-align:center;"> eq </td> <td style="text-align:center;"> \(\frac{dY}{dX}\) </td> <td style="text-align:center;"> \(\frac{dY}{dX}\cdot\frac{X_i}{Y_i}\) </td> <td style="text-align:center;"> \(\frac{dY}{dX}\cdot\frac{\bar{X}}{\bar{Y}}\) </td> </tr> <tr> <td style="text-align:center;"> \(M_1\)线性模型 </td> <td style="text-align:center;"> \(Y_i=\beta_1+\beta_2X_i+u_i\) </td> <td style="text-align:center;"> \(\beta_2\) </td> <td style="text-align:center;"> \(\beta_2{X_i}/{Y_i}\) </td> <td style="text-align:center;"> \(\beta_2{\bar{X}}/{\bar{Y}}\) </td> </tr> <tr> <td style="text-align:center;"> \(M_2\)过原点模型 </td> <td style="text-align:center;"> \(Y_i=\beta_2X_i+u_i\) </td> <td style="text-align:center;"> \(\beta_2\) </td> <td style="text-align:center;"> \(\beta_2{X_i}/{Y_i}\) </td> <td style="text-align:center;"> \(\beta_2{\bar{X}}/{\bar{Y}}\) </td> </tr> <tr> <td style="text-align:center;"> \(M_3\)双对数模型 </td> <td style="text-align:center;"> \(ln(Y_i)=\beta_1+\beta_2ln(X_i)+u_i\) </td> <td style="text-align:center;"> \(\beta_2Y_i/X_i\) </td> <td style="text-align:center;"> \(\beta_2\) </td> <td style="text-align:center;"> \(\beta_2\) </td> </tr> <tr> <td style="text-align:center;"> \(M_4\)线性到对数模型 </td> <td style="text-align:center;"> \(ln(Y_i)=\beta_1+\beta_2X_i+u_i\) </td> <td style="text-align:center;"> \(\beta_2Y_i\) </td> <td style="text-align:center;"> \(\beta_2{X_i}\) </td> <td style="text-align:center;"> \(\beta_2{\bar{X}}\) </td> </tr> <tr> <td style="text-align:center;"> \(M_5\)对数到线性模型 </td> <td style="text-align:center;"> \(Y_i=\beta_1+\beta_2ln(X_i)+u_i\) </td> <td style="text-align:center;"> \(\beta_2/X_i\) </td> <td style="text-align:center;"> \(\beta_2/{Y_i}\) </td> <td style="text-align:center;"> \(\beta_2/{\bar{Y}}\) </td> </tr> <tr> <td style="text-align:center;"> \(M_6\)倒数模型 </td> <td style="text-align:center;"> \(Y_i=\beta_1+\beta_2/X_i+u_i\) </td> <td style="text-align:center;"> \(-\beta_2/X_i^2\) </td> <td style="text-align:center;"> \(-\beta_2/({X_i}{Y_i})\) </td> <td style="text-align:center;"> \(-\beta_2/({\bar{X}}{\bar{Y}})\) </td> </tr> <tr> <td style="text-align:center;"> \(M_7\)对数倒数模型 </td> <td style="text-align:center;"> \(ln(Y_i)=\beta_1-\beta_2/X_i+u_i\) </td> <td style="text-align:center;"> \(\beta_2Y_i/X_i^2\) </td> <td style="text-align:center;"> \(\beta_2/{X_i}\) </td> <td style="text-align:center;"> \(\beta_2/{\bar{X}}\) </td> </tr> </tbody> </table> --- layout:false background-image: url("../pic/thank-you-gif-funny-little-yellow.gif") class: inverse,center # 本章结束