background-image: url("../pic/slide-front-page.jpg") class: center,middle exclude: FALSE # 统计学原理(Statistic) <!--- chakra: libs/remark-latest.min.js ---> ### 胡华平 ### 西北农林科技大学 ### 经济管理学院数量经济教研室 ### huhuaping01@hotmail.com ### 2021-05-18
--- class: center, middle, duke-orange,hide_logo name: chapter exclude: FALSE # 第五章 相关和回归分析 ### [5.1 变量间关系的度量](#corl) ### [5.2 回归分析的基本思想](#concept) ### [5.3 OLS方法与参数估计](#ols) ### [5.4 假设检验](#hypthesis) ### [5.5 拟合优度与残差分析](#goodness) ### [5.6 回归预测分析](#forecast) ### [.white[5.7 回归报告解读]](#report) --- layout: false class: center, middle, duke-softblue,hide_logo name: report # 5.7 回归报告解读 ### 方程表达式 ### 表格表达式 ### 统计软件 --- layout: true <div class="my-header-h2"></div> <div class="watermark1"></div> <div class="watermark2"></div> <div class="watermark3"></div> <div class="my-footer"><span>huhuaping@    <a href="#chapter"> 第05章 相关和回归分析 </a>                       <a href="#report"> 5.7 回归报告解读 </a> </span></div> --- exclude:true ## (案例)教育程度与时均工资 ``` Warning: `funs()` was deprecated in dplyr 0.8.0. Please use a list of either functions or lambdas: # Simple named list: list(mean = mean, median = median) # Auto named with `tibble::lst()`: tibble::lst(mean, median) # Using lambdas list(~ mean(., trim = .2), ~ median(., na.rm = TRUE)) ``` --- ## 回归分析的形式 **课程要求**:会熟练、正确阅读统计软件给出的各类分析报告,理解其中的关键信息和内涵。这些分析报告包括:传统的多元回归分析报告;以及各种计量检验的辅助分析报告(如异方差white检验报告)等。 根据统计软件的不同(`stata`;`Eview`;`R`;`Excel` ……),各种分析报告呈现形式略有差异,但基本要素和信息都大抵一致。 给定如下一元回归模型: `$$Y_i = \beta_1 + \beta_2X_i +u_i$$` --- ## 回归分析的形式(多行方程表达法) **形式1:多行方程表达法**(整理好的**精炼报告**):根据统计软件的原始报告,选取最关键的信息,经过整理并以多行**样本回归方程**(SRF)的形式呈现。例如: `$$\begin{equation} \begin{alignedat}{999} &\widehat{Y}=&&-0.01&&+0.72X\\ &\text{(t)}&&(-0.0165)&&(10.4065)\\&\text{(se)}&&(0.8746)&&(0.0696)\\&\text{(fitness)}&& R^2=0.9078;&& \bar{R^2}=0.8994\\& && F^{\ast}=108.29;&& p=0.0000 \end{alignedat} \end{equation}$$` -- - 第1行表示样本回归函数(回归系数) - 第2行(t)表示回归系数对应的**样本t统计量**( `\(t^{\ast}_{\hat{\beta}_i},i \in 1,2,\cdots, k\)`) - 第3行(se)表示回归系数对应的**样本标准误差**( `\(S_{\hat{\beta}_i},i \in 1,2,\cdots, k\)`) --- ## 回归分析的形式(多行方程表达法) **形式1:多行方程表达法**(整理好的**精炼报告**):根据统计软件的原始报告,选取最关键的信息,经过整理并以多行**样本回归方程**(SRF)的形式呈现。例如: `$$\begin{equation} \begin{alignedat}{999} &\widehat{Y}=&&-0.01&&+0.72X\\ &\text{(t)}&&(-0.0165)&&(10.4065)\\&\text{(se)}&&(0.8746)&&(0.0696)\\&\text{(fitness)}&& R^2=0.9078;&& \bar{R^2}=0.8994\\& && F^{\ast}=108.29;&& p=0.0000 \end{alignedat} \end{equation}$$` - 第4行(fitness)表示回归模型**拟合情况**和**统计检验**的简要信息,其中 `\(R^2\)`表示**判定系数**, `\(\bar{R}^2\)`表示**调整判定系数**,F表示模型整体显著性检验中的**样本F统计量值**( `\(F^{\ast}\)`),p表示样本F统计量值对应的概率值。 --- ## 回归分析的形式(表格列示法) **形式2:表格列示法**(整理好的**精炼报告**):根据统计软件的原始报告,往往是选取最关键的信息,经过整理以表格形式呈现,**表格列示法**的形式呈现为: ``` Warning: package 'broom' was built under R version 4.0.4 ``` <table> <caption>表格列示法</caption> <thead> <tr> <th style="text-align:center;"> term </th> <th style="text-align:center;"> estimate </th> <th style="text-align:center;"> std.error </th> <th style="text-align:center;"> statistic </th> <th style="text-align:center;"> p.value </th> </tr> </thead> <tbody> <tr> <td style="text-align:center;"> (Intercept) </td> <td style="text-align:center;"> -0.01 </td> <td style="text-align:center;"> 0.87 </td> <td style="text-align:center;"> -0.02 </td> <td style="text-align:center;"> 0.99 </td> </tr> <tr> <td style="text-align:center;"> X </td> <td style="text-align:center;"> 0.72 </td> <td style="text-align:center;"> 0.07 </td> <td style="text-align:center;"> 10.41 </td> <td style="text-align:center;"> 0.00 </td> </tr> </tbody> </table> -- - **第1列**:`term`表示回归模型中包含的变量,也即 `\(X_{2i},X_{3i},\cdots,X_{ki}\)`,其中**截距项**默认为`(Intercept)`。 - **第2列**:`estimate`表示回归系数的估计值,也即 `\(\hat{\beta}_1,\hat{\beta}_2, \cdots, \hat{\beta}_k\)`。 - **第3列**:`std.error`表示回归系数对应的**样本标准误差**,也即 `\(S_{\hat{\beta}_i},i \in 1,2,\cdots, k\)`。 - **第4列**:`statistic`表示回归系数对应的**样本t统计量**,也即 `\(t^{\ast}_{\hat{\beta}_i},i \in 1,2,\cdots, k\)` - **第5列**:`p.value`表示回归系数**样本t统计量**对应的概率值,也即 `\(Pr(t = t^{\ast}_{\hat{\beta}_i})=p\)` --- ### (示例)Excel软件原始报告:全貌 **形式3:原始报告**:分析软件如`EViews`、`R`、`STATA`、`Excel`等直接自动生成的多元回归分析报告。`Excel`软件原始分析报告形式如下: <img src="../pic/chpt05-reg-excel-report-view.png" width="4080" style="display: block; margin: auto;" /> --- ### (示例)Excel软件原始报告:参数估计 <div class="figure" style="text-align: center"> <img src="../pic/chpt05-reg-excel-report-estimate.png" alt="Excel回归分析的参数估计结果" width="4029" /> <p class="caption">Excel回归分析的参数估计结果</p> </div> --- ### (示例)Excel软件原始报告:拟合优度 <div class="figure" style="text-align: center"> <img src="../pic/chpt05-reg-excel-report-goodness.png" alt="Excel回归分析的拟合优度" width="80%" /> <p class="caption">Excel回归分析的拟合优度</p> </div> --- ### (示例)Excel软件原始报告:方差分解 <div class="figure" style="text-align: center"> <img src="../pic/chpt05-reg-excel-report-anova.png" alt="Excel回归分析的ANOVA表结果" width="2824" /> <p class="caption">Excel回归分析的ANOVA表结果</p> </div> --- ### (示例)Excel软件原始报告:残差表 <div class="figure" style="text-align: center"> <img src="../pic/chpt05-reg-excel-report-ei.png" alt="Excel回归分析的预测和残差结果" width="50%" /> <p class="caption">Excel回归分析的预测和残差结果</p> </div> --- ### (示例)Excel软件原始报告:残差图 <div class="figure" style="text-align: center"> <img src="../pic/chpt05-reg-excel-residual.png" alt="Excel回归分析的残差图" width="2149" /> <p class="caption">Excel回归分析的残差图</p> </div> --- ### (示例)Excel软件操作步骤:配置数据分析模块 <div class="figure" style="text-align: center"> <img src="../pic/chpt05-reg-excel-config.png" alt="Excel“数据分析”模块的配置" width="80%" /> <p class="caption">Excel“数据分析”模块的配置</p> </div> --- ### (示例)Excel软件操作步骤:回归分析的操作步骤 <div class="figure" style="text-align: center"> <img src="../pic/chpt05-reg-excel-steps.png" alt="Excel“回归分析”的操作步骤" width="99%" /> <p class="caption">Excel“回归分析”的操作步骤</p> </div> --- ### 回归分析的形式(EViews软件原始报告) **形式3:原始报告**:分析软件如`EViews`、`R`、`STATA`等直接自动生成的多元回归分析报告。`EViews`软件原始分析报告形式如下:**抬头区域** .pull-left[ <img src="../pic/extra/chpt4-eq-report-EViews.png" width="633" style="display: block; margin: auto;" /> ] -- .pull-right[ - `Dependent Variable: Y`:因变量 - `Method: Least Squares`:分析方法 - `Date: 03/09/19 Time: 10:55`:分析的时间 - `Sample: 1 13`:样本范围 - `Included observations: 13`:样本数n ] --- ### 回归分析的形式(EViews软件原始报告) **形式3:原始报告**:分析软件如`EViews`、`R`、`STATA`等直接自动生成的多元回归分析报告。`EViews`软件原始分析报告形式如下:**三线表区域** .pull-left[ <img src="../pic/extra/chpt4-eq-report-EViews.png" width="633" style="display: block; margin: auto;" /> ] -- .pull-right[ - **第1列**:`Variable`表示模型包含的变量, `\(X_{2i},X_{3i},\cdots,X_{ki}\)`,其中**截距项**默认为`C`。 - **第2列**:`Coefficient`回归系数,也即 `\(\hat{\beta}_1,\hat{\beta}_2, \cdots, \hat{\beta}_k\)`; - **第3列**:`Std. Error`回归系数的样本标准误差,也即也即 `\(S_{\hat{\beta}_i},i \in 1,2,\cdots, k\)`。 - **第4列**:`t-Statistic`表示回归系数对应的**样本t统计量**,也即 `\(t^{\ast}_{\hat{\beta}_i},i \in 1,2,\cdots, k\)`; - **第5列**:`Prob.`表示回归系数**样本t统计量**对应的概率值,也即 `\(Pr(t = t^{\ast}_{\hat{\beta}_i})=p\)` ] --- ### 回归分析的形式(EViews软件原始报告) **形式3:原始报告**:分析软件如`EViews`、`R`、`STATA`等直接自动生成的多元回归分析报告。`EViews`软件原始分析报告形式如下:**指标值区域(左)** .pull-left[ <img src="../pic/extra/chpt4-eq-report-EViews.png" width="633" style="display: block; margin: auto;" /> ] -- .pull-right[ - `R-squared`:回归模型**判定系数** `\(R^2\)`。 - `Adjusted R-squared`:回归模型**调整判定系数** `\(\bar{R}^2\)`。 - `S.E. of regression`:回归模型的**回归误差标准差** `\(\hat{\sigma}\)`。 - `Sum squared resid`:回归模型的**残差平方和RSS** `\(RSS=\sum{e_i^2}\)`。 - `Log likelihood`:回归模型的**对数似然值**。 - `F-statistic`:回归模型整体显著性的**样本F统计量** `\(F^{\ast}\)`。 - `Prob(F-statistic)`:回归模型整体显著性的样本F统计量对应的**概率值p**。 ] --- ### 回归分析的形式(EViews软件原始报告) **形式3:原始报告**:分析软件如`EViews`、`R`、`STATA`等直接自动生成的多元回归分析报告。`EViews`软件原始分析报告形式如下:**指标值区域(右)** .pull-left[ <img src="../pic/extra/chpt4-eq-report-EViews.png" width="633" style="display: block; margin: auto;" /> ] -- .pull-right[ - `Mean dependent var`:Y的**均值** `\(\bar{Y}\)`。 - `S.D. dependent var`:Y的**样本标准差** `\(S_{Y}\)`。 - `Akaike info criterion`:回归模型的**AIC信息准则**。 - `Schwarz criterion`:回归模型的**Schwarz准则**。 - `Hannan-Quinn criter. `:回归模型的**Hannan-Quinn准则**。 - `Durbin-Watson stat`:回归模型的**德宾沃森统计量d**。 ] --- ## 回归分析的形式(R软件原始报告) **形式4:原始报告**:分析软件如`EViews`、`R`、`STATA`等直接自动生成的多元回归分析报告。`R`软件原始分析报告形式如下: ``` Call: lm(formula = mod_wage, data = data_wage) Residuals: Min 1Q Median 3Q Max -1.564 -0.735 0.127 0.716 1.320 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.0145 0.8746 -0.02 0.99 X 0.7241 0.0696 10.41 0.0000005 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.94 on 11 degrees of freedom Multiple R-squared: 0.908, Adjusted R-squared: 0.899 F-statistic: 108 on 1 and 11 DF, p-value: 0.000000496 ``` --- layout:false background-image: url("../pic/thank-you-gif-funny-little-yellow.gif") class: inverse,center # 本节结束