孩时的方言事件
计量经济学的疯言风语
计量经济学“疯言风语”1:数学符号语言(母语)
计量经济学“疯言风语”2:回归报告语言(暗语)
计量经济学“疯言风语”3:矩阵语言matrix(狂语)
后话:语言障碍还是心理障碍
孩时的方言事件
打小时起,我就对各种村落方言带来的困惑感受至深。我的故乡,属于典型的南方村落。古时是被算作南蛮之地的,外族异性零落杂居。虽然还不至于一村一俗,但是一村一个方言那是十分常见。我们村周边,3里地范围内,大概分布4个村落,就存在4种方言。好在距离不是太远,自小接触融通,还不至于听不懂。这种方言的差异,不是普通人想象的口音上的差异。就我而言,也仅限于听懂而已,要是模仿发音,那实在是难于上青天。
我的家庭里就有两种方言,母亲带来了4里远的外婆家族的方言。大姨嫁到离我家约6里地远的村子,那种村落语言对于小时候的我简直就是外星语一般的存在。因为暑假或春节会到大姨家待上一阵子,我总有一种被那个村落完全隔绝的感觉。因为无法跟这个村里其他小孩对话沟通,我大多数情况都是跟在表哥的屁股后面,生怕落单。有一次,村里一个热心的小孩看到我一个人在路边独自玩得起劲,就凑过来打招呼,可能是希望加入一起玩耍的意思。但是他的方言发音咿咿呀呀,我一个字都不懂。再加上这小孩神情诡谲,动作夸张,我飞一般地赶紧逃离是非之地,躲进大姨家里半天没出门。表哥知道后,找来那小孩问明来由,一通翻译,真相大白,大家笑得肚疼。因为这事,小孩这句接头暗话,都是目前为止我唯一能说出来而且知道意思的该村方言了,真是印象至深。
小孩的方言发音(此处纯粹表达出发音):
“哟斯呗嗟嘎?哈粤郭。”
我当时理解的意思是:
“你是北京来的?唱个歌吧。”(我天生五音不全!)
表哥翻译的结果是:
“你是哪里来的?一起玩喽。”
这个事情让我知道,语言不通还要一起好好玩耍,简直就是个灾难!
计量经济学的疯言风语
有一部经典的二战电影《风语者》,讲的是战争双方的密码攻防。美军为了通讯安全,专门雇请神秘的印第安部落纳瓦霍人参军,使用纳瓦霍人的语言进行通讯。因为纳瓦霍语是一种没有文字,只通过世世代代口耳相传,极其复杂的语言,可以说就是不为人知的、偏远地带的“鸟语”。由于他们的语言发音来自于大自然,所以给他们的外号就叫做“风语者”。
哪怕具备了一定的统计学知识,我相信大部分人一开始学习《计量经济学》时也会语言障碍。就好比是日本通讯兵在听美军用纳瓦霍语发送的电报,一头雾水,根本就不带人玩耍的节奏。
下面我就分三个方面来罗列一下计量经济学的三类“疯言风语”:
计量经济学“疯言风语”1:数学符号语言(母语)
数学符号是计量经济学的母语,一点都不为过。其中数学符号主要是搭建了一套共同的语言规则,把社会经济分析中各种含混的概念、术语、各种情景用清晰无误的数学语言表达出来。这样,那些仍旧坚持说自己“方言”的经济学家,自然就不能跟别的小朋友好好玩耍了。
以计量经济学最基础的总体和样本模型定义和内涵为例:
总体回归函数PRF:
\[\begin{align}
E(Y|X_i) &= \beta_1 +\beta_2X_i && \text{(PRF)}
\end{align}\]
总体回归模型PRM:
\[\begin{align}
Y_i &= \beta_1 +\beta_2X_i + u_i && \text{(PRM)}
\end{align}\]
样本回归函数SRF:
\[\begin{align}
\hat{Y}_i =\hat{\beta}_1 + \hat{\beta}_2X_i && \text{(SRF)}
\end{align}\]
计量经济学的聊天方式和说教腔调。
在计量经济学课堂上,如果开始有一个又一个的学生不断向老师发起各种提问,这似乎是一个好的预示——至少有那么一些学生已经开始对某些“枯燥乏味”的话题开始自己的思考。但是,也不要高兴太早。因为后面的来回反馈和互动,可能更加让人焦头烂额。情形就好比如,菜市场热闹早市下熙熙攘攘吵闹讨价的买家和卖主,各自吆喝一番,然后各得其所,好像都赚了。
计量经济学学习中有很多坑,不一一失足踏过,就千万不敢妄称深谙其道、门儿清。
外文原著的中文翻译版不可读,或者起码要少读少碰。一是翻译错误多(多半是态度和责任心问题);或者译词怪异(各种创造,也不能说是谬误,就是觉得奇怪,比如time constant variable译成时常变量看起来“很妥帖”啊;又比如innovation译成新息也有相同后遗症),或者一词多译(还往往出现在同一译本下);或者前后颠倒语句生涩(大多是生硬套译,中文里美妙的“意译”技巧好像完全施展不出来。ps:怀念一下傅雷翻译罗曼罗兰的《约翰克里斯多夫》,不过人家操刀上架的可是文学作品)。如此种种,能耐心看完的也算得上是忍性极好之人。
计量经济学独特的语言体系。计量经济学充满了各类符号、记号、公式等,初接触它无异于观地外文明、听梦魇呓语。总体上看,计量经济学好似有其独特的语言体系。这套语言体系,主体应该以数学语言为其蓝本,但是又大量加入了各种神秘万千的假设(Assumptions),远不如数学语言那么严格优美。
场景变幻和剧情线条很重要。模型千万个,理论各有理。同一个符号出现在A场景里,可能在B场景里就完全变了另一个含义。比如总体回归模型(PRM)\(Y_i = \beta_1 +\beta_2X_i +u_i\)和样本回归模型(SRM)\(Y_i = \hat{\beta}_1 + \hat{\beta}_2X_i +e_i\),两个场景下\(Y_i\)的含义完全不同(前者是总体\(Y_i\),后者是样本\(Y_i\),一般前者要包含后者的)。另外就是要考虑讲故事的剧情。同样是表达方差,总体方差要记成\(\sigma^2_{\hat{\beta}_2}=\frac{\sigma^2}{\sum{x_i^2}}\),样本方差就要记成\(S^2_{\hat{\beta}_2}=\frac{\hat{\sigma}^2}{\sum{x_i^2}}\),而\(\hat{\sigma}^2\)又是PRM中随机干扰项\(u_i\)的方差的无偏估计量,如此这番,这个剧情和故事线的深度简直堪比HBO神剧的编剧设定,让你欲罢不能,脑细胞非要死一大片不罢休。
统计软件上手操作,那是真的“伤痛”。EViews、SPSS之类的软件,菜单驱动的做法本质上就是给初学者完美定制了一个个“宠坏孩子”的“工具黑箱”!使用这些方便的套件久了,真的会禁锢人的思维,麻痹人类的神经。事实上,你会发现书本上的理论和假设,跟你的实际分析案例总是那么格格不入。削足适履也好,生搬硬套也好,总觉得那那难受。
下面说一点“建设性”的意见:
计量经济学原著走起吧,少年!这个舶来品,还是原汁原味的读起来更顺畅。它不能像文学作品那样,意译可以活灵活现,能植入到本土文化中并让你感同身受。它更多的是科学作品,追求严格和准确,因此直译你会水土不服(产生文化排斥),意译你会不知所云(丢失太多信息)。
熟悉“主流话语”,忘掉哪些非主流的“方言”吧。计量大咖们(已经被封神)的经典传世之作一定要好好拜读(Wooldridge、Green之类的),它们的“语言符号”大多经过精巧打磨,形成了、影响着、并决定着“主流话语”(官方语言)。
理论与实践,各露一手。熟悉一门编程统计语言(R语言,Python,Stata等等皆可,最好精通一门),有备无患,上能通天会仙,下能镇妖除魔。理论和实践要兼顾,相得益彰。
下面以面板数据(panel data analysis)的相关学习为例:
理论方面的书籍主要可以看:
Wooldridge, J. M. Introductory econometrics. A modern approach(6th) [M], Cengage Learning, 2016. 关于面板的内容,精简了很多。
Wooldridge, J. M. Econometric Analysis of Cross Section and Panel Data 2ed [M], MIT press, 2010. 当然是经典了,但是阅读难度较大(矩阵知识和技巧)。
“计量经济学”形式的数学公式
本科生课程《计量经济学》会大量使用各类公式。这些公式大概有两类:
理论公式:这些数学公式的呈现基本上用不到数据报告的结果。在Rmarkdown文档中处理办法相对简单,直接使用LaTex形式代码输入即可。
报告公式:这些数学公式的呈现,跟某些数据分析报告紧密联系。此时,手工输入LaTex将会变得很不现实!一个系统性的解决思路是,利用Rmardown chunk 自己编写代码块。前边分析步骤负责出数据报告结果,后面Chunk里公式创造时直接调用数据报告的各类数值。
所以,如果一切顺利,“计量经济学”课程的大量报告公式,都可以自动地使用R函数调用实现,可谓一本万利,合算得很!
代码实现过程中的各种“梗”
实现思路倒是很清晰,Rmarkdown下的操作也是可行的。下面就是需要撸起袖子加油干,找到“聪明”的实现办法,破除各种“梗”!
格式选择真是一个大问题:关于pdf、html、word输出形式
选择Rmarkdown的一个很重要理由,就是它可以实现一份文档种格式输出。这个“理想”确实比较宏大。在数学公式领域,起码就有这几个问题:
数学公式友好度差别较大。word比较另类,数学公式支持是最糟糕的;Latex(pdf)下是最灵活的。html则最通用。所以,复杂的公式,在latex(pdf)下OK,放到word里可能就吃不消了。
package实现各不相同。如果写书,最好就是用bookdown包;如果做演示slide可以用Xaringan包;写网站文章,可以用blogdown。对于数学公式而言,最需要注意是:是否需要交叉引用(cross reference)公式。基本就是两种情形:写slide和blog默认是不交叉应用公式的;写book则必然需要的。
数学公式的排版(alignment)
这个部分折腾我很久。因为主要使用Latex语法形式来编写R chunk代码。所以必须要熟悉Latex math equation的公式环境(environment)。
独立公式环境:
\begin{equation} ... \end{equation}
\begin{align} ... \end{align}
\begin{aligned} ... \end{aligned}
\begin{alignedat}{3} ... \end{alignedat}
组合公式环境:
cat(
"\\begin{equation}",
"\\begin{alignedat}{999}",
"&\\widehat{Y}=&&+17.81&&+0.62X\\\\",
"&\\text{(t)}&&(1.9238)&&(11.9968)\\\\",
"&\\text{(se)}&&(9.2556)&&(0.0516)\\\\",
"&\\text{(fitness)}&& n=10;&& R^2=0.9473;&& \\bar{R^2}=0.9408\\\\",
"& && F^{\\ast}=143.92;&& p=0.0000",
"\\end{alignedat}",
"\\end{equation}")
\[\begin{equation} \begin{alignedat}{999} &\widehat{Y}=&&+17.81&&+0.62X\\ &\text{(t)}&&(1.9238)&&(11.9968)\\ &\text{(se)}&&(9.
利用xaringan来设计课程slide。
现在对(本科)教学工作的要求,已经发生了很大的改变:教学的内容变得更加专业化和细分化(学生就业市场的倒逼);教学过程/流程需要标准化(一切变得透明公开);教学活动应该能够便于复制并规模化运行(课程最好能以公开课/慕课方式运作);个性化教学和灵活性调整被反复强调(对学生多元考核、“一人一套试卷”);其他方面。
教师在讲台上的台前“艺术化”魅力(仪态、表情、音色等)已经不再如曾经那么重要;教师在台后的“技术性”设计(内容、互动、展示等)上升到了无与伦比的地位。
尤其是对于哪些技术性课程,如计量经济学(Econometrics)和统计学(Statistics),“技术性”设计必须要赶上这些教学新要求的呼声。(当你发现一位大学教师还在“坚持”使用Office2007,你一点都不要惊讶——经管现在已经是2019年了。)
为什么要逃离PowerPoint,拥抱HTML形式的slide?
PowerPoint的“断、舍、离”:
office版本太过分散,ppt可能会上演各种“变形记”。(现在国内有很多学生,已经不能区分WPS和Office了。学生的毕业论文或作业提交,那酸爽,真是谁看谁知道。)
ppt维护和更新的各种“梗”。最让我纠结的就是mathtype公式,神一般地会一夜之间“变砖”(倒腾几下,公式变图片,或者干脆显示不了),更不要说公式的重复使用和编辑修改。如果使用一些新技巧、新字体,那一定会让你记住“凡走过的都是一个一个的巨坑”。
难以逾越数据、图形和模型分析的“天堑”。表格数据加总等分析基本等于不可能(事实上也可以关联excel,但是“关联越多,等价于羁绊越多”!);数据图形化,你只能老老实实拷贝统计软件里的做好的图吧(泪奔!);建模分析结果的调用,就更别提了(反复在多个软件窗口中切换和敲键盘,眼花缭乱的“骚操作”不说,最担心的还是手一抖怕敲错了结果啊!)。
HTML形式slide的“前世今生”:
一个浏览器就够了。HTML是互联网世界最广泛使用的交流形式。每台电脑都会安装浏览器(chrome、firefox、IE…),但不是都会安装Microsoft office全家桶(365家庭版那可是每年500RMB啊,心疼一下下!)。
一份文本多种输出形态的终极需求。就像KTV里嗨唱切歌,老师们常常要在word、pdf、html、ppt、png等格式中不断切换啊。一个逗号或减号,在word里改了,那还得改ppt啊,就问你蛋疼不蛋疼。所以,仅维护一份文本,随时获得各种输出(html、word、ppt、slide…)简直就是人类共同的梦想啊。
“纯文本”就是你的最底层“话语”。一切的文字、代码、图形、格式、排版…,统统汇集于一份“纯文本”中!Plain Text,正如其名,平铺直叙,朴素而不简单,包含了你所需的一切,你想说和想呈现的一切。
Xaringan的优势和不足
Xaringan的优势:
R语言和RMarkdown的应用就是它最大的优势。这赋予了教学准备工作更强的“生产力”:代码可重复利用、统计处理和分析报告完美整合。
Xaringan Slide可以高度灵活的定制化。本质上形式的呈现,完全依赖于CSS技术,这与PowerPoint中的模板使用是完全不同的体验,效率上完全秒掉后者。
Xaringan Slide可以完美转成pdf格式的slide。其实直接用Chrome浏览器打开HTML Slide不就完了嘛,这种格式转换的操作本来就是多此一举!总之,你说,世界需要pdf;于是Xaringan便说,给你pdf!
与GitHub版本控制技术融合。我想说的是,这是一种全新的师生交互和反馈机制!
Xaringan的不足:
对行内公式支持不是很友好。比如$\beta$必须要保持独立一行!一段话要是有很多这样的inline equation,那么xaringan::moon_reader 文档就显得很破碎了。
风格调整CSS技术的学习还是有一定成本的。换言之,制作一份自己喜欢的“专属”模板,还需要花费一些时间。
强迫症的一些小细节。使用knitr::kable()制表,转pdf时表格无法显示,替代办法就是用DT::datatable()的表格风格,而它往往不是真正的Table风格!另外,就是windows环境下,不支持Rstudio面板Viewer中预览slide,只能在浏览器中预览。
Xaringan使用中需要注意的几个细节
选用一个好的模板:
比如我使用的杜克大学模板:Slide Template for Duke University。
初学者最好先不要删除模板的内容,里面的示例说明可以很好地参考。
Xaringan支持“实时”预览了:
赶紧去看Yihui的blog,The Ultimate Infinite Moon Reader for xaringan Slides。赶快安装更新包:
remotes::install_github('yihui/xaringan', upgrade = TRUE)
而且是Windows用户的又一个福音啊。前面刚说Rstudio里不能Viewer预览,但是更新Xaringan包后发现Chrome浏览器竟然可以“实时”同步预览了!yoo!
定制自己的字体大小: