1 安装R软件和第三方编译软件Rstudio
2 用R进行编程统计分析
3 用R进行绘图(图形可视化):
4 用R来写文章
5 project版本控制和团队协作
6 几点忠告
R语言及Rmarkdown语言快速上手参考资料。
说明:
本文档中提到的图书pdf文件可以通过百度云下载(下载地址:https://pan.baidu.com/s/1ZRuVSf2Jv_u3C_XmAUingA)。
下载地址永久有效!如有问题请反馈wsad2008@gmail.com。
材料仅供学习交流使用,请尊重原作者的版权!祝大家开心学习,学有所成!
1 安装R软件和第三方编译软件Rstudio
(开源软件,免费公开,自行安装)
R CRAN主站下载安装R程序(根据自己的电脑操作系统选择)。网址https://cran.r-project.org/
Rstudio主站下载安装Rstudio软件。网址https://www.rstudio.com/
2 用R进行编程统计分析
Adler, J. R in a Nutshell (2ed) [M], Reilly, 2012.这是R语言学习的红宝书之一,手中常备,随时翻阅。建议要通览一遍,并对照实例运行代码。
Crawley, M. J. The R Book (2nd) [M], Wiley, 2013. 这是R语言学习的红宝书之二。两本红宝书写作风格不同,自己挑一本就行。
Wickham, H. and G. Grolemund. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data [M], O’Reilly Media, 2017.
计量经济学的聊天方式和说教腔调。
在计量经济学课堂上,如果开始有一个又一个的学生不断向老师发起各种提问,这似乎是一个好的预示——至少有那么一些学生已经开始对某些“枯燥乏味”的话题开始自己的思考。但是,也不要高兴太早。因为后面的来回反馈和互动,可能更加让人焦头烂额。情形就好比如,菜市场热闹早市下熙熙攘攘吵闹讨价的买家和卖主,各自吆喝一番,然后各得其所,好像都赚了。
计量经济学学习中有很多坑,不一一失足踏过,就千万不敢妄称深谙其道、门儿清。
外文原著的中文翻译版不可读,或者起码要少读少碰。一是翻译错误多(多半是态度和责任心问题);或者译词怪异(各种创造,也不能说是谬误,就是觉得奇怪,比如time constant variable译成时常变量看起来“很妥帖”啊;又比如innovation译成新息也有相同后遗症),或者一词多译(还往往出现在同一译本下);或者前后颠倒语句生涩(大多是生硬套译,中文里美妙的“意译”技巧好像完全施展不出来。ps:怀念一下傅雷翻译罗曼罗兰的《约翰克里斯多夫》,不过人家操刀上架的可是文学作品)。如此种种,能耐心看完的也算得上是忍性极好之人。
计量经济学独特的语言体系。计量经济学充满了各类符号、记号、公式等,初接触它无异于观地外文明、听梦魇呓语。总体上看,计量经济学好似有其独特的语言体系。这套语言体系,主体应该以数学语言为其蓝本,但是又大量加入了各种神秘万千的假设(Assumptions),远不如数学语言那么严格优美。
场景变幻和剧情线条很重要。模型千万个,理论各有理。同一个符号出现在A场景里,可能在B场景里就完全变了另一个含义。比如总体回归模型(PRM)\(Y_i = \beta_1 +\beta_2X_i +u_i\)和样本回归模型(SRM)\(Y_i = \hat{\beta}_1 + \hat{\beta}_2X_i +e_i\),两个场景下\(Y_i\)的含义完全不同(前者是总体\(Y_i\),后者是样本\(Y_i\),一般前者要包含后者的)。另外就是要考虑讲故事的剧情。同样是表达方差,总体方差要记成\(\sigma^2_{\hat{\beta}_2}=\frac{\sigma^2}{\sum{x_i^2}}\),样本方差就要记成\(S^2_{\hat{\beta}_2}=\frac{\hat{\sigma}^2}{\sum{x_i^2}}\),而\(\hat{\sigma}^2\)又是PRM中随机干扰项\(u_i\)的方差的无偏估计量,如此这番,这个剧情和故事线的深度简直堪比HBO神剧的编剧设定,让你欲罢不能,脑细胞非要死一大片不罢休。
统计软件上手操作,那是真的“伤痛”。EViews、SPSS之类的软件,菜单驱动的做法本质上就是给初学者完美定制了一个个“宠坏孩子”的“工具黑箱”!使用这些方便的套件久了,真的会禁锢人的思维,麻痹人类的神经。事实上,你会发现书本上的理论和假设,跟你的实际分析案例总是那么格格不入。削足适履也好,生搬硬套也好,总觉得那那难受。
下面说一点“建设性”的意见:
计量经济学原著走起吧,少年!这个舶来品,还是原汁原味的读起来更顺畅。它不能像文学作品那样,意译可以活灵活现,能植入到本土文化中并让你感同身受。它更多的是科学作品,追求严格和准确,因此直译你会水土不服(产生文化排斥),意译你会不知所云(丢失太多信息)。
熟悉“主流话语”,忘掉哪些非主流的“方言”吧。计量大咖们(已经被封神)的经典传世之作一定要好好拜读(Wooldridge、Green之类的),它们的“语言符号”大多经过精巧打磨,形成了、影响着、并决定着“主流话语”(官方语言)。
理论与实践,各露一手。熟悉一门编程统计语言(R语言,Python,Stata等等皆可,最好精通一门),有备无患,上能通天会仙,下能镇妖除魔。理论和实践要兼顾,相得益彰。
下面以面板数据(panel data analysis)的相关学习为例:
理论方面的书籍主要可以看:
Wooldridge, J. M. Introductory econometrics. A modern approach(6th) [M], Cengage Learning, 2016. 关于面板的内容,精简了很多。
Wooldridge, J. M. Econometric Analysis of Cross Section and Panel Data 2ed [M], MIT press, 2010. 当然是经典了,但是阅读难度较大(矩阵知识和技巧)。