推荐《数理统计学简史》

最近一段时间一直关注统计学和信息论的内容,主要参考资料包括川大版《统计学与概率论》也是我大学时的教材,另外参考李航的《统计学习方法》,北大的李东风的《统计计算》。我主要是整理参考资料的内容,尝试按照我自己的理解来写文章。如果有纰漏的还请各位读者指正。

笔者发现教材的内容非常重视系统,其编排往往按照内容前后逻辑进行,忽视了理论发展脉络,导致读者往往关注理论,而忽视了理论背后的故事,少了一些“人情味”。笔者就去找有没哟关于统计学的历史方面的书,在豆瓣上看到陈希儒写的《数理统计学简史》,评价也非常高。花了3天时间,大致看了一半内容,有些章节写得非常精彩,借此机会推荐给大家。

我个人觉得写得非常精彩的章节挺多,第四章讲勒让德发现最小二乘法,以及此方法对接下来60年的影响,尤其是是对天文学和测量方向的影响。仔细想来最小二乘法的发明确实意义重大。因为在这些应用学科上,有大量的观测数据,而变量的个数远小于观测数据量,并且观测数据还存在随机误差。按照以前的方法,只能利用部分观测数据,建立与变量个数相等方程个数,然后解方程来估计变量的值。这样的解与选择的观测数据有关,而且也无法估计误差,其计算精度更不用说了。

第五章也同样精彩,接着第四章的最小二乘法,高斯进一步完善最小二乘法的误差理论,证明了随机误差是服从正态分布的,也称为高斯分布。从理论上说明了最小二乘法为什么有效,同时推导出高斯分布。要说统计学中最重要的分布是高斯分布,估计这一点很多人不会有异议吧。这一章按照发展脉络,先从天文学的工作,有大量观测数据,提出需要解决的问题。之后分别介绍辛普森、拉普拉斯、再到高斯的工作。还介绍正太分布对应的偏态分布,是不是听着有点意思了。

后面的章节介绍了费歇尔的工作,让统计学走上新台阶的小样本,t分布、F分布和方差分析,以及参数估计。这些都是近代统计学非常重要的理论了。由于还没有看完,粗略看下来,好像没有专门的章节提大数定理和中心极限定理,只是穿插提到而已。也可能作者认为这两个定理相对比较简单,没有用大篇幅来说明吧。

总结

看书尤其是看枯燥的理论书特别容易犯困,看故事书就轻松很多了。当然书中还是有大量的公式和证明,读者觉得吃力是可以跳过,不影响阅读的。当然如果愿意静下心来研究一下公式,你对故事和理论的理解会更加深入。确实是一本好书推荐给有兴趣的读者朋友。