第3章 随机变量及其分布

Random variables and their distributions

在本章中,我们将引入随机变量。这是一个极其有用的概念,它既能简化记号,又能增强我们量化不确定性以及总结实验结果的能力。随机变量在本书后续内容以及整个统计学中都至关重要,因此,从直觉和数学两个层面深入思考其含义是至关重要的。

阅读全文 »

第 2 章 条件概率

Conditional probability

我们已经将概率引入为一种表达我们对事件的置信程度或不确定性的语言。每当我们观察到新的证据(即获得数据)时,我们就获取了可能影响我们不确定性的信息。一个与现有信念一致的新观察结果可能会让我们对该信念更加确定,而一个令人惊讶的观察结果可能会使该信念受到质疑。条件概率正是解决这一根本问题的概念:我们应当如何根据观察到的证据来更新我们的信念?

阅读全文 »

第1章 概率与计数

Probability and counting

运气、巧合、随机性、不确定性、风险、疑虑、命运、机遇。

Luck. Coincidence. Randomness. Uncertainty. Risk. Doubt. Fortune. Chance.

你可能无数次听过这些词,但很有可能它们只是被以一种模糊、随意的方式使用。遗憾的是,尽管概率在科学和日常生活中无处不在,它却可能极其违背直觉。如果我们依赖可靠性存疑的直觉,就会面临做出不准确预测或过度自信决策的严重风险。本书的目标是将概率论作为一种逻辑框架引入,以规范的方式对不确定性和随机性进行量化。我们还旨在加强直觉——无论是在我们的初步猜测与逻辑推理一致时,还是在没那么走运的时候。

阅读全文 »

前言

本书为概率论提供了一套现代化的入门介绍,并为理解统计学、随机性和不确定性奠定了基础。书中探讨了各种应用和案例,从基础的抛硬币和巧合研究,到 Google PageRank 算法以及马尔可夫链蒙特卡罗方法(MCMC)。由于概率论通常被认为是一个直觉匮乏的学科,书中提供了大量的直觉性解释、图表和练习题。每章末尾都设有一个专门章节,介绍如何在 R 语言(一个用于统计计算和模拟的免费软件环境)中探索该章的思想。

哈佛大学 Stat 110 课程的授课视频可在 http://stat110.net 免费获取,该书正是源于这门课程。此外,该网站还提供 R 代码、动画以及标有 s 的习题解答等补充材料。

阅读全文 »

本计划酝酿一个有诗意、有新意的标题,但是,就像洗尽铅华的人生,朴素、简单便是美,也更能直达本意,故俗套的沿用《我的2025年终总结》。

年终总结写过很多,学校的、单位的、个人的,但这次算是真正意义上自发的为自己而写。

作为一个不爱拍照、不爱发朋友圈的 I 人,真正留下的、有据可查的记忆实在太少。印象里,抽屉中除了大学时期的书信、明信片(当年流行的节日祝福信物),还有年轻时的一些照片,也没其它可以睹物思人的东西了。电子化时代,总觉得,就像记忆发生断片一样,留下了一段空白。不过,一切都是过目烟云,再怎么样,也终归物是人非。

阅读全文 »

浣溪沙·游蕲水清泉寺 苏轼
山下兰芽短浸溪,松间沙路净无泥,萧萧暮雨子规啼。
谁道人生无再少?门前流水尚能西!休将白发唱黄鸡。

苏东坡脍炙人口的诗词不胜枚举,以上这首最契合当前心情,故为开篇。

苏东坡在诗词造诣方面,历史上无人出其右。据说欧阳修一天对儿子说,“记住我的话,三十年后,无人再谈论老夫。”他的话果然应验,即便今天,苏东坡仍是大家谈论的重点。苏东坡的的天才之作,其代表见文末图片(拍摄自本书扉页的图片),这里不再赘述。

就像本书的英文名《The Gay Genius》,林语堂重点要讲的也是苏东坡那洒脱般的天才。

阅读全文 »

最近迷上了村上春树的文学,文字优雅、行云流水、温馨又充满诗意。不知是否应归功于译者,就如,傅雷之于罗曼·罗兰。

《世界尽头与冷酷仙境》,故事情节引人入胜,有了久违的那种手不释卷的感觉。

“谷崎润一郎文学奖”评委曾这样评价这部小说:这部长篇看似科幻而不是科幻,看似推理而不是推理,看似魔幻而不是魔幻,从而游刃有余地保持了纯文学的品格。

你说这镇子上没有争夺没有怨恨没有欲望,这固然可钦可佩,若有力气,我也想为之鼓掌。可是,没有争夺没有怨恨没有欲望,无非等于说也就没有相反的东西,那便是快乐、幸福和爱情。正因为有绝望有幻灭有哀怨,才有喜悦可言。没有绝望的终极幸福是根本不存在的。

阅读全文 »

以下是阅读统计学书籍的一些心得和摘录。

  • 世界的不确定性
    科学家们开始改变思维:能找到现象背后的因果模型更好,因为这毕竟是一劳永逸的事情,很好的体现了上帝的意志
    但是,在这个每个突破的都需要漫长的时间里,我们可以通过大数据思维,在基于不确定的前提下,借助数据量的突破性增长、借助计算机能力的突破性发展,以及人类在人工智能方面的飞跃(Alphago战胜了李世石),通过数据的相关性来掌握事物的规律,然后基于机器学习,不断优化模型。这就是大数据思维的核心。
    用不确定的眼光看待世界,再用信息来消除这种不确定性,是大数据解决智能问题的本质。(从确定性到相关性)

    阅读全文 »

一般人都不是他们想要做的那种人,而是他们不得不做的那种人。

确实,这就是人生的困境,责任和自我的平衡,生活的天平常常偏向责任那一端。在面对生活的压力时,我们普通人可以做的大多也只能是放弃生命的尊严。

作为文青眼中关于“诗和远方”的神作《月亮和六便士》,久闻其名。通读之后,心情却难以平复。主人公那样的选择,像尼采说的,要么是天才,要么是疯子。

阅读全文 »

花了一个多礼拜,《机器学习的数学基础》的笔记整理终于大功告成。相比文学类读书心得,这类工作更耗时。不同工具、不同版本对数学公式的渲染略有差别,整理过程中需要大量人工核对,甚是繁琐。

阅读全文 »
0%