《数学桥--对高等数学的一次观赏之旅》读书心得之五

接上篇:《数学桥--对高等数学的一次观赏之旅》读书心得之四

五、概率

概率论就是用数学的确定性来描述随机的过程。
样本空间:Ω; 某个结局:ω(在样本空间中)
概率论就是先要把问题转换成事件,然后通过概率学符号来处理。
事件:某些我们感兴趣事件(A)的概率P(A)。A是Ω样本空间中的某一种情况。
P(A)=使A中事件可以发生的等可能方式的数目/等可能的结局的总数。
等可能:相同可能,同概率随机事件。P(ω1)=P(ω2)=P(ω3)……

例1、生日相同问题

假设有n个人参加一个聚会,其中至少有两个人生日相同的概率是多少?
思路:求完全不相同的概率,再1减去该概率。
特征:当n大于或等于23的时候,两个人生日相同的可能性就过半。如果房间里有70个人,那么有两个人同生日的概率就达到了99.9%。

例2、比赛中止问题

如果不是等可能是,必须非常小心。

例3、门和山羊的问题

蒙提霍尔问题,亦称为蒙特霍问题或三门问题(英文:Monty Hall problem),是一个源自博弈论的数学游戏问题,大致出自美国的电视游戏节目Let's Make a Deal。问题的名字来自该节目的主持人蒙提·霍尔(Monty Hall)。
这个游戏的玩法是:参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车或者是奖品,选中后面有车的那扇门就可以赢得该汽车或奖品,而另外两扇门后面则各藏有一只山羊或者是后面没有任何东西。当参赛者选定了一扇门,但未去开启它的时候,知道门后情形的节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机会率?如果严格按照上述的条件的话,答案是会。—换门的话,赢得汽车的概率是2/3。

例4、外套问题

n位数学家参加一个聚会,他们脱下外套,放在一起,聚会结束,他们各人随机地取了一件,问题:至少有一个人取了自己外套的概率是多少?

1、容斥公式


2、条件概率

A在B已发生的条件下的概率。P(A|B)

3、全概率定律和贝叶斯公式


4、样本空间上的函数:随机变量

我们感兴趣的往往不是一个特定试验的结局,而是这个结局的某种函数。
随机变量:我们探究时间空间上的函数的性质,这样的一种函数称为随机变量!

1)二项分布
结局只有成功或失败两种!

二项分布的泊松近似:
我们感兴趣的是,实验进行了很多次,但其中不成功却发生得相当稀少的情况。(小概率事件)

2)泊松分布
泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。
Poisson分布(法语:loi de Poisson,英语:Poisson distribution),译名有泊松分布、普阿松分布、帕松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等,又称泊松小数法则(Poisson law of small numbers),是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表。
泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、激光的光子数分布等等。
泊松分布的概率质量函数为:
\[{\displaystyle P(X=k)={\frac {e^{-\lambda }\lambda ^{k}}{k!}}} \]
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。

3)连续性随机变量
随机变量是作用在某个样本空间上而产生出实数输出的函数!
概率密度函数:概率是取某段期间的面积(积分)来代替,而不是像离散随机变量那样是一个点的值

4)正态分布

5)均匀分布
蒲丰投针问题,用来估计π的值!

5、平均化与期望

需要关注的不是试验产生某个特定结果的概率,而是这个试验最有可能产生的结果范围。期望为我们给出了关于一个试验可能是什么结局的好想法!
期望的定义(加权平均):

期望是刻画整个概率分布的一个单独的数,它不一定是任何一个特定试验的结果。
例如,抛硬币。E[x]=(1+2+3+4+5+6)/6=3.5
这种情况说明:因为掷骰子,掷一次,6个点数都是同样的可能!所以,这种情况下,由期望所预测出来的值基本上没有用处!

6、离散程度与方差

方差,提供了分布值正在平均值周围离散程度的一种切实度量!方差大意味着随机变量有一个较广的分布,而方差小意味着一个较窄的分布。

7、极限定理

1)切比雪夫不等式
切比雪夫不等式为我们提供了一种方法,这种方法利用方差准确地确定了随机变量与平均值的偏差至少为一给定值的最大概率。切比雪夫不等式给出了最好的界限。

这个不等式以数量化这方式来描述,究竟“几乎所有”是多少,“接近”又有多接近:
与平均相差2个标准差以上的值,数目不多于1/4
与平均相差3个标准差以上的值,数目不多于1/9
与平均相差4个标准差以上的值,数目不多于1/16
……
与平均相差k个标准差以上的值,数目不多于1/k²
举例说,若一班有36个学生,而在一次考试中,平均分是80分,标准差是10分,我们便可得出结论:少于50分(与平均相差3个标准差以上)的人,数目不多于4个(=36*1/9)。

2)大数律
假设我们把某个随机试验进行许多次,并记下我们每一次试验的结果。直觉告诉我们,经过足够多次的试验后,根据所谓的“平均律”,所记录结果的平均值会趋向与某个固定的极限。有了大数定律,我们可以确信,为求得一个随机变量的期望,我们只要把它测量许多次,然后取我们所得值的平均值就可以了。

3)中心极限定理和正态分布
中心极限定理是概率论中的一组定理。中央极限定理说明,大量相互独立的随机变量,其均值的分布以正态分布为极限。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。

完!