《Introduction to Probability》第11章 马尔可夫链
第 11 章 马尔可夫链
Markov chains
马尔可夫链由安德烈·马尔可夫(Andrey Markov,马尔可夫不等式的提出者)于 1906 年首次引入,其目标是证明大数定律同样适用于非独立的随机变量。
为了理解马尔可夫模型的由来,首先考虑独立同分布(i.i.d.)的随机变量序列 \(X_0, X_1, \dots, X_n, \dots\),其中 \(n\) 代表时间。这是我们在第 10 章中一直采用的设定,但对于模拟现实世界的现象,独立性假设可能过于苛刻;它意味着 \(X_n\) 彼此之间完全不提供任何信息。在另一个极端,允许 \(X_n\) 之间存在任意的相互作用会使计算变得异常困难。马尔可夫链是一种表现出“一步相关性”的随机变量序列。因此,马尔可夫链是完全独立与完全相关之间的一个理想折中点。
自发明以来,马尔可夫链已在生物学、博弈论、金融、机器学习和统计物理等众多领域变得极其重要。它们还广泛用于通过被称为马尔可夫链蒙特卡罗(MCMC)的算法来模拟复杂分布。在本章中,我们将介绍马尔可夫链及其性质,并在下一章探讨一些 MCMC 技术的示例。