在
数学中,随机矩阵(也称为概率矩阵、转移矩阵、替代矩阵、或马尔可夫矩阵)是用来描述一个
马尔可夫链的转变的
矩阵 。它的每一项都是一个表示
概率的非负
实数。它适用于概率论、统计学和线性代数,也在计算机科学和群体遗传学中使用。
定义
随机矩阵描述了在一个有限状态空间S上的
马尔可夫链。
如果在一个时间步长内从i到 j移动的
概率为 ,随机矩阵P的第 i行,第 j 列元素由给出,例如,
由于从状态 i 到下一状态的概率总和必须是 1,这个矩阵是一个右随机矩阵,于是
从i 到 j分两步转变的概率由然后由给定的P的平方矩阵的(i,j)号元素给出:
一般地,在由矩阵P给出的
有限马尔可夫链上从任何状态转移到另一个状态的k步转移概率为Pk。初始分布为一个
行向量。平稳概率向量 定义为不随转移矩阵的运用而变化的一个向量;也就是说,它定义为概率矩阵的左特征向量,其特征值为1:
佩龙一弗罗宾尼斯定理保证了每个随机矩阵都具有这样的向量,而特征值的最大绝对值始终为1。在一般情况下,可能有多个这样的向量。然而,对于具有严格正项的矩阵,该向量是唯一的,并可以观察到对任意i我们都有以下极限而求出,
其中是行向量 的第j 个元素。在其他方面,这表示处在状态 j下的长期概率与初始状态 i是独立的。这两种计算得到相同的稳定向量是遍历定理的一种形式,在各种各样的耗散动力系统广泛成立:该系统随着时间演变到
定态。
直观地看,随机矩阵表示一个
马尔可夫链;对概率分布应用随机矩阵,就是将原始分布的概率质量进行重新分布,同时保持其总质量。如果反复应用此过程,分布就会收敛为马尔可夫链的平稳分布。
设A、B为二个n×n阶转移矩阵,则以下亦为转移矩阵:AB、A、1/2(A+B)。
分类
有几种不同的定义和类型随机矩阵:
右随机矩阵是实方阵,其中每一行求和为1。
左随机矩阵是实方阵,其中每一列求和为1。
双随机矩阵是非负实数方阵,每个行和列求和均为1。
同理,可以定义随机向量(也称为概率向量)为元素为非负实数且和为1的
向量。因此,右随机矩阵的每一行(或左随机矩阵的每一列)都是一个随机向量。在英语数学文献中的惯例是用概率的
行向量和概率的右随机矩阵,而不用
列向量和左随机矩阵,本文遵循此惯例。
应用
转移矩阵可用以表示
机率(或变化比率),而矩阵相乘的结果可用以预测未来事件发生的
机率。
范例
假设你有一个计时器和五个相邻的格子排成一行,零时刻有一只猫在第一个格子中,而一只老鼠在第五个格子中。在计时器增加的时候猫和老鼠都会随机跳到一个相邻的格子中。例如,如果猫在第二个格子,老鼠在第四个,在计时器增加后,猫会出现在第一个格子且老鼠会出现在第五个格子的概率为1/4。如果猫在第一个格子而老鼠在第五个,那么计时器增加后,猫会出现在第二个格子且老鼠会出现在第四个的概率为1。当它们处于同一个格子的时候,猫会吃掉老鼠,游戏结束。
随机变量K给出了老鼠仍留在游戏中的时间步长。
表示这个包含五种位置组合 (猫,鼠) 的状态的游戏的
马尔可夫链为:
我们使用一个随机矩阵来表示这个系统的
转移概率(这个矩阵中的行和列用上面提到的可能状态来索引),
长期平均
无论初始状态是什么,猫最终都会抓到老鼠(概率为1),且极限为稳态π= (0,0,0,0,1)。要计算随机变量 Y 的长期平均或期望值。对每种状态 Sj和时间 tk,都有 Yj,k·P(S=Sj,t=tk) 的贡献。生存与否可以视作一个二值变量,Y=1 代表生存状态而 Y=0 代表终止状态。Y=0 的状态不对长期平均有贡献。
位相型表示
由于状态 5 是一个吸收态,吸收对时间的分布为离散位相型分布。假设系统从状态 2 开始,表示为向量[0,1,0,0,0]。老鼠死亡后的状态不会对生存平均产生影响,所以状态五可以忽略。初始状态和转移矩阵可以化简为,
以及,
;而其中I为
单位矩阵,表示全为1的列矩阵,进行状态的相加。由于每个状态都占据一个时间步长,老鼠生存时间的期望就是在所有生存状态和时间步长中占据的概率之
和,
其高阶矩为