轉移矩陣




在数学中,随机矩阵(也称为概率矩阵转移矩阵[1]替代矩阵、或马尔可夫矩阵)是用来描述一个马尔可夫链的转变的矩阵 。它的每一项都是一个表示概率的非负实数。它适用于概率论、统计学和线性代数,也在计算机科学和群体遗传学中使用。
有几种不同的定义和类型随机矩阵:




  • 右随机矩阵是实方阵,其中每一行求和为1。


  • 左随机矩阵是实方阵,其中每一列求和为1。


  • 双随机矩阵是非负实数方阵,每个行和列求和均为1。


同理,可以定义随机向量(也称为概率向量)为元素为非负实数且和为1的向量。因此,右随机矩阵的每一行(或左随机矩阵的每一列)都是一个随机向量。


在英语数学文献中的惯例是用概率的行向量和概率的右随机矩阵,而不用列向量和左随机矩阵,本文遵循此惯例。




目录






  • 1 定义和性质


  • 2 應用


  • 3 性質


  • 4 范例:猫和老鼠


    • 4.1 长期平均


    • 4.2 位相型表示




  • 5 参见


  • 6 参考文献





定义和性质


随机矩阵描述了在一个有限状态空间 S 上的马尔可夫链 Xt{displaystyle {boldsymbol {X}}_{t}}{boldsymbol  {X}}_{{t}}


如果在一个时间步长内从 i{displaystyle i}ij{displaystyle j}j 移动的概率为 Pr⁡(j|i)=Pi,j{displaystyle operatorname {Pr} (j|i)=P_{i,j}}operatorname {Pr}(j|i)=P_{{i,j}},随机矩阵 P 的第 i{displaystyle i}i行,第 j{displaystyle j}j 列元素由 Pi,j{displaystyle P_{i,j}}P_{{i,j}} 给出,例如,


P=(p1,1p1,2…p1,j…p2,1p2,2…p2,j…pi,1pi,2…pi,j…).{displaystyle P=left({begin{matrix}p_{1,1}&p_{1,2}&dots &p_{1,j}&dots \p_{2,1}&p_{2,2}&dots &p_{2,j}&dots \vdots &vdots &ddots &vdots &ddots \p_{i,1}&p_{i,2}&dots &p_{i,j}&dots \vdots &vdots &ddots &vdots &ddots end{matrix}}right).}P=left({begin{matrix}p_{{1,1}}&p_{{1,2}}&dots &p_{{1,j}}&dots \p_{{2,1}}&p_{{2,2}}&dots &p_{{2,j}}&dots \vdots &vdots &ddots &vdots &ddots \p_{{i,1}}&p_{{i,2}}&dots &p_{{i,j}}&dots \vdots &vdots &ddots &vdots &ddots end{matrix}}right).

由于从状态 i{displaystyle i}i 到下一状态的概率总和必须是 1,这个矩阵是一个右随机矩阵,于是


jPi,j=1.{displaystyle sum _{j}P_{i,j}=1.,}sum _{j}P_{{i,j}}=1.,

i{displaystyle i}ij{displaystyle j}j 分两步转变的概率由然后由给定的 P{displaystyle P}P 的平方矩阵的 (i,j){displaystyle (i,j)}(i,j) 号元素给出:


(P2)i,j.{displaystyle left(P^{2}right)_{i,j}.}left(P^{{2}}right)_{{i,j}}.

一般地,在由矩阵P{displaystyle P}P给出的有限马尔可夫链上从任何状态转移到另一个状态的 k 步转移概率为 Pk{displaystyle P^{k}}P^{k}


初始分布为一个行向量。


平稳概率向量 π{displaystyle {boldsymbol {pi }}}boldsymbol{pi} 定义为不随转移矩阵的运用而变化的一个向量;也就是说,它定义为概率矩阵的左特征向量,其特征值为1:


πP=π.{displaystyle {boldsymbol {pi }}P={boldsymbol {pi }}.}{boldsymbol  {pi }}P={boldsymbol  {pi }}.

佩龙一弗罗宾尼斯定理英语Perron–Frobenius theorem保证了每个随机矩阵都具有这样的向量,而特征值的最大绝对值始终为1。在一般情况下,可能有多个这样的向量。然而,对于具有严格正项的矩阵,该向量是唯一的,并可以观察到对任意 i{displaystyle i}i 我们都有以下极限而求出,


limk→(Pk)i,j=πj,{displaystyle lim _{krightarrow infty }left(P^{k}right)_{i,j}={boldsymbol {pi }}_{j},}lim _{{krightarrow infty }}left(P^{k}right)_{{i,j}}={boldsymbol  {pi }}_{j},

其中 πj{displaystyle {boldsymbol {pi }}_{j}}{boldsymbol  {pi }}_{{j}} 是行向量 π{displaystyle {boldsymbol {pi }}}boldsymbol{pi} 的第 j{displaystyle j}j 个元素。在其他方面,这表示处在状态 j{displaystyle j}j 下的长期概率与初始状态 i{displaystyle i}i 是独立的。这两种计算得到相同的稳定向量是遍历定理的一种形式,在各种各样的耗散动力系统广泛成立:该系统随着时间演变到定态。


直观地看,随机矩阵表示一个马尔可夫链;对概率分布应用随机矩阵,就是将原始分布的概率质量进行重新分布,同时保持其总质量。如果反复应用此过程,分布就会收敛为马尔可夫链的平稳分布。



應用


轉移矩陣可用以表示機率(或變化比率),而矩陣相乘的結果可用以預測未來事件發生的機率。



性質


A{displaystyle mathbf {A} }mathbf{A}B{displaystyle mathbf {B} }mathbf {B} 為二個n×n階轉移矩陣,則以下亦為轉移矩陣:



  • AB{displaystyle mathbf {AB} }mathbf{AB}

  • A2{displaystyle mathbf {A} ^{2}}{mathbf  {A}}^{2}

  • 12(A+B){displaystyle {frac {1}{2}}(mathbf {A} +mathbf {B} )}{frac  {1}{2}}({mathbf  {A}}+{mathbf  {B}})



范例:猫和老鼠


假设你有一个计时器和五个相邻的格子排成一行,零时刻有一只猫在第一个格子中,而一只老鼠在第五个格子中。在计时器增加的时候猫和老鼠都会随机跳到一个相邻的格子中。例如,如果猫在第二个格子,老鼠在第四个,在计时器增加后,猫会出现在第一个格子老鼠会出现在第五个格子的概率为1/4。如果猫在第一个格子而老鼠在第五个,那么计时器增加后,猫会出现在第二个格子且老鼠会出现在第四个的概率为1。当它们处于同一个格子的时候,猫会吃掉老鼠,游戏结束。随机变量 K 给出了老鼠仍留在游戏中的时间步长。


表示这个包含五种位置组合 (猫,鼠) 的状态的游戏的马尔可夫链为:



  • 状态 1:(1,3)

  • 状态 2:(1,5)

  • 状态 3:(2,4)

  • 状态 4:(3,5)

  • 状态 5:游戏结束:(2,2), (3,3) & (4,4).


我们使用一个随机矩阵来表示这个系统的转移概率(这个矩阵中的行和列用上面提到的可能状态来索引),


P=[001/201/2001001/41/401/41/4001/201/200001].{displaystyle P={begin{bmatrix}0&0&1/2&0&1/2\0&0&1&0&0\1/4&1/4&0&1/4&1/4\0&0&1/2&0&1/2\0&0&0&0&1end{bmatrix}}.}P={begin{bmatrix}0&0&1/2&0&1/2\0&0&1&0&0\1/4&1/4&0&1/4&1/4\0&0&1/2&0&1/2\0&0&0&0&1end{bmatrix}}.


长期平均


无论初始状态是什么,猫最终都会抓到老鼠(概率为1),且极限为稳态 π = (0,0,0,0,1)。要计算随机变量 Y 的长期平均或期望值。对每种状态 Sj 和时间 tk,都有 Yj,k·P(S=Sj,t=tk) 的贡献。生存与否可以视作一个二值变量,Y=1 代表生存状态而 Y=0 代表终止状态。Y=0 的状态不对长期平均有贡献。



位相型表示




老鼠的生存函数。老鼠至少在第一个时间步长存活。


由于状态 5 是一个吸收态,吸收对时间的分布为离散位相型分布英语Discrete phase-type distribution。假设系统从状态 2 开始,表示为向量 [0,1,0,0,0]{displaystyle [0,1,0,0,0]}[0,1,0,0,0]。老鼠死亡后的状态不会对生存平均产生影响,所以状态五可以忽略。初始状态和转移矩阵可以化简为,


τ=[0,1,0,0]{displaystyle {boldsymbol {tau }}=[0,1,0,0]}{boldsymbol  {tau }}=[0,1,0,0]

以及,



T=[001/2000101/41/401/4001/20]{displaystyle T={begin{bmatrix}0&0&1/2&0\0&0&1&0\1/4&1/4&0&1/4\0&0&1/2&0end{bmatrix}}}T={begin{bmatrix}0&0&1/2&0\0&0&1&0\1/4&1/4&0&1/4\0&0&1/2&0end{bmatrix}};而 (I−T)−11=[2.754.53.52.75],{displaystyle (I-T)^{-1}{boldsymbol {1}}={begin{bmatrix}2.75\4.5\3.5\2.75end{bmatrix}},,}(I-T)^{{-1}}{boldsymbol  {1}}={begin{bmatrix}2.75\4.5\3.5\2.75end{bmatrix}},,

其中 I{displaystyle I}I 为单位矩阵,1{displaystyle mathbf {1} }mathbf{1} 表示全为1的列矩阵,进行状态的相加。


由于每个状态都占据一个时间步长,老鼠生存时间的期望就是在所有生存状态和时间步长中占据的概率之和,


E[K]=τ(I+T+T2+⋯)1=τ(I−T)−11=4.5.{displaystyle E[K]={boldsymbol {tau }}(I+T+T^{2}+cdots ){boldsymbol {1}}={boldsymbol {tau }}(I-T)^{-1}{boldsymbol {1}}=4.5.}E[K]={boldsymbol  {tau }}(I+T+T^{2}+cdots ){boldsymbol  {1}}={boldsymbol  {tau }}(I-T)^{{-1}}{boldsymbol  {1}}=4.5.

其高阶矩为


E[K(K−1)…(K−n+1)]=n!τ(I−T)−nTn−11.{displaystyle E[K(K-1)dots (K-n+1)]=n!{boldsymbol {tau }}(I-{T})^{-n}{T}^{n-1}mathbf {1} ,.}E[K(K-1)dots (K-n+1)]=n!{boldsymbol  {tau }}(I-{T})^{{-n}}{T}^{{n-1}}{mathbf  {1}},.


参见



  • Muirhead's inequality

  • 佩龙一弗罗宾尼斯定理英语Perron–Frobenius theorem

  • 密度矩陣

  • 双随机矩阵英语Doubly stochastic matrix

  • Discrete phase-type distribution

  • 概率自动机英语Probabilistic automaton

  • Models of DNA evolution


  • 马尔可夫核英语Markov kernel,随机矩阵在连续状态空间的等价形式



参考文献





  1. ^ Markov Chains. Applied Probability and Queues. Stochastic Modelling and Applied Probability. Springer, New York, NY. 2003: 3–38. ISBN 9780387002118. doi:10.1007/0-387-21525-5_1 (英语). 



  • G. Latouche, V. Ramaswami. Introduction to Matrix Analytic Methods in Stochastic Modeling, 1st edition. Chapter 2: PH Distributions; ASA SIAM, 1999.




Comments

Popular posts from this blog

Information security

Volkswagen Group MQB platform

刘萌萌