演化方程
揭示动态对策变化规律的方程
演化方程(evolution equation)是揭示动态对策变化规律的方程。动态对策是与同步对策相对的概念,它意味着局中人按一定顺序相继作出若干步决策。对于动态对策通常考虑两种均衡概念:子对策精练纳什均衡与贝叶斯均衡。
概念
演化方程是揭示动态对策变化规律的方程。即:
这里考虑的是一个动态两人零和对策:
式中Xk={x(k)},Yk={y(k)}分别表示局中人Ⅰ和局中人Ⅱ在k时刻的策略集,Ak是依赖于策略x(k)和y(k)的局中人Ⅰ的赢得函数,z(k)是状态变量,fk(·)是某个函数,当初态z(0)已知时,局中人Ⅰ在整个对策过程的赢得为
动态对策
动态对策是与同步对策相对的概念,它意味着局中人按一定顺序相继作出若干步决策。动态对策理论通常依赖于以下基本假设:
(1)每个局中人了解每一结局的后果,且确信其对手也了解这一点。
(2)每个局中人能完全记住自己及对手已 作出的所有策略选择。
对于动态对策通常考虑两种均衡概念:子对策精练纳什均衡与贝叶斯均衡。
设对一展开型对策的每个决策结点x,指 定了概率μ(x),使得对每个信息集H,有 。对于信息集H、在H行动的局中人i及某个混合策略组σ=(σi,σ-i),若对i的任何其他混合策略i,i在策略组(σi,σ-i)下从H 开始的期望收益不小于在(i,σ-i)下从H开始的期望收益,即:E[ui|H,μ,σi,σ-i]≥E[ui|H,μ,i,σ-i],则说σ对H是序列合理的。若σ对所有信息集 H是序列合理的,且当Prob(H |σ)>0时,对任何x∈H有:Prob(x|σ)=μ(x)Prob(H|σ),则称σ为弱完全贝叶斯均衡,简称为WPBE。 WPBE必为纳什均衡,反之则未必。
贝叶斯均衡
贝叶斯均衡是不完全信息博弈(贝叶斯博弈)的均衡概念,静态的不完全信息博弈的均衡被称为贝叶斯纳什均衡,动态的不完全信息博弈的均衡被称为精炼的贝叶斯纳什均衡。解决不完全信息的方法是使用哈萨尼转换。
静态贝叶斯博弈记为G={a1,…,an;θ1, …,θn;p1,…,pn;u1,…,un}。其中ai是第i个博弈方采取的行动(纯策略),ai∈Ai(θi),Ai(θi)是 第i个博弈方类型依存的行动空间;θi是第i个博弈方的类型,Θi是第i个博弈方的类型空间;pi是第i个博弈方的类型为θi(θi∈Θi)的概率。 ui是第i个博弈方的效用,ui=ui(a1,…,ai,…, an;θ1,…,θi,…,θn)=ui(ai,a-i;θi,θ-i)。其中θ-i=(θ1,…,θi-1,θi+1,…,θn)。
定义一:如果对所有的i,ai*∈Ai(θi),使得:
则a*=(a1*,…,an*)就称为一个(纯策略)贝叶斯纳什均衡。混合策略的贝叶斯纳什均衡的定义类似。其中pi(θ-i|θi)是第i个博弈方在已知 自己的类型为θi时判定其他博弈方类型属于θ-i的概率。
在动态博弈中,记Si(θi)为第i个博弈方类 型依存的策略空间,si∈Si(θi)是Si中的一个特 定的策略。记a-ih=(a1h,…,ai-1h,ai+1h,…,anh)是 在第h个信息集上参与人i观测到其他参与人的行动组合。记p(θ-i|a-i)是第i 个博弈方在观测到a-i后关于θ-i的后验概率。
定义二:精炼贝叶斯均衡是一个策略组合 s*=(s1*,…,sn*)和一个后验概率分布p=(p1, …,pn),满足:
1.对于所有博弈方i,在每一个信息集h,si*使得:
2.后验概率i(θ-i|a-i)是使用贝叶斯法则,从先验概率pi(θ-i|θi),观察到的a-i和最优 策略s-i得到的(在可能的情况下)。
需要注意的是,精炼的贝叶斯均衡不仅仅是关于策略的均衡,而是关于策略s和对类型的判断(信念)的共同均衡。 给定信念p,策略s是最优的;给定均衡策略s,是使用贝叶斯法则从均衡策略和观测到的行动得到的。
贝叶斯博弈
又称“不完全信息博弈”。“完全信息博弈”的对称。至少有一个参与者不知道其他参与者的类型特征、对策和收益的一种博弈类型。不完全信息博弈是以英格兰概率统计学家贝叶斯(Bayes,Thomas,1702—1761)的名字命名的。
1967年前,博弈论对不完全信息博弈是无能为力的。匈牙利经济学家海尔萨尼(Harsanyi,John Charles, 1920—2000)引入了虚拟参与者——“自然”,将不完全信息模型化并进行分析。其工作被称为“海尔萨尼转换”。通过这个转换,海尔萨尼将不完全信息博弈转换为完全但不完美信息博弈。所谓不完美信息博弈,是指“自然”作出了它的选择,但是其他参与者并不知道它的具体选择是什么,仅知道该选择的各种可能的概率分布(先验信念)。在这个基础上,海尔萨尼定义了“贝叶斯-纳什均衡”(或称为“贝叶斯均衡”)。贝叶斯均衡是纳什均衡在不完全信息博弈中的扩展。
子对策精练纳什均衡
设Γ是有N个局中人的展开型对策。Γ的 一个子集G称为Γ的一个子对策,若它满足以 下两个条件:
(1)G从某个含惟一决策结点的信息集开始,包含这个结点的所有(直接或间接)后继决 策结点,且仅含有这样的结点。
(2)G由若干完整的信息集组成,即若G含信息集H中某点x,则必定包含整个H。
子对策自身组成一个对策,因而可对之应用对策论的结论。
给定Γ的子对策G与Γ的纳什均衡σ。若 当G单独考虑时,σ对应G中信息集的那些行为构成G的一个纳什均衡,则说σ在子对策G 中导出一个纳什均衡。若σ在Γ的每个子对策 中导出一个纳什均衡,则称σ为Γ的子对策精 练纳什均衡,简称为SPNE。SPNE必定是纳什 均衡,但反之则未必,试看下例。
设Γ是如图1所示的展开型对策。开发商 A的策略集SA={开发,不开发};B的策略集
SB={(开发,开发),(开发,不开发),(不开发, 开发),(不开发,不开发)},其中(开发,开发)表 示策略“当A开发时B开发,当A不开发时B 开发”,其余类推。Γ可表示如下表所示的标准 型对策。这个标准型对策有三个纳什均衡:
(开发,(不开发,开发))、(开发,(不开发,不开 发))与(不开发,(开发,开发))。对策Γ有三个 子对策:Γ本身及分别从结点ⅡC与ⅡG出发的 子对策C与G。因在子对策C内不开发是最优的,而在子对策G内开发是最优的,故(开发, (不开发,开发))分别在C与G内考虑时是纳 什均衡,从而它是SPNE。但易于验证,P的其 他两个纳什均衡都不是SPNE。
参考资料
最新修订时间:2022-08-25 15:21
目录
概述
概念
动态对策
参考资料