给定一个基本博弈G(可以是静态博弈也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中每次重复称为G(T)的一个“阶段”
如果是有限次的重复博弈,情况就有所不同了。用逆推法来分析博弈过程,可以表明,参与者若明确合作到了最后一期,以后不会再有重复博弈,那么,最后一期的博弈和一次性的博弈就没有区别,参与者的欺骗和违约行为是不可能被报复的,于是最后一期单个参与者的
占优策略就是不合作的欺骗或违约。逆推到前一期,每个参与者都推知以后将不合作,所以也不会合作。如此等等,在有限次重复博弈中,囚犯困境博弈的
纳什均衡是参与者的不合作。
无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。
无限次重复博弈不能忽视不同时间得益的
价值差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和
博弈均衡的分析必须以平均得益或总得益的现值为根据。
无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。