天才一秒记住【畅想小说网】地址:http://www.cxtra.net
故知在齐王赛马的对策中,双方都没有最优纯策略.
设齐王和田忌的最优混合策略为
X*=(x*1,x*2,x*3,x*4,x*5,x*6)T
Y*=(y*1,y*2,y*3,y*4,y*5,y*6)T
从矩阵A的元素来看,每个局中个选取每个纯策略的可能性都是存在的,故可事先假定x*i≥0,y*j≥0,i=1,2,…6,j=1,2,…,6
于是求解线性分程组
3x1+x2+x3-x4+x5+x6=v
x1+3x2-x3+x4+x5+x6=v
x1+x2+3x3+x4-x5+x6=v
x1+x2+x3+3x4+x5-x6=v
x1-x2+x3+x4+3x5+x6=v
-x1+x2+x3+x4+x5+3x6=v
x1+x2+x3+x4+x5+x6=1
和
3y1+y2+y3+y4+y5-y6=v
y1+3y2+y3+y4-y5+y6=v
y1-y2+3y3+y4+y5+y6=v
-y1+y2+y3+3y4+y5+y6=v
y1+y2-y3+y4+3y5+y6=v
y1+y2+y3-y4+y5+3y6=v
y1+y2+y3+y4+y5+y6=1
得到xi=16i=1,2,…,6
yj=16j=1,2,…,6
V=1
故齐王和田忌的最优混合策略为:
X*=(16,16,16,16,16,16)T
Y*=(16,16,16,16,16,16)T
对策的值齐王的期望赢得为VG=1.
这与我们的设想相符,即双方都以16的概率选取每个纯策略或者说每个纯策略的被选取的机会应是均等的,则总的结局应该是:齐王有56的机会赢田忌,赢得的期望值是1千金.但是齐王在每出一匹马前将自己的选择告诉了对方,这实际上等于公开了自己的策略,如齐王选出马次序号(上、中、下),则田忌根据谋士的取建立便以(下、上、中)对立,结果田忌反而可得千金.因此,在矩阵对策不存在鞍点时,竞争的双方在开马前,均应对自己的策略(实际上是纯策略)加以保密,否则不保密的一方是要吃亏的.
例7.5.3有一种游戏:任意掷一个硬币,先将出现是正面或反面的结果告诉甲.甲有两种选择:(1) 认输,付给乙一元;(2) 打赌,只要甲认输,这一局就终止重来.当甲打赌时,乙也有两种选择:(1) 认输,付给甲一元;(2) 较真,在乙较真时,如钱币掷的是正面时,乙输给甲二元,如钱币是反面,甲输给乙两元.试建立甲方的赢得矩阵,求对策值及双方各自的最优策略.
解:甲有四种纯策略,(1) 均认输,(2) 均打赌,(3) 正面认输,反面打赌,(4) 正面打赌,反面认输,乙有两种纯策略,(1) 较真,(2) 认输,甲的赢得矩阵
A=-1-1
01
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!