本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 7 |% a! ?' m3 k9 u+ k
! @- e8 r9 T0 e( a严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 U8 H. X, S/ ]- D# \
以下三个定义:( Y- U. l1 O: y# d- t# T
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# }5 S; H; \# c0 H% |+ F 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 % i/ b2 _* y8 Y3 J6 U
所谓的双方优势策略则是指双方利益总和最大的策略。 + g+ O& o, t* M& S
[编辑本段]严格优势策略举例分析
/ v. Y& @" x% a( [2 M 一、经典的囚徒困境 7 P/ y. ]7 W% e, ^! p6 N
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( J; y1 |3 F/ V ~! m7 l
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + `# S* Z3 J+ F y1 L) O
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 U$ n, `* H; H2 t' ~6 F* P3 n: u 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( T, d7 T# D" ^1 p! _
若二人都互相检举(互相“背叛”),则二人同样判监2年。" d3 u8 c1 Q6 W t( w$ U9 {
: v3 m$ J" Q8 M$ c3 d8 [/ o
用表格概述如下:
! D0 B' d6 R& w. V8 m9 ^2 ?
3 F8 C, S& Y3 \: `6 L+ e+ K; J; ]7 N 甲沉默(合作) 甲认罪(背叛)
1 u3 T D3 f4 _% l& z$ _乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 / z7 f: @' V4 ~5 Y, \0 O. \. s6 E& @
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 t: b) t, l5 A- l
2 `5 p' E' \+ }! I8 Q8 a 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* P' A' j( n# _; ~ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
Z0 a! g* f" ]% p" s* K% u 若对方沉默、背叛会让我获释,所以会选择背叛。 , ]' b$ Y4 |& E
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. z/ j& X. E# G# [1 } 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - @1 f$ l& F7 d% {+ c# Z7 A. q' }# g
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 6 Y0 x- V# c+ s) R! U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 R, r. |) H6 a2 D* K[编辑本段]二、智猪博弈理论
; y+ X- h5 q& f$ v( |. d2 h 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 k" P* }* V! K
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 C' R, w$ a8 R0 d 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 n* s0 K& R; R( a$ T' \ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; O& L6 J! a d F7 k “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 t# J; J# G# t3 M
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* M T, Y: }1 b! M4 W% a 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ ?, I9 e) z" k l$ v& ?
$ U6 `/ d0 r6 T" B5 f三、关于企业价格策略
5 v9 ?; `; M' r
/ |' z' s1 \" B. |
" e' k3 P( M* l( [$ k% j 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . c: \& ?. O3 l9 I0 P* U! ?
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 d5 R; E) [9 v& `+ { 以下三个定义:) y) v; U8 v6 M( N
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % ] j8 c! ?' {- W9 B8 Y: T
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 u5 y, P2 S1 N! {) z& u7 h 所谓的双方优势策略则是指双方利益总和最大的策略。 " J8 u3 Q$ ? ?) }: K% s o
[编辑本段]严格优势策略举例分析
$ h J# w7 u2 r& b% D 一、经典的囚徒困境
) T, Z& x5 Q6 h7 V" E, ] 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 x2 B1 m$ I9 m8 P0 i% P; g
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' w2 a( F& S4 V8 w, f; _! x
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 Z. R5 A6 b3 n$ Y% Q% X
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# e+ w3 Z1 _7 |. c 若二人都互相检举(互相“背叛”),则二人同样判监2年。
. b8 P% c+ Z( m6 D( U+ B
" a* j- X* ^8 u* L; V+ U! C6 T9 j' d用表格概述如下:
% I: o- C9 M/ V0 t' \! H# ]
+ M4 R% [4 q4 ]) D 甲沉默(合作) 甲认罪(背叛) . e0 f5 ?& n8 T. W
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 P I0 ]. b6 H! A5 c+ P& e
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
( E/ u4 J- {6 J1 A& q2 \
! U- M6 Q9 V3 K* A 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 A- w' v0 Q" R/ q7 A/ Z 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( P- K, Q2 v5 x, o( V7 E! ~ 若对方沉默、背叛会让我获释,所以会选择背叛。 6 ]+ a/ Q2 P) W, @2 @# ]* l# m4 C
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% J& u4 i0 q5 F, `& B! C! q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % U2 g& ^" c3 n5 V- o& l% p, Z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 t& x) W# f! K) A. ^9 K( i7 f' ? 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 z0 T# H* Z6 L! j/ i b[编辑本段]二、智猪博弈理论
o* }3 h3 Y: ~1 I5 k 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ N9 p& ~8 l1 S, \9 w% ^; x 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; t1 x: v* _8 B3 O 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' b- }6 C+ P* Y+ V 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 q+ _4 A& A$ W y7 i “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
5 n7 [0 V+ b9 }: ]: O 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 |4 R" q" a0 A9 ^! z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 A- G8 g+ `* q3 Z1 }. I# F, c
" r6 [% O/ F& ^ a三、关于企业价格策略) I+ i2 U, m7 c! i" s: u8 L
% S& F9 o0 d( s0 H5 T
2 J2 D* K$ e# [( J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 U, i1 t/ v8 S9 u: T 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 [$ H/ Y# U7 d 以下三个定义:: j/ \2 g9 G+ Z" n- K3 H/ Z6 m
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 . ~, [- M& p- e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . t1 ~2 U6 u4 ~( L
所谓的双方优势策略则是指双方利益总和最大的策略。
7 Z" F* K. k1 m6 T# P8 Q: h[编辑本段]严格优势策略举例分析 C* E. @2 Z* K$ M- p1 p* ~
一、经典的囚徒困境
& ?; |: P! T3 C6 S: }) p- z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
m4 L7 W: M& r0 c 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 5 W3 j$ c. t7 o y" C5 y, Y
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 " ]; o& S: y0 f0 s I
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 P N1 S" }* D$ N9 |' I* f 若二人都互相检举(互相“背叛”),则二人同样判监2年。/ d0 C0 }6 ]+ F+ p
: X" R6 U! W8 `% m6 A
用表格概述如下:
, X* a4 b6 M/ ` c0 `2 A0 i" R& U5 ?$ u; }1 e/ J) P6 d) z
甲沉默(合作) 甲认罪(背叛)
* T& I& F8 W" b# A( G# I |6 M乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ j6 r6 C2 p1 P3 r8 A/ [
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 4 n, L. I( x6 [7 w1 `
: J/ R7 f/ E9 a5 c, q* P5 P# v* |
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' B9 E$ u O8 {2 @- }4 [
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 [! w3 {1 ]1 L 若对方沉默、背叛会让我获释,所以会选择背叛。
9 \' J- C u! e( d% J) k 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # s+ Z l1 J2 @
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 $ R) g8 A2 ^5 k7 k- F+ q: S1 u
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * ]" }9 m5 U5 |2 V6 `) g* x
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 R" P2 q; x& M" N+ c$ v4 u; `[编辑本段]二、智猪博弈理论
/ |( w& S% h; a0 V' V7 X 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ) D) O% A* a3 x8 J3 O+ |
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 }! T* d! X6 A% k+ K/ }7 F4 _3 g, c
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: W9 u, `' g9 m5 C8 ? 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * @5 g; Z4 [7 m9 P* e2 s
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
5 c3 A) n' Y" m7 V' A# f3 h I& x- r% C 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; z. D8 Z: C3 D8 Y( P3 i' x3 s- K 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
M6 z Y5 c& u u2 H3 j( I
6 \4 s& P, O2 d三、关于企业价格策略. R- i$ i4 o, O+ Y ?4 l
- v7 ~ h' ~+ B
5 g8 a& F: I2 e' R$ C- W/ r- ~ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 b" L: u. C- ] 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, E8 C" v I% W- ^
以下三个定义:' M' r4 j% z6 k& T" y" h
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 / c7 o% E0 N3 y+ W! M) e8 O+ C) Y$ B
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 @2 @! J& z- _- z
所谓的双方优势策略则是指双方利益总和最大的策略。 ; k* P! a- j4 |" b0 R( U
[编辑本段]严格优势策略举例分析, G x$ }! L& R! N
一、经典的囚徒困境 & w2 W6 g' D; x4 K+ J% C
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 u) P+ n; A8 P. d
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
- G8 N. z6 W3 u( w' f L1 I5 B6 n 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; B* K/ Z: f5 N3 V( h9 v 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! L( ?7 f) E+ [9 L( \
若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 g# J1 y, c* b- X
' {$ M! D3 d* S. Q) p* b' v用表格概述如下:% m( a! e0 T4 o
+ g. ^9 B- Z1 R) L
甲沉默(合作) 甲认罪(背叛) 4 u0 n5 @( e0 T' f; C
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
, h t* ?' k7 G$ s乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 A2 g* k6 G$ D2 W" m0 ]
8 D" s2 M0 v, W: M& P& C1 U 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & }* ^3 e" z0 q: @7 v5 L
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; _/ h- | P) z+ t. T. k
若对方沉默、背叛会让我获释,所以会选择背叛。 O# ?2 m( `2 a0 M$ [; s
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + B* u1 Q) C2 c; w% {
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 / n# c' r) O4 Q! C6 Z9 J' b
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! }% ?# C* n; D$ k- S/ l6 i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, Q, Z; e0 M; D$ B- D[编辑本段]二、智猪博弈理论
& a, v; W& U+ z) g2 G, o& o 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
k, Q3 Q% u5 d% s0 d: y/ ^# }# J8 g 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 `6 L' j. Z! i$ x) O$ \% v% \0 a0 J
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: N9 B6 k# N! L6 n% B0 W 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ) T; u5 f3 T3 f- l
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; `) }" f. e+ } 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 r) i- p0 z; { 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% \6 o. i! C, e# U1 t: e- ?
& C( ^+ c9 h4 x9 p
三、关于企业价格策略9 G1 m! E8 j9 @. ?: `; `" @
+ e' y$ h `+ j# a
' F. N6 ], N0 |# R 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 M! o5 G0 M& r 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |