关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
) Y; W# c" ^4 ^8 U; S) Z- }9 L" L: G- S2 h$ L9 C
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' s( h( {: P) ^- f% c, b, @/ O  以下三个定义:' K. s# O+ D4 n4 u7 P0 c! r
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 r- @: K5 ~; S6 j- D) |
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 V" O  S7 K) _* p# ^  所谓的双方优势策略则是指双方利益总和最大的策略。  
# r0 C0 v/ g! A, \[编辑本段]严格优势策略举例分析. l' ^! b3 W1 E( ^. e; d
  一、经典的囚徒困境 " ?* @4 \2 a, w' w( X
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ L: Z& m0 q; i( V# H/ O5 m  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& c' O  m( H; Y% q6 H2 g  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( |0 w' w2 e' E
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 M" q2 {! ]- n# R
  若二人都互相检举(互相“背叛”),则二人同样判监2年。- F" ~% n1 ?9 F: m( x5 p/ L8 M' r
  
" A9 P5 f8 T  x) }6 a+ q用表格概述如下:
2 E2 _9 C0 \8 k5 \9 {/ L6 h1 w& b% ?5 n# r$ _1 E+ |/ _
    甲沉默(合作)  甲认罪(背叛)  
4 L3 M8 y3 ~" ?# C) A) {% v乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
1 O2 m! b. M1 |3 p! b7 t乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  + _6 O# d- j8 w

8 t% Z3 i# Z' z' {  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 a- Y# P% H, H; E$ A, p" ^% r  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 S$ B' \8 q& K7 }* R# e0 q. W/ j  j" q
  若对方沉默、背叛会让我获释,所以会选择背叛。
% F, ^. Z) i9 v  I0 N) j6 _& y  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " H9 n& E! d) T# @- k$ X  i  s' T
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% l' z: E, c8 v; ?  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + J# ^7 x  ]3 |( j- i" c- o
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* g* g: K# ]; g0 K) _6 B2 ]
[编辑本段]二、智猪博弈理论
) ~# w2 U& b7 W9 x2 S  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 T7 L7 O0 h7 J0 [6 L9 h8 k4 k  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 y- Z' F" z- g9 P* }3 C8 s  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - E, s' H! z: C/ ~7 D. x0 _9 f7 i3 F
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. _: J# X$ I! P) o; o  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! L" k" k0 l! F: n4 i5 ~( R$ l  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ a5 _7 b! N+ l: K
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! F& A9 m8 [+ X$ w  p  
9 f; {: r1 N1 h4 C% a三、关于企业价格策略
3 X9 @( M. A. G. t4 p
' X9 A# Y4 U6 `6 S. c7 Q  $ ^8 w& F) w+ |; O# z5 a
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , n# M! B# v+ _; p$ w% T
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);  _' @+ I% ?4 q0 M5 ~
  以下三个定义:1 W3 \2 P, ^' h" Z
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 - K0 S8 A! d; ]) E6 `2 {7 P
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 @1 |) N; f& X1 n9 T. E: {" c  所谓的双方优势策略则是指双方利益总和最大的策略。  - a: @* S' W; c( t
[编辑本段]严格优势策略举例分析
& d: A: _9 _& m: Y% w3 B8 F  一、经典的囚徒困境 2 ~* D3 [. ]3 H) P' b# @
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' n; ?  a# ^2 g  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 `. O6 P/ R/ q6 ~  D& R  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 F4 d8 M0 u7 E2 k3 J" x
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: q& W& {' {& X* t( K  若二人都互相检举(互相“背叛”),则二人同样判监2年。' b) w" @) E  @) o2 O. Z6 ?: a
  
. ^8 d- U+ l; ~! r2 v; f用表格概述如下:
3 i* h8 k% V4 w$ M7 H
  Y* L" w. S# f) D6 J7 ]    甲沉默(合作)  甲认罪(背叛)  
+ Z! S3 Q  M1 }, w) e乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ( h* ~5 S, h$ [7 S2 }
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  + {" M; ?- d" S3 ~: B( v

/ a. s7 J7 w  y; y2 t+ a  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ H5 c) r7 \4 W# z4 J; a6 `  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' |* m& q; R- U& U  若对方沉默、背叛会让我获释,所以会选择背叛。
) p. H' Z8 w+ c9 z: E0 I: j  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 x4 z/ R1 e/ P
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 P- y& X" ?% ]0 j9 j
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- A. d/ Z7 K0 B9 N) O$ i  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 ^, P+ V5 h7 S! ~9 Y3 Q2 F, ~
[编辑本段]二、智猪博弈理论
% U. Y; D* D. n: T  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ Z: z0 J" z8 @' _3 s  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
) q2 t) m/ t; L4 j. E, a  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . I, e( W  f  Z
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 d' g9 Q) Q& b% j# {! N
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 H. g( O7 p! _* j& U% z  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ V9 v/ `6 W# F" y  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& @( q! [5 R8 _, [, |( g/ g  
" L6 d: a9 }) [( v6 W6 r0 X三、关于企业价格策略; G( A! H+ ^; I" X9 F6 |, L

' ~! }0 g# N, u" N/ b  N  
0 b' p2 H% E6 ~3 e* o/ ~3 Q  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 }' f: P. E& M/ Q6 M$ e, ~- ^
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ y1 y6 o9 T2 X% S
  以下三个定义:3 q. P4 ?7 S- t: Z/ n
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: ]( X  ^/ H. ]. x4 J* m  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( O5 J. u# _9 e; s  u  所谓的双方优势策略则是指双方利益总和最大的策略。  
8 ?9 E# k) M* H4 w9 G( c3 L2 E$ E6 @[编辑本段]严格优势策略举例分析
( n6 d* y- ^7 {4 D, q9 t  一、经典的囚徒困境 , ?% v% U3 L9 h( E
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, J0 u: J! j* X5 ~  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 V, G5 [$ @, H  a, \5 t
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 X$ s4 j( G* Z. V  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 z* c0 B" ^6 K) R  若二人都互相检举(互相“背叛”),则二人同样判监2年。, `5 G) o" L1 N) v& c) H8 d
  & |9 U3 E) n. m+ |
用表格概述如下:9 a" y; J6 p6 ]5 W6 q1 J; M
! S2 X% b$ R6 v( w
    甲沉默(合作)  甲认罪(背叛)  ; K  R& W7 J( Q
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
8 @! L; k. t) S: v; t乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 g# x) X" U$ @5 Z; v' g" ~

+ w* [: {( I6 U% h( t% _6 A' R  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ R' |( `/ p: t1 v2 D) Q" [* J  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ v+ ^8 k; c! P% ?9 M" p0 o7 r  若对方沉默、背叛会让我获释,所以会选择背叛。 4 K$ O" Z5 x% C+ P
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 . x- H5 A( R8 J, m" ~8 v+ F
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' p: j$ v) L% g* v9 f
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   Y' d" M9 d' O* n
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- s1 e: v5 T' }* s9 \[编辑本段]二、智猪博弈理论( N+ ?& D7 r8 I/ x
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 _3 `- f1 M- u/ F2 U/ U: Y
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) G4 `4 A) j! Y% E8 Z
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: X. `% `# N: a2 j1 t+ M  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 L& V0 h0 }" s" u, p  D  M
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 D! Y( f/ s" {9 W$ f6 |  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' m) X) o0 Z& w4 j. k
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。  W8 ?$ j7 y$ [0 t/ G
  $ w  X6 o8 \9 X
三、关于企业价格策略
8 x' T, O) g% J" R5 q. F& I7 s2 c9 N* q* s- j1 {9 \& W- h) K7 V
  
1 y% C" i3 T. d! }  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( a( h9 _' R) y& a! B
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 {$ R3 O0 R* J7 r8 H
  以下三个定义:! V5 l- z/ N! J$ {6 G, _8 @$ F
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; B1 q# a1 d, e( W. g) W; P2 N
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . Q! b5 i3 U$ u: i( k
  所谓的双方优势策略则是指双方利益总和最大的策略。  8 v4 D2 s: z3 E2 e8 B/ b( w5 @6 v8 l
[编辑本段]严格优势策略举例分析( R7 ~) a( Z! }  L' I
  一、经典的囚徒困境 ( Y) f" a3 B2 p/ y# J, I
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' x* l9 ]& [2 ]2 d# y! P
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 4 V' N. t1 ~7 i8 r
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 g) S3 _4 W' f- t  J. }
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 o- h6 L/ h. V4 H
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 L- a7 L, L3 j7 C& i. K  
8 T# i. h& E6 W1 k/ \用表格概述如下:% B1 D* h6 t/ b: v! D8 s
; r: ?( M: ~- R2 ~+ `, i
    甲沉默(合作)  甲认罪(背叛)  # K, o# j* S, [% t2 O- R
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  9 m% \- V& H* d: W7 J
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  * ]% ~0 N2 n& f* N7 \7 H0 e; e8 S- M
* b9 T& b1 @/ K) ]
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ p; C0 b7 |% i* u$ J6 u  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) E" b6 f9 X  z% r$ L- ^
  若对方沉默、背叛会让我获释,所以会选择背叛。
6 H9 A) a+ U' {  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; n; w7 g! y8 y) @& B- H
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! o9 X$ v2 B3 \: Q  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 / C4 N' q4 r/ V' {+ Y
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( V8 i) P- q2 W[编辑本段]二、智猪博弈理论
* b4 p9 x- q/ G! ~- |  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / d4 Q3 ~" Y3 }
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ s# j- |9 P+ ]) \  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* Q3 ]) V: S. w. M4 `9 p% ~# p  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ y; c) b" q! [+ R, e/ S. G
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: S2 X: O; E7 b, y) t  q4 V. L  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / _( f% d% G8 U' i3 b$ [# ?$ y, v( K, i
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: ]  j, K+ Y# a6 B* M  I8 O* y; R/ ?  
( ]+ K( t1 i/ v& T三、关于企业价格策略
3 D% {1 ~& ~  ^' M4 ?- z
; a1 S6 [5 W3 J  I$ u  $ I8 h! n8 U; J
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( R1 |7 ?& f# e& A+ |" W  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )