博弈理論論文8篇

時間：2023-04-23 15:13:59

緒論：在尋找寫作靈感嗎？愛發(fā)表網(wǎng)為您精選了8篇博弈理論論文，愿這些內(nèi)容能夠啟迪您的思維，激發(fā)您的創(chuàng)作熱情，歡迎您的閱讀與分享！

博弈理論論文

篇1

分析的興起與70年代，起始于1978年出版的G.A.科亨的《卡爾•馬克思的歷史理論：一個辯護(hù)》一書。在80年代形成一種學(xué)術(shù)思潮，影響至今。嚴(yán)格的說，“分析的”不是一個學(xué)派或者流派，因?yàn)樗鼪]有通常能夠成為學(xué)派的基本的立論特征，比如，相互認(rèn)可的基本特征，原理，主要觀點(diǎn)等，它是一個開放的系統(tǒng)，松散的互相討論、學(xué)者之間的觀點(diǎn)并不是互相認(rèn)同，那為什么稱之為一個學(xué)派呢？原因有兩個，以使他們的研究方法都有英美分析哲學(xué)的底子，采取的用分析的方法重新研究的經(jīng)典原著，分析哲學(xué)20世紀(jì)起源于英國，1905年羅素《論指標(biāo)》，其產(chǎn)生是自然科學(xué)升入發(fā)展，數(shù)理邏輯影響空前的催化下形成的一種哲學(xué)思潮，強(qiáng)調(diào)分析方法的重要性，分解分析法，就是把整體分解為各個部分或組成要素，形式分析法，分析科學(xué)預(yù)言，命題，推理形式結(jié)構(gòu)，意義分析法，分析詞語，命題的意義，特別是分析元邏輯，元科學(xué)語言的意義。與的結(jié)合，有利于理論的精確化，清晰，嚴(yán)密。其二他們聲稱以為研究對象，追求的是重構(gòu)一種既是科學(xué)的又是革命的理論，科學(xué)的意義是指，符合20世紀(jì)的哲學(xué)標(biāo)準(zhǔn)，機(jī)構(gòu)嚴(yán)謹(jǐn)，話語明確，革命的意義是說，一種有關(guān)解放的理論。分析的者基本上可以分為兩類，一些注重理論的詮釋和概念化，拒絕或批判各種形式的方法論主義和個人主義的微觀基礎(chǔ)，一些強(qiáng)調(diào)以理性選擇為方法論原則探討理論的微觀基礎(chǔ)，既反對整體主義也對基礎(chǔ)注意持某種否定態(tài)度，而且從實(shí)踐和理論角度來看，分析的決不是一套和信心年集中在一起的緊湊實(shí)體，不存在一種分析的理論，也不存在一種分析的研究方式，分析的馬克思只是將不同的觀點(diǎn)和研究路徑結(jié)合到了一起。分析的其研究對象可分為三部分，一部分是方法論問題，二是經(jīng)驗(yàn)理論部門，主要是歷史唯物主義和資本主義的經(jīng)濟(jì)分析，三是規(guī)范理論部分，主要是對異化，剝削等倫理問題的分析。

分析的的最早代表人物是柯亨，埃爾斯特，羅默等。分析的者各自取得了一定的成就，柯亨在歷史唯物主義解釋中取得了影響，羅默是最具創(chuàng)造性和獨(dú)創(chuàng)性的人物，他的關(guān)于資本主義和積極剝削的博弈理影響很大，埃爾斯特的研究成果總體上對馬克思的否定多于重構(gòu)，他對方法論的研究影響頗大，賴特將它的階級理論與在幾個國家進(jìn)行的經(jīng)驗(yàn)調(diào)研結(jié)合起來，提供了一種對實(shí)際現(xiàn)存于資本主義中的階級和剝削模式的剖析，他還發(fā)起并參與了名為“真正的烏托邦”的對社會主義建設(shè)前景的研究，范帕里斯將環(huán)境主義與相結(jié)合，他的基本收入理論影響廣泛，布倫納對不同的前資本主義歐洲經(jīng)濟(jì)中階級結(jié)構(gòu)的變動提供了一種歷史的說明，重新開展了關(guān)于從封建主義相資本主義過渡的特征的爭論，鮑爾斯以有關(guān)不完善的勞動契約的思想，考察了工廠中階級斗爭的必然性。巴洛漢研究了第三世界的半封建關(guān)系和新生的資本主義，他還與羅默一起研究了有關(guān)市場社會主義設(shè)計(jì)的問題。做出了自己的貢獻(xiàn)。最近的，金里卡也對分析的做出了自己的經(jīng)典評價。通過一個體系在考察分析的有關(guān)剝削和異化理論，對強(qiáng)制性的轉(zhuǎn)移剩余價值就是剝削這一個觀點(diǎn)的堅(jiān)持，事實(shí)上，這是一種對自我所有權(quán)的自由至上主義的關(guān)注，金里卡對正義、平等這些倫理與哲學(xué)概念也作出了重新解構(gòu)與詮釋，用自己特有的方法給出了自己的答案，可以說對政治哲學(xué)發(fā)生了重要影響。在這里尤其是有關(guān)對剝削和異化的分析，對這些規(guī)范理論的倫理性分析，確實(shí)需要我們認(rèn)真地把握。

二、對剝削理論地分析

1、經(jīng)典克思主義者的觀點(diǎn)

馬克思的剝削理論是以勞動價值論為基礎(chǔ)進(jìn)行展開的。馬克思從商品一因素到生產(chǎn)商品勞動的二重性。再到只有勞動力創(chuàng)造價值和剩余價值，建立了科學(xué)的勞動價值論。而馬克思的剝削理論又是基于其勞動價值理論之上的，即剝削也就是對被剝削者在剩余勞動時間里所創(chuàng)造的剩余價值的一種剝奪。剝削特指資本家從工人的勞動中榨取的價值（以產(chǎn)品的形式），超過了對工人勞動力的報(bào)酬（以工資的形式）。資本家就是工人的剝削者，資本家只是在能夠榨取公認(rèn)的“剩余價值”的前提下才會雇用工人，因此，這種通過剝削把剩余價值從工人轉(zhuǎn)向資本家的做法存在于所有的勞資關(guān)系中，勞資關(guān)系本質(zhì)上是一種剝削關(guān)系。馬克思對剝削的概念采取了這種技術(shù)性的定義。并且者都把對剩余價值的榨取當(dāng)作不正以的證據(jù)，事實(shí)上，當(dāng)作不正義的范例。的剝削觀是否還有道德意義，例如，是否涉及著對他人的不公平利用，技術(shù)意義上的剝削是一種不正義，對此的傳統(tǒng)論正是這樣的。

a只有勞動才創(chuàng)造價值

b資本家獲得了產(chǎn)品的一部分價值

c勞動者所獲得的價值少于他所創(chuàng)造的價值

d資本家獲得了勞動者所創(chuàng)造的價值的一部分

e勞動者被資本家剝削

馬克思通過勞動價值論對剝削下的技術(shù)性定義，并且左證了這是一種不正義的范例。隨著時代的變化，也遭來了廣泛的質(zhì)疑。

2、當(dāng)代分析對剝削理論的質(zhì)疑與重構(gòu)

當(dāng)代分析對剝削理論的質(zhì)疑與重構(gòu)主要來自兩個方面。

首先，是對勞動價值論的質(zhì)疑，按照勞動價值論，產(chǎn)品的價值由生產(chǎn)該產(chǎn)品所需的勞動量來決定，但如柯亨所指出的那樣，勞動價值論事實(shí)上正好與a相反，因?yàn)椋凑談趧觾r值論的說法，產(chǎn)品的價值由當(dāng)下所需的生產(chǎn)這種產(chǎn)品的勞動量所決定，而不由再生中實(shí)際投入的勞動量所決定，如果技術(shù)革新使得當(dāng)下生產(chǎn)某種產(chǎn)品只需要過去一般的勞動量，勞動價值論就說，對于已經(jīng)在過去生產(chǎn)出來的產(chǎn)品而言，即使投入其中的勞動量沒有什么變化，該產(chǎn)品的價值也只有以前的一半，如果勞動價值論是正確的話，工人實(shí)際投入的勞動就不是價值的決定因素。重要的不是工人創(chuàng)造了價值，而是他們創(chuàng)造了具有價值的東西，使得剝削的指控得以成立的，不是資本家占有了工人生產(chǎn)的一部分價值，而是占有了工人生產(chǎn)的東西所具有的價值的一部分，創(chuàng)造具有價值的產(chǎn)品不同于創(chuàng)造那些產(chǎn)品的價值，而前者才真正構(gòu)成了對剝削的指控，就算不是工人創(chuàng)造了產(chǎn)品的價值。因此，恰當(dāng)?shù)恼撟C是這樣的：

aa只有勞動這才是創(chuàng)造產(chǎn)品的人，而產(chǎn)品才具有價值

bb資本家獲得了產(chǎn)品的一部分價值

cc勞動者所獲得的價值要少于他所創(chuàng)造的產(chǎn)品具有的價值

dd資本家獲得了勞動者所創(chuàng)造的產(chǎn)品的價值的一部分

ee勞動者被資本家所剝削

當(dāng)然這種論證還是不能解決關(guān)于正義的問題，因?yàn)榇嬖谥鲃訉⒆约旱膭趧恿ω暙I(xiàn)出來的問題，后來將這種剝削關(guān)系加上了強(qiáng)迫這一限制性條件，工人為資本家工作必須是強(qiáng)迫的結(jié)果，對剩余價值的強(qiáng)迫轉(zhuǎn)移是一種剝削。但是這種限定也出現(xiàn)了問題，他把嚴(yán)格意義上講并非出自強(qiáng)迫的勞資關(guān)系排除到了剝削范圍之外，同時剩余價值的強(qiáng)迫轉(zhuǎn)移在很多情況下也可能是正當(dāng)?shù)摹Ｗ钪匾氖?，按照這種強(qiáng)迫的觀點(diǎn)，保護(hù)兒童和婦女的強(qiáng)制性征稅也是一種剝削。剝削理論產(chǎn)生了不可逾越的問題。這引起了第二次的修正。是不是剝削取決于對剩余價值的具體處理是否符合更大的分配正義的模式，存在著使剝削成為不正義的更深的不正義，對生產(chǎn)資料的不平等占有。

第二、對剩余價值強(qiáng)迫轉(zhuǎn)移的修正，正如羅默后來對剝削的定義，不是基于剩余價值的轉(zhuǎn)移，而是基于對生產(chǎn)資料的不平等擁有，按照他的觀點(diǎn)，某人是否遭到了剝削，取決于在一種假像的分配平等條件下他的境遇是否會更好，那種假像的條件意味著，某人可以帶走自己的勞動力和人均擁有的外部資源而推出現(xiàn)行的分配條件，如果我們把不同的經(jīng)濟(jì)群體當(dāng)作由現(xiàn)行財(cái)產(chǎn)關(guān)系確定規(guī)則的游戲的參與者。那么，某個群體一旦滿足了下述條件就被視為遭到了剝削，如果該群體的成員帶著人均擁有的外部資源推出了這個游戲并開始自己的游戲之后其處境反而更好，按照羅默的看法，如果退出資本主義的游戲，在崗工人和下崗工人的處境都會變得更好。因此遭到了剝削。剝削是資本主義制度下分配不正義的最常見的結(jié)果，在這里就直接解決了強(qiáng)迫與正義的問題，這樣的解釋允許我們處理勞資關(guān)系之外的分配不正義，這些都源于對資源的不公平占有。但是問題也是顯而易見的。

3、金里卡的質(zhì)疑與意見

首先羅默擴(kuò)大了剝削的范圍，并使之覆蓋所有形式的分配不平等，我們需要基礎(chǔ)性的原則去證明人們對自身和外部資源擁有的權(quán)利和資格，只有從在先的和更寬泛的關(guān)于不平等分配的原則，才能推導(dǎo)出剝削的觀點(diǎn)，金指出剝削不過是分配不正以的諸多形式中的一種；金對羅默混淆了平等與剝削也提出了批評，如果不平等需要某種更深入的平等原則加以裁決，這就是要使擁有資源的途徑化的倫理命令，剝削在平等理論中就不再占有道德關(guān)注的中心地位；關(guān)于私有財(cái)產(chǎn)的不平等占有，金里卡認(rèn)為并不一定導(dǎo)致剝削，如果能夠在羅爾斯“持有財(cái)產(chǎn)的民主”得那樣制度中產(chǎn)生，如果人們能夠意識到選擇的后果，如果人們的不同偏好是在正義的條件下形成的，事實(shí)上也是這樣的，相反，對生產(chǎn)資料的社會化也許會引起剝削，使資源平等也許不會產(chǎn)生剝削，而使資源社會化也許會產(chǎn)生剝削，這取決于人們的偏好和境遇；最重要的是，金里卡通過一種整體的有關(guān)對正義地分析，表達(dá)了與羅爾斯等自由主義的平等主義的正義觀相一致的部分，而不是僅僅簡單的一種擺設(shè)。

三、對異化理論的分析

1、經(jīng)典克思主義者的觀點(diǎn)

馬克思對資本主義的批判不僅僅是對剝削的關(guān)注，而且訴求這對異化的完善論式的關(guān)注，這種完善論的觀點(diǎn)不僅強(qiáng)調(diào)，私有財(cái)產(chǎn)的問題在于存在剝削，而且因?yàn)閯兿鞯氖芤嬲咴獾搅水惢鵁o法發(fā)展他們作為人的本質(zhì)能力。馬克思對異化理論的分析主要包括四個方面，第一，勞動產(chǎn)品的異化，即勞動生產(chǎn)出來勞動產(chǎn)品成為奴役和統(tǒng)治勞動者的異己力量。“勞動者生產(chǎn)的財(cái)富越多，他的產(chǎn)品的力量和數(shù)量越大，他就越貧窮?！?《1844年經(jīng)濟(jì)學(xué)哲學(xué)手稿》第44頁)在資本主義社會勞動表現(xiàn)為勞動者的非現(xiàn)實(shí)化，對象化表現(xiàn)為對象的喪失和為對象所奴役，占有表現(xiàn)為異化、外化。于是勞動者在勞動中的力量越多，他親手創(chuàng)造的與自身相對立的異己的對象世界的力量便越強(qiáng)大，他本身、他的內(nèi)部世界便越貧乏，歸他所有的東西便越少。第二，勞動活動的異化，即勞動者的勞動成為一種被迫的強(qiáng)制勞動“‘對勞動者來說，勞動是外在的東西，也就是說是不屬于他的本質(zhì)的東西，因此，勞動者在勞動中不是肯定自己，而是否定自己，并不感到幸福，而是感到不幸并不是自由地發(fā)揮自己的肉體力量和精神力量，而是使自己的肉體受到損傷，精神受到摧殘?！?《1844.年經(jīng)濟(jì)學(xué)哲學(xué)手稿》第45頁)第三，人的本質(zhì)的異化，即把作為人的本質(zhì)的自由自覺改造世界的活動“變成與人異類的本質(zhì)，變成他的個人生存的手段”(《1844年經(jīng)濟(jì)學(xué)哲學(xué)手稿》第51頁)。人是類存在物，這不僅是說人無論在實(shí)踐上還是在理論上都把類作為自己的對象，而且是說人把自己也當(dāng)作活生生的類，當(dāng)作普遍的因而也是自由的存在物對待這種自由的存在物同自然也是和諧統(tǒng)一的。異化勞動從人那里把自然異化出去。第四，人與人的異化，即勞動產(chǎn)品為他人所占有。馬克思指出，外在于人并奴役人的勞動和勞動產(chǎn)品所歸屬的那個異己存在物只能是人本身。通過異化勞動，“人不僅生產(chǎn)出自己同作為異己的、與之相對的力量的生產(chǎn)對象和生產(chǎn)行為的關(guān)系.而目_也生產(chǎn)出其它人同他的生廣“和他的產(chǎn)品的關(guān)系，以及他本身同這些其它人的關(guān)系”(《1844年經(jīng)濟(jì)學(xué)哲學(xué)手稿》第51頁)。

2、當(dāng)代分析對剝削理論的質(zhì)疑與重構(gòu)

雖然馬克思的異化理論為禁止私有財(cái)產(chǎn)提供了很好的辯護(hù)。但是勞動的異化與否卻并非唯一的價值準(zhǔn)繩。如果我愿意通過異化勞動而獲得閑暇。同時有些人對消費(fèi)價值的關(guān)注，使得他們寧愿去獲得異化勞動，而非異化勞動也不是天賜餡餅，需要動用資源去獲得。同時非異化勞動也是對友誼是一種威脅，這種對生產(chǎn)的關(guān)注，卻是忽視了友誼和消費(fèi)的價值。它并不是一種至高無上的利益。同時，自由合作的生產(chǎn)，才能使我們成為認(rèn)這個觀點(diǎn)并不能成立，人們會賦予勞動的不同的價值，只要提供一種機(jī)會平等的條件和財(cái)產(chǎn)的公平劃分，異化勞動可以提高人們的生活福祉，完善論并不完全是正確的。

另外一些分析者則作了另外一種角度的修正，他們并沒有就如何分配資源給與完善論的啟示，他們預(yù)見說，人們將會珍視非異化勞動到這樣一種程度，以至于他們絕不同意用閑暇時間或家庭生活的增加來對異化進(jìn)行彌補(bǔ)。

3、金里卡的質(zhì)疑與意見

對于這種預(yù)見，金里卡認(rèn)為，通過禁止非異化勞動而干涉人們的選擇是沒有道理的，對有意思的工作進(jìn)行分配也是沒有道理的，因?yàn)槊總€人的偏好并不一樣，不應(yīng)該不恰當(dāng)?shù)陌涯承﹤€人的偏好放到特殊的地位，而是對個體帶入市場交換的資源進(jìn)行修正性分配。個體在擁有平等資源份額的情況下，自由的決定什么是愿意從事的有價值的事情，這會引起一系列關(guān)于公平分配的問題，者必須要嘗試著給出自己獨(dú)特的答案。

篇2

關(guān)鍵詞博弈理論圖書館員的特征圖書館員排班完全信息動態(tài)博弈

分類號 G251.6

Use Game Theory to Solve Library Staff Scheduling Problem

He Haizhao， Xu Ying

Abstract This paper designs the variable-sum game model according to the characteristic of librarian. In this model librarians are simply classified into two types， one need work time， another need impartiality. Based on the game theory， it will form four kinds of game’s income. The overall revenue and two sides benefit will be the largest in the complete information dynamic game when both requirements are satisfied.

Keywords Game theory. Characteristic of librarian. Librarian scheduling. Complete information dynamic game.

圖書館員在圖書館開放時輪流上班，會因館員上班時間段不同有較大差異。這種差異的公平合理性是影響圖書館員們工作行為與工作績效的重要因素，因?yàn)楣?jié)假日與晚上是所有圖書館員的非意愿上班時段。據(jù)調(diào)查，現(xiàn)代圖書館的工作環(huán)境與內(nèi)容已具備良好的吸引力，但許多有才華能力、熱愛閱讀、樂于奉獻(xiàn)與交流的人不愿意成為圖書館員，并不僅僅因?yàn)閳D書館工作枯燥單調(diào)、為他人做嫁衣等，工作時間也是重要原因之一。實(shí)際工作中，館員的排班時間表由該組織的領(lǐng)導(dǎo)做決定，組織領(lǐng)導(dǎo)對組織內(nèi)成員存在親疏關(guān)系，會直接影響組織員工的工作行為與工作績效[1]。本文試應(yīng)用博弈理論解決館員的排班問題，消除組織領(lǐng)導(dǎo)對組織成員親疏關(guān)系在排班中產(chǎn)生的影響，從而保持團(tuán)隊(duì)凝聚力。

1 研究背景

通過文獻(xiàn)調(diào)查，發(fā)現(xiàn)其他需排班的行業(yè)如機(jī)場、醫(yī)院、火車站等對排班問題已有大量的研究成果，唯有圖書館行業(yè)對館員的排班問題鮮見研究成果，僅有魏紅翠的《基于排隊(duì)論方法的圖書館人員排班問題的優(yōu)化模型》一文研究了圖書館員排班問題[2]。該文將圖書館員的排班問題用排隊(duì)理論進(jìn)行闡述研究，分為讀者需求第一及圖書館員時間意愿需求第一兩種排隊(duì)模型，發(fā)現(xiàn)圖書館員的排班問題處于兩難境地。追求讀者需求第一而又考慮館員的需求，一直為管理者的理想值，因?yàn)轲^員的工作狀態(tài)決定服務(wù)質(zhì)量。圖書館員時間意愿需求第一模型是非讀者至上型，這種模式與圖書館發(fā)展規(guī)律相違背，演化的結(jié)果是讀者疏離圖書館，這與筆者工作中觀察到的現(xiàn)象相符。本文試圖在排班過程中根據(jù)館員客觀存在競爭的事實(shí)，用博弈理論科學(xué)地闡釋館員的排班問題，以促使館員從競爭動機(jī)演化成合作動機(jī)，主動適應(yīng)圖書館職業(yè)要求特性，使所有館員的個人時間與工作時間達(dá)到平衡、個人時間與他人時間達(dá)到平衡，不因組織領(lǐng)導(dǎo)個人因素而影響服務(wù)質(zhì)量。

博弈論又常稱為對策論，是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)理方法。個人、隊(duì)組或組織，在確定的環(huán)境條件與規(guī)則下，可從各自允許選擇的行為或策略中選擇最佳方案并加以實(shí)施，最終取得相應(yīng)收益的過程。博弈問題分為以下幾種情況，詳見圖1。

根據(jù)博弈中各博弈方得益之和，常將博弈問題分為三類：零和博弈、常和博弈和變和博弈。變和博弈的結(jié)果是博弈方總體效益大小的區(qū)別，即博弈方之間可以通過相互配合獲得更大的各博弈方總體利益[3]。本文建立的博弈模型即變和博弈，整體收益值還能體現(xiàn)是否有利于工作。

圖1 博弈問題分類圖（按博弈過程分類）

2 基于博弈理論的排班問題

調(diào)查數(shù)據(jù)顯示，高校圖書館中女性館員約占69.7%，公共圖書館約為64.1%[4]。女性館員有自己的心理特征，如心思細(xì)膩、小氣、容易嫉妒、愛攀比等。工作一方面給予她們金錢收益，另一方面給予她們心理收益，即工作的滿意度[5]。排班問題中一般不考慮金錢收益問題。為了簡化博弈論模型，各博弈方的收益以女性館員的工作滿意度來衡量。公平度與滿意度成正相關(guān)關(guān)系，自身感覺越公平，滿意度就越高[6]。由于圖書館的開放服務(wù)特性，存在館員上班時間段不一樣，同一崗位不同時間段工作量不一樣的客觀現(xiàn)實(shí)，館員認(rèn)為自身在工作中受到不公平待遇，多源自上班時間段的安排。為了消除上述情況帶來的負(fù)面作用，圖書館界一直采取倡導(dǎo)職業(yè)精神，建立圖書館文化，營造和諧的人際環(huán)境等方法加以解決[7]。筆者試?yán)貌┺睦碚摚ㄟ^制定規(guī)則，消除人為競爭因素，讓館員由同質(zhì)競爭走向合作，客觀上實(shí)現(xiàn)集體利益與個人利益的雙贏。

本文建立的博弈模型中，認(rèn)為館員們是完全理性人，他們以個體利益最大化為目標(biāo)，且有準(zhǔn)確判斷選擇能力，也不會“犯錯誤”。實(shí)際工作中，圖書館員們的年齡、家庭環(huán)境、學(xué)歷、職業(yè)追求、個人能力、性格、身體狀況等方面的客觀差異，使她們對上班時間的需求不一樣。根據(jù)廣西科技大學(xué)圖書館與杭州電子科技大學(xué)圖書館中多年的排班工作經(jīng)驗(yàn)，排班時館員可以分成兩種類型區(qū)別對待。一種館員對上班時間有剛性需求，如孩子年齡小，孩子面臨升學(xué)，愛人工作時間不固定，家里老人身體不好需要照顧等情況引發(fā)的客觀性需求;一種館員為公平性剛性需求，她們在意工作安排的公平性，如在非意愿時間段內(nèi)大家上班時間長短是否一致，晚上上班次數(shù)是否一致等。這兩種類型的需求之間存在著博弈。

博弈模型中，我們將上班時間點(diǎn)剛性需求類型，取名為time類，簡稱為T類;公平性剛性需求類型，取名為just類，簡稱J類。公平性剛性需求是一個模糊自身感受值，會隨著信息不對稱性的高低而增強(qiáng)或者減弱。博弈雙方對排班時間表的滿意度為各方的收益值。排班時有兩種博弈過程，一種是T類與J類同時做出自己的決策，這是靜態(tài)信息博弈;一種是T類與J類不同時做出自己的上班時間段安排，后者能看到前者的上班時間安排，從而調(diào)整自己的策略，這是動態(tài)信息博弈。排班時，雙方進(jìn)行溝通，如告知對方自己某些時間點(diǎn)需照顧家里而不能來上班，我將非常感激你對我的照顧;或者向?qū)Ψ教嶙h這次排班你照顧我，下次我將照顧你;或者向?qū)Ψ绞竞貌橹冻龈星榛蛭镔|(zhì)等等，此種為完全信息博弈。排班時無信息交流與溝通，雙方互相不知對方的行為與決策，為非完全信息博弈。

（1）完全信息靜態(tài)博弈：各博弈方同時決策，并且所有博弈方對各方得益都了解的博弈。博弈雙方的收益如表1所示。

表1 完全信息靜態(tài)博弈

該模型在排班決策時雙方互相交流溝通，清楚對方的收益值。由于時間具有客觀上的唯一排他性，當(dāng)博弈雙方同時做出決策，不可能滿足雙方需求，但此時雙方?jīng)]有損失，所以收益值都為零;當(dāng)只滿足館員中一方的要求而未同時滿足另一方的要求時會激化排班矛盾，降低雙方的收益。如要求被滿足方，一方面因?yàn)闈M足要求而有收益值，另一方面由于這種模型方式中，雙方有過信息交流與溝通，互相清楚收益，所以結(jié)果將影響同事之間的工作合作，從而降低滿足方的博弈收益值，假設(shè)為6。未能滿足要求的博弈方，也因?yàn)殡p方排班策略收益清楚，這種結(jié)果將激化排班矛盾，所以未能滿足要求方的收益值設(shè)為-2。當(dāng)雙方需求都不被滿足時，女人的心理特質(zhì)將使雙方對排班不滿升級，這種決策結(jié)果都會減低博弈雙方的收益值，假設(shè)為-4。

（2）不完全信息靜態(tài)博弈：博弈雙方同時進(jìn)行排班策略選擇決策，但雙方互相不清楚對方收益。因?yàn)闀r間具有客觀方面的唯一排它性，當(dāng)博弈雙方同時做出決策時，不可能同時滿足雙方需求，但此時雙方?jīng)]有損失，所以收益值都為零。當(dāng)只滿足一方的意愿要求時，因?yàn)槭峭瑫r做出策略，互相不清楚收益，所以沒有激化排班矛盾，這樣被滿足要求的博弈方的收益值沒有被降低，假設(shè)為7。當(dāng)博弈的另一方，也即要求未被滿足方，因?yàn)槭峭瑫r做出博弈決策，未激化排班矛盾，所以未被滿足要求方收益為0。當(dāng)博弈雙方要求都不被滿足時，這種方式?jīng)]有激化排班矛盾，這時雙方收益值為不滿足情況下的最高收益，設(shè)為-2。博弈雙方的收益如表2所示。

表2 不完全信息靜態(tài)博弈

（3）不完全信息動態(tài)博弈：參與者對其他參與人的戰(zhàn)略空間和戰(zhàn)略組合下的策略與收益沒有完全了解，但行動有先后順序，后動者可以觀察到前者的行動，了解前者行動的所有信息。

表3 不完全信息動態(tài)博弈

雙方先后進(jìn)行排班策略選擇，但雙方的意愿需求互相隱瞞，相互間不完全了解對方的具體收益值。博弈雙方中后動的一方雖能了解先動者做出的決策，但因?yàn)殡p方策略未做溝通與調(diào)整，先動的一方設(shè)定滿足自己策略后，后動的一方不滿足對方的要求但滿足自己的要求，這樣不可能實(shí)現(xiàn)同時能夠滿足雙方需求，所以收益值都為零。因?yàn)槭窍群笞龀龅牟呗赃x擇，雙方需求沒有充分溝通，這種單獨(dú)滿足個人要求的自私行為將激化同事之間的矛盾，從而降低雙方的收益值，滿足方假設(shè)為6，不滿足方設(shè)為-4。當(dāng)雙方需求都不被滿足時會激化排班矛盾，這種決策行為減低了博弈雙方的收益值，假設(shè)為-4。

（4）完全信息動態(tài)博弈：博弈模型中的各方先后做出決策，所有博弈方?jīng)Q策時都互相了解各方的收益。

表4 完全信息動態(tài)博弈[8]

這種方式下，后選擇策略的館員能根據(jù)對方的策略進(jìn)行調(diào)整。博弈雙方有信息交流溝通，雙方收益互相透明，所有人都發(fā)揮主觀能動性，決策前積極商量調(diào)整需求，從而讓雙方都滿足需求。當(dāng)所有方意愿都被滿足后，雙方會因?yàn)檫@種決策過程增進(jìn)雙方的團(tuán)結(jié)合作度而獲得較高的心理收益，這樣提高了收益值，假設(shè)為8。因?yàn)橄群笞龀龅牟呗赃x擇，雙方需求又有溝通，這種單獨(dú)滿足個人要求的自私行為將激化同事之間的矛盾，從而降低雙方的收益值。博弈方中被滿足方的收益假設(shè)為6，不滿足方設(shè)為-4。當(dāng)雙方需求都不被滿足時，這種決策過程將急劇地增加排班矛盾，從而減低了博弈雙方的收益值，假設(shè)為-4。

博弈理論的核心是通過博弈收益改變博弈方的動機(jī)。綜上所述，管理者制定排班博弈規(guī)則后，消除信息不對稱性，使兩方進(jìn)行博弈決策，客觀地將她們的競爭動機(jī)演化成合作動機(jī)，從而達(dá)到個體與總體收益值中的最優(yōu)。

3 博弈理論在排班中的實(shí)際應(yīng)用

以廣西科技大學(xué)圖書館閱覽部為例。排班人員組成：共17個人，其中只有1名男性;平均年齡全館最大，年齡分布段為25歲到53歲;學(xué)歷層次為全館最低，60%為大專及以下學(xué)歷，40%為本科學(xué)歷;其中有13名館員是帶有安置工作性質(zhì)的博士后或教授家屬。工作內(nèi)容與情況：保證19個不需刷卡可帶包進(jìn)入的閱覽室每周開放80個小時以上;一年內(nèi)除法定節(jié)假日外需天天開放的新報(bào)刊閱覽室;閱覽室內(nèi)書刊類型復(fù)雜且管理方式各異，館員的日常工作主要為新刊記到、舊刊裝訂上架，閱覽室清潔，復(fù)印并收費(fèi)，圖書上架與整架，讀者咨詢等工作。排班工作難點(diǎn)：（1）圖書館開放時間需要4名館員同時值班，4個崗位的工作量大小差別很大;（2）閱覽部的館員工作為輪休制，很難見面，客觀上溝通交流困難;（3）閱覽部的館員大部分為家屬，工作中小矛盾容易被外部環(huán)境放大;（4）圖書館無物業(yè)管理公司，需要圖書館員帶領(lǐng)勤工助學(xué)學(xué)生負(fù)責(zé)閱覽室的清潔工作，而各閱覽室人流量不一樣;（5）閱覽室管理工作時間段忙閑不均，忙碌的時間段大約是開學(xué)后三周、期中考試時兩周、期未放假前二周。綜上原因，每到新學(xué)期預(yù)計(jì)排班時，部門內(nèi)亂成了一團(tuán)，小道消息滿天飛。館員們找部主任要求照顧、找館領(lǐng)導(dǎo)哭訴;內(nèi)部分成五六個小團(tuán)體，部門內(nèi)人員不團(tuán)結(jié)。

應(yīng)用博弈理論排班時，部主任先制定排班規(guī)則，以利達(dá)到完全信息動態(tài)博弈中雙方需求都得到滿足的最佳情況。如規(guī)定某些特殊時間段大家協(xié)調(diào)不了時采取抓鬮的方式做決定;將男同志與部主任這種明顯合作意愿強(qiáng)的人分離出來，不讓他們成為博弈方。第一次博弈排班時，因?yàn)樾畔⒌牟粚ΨQ性，大家對各崗位工作量的差異性不清楚或者故意隱藏個人私有信息以便混水摸魚，都不公開自己的時間需求。在信息不明確的情況下，博弈模型成為不完全信息靜態(tài)博弈，其中所有人需求都沒被滿足，收益都很低。第二次博弈排班時，館員們就分成了兩撥，一撥是剛性需求T方，將自身的客觀事實(shí)理由完全公開，要求獲得同事照顧，一撥是無時間要求。博弈過程中先滿足T方的館員，其博弈結(jié)果是完全信息動態(tài)博弈模型中，時間T方滿足而J方不被滿足的收益。因?yàn)镴方礙于情面，不能明確地向同事表露她們的公平要求。第三次博弈排班時，所有館員都主動要求參予排班，主動消除信息不對稱性，時間剛性需求的T方與事實(shí)中存在的J方進(jìn)行博弈，大家互相合作，很快達(dá)到了雙方需求都被滿足的情況。這樣的排班方式實(shí)行兩年后，閱覽部館員由矛盾的不和諧群體變成工作中積極主動的團(tuán)結(jié)群體。究其根源，博弈排班方法科學(xué)地促成館員們由競爭動機(jī)演化成為合作動機(jī)，發(fā)揮了館員們主觀能動性。另外在此過程中還促進(jìn)了館員們的溝通協(xié)作，提高了個人溝通協(xié)作與科學(xué)安排時間的能力。博弈式的排班過程中，男館員的加入更容易滿足完全信息動態(tài)博弈情況下的T與J方需求。因?yàn)椋叙^員們的合作動機(jī)更強(qiáng)，他們很樂意與女館員們合作。不過在某些特殊情況下，如所有館員都為時間剛需方，則要采取重復(fù)博弈以達(dá)到平衡，每次博弈時只滿足一方的需求，下一次博弈滿足另外一方的需求，這樣總體收益、各方收益也將同處于一個較高的水平。

篇3

Abstract： The incentive problems have been the focus of the company. Company incentive problems can fully mobilize the enthusiasm of the staff， and improve the effectiveness of the company. This paper analyzed company incentive problems， based on perspective of game theory， from three aspects of the owners and operators， managers and employees， and the employees， with the use of the Prisoner's Dilemma model， Kreps-Wilson reputation model and Pig Game model， and made reasonable countermeasures accordingly. Meanwhile， it provided the reference for studying the problem for other researchers.

關(guān)鍵詞：博弈論；激勵；探析

Key words： game theory；incentive；exploration

中圖分類號：F272 文獻(xiàn)標(biāo)識碼：A 文章編號：1006-4311（2012）31-0140-02

0 引言

本文基于博弈論的視角，圍繞所有者與經(jīng)營者，經(jīng)理與員工，員工與員工三個層面分析其博弈關(guān)系，從而抓住公司激勵問題的本質(zhì)，據(jù)此提出合理化對策建議。這種研究視角能為公司管理者和學(xué)者提供參考。

1 所有者與經(jīng)營者的博弈

1.1 囚徒困境模型分析假設(shè)所有者和經(jīng)營者都有兩種選擇：“合作”，“不合作”；只要一方提高合作的程度，對企業(yè)的總績效提高都是有利的，如表1所示。所有者選擇“合作”，即所有者認(rèn)可經(jīng)營者，相信經(jīng)營者會盡全力工作為公司創(chuàng)造最大價值；經(jīng)營者選擇“合作”，即經(jīng)營者會把公司當(dāng)作自己的公司，盡全力為公司創(chuàng)造價值。所有者和經(jīng)營者選擇“不合作”，即雙方都按契約辦事，所有者對經(jīng)營者沒有額外的激勵，經(jīng)營者的努力水平也不會超過所有者的激勵水平。當(dāng)雙方都選擇“不合作”，公司會失去契約之外的發(fā)展機(jī)會，雙方也失去各自發(fā)展受益，雙方只獲得3個單位的收益，不能達(dá)到雙方都選擇“合作”的5個單位收益，這是納什均衡，雙方博弈進(jìn)入“囚徒困境”。

如果要改善這種狀態(tài)，那么所有者與經(jīng)營者必須提高合作水平。由于博弈雙方會按照“社會習(xí)俗”選擇策略，習(xí)俗會迫使博弈雙方選擇與習(xí)俗相適應(yīng)的策略。所有者對經(jīng)營者的激勵不單純是一個“最優(yōu)激勵契約”的問題，在不完全契約之外，所有者對經(jīng)營者的激勵離不開社會習(xí)俗的影響，創(chuàng)造使所有者與經(jīng)營者愿意合作的社會習(xí)俗或能提高雙方利益的機(jī)制是走出囚徒困境的有效手段。

1.2 基于克瑞普斯—威爾森聲譽(yù)模型的激勵對策克瑞普斯—威爾森聲譽(yù)模型表明，只要消費(fèi)者經(jīng)常地重復(fù)購買壟斷廠商的產(chǎn)品或服務(wù)，就會導(dǎo)致廠商樹立一種高質(zhì)量的聲譽(yù)以吸引消費(fèi)者，即利用重復(fù)博弈原理，進(jìn)入艾克斯羅德實(shí)驗(yàn)，達(dá)到走出囚徒困境的目的。

從克瑞普斯—威爾森聲譽(yù)模型可以看出，職業(yè)經(jīng)理人為了獲得長期收益，應(yīng)該樹立良好的聲譽(yù)。然而，職業(yè)經(jīng)理人本質(zhì)上是不合作的，他總想在一定的條件下使自身利益最大化。但如果博弈重復(fù)的次數(shù)足夠多，這時職業(yè)經(jīng)理人侵占企業(yè)所有者的剩余就可能受到企業(yè)所有者的干預(yù)，從而未來收益的損失就超過短期侵占剩余的所得。所以，職業(yè)經(jīng)理人通過使所有者收益最大化，提高企業(yè)效率，建立一個良好的聲譽(yù)，就是職業(yè)經(jīng)理人在特定條件約束下的最佳選擇。因此，理論上可以說，在一定時期內(nèi)，職業(yè)經(jīng)理人的績效應(yīng)該是好的。只有在博弈結(jié)束時，如退休、調(diào)動、免職或?qū)ζ髽I(yè)失去信心時，職業(yè)經(jīng)理人就會考慮到短期收益很大而未來收益很小，就會把自己過去樹立起來的良好聲譽(yù)用盡，大量侵占所有者的剩余。但是，不到博弈的最后關(guān)頭，職業(yè)經(jīng)理人輕易不會做這種選擇。

所以，建立職業(yè)經(jīng)理人聲譽(yù)管理機(jī)制，發(fā)揮聲譽(yù)對職業(yè)經(jīng)理人的激勵約束作用，是十分必要的。一是應(yīng)該盡快制定一套合理的薪酬激勵機(jī)制，提高長期薪酬的占比。具體操作可以從降低固定報(bào)酬比例、加大浮動報(bào)酬的比例開始。在企業(yè)的分配制度中，年薪制實(shí)際上已成為固定報(bào)酬，應(yīng)該增加與企業(yè)績效相關(guān)的浮動報(bào)酬在報(bào)酬中所占的比例，加大長期激勵，比如采用以期權(quán)、股權(quán)等長期報(bào)酬激勵為內(nèi)容的激勵手段。二是企業(yè)應(yīng)該建立合理的業(yè)績考核評價體系。對職業(yè)經(jīng)理人的業(yè)績進(jìn)行考核，可以每年根據(jù)獨(dú)立評估機(jī)構(gòu)對經(jīng)理人的評估結(jié)果，決定下年度是晉升還是降級，業(yè)績好則晉升或者增加報(bào)酬，業(yè)績差則降級甚至解聘。三是建立職業(yè)經(jīng)理人聲譽(yù)評價體系，推動經(jīng)理人市場的建立。政府、企業(yè)和勞動力市場應(yīng)該設(shè)立獨(dú)立評估的中間機(jī)構(gòu)，對職業(yè)經(jīng)理人進(jìn)行有效的評估，并且定期公布評估結(jié)果，給企業(yè)提供參考，建立一套完善的職業(yè)經(jīng)理人聲譽(yù)體系，并逐步建立經(jīng)理人市場機(jī)制。

2 經(jīng)理與員工的博弈

經(jīng)理與員工的激勵博弈，也是從囚徒困境到重復(fù)博弈，與上文所有者、經(jīng)營者之間的激勵博弈分析相似，在此不做贅述。針對重復(fù)博弈下需要達(dá)到的均衡結(jié)果，提出的建議有：一是善意地對待員工。企業(yè)善待員工，員工就會感受到精神上的鼓舞，進(jìn)而有利于企業(yè)內(nèi)部的和諧，有利于企業(yè)團(tuán)隊(duì)精神和凝聚力的形成。二是制定長期的企業(yè)激勵制度。長期的激勵制度能讓員工有持續(xù)努力工作的動力。三是正負(fù)激勵相結(jié)合。這符合針鋒相對策略中“對合作歡迎，對背叛不姑息”的做法，采取適當(dāng)負(fù)激勵措施，如淘汰激勵、降職、罰款和開除激勵等。四是準(zhǔn)確、及時、到位的回應(yīng)。對于創(chuàng)了業(yè)績的員工，企業(yè)一定要給予準(zhǔn)確、及時、到位的獎勵，這一方面激勵獲獎員工繼續(xù)努力，另一方面也帶動其他員工積極表現(xiàn)爭取以后得獎。對于犯錯誤的員工，企業(yè)也要在第一時間對其做出合理的懲罰，以儆效尤。

3 員工與員工的博弈

3.1 智豬博弈模型分析員工與員工之間，同樣也存在著博弈關(guān)系?；趩T工彼此之間職位高低，職業(yè)技能，人際關(guān)系等因素的不同，這種博弈關(guān)系往往是一種非均衡的博弈關(guān)系。如不同職位的員工之間，就存在著不平等的博弈——部門經(jīng)理可以獨(dú)吞其管轄員工的成績得到升遷，而原本成績斐然的底層員工卻被埋沒；同等職位的員工之間也有可能存在不均衡關(guān)系——人際關(guān)系好的員工往往可以得到領(lǐng)導(dǎo)的庇護(hù)及賞識；即使是同一團(tuán)隊(duì)中的員工也存在著由于工作能力不同而出現(xiàn)的“搭便車”式的不均衡博弈關(guān)系。由此可知，大多數(shù)員工之間存在的是“智豬博弈”式的博弈關(guān)系。大豬與小豬式的博弈關(guān)系，由于員工之間的強(qiáng)勢與弱勢地位而形成。這種強(qiáng)勢與弱勢的不平衡，往往造成員工中的弱勢方倒向“小豬”式的等待作為最佳策略。從而導(dǎo)致，大豬疲于奔命，小豬坐享其成，企業(yè)的資源不但無法優(yōu)化配置，而且大量浪費(fèi)。最終，大豬小豬都疲憊饑餓。企業(yè)效益也隨之減少。

3.2 員工與員工激勵對策一是薪酬激勵要具有公平性、競爭性和公開性。公平性是指依據(jù)業(yè)績狀況，只要是做出貢獻(xiàn)的員工就應(yīng)該激勵，而不能偏袒和照顧某些人，任其“搭便車”。競爭性是指企業(yè)的薪酬標(biāo)準(zhǔn)應(yīng)該是有吸引力的，在企業(yè)外部和內(nèi)部都形成競爭的壓力，刺激員工積極向上。公開性是指薪酬的發(fā)放應(yīng)該是公開和透明的，按照職位等級、技能等級、工齡等級和績效水平公開各種等級的薪資范圍，使員工能夠把報(bào)酬與績效聯(lián)系起來。二是建立合理的業(yè)績考核標(biāo)準(zhǔn)和監(jiān)督機(jī)制。業(yè)績考核是獎懲的依據(jù)，考核必須要合理、公正，否則就會造成員工間的不平衡。健全和客觀的監(jiān)督機(jī)制更是合理業(yè)績考核的保障。三是實(shí)施因人而異的激勵措施。企業(yè)的激勵制度應(yīng)該能夠滿足員工的需求，企業(yè)應(yīng)根據(jù)每個人的特點(diǎn)，有針對性的實(shí)施激勵。

4 結(jié)語

激勵問題是公司的一個焦點(diǎn)問題，解決該問題是一個復(fù)雜的過程，需要在實(shí)踐中不斷改進(jìn)。雖然博弈論是一種科學(xué)的分析方法，但是運(yùn)用博弈分析方法探析公司激勵問題是不夠的。因?yàn)榧顧C(jī)制涉及到人復(fù)雜過程，需要考慮員工需求、心理等多方面因素。因此盡可能多角度，多種方法研究公司激勵問題，才能為激勵制度科學(xué)化提供正確的理論依據(jù)，有效解決公司激勵問題，提高公司人力資源管理水平。

參考文獻(xiàn)：

[1][美]加里·德斯勒.人力資源管理[M].北京：中國人民大學(xué)出版社，1996.

[2]洪怡恬.博弈分析在人力資源管理中的應(yīng)用[J].寧波廣播電視大學(xué)學(xué)報(bào)，2005（3）.

篇4

博弈論又稱為“對策論”，一種使用嚴(yán)謹(jǐn)數(shù)學(xué)模型來解決現(xiàn)實(shí)世界中的利害沖突的理論。由于沖突、合作、競爭等行為是現(xiàn)實(shí)世界中常見的現(xiàn)象，因此很多領(lǐng)域都能應(yīng)用博弈論，例如軍事領(lǐng)域、經(jīng)濟(jì)領(lǐng)域、政治外交，解決諸如戰(zhàn)術(shù)攻防、國際糾紛、定價定產(chǎn)、兼并收購、投標(biāo)拍賣甚至動物進(jìn)化等問題。

博弈論的研究開始于本世紀(jì)，1944年諾依曼和摩根斯坦合著的《博弈論和經(jīng)濟(jì)行為》一書的出版標(biāo)志著博弈理論的初步形成，隨后發(fā)展壯大為一門綜合學(xué)科。1994年三位長期致力于博弈論研究實(shí)踐的學(xué)者納什、海薩尼、塞爾頓共同獲得諾貝爾經(jīng)濟(jì)學(xué)獎，使博弈論在經(jīng)濟(jì)領(lǐng)域中的地位和作用得到權(quán)威性的肯定。

2．博弈論的基本原理和方法

文獻(xiàn)[1][2]用淺白的語言敘述了博弈論的思想精髓和基本概念。文獻(xiàn)[3][4]更注重理論上的分析和數(shù)學(xué)的嚴(yán)謹(jǐn)。概括起來，博弈論模型可以用五個方面來描述

G={P，A，S，I，U}

P：為局中人，博弈的參與者，也稱為“博弈方”，局中人是能夠獨(dú)立決策，獨(dú)立承擔(dān)責(zé)任的個人或組織，局中人以最終實(shí)現(xiàn)自身利益最大化為目標(biāo)。

A：為各局中人的所有可能的策略或行動的集合。根據(jù)該集合是否有限還是無限，可分為有限博弈和無限博弈，后者表現(xiàn)為連續(xù)對策，重復(fù)博弈和微分對策等。

S：博弈的進(jìn)程，也是博弈進(jìn)行的次序。局中人同時行動的一次性決策的博弈，成為靜態(tài)博弈，如齊威王和田忌賽馬；局中人行動有先后次序，稱為動態(tài)博弈，如下棋。

I：博弈信息，能夠影響最后博弈結(jié)局的所有局中人的情報(bào)，如效用函數(shù)，響應(yīng)函數(shù)，策略空間等。打仗強(qiáng)調(diào)“知己知彼，百戰(zhàn)不殆”，可見信息在博弈中占重要的地位，博弈的贏得很大程度依賴于信息的準(zhǔn)確度與多寡。得益信息是博弈中的重要信息，如果博弈各方對各種局勢下所有局中人的得益狀況完全清楚，稱之為完全信息博弈（gamewithcompleteinformation），例如齊威王和田忌賽馬，各種馬的組合對陣的結(jié)果雙方都不嚴(yán)而喻。反之為不完全信息博弈（gamewithincompleteinformation），例如投標(biāo)拍賣，博弈各方均不清楚對方的估價。在動態(tài)博弈中還有一類信息：輪到行動的博弈方是否完全了解此前對方的行動。如果完全了解則稱之為“具有完美信息”的博弈（gamewithperfectinformation），例如下棋，雙方都清楚對方下過的著數(shù)。反之稱為“不完美信息的動態(tài)博弈”（gamewithimperfectinformation）。由于信息不完美，博弈的結(jié)果只能是概率期望，而不能象完美信息博弈那樣有確定的結(jié)果。

U：為局中人獲得利益，也是博弈各方追求的最終目標(biāo)。根據(jù)各方得益的不同情況，分為零和博弈和變和博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關(guān)系，爭取雙贏的局面。

還有另一類型博弈稱為多人合作博弈，例如安理會投票表決，OPEC聯(lián)合限產(chǎn)保價等問題。這類問題重點(diǎn)放在聯(lián)盟利益的分配上，它的理論和方法廣泛應(yīng)用于利益損失的共同分擔(dān)問題。多人合作博弈的研究方法主要是特征函數(shù)模型。以個可能的聯(lián)盟為定義域，特征函數(shù)表示各個聯(lián)盟的得益（N是局中人的數(shù)目），它的分配解必須符合一定的合理性和穩(wěn)定性，它的解的概念也發(fā)展成多種多樣，包括穩(wěn)定集、核心、核仁、Shapely值等。解的多樣性符合現(xiàn)實(shí)世界復(fù)雜多樣的需要，針對不同的問題選擇或創(chuàng)造合適的解的概念是博弈論深入研究的課題。

不管博弈各方是合作、競爭、威脅還是暫時讓步，博弈論模型的求解目標(biāo)就是使自身最終的利益最大化，這種解建立在對方也采取各自“最好策略”為前提，各方最終達(dá)到一個力量均衡，也就是說誰也無法通過偏離均衡點(diǎn)而獲得更多的利益。這就是博弈論求解的本質(zhì)思想。

3、博弈論與電力市場

博弈論是研究市場經(jīng)濟(jì)的重要工具。電力作為特殊的商品，它的生產(chǎn)、運(yùn)輸、銷售和消費(fèi)也逐漸走向市場化。世界范圍內(nèi)很多國家的電力工業(yè)走向放松管制、引進(jìn)競爭的進(jìn)程中，遇到很多前所未有的新課題，運(yùn)用博弈論來分析解決其中一些問題是一個研究方向。用博弈論模擬電力市場，模擬的結(jié)果可能更加接近實(shí)際，為市場模式設(shè)計(jì)提供依據(jù)。另外，電廠或用電用戶作為市場的參與者，可以用博弈論來分析市場，研究如何報(bào)價獲利最大。

正確運(yùn)用博弈論關(guān)鍵要針對電力市場的特點(diǎn)正確選擇模型和解的概念。例如：力量相當(dāng)?shù)膬蓚€區(qū)域電網(wǎng)之間交換功率的情形比較適合用古諾模型和Nash談判解方法；而自備電廠與公用電網(wǎng)之間的交易可能更適合用Stackleberg模型。還有局中人結(jié)盟問題：如何識別合作伙伴，結(jié)盟利益如何在聯(lián)盟內(nèi)分配。電力市場環(huán)境下，電網(wǎng)輸電作為一項(xiàng)服務(wù)，它的網(wǎng)損、固定資產(chǎn)投資如何在網(wǎng)絡(luò)使用者之間分擔(dān)。這些分配問題有不同的概念的解：穩(wěn)定集，核心，核仁，Shapely值等，如何合理選擇或創(chuàng)造最接近實(shí)際的解的概念也是面臨的課題。

博弈的結(jié)果是依賴于擁有的信息，采用什么樣的信息披露政策是設(shè)計(jì)電力市場模式的一個方面。例如：電廠競價上網(wǎng)，一個成功的報(bào)價不僅取決于自己的實(shí)力，還有賴于他人如何報(bào)價。但是各方往往不清楚互相之間成本、報(bào)價等信息，因?yàn)檫@些信息都是各自的商業(yè)秘密。如何處理這種信息既不完全也不完美的博弈是一個重要的課題。反過來，博弈的實(shí)驗(yàn)結(jié)果也為電力市場披露怎樣的信息提供依據(jù)。

博弈論和電力市場理論都是很年輕的科學(xué)，兩者都有廣闊的發(fā)展天地，兩者的結(jié)合可以互相促進(jìn)。

4、博弈論在電力市場中的應(yīng)用

4.1自備電廠與公用電網(wǎng)之間的交易

開放發(fā)電市場的進(jìn)程中，擁有自備電廠的用戶是一類特殊的市場參與者，它既是用電用戶，也可以是電力的供應(yīng)者。隨著電力市場深入發(fā)展和工業(yè)的進(jìn)步，自備電廠將成長為一支生力軍。

文獻(xiàn)[5]用博弈論來分析評價在分時定價的環(huán)境下?lián)碛凶詡潆姀S的用戶（NCP）對定價的影響作用。NCP既可以從公用電網(wǎng)購電，也可以自己發(fā)電來滿足自身需求。為解決兩者的沖突，作者提出了三種博弈模型：非合作Nash博弈模型，合作博弈模型和超博弈模型。作者構(gòu)造了三個局中人：公用電網(wǎng)，普通用戶，帶自備電廠的用戶（NCP），并且假設(shè)它們的需求函數(shù)、邊際成本、收益函數(shù)等均是線性的，通過數(shù)字模擬得出了一些有趣的結(jié)果：①NCP的加入促使公用電網(wǎng)降低出售給NCP的電價；②沖突還使普通用戶得到更多益處。該文為解決自備電廠與公用電網(wǎng)的相互作用提供了很有用的分析思想。但是尚有三點(diǎn)可以進(jìn)一步改進(jìn)：①該文尚未考慮NCP將自己多余的自發(fā)電賣給公用電網(wǎng)的情況；②該文將公用電網(wǎng)和NCP置于平等的市場地位可能不符合實(shí)際市場，如果公用電網(wǎng)規(guī)模很大，NCP數(shù)目很多但規(guī)模小，考慮Stackerlberg模型更符合兩者實(shí)際；③該文假設(shè)公用電網(wǎng)的目標(biāo)函數(shù)是整個社會利益最大化，而并非是自身利益最大化，這個假設(shè)不符合電力市場需要解除管制的發(fā)展方向。

文獻(xiàn)[6]部分解決了以上問題，它重點(diǎn)放在自備電廠和公用電網(wǎng)相互作用的方式的選擇：公用電網(wǎng)回購NCP多余電力（buy-backsystem）或者公用電網(wǎng)收取NCP運(yùn)轉(zhuǎn)電力的過網(wǎng)費(fèi)（wheelingcharges）。該文分析了在不同市場環(huán)境下，各方的得益情況，得出了一些可能只有用博弈論才能得出的結(jié)論。

4.2區(qū)域間輸電交易分析

互聯(lián)網(wǎng)間短期電力交換是一種經(jīng)濟(jì)運(yùn)行的手段。白曉民等在文獻(xiàn)[7]中應(yīng)用Nash博弈論來分析簡單的兩區(qū)域系統(tǒng)單時段交易分析，得出雙方都可接受的交換功率和交易價格。在此基礎(chǔ)上，文獻(xiàn)[8]提出了一種兩階段迭代計(jì)算方法來處理外部交易計(jì)劃與內(nèi)部經(jīng)濟(jì)調(diào)度的協(xié)調(diào)。該文所用的博弈模型是二人非零和對策，采取合作型對策，應(yīng)用Nash談判公理作為仲裁程序，決策出雙方都可接受的交換功率和交易價格。應(yīng)該指出，白曉民等的分析是基于完全信息的博弈也即博弈雙方均對對方在各種情況下的得益了解非常清楚。如果缺少這方面的信息，又應(yīng)該如何分析處理呢？這個問題值得進(jìn)一步深入探究。

4.3轉(zhuǎn)運(yùn)市場中電網(wǎng)的固定成本分?jǐn)倖栴}

運(yùn)轉(zhuǎn)市場中一個難題是網(wǎng)絡(luò)輸電服務(wù)定價，這個定價能夠給網(wǎng)絡(luò)使用者一個信號，以達(dá)到全網(wǎng)最優(yōu)化；并且能夠補(bǔ)償網(wǎng)絡(luò)的投資者，網(wǎng)損、變動成本、固定成本等費(fèi)用在網(wǎng)絡(luò)使用者中合理分?jǐn)?；同時能夠正確激勵網(wǎng)絡(luò)增容。節(jié)點(diǎn)實(shí)時價格（nodalspotprice）制度可以解決網(wǎng)損和網(wǎng)絡(luò)阻塞問題。但是文獻(xiàn)[9]的作者認(rèn)為節(jié)點(diǎn)實(shí)時價格制度不能完全回收輸電系統(tǒng)的固定投資，為了解決雙邊貿(mào)易中輸電系統(tǒng)固定成本公正分?jǐn)倖栴}，作者提出了基于多人合作博弈模型，可以計(jì)算出逐條線路逐筆交易的分?jǐn)傎M(fèi)用。文中使用“核仁”作為模型的解。該方法的優(yōu)點(diǎn)：①使用“核仁”而不用Shapely值，因?yàn)椤昂巳省碧幱诤诵?，分配值更加穩(wěn)定和易于被各方接受；②提供了一種激勵，減輕線路過載。

4.4基于Pool或PX模式的多邊貿(mào)易市場

電力市場環(huán)境下的博弈具有行動策略隨機(jī)性、信息隱蔽性，這些特點(diǎn)都給建模和計(jì)算造成困難，從而限制了實(shí)際應(yīng)用。各種文獻(xiàn)在處理這種不確定信息環(huán)境下的決策問題中，通常需要假設(shè)或者估計(jì)對方的信息，方法各有特色。

在文獻(xiàn)[10]作者認(rèn)為在完全競爭的市場環(huán)境下，市場參與者相對于市場規(guī)模都顯得很小，市場影響力很小。在這種情況下，優(yōu)化報(bào)價決策不需要博弈的思想。文中作者認(rèn)為電力市場屬于不完全競爭市場，單個市場參與者對市場是有影響力的，其模型本質(zhì)上屬于不完全信息的非合作博弈。例如：每個參與者只知道自己的成本信息，而不知道對方的成本等信息。在這種情況下作者提出了這樣的一個問題：在無法完全了解對方的信息情況下，參與者如何投標(biāo)（選擇高價投標(biāo)還是低價投標(biāo)）才能使自己收益最大。該文通過轉(zhuǎn)化的方式把不完全信息的博弈變?yōu)樾畔⑼耆煌昝赖膭討B(tài)博弈來求解。每個市場參與者均對自己的對手可能的出價進(jìn)行分類，并對每一類的可能性進(jìn)行概率估計(jì)，形成一個概率意義上的期望收益矩陣，用Nash平衡點(diǎn)的概念求解矩陣，得到問題的解。

文獻(xiàn)[11][12]作者提出了一種談判模型。每一個局中人進(jìn)行決策時，都同時執(zhí)行以下兩個步驟：①對可能的合作對象按照一定的指標(biāo)進(jìn)行優(yōu)先排序；②按照談判優(yōu)先順序，逐一進(jìn)行討價還價，談判的規(guī)則與程序是預(yù)先設(shè)定好的。該文的特色是談判對象的優(yōu)先順序表的形成。排序的準(zhǔn)則基于該局中人A對關(guān)于他人的信息的了解程度。先分別對其他局中人的成本信息進(jìn)行分類，并對每一類出現(xiàn)的可能性進(jìn)行概率估計(jì)。然后假設(shè)與某局中人B進(jìn)行合作，互相交換共享所擁有的信息，聯(lián)合成博弈的一方，剩下的局中人結(jié)合為博弈的另一方。這樣的博弈模型的Nash平衡點(diǎn)是概率意義上的期望值，作為與B合作的優(yōu)先指標(biāo)。對每個局中人都進(jìn)行一遍以上計(jì)算，得到了A的談判對象優(yōu)先順序表。每個局中人都有自己的一張優(yōu)先順序表。最后按照預(yù)先設(shè)定的談判規(guī)則與程序，各方同時進(jìn)行合作談判，談判要解決如何合理分配或均衡比單干多出的利益。

該文關(guān)鍵的一點(diǎn)：正確掌握對方的成本、策略等信息。各方可能從每一次博弈的結(jié)果中得到有用的反饋信息，并用這種反饋來更新自己的知識庫，提高對他人了認(rèn)識。遺憾的是作者并沒有提到如何實(shí)現(xiàn)這樣重要的學(xué)習(xí)過程。該文的模擬算法中的一個缺點(diǎn)：計(jì)算量隨局中人的數(shù)目和每個局中人類型的數(shù)目的增長呈指數(shù)增長。

對于多邊貿(mào)易模式的電力市場，文獻(xiàn)[13]提出了多理論模型，解決貿(mào)易合作問題，文中的模型基于完全信息的博弈模型。模擬的過程包括四個階段：①確定自身成本等信息；②與對方互相交換信息，互相尋求合作伙伴；③按照預(yù)先設(shè)定的準(zhǔn)則和協(xié)議進(jìn)行聯(lián)合分組，形成一個談判對象優(yōu)先順序表，這個順序表獲得方法于[11][12]的方法不一樣。作者采用公平性合作標(biāo)準(zhǔn)和Shapely值來確定這個順序表；④按照優(yōu)先順序表進(jìn)行雙邊談判。作者認(rèn)為這四個階段可以反復(fù)迭代進(jìn)行，直至沒有人愿意改變合作格局為止或者達(dá)到預(yù)先設(shè)定的計(jì)算時間。作者在文中考慮了多種情況，但是模型仍偏于簡單。

4.5用博弈論解釋和實(shí)現(xiàn)算法

文獻(xiàn)[14]用博弈論來解釋拉格朗日松弛法法解決機(jī)組經(jīng)濟(jì)組合的算法。該文認(rèn)為在電力市場的環(huán)境下，競爭各方均以實(shí)現(xiàn)自身利益最大化為目標(biāo)，旋轉(zhuǎn)備用的約束變得軟起來，PX（powerexchange）機(jī)構(gòu)可能通過松弛這一約束進(jìn)一步降低成本。該文提出了一種基于博弈論的算法獲取最優(yōu)的旋轉(zhuǎn)備用。

作者認(rèn)為拉格朗日松弛法的拉格朗日乘子是有經(jīng)濟(jì)含義的，松弛旋轉(zhuǎn)備用的乘子被看作是提供備用的價格信息，各時段的旋轉(zhuǎn)備用根據(jù)這個信息不斷在規(guī)定的高低兩種備用水平之間調(diào)整（例如：為t時段負(fù)荷）。根據(jù)優(yōu)化原理，如果拉格朗日函數(shù)存在鞍點(diǎn)，則鞍點(diǎn)是原問題的最優(yōu)解。

鞍點(diǎn)的概念與博弈論中的Nash平衡點(diǎn)有非常相似之處，如以上公式所示?；诖讼敕ǎ髡邩?gòu)造了兩廠商博弈模型。其中一局中人P代表整個實(shí)際電網(wǎng)的利益，它控制的決策變量是p，u（p向量表示各機(jī)組分配的有功，u向量表示機(jī)組啟停），目標(biāo)是使整個系統(tǒng)成本最低。另一個局中人Q，是一個假想的發(fā)電商，它以價格向P銷售備用容量和有功容量。雙方就旋轉(zhuǎn)備用交易進(jìn)行討價還價，最終達(dá)到一個平衡的交易量和交易價格。作者證明以上博弈過程的Nash平衡解就是拉格朗日函數(shù)的解。基于以上結(jié)論，作者設(shè)計(jì)了自適應(yīng)的次梯度算法尋求平衡點(diǎn)，其中一個關(guān)鍵技術(shù)作者設(shè)計(jì)了廠商P對廠商Q備用容量報(bào)價的反應(yīng)函數(shù)該函數(shù)將映射到備用容量的兩種水平之間（例如：5%Dt-%Dt，Dtt時段負(fù)荷），形成一個隨價格信息變動的備用容量。根據(jù)廠商Q是否了解廠商P的反應(yīng)函數(shù)，模型可細(xì)分為兩種：Nash模型（不了解對方反應(yīng)函數(shù)）和Stackelberg模型（Q了解P的反應(yīng)函數(shù)），作者認(rèn)為后一種模型掌握的信息較多，因此收斂的速度和優(yōu)化的效果梢好于前一種模型。

用博弈論來解釋并且設(shè)計(jì)一些算法是一個新鮮而具有挑戰(zhàn)性的課題。博弈論本身就是帶有優(yōu)化功能的一門嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)，不過它更具有人的邏輯思維的色彩，融合了一些用別的方法難以表達(dá)的信息。

篇5

互聯(lián)技術(shù)的發(fā)展，使社會輿論環(huán)境發(fā)生了深刻的變化，當(dāng)前對網(wǎng)絡(luò)輿情的研究逐漸得到相關(guān)學(xué)者的關(guān)注和重視w具體來說，國內(nèi)主要研究集中在以下三個方面：1)網(wǎng)絡(luò)輿情發(fā)展的一般性理論：主要研究網(wǎng)絡(luò)輿情的概念、功能、傳播途徑、形態(tài)特征等理論問題121.2)網(wǎng)絡(luò)輿情監(jiān)測、預(yù)警和控制.如曾潤喜提出了網(wǎng)絡(luò)輿情預(yù)警的系統(tǒng)構(gòu)成、指標(biāo)體系和運(yùn)行機(jī)制M.黃曉斌提出了網(wǎng)絡(luò)輿情信息挖掘分析模型’并以實(shí)例說明文本挖掘在網(wǎng)絡(luò)輿情分析中的應(yīng)用[4].齊佳音利用系統(tǒng)動力學(xué)建模，分析了突發(fā)事件發(fā)展和網(wǎng)絡(luò)輿情的作用機(jī)制臥史波提出了網(wǎng)絡(luò)輿情群體極化的動力機(jī)制與調(diào)控策略吒余廉借鑒傳染病模型SIR分析了非常規(guī)事件下的群體行為171?3)網(wǎng)絡(luò)輿情對不同領(lǐng)域的影響?中國上市公司輿情中心分析了負(fù)面輿情與上市公司市值的波動.周如俊認(rèn)為，新時期思想政治教育工作要研究網(wǎng)絡(luò)輿情的特點(diǎn)，形成上思想政治教育的強(qiáng)勢國外在網(wǎng)絡(luò)輿情方面的研究.也有許多成果.如Wu等的研究表明.輿論的形成與社會網(wǎng)絡(luò)的結(jié)構(gòu)有關(guān)丨91.在輿論演化方面，最經(jīng)典的模型有兩個：一個是“Sznajd模型”，另一個是“有限信任模型”."Sznajd模型”借用鐵磁體中的磁性粒子等概念為理論基礎(chǔ)，利用蒙特卡羅等仿真方法對封閉社區(qū)的輿論演進(jìn)過程進(jìn)行了研究，提出輿論最終的演化結(jié)果只有兩種：全部贊同、全部反對和贊同與反對各占一半P叱模型比較簡單,不足之處在于磁性粒子的性質(zhì)過于簡單，個體的觀點(diǎn)與交互方式與實(shí)際差別較大.“有限信任模型”提出當(dāng)兩個人觀點(diǎn)相近時，才會相互影響，當(dāng)兩人觀點(diǎn)差距太大時，不會相互影響I1、模型的優(yōu)點(diǎn)是采用了信用閾值來限制個體間的交互，比較真實(shí)的反映了現(xiàn)實(shí)中的交互過程.國內(nèi)外在網(wǎng)絡(luò)輿情控制方面，傳統(tǒng)研究思路都是將非線性不規(guī)則的網(wǎng)絡(luò)傳播系統(tǒng)化約為線性系統(tǒng)，以獲得確定的結(jié)果'12'.相關(guān)的技術(shù)主要包括監(jiān)測、預(yù)警、應(yīng)急處理等，涉及諸如話題檢測與跟蹤、Web信息挖掘…丨、文本傾向性分析丨15]、基于云計(jì)算的網(wǎng)絡(luò)輿情預(yù)警[161、遷移元胞自動機(jī)網(wǎng)絡(luò)演化模型[17]和網(wǎng)絡(luò)事件的案例庫建設(shè)和案例分析等.通常使用的控制手段主要有接種疫苗和隔離接種疫苗的具體方法包括對非法網(wǎng)絡(luò)傳播進(jìn)行事后追懲，加強(qiáng)站的自我審查，網(wǎng)絡(luò)實(shí)名制等來約束自我的行為.隔離的具體方法是在網(wǎng)絡(luò)中安插把關(guān)人，加強(qiáng)對網(wǎng)絡(luò)傳播內(nèi)容的日常監(jiān)控,對敏感話題進(jìn)行屏蔽或刪除，也有一些部門采用雇傭網(wǎng)絡(luò)水軍，對信息進(jìn)行大面積覆蓋等.隔離、屏蔽等管理技術(shù)在實(shí)踐中得到了較廣泛的應(yīng)用，但是這些管理方式有剝奪公民表達(dá)自由之嫌，“只知打壓甚至封堵，無疑會使‘通，沒有了‘通，，只剩下一條無法跨越的‘溝’"[20].當(dāng)前應(yīng)用博弈論研究網(wǎng)絡(luò)輿情的學(xué)者較多，一般集中在研究傳播機(jī)制方面的問題.王楊等人提出了基于博弈論的真情傳播模型（POBGT)l21]，模型能夠從動態(tài)和交互兩方面描述傳播過程，最終能夠形成穩(wěn)定的狀態(tài).劉錦德等認(rèn)為，網(wǎng)絡(luò)輿情傳播過程是以大部分人對事實(shí)不了解為前提的.指出羊群行為的集聚產(chǎn)生受多種因素影響，主要與采取分析策略的交互利益、成本系數(shù)以及記憶長度有關(guān)[221.以上這些研究成果深刻地分析了網(wǎng)絡(luò)輿情的基本理論和監(jiān)測、預(yù)測以及一些相關(guān)的調(diào)控策略，但是，多數(shù)研究都把民視為一個整體，并且大多從網(wǎng)絡(luò)事件_、網(wǎng)絡(luò)結(jié)構(gòu)、傳播規(guī)律等角度進(jìn)行研究，很少從線下形成網(wǎng)絡(luò)輿情的民個體入手，深入研究民如何在網(wǎng)絡(luò)上聚集形成網(wǎng)絡(luò)輿情的機(jī)制，更沒有把根源事件的發(fā)展和輿情的演化聯(lián)系起來，僅著眼網(wǎng)絡(luò)結(jié)構(gòu)等傳播過程中的各種影響，強(qiáng)調(diào)輿情應(yīng)對中的各種技巧，以至于忽略了輿情發(fā)展的根本動力.大都就輿情研究輿情，而未深入到社會政治生活具體目標(biāo)設(shè)定、政府行政目的、行政方式和民眾行為邏輯的深度，因而也在一定程度影響了應(yīng)對對策的恰當(dāng)性和有效性1231,從而無法提出切實(shí)有效的網(wǎng)絡(luò)輿情疏導(dǎo)策略，反而使網(wǎng)絡(luò)輿情愈演愈烈.現(xiàn)實(shí)中網(wǎng)絡(luò)輿情是一個群集演進(jìn)過程.而集群演進(jìn)過程是一個很難進(jìn)行實(shí)證研究的問題[271.本文將民作為個體，以群集動力學(xué)為基礎(chǔ)，基于博弈論來深入分析網(wǎng)絡(luò)輿情的聚集過程，結(jié)合輿情產(chǎn)生的根源事件發(fā)展變化，最終給出網(wǎng)絡(luò)輿情疏導(dǎo)模型.

2網(wǎng)絡(luò)輿情群集動力學(xué)過程分析

2.1網(wǎng)絡(luò)輿情民特征分析

復(fù)雜性理論將人群看做由許多相互作用的個體組成的“復(fù)雜的社會經(jīng)濟(jì)系統(tǒng)”，并借用物理學(xué)、數(shù)學(xué)以及計(jì)算機(jī)科學(xué)中的概念性工具對社會現(xiàn)象進(jìn)行分析[24],民作為獨(dú)立的智能體在網(wǎng)絡(luò)環(huán)境中，與其它民共享信息.民能夠感知它所處的環(huán)境和其它民，感知和其它民行為的擠壓、碰撞、推動、吸引、排斥等相互作用.根據(jù)復(fù)雜性理論,對網(wǎng)絡(luò)輿情中每個民自身的運(yùn)動能力可以從外部感知、內(nèi)部狀態(tài)和行為產(chǎn)生系統(tǒng)等3個基本方面描述.定義1外部感知每個民具有發(fā)現(xiàn)事件及感應(yīng)外部環(huán)境刺激的能力，同時環(huán)境中的其它民會對民的感知能力產(chǎn)生影響.夕卜部感知可以用以下公式表示：S=So+5feel(1)其中S表示輿情環(huán)境中民對某事件的感受，So表示民個體對事件的感受，5fee,表示輿情環(huán)境中其它民對該民感受的影響，n表示民數(shù)量，j=nSfeei=(2)3=1定義2內(nèi)部狀態(tài)根據(jù)馬斯洛的需求層次理論,人的需求產(chǎn)生動機(jī)，動機(jī)導(dǎo)致人的行動，即：Need^Motivation^Action,同樣在網(wǎng)絡(luò)輿情形成與發(fā)展過程中，每個民的表達(dá)都源于內(nèi)部動機(jī)，動機(jī)來自民的需求，需求源自民的感受.用iV表示民的需求,G(S)表示為S的分段增函數(shù)，馬斯洛將需求分為五個層次，設(shè)況=(1,2,3,4,5)，不同的需求層次表現(xiàn)為不同的內(nèi)部狀態(tài)，即凡可以分為五個層次：凡=G(S)(3)內(nèi)部狀態(tài)可以表現(xiàn)為忍耐程度P,時間用t來表示.P=P(Nt)/t(4)其中巧況）為凡的減函數(shù).此外，用M表示民動機(jī)，H(Nt)表示Nt的增函數(shù).M=H{Nl)/t(5)當(dāng)實(shí)際發(fā)生的事件發(fā)展速度達(dá)不到期望速度時，隨著時間的增長，個體的忍耐度會下降，動機(jī)也會下降.當(dāng)忍耐度下降較快時，民呈現(xiàn)“好斗”趨勢，產(chǎn)生灌水、謾罵行為；當(dāng)動機(jī)下降較快時,民表現(xiàn)為放棄行為.定義3行為產(chǎn)生系統(tǒng)網(wǎng)絡(luò)輿情中個體是自驅(qū)動的，在自身行為規(guī)則的作用下,可以對周圍實(shí)體和環(huán)境的刺激做出本能的反應(yīng)，產(chǎn)生自驅(qū)動力和期望速度，根據(jù)每一時間步上每一個體的外部感知和內(nèi)部狀態(tài)，行為產(chǎn)生系統(tǒng)為個體產(chǎn)生一個行為，且對內(nèi)部狀態(tài)進(jìn)行修正.用F⑴表示民受力狀態(tài)：F(t)=a[(M-P)dt+/i[(Mfeei)df(6)JoJo其中表示某時刻民感受到的外力.亡表示時間，a和/X為常數(shù).當(dāng)F(t)>0時,民為活動狀態(tài)；當(dāng)F(t)<0時，民為沉默狀態(tài).為分析方便，假設(shè)"=0、1、一1，分別表示外力與自驅(qū)動力無關(guān)、同向和反向的關(guān)系.可以看出，即使當(dāng)內(nèi)部動機(jī)為0時，也可能受外部影響而持續(xù)活動.此外,用民在受力變化下會更新運(yùn)動狀態(tài)：V{t+1)=V{t)+uAF(t)(7)其中乂⑷表示tB寸刻民的運(yùn)動速度，AF⑴表示民的受力變化情況，uj為一常數(shù),表示民加速度系數(shù).公式7刻畫了民的行為更新機(jī)制.

2.2網(wǎng)絡(luò)輿情群集特征分析

網(wǎng)絡(luò)上民聚集成群會產(chǎn)生群集現(xiàn)象.群體流動動力來自于民的合力，整個群體對外界環(huán)境呈反沉默螺旋特征：1)群體中存在異向群集，也存在異質(zhì)群集.群體中的個體運(yùn)動力（包括力的大小和方向矢量)熵最小時，群體合力最大，反之合力最小.2)民個體需求得到滿足，個體動力消失>最終導(dǎo)致群體動力消失，同時，群體有可能提高或者降低個體的需求.3)網(wǎng)絡(luò)輿情群集方向取決所有民合力.

2.3網(wǎng)絡(luò)輿情群集動力學(xué)模型構(gòu)建與分析

從混沌學(xué)的觀點(diǎn)看，在輿情爆發(fā)前民眾心態(tài)是個混沌系統(tǒng)，處于相對穩(wěn)定狀態(tài).當(dāng)突發(fā)事件使民眾對自己的生存與發(fā)展?fàn)顩r感到深度優(yōu)慮和不安全，相對穩(wěn)定的混沌態(tài)心理被打破，事件就成為輿情的初始觸發(fā)條件在網(wǎng)絡(luò)中，以輿情話題涉及民個體的聚集和互動為環(huán)境背景，以民參與輿情的可察網(wǎng)絡(luò)空間為邊界,結(jié)合定義1、定義2、定義3，經(jīng)過分析，得出以下結(jié)論.命題1當(dāng)民所處外界環(huán)境與民需求期望有偏差時，即A_A#0,網(wǎng)絡(luò)中進(jìn)行訴求的民個體，以追求成為某種話題的輿論領(lǐng)導(dǎo)者位置為手段(雖然未必獲得領(lǐng)導(dǎo)者位置)，期望獲得輿情的直接或者間接最大利益，達(dá)到個體需求得到滿足的目的.如圖1所示，個體需求所處等級越低，內(nèi)在動力就越大，F(xiàn)1>F2>F3>F4>F5且容忍度越低，P1<P2<P3<Pi<P5.F表示內(nèi)在動力、P表示兩民容忍度，朽至F5，P1至P5分別對應(yīng)需求從低到高5個層次的內(nèi)在動力和容忍度.命題2民個體動力大小、方向可變.民個體動力受自身可見范圍內(nèi)所有其它個體合力的影響，即：F合=+外;ff=-l或丑=1或i7=0(8)為方便分析，假設(shè)個體動力方向只有同向H=1、反向H=-1和無關(guān)H=0三種情況.相關(guān)研究發(fā)現(xiàn)，當(dāng)獲得新的信息或者受到社會壓力的影響，群體成員評估信息的正確性主要是通過參照他人達(dá)成的，這就是社會群體中普遍存在的“從眾效應(yīng)”命題3民個體運(yùn)動狀態(tài)隨時間變化不斷更新.即公式(7)所示：V(t+1)=V(t)+u;AF(t),隨著時間的變化，民個體的受力不同，因此對輿情事件的反應(yīng)狀態(tài)不同.命題4民個體在網(wǎng)絡(luò)輿情中影響力不同.結(jié)合網(wǎng)絡(luò)傳播的特點(diǎn)，民的影響力不同，鄰居節(jié)點(diǎn)多的民、處于領(lǐng)導(dǎo)者位置的民以及把關(guān)人位置的民影響力相對更大.個體選擇往往依賴于群體中的“領(lǐng)導(dǎo)意見”1251.命題5民個體具有聚集特性.民個體是處于外界環(huán)境的力場之中，個體盡量與鄰居個體靠得近一些,避免被孤立（如圖2).個需求層次關(guān)系圖圖2S集特性民個體聚集的目的是為了獲得群集力，抗外界力場.只有輿情中民個體觀點(diǎn)被鄰居感受到，才能聚集成為更大影響力的群體，甚至使民個體達(dá)到成為領(lǐng)導(dǎo)者的目標(biāo).民聚集過程如圖3所示.從圖3可以看出，當(dāng)發(fā)起人個體強(qiáng)大到足以對抗外力，能夠獨(dú)立達(dá)到期望的情況下，不會發(fā)生群集行為，而個體無法對抗外力或者無法獨(dú)立達(dá)到期望的情況下，個體會產(chǎn)生對群集現(xiàn)象的需求.聚集過程可以分為以下5種情況：其中6>0表示個體的安全承受力，a>0表示容忍度，a〈b.對于個體來說,G表示群體聚集并趨向極端化的現(xiàn)象,即群體期望將比個體期望更具有冒險性.D表示對聚集呈排斥狀態(tài)，但不反對他人行為，—G表示聚集并趨向沉默螺旋，即外力過大時,群體期望甚至比個體期望更低時，表現(xiàn)為沉默螺旋.公式(9)中第一^式子表示事件超過個體容忍度，政策管理相對寬松時，將會發(fā)生聚集?公式(9)中第二個式子表示內(nèi)力過大，即使政策高壓管理，仍將會有聚集的需求.式子三表示事件超出個體容忍范圍，但由于內(nèi)在動力沒有比外力高到一定程度,不但不會發(fā)生聚集,反而排斥聚集.第四個式子表示高壓政策下，由于內(nèi)在動力不足，即使事件超過了個體容忍度,也不會發(fā)生聚集.式子五表示事件在個體容忍范圍內(nèi)，不會發(fā)生聚集.命題6民個體之間具有排斥性.民為了避免與周圍民個體同化，希望保持個14.輿情中觀點(diǎn)力求個性和新意，否則無法達(dá)到自己為領(lǐng)導(dǎo)者的目標(biāo)，從而無法獲得最大的群集動力如圖4.社會學(xué)研究發(fā)現(xiàn)，個體從眾行為會產(chǎn)生群體極化，同時人們也有獨(dú)立作出判斷的意愿，以及過于自信的行為傾向[261.命題7民觀點(diǎn)匹配，網(wǎng)絡(luò)輿情中個體保持觀點(diǎn)上的同步，當(dāng)民觀點(diǎn)的熵越小時,獲取的群集合力才會越大,因此，個體獲得群集力的過程中，要以使群集觀點(diǎn)熵減為手段如圖5.根據(jù)物理學(xué)的力與作用力原理，在復(fù)雜系統(tǒng)中，熵越小，群集力的互相抵消就會相對變小?命題8民群集也是個體，是由民個體形成的更有影響力的個體.因?yàn)榘l(fā)生群體極化時，可以把統(tǒng)一發(fā)聲的民群體,看做是一個獨(dú)立的個體，并且是比民個體更有影響力的個體.命題9民群集是有生命周期的，生命周期發(fā)展過程如圖6.由于民在輿論環(huán)境中感受不同，敏感者（某事件處在需求層次較低層的個體）將在被動的情況下，率先提倡聚集，以期獲得群集動力.而非敏感者(某事件處于需求層次較高層次的個體）看到一個話題,是否參與，取決于該話題的引力和阻力.由于個體視野問題，集群越大的話題，越容易被個體所發(fā)現(xiàn)?因此發(fā)展也越快.群集的發(fā)展和生命周期取決于該話題對民的引力和民外界力場的阻力.

3基于群集動力的輿情演化博弈分析

根據(jù)網(wǎng)絡(luò)輿情的群集動力學(xué)過程的分析，可以對社會網(wǎng)絡(luò)中的民個體作出如下假設(shè).假設(shè)1在一個話題事件發(fā)生時（話題已經(jīng)存在)，群體中有隨機(jī)的兩個人A和B，有可能從話題中實(shí)現(xiàn)個人期望，話題對A有固定影響,對B可能有影響，每個人都對該事件有自己的觀點(diǎn)A(0，1).假設(shè)2在信息不充分情況下，A和B會根據(jù)對方進(jìn)行決策（信任時羊群效應(yīng)，不信任時不跟隨)，其中A選擇增加投入，以使話題對B引力大于斥力的概率為P，選擇默認(rèn)的概率為1-P.假設(shè)3如果對A采取投入策略，B采取的策略是參與,那么A獲得固定收益(無論參與與否，話題通過外界環(huán)境變化帶來的固定影響）以外，還會得到額外收益Re,即群集力（正負(fù)不一定).同時付出成本C,B的收益為Rb,如果B選擇不跟隨，A的收益為當(dāng)A采取默認(rèn)時，B采取參與的策略，A的收益是i?A，而B將損失RB-d,d表示參與話題對B的阻力減去動力之差產(chǎn)生的損失.假設(shè)4假設(shè)Re=x/d,C=d/y(效益、投入和阻力產(chǎn)生的損失之間的關(guān)系，cc、y為常數(shù)，d+0)，由于阻力越大,^將越大,因此，這里也可以看成效益、投入與外在阻力的關(guān)系.構(gòu)建博弈樹如圖7所示.在上述假設(shè)條件下，計(jì)算A的期望收益和平均收益，U~+Re—C)*g+(RA—C)*(1—^)=RA+RE*Q~C,由假設(shè)4上式可轉(zhuǎn)化為：Ra-\-q(x/d)一d/y,U⑷狐二RAi？7(^4)平均=p(U(A)&x)+(1—p)(U(A)^)=Ra-\-p(qx/d—d/y).當(dāng)投入效益和默認(rèn)效益不相等時，得益差的會模仿效益好的策略,則投入策略與默認(rèn)策略的人的比例是時間的函數(shù)，分別表示為P⑴和1-P⑷.投入策略的動態(tài)變化速度可以用如下復(fù)制動態(tài)方程表示：dp/dt=p(U(A)^-C/⑷平均)=p(l-p){qx/d—d/y).穩(wěn)定性分析，令dp/di=0，當(dāng)qxld=d/y時，d=時，為一穩(wěn)定點(diǎn)，且d隨g變化，0<g<1,范圍是[-_,_]，由假設(shè)3可知：d=(、-Fn)*6,6為力差與損失之間的系數(shù)，則由公式9可知：^fqxy/e>b或者（一VP^/0<~b(此處（_v^/0只表示F外一F內(nèi))或者0<v^/0<a,因此，柞-&>&和（F外-凡<-b以及0<-<a時，為穩(wěn)定狀態(tài)（可以求得q的閾值).所以，而且穩(wěn)定點(diǎn)和民個體在輿情力場中受力情況、個體的容忍度和個體的安全承受能力有關(guān).p=0,p=l兩點(diǎn)是否為穩(wěn)定點(diǎn)，取決于P在這兩點(diǎn)附近時qx/d-d/y是否大于0.相位圖分析如圖8所示.A根據(jù)力的變化，使辦/出=0的點(diǎn)中，斜率為負(fù)的點(diǎn)是穩(wěn)定點(diǎn).可以注意到，0、1兩點(diǎn)位穩(wěn)定點(diǎn)僅是其中的一種特殊情況，圖8只畫出了一種‘情況.結(jié)論1當(dāng)A最為猶豫時{p=0.5)，B是否參與對A的決策影響最大,力場中力的調(diào)整對A的影響最大.結(jié)論2由于g和d是變化的,不是B只要參與就可以影響A的決策，只有q在一定范圍內(nèi)才可以影響A,這個范圍和民個體的安全承受力、忍耐度有關(guān)系.結(jié)論3A的決策與B的觀點(diǎn)有一定關(guān)系，但不存在直接關(guān)系，而是和力場中的力有關(guān)系，存在B和A的觀點(diǎn)對立，但增大了對A的助力情況（例如一些網(wǎng)絡(luò)炒作等現(xiàn)象).同理，計(jì)算B的情況：U(B)^=RbP+(Rb-d)*(1—p)=Rb—d(l-p),U(B)稱^=0，C/(S)平均二g(ii;s_d(l_;p)),則dg/di=q{U{B)m-U(B)^)=q(l-q)(RB-d{l-p)).穩(wěn)定性分析，令dg/dt=0，當(dāng)辦_<1-p)=0B寸為一穩(wěn)定點(diǎn),d=Rb/(1—p),(此處RB也在隨V變化）由假設(shè)3可知：d=-F內(nèi))*e,6為力差與損失之間的系數(shù)，則由公式9可知：Rb/{9{1-p))：^或者RB/、Q(l—V))<-b(此處RB/(e(l-p))只表示—F內(nèi))或者0<Rb/(0(1-p))<a時為穩(wěn)定狀態(tài)，可以求出(rb-ea)/ea<p<(rb-eb)/eb時,a的決策才會影響b的決策.g=o、g=i兩點(diǎn)是否為穩(wěn)定點(diǎn)，取決于q在這兩點(diǎn)附近時Rb~d(l-p)是否大于0.對B的相位圖與A類似，不再贅述.結(jié)論4當(dāng)B最為猶豫時(p=0.5)，A是否參與對B的決策影響最大,力場中力的調(diào)整對B影響最大.結(jié)論5A的話題參與情況在一定范圍時，是可以對B的決策產(chǎn)生影響的，但脫離這個范圍時，將沒有影響,不是A參與比例越大，影響就越大，這個范圍和民個體的安全承受力、忍耐度有關(guān)系.這和傳統(tǒng)的羊群效應(yīng)理論有差異.例如網(wǎng)絡(luò)水軍提出的主題,對非水軍民來說,不一定引發(fā)羊群效應(yīng)，反而可能脫離話題.結(jié)論6在一個話題中，當(dāng)A選擇增加投入策略人過多時.達(dá)到一定范圍，B將達(dá)到穩(wěn)定狀態(tài)，只有從該話題中發(fā)掘新的相關(guān)話題，才能吸引B選擇參與策略，這是蝴蝶效應(yīng)的原因.

4仿真

由于A、B情況類似,僅對上述博弈中的A進(jìn)行仿真，用Netlogo創(chuàng)建民個體在社會網(wǎng)絡(luò)中的博弈環(huán)境，同時考慮民個體策略會受到外力的影響，觀察在不同外力影響下演化過程中不同策略轉(zhuǎn)化形成的軌跡.具體仿真如下：民Agent300個，初始策略為參與輿情比率p為0.35，初始策略為不參與輿情的比率1-p為0.65，Agent的個數(shù)和初始比率可以為其它值.為考慮：1)—F內(nèi))>b和（巧卜-F內(nèi))<-6以及0<(&-<a情況，設(shè)民所受外力取均值0，標(biāo)準(zhǔn)差0.06,仿真200步（都可為其它值)：由圖9可以看出，A在p=0.35時達(dá)到了穩(wěn)定狀態(tài)，所以0和1不一定是穩(wěn)定點(diǎn)，主要看輿情場中力的平循況.2)(F^—F內(nèi)）〉a>0情況下，即設(shè)力取均值0.3，標(biāo)準(zhǔn)差0.06，仿真200步：publicopiniondevl.ppublicopitdoi由圖10可以看出，力在一定范圍內(nèi)時，A會采取投入策略，如果力場變化不大，甚至可以達(dá)到1，即群體極化的穩(wěn)定狀態(tài).3)考慮-a<(4-<0情況下，即設(shè)力取均值-0.3，標(biāo)準(zhǔn)差0.06,仿真200步：由圖11可以看出，在外力較大（與內(nèi)在動力差值較?。┑那闆r下，A會采取不投入策略，如果力場變化不大，甚至達(dá)到0的穩(wěn)定點(diǎn).4)其它不變，力均值取0.3,力口大標(biāo)準(zhǔn)差，標(biāo)準(zhǔn)差取0.9仿真200步：由圖12可以看出，力場的變化標(biāo)準(zhǔn)差大的時候，A在達(dá)到穩(wěn)定點(diǎn)之前會經(jīng)歷更多的策略選擇波動.5)其余不變,均值取-0.3，標(biāo)準(zhǔn)差取0.9仿真200步：由圖13,可以看出A對力場均值變化的影響，當(dāng)合力呈負(fù)的范圍時，A采取不投入策略，甚至達(dá)到0的穩(wěn)定狀態(tài).

5網(wǎng)絡(luò)輿情疏導(dǎo)分析

網(wǎng)絡(luò)輿情中的民個體，經(jīng)過碰撞、聚集，形成各種觀點(diǎn)為核心的小團(tuán)體，這些小團(tuán)體再相互影響，決定網(wǎng)絡(luò)輿情的總體群集力的大小和方向.如圖14所示，在集群中各種力的熵小時力的絕對值大，熵大時，力的絕對值小.就像船上的人有不同的目的（烏合之眾)，但為了暫時的一致目標(biāo)聚集在一起（甚至目的不同，比如小偷乘船目的只是為了偷錢)，輿情主體事件成了船一樣的載體.輿情的發(fā)展從熵值最大到最小形成訴求，經(jīng)過問題解決，產(chǎn)生新的爭議，又從熵值最小到最大，之后經(jīng)過平衡處理，熵值又發(fā)展到最小，形成新的看法.根據(jù)視野，每個民個體只能受到網(wǎng)絡(luò)視野內(nèi)的力的影響.群體由于信息量大，視野也大.同時視野的大小對個體的決策有重要影響.一個事件解決之后，仍有有需求的民還會找其他的事件，來實(shí)現(xiàn)自己的輿情收益.從上面分析可以看出，疏導(dǎo)輿情可以從個體的動力，個體受到的阻力，個體觀察到的其它人參與的概率來入手，其中力場的調(diào)整是輿情得以平息的關(guān)鍵.在建筑學(xué)中，對于封閉場所疏散時間和人流流量之間的關(guān)系，Togawa提出了如下數(shù)學(xué)模型1271，將其引入輿情疏導(dǎo)問題中，改變其中各變量的涵義，P為事件群集合力，n為地方各級管理部門，Qi表示各級管理部門積累的群集動力，Q中央管理部門對群集力的處理平均速度，T0為事件開始到需要中央管理部門插手的時間.為驗(yàn)證疏導(dǎo)模型有效性，對管理部門實(shí)施疏導(dǎo)和管理部門不參與疏導(dǎo)兩種情況下,對上述博弈A的動態(tài)策略選擇進(jìn)行仿真.考慮現(xiàn)實(shí)意義，令RA=3,Re=1,C=1(可以為其它值）仿真1000步如圖15.可以看出，在沒有管理部門以動態(tài)懲罰手段參與.群集外力沒有變化的情況下，僅憑輿情利益雙方博弈，策略選擇出現(xiàn)無限振蕩，且振幅越來越大，無法達(dá)到均衡穩(wěn)定.如果管理部門根據(jù)輿情相關(guān)民的參與概率，憑借法律對相關(guān)者進(jìn)行動態(tài)懲罰，即懲罰力度隨參與概率的大小而變化.仿真中假設(shè)C=2+p*2(可為其它形式)，圖16中可以看到，隨著博弈次數(shù)和時間的增加.輿情參與民采取參與的概率將逐漸收斂，穩(wěn)定在納什均衡點(diǎn).如圖17，降低管理部門的動態(tài)懲罰力度.假設(shè)C=2+p*1.5,隨著博弈的深入，依然能夠趨向穩(wěn)定點(diǎn)，但明顯疏導(dǎo)效率低于圖16情況.結(jié)論7從仿真中可以看出，網(wǎng)絡(luò)輿情要疏導(dǎo)的是人群產(chǎn)生的群集動力，而不是單一解決某一事件，即使單一事件被解決.民還會尋找類似事件來實(shí)現(xiàn)其需求，即民在輿情博弈中表現(xiàn)出無限震蕩現(xiàn)象.結(jié)論8高效的疏導(dǎo)是實(shí)現(xiàn)民博弈均衡的重要條件.無效率的地方各級管理部門將會導(dǎo)致集群流向中央管理部門，造成上訪事件，無法或者達(dá)不到期望速度的將會增大不耐煩程度.導(dǎo)致發(fā)生.結(jié)論9上述疏導(dǎo)模型是輿情發(fā)生時的應(yīng)急疏導(dǎo)方式，在輿情尚未形成時，保證民所感受力場在一定范圍內(nèi)的平衡.增大民的忍受度，降低安全承受能力.是預(yù)防網(wǎng)絡(luò)輿情爆發(fā)的有效途徑.

篇6

2．博弈論的基本原理和方法

G={P，A，S，I，U}

3、博弈論與電力市場

博弈論和電力市場理論都是很年輕的科學(xué)，兩者都有廣闊的發(fā)展天地，兩者的結(jié)合可以互相促進(jìn)。

4、博弈論在電力市場中的應(yīng)用

4.1自備電廠與公用電網(wǎng)之間的交易

4.2區(qū)域間輸電交易分析

4.3轉(zhuǎn)運(yùn)市場中電網(wǎng)的固定成本分?jǐn)倖栴}

運(yùn)轉(zhuǎn)市場中一個難題是網(wǎng)絡(luò)輸電服務(wù)定價，這個定價能夠給網(wǎng)絡(luò)使用者一個信號，以達(dá)到全網(wǎng)最優(yōu)化；并且能夠補(bǔ)償網(wǎng)絡(luò)的投資者，網(wǎng)損、變動成本、固定成本等費(fèi)用在網(wǎng)絡(luò)使用者中合理分?jǐn)偅煌瑫r能夠正確激勵網(wǎng)絡(luò)增容。節(jié)點(diǎn)實(shí)時價格（nodalspotprice）制度可以解決網(wǎng)損和網(wǎng)絡(luò)阻塞問題。但是文獻(xiàn)[9]的作者認(rèn)為節(jié)點(diǎn)實(shí)時價格制度不能完全回收輸電系統(tǒng)的固定投資，為了解決雙邊貿(mào)易中輸電系統(tǒng)固定成本公正分?jǐn)倖栴}，作者提出了基于多人合作博弈模型，可以計(jì)算出逐條線路逐筆交易的分?jǐn)傎M(fèi)用。文中使用“核仁”作為模型的解。該方法的優(yōu)點(diǎn)：①使用“核仁”而不用Shapely值，因?yàn)椤昂巳省碧幱诤诵?，分配值更加穩(wěn)定和易于被各方接受；②提供了一種激勵，減輕線路過載。

4.4基于Pool或PX模式的多邊貿(mào)易市場

4.5用博弈論解釋和實(shí)現(xiàn)算法

鞍點(diǎn)的概念與博弈論中的Nash平衡點(diǎn)有非常相似之處，如以上公式所示。基于此想法，作者構(gòu)造了兩廠商博弈模型。其中一局中人P代表整個實(shí)際電網(wǎng)的利益，它控制的決策變量是p，u（p向量表示各機(jī)組分配的有功，u向量表示機(jī)組啟停），目標(biāo)是使整個系統(tǒng)成本最低。另一個局中人Q，是一個假想的發(fā)電商，它以價格向P銷售備用容量和有功容量。雙方就旋轉(zhuǎn)備用交易進(jìn)行討價還價，最終達(dá)到一個平衡的交易量和交易價格。作者證明以上博弈過程的Nash平衡解就是拉格朗日函數(shù)的解。基于以上結(jié)論，作者設(shè)計(jì)了自適應(yīng)的次梯度算法尋求平衡點(diǎn)，其中一個關(guān)鍵技術(shù)作者設(shè)計(jì)了廠商P對廠商Q備用容量報(bào)價的反應(yīng)函數(shù)該函數(shù)將映射到備用容量的兩種水平之間（例如：5%Dt-%Dt，Dtt時段負(fù)荷），形成一個隨價格信息變動的備用容量。根據(jù)廠商Q是否了解廠商P的反應(yīng)函數(shù)，模型可細(xì)分為兩種：Nash模型（不了解對方反應(yīng)函數(shù)）和Stackelberg模型（Q了解P的反應(yīng)函數(shù)），作者認(rèn)為后一種模型掌握的信息較多，因此收斂的速度和優(yōu)化的效果梢好于前一種模型。

篇7

[關(guān)鍵詞]進(jìn)化博弈文獻(xiàn)綜述

一、進(jìn)化博弈的基本理論

進(jìn)化博弈論的研究起源于生物學(xué)領(lǐng)域,其目的是為了解決動物和植物的沖突及合作,為達(dá)爾文的自然選擇過程提供數(shù)理基礎(chǔ)。進(jìn)化博弈理論結(jié)合經(jīng)典博弈理論及生態(tài)理論研究成果,以有限理性的參與人群體為研究對象,利用動態(tài)分析方法把影響參與人行為的各種因素納入其模型之中,并以系統(tǒng)論的觀點(diǎn)來考察群體行為的進(jìn)化趨勢。正是基于其在生物物種與種群的競爭進(jìn)化演變規(guī)律分析中的成功,眾多學(xué)者紛紛將其概念和前提加以修正,將其廣泛應(yīng)用于經(jīng)濟(jì)領(lǐng)域、社會領(lǐng)域來解釋并預(yù)測人的群體決策行為。

二、進(jìn)化博弈理論的應(yīng)用研究

1.社會行為領(lǐng)域

Conlisk利用帶滯后項(xiàng)及隨機(jī)項(xiàng)的離散時間動態(tài)來分析參與人是否總是行為的最優(yōu)者。它假定有“最優(yōu)化”及“模仿”兩個純策略,其中非最優(yōu)化者有一個二次損失函數(shù),在此基礎(chǔ)上,他尋求一個滿足非最優(yōu)化者損失函數(shù)等于最優(yōu)化者正的常數(shù)成本的均衡群體比率,從而得出結(jié)論:當(dāng)群體中幾乎都是最優(yōu)化者時,模仿比最優(yōu)化策略更合算,因此,群體中非最優(yōu)化者在群體中最優(yōu)化者所占比例并不漸進(jìn)地收斂于1。Peyton Young認(rèn)為現(xiàn)實(shí)中每個參與人都是在前人給定的經(jīng)驗(yàn)知識基礎(chǔ)上選擇策略,個人選擇策略是一個適應(yīng)性的學(xué)習(xí)過程。個體在做出選擇時,盡管參與人存在一定的慣性及犯錯誤的可能性,經(jīng)過行為的長期進(jìn)化,這個適應(yīng)性學(xué)習(xí)過程也會收斂于一個有效率的傳統(tǒng)或合約。Sandholm對個體行為偏好的進(jìn)化進(jìn)行了動態(tài)分析。Juang從進(jìn)化的視角研究了規(guī)則的進(jìn)化與均衡的選擇問題。Nyborg和Rege探討了有關(guān)吸煙行為的社會規(guī)范的深化,并運(yùn)用挪威的經(jīng)驗(yàn)數(shù)據(jù)對結(jié)論進(jìn)行了檢驗(yàn)。

2.制度的演化

青木昌彥等運(yùn)用進(jìn)化博弈理論分析了社會經(jīng)濟(jì)體制的變遷。他們認(rèn)為:任何一種經(jīng)濟(jì)體制的產(chǎn)生都具有一定的慣性,并隨著經(jīng)濟(jì)所處的外部環(huán)境與所積累的內(nèi)部環(huán)境的變化一起逐漸地進(jìn)化。吳炯、彭飛以進(jìn)化博弈的復(fù)制動態(tài)方法為工具解釋了公司治理結(jié)構(gòu)演進(jìn)過程中的“兩極化”現(xiàn)象。邱中華等通過演化博弈模型考察委托人和人在委托過程中行為策略的自發(fā)演化過程,發(fā)現(xiàn)這一博弈過程的所有均衡都是鞍點(diǎn),從而得出委托人和人之間的監(jiān)察博弈沒有進(jìn)化穩(wěn)定策略。Kandori和Rafael運(yùn)用進(jìn)化博弈理論研究了兩種具有網(wǎng)絡(luò)外部性的技術(shù)之間競爭的博弈過程,提出了解決“花車效應(yīng)”問題的對策,論證了后發(fā)技術(shù)取代主導(dǎo)技術(shù)的可能性。

3.經(jīng)濟(jì)行為的演化

Routledge基于Grossman和Stiglitz提出的經(jīng)濟(jì)模型,探討了金融市場上個體行為人是如何通過適應(yīng)性和進(jìn)化學(xué)習(xí)來發(fā)現(xiàn)內(nèi)生變化并運(yùn)用這種內(nèi)生關(guān)系的一種學(xué)習(xí)模型。他通過模仿過程和經(jīng)驗(yàn)過程來對個體的投資行為建模,而不是運(yùn)用傳統(tǒng)上的顯性最優(yōu)化方法放松關(guān)于知識和理性的假設(shè)。Cowen和Kroszner利用進(jìn)化博弈理論研究了在自由競爭易貨貿(mào)易經(jīng)濟(jì)中,在存在交易成本的情況下,交易媒介的選擇問題。羅發(fā)友等對集群內(nèi)企業(yè)技術(shù)創(chuàng)新行為構(gòu)建了鷹鴿博弈、鷹鴿反擊者博弈和鷹鴿應(yīng)變者博弈三個模型,并得出集群內(nèi)企業(yè)創(chuàng)新行為不存在純策略進(jìn)化穩(wěn)定均衡,但存在混合策略進(jìn)化穩(wěn)定均衡和行為策略進(jìn)化穩(wěn)定均衡,反映了集群內(nèi)企業(yè)創(chuàng)新行為的協(xié)同競爭性以及這種協(xié)同競爭創(chuàng)新行為的進(jìn)化穩(wěn)定特性。

三、借鑒意義

1.進(jìn)化博弈論從有限理性人出發(fā),強(qiáng)調(diào)系統(tǒng)達(dá)到均衡的過程而非均衡本身。進(jìn)化博弈理論是完全摒棄傳統(tǒng)理論中非現(xiàn)實(shí)的“理性人”假設(shè),直接從有限理性參與人群體出發(fā)而提出的一種全新的動態(tài)分析方法,該方法認(rèn)為經(jīng)濟(jì)系統(tǒng)達(dá)到均衡需要一個長期的漸進(jìn)過程,均衡結(jié)果依賴于達(dá)到均衡的過程。

2.進(jìn)化博弈論納入了系統(tǒng)到達(dá)均衡的時間因素,有利于決策者控制系統(tǒng)向目標(biāo)的進(jìn)化。進(jìn)化博弈理論的動態(tài)分析方法中一個顯著特征就是把參與人的決策過程時間及因素互動的時間納入到其基本模型之中,強(qiáng)調(diào)系統(tǒng)達(dá)到均衡的過程。這樣有利于決策者控制經(jīng)濟(jì)系統(tǒng)使之朝向既定的目標(biāo)前進(jìn),也有利于決策者尋找能夠最大限度地促進(jìn)系統(tǒng)向意愿均衡轉(zhuǎn)化的因素,使系統(tǒng)盡快達(dá)到有效率的均衡。

3.進(jìn)化博弈理論引入突變因素較好的解決了多重均衡的選擇問題,即系統(tǒng)最終會趨于哪一個均衡依賴于系統(tǒng)的初始狀態(tài)。進(jìn)化博弈理論的基本均衡概念――進(jìn)化穩(wěn)定均衡,描述了當(dāng)經(jīng)濟(jì)系統(tǒng)一旦進(jìn)入到某一均衡的吸引域內(nèi),系統(tǒng)就會對其他的突變策略具有一定程度的抵抗力。

參考文獻(xiàn):

[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)

[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998

[3] 青木昌彥奧野正寬:經(jīng)濟(jì)體制的比較制度分析.中國發(fā)展出版社,1999

[4]邱中華金翔:基于進(jìn)化博弈論研究的一類監(jiān)察博弈. 南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,26

篇8

（一）配料配料的目的是將其熔化制造原材料。雖說浮法玻璃所需配料沒有其他類型玻璃的配料那么復(fù)雜，但是基本的配料是必須的，包括石灰石、白云石、砂、芒硝和純堿。料房中的控制系統(tǒng)主要負(fù)責(zé)運(yùn)輸浮法玻璃的生產(chǎn)原材料，同時控制著配合料的均勻混合。配料房內(nèi)部的平傳送帶主要是按照順序?qū)⑴淞陷斔偷蕉肥教嵘龣C(jī)并運(yùn)送到稱重裝置進(jìn)行稱重復(fù)合重量。最后人工將干燥的材料放入混合機(jī)中攪拌形成配合料，再經(jīng)過配料房送到窯頭料倉存儲，利用加料機(jī)來有控制地將配合料放入熔窖里。

（二）熔化熔窖的主要部分包括熔化池、澄清池、工作池和蓄熱室以及小爐。當(dāng)加料機(jī)將配合料放入熔窖的熔化池，通過天然氣噴槍將溫度加熱到1650度后熔化玻璃原料，熔化的玻璃通過澄清池均勻攪拌，再經(jīng)過工作室將溫度降到1100以增加玻璃液的粘度，而蓄熱池和小爐可以保持玻璃液的溫度處于1100度，使得玻璃液粘度不至于太黏，達(dá)到粘度正合適。

（三）成形經(jīng)過熔化的玻璃液在一定的降溫后，通過閘板來控制浮法玻璃液的流量使得浮法玻璃液能夠順著流道區(qū)自然流出。當(dāng)經(jīng)過錫液的時候，浮法玻璃并不會與錫液發(fā)生化學(xué)和物理反應(yīng)且在分子的作用下使得浮法玻璃的表面十分光滑。

（四）退火浮法玻璃由于在高溫下生產(chǎn)成形，如果直接將成形的浮法玻璃放在空中冷卻會導(dǎo)致玻璃板的表面在內(nèi)應(yīng)力的作用下壓縮，所以退火這一步驟十分重要。退火就是將浮法玻璃放置于已經(jīng)設(shè)置好溫度梯度的退火窖中使得玻璃的溫度逐漸降至大氣溫度而不會形成強(qiáng)烈的溫差。

（五）切割與包裝經(jīng)過退火窖的處理浮法玻璃已經(jīng)制造完成，緊接著將被送到切割區(qū)域。在切割之前會進(jìn)行缺陷檢測，檢測完成后將按照實(shí)際需要的規(guī)格用金剛石進(jìn)行切割。為了便于堆積存放，一般都會在浮法玻璃的表面撒一些粉末介質(zhì)。最后就是包裝階段，包裝可以用人力也可以使用自動機(jī)器來完成，通過分垛來包裝。

二、治理浮法玻璃錫缺陷措施

（一）控制錫的氧化和硫化導(dǎo)致錫缺陷的主要污染源是錫的化合物，這種情況產(chǎn)生的原因是當(dāng)錫液被污染（也就是錫液不純）后錫槽內(nèi)所發(fā)生的化學(xué)反應(yīng)產(chǎn)生的。所以唯有控制好錫的氧化和硫化才能夠提升浮法玻璃的質(zhì)量。保護(hù)氣體的純度在一定程度上能夠抑制錫的氧化和硫化以此來確保浮法玻璃的質(zhì)量，因此通過增加保護(hù)氣體中還原氣體的比例且減少氧化氣體能夠抑制錫液中發(fā)生氧化反應(yīng)。另外，錫槽的壓力也是一項(xiàng)判別保護(hù)氣體純度的指標(biāo)，因此要嚴(yán)格監(jiān)控并及時調(diào)整。

（二）提高槽壓提高槽壓的目的是防止外界氣體進(jìn)入到錫槽中以此來提升保護(hù)氣體的純度。但是由于技術(shù)的局限到目前為止最佳槽壓值還不為人知，另外空壓機(jī)設(shè)備相對而言較落后且生產(chǎn)者并不太關(guān)注錫槽的槽壓導(dǎo)致保護(hù)氣體的純度達(dá)不到標(biāo)準(zhǔn)，因此只有提高錫槽的槽壓才是解決錫缺陷的根本手段。

（三）定期排氣和清掃錫槽內(nèi)的氣流結(jié)構(gòu)由熱梯度和氣體量組成，由于一切工作程序都將引發(fā)熱梯度和氣體量的改變以至于使得氣流結(jié)構(gòu)變化，通常保護(hù)氣體的流動方向是由冷端流向熱端，為了促進(jìn)氣體流動可以裝置排氣孔且定期地進(jìn)行排氣，氣體流動將加速保護(hù)氣體中的氣體雜質(zhì)的排除，提升純度。

三、結(jié)語

推薦范文