博弈最優策略優選九篇

時間：2023-08-25 16:39:18

引言：易發表網憑借豐富的文秘實踐，為您精心挑選了九篇博弈最優策略范例。如需獲取更多原創內容，可隨時聯系我們的客服老師。

博弈最優策略

第1篇

論文摘要：信貸市場中，企業獲得貸款后基于自身利益的驅動會產生道德風險，從而加大了銀行信貸風險。本文建立了銀企博弈模型，得出銀行可以將審核概率控制在一定閥值上，從而降低企業的道德風險。在此基礎上，設計了銀行對借款企業的激勵契約，得出抵押物價值和貸款利率的最優線性關系。

隨著我國金融業的不斷開放，我國商業銀行面臨著日益激烈的競爭，借款企業的道德風險已經成為銀行較高不良資產率的主要原因之一發放貸款后，由于信息不對稱，銀行往往無法對企業進行有效監控，企業可能做出損害銀行利益的行為，這就是企業道德風險。

銀企博弈模型

交易雙方為銀行和借款企業，假設兩者均風險中立。博弈順序如下：借貸雙方針對某一項目簽訂借貸合同，貸款額度為B。合同規定抵押價值Q以及貸款利率i等，顯然Q>B。企業可選擇“不改變資金用途”或“改變資金用途”兩種純策略，對應的項目失敗概率t1和t2，顯然，t10，高風險意味著高收益)。銀行收益始終為r，有r=iB。項目失敗后，銀行由于存在審核成本，故其策略有“審核”與“不審核”，對應概率分別為α和1-α，審核成本為C。如果審查出企業“改變資金用途”，則銀行沒收抵押后并給予企業懲罰π，其中可以是信用等級的降低等。

雙方收益函數：企業不改變資金用途，如果項目成功，企業和銀行收益分別為R-r 和r；如果項目失敗并且銀行選擇審核，雙方收益分別為B-Q和Q-B-C，如果銀行選擇不審，雙方收益分別為B-Q和Q-B。企業改變資金用途，如果項目成功，企業和銀行收益分別為R+Δ-r和r；如果項目失敗并且銀行選擇審核，雙方收益分別為B-Q-π和π+Q-B-C，如果銀行選擇不審，雙方收益分別為B-Q和Q-B。

博弈的均衡分析

如果一個混合策略是企業的最優選擇，那么意味著企業是否改變資金用途的期望收益無差異，即：(1-t1)(R-r)+t1[α(B-Q)+(1-α)(B-Q)]=(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)]，得出：

同理，如果一個混合策略是銀行的最優選擇，那么意味著銀行審核與不審核之間的期望收益是無差異的。引入一個條件概率λ(c/f)，表示項目失敗后銀行認為企業改變資金用途的概率，由貝葉斯法則得：這種情況下銀行審核與不審核的期望收益相同，即：λ(c/f)(π+Q-B-C)+[1-λ(c/f )](Q-B-C)=Q-B，得出：

因此，所求的α和p即為所求納什均衡點。這表明當銀行審核概率低于α時，企業最優策略是改變資金用途；當銀行認為企業改變資金用途的概率小于p時，考慮到審核成本，銀行選擇不去審核。所以，銀行可以將審核概率控制在一定閥值之上，就能夠有效控制道德風險。

激勵契約設計

銀行在設計契約時，應理性預期到雙方的博弈策略選擇及其各種局勢的支付，進而設計激勵契約。設計契約如下：

{(1-p)(1-t1)r+(1-p)t1[α(B-Q-C)+(1-α)(Q-B )]+p (1-t2)r+pt2[α(π+Q-B )+(1-α)(Q-B )]} (1)

s.t(1-t1)(R-r)+t1(B-Q)≥0(2)

(1-t1)(R-r)+t1(B-Q)≥(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)] (3)

r=iB (4)

銀行的最優策略是使自身期望收益即(公式1)達到最大；同時應滿足不改變資金用途的企業的參與約束(公式2)；為激勵企業不改變資金用途，還應滿足激勵約束(公式3)，即不改變資金用途的企業獲得的收益應大于改變資金用途的企業。(公式4)為r與B的關系。

添加參與約束因子β和激勵約束因子γ構造拉格朗日函數，得出β=1，γ=1-p。

當γ≠0，即p≠1時，因此約束條件(2)和(3)取等號，解之得：;當γ=0，即p =1時，即銀行認為企業一定會改變資金用途，則銀行一定會審核，即α=1。

由結果可知，在最優博弈策略的基礎上，銀行利潤最大時其最優抵押物價值和貸款利率存在以上線性關系。一般，當貸款額度和貸款利率一定時，抵押物價值與項目失敗率成反比，因此，銀行可以通過設計不同的抵押物價值要求的契約來對企業進行激勵。

參考文獻

第2篇

關鍵詞均值方差準則；隨機微分博弈；線性二次控制；負債

中圖分類號 F830 ， O225 文獻標識碼 A

1 引言

均值方差投資組合選擇的目標是，在終值財富的均值給定時使其方差最小.文獻[1]第一次用計量數學方法研究了該問題，并給出了求解投資組合策略的理論框架.近年來，由于人們對經濟問題的持續關注，均值方差投資組合選擇問題已成為數理金融研究的最熱點問題.文獻[2]研究了動態多個時代的均值方差組合問題.文獻[3]在隨機LQ的框架下研究了連續時間均值方差組合問題，通過隨機LQ得到了最優策略和有效邊界.文獻[4]研究了馬爾柯夫調制市場上具有資產負債的均值方差組合問題，獲得了最優策略和有效邊界.

在研究中，發現已有文獻對均值方差問題的研究，大多只從投資者的角度出發，獲得最優投資組合，而沒有考慮市場不確定性對投資者的影響.在實際中，投資者肯定會受到市場不確定性因素的影響，因此從投資者和市場2個角度同時考慮才更符合實際.這就是隨機微分博弈問題.隨機微分博弈屬于博弈論的范疇.博弈論雖然古已有之，但文獻[5]的發表才標志著隨機微分博弈時代的真正到來.隨機微分博弈，假設市場是博弈的“虛擬”對手，通過投資者和市場之間的雙重博弈得到最優的投資組合.它如今已成為數理金融學、管理學科的研究熱點.文獻[6]在跳-擴散金融市場中，利用隨機微分博弈論研究了風險最小化的投資組合策略問題.文獻[7]利用隨機微分博弈論研究了Markov調制模型下的期權估值問題.文獻[8]研究了兩個具有相關但不同投資機會的投資者之間基于隨機微分博弈的最優投資問題.文獻[9]在冪效用和指數效用下研究了具有負債的隨機微分博弈.文獻[10]在冪效用和指數效用下研究了基于再保險和投資的隨機微分博弈.

已往文獻對隨機微分博弈的研究大多數都是基于效用的，很少研究基于均值方差準則的隨機微分博弈.基于已往文獻對均值方差問題和隨機微分博弈的研究，本文嘗試把這2個問題結合起來研究.另外，目前資產負債管理已經受到理論界和許多金融機構的重視，有越來越多的學者對其進行研究，這里不再一一列舉.因此本文在文獻[9]基礎上研究了基于均值方差隨機微分博弈的資產負債管理.目標是當終值財富的均值一定時，在市場最壞的情況下，投資者選擇一個最優的投資策略最小化終值財富的方差.應用線性二次控制理論求得了最優投資策略、最優市場策略和有效邊界，并分析了負債對它們的影響.本文的創新點是：在資產負債管理中引入了均值方差隨機微分博弈.通過本文的研究在實踐上可以指導投資者在具有負債和市場出現最壞情況下，選擇恰當的投資策略使自身獲得一定的財富而面臨的風險最小；同時在理論上豐富和發展了資產負債管理和隨機微分博弈.

2 模型設定

2.1 金融市場

參考文獻

[1] H M MARKOWITZ. Portfolio section [J]. Journal of Finance， 1952， 7（1）：77-91.

[2] D LI， W L NG. Optimal dynamic portfolio selection： multiperiod meanvariance formulation [J]. Mathematical Finance ， 2000， 10（3）：387-406.

[3] X ZHOU， G YIN. Markowitz’s meanvariance portfolio selection with regime switching：a continuoustime model [J]. SIAM Journal on control and optimal， 2003， 42（4）：1466-1482.

[4] S X XIE. Continuoustime portfolio selection with liability and regime switching [J]. Insurance： Mathematical and Economics， 2009， 45（1）：148-155.

[5] R ISAACS. Differential Games [M]. New York：Wiley，1965.

[6] S MATARAMVURA， B OKSENDAL. Risk minimizing portfolios and HJBI equations for stochastic differential games [J]. Stochastics An International Journal of Probability and Stochastic Processes， 2008， 4（3）： 317-337.

[7] T K SIU. A game theoretic approach to option valuation under Markovian regimeswitching models [J]. Insurance： Mathematics and Economics， 2008， 42（3）：1146-1158.

[8] S BROWNE. Stochastic differential portfolio games [J]. Journal of Applied Probability， 2000， 37 （1）：126-147.

[9] 楊鵬，林祥.隨機微分博弈下的資產負債管理[J].中山大學學報：自然科學版，2013，52（6）： 30-33.

第3篇

自20世紀90年代以來，科學技術和經濟快速發展，市場開始全球化，企業面臨的競爭日趨激烈。技術的進步和需求的多樣化，使產品壽命周期不斷縮短，因而企業面臨著縮短交貨期、提高產品質量、降低成本和改進服務的壓力。如何以更高的產品價值、更優的產品質量、更低廉的成本、更快捷的市場反應速度和更滿意的服務與競爭者抗衡；如何占領盡可能大的市場份額，成為企業經營戰略的核心，也成為企業面臨的重要問題。供應鏈的產生改變了現代企業的競爭方式，使得企業間通過加強合作來提高競爭力，共同將利益蛋糕做大，建立一種“共贏”的戰略合作伙伴關系。在建立合作伙伴關系中，由于利益的原因，雙方之間往往存在著策略的對抗和競爭，或對某一種局面的對策選擇，因此須對建立供應鏈合作伙伴關系采用非合作博弈的方法去分析。

現在非合作博弈在經濟管理中已得到了廣泛的應用，Nash均衡作為非合作博弈的一個重要概念，是所有應用領域中希望得到的最優狀態。雖然理論上已經證明了它的存在性，但是并沒有給出求解Nash均衡的一般性算法。尤其是對規模較大的問題，現有的方法很難給出解。隨著現代優化算法的發展，人們開始把遺傳算法引入到均衡求解中來。2001年，陳士俊等[1]提出了一種求解Nash均衡解的遺傳算法。仝凌云等[2]運用雙種群自適應遺傳算法解決了虛擬企業伙伴選擇的問題。王成山等[3]以改進的遺傳算法為基礎，提出了一種適用于輸電網投資博弈的均衡分析方法。以上這些算法都是對經典的Nash均衡設計的。2004年，曾玲等[4]針對產品價格為模糊變量的一般遞階資源分配問題，設計了一個求解Stackelberg-Nash均衡解的基于模糊模擬的二層遺傳算法。本文將在此基礎上為模糊非合作博弈設計一個求解模糊均衡的基于模糊優先關系的遺傳算法，并通過一個實例進行驗證。

一、模糊非合作博弈

定義1局中人的集合為，局中人的策略集為，當每個局中人選定一個策略（）后，就形成了博弈的一個局勢；對于每一個局勢，局中人有一個模糊支付函數，則為一個模糊非合作博弈。

定義2設是模糊非合作博弈的一個局勢，如果

，

則稱為的一個均衡局勢。

定義3對于模糊非合作博弈，為局中人的模糊占優策略的隸屬度為

定義4對于模糊非合作博弈，局勢S為的模糊均衡的隸屬度為

定義5對于模糊非合作博弈，如果對隸屬函數有

，

則稱局勢為的最優模糊均衡。

二、求解模糊均衡的遺傳算法

對于模糊非合作博弈，其最優模糊均衡滿足。顯然這是一個組合最優化問題，隨著局中人數量以及策略集元素的增加，求解最優模糊均衡的計算量是指數增長的。這是一個NP-hard問題。

我們將每個局勢看作自然界中的一個生物體，每個局中人的策略看作是生物體的不同染色體。正如生物體的生存性質與染色體組的基因關系，最優解也將是算法過程中的最優模糊均衡，從而獲得有限n人非合作模糊博弈的最優模糊均衡。在此我們假設所有局中人均有m個策略。

首先我們對問題進行編碼。根據非合作模糊博弈的特點，本文采用常規碼，對于局中人，其策略集為，向量是局中人的決策向量，其中表示局中人沒有選取第個策略，表示局中人選擇了第個策略。所有局中人的選擇構成了博弈的一個局勢，則局勢可以用向量表示。

隨機選擇個局勢作為初始群體，

由定義4，可知衡量最優模糊均衡的指標函數為：

又由定義2，3，局勢為模糊均衡的隸屬度是：

現在問題轉化為求的最大值。作適應函數：

計算概率

并以此概率分布從中隨機選一些染色體構成一個種群（集中可能重復選中的一個元素）。

因為前面采用了常規編碼，而局勢的變化隨每一個局中人策略選擇的變化而變化，所以選擇規則時，我們采用單親遺傳法。

從1到中隨機選取個數，對于每一個，將第個分量與第個分量交換當時，；得到新的，組成新的局勢。將中所有染色體進行上述，得到。

以某個較小的概率p發生變異，得到，令，，形成新的群體，循環計算。

當或者迭代次數達到某個次數時，終止程序。

簡單遺傳算法有可能不收斂到全局最優解，因此需要簡單遺傳算法作一點改動，每次記下當前最優解并在群體狀態最前增加一維存放當前最優解，則遺傳算法收斂到最優解。

改進后的遺傳算法其主要特征是：進化的每一代，記錄前面各代遺傳的最優解并存放在群體的第一位，這個染色體只起到一個記錄的功能不參加遺傳運算。

現將模糊均衡的改進遺傳算法敘述如下：

步驟一：給定群體規模，初始群體；

步驟二：對群體中的每一個染色體計算它的適應函數

，；

步驟三：若停止規則滿足，則算法停止；否則，計算概率

，

以此概率分布從中隨機選一些染色體構成一個種群；

步驟四：通過單親遺傳法進行，概率為，得到；

步驟五：以一個較小的概率p，使得一個染色體的一個基因發生變異，形成；在中記錄當前最優解，，形成一個新的群體；

返回步驟二。

三、實際應用

下面通過一個具體的實例來驗證一下算法的有效性。

假設現有同行業的兩個制造商甲和乙，他們希望建立供應鏈的方式來提高自身的競爭力，在建立合作伙伴關系的過程中，各自有3個可供選擇的供應商，他們的選擇結果是互相影響的，根據不同的情況，甲和乙的收益矩陣如下：

遺傳算法的參數選擇：群體規模=3；概率為0.5；變異概率為0.2；算法終止條件為：迭代次數達到100或者當均衡隸屬度高于0.5算法停止。通過計算，我們得到上述問題的最優均衡局勢為甲選擇策略3，乙選擇策略3，即局勢（3，3）為模糊均衡的隸屬度為0.214。

四、小結

本文先給出了具有模糊支付的非合作博弈的定義，以及求解模糊均衡的定義，但是發現當局中人數量較多，或策略較多時，依靠枚舉法進行求解是非常繁瑣的，這是一個NP-hard問題。為了求得最優模糊均衡，在一個求解Stackelberg-Nash均衡解的基于模糊模擬的二層遺傳算法的基礎上，為模糊非合作博弈設計了一個求解模糊均衡的基于模糊優先關系的遺傳算法，并給出了求解最優模糊均衡的改進遺傳算法，最后通過一個實例進行了驗證。

[1]陳士俊，孫永廣，吳宗鑫.一種求解Nash均衡解的遺傳算法[J].系統工程，2001.19

[2]仝凌云，陳增強，袁著祉，安利平.虛擬企業伙伴選擇的雙種群自適應遺傳算法[J].計算機工程，2006.32

第4篇

關鍵詞：博弈論；圍標串標；治理

中圖分類號：F22 文獻標志碼：A 文章編號：1673—291X（2012）28—0210—03

一、博弈論概述

博弈論是專門研究博弈如何出現均衡的規律的學科[1]。博弈論的思想最早出現于18世紀，20世紀20年代，由科學家馮·諾依曼和經濟學家奧斯卡·摩根斯坦恩合著的《博弈與經濟行為的理論》一書中將博弈論真正作為了一種理論研究。他們提出了策略型和廣義型等基本博弈模型、解的概念和分析方法，構建了博弈論的理論框架。1951年納什對靜態博弈模型提出了納什均衡的概念，明示了博弈論與經濟均衡的內在聯系。

博弈論又稱對策論，是研究決策主體在決策主體各方相互作用情況下如何進行決策及有關決策均衡問題的理論。博弈論強調決策主體各方策略的相互依存性，即任何一個決策主體必須在考慮其他局中人可能的策略選擇基礎上來確定自己的最優行動策略。博弈論的精髓在于博弈中的理性決策者必須考慮在其他局中人反應的前提下來選擇自己最理想的行動方案。所謂均衡即所有局中參與人的最優策略組合，各方博弈產生的結果是一個均衡結果，它可能不是局中各方及整體的利益最大化，但它是在已給信息與知識條件下的一種必然結果，因為任何一方改變策略而導致均衡的變化都有可能使自己得到一個更差的結果。

博弈論假設人是理性的，即人人都會在給定的條件下想辦法使自身利益最大化。另外，人們在合作交往中有沖突，行為決策會受到相互的影響，且信息通常不對稱。在現實中，博弈的最終結果往往是博弈的各參與人的策略組合達到一個均衡的結果，我們稱之為納什均衡。一旦達到這種均衡，博弈的任何一方都不會有積極性偏離這種均衡。

在一個存在n個參與者的博弈中，假設所有參與者都是理性的，如果策略組合s*是一個均衡的話，那么給定n—1個參與者的策略，某個特定參與者所選擇的策略一定是最優的

（否則與理性人的假設相矛盾）；因為某特定參與者是任意選取的，因而上述特性對每個參與者都成立。換言之，對于一個策略組合s*，如果保持其他參與者的策略不變，而任意一個參與者的策略都是最優的，那么策略組合s*就是納什均衡。歸納為一句話即為：“最優對任一參與者的任一策略成立。”簡而言之，納什均衡就是在給定其他參與人策略的條件下，每個人選擇自己的最優策略。

用數學公式可這樣表示：如果一個策略組合s*=（s*1，…，s*n）是博弈G={S，U}的一個納什均衡，那么對任一參與者i=1，2，…，n，對其任意一個策略si∈Si，不等式ui（s*i，s—i）≥ui（si，s—i）成立。

納什均衡的運用非常廣泛，最為有名的一個例子就是由塔克給出的“囚徒困境”博弈模型。囚徒1和囚徒2共同作案，被抓住，警方將兩名囚徒分開在兩間審訊室同時審問，他們都只有兩個選擇，招供和沉默。警方提出這樣的條件：若兩人都招供，則證據確鑿，兩人均被判六年；若一人招供，一人沉默，則招供的囚徒可立即釋放，而沉默的人則加刑二年；若兩名囚徒均不招供，則因證據不足只能判他們一年。由此分析如下：

1.參與者集合：N={1，2}。

2.策略空間：囚徒1的策略空間S1={沉默，招供}，囚徒 2的策略空間S2={沉默，招供}。

3.偏好和收益函數：囚徒1的偏好為，（招供，沉默），（沉默，沉默），（招供，招供），（沉默，招供）。前一項為囚徒1的策略，后一項為囚徒2的策略。囚徒2的偏好類似。定義u1（s1j，s2k）和u2（s1j，s2k）分別為囚徒1和囚徒2的收益函數。所有收益如下：

u1（s11，s21）=—1 u1（s11，s22）=—8

u1（s12，s21）=0 u1（s12，s22）=—6

u2（s11，s21）=—1 u2（s11，s22）=0

u2（s12，s21）=—8 u2（s12，s22）=—6

顯然有：

u1（s12，s21）=0>u1（s11，s21）=—1>u1（s12，s22）=—6>u1（s11，s22）=—8

u2（s11，s22）=0>u2（s11，s21）=—1>u2（s12，s22）=—6>u2（s12，s21）=—8

囚徒困境博弈模型（見下頁圖1）。

圖1 囚徒博弈矩陣

由圖1可清楚的看出，在完全不清楚對方如何決策的條件下，對于囚徒1，不論囚徒2選定的是招供還是沉默，他都應該選擇招供，因為招供是他的嚴格占優策略；同樣的，對于囚徒2，不論囚徒1如何選擇，招供是他的嚴格占優策略。于是（招供，招供）是該博弈模型的嚴格優策略。同時，（招供，招供）是該模型的一個納什均衡。如果給定囚徒2選擇招供，則囚徒1的最優策略只可為招供；反之，給定囚徒1選擇招供，囚徒2的最優策略也只能是招供。

二、圍標串標的危害

所謂“圍標”，是指某個投標人通過一定的途徑，秘密伙同其他投標人共同商量投標策略，串通投標報價，排斥其他投標人的公平競爭，以非法手段贏取中標的一種違法行為。圍標行為的發起者稱為圍標人，參與圍標行為的投標人稱為陪標人。所謂“串標”，是指在工程招投標過程中，幾家投標單位通過事先商定，聯合對招標項目的一個或幾個招標標段用一致性報價、壓價或抬價等手段串通報價，以達到排斥其他投標人，控制中標價格和中標結果，讓他們其中的投標者中標的目的。

第5篇

關鍵詞：大學生就業UIG合作體系；博弈；共贏

一、前言

大學生就業一直是高等教育界乃至整個社會共同關注的話題。近幾年我國經濟進入新常態，在經濟下行壓力和產業結構調整的大背景下，就業壓力問題更加突出，結構性矛盾更加凸顯。與此同時，高校畢業生人數逐年增加，2017年高校畢業生將達795萬，較去年增加30萬人數，這在一定程度上導致我國當前就業形勢更加嚴峻和復雜。基于此，本文借鑒“產學研合作”研究的方法，提出大學生就業UIG合作機制，并進一步探討了UIG合作機制中相關利益主體的博弈分析，試圖緩解當前就業難問題。

二、大學生就業UIG合作創新體系中的利益主體

政府在大學生就業UIG合作過程中發揮宏觀指導作用，政府主要通過制定相關方針政策起作用，它是引導大學生就業的重要力量。就業政策就像是“看得見的手”，不僅可以彌補勞動力市場這只“看不見的手”的不足，而且能夠引導和促進“看不見的手”，在大學生就業過程中更好發揮作用。政府具有資金和政策的優勢，政府應制定相應的政策法規，地方各級政府也必須高度重視，發揮政府的組織優勢、資源調控優勢、公共管理優勢，形成政府、高校和企業的協同運作，在稅收、信貸、經費等方面積極發揮調節作用。企業在大學生就業UIG合作具有實踐作用。企業作為人才的需求方，應利用自身對市場的聯系，及時反饋市場對人才的需求。這樣，高校才能快速調整培養模式，向企業輸送急需人才。此外，企業應為畢業生提供實習平臺，參與人才培養的過程來，這樣培養的人才，有助于企業未來的發展。高校就業率是評價一個學校的標準，社會對就業率的強勢關注在一定程度上促進了高校對大學畢業生就業工作的重視。高校作為勞動力市場的供給方，每年向企業和政府部門培養和輸送大批優秀人才，應該打破傳統人才培養模式，在產學研合作的基礎上，促進校企合作培養人才，實現企業需求與人才培養之間“零距離”，社會需求和崗位要求“零距離”，實施教育與上崗就業之間“無縫連接”，結合市場需求、企業要求和大學生自身需求，積極推進人才教育模式的革新，進行頂層設計。高校學科專業結構需要同社會、經濟發展規律相適應，根據不同的辦學層次、類型和定位，形成特色專業，使培養的學生能夠符合現有市場的要求。政府也應該在高校教育體制改革上給予一定的支持，確保新的培養模式的能夠進行。其次，針對大學畢業生，高校就業指導需要有效“補位”。高校應促進校企合作，讓企業加入高校人才培養中來，利用企業的資源和平臺，從而實現畢業生有效、快速的就業。

三、大學生就業UIG合作創新體系的博弈分析

政府、企業、高校三者之間的利益既存在一定矛盾，也有協調的一面。由于涉及政府、企業、高校三者之間的利益博弈，為簡單起見，本文在“經紀人”和不完全信息假設條件下，采用博弈（EvolutionaryGame）方法，分別討論政府與企業、企業與高校、高校與政府之間的利益博弈，以此來解釋大學生就業UIG合作創新體系的可行性。

（一）政府與高校的利益博弈分析

政府與高校博弈的收益矩陣如表1所示。通過對政府與高校博弈的收益矩陣的分析可知，對高校而言，無論政府選擇“支持”或者“不支持”策略，“作為”是高校的最優選擇（理由：1＞-1；6＞3）。同理，對政府而言，無論學校選擇“作為”或者“不作為”策略，政府都會選擇“支持”策略。因此，策略組合（作為，支持）是該博弈的納什均衡，此時，雙方也達到帕累托最優狀態，即最優均衡策略，其均衡報酬為（6,4）。政府和高校的博弈過程和結果表明，在大學生就業UIG合作方面，政府與高校的利益目標基本一致，政府關注大學生就業問題，有利于社會的穩定和發展，而高校重視畢業生就業率對自身以后的招生和長期發展十分有利。因此，政府和高校會達成共識，共同努力，來解決大學生“就業難”問題，從而實現雙贏的效果。

（二）高校與企業的利益博弈分析

高校與企業博弈的收益矩陣如表2所示.通過對高校與企業博弈的收益矩陣分析可知，對企業而言，無論高校選擇“作為”或者“不作為”策略，“配合”是企業的最優選擇（理由：3＞1；5＞2）。同理，對高校而言，無論企業選擇“配合”或者“不配合”策略，高校都會選擇“作為”策略。因此，策略組合（配合，作為）是該博弈的納什均衡，此時，雙方也達到帕累托最優狀態，即最優均衡策略，其均衡報酬為（5,4）。企業和政府的博弈過程和結果表明，在大學生就業UIG合作方面，企業與高校的利益目標基本一致，企業需要符合自己發展的人才，而積極與高校交流，有利于企業科研成果轉化為產品，是企業在市場立于不敗之地。高校重視畢業生就業率對自身以后的招生和長期發展十分有利，而與企業合作，可以共享其資源和平臺，將有利于高校科研的發展。因此，政府和高校會達成共識，共同努力，來解決大學生“就業難”問題，從而實現雙贏的效果。

（三）企業與政府的利益博弈分析

企業與政府博弈收益矩陣如表3所示。通過對企業與政府博弈的收益矩陣分析可追，對政府而言，無論企業選擇“配合”或者“不配合”策略，“支持”是政府最優的選擇（理由：1＞-2；6＞1）。同理，對企業而言，無論政府選擇“支持”或者“不支持”策略，企業都會選擇“配合”策略。因此，策略組合（支持，配合）是該博弈的納什均衡，此時，雙方也達到帕累托最優狀態，即最優均衡策略，其均衡報酬為（6,5）。企業與政府博弈的過程與結果表明，在大學生就業UIG合作方面，企業與政府的利益目標基本一致，企業一方面能夠招聘到符合自己發展的人才，另一方面參與大學生就業UIG合作，在一定程度上可以獲得政策支持，這有利于企業的長期發展，而政府通過在大學生就業UIG合作發揮積極作用，可以降低社會失業率，有利社會的穩定和發展。因此，企業和政府會達成共識，共同努力，來解決大學生“就業難”問題，從而實現雙贏的效果。

四、研究結論

在大學生就業UIG合作過程中，政府、企業和高校三者既有協調的方面，也存在一些矛盾，總體上，三者之間利益目標基本一致。本文基于博弈論的視角，利用數值模擬討論了三者在大學生就業UIG合作過程的利益博弈，得到其最優策略，從博弈結果可知，大學生就業UIG合作在理論上具有很強的可行性，是一種多方“共贏”的模式。

參考文獻：

[1]楊偉國.《借重“看得見的手”——談談國外對大學生就業的政策支持》，《求是》，2004年第6期。

第6篇

納什博弈論：指假設有n個局中人參與博弈，如果某情況下無一參與者可以獨自行動而增加收益，即為了自身利益的最大化，沒有任何單獨的一方愿意改變其策略的，則此策略組合被稱為納什均衡；所有局中人策略構成一個策略組合，納什博弈論，從實質上是一種非合作博弈狀態；

納什均衡達成時，并不意味著博弈雙方都處于不動的狀態，在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的；納什均衡也不意味著博弈雙方達到了一個整體的最優狀態，最優策略不一定達成納什均衡，嚴格劣勢策略不可能成為最佳對策，而弱優勢和弱劣勢策略是有可能達成納什均衡的。

（來源：文章屋網）

第7篇

關鍵詞：水資源；政府管制；產權；博弈

[中圖分類號]F272.92;F224.32 [文獻標識碼]A [文章編號]1009-9646（2012）4-0078-02

一、水資源環境污染的博弈分析

水資源環境污染問題，即水質博弈，廠商之間的“囚徒困境”問題。首先假定市場自由競爭，政府不進行管制，在環境污染博弈中參與人是兩個相同的排污者A與B，兩方的策略是排污與不排污，假設兩個人都不排污，有一個好的環境，大家收益都為20；如果大家都排污，這時環境惡化，每個人的收益都降低到9；如果一人不排污，另一人排污，由于治理污染要付出成本，不排污者的收益為為4，而排污者的收益為15。該博弈的支付矩陣見圖1：

圖1 無管制情況下排污者之間博弈

該博弈有兩個納什均衡，即(9，9)和(20，20)也就是兩方同時排污或者同時不排污。但是納什均衡(20，20)是不穩定的，因為A與B兩方合謀不排污是不可信的，一旦一個選擇不排污，另一個可能排污，那么排污者的收益為15，不排污者的收益為4。最后的納什均衡是(9，9)，社會的總效益為18，而不是40，此實際是兩人博弈的囚徒困境。在現實經濟中排污者有很多個，假定有n個排污者，這實際上就是有n個局中人的博弈模型。在沒有政府監管的情況下，這n個局中人進行博弈，他們會根據利益最大化選擇自己的策略，要么排污要么不排污，如果大家都不排污，環境不會被污染，整個社會福利最大。但是合謀不排污是不可信的，因為如果你不排污就要進行污染治理，治理要成本，結果你和別人共享同樣的環境，你的效用相對他人較低，因此你不排污你吃虧，結果大家都排污，這就是n人博弈的囚徒困境。

二、政府與用水單位之間的博弈

政府代表供水單位，此為水量博弈。我國長期以來對耗水大的單位，供水無限量且價格低廉，導致大家缺乏節水動力。為了達到水資源的最優配置，對供水與用水單位之間進行博弈分析。該博弈的三要素是：博弈參與人集合：{政府，用水單位}；政府的策略集是：供水多，供水少，用水單位的策略集是：節約水，不節水；設參與人的收益如圖2所示：

圖2 供水與節水之間博弈

當政府的策略是供水多時，用水單位采取的最優策略是不節水，由圖2可知由于15>12；當給定用水單位不節水時，政府的最優策略是供水少，收益為6；當給定政府供水少時，用水單位的最優策略是節水，收益選擇為10；當給定用水單位節水時，政府的最優策略是供水多因為15>3，此博弈不存在納什均衡。在這種情況下，政府如采用水權交易能收效甚大，與用水單位交易，用量多的需花大成本購買大的用水權，這就促使用水多的單位節約用水以節約成本。為此生產用水價位要高，而生活用水要低；將用水量分若干檔次水價，按不同檔次由低到高遞增計價；夏天與冬天應按不同水價計費，目的也是促進節約用水；洗用水做到達標排放，這樣可循環用水，也可避免污染水環境，其治理費用要計入水廠成本中，通過上述措施達到水資源的最優配置。

三、政府與廠商之間博弈分析

1.府與廠商之間的不完全信息動態博弈

廠商一般比較清楚政府各次制定的環保法規等，但政府很難了解廠商的執行情況，即信息不對稱。此外，短期內環境改善或污染的損益不易表現并很難計量。因此，廠商與政府就形成了一個不完全信息動態博弈。將有關廠商看作廠商A，而政府為B，就構成了兩個博弈方的動態博弈。圖3表示政府與廠商之間的子博弈，p1、p2、p1 、p2′、q1、q2指博弈方選擇對應策略的概率，對方很難準確把握，(u、v)指A、B博弈方得益。在此博弈中，如果p1=1，p2=0，那么博弈提前結束，等到人們對環境質量有更高要求時，政府又開始制定新環保法規，博弈又開始，環境質量將得到不斷改善。但政府管制對于廠商來說是一種威脅，如果q1>q2，則它是可信的威脅，那么廠商在上階段很可能選擇不違規，即p1>p2；反之q2>q1，博弈繼續向下進行，環

境向著惡性發展。目前我國的環保法規不夠嚴厲，即使上交罰金，仍有高額暴利，因此政府的法規只是一種不可信“威脅”。

圖3 政府與廠商之間的動態子博弈

2.政府與廠商之間的靜態博弈

此博弈中，政府的選擇是打擊與不打擊，廠商的選擇為合理與不合理排污。這是一個靜態博弈，其支付矩陣如圖4：其中a，b分別為廠商合理排污的概率、政府打擊廠商違法排污行為的概率，A為廠商合理排污的成本，C為政府打擊違法排污行為的成本，F是廠商不合理排污時被政府發現后的罰款。給定a，政府選擇打擊與不打擊的期望收益分別為(G為政府，Q為廠商)：

圖4 政府與廠商之間的靜態博弈

G(1，a)=C*a+(F-C)*(1a)； G(0，a)=0，解 G(1，a)= G(0，a)= 0，得a*=(FC)/F。即：若廠商合理排污的概率大于(FC)/F，政府最優選擇是不打擊;否則反之。給定b，廠商選擇合理與不合理排污的期望收益分別為： Q(b，1)=A*b+(-A)*(1b)； Q(b，0)=(FA)*b，解 Q(b，1)= Q(b，0)=0，得b*=A/(A+F)。若政府打擊違法排污行為的概率小于A/(A+F)，廠商最優選擇是不合理排污；否則反之。因此政府應嚴厲打擊違法排污行為，使政府的打擊行為成為對廠商不可置疑的威脅，這樣廠商才會合理排污，而且水質和水量之間也是相互影響的，污水資源化，既可減少環境污染，又能提高水的利用率，增加新的水資源。

四、小結

廠商共同排污、代表政府的自來水公司進行城市供水、政府與廠商之間的博弈等都是公共水資源問題的表現。若使水資源可持續開發利用，第一，制定合理的排污收費制度或實行排污許可證交易促使用水單位合理排污，同時調整產業結構及集中治理治污，解決用水緊張以及污染嚴重等問題。第二，政府制定統一合理的水價或實行水權交易使水資源在各用水單位的配置合理，指導自來水公司之間重組，擴大規模，減少公司數量，提高效益，同時節約水資源。第三，在廠商與政府的動態博弈中，盡量減少政府失靈，制定高額罰款標準，嚴厲的法律制裁及執行程序，同時減少水資源管理中的尋租行為，使之成為該博弈中的可信威脅，使博弈提前結束。第四，設計水資源保護機制，怎樣規則最有效，底價、投標費、保證金等定在多少較合理，以使得拍賣方達到盈利極大化就是拍賣形式的機制設計等。總之要做到水資源開發、利用和保護協調發展，政府、社會和公民必須在水資源保護和利用過程中，更加開闊思路，減少錯誤決策，提高行動效率，使得博弈各方利益都得到最好的保護，以實現人與水資源開發利用的和諧發展。

[1]張維迎.博弈論與信息經濟學[M].上海：上海人民出版社，1996.

[2]Roger Perman. Natural resource and environment economics [M].second edition ， December 1998.

[3]張煥林.探析規劃水資源論證的政策框架構成[J].水利發展研究，2010(4).

[4]王金南.排污收費理論學[M].北京：中國環境科學出版社，1997.

第8篇

[關鍵詞] 訂單農業農業產業化博弈論

在我國農業產業化過程中訂單農業是居于主要形式的，其未來的發展對我國農業產業化進程至關重要。在訂單農業中最為關鍵的就是農戶與農業加工企業間的關系，“農+企”的關系構成了訂單農業的核心。目前在我國訂單農業中農戶與農業企業間的關系并不是很穩定的，在一定范圍中存在著履約率低的現象，這嚴重束縛了訂單農業在我國的進一步發展。

一、訂單農業中“農+企”關系的現狀介紹

訂單農業目前出現了履約率較低的現象，究其原因是復雜的。主要表現在：當原料市場價格高的時候，哪家企業出的價格高，農民就把農產品賣給那家企業，不履行合同中規定的義務，進而會出現幾家企業甚至地區間企業搶購原料的無序競爭狀態；當原料市場價格低的時候，企業又不愿敞開收購或壓級壓價收購，變相不履行合同，造成訂單農業執行難，產生大量的經濟糾紛，束縛了當地訂單農業的進一步發展。

二、訂單農業中“農+企”關系矛盾的博弈分析

我們就以農產品加工企業和當地的種植農民之間的關系作為例子，運用博弈論的知識來對此加以分析：假定在這場博弈中有兩個博弈的參與者，一個是種植農戶，簡稱博弈參與者A；另一個是當地收購并且加的企業，簡稱博弈參與者B。同時假定在這個博弈過程中雙方享有的信息是平等的，不存在任何一方占有信息優勢。對于參與者A和B來說，都有兩種可供選擇的博弈策略：履約和不履約。由此，可得關于A,B博弈參與者的收益矩陣：（見表1）

表1 A、B博弈參與者的收益矩陣（注：b>a>d>c）

由上表中關于博弈參與者A，B的收益矩陣可知，當博弈參與者B遵守合同時，A遵守合同獲得的收益為a，不遵守合同獲得的收益為b，因為b>a，在此情況下A作為一個理性的人來講會選擇不遵守合同；當博弈參與者B不遵守合同時，A遵守合同獲得的收益為c，不遵守合同獲得的收益為d，因為d>c，在此情況下A作為一個理性人會選擇不遵守合同。這樣，對于博弈參與者A來講，不管博弈參與者B采取何種博弈策略，它的最優策略是不遵守合同較為有利。同樣，對于博弈參與者B而言，最優策略也是不遵守合同較為有利。

綜上，在該博弈里，對于博弈的參與雙方而言，各自的最優策略都是不遵守合同，這樣得到一個納什均衡博弈結果，此時雙方的收益為(d,d)。由收益矩陣可知，該博弈的最優均衡結果是雙方都選擇遵守合同的策略，相應的收益為(a,a)。因而，此種博弈的納什均衡并不是最優的納什均衡結果。

三、增加外部干預措施后的博弈分析

導致前面博弈沒有取得最優均衡結果的根本原因是：博弈雙方的利益分配得不合理，增加了博弈雙方的違約動機。如果我們能對博弈棋局的外部采取干預措施來改變博弈雙方的利益分配格局，進而降低博弈雙方的違約動機，就有可能使雙方的收益達到最優的均衡博弈結果，即雙方將都從干預中獲益。

下面我們就以對博弈參與雙方的違約行為采用高額罰金進行處罰的干預方式作為例子來分析利益雙方的博弈行為。

假定在博弈的一方遵守合同而另一方違約的情況下，違約的一方將面臨高額罰金（假如該罰金為），同時該罰金的所得都用于補償遵守合同的另一方的利益損失。此時違約的一方所獲得的收益為，遵守合同的另一方的收益為，其他情況則保持不變（收益矩陣見表2）。

表2 收益調整后博弈參與者A，B的收益矩陣

下面分析的不同取值對博弈雙方最終博弈結果的影響：

1.當時。在此條件下我們很容易得出結果：對于博弈雙方AB來說，不管對方采取何種博弈策略，它都會選擇不遵守合同的博弈策略。這樣，最終博弈雙方的均衡結果與先前的博弈結果是相同的，此時該種干預措施的效果是比較差的。

2.當時。對于博弈的參與者A來說，當博弈參與者B遵守合同時，它遵守合同獲得的收益a要大于不遵守合同獲得的收益，從理性人的角度來看，A會選擇遵守合同的博弈策略；當B不遵守合同時，它遵守合同獲得的收益要大于不遵守合同獲得的收益d，此時A同樣會選擇遵守合同的博弈策略。即不管B采取何種策略，A都會選擇遵守合同的博弈策略。同理，對B加以分析，也會得到相同的結果。這樣，最終博弈雙方的均衡結果是最優納什均衡，即大家都選擇了遵守合同的博弈策略，最終收益為(a,a)是最優的，即該種干預措施對利益雙方都是有利的。

3.當時。分析結果是此時博弈雙方無最終的均衡博弈結果，也就是說此時的博弈結果是不確定的，因而此時該種干預措施的效果也就是不確定的。

綜上所述，適當增加干預條件，當罰金值滿足的條件時，經過收益調整后的博弈雙方就會得到一個最優的納什均衡，此時雙方也將會從該博弈中獲得最大的收益。

四、對策與建議

我們論證了：通過外界的干預措施來降低博弈雙方違約的動機是解決先前的非最優均衡博弈結果的有效方法[4]。具體的干預方法和措施主要有：

1.增加博弈雙方的違約成本，降低違約動機

（1)可以設立一個中介機構，比如稱為農產品交易中心，通過以該交易中心為中介，來完成雙方的交易（這有點像期貨交易中的清算所的作用，具體見圖）。這樣不論哪一方都不會輕易的違約，因為保證金會作為它們違約的代價。同時也避免了違約金被長期占用的情況，雙方履約完成后保證金會自動退回雙方。而且，交易的雙方可以互相選擇交易對象，有利于農戶維護自身的權利，改善了單個農戶與企業之間訂立合同時所處的劣勢。

設有農產品交易中心的訂單農業示意圖

（2）建立農戶和企業的信用檔案。如果發現農戶或者企業在履約時出現違約的現象，可以在它們的信用檔案中加以記錄。對有違約現象等不良記錄的農戶，從信用社或銀行獲取貸款時，將增加貸款的審核條件，在貸款利率、期限和貸款使用途徑等方面有更嚴格的要求。通過這種方式，增加相關農戶和企業違約的成本，提高履約率。

（3）通過設立農戶自律組織來增加雙方的違約成本。通過協會的形式來規范農戶自身的行為，同時當農戶面臨農業企業的變相違約時，可以以協會為主體，采取集體性的措施，維護自身的權利。當然，對于農業生產中介組織這個領域，目前我國的發展還處于起步和探索階段，要真正在實踐中做好還是比較難的。

2.通過更為科學的合同定價來降低博弈雙方的違約動機。通過分析，我們會發現導致種種利益矛盾的另外一個根本的癥結是合同中所采用的固定價格機制，而這與市場中相關農產品價格的波動是有沖突的，這也導致了雙方利益關系的不穩定甚至出現利益沖突。

（1）將合同中的固定價格轉化為浮動價格。如果把合同中的固定價格轉化為浮動價格，這樣農民和企業之間就不會產生因為市場價格變化，而導致雙方之間的利益沖突。主要是通過期貨交易，來達到對該農產品的價格進行套期保值的效果，鎖定該農產品的未來價格。

（2）在合同中設立附加條款，避免合同雙方利益的過度不平衡，進而可以減少雙方的違約動機。比如可以在合同中規定，當市場價格處于合同規定價格的10%（或者是其他比例數額）波動范圍內時，雙方交易的價格仍以合同規定的價格為基準；超過波動范圍時，此時雙方交易的價格就以另一種計價方式來計價。這樣，避免了因為市場價格的大幅度變化，出現一方獲得較大收益，而另一方則面臨著相應的大幅度虧損的不利局面，有利于提高合同雙方的履約率。

五、結束語

從上面的分析中可以看出，導致當前“農+企”關系面臨困境的主要原因是其中的制度設計和執行方面存在著缺陷。所以，對于這種由于制度缺陷原因而導致的困局我們應主要從糾正制度缺陷方面入手來加以解決，即通過改變博弈雙方不合理的收益分配格局，以此來降低雙方的違約動機，實現最優納什均衡。

參考文獻：

[1]祝宏輝:新疆番茄產業實施訂單農業生產方式的效果評析[J].農業技術經濟.2007(3):89-95

[2](美)朱?弗登博格,(法)讓?梯若爾.博弈論[M].北京:中國人民大學出版社,2002

[3]楊鵬飛:發展農業產業化之我見[J].內蒙古農業科技，2003(6)：153-154

[4](美)約翰?海薩尼.海薩尼博弈論論文集[M].北京:首都經濟貿易大學出版社,2003

第9篇

〔關鍵詞〕圖書館；數據庫商；博弈論；囚徒困境

DOI：10.3969/j.issn.1008-0821.2015.07.003

〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821（2015）07-0014-05

〔Abstract〕The game theory model of the libraries and the database vendors is formulated in this article，it also pointed out the prisoners dilemma was the Nash equilibrium of the game between the libraries and the database vendors，it analysed the causes of the prisoners dilemma and also had an analysis of the possibility and necessity to break prisoners dilemma between the libraries and the database vendors.Based on the perspective of Karldor Hicks Priciple，some strategies to break prisoners dilemma were proposed.

〔Key words〕library；database vendor；game theory；prisoners dilemma

版權法的立法目標是要禁止對作品的無償使用又要保障知識的自由傳遞，對于數據庫這類匯編作品，版權法只保護對事實的選擇和編排形式而不保護數據庫作品中的事實本身[1]。但是，歐盟于1996年頒布了數據庫指令，該數據庫指令創設了一個數據庫特殊權利，這一權利意味著把數據庫制作者的權利延伸到了數據庫中的信息內容本身[2]。歐盟頒布的數據庫指令加大了數據庫商版權保護和圖書館信息獲取之間的固有沖突，使得圖書館與數據庫商之間的博弈競局凸顯[3]。

1 圖書館與數據庫商的博弈分析

11 博弈競局產生

1996年歐盟頒布的數據庫指令，創設了一個數據庫特殊權利，這一權利加強了對數據庫商的保護力度，使得更多的數據庫成果被創造出來，推動了數據庫產業的發展。圖書館與圖書館用戶是數據庫資源的最終消費者，是數據庫產業發展的根本動力，他們的利益代表著社會的公共利益，希望獲取更多的數據庫信息資源以促進知識的傳播和科學技術的進步；而數據庫商是數據庫信息資源的所有者，希望憑借數據庫保護條例，阻止公眾對其數據庫內容的免費使用。因此，在數字環境下，要平衡數據庫商追求的私人利益和圖書館代表的社會整體利益，不能一味地強調一方的利益而削弱另一方的利益。由于圖書館與數據庫商的利益訴求不同，圖書館所代表的社會整體利益與數據庫商的個人利益的矛盾導致二者之間博弈關系的產生，即數據庫商與圖書館之間的博弈競局產生。

12 納什均衡的“囚徒困境”

博弈論的理論認為，在競爭關系的非合作博弈中，由于每個博弈決策參與人都充盈著自由自覺的意識，但這種自覺意識是原子形態的意識，無法形成合作的有機分子結構或集體理性。因此，在競爭關系的非合作博弈中，決策參與人認為對手欲置自己于最不利的狀態，所以，博弈決策參與人要通過對方案進行選擇以謀求收益的最大化，這樣做的結果反而使博弈各方最終選擇了對自己較劣的策略，并造成了對集體利益的嚴重破壞[4]。圖書館與數據庫商之間進行的數據庫買賣的交易活動，實質上就是一種雙方利益的博弈，在雙方博弈的過程中，每一方既可以采用合作的策略，也可以采用不合作的策略，為表述方便，將雙方博弈情況用圖1說明。如果一方合作、另一方不合作：合作方得1分，不合作方得5分；雙方都合作：各得4分；雙方都不合作：各得2分。

從社會整體效用的視角可以看出：（4，4）>（5，1）>（1，5）>（2，2）。可見，圖書館與數據庫商都選擇合作策略時，社會整體效用最大；但圖書館與數據庫商都選擇“不合作”策略，這對雙方來說都是超優策略，即最符合他們個體理性的選擇，按照博弈論的說法，這是惟一的納什均衡點（不合作，不合作）。除了這個納什均衡點，圖書館與數據庫商任何一方單方面改變策略選擇，只會使其得到更加不經濟的結果[6]。而在其它的策略組合中，比如雙方都選擇“合作”策略的情況下，都存在其中一方可以通過單方面改變策略選擇，來增大自己的效用的機會，因此，策略組合（合作，合作）顯然不是納什均衡點，不可能會被自動實施。圖書館與數據庫商經過理性分析后，肯定選擇惟一的納什均衡點（不合作，不合作），即雙方博弈陷入“囚徒困境”。

13 “囚徒困境”的后果

分析圖1圖書館與數據庫商競爭博弈的效用矩陣可知，圖書館和數據庫商都選擇“不合作”策略，這對雙方來說都是超優策略，即最符合他們個體理性的選擇，按照博弈論的說法，這是惟一的納什均衡點（不合作，不合作）。圖書館和數據庫商經過一番理性計算后，肯定選擇惟一的納什均衡點（不合作，不合作），以為圖書館和數據庫商要追求個體效用的最大化，但圖書館與數據庫商單方利益的最大化并非社會整體利益的最優選擇，從本質上看，是一種“沒有效率”均衡狀態，即非“帕累托最優”狀態[7]。所以，圖書館與數據庫商競爭博弈均衡的“囚徒困境”反映的是因個體理性的擴張而導致集體理性的缺失，對整個社會的影響是消極的，極易產生數據庫產業的壟斷和圖書館以及社會公眾的反感，造成社會凈福利的損失。為提高整個社會的信息福利水平，實現社會整體利益的“帕累托改進”，必須思考如何破解圖書館與數據庫商競爭博弈均衡的“囚徒困境”。

2 產生“囚徒困境”的原因

21 經濟人的逐利本性

經濟學鼻祖亞當?斯密認為：“當個人在追求他自己的私利時，市場的看不見的手會導致最佳的經濟后果。”[8]按照亞當?斯密的觀點，人的經濟行為的根本動機是自利，每個人都有權追求自己的利益，沒有自私社會就不會進步。但是“囚徒困境”恰恰表明個體理性不能通過市場導致社會福利水平實現“帕累托最優”狀態，所以說經濟人的逐利本性會導致社會整體利益缺失的“囚徒困境”的惡果，這一點與儒家主張的“財自道生，利緣義取”的觀點相抵觸，即儒家反對個體私利的無限擴張，倡導社會整體公益的提升[9]。佛家講因果律，從“囚徒困境”的結果來看，如果個體一味地想算計別人，算來算去，最后必然導致自身效用的喪失，“機關算盡太聰明，反誤了卿卿性命”用在“囚徒困境”的結局是再恰當不過的了。如圖2所示，圖書館追求社會公共權利的擴張，而數據庫商追求個人私權利的擴張。X軸代表數據庫商追求的個人私權利，Y軸代表圖書館追求的社會公共權利，M點代表絕對追求社會公共權利，N點代表絕對追求個人私權利，并且a=b。圖書館與數據庫商雙方都希望實現自身追求的權利的最大擴張，但是，雙方權利都實現最大擴張卻不可能存在，及M點與N點不可能重合。正如英國經濟學家科斯主張：不同權利之間不存在絕對清晰的界限，在法律保護一種權利時，必定會損害另一種權利[10]。因此，當圖書館與數據庫商都想擴張自身權利的同時，必然導致雙方都受損的“負和博弈”結果，即數據庫商與圖書館雙方的利益都受損的“囚徒困境”結局。

22 對合作共贏前景的不信任

從圖書館與數據庫商博弈均衡的“囚徒困境”來看，圖書館與數據庫商競爭博弈的納什均衡，從本質上看，是一種“沒有效率”的均衡狀態，即圖書館與數據庫商單方利益的最大化并非社會整體利益的最優選擇，我們有必要對這種（不合作，不合作）的納什均衡進行帕累托改進。

根據意大利經濟學家維弗雷多?帕累托的觀點：在未達到“帕累托最優”狀態前，能夠朝著“帕累托最優”狀態方向前進的行為，叫作“帕累托改進”[7]。圖書館與數據庫商博弈的帕累托最優狀態，無疑是圖書館與數據庫商追求的目標，但在現實的圖書館與數據庫商的協同競爭中，帕累托最優狀態往往難以實現，因為按照帕累托最優的標準，實行“帕累托改進”是要在絕對公平的前提下不斷提高效率，而圖書館與數據庫商代表著兩種利益的博弈，圖書館代表信息公權，數據庫商代表信息私權，如果做到絕對公平的“帕累托最優”，那么對數據庫版權保護的保護力度在圖2中只能保持在P點（因為a=b），但圖書館與數據庫商都明白這種絕對公平的“帕累托最優”是很難實現的，即使在某一時刻實現了，也是不穩定的，基于這種對“帕累托最優”狀態實現的認識，雙方都不可避免地力圖擴張自身權利，因此“囚徒困境”結局必然產生[11]。

3 “囚徒困境”的破解

31 破解“囚徒困境”的可能性

20世紀初，意大利經濟學家維弗雷多?帕累托提出“帕累托最優”狀態的概念：如果一個人可以在不使任何其他人的處境變差的前提下而使自己的處境變得更好，那么，這種狀態就是“帕累托最優”狀態[12]。圖書館與數據庫商合作雙贏的理想狀態應該是帕累托最優狀態，即福利經濟學中資源分配的理想狀態。按照帕累托標準來分析圖書館與數據庫商的博弈問題，必須兼顧雙方利益，才是最有效率的，如果以損害一方利益為代價，來改善另一方利益的方法實質上是沒有效率的。設定以下經濟模型：Z代表圖書館追求的社會整體利益，G代表數據庫商追求的私人利益，X軸代表對數據庫的保護力度，C（x）代表數據庫版權保護所付出的成本，則有函數圖像如圖3所示。

圖3 圖書館與數據庫商合作博弈的理想狀態[5]

觀察圖3的函數圖像可以看出，私人利益G的函數曲線隨著保護力度的增大而增大，并趨于正比例上升，所以，隨著對數據庫保護力度的增加，數據庫商的私人利益會逐漸增大。用x表示X軸上的任意一點，當xx′時，代表社會整體利益的Z曲線隨x值的增大而下降，例如，代表數據庫商私人利益曲線G與代表社會整體利益的曲線Z的交點r，就表示因對數據庫版權的過度保護而導致社會整體利益下降的狀態。只有當x=x′時，才能做到既保護了數據庫商的私人利益，又實現了圖書館追求的社會整體利益的最大化，因為x′點對應的y′值是曲線Z的波峰值，是使邊際產出MZ（x′）等于邊際成本MC（x′）的社會利益點，也是圖書館追求的社會利益Z與數據庫追求的私人利益G之差最大化的點，當x=x′時，Z（x′）-G（x′）≥Z（x）-G（x），即當x=x′時，Q（x′，y′）點獲得的總效用不低于其他各點時獲得的總效用[13]。因此，x′值代表對數據庫版權保護的帕累托最優狀態，x′值體現了圖書館與數據庫商合作博弈公平與效率的理想狀態，因為當保護力度x=x′時，做到了既保障了社會整體利益又保障了數據庫商的私人利益，即既能保障圖書館用戶對數據庫信息內容的獲取，又不會影響數據庫商的私人利益，因此，對數據庫的保護力度值x

32 破解“囚徒困境”的必然性

圖書館代表的社會公權與數據庫商對數據庫資源的合理收費并不矛盾，相反，對數據庫資源適當收費可以實現信息價值的貨幣化，減緩數據庫開發的成本壓力，改善數據庫資源的供給結構，使圖書館的用戶可以獲得更好、更多的數據庫信息內容。由于數據庫產品的特點是高固定成本，低邊際成本，因此不能用邊際成本作為對數據庫定價的標準，而必須按照用戶對數據庫價值的評價來定價[14]。但是，多數數據庫商忽略用戶對數據庫價值的評價，為了實現自身收益的最大化，不當使用數據庫銷售定價策略，對數據庫產品定價過高，引發了與圖書館之間的矛盾。觀察圖2可知：當線段OP到達P（a，b）點后，如果數據庫商繼續通過提高數據庫產品的價格來擴大自身收益，必然會引起圖書館所代表的公共利益的下降，引起圖書館界的不滿而采用聯合抵制行為，即圖書館與數據庫商之間的博弈由合作狀態轉向競爭狀態，數據庫商追求的私人利益反而不會兌現，如圖1所示的納什均衡的“囚徒困境”凸顯，雙方博弈的均衡結果是圖1中的（不合作，不合作）策略組合，顯然，雙方都沒有實現自身收益的最大化，最終的結果卻是兩敗俱傷。

羅伯特?愛克斯羅德教授在研究人類合作之前，設定了兩個前提：第一，人都是自私的；第二，個人決策不受權威干涉。也就是說，個體能夠按照自身利益最大化的企圖進行決策，這完全遵循博弈論的基本思想。愛克斯羅德為了研究：人為什么要合作？人在什么時候選擇合作？什么時候選擇不合作等問題設計了一種游戲，邀請社會各界的專家參加游戲程序的設計。這個游戲共分兩輪，第一輪游戲共15個程序參加，運轉了200次，結果是加拿大學者羅伯布編寫的針鋒相對策略的游戲程序獲勝，針鋒相對（tit-for-tat）策略即“胡蘿卜加大棒策略”。針鋒相對策略向我們證明一個純粹自利的人也可以選擇善，因為合作是自我利益最大化的一種必要手段[15]。因此，只要圖書館與數據庫商建立持久數據庫交易關系，雙方都會基于維持自身聲譽的原則盡量不首先選擇不合作策略，以免承擔道德壓力和法律制裁，這樣基于長遠合作利益的角度，雙方具有合作的動力。根據以上的分析可知，只要圖書館與數據庫商的數據庫交易關系建立長效機制，力爭博弈重復無窮次，使得雙方清楚：數據庫的交易是長期合作行為，任何方偷偷實行了“不合作”策略，將會得到對方報復，偷偷實行了“不合作”策略的一方的長期效用將會小于選擇“合作”策略時的長期效用，在長期的動態博弈中，如果圖書館與數據庫商都采用針鋒相對策略，博弈的結局也就是納什均衡點將是雙方都選擇“合作”策略，此時圖書館與數據庫商的博弈必然走出“囚徒困境”。

33 破解“囚徒困境”的策略

331 圖書館主動維護數據庫版權

合作是文明的基礎，哲學家盧梭的《社會契約論》指出契約是合作基礎，數據庫版權保護條例本身就是一種契約，只要圖書館遵守數據庫版權保護規定，“囚徒困境”自然就會破解。觀察圖2可知，線段OP表示圖書館與數據庫商之間的合作關系，此時雙方追求的個人私權和社會公共權可以同時實現。根據圖3的函數圖像也可知：當x

332 數據庫商主動讓渡版權收益

基于卡爾多-希克斯效率的“帕累托改進”模式，即數據庫商要制定合理的定價策略，數據庫價格過高時要適當降價，主動讓渡版權收益[16]。正如國外學者的觀點：“公共信息的利用應該在透明和合理的價格機制下通過各種技術形式和許可方式來提高獲取和再利用。”[17]所以，數據庫商即使從擴大自身收益的視角看，也必須考慮制定合理的定價策略，必須考察作為公益事業單位的圖書館的經濟承受能力，必要時要合理降價，特別是針對眾多圖書館的集團購買行為，數據庫商更要合理降價。由此看來，對數據庫產品采取合理的定價方式，并且必要時合理降價，一方面可以對數據庫商版權的獨占性進行保護；另一方面，可以促進圖書館用戶對數據庫內容的有效獲取和應用，避免因數據庫版權的過度保護而導致知識傳播與科技發展的障礙，充分降低數據庫版權過度保護的消極作用，破解博弈的“囚徒困境”。

333 依法約束雙方的行為

西方哲學家盧梭說過：究竟是什么使人類找到一種方法，通過強迫人們服從，從而使他們獲得自由[18]？法律作為一種機制設計，其本身就代表多方利益的博弈，在對數據庫保護的執法實踐中必須堅持權利規制和權利保護并重的原則，即在依法保障數據庫商充分行使其數據庫的知識產權的同時，要有效制止和懲戒其權利濫用行為[19]。如圖3所示，當x

334 采用合理補償機制

經濟學家卡爾多和希克斯在對“帕累托最優”標準進行研究的基礎上，提出了卡爾多-希克斯補償效率標準。卡爾多-希克斯效率的含義是：可以使一些人受損，另一些人受益，但總體收益要大于損失，并且可以用獲得的收益對所受到的損失進行補償，以實現社會總福利的增加[12]。由此看來，卡爾多-希克斯補償理論是一種次優的平衡。雖然理論上“帕累托最優”標準是協調圖書館與數據庫商競爭與協同關系的理想目標，但從實踐上看，卡爾多-希克斯補償效率標準更具有實際應用的價值。如圖2所示，線段OP部分既保證了圖書館的公權又保護了數據庫商的私權，從O（0，0）點到P（a，b）點是一個“帕累托改進”過程，P（a，b）點是“帕累托最優”狀態，即P（a，b）點再也無法依據“帕累托最優”標準進行“帕累托改進”。線段PM代表圖書館的公權大于數據庫商的私權，雖然線段PM強調圖書館的公權必定會侵犯數據庫商的私權，但卻有利于社會整體信息福利的增加，如果能夠從社會整體信息福利增加的結果中對數據庫商給予適度的補償，這無疑就是一種基于卡爾多-希克斯效率的“帕累托改進”，是一種次優的平衡，是現實的“帕累托改進”路徑，同時自然也會破解雙方博弈的“囚徒困境”。

335 促進信息的有效溝通

雖然數據庫商與圖書館之間的矛盾與沖突蘊含著個體利益與社會整體利益之間的博弈，但是二者之間并不是不可調和的敵對關系，因此，數據庫商與圖書館之間都不希望出現雙方都受損的“囚徒困境”結果。為了避免“囚徒困境”的結局出現，雙方之間必須建立有效的信息溝通渠道，主動協調利益關系：要讓對方清楚，自身首先要善意而不是惡意地對待他方，但是一旦發現他方采取了不合作策略，也會斬釘截鐵地進行報復，這樣的結果必然是形成兩敗俱傷的“囚徒困境”。通過有效的溝通讓對方了解己方的態度，必然會減少因信息溝通不暢而導致的誤解，避免出現錯誤的策略選擇。因此，只要數據庫商與圖書館都有明晰的個性和坦誠的態度對待雙方的合作，能夠在數據庫的交易活動中及時溝通，相互體諒，消除誤會，必然會走出博弈的“囚徒困境”。

參考文獻

[1]李明德，許超.著作權法[M].北京：法律出版社，2003：27.

[2]張偉君.版權保護對信息獲取的制約及其反壟斷法規制[J].信息網絡安全，2009，（2）：56-59.

[3]張偉君.版權擴張對信息獲取的影響及其反壟斷法規制[J].科技與法律，2006，（1）：32-35.

[4]Geoffroy de clippel.Values for Cooperative Games with in Complete Information：An Eloquent Example[J].Journal of Translation From Foreign Literatures of Economics，2006，（1）：73-82.

[5]孫瑞英.網絡信息資源共享與版權保護的博弈雙贏研究[J].情報理論與實踐，2013，（12）：30-34.

[6]孫瑞英，馬海群.文獻信息資源共享的博弈分析及管理機制設計研究[J].情報資料工作，2009，（2）：40-41.

[7]李紹榮.帕累托最優與一般均衡最優之差異[J].經濟科學，2002，（2）：75-80.

[8]李黎力，張紅梅.亞當?斯密“看不見的手”及其批判述評[J].經濟與管理評論，2014，（9）：31-36.

[9]張紅明，朱麗賢.商業倫理的中西方比較研究[J].經濟經緯，2005，（6）：143-146.

[10]熊艷玲.論版權保護與信息資源共享的利益沖突及平衡[D].湘潭：湘潭大學碩士論文，2004：16.

[11]高月蘭.對“帕累托最優”的倫理詰問[J].河北理工大學學報：社會科學版，2005，（8）：18-20.

[12]朱富強.效率原則是否為指度制度改革的合理原則――社會總效率和帕累托效率的實踐后果解析[J].制度經濟學研究，2010，（6）：185-207.

[13]斯蒂格利茨.經濟學：上冊[M].第3版.北京：中國人民大學出版社，2005：214-229.

[14]萬靜.電子期刊定價研究[J].情報理論與實踐，2008，（3）：344-346.

[15]王則柯.新編博弈論平話[M].北京：中信出版社，2003：18-27.

[16]陳傳夫，等.圖書館知識產權管理方案優化研究[J].國家圖書館學刊，2009，（2）：23-27.

[17]竇曦騫.淺析電子文獻產品的定價模式[J].情報理論與實踐，2008，（5）：675-679.

[18]高全喜.法律與自由[J].學海，2006，（2）：86-102.

相關期刊

五月激情开心网,五月天激情社区,国产a级域名,婷婷激情综合,深爱五月激情网,第四色网址

博弈最優策略優選九篇

第1篇

第2篇

第3篇

第4篇

第5篇

第6篇

第7篇

第8篇

第9篇

博弈雙贏模式下的企業績效考核探析

博弈理論論文

博弈論論文

博弈論方法

博弈論的構成要素

反壟斷研究

咨詢與決策

東亞評論