基于動(dòng)態(tài)認(rèn)知邏輯的博弈剔除算法研究及模型檢測(cè).pdf_第1頁(yè)
已閱讀1頁(yè),還剩115頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論研究的核心就是尋找博弈問(wèn)題的解。各種重復(fù)剔除算法對(duì)于快速約簡(jiǎn)博弈模型、尋找合理置信的納什均衡具有極為重要的意義。傳統(tǒng)的博弈分析框架總是假定:博弈中的選手是貝葉斯理性的(Bayesian Rational),并且“每個(gè)選手是理性的”是選手之間的公共知識(shí)(common knowledge)。然而,博弈論本身并沒(méi)有顯性地表達(dá)主體的認(rèn)知成分,自然也就不能精確模型主體間認(rèn)知交互的高階信息(higher-order information)變

2、化,從而導(dǎo)致利用某些經(jīng)典的重復(fù)剔除算法求解均衡時(shí)出現(xiàn)認(rèn)知悖論,阻礙了博弈論的進(jìn)一步發(fā)展和完善。同時(shí),盡管模型檢測(cè)技術(shù)作為有限狀態(tài)系統(tǒng)的自動(dòng)化驗(yàn)證技術(shù)已得到廣泛應(yīng)用,并且也越來(lái)越多地在多主體系統(tǒng)(Multi-Agent Systems,簡(jiǎn)記為MAS)等人工智能領(lǐng)域得到重視,但應(yīng)用動(dòng)態(tài)模型檢測(cè)工具判定博弈認(rèn)知邏輯系統(tǒng)性質(zhì)、博弈中選手認(rèn)知狀態(tài)的屬性等方面的工作在國(guó)際上尚無(wú)研究涉及,這必然會(huì)成為基于博弈論研究多主體系統(tǒng)建模技術(shù)的發(fā)展障礙。

3、>   本文首先分析了策略式博弈中各種重復(fù)剔除算法的邏輯認(rèn)知基礎(chǔ),系統(tǒng)地比較了幾種常見(jiàn)剔除算法之間的強(qiáng)弱關(guān)系,并闡明了對(duì)于迅速化簡(jiǎn)博弈、精煉納什均衡、尋求更為合理置信博弈解等方面都有著明顯優(yōu)勢(shì)的重復(fù)可允許算法(Iterated Admissibility)的邏輯研究和認(rèn)知分析的重要意義。其次,基于可能世界語(yǔ)義的Kripke結(jié)構(gòu),我們分別構(gòu)建了用于描述純策略型靜態(tài)博弈認(rèn)知結(jié)構(gòu)和混合策略型博弈認(rèn)知結(jié)構(gòu)的公理化邏輯系統(tǒng)ELG和PEGL(Po

4、rbability Epistemic Game Logic)。在這兩個(gè)系統(tǒng)中,定義出一種更為直觀、更符合現(xiàn)實(shí)生活中選手博弈時(shí)的理性概念,且嚴(yán)格形式化地證明了這種理性概念作為博弈選手問(wèn)公共知識(shí)所導(dǎo)致的認(rèn)知結(jié)果和作為公開(kāi)宣告事實(shí)時(shí)所導(dǎo)致的宣告極限都是與IA算法簡(jiǎn)求解博弈所取得的結(jié)果完全一致。因此,我們從靜態(tài)和動(dòng)態(tài)兩種不同認(rèn)知角度為該算法求解博弈所得的均衡提供了合理置信的認(rèn)知解釋?zhuān)⒂行У乜朔嗽撍惴ū澈蟮恼J(rèn)知悖論。最后,基于動(dòng)態(tài)認(rèn)知模型檢

5、測(cè)工具DEMO(Dynamic EpistemicModeling),我們開(kāi)發(fā)了動(dòng)態(tài)認(rèn)知博弈檢測(cè)工具DEMOGAME。利用它可以檢測(cè)策略式博弈認(rèn)知系統(tǒng)的性質(zhì)以及判定博弈中選手認(rèn)知狀態(tài)的屬性。實(shí)例表明該工具是有效的,同時(shí)通過(guò)它也成功驗(yàn)證了我們理論成果的正確性。因此,本文研究成果不僅進(jìn)一步促進(jìn)了認(rèn)知博弈論的發(fā)展和完善,而且擴(kuò)展和豐富了當(dāng)前的多主體體系統(tǒng)模型檢測(cè)技術(shù)。其主要意義體現(xiàn)在以下幾個(gè)方面:
   1)厘清了博弈論中常見(jiàn)剔除算法

6、之間的強(qiáng)弱關(guān)系;
   2)構(gòu)建了描述策略式博弈認(rèn)知結(jié)構(gòu)的邏輯系統(tǒng)ELG和PEGL。基于這些系統(tǒng),結(jié)合本文提出理性定義,形式化證明了:這種理性概念作為博弈選手間公共知識(shí)所導(dǎo)致的認(rèn)知結(jié)果,與利用重復(fù)可允許算法化簡(jiǎn)求解博弈的結(jié)果是完全吻合,從而為該算法提供了合理置信的認(rèn)知基礎(chǔ),并避免了該算法背后的認(rèn)知悖論。
   3)通過(guò)嚴(yán)格證明我們所定義的理性可以用作公開(kāi)宣告邏輯PAL(PublicAnnouncement Logic)的

7、宣告事實(shí),進(jìn)一步表明重復(fù)宣告新的理性斷定所產(chǎn)生的宣告極限也是與IA算法求解博弈的結(jié)果完全一致。從而,動(dòng)態(tài)地刻畫(huà)了IA算法,更為明晰形象地闡明了IA算法的認(rèn)知基礎(chǔ);
   4)基于動(dòng)態(tài)認(rèn)知模型檢測(cè)工具DEMO,開(kāi)發(fā)了可以用于檢測(cè)雙人靜態(tài)博弈認(rèn)知系統(tǒng)性質(zhì)、判定博弈中選手認(rèn)知狀態(tài)屬性的動(dòng)態(tài)認(rèn)知博弈模型檢測(cè)工具DEMOGAME,并用此工具驗(yàn)證了我們理論研究成果的正確性,充分體現(xiàn)我們研究成果的實(shí)用價(jià)值。
   5)對(duì)DEMOGAM

8、E稍加改動(dòng),我們還成功實(shí)現(xiàn)了利用該工具驗(yàn)測(cè)博弈論中經(jīng)典的重復(fù)剔除嚴(yán)格劣策略LESD(Iterated Elimination ofStrictly Dominated Strategies)算法、可理性化(Rationalizability)算法等結(jié)果是否與文[1]中定義的理性主體所做出的認(rèn)知預(yù)測(cè)結(jié)果相一致,并通過(guò)實(shí)例表明DEMOGAME還可用于求解雙人有限策略式博弈均衡,找出博弈中所有的均衡解以及博弈認(rèn)知系統(tǒng)性質(zhì)等問(wèn)題的判定。

9、   以邏輯為工具研究博弈理論的博弈邏輯和多主體體系統(tǒng)模型檢測(cè)技術(shù)的研究不僅有重要的理論意義,還有重大的實(shí)際應(yīng)用價(jià)值。本文是多主體互動(dòng)理論邏輯建模和模型檢測(cè)的一些階段性成果。今后,我們將在此基礎(chǔ)上,深入研究PEGL系統(tǒng),尋找高效的模型檢測(cè)算法,以實(shí)現(xiàn)具有模型檢測(cè)混合策略型博弈認(rèn)知結(jié)構(gòu)性質(zhì)的判定工具。同時(shí),將研究拓展到擴(kuò)展式博弈研究領(lǐng)域,嘗試構(gòu)建可以用于描述和刻畫(huà)擴(kuò)展式博弈認(rèn)知結(jié)構(gòu)的公理化系統(tǒng),以期消解動(dòng)態(tài)博弈求解的經(jīng)典算法——后向歸納

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論