公司名稱(chēng)-智能科學(xué)網(wǎng)站_第1頁(yè)
已閱讀1頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于KDD的知識(shí)自動(dòng)獲取及其應(yīng)用,答 辯 人:黃 瑞指導(dǎo)教師:趙遠(yuǎn)東 副教授 史忠植 研究員,,,主要內(nèi)容,一、研究背景及意義二、基于KDD的知識(shí)自動(dòng)獲取模型概述三、基于知識(shí)庫(kù)的KDD四、自動(dòng)演化知識(shí)庫(kù)五、模型在自動(dòng)化測(cè)井?dāng)?shù)據(jù)分析中的應(yīng)用六、總結(jié)與展望,,,,研究背景及意義,知識(shí)獲取研究概述知識(shí)獲取的基本過(guò)程知識(shí)獲取研究的主要內(nèi)容知識(shí)自動(dòng)獲取研究發(fā)展KDD (Knowledge Discover

2、y in Databases)研究概述KDD的基本過(guò)程KDD的主要任務(wù)數(shù)據(jù)挖掘的常用方法KDD的應(yīng)用本文的研究目的,,,,知識(shí)獲取的基本過(guò)程,人類(lèi)學(xué)習(xí)知識(shí)的基本過(guò)程,,,,,基礎(chǔ)知識(shí)學(xué)習(xí)(固化記憶),,,生產(chǎn)實(shí)踐(總結(jié)經(jīng)驗(yàn)),知識(shí)的發(fā)展與完善(新、舊知識(shí)融合),循環(huán),,,知識(shí)獲取的基本過(guò)程,知識(shí)獲取的基本過(guò)程,,知識(shí)工程師從知識(shí)源抽取知識(shí)存入知識(shí)庫(kù),通過(guò)機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘工具從實(shí)踐數(shù)據(jù)中獲得新知識(shí),由知識(shí)工程師和領(lǐng)域?qū)<?/p>

3、配合更新知識(shí)庫(kù),,,,循環(huán),人類(lèi)學(xué)習(xí)知識(shí)的基本過(guò)程,,,知識(shí)獲取的基本過(guò)程,人類(lèi)學(xué)習(xí)知識(shí)的基本過(guò)程,,知識(shí)獲取的基本過(guò)程,,,知識(shí)獲取研究的主要內(nèi)容,知識(shí)抽取,,知識(shí)建模,知識(shí)轉(zhuǎn)換,知識(shí)檢測(cè),知識(shí)的組織與管理,,,知識(shí)自動(dòng)獲取研究發(fā)展,非自動(dòng)的知識(shí)獲取,,自動(dòng)知識(shí)獲取,,,知識(shí)自動(dòng)獲取研究發(fā)展,運(yùn)用機(jī)器學(xué)習(xí)方法構(gòu)建知識(shí)庫(kù)Okamura 等人的鋼鐵工藝生產(chǎn)專(zhuān)家系統(tǒng)Yamamoto 等人的高爐配料操作自動(dòng)知識(shí)獲取系統(tǒng)中科院合肥智能所的

4、農(nóng)業(yè)病蟲(chóng)害專(zhuān)家系統(tǒng),,運(yùn)用機(jī)器學(xué)習(xí)方法增強(qiáng)知識(shí)庫(kù)的自適應(yīng)能力吳榮根教授的基于模型的數(shù)字電路設(shè)計(jì)系統(tǒng)Elliott.和Schneider 的故障分離專(zhuān)家系統(tǒng),擁有自學(xué)習(xí)能力的知識(shí)編輯器Wheeler 和Schneider 的知識(shí)自動(dòng)獲取工具AUTOKNAQ,,,知識(shí)自動(dòng)獲取研究發(fā)展,利用KDD技術(shù)從數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)新知識(shí)Mitchell 等人的燃?xì)鉁u輪機(jī)故障檢測(cè)TIGON系統(tǒng)Takano 等人的可自動(dòng)生成操作序列的范例學(xué)習(xí)工具,,

5、擴(kuò)大到了知識(shí)管理、Web知識(shí)獲取等領(lǐng)域,引入了本體學(xué)習(xí)、語(yǔ)義Web等概念與技術(shù)KAON工具套件中的TEXT-TO-ONTO工具Henk-Jan Lebbink等人的基于本體的知識(shí)系統(tǒng)Joerg-Uwe Kietz等人的自動(dòng)本體獲取Paulo Gottgtroy等人研究了動(dòng)態(tài)領(lǐng)域中的知識(shí)發(fā)現(xiàn)問(wèn)題清華大學(xué)的基于語(yǔ)義Web的本體數(shù)據(jù)挖掘平臺(tái)中科院計(jì)算所的綜合知識(shí)管理平臺(tái)CKMP,,,知識(shí)自動(dòng)獲取研究發(fā)展,存在的問(wèn)題,,循環(huán),環(huán)境

6、/背景知識(shí)不斷變化,自動(dòng)進(jìn)行,?,,,KDD的基本過(guò)程,,KDD從大量數(shù)據(jù)中提取出可信的、新穎的、有用的且可以被人理解的模式的高級(jí)處理過(guò)程五個(gè)步驟為:數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、模式解釋/評(píng)價(jià),,,KDD的主要任務(wù),關(guān)聯(lián)分析分類(lèi)聚類(lèi)預(yù)測(cè)時(shí)序模式偏差檢測(cè)空間數(shù)據(jù)挖掘 Web數(shù)據(jù)挖掘,,,,數(shù)據(jù)挖掘的常用方法,關(guān)聯(lián)規(guī)則挖掘決策樹(shù)方法統(tǒng)計(jì)方法粗糙集方法人工神經(jīng)網(wǎng)絡(luò)遺傳算法,,,,KDD的應(yīng)用,數(shù)據(jù)挖

7、掘和知識(shí)發(fā)現(xiàn)系統(tǒng)IBM Almaden研究中心的Quest加拿大Simon Fraser大學(xué)的DBMinerAT&T實(shí)驗(yàn)室的IMACS和Spotlight中科院計(jì)算所的MSMiner,,作為知識(shí)獲取工具Bohanec等人的決策支持工具DEXIBM Watson研究中心開(kāi)發(fā)的SEAS專(zhuān)家系統(tǒng)明確提出了“基于知識(shí)的數(shù)據(jù)挖掘”這一概念,,,?,KDD的應(yīng)用,存在的問(wèn)題,,知識(shí)庫(kù),KDD工具,,,知識(shí)工程師&領(lǐng)域?qū)<?/p>

8、,發(fā)現(xiàn),融合,先驗(yàn)知識(shí),,,?,,,本文的研究目標(biāo),背景:中澳科技合作特別資金項(xiàng)目“數(shù)據(jù)挖掘技術(shù)在石油天然氣勘探開(kāi)發(fā)工程中的應(yīng)用”問(wèn)題:動(dòng)態(tài)環(huán)境下基于KDD的知識(shí)自動(dòng)獲取方法:從研究基于知識(shí)庫(kù)的KDD出發(fā),將知識(shí)庫(kù)中的知識(shí)作為先驗(yàn)知識(shí)引入KDD過(guò)程;進(jìn)而研究知識(shí)庫(kù)的自動(dòng)演化機(jī)制,將KDD過(guò)程發(fā)現(xiàn)的新模式與知識(shí)庫(kù)中的原有知識(shí)進(jìn)行自動(dòng)的知識(shí)檢測(cè)與融合目標(biāo):自動(dòng)進(jìn)行基于KDD的知識(shí)獲取循環(huán),,,,基于KDD的知識(shí)自動(dòng)獲取模型,,,,模型

9、結(jié)構(gòu),,,,主要子系統(tǒng),約束生成從知識(shí)庫(kù)自動(dòng)產(chǎn)生對(duì)KDD過(guò)程的約束輸入:知識(shí)庫(kù)和KDD模塊的參數(shù)輸出:對(duì)KDD過(guò)程的約束基于約束的KDD數(shù)據(jù)選擇:依據(jù)相應(yīng)的約束選出相關(guān)數(shù)據(jù)數(shù)據(jù)預(yù)處理:篩選掉非法的記錄并補(bǔ)齊缺失值數(shù)據(jù)挖掘:基于約束的規(guī)則挖掘解釋/評(píng)價(jià):根據(jù)規(guī)則的支持度、置信度、并結(jié)合其滿(mǎn)足約束的程度對(duì)目標(biāo)規(guī)則集進(jìn)行處理,,,,主要子系統(tǒng),知識(shí)庫(kù)管理對(duì)所發(fā)現(xiàn)的新知識(shí)與知識(shí)庫(kù)中的原有知識(shí)進(jìn)行一致性檢測(cè)和完整性檢測(cè),并對(duì)不一

10、致和不完整的情況自動(dòng)進(jìn)行處理知識(shí)應(yīng)用將知識(shí)庫(kù)中的知識(shí)應(yīng)用于實(shí)際的運(yùn)行過(guò)程,并從外界獲得反饋,與運(yùn)行結(jié)果進(jìn)行比較,計(jì)算誤差,激發(fā)下一輪基于KDD的知識(shí)獲取過(guò)程兩個(gè)誤差閾值:平均誤差閾值和嚴(yán)重錯(cuò)誤閾值在KDD等過(guò)程中,知識(shí)庫(kù)不變且保持可用,知識(shí)庫(kù)更新后也可以立即應(yīng)用,,,,相關(guān)工作比較,利用KDD過(guò)程輔助知識(shí)自動(dòng)獲取的方法運(yùn)用KDD過(guò)程從實(shí)際案例中發(fā)現(xiàn)知識(shí)建立知識(shí)庫(kù)或驗(yàn)證知識(shí)庫(kù)中的現(xiàn)有知識(shí)將KDD過(guò)程發(fā)現(xiàn)的知識(shí)自動(dòng)融入知識(shí)庫(kù)存

11、在的問(wèn)題需要進(jìn)行繁瑣的手工操作KDD獨(dú)立于現(xiàn)有知識(shí)本文模型的優(yōu)點(diǎn)利用KDD過(guò)程的發(fā)現(xiàn)結(jié)果建立和完善知識(shí)庫(kù)利用知識(shí)庫(kù)中的現(xiàn)有知識(shí)指導(dǎo)KDD過(guò)程進(jìn)行,,,,基于知識(shí)庫(kù)的KDD,基本思想根據(jù)一定的約束生成機(jī)制自動(dòng)從知識(shí)庫(kù)中生成約束,這些約束在一定程度上反映了知識(shí)庫(kù)中的現(xiàn)有知識(shí)利用這些約束指導(dǎo)KDD過(guò)程的進(jìn)行,實(shí)現(xiàn)基于約束的數(shù)據(jù)挖掘,即相當(dāng)于利用知識(shí)庫(kù)中的現(xiàn)有知識(shí)指導(dǎo)了KDD過(guò)程的進(jìn)行整個(gè)約束生成和基于約束的KDD過(guò)程都可以自動(dòng)

12、化地進(jìn)行,減少了手工操作的任務(wù)量,極大地提高了模型的工作效率及其實(shí)時(shí)性。,,,,模型知識(shí)庫(kù)中的知識(shí)表示方法,采用面向?qū)ο蟮母拍詈图夹g(shù),吸收了框架理論和語(yǔ)義網(wǎng)絡(luò)的一些特點(diǎn),并融合了產(chǎn)生式規(guī)則表示方法,,,,,關(guān)聯(lián)規(guī)則挖掘,設(shè)I={i1, i2,…, im}是事務(wù)項(xiàng)的集合。設(shè)任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫(kù)事務(wù)的集合,D中的每個(gè)事務(wù)T是一個(gè)事務(wù)項(xiàng)集且滿(mǎn)足 。每一個(gè)事務(wù)有一個(gè)標(biāo)識(shí)TID。設(shè)X是一個(gè)事務(wù)項(xiàng)集,事務(wù)T包含X當(dāng)且僅當(dāng)

13、 。關(guān)聯(lián)規(guī)則是形如 的蘊(yùn)涵式,其中 且規(guī)則的支持度:規(guī)則的置信度:,,,,基于約束的關(guān)聯(lián)規(guī)則挖掘,約束:包括數(shù)據(jù)約束、挖掘的維和層次約束、規(guī)則約束等規(guī)則模板:用來(lái)表示用戶(hù)希望探察或希望證實(shí)的、并且感興趣的規(guī)則模式例:,,數(shù)據(jù)約束“X屬性值必為負(fù)”:規(guī)則約束“挖掘包含原子表達(dá)式(X ?)的規(guī)則,Z為目標(biāo)屬性”:,,,基于知識(shí)庫(kù)的約束自動(dòng)生成,例規(guī)則行:if ((

14、DEN <= 2.111) && (CNL <= 28.866)) then FORMATION = “gas”約束:,,,,模式評(píng)價(jià)策略,結(jié)合支持度、置信度以及規(guī)則約束計(jì)算評(píng)價(jià)系數(shù)滿(mǎn)足約束的程度:,,規(guī)則的評(píng)價(jià)系數(shù):,,,相關(guān)工作比較,結(jié)合領(lǐng)域先驗(yàn)知識(shí)進(jìn)行KDD的方法由知識(shí)工程師從領(lǐng)域?qū)<夷抢镏苯荧@得,并直接硬編碼到應(yīng)用系統(tǒng)之中由用戶(hù)對(duì)KDD過(guò)程指定約束,從而間接將領(lǐng)域知識(shí)和應(yīng)用需求結(jié)合到KD

15、D過(guò)程中去存在的問(wèn)題繁瑣的手工操作本文方法的優(yōu)點(diǎn)提高第二類(lèi)方法的自動(dòng)化程度通過(guò)知識(shí)庫(kù)自動(dòng)生成約束指導(dǎo)KDD過(guò)程的進(jìn)行,,,,自動(dòng)演化知識(shí)庫(kù),目標(biāo):自動(dòng)實(shí)現(xiàn)知識(shí)檢測(cè)與知識(shí)融合,實(shí)現(xiàn)知識(shí)庫(kù)的自動(dòng)演化知識(shí)檢測(cè)需要檢測(cè)知識(shí)庫(kù)中的不一致和不完整等情況知識(shí)融合將不同來(lái)源的多個(gè)知識(shí)集合合并為一個(gè)知識(shí)集合,本文模型中指將KDD過(guò)程發(fā)現(xiàn)的新知識(shí)與模型知識(shí)庫(kù)中的原有知識(shí)合并為新的知識(shí)庫(kù)“演化”一詞表示隨著反復(fù)、自動(dòng)進(jìn)行的知識(shí)獲取過(guò)程,知識(shí)庫(kù)

16、中的知識(shí)也不斷更新和完善,知識(shí)庫(kù)也因而不斷發(fā)展,,,,規(guī)則表示形式,,,,規(guī)則Rule的BNF定義,,,,原子表達(dá)式之間的關(guān)系,定義1: 原子表達(dá)式相等:兩個(gè)原子表達(dá)式運(yùn)算數(shù)相同,且運(yùn)算數(shù)的取值區(qū)間也相同,則稱(chēng)原子表達(dá)式A與B相等,記做A=B。定義2:原子表達(dá)式覆蓋:兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,若A中運(yùn)算數(shù)的取值區(qū)間包括了B中運(yùn)算數(shù)的取值區(qū)間,則稱(chēng)原子表達(dá)式A覆蓋原子表達(dá)式B,記做 ,或者稱(chēng)原子表達(dá)式B被原子表

17、達(dá)式A覆蓋,記做 。當(dāng)A、B不相等時(shí),該關(guān)系變成 ,即 。定義3: 原子表達(dá)式交叉:兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,若A、B中運(yùn)算數(shù)的取值區(qū)間既有相同的部分,也都有不同的部分,則稱(chēng)原子表達(dá)式A與B交叉,記做A&B。,,,,原子表達(dá)式之間的關(guān)系,定義4:原子表達(dá)式相異:兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,但A、B中運(yùn)算數(shù)的取值區(qū)間沒(méi)有相同的部分,則稱(chēng)原子表達(dá)式A與B相異,記做A∥B。定

18、義5: 原子表達(dá)式互補(bǔ):兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,且A、B中運(yùn)算數(shù)的取值區(qū)間互為補(bǔ)集,則稱(chēng)原子表達(dá)式A與B互補(bǔ),記做A= ,或 B= 。,,,,原子表達(dá)式之間的關(guān)系,運(yùn)算符相同但值不同的原子表達(dá)式之間關(guān)系,,,,原子表達(dá)式之間的關(guān)系,運(yùn)算符不同的原子表達(dá)式之間關(guān)系,,,,表達(dá)式之間的關(guān)系,定義6: 表達(dá)式包括:兩個(gè)表達(dá)式R、S,若R中任意一個(gè)原子表達(dá)式均與S中的某一個(gè)原子表達(dá)式相等,則稱(chēng)表達(dá)式S包括表達(dá)式

19、R,記做 ,或者稱(chēng)表達(dá)式R被表達(dá)式S包括,記做 。定義7: 表達(dá)式相等:兩個(gè)表達(dá)式R、S,若S包括R(即 ),且R也包括S(即 ),則稱(chēng)表達(dá)式R與S相等,記做R=S。定義8: 表達(dá)式覆蓋:兩個(gè)表達(dá)式R、S,若R中任意一個(gè)原子表達(dá)式均被S中的某一個(gè)原子表達(dá)式覆蓋,則稱(chēng)表達(dá)式S覆蓋R,記做 ,或者稱(chēng)表達(dá)式R被S覆蓋,記做

20、 。當(dāng)R與S不相等時(shí),該關(guān)系變成 ,即 。,,,,,表達(dá)式之間的關(guān)系,定義9: 表達(dá)式交叉:兩個(gè)表達(dá)式R、S,對(duì)R中的任意一個(gè)原子表達(dá)式,當(dāng)S中存在與它運(yùn)算數(shù)相同的原子表達(dá)式時(shí),若它與S中這些與它運(yùn)算數(shù)相同的原子表達(dá)式之間,存在交叉關(guān)系,且不存在相異關(guān)系,則稱(chēng)表達(dá)式R與S交叉,記做R&S。定義10: 表達(dá)式相異:兩個(gè)表達(dá)式R、S,對(duì)R中的任意一個(gè)原子表達(dá)式,當(dāng)S中存在與它運(yùn)算數(shù)相同的原子表達(dá)式時(shí),若它

21、與S中這些與它運(yùn)算數(shù)相同的原子表達(dá)式之間存在相異關(guān)系,則稱(chēng)表達(dá)式R與S相異,記做R∥S。,,,,,知識(shí)自動(dòng)檢測(cè),知識(shí)檢測(cè)處理冗余矛盾從屬環(huán)路不完整,,,,基于規(guī)則Rule的知識(shí)自動(dòng)檢測(cè),冗余檢測(cè)與處理知識(shí)冗余:知識(shí)庫(kù)中存在多余的知識(shí)或多余的條件三種情況:等價(jià)規(guī)則、冗余規(guī)則鏈、冗余條件檢測(cè)與處理:等價(jià)規(guī)則:兩條規(guī)則在相同的條件下有相同的結(jié)論;可以直接刪除一條;冗余規(guī)則鏈:兩條規(guī)則鏈中第一條規(guī)則的條件相同,最后一條規(guī)則的

22、結(jié)論也等價(jià);刪除唯一出現(xiàn)的條件,并按需要補(bǔ)充規(guī)則;冗余條件:兩條規(guī)則有相同的結(jié)論,但一條規(guī)則前件中的某些條件與另一條規(guī)則前件中的條件互補(bǔ),而其它條件保持一致;刪除這些互補(bǔ)的多余條件。,,,,基于規(guī)則Rule的知識(shí)自動(dòng)檢測(cè),從屬檢測(cè)與處理知識(shí)從屬:若規(guī)則r1比r2要求更苛刻的條件,或得到更苛刻的結(jié)論,則r1是r2的從屬規(guī)則設(shè)兩條規(guī)則r1: ,r2: ,其中P、Q、R、S為表達(dá)式,若 或

23、 ,且 或 ,則規(guī)則r1是r2的從屬規(guī)則。規(guī)則從屬通常需要領(lǐng)域?qū)<疫M(jìn)行處理,知識(shí)檢測(cè)過(guò)程僅對(duì)其進(jìn)行初步處理,即將其進(jìn)行標(biāo)記,然后由知識(shí)融合進(jìn)行進(jìn)一步處理。,,,,基于規(guī)則Rule的知識(shí)自動(dòng)檢測(cè),矛盾檢測(cè)與處理知識(shí)矛盾:知識(shí)庫(kù)中存在矛盾的知識(shí)或矛盾的結(jié)論兩種情況:矛盾規(guī)則、矛盾規(guī)則鏈檢測(cè)與處理:矛盾規(guī)則:若兩條規(guī)則中某些相同的條件下有不同的結(jié)論,即兩條規(guī)則的條件部分冗余或者從屬

24、,結(jié)論部分卻存在不同(交叉或相異),則稱(chēng)為矛盾規(guī)則;對(duì)其進(jìn)行初步處理;矛盾規(guī)則鏈:若兩條規(guī)則鏈中,第一條規(guī)則的條件部分冗余或者從屬,最后一條規(guī)則的結(jié)論部分卻存在不同(交叉或相異),則稱(chēng)兩條規(guī)則鏈矛盾;仿照矛盾規(guī)則和冗余規(guī)則鏈的處理方法進(jìn)行初步處理。,,,,基于規(guī)則Rule的知識(shí)自動(dòng)檢測(cè),環(huán)路檢測(cè)與處理當(dāng)一組規(guī)則形成一條循環(huán)鏈時(shí),稱(chēng)它們構(gòu)成了一個(gè)環(huán)路如規(guī)則r1: 、r2: 、r3: 、r4:

25、,對(duì)這四條規(guī)則無(wú)論先執(zhí)行哪一條,最終都會(huì)回到出發(fā)點(diǎn),因此它們之間出現(xiàn)了環(huán)路檢測(cè)與處理:從任何一條未經(jīng)過(guò)的規(guī)則出發(fā),沿著規(guī)則鏈表進(jìn)行查找,若找到一條規(guī)則的結(jié)論與前面某條規(guī)則的條件等價(jià),則找到了環(huán)路;當(dāng)知識(shí)庫(kù)中出現(xiàn)環(huán)路時(shí),一般需要領(lǐng)域?qū)<疫M(jìn)行處理,知識(shí)檢測(cè)僅對(duì)其進(jìn)行標(biāo)記,然后由知識(shí)融合進(jìn)行進(jìn)一步處理。,,,,基于規(guī)則Rule的知識(shí)自動(dòng)檢測(cè),不完整與知識(shí)精化知識(shí)不完整可能導(dǎo)致錯(cuò)判和漏判兩種錯(cuò)誤錯(cuò)判:對(duì)給定的不一定產(chǎn)生某一結(jié)論的

26、條件,經(jīng)系統(tǒng)運(yùn)行卻得出了這一結(jié)論漏判:在給定條件下本來(lái)應(yīng)該推出的結(jié)論沒(méi)有推出來(lái)知識(shí)精化的一般方法:用一批已知結(jié)論的實(shí)例考核知識(shí)庫(kù),看有多少實(shí)例被錯(cuò)判及漏判,然后對(duì)知識(shí)進(jìn)行修正本文模型中的方法:通過(guò)知識(shí)應(yīng)用對(duì)知識(shí)庫(kù)進(jìn)行考核,一方面降低知識(shí)庫(kù)中導(dǎo)致錯(cuò)判和漏判的規(guī)則的置信度,另一方面通過(guò)約束指導(dǎo)KDD過(guò)程發(fā)現(xiàn)更多有利于知識(shí)精化的新模式,,,,知識(shí)庫(kù)的自動(dòng)演化過(guò)程,,,,相關(guān)工作比較,傳統(tǒng)的知識(shí)檢測(cè)方法僅在規(guī)則條件這一層次上進(jìn)行檢測(cè),即

27、對(duì)于兩條規(guī)則,僅僅檢查他們的原子表達(dá)式是否相等或互補(bǔ)本文提出的方法除檢查原子表達(dá)式是否相等或互補(bǔ)外,還檢查原子表達(dá)式以及表達(dá)式之間的覆蓋、沖突等關(guān)系,即對(duì)原子表達(dá)式中屬性項(xiàng)的取值范圍進(jìn)行檢測(cè),,,,相關(guān)工作比較,兩種方法對(duì)比例如條件x=0與它互補(bǔ)本文的知識(shí)檢測(cè)方法:條件x-1與它交叉等結(jié)論:本文的知識(shí)檢測(cè)方法在一個(gè)更細(xì)的粒度上進(jìn)行,因此更為精確,通過(guò)檢測(cè)的知識(shí)庫(kù)一致性更好,,,,模型在自動(dòng)化測(cè)井?dāng)?shù)據(jù)分析中的應(yīng)用,測(cè)井?dāng)?shù)據(jù)分析簡(jiǎn)

28、介應(yīng)用數(shù)據(jù)與應(yīng)用需求基于知識(shí)庫(kù)的KDDMSMiner(Multi-Strategies Miner)簡(jiǎn)介基于知識(shí)庫(kù)的KDD自動(dòng)演化知識(shí)庫(kù)OKPS(Object-oriented Knowledge Processing System)簡(jiǎn)介自動(dòng)演化知識(shí)庫(kù),,,,測(cè)井?dāng)?shù)據(jù)分析簡(jiǎn)介,石油天然氣勘探開(kāi)采工程的重要環(huán)節(jié)測(cè)井:從地表到井底測(cè)量鉆井的各個(gè)地層的各種性質(zhì)(包括電、聲、放射性等物理性質(zhì))測(cè)井?dāng)?shù)據(jù):測(cè)井中測(cè)得的各種性質(zhì)的數(shù)

29、據(jù)值測(cè)井?dāng)?shù)據(jù)分析:綜合研究和分析測(cè)井?dāng)?shù)據(jù),并結(jié)合領(lǐng)域相關(guān)知識(shí)預(yù)測(cè)特定鉆井甚至整個(gè)勘探區(qū)域和含烴構(gòu)造帶的油氣層情況和油氣藏類(lèi)別需要進(jìn)行定性分析和定量計(jì)算不同測(cè)井的地層情況不同需要反復(fù)進(jìn)行,,,,應(yīng)用數(shù)據(jù)與應(yīng)用需求,數(shù)據(jù)來(lái)源:新疆境內(nèi)的油田測(cè)井?dāng)?shù)據(jù)表:每一條記錄包含鉆井中一個(gè)特定深度地層的各屬性的實(shí)測(cè)值,共有十維屬性:“DEPTH” 、“CALI” 、“CNL” 、“DEN” 、“GR”、“RI” 、“RT” 、“RXO” 、“S

30、P” 和“AC” 區(qū)塊含油數(shù)據(jù)表:每一條記錄包含鉆井中一個(gè)特定的、已探明油氣層的各屬性的實(shí)測(cè)值,系統(tǒng)中用到的有:“thickness” 、“starting depth” 、“ending depth”和 “Result”應(yīng)用需求不斷從測(cè)井?dāng)?shù)據(jù)和已知油氣層數(shù)據(jù)中學(xué)習(xí),從而可以從測(cè)井?dāng)?shù)據(jù)中預(yù)測(cè)可能包含的油氣層,,,,MSMiner簡(jiǎn)介 ——系統(tǒng)主界面,,,,,MSMiner簡(jiǎn)介——數(shù)據(jù)挖掘子系統(tǒng),,,,,,基于知識(shí)庫(kù)的KDD,設(shè)定K

31、DD過(guò)程各個(gè)步驟的算法及其參數(shù),,,,,基于知識(shí)庫(kù)的KDD,KDD過(guò)程生成的發(fā)現(xiàn)規(guī)則文件例,,,Final hypothesis is:d :- RT>=14.397, CALI=-0.398 (56/0).c :- RT>=7.198, RT>=9.28 (127/0).c :- AC>=94.375, RT>=5.426, SP=8.654 (23/1).c :- RT>=7.198, C

32、NL>=28 (31/6).c :- CALI>=8.966 (6/2).c :- CALI=73.987 (8/1).c :- AC>=101.787 (2/0).default b (494/0).=========================== summary ==========================Train error rate: 1.61% +/- 0.44% (808 da

33、tapoints) <<Test error rate: 66.77% +/- 2.64% (319 datapoints) <<Hypothesis size: 8 rules, 23 conditionsLearning time: 0.98 sec,,,OKPS簡(jiǎn)介 ——KAMT,,,,,OKPS簡(jiǎn)介 ——OOIE,,,,,自動(dòng)演化知識(shí)庫(kù),設(shè)定知識(shí)檢測(cè)與融合時(shí)所需參數(shù),,,,

34、,自動(dòng)演化知識(shí)庫(kù),知識(shí)檢測(cè)與融合,,,,,本文的工作,設(shè)定KDD過(guò)程各個(gè)步驟的算法及其參數(shù)的子系統(tǒng)從知識(shí)庫(kù)自動(dòng)生成約束根據(jù)約束自動(dòng)設(shè)定MSMiner的挖掘任務(wù)自動(dòng)知識(shí)檢測(cè)自動(dòng)知識(shí)融合測(cè)井?dāng)?shù)據(jù)分析主系統(tǒng),,,,,總結(jié)與展望,本文的主要貢獻(xiàn)提出了一種通用的基于KDD的知識(shí)自動(dòng)獲取模型。利用KDD發(fā)現(xiàn)的知識(shí)自動(dòng)完善知識(shí)庫(kù);同時(shí)從知識(shí)庫(kù)中自動(dòng)生成約束指導(dǎo)KDD過(guò)程。該模型在一定程度上減輕了人工操作的負(fù)擔(dān),并可以自適應(yīng)動(dòng)態(tài)變化的環(huán)境。

35、實(shí)現(xiàn)了基于知識(shí)庫(kù)的KDD過(guò)程。提出了在數(shù)值屬性的取值區(qū)間上進(jìn)行知識(shí)自動(dòng)檢測(cè)的方法。提出了結(jié)合規(guī)則支持度、置信度及其滿(mǎn)足約束程度的知識(shí)自動(dòng)融合機(jī)制。,,,,總結(jié)與展望,下一步的工作提高基于約束的KDD系統(tǒng)的創(chuàng)新能力對(duì)約束進(jìn)行評(píng)價(jià)和優(yōu)化,進(jìn)一步提高基于約束的KDD過(guò)程有效性和針對(duì)性平衡模型的魯棒性和對(duì)知識(shí)變化的敏感程度拓展模型的應(yīng)用范圍,進(jìn)一步將模型應(yīng)用于KBS、知識(shí)管理、決策支持、Web知識(shí)獲取等領(lǐng)域,實(shí)現(xiàn)更多動(dòng)態(tài)環(huán)境下的、

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論