

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,1,機器學習,第1章 引言,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,2,什么是機器學習,什么是機器學習計算機程序如何隨著經驗積累自動提高性能系統(tǒng)自我改進的過程歷史成功應用學習識別人類講話學習駕駛車輛學習分類新的天文結構學習對弈西洋雙陸棋,2003.12.18,機器學習-引言 作者
2、:Mitchell 譯者:曾華軍等 講者:陶曉鵬,3,相關學科,人工智能計算復雜性理論控制論信息論統(tǒng)計學,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,4,學習問題的標準描述,定義如果一個計算機針對某類任務T的用P衡量的性能根據經驗E來自我完善,那么我們稱這個計算機程序在從經驗E中學習,針對某類任務T,它的性能用P來衡量。西洋跳棋學習問題的解釋E,和自己下棋T,參與比賽P,
3、比賽成績(或贏棋能力,擊敗對手的百分比)手寫識別學習問題機器人駕駛學習問題,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,5,學習問題的標準描述(2),定義太寬泛甚至包括了以非常直接的方式通過經驗自我提高的計算機程序實際的機器學習問題往往比較復雜定義一類問題探索解決這類問題的方法理解學習問題的基本結構和過程,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾
4、華軍等 講者:陶曉鵬,6,設計一個學習系統(tǒng),基本設計方法和學習途徑(以西洋跳棋為例)選擇訓練經驗選擇目標函數選擇目標函數的表示選擇函數逼近算法最終設計,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,7,設計一個學習系統(tǒng),西洋跳棋學習問題任務T,下西洋跳棋性能標準P,擊敗對手的百分比訓練經驗E,和自己進行訓練對弈學習系統(tǒng)需要選擇要學習的知識的確切類型對于這個目標知識的表
5、示一種學習機制,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,8,選擇訓練經驗,第一個關鍵屬性,訓練經驗能否為系統(tǒng)的決策提供直接或間接的反饋第二個重要屬性,學習器在多大程度上控制樣例序列第三個重要屬性,訓練樣例的分布能多好地表示實例分布,通過樣例來衡量最終系統(tǒng)的性能,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,9,選擇目標函數,目標函數C
6、hooseMoveChooseMove: B?M,接受合法棋局集合中的棋盤狀態(tài)作為輸入,并從合法走子集合中選擇某個走子作為輸出問題轉化我們把提高任務T的性能P的問題轉化(或簡化)為學習像ChooseMove這樣某個特定的目標函數,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,10,選擇目標函數(2),ChooseMove的評價學習問題很直觀地轉化成這個函數這個函數的學習很困難,因為
7、提供給系統(tǒng)的是間接訓練經驗另一個目標函數V一個評估函數,V: B?R,它為任何給定棋局賦予一個數值評分,給好的棋局賦予較高的評分優(yōu)點,學習簡單V的應用根據V能夠輕松地找到當前棋局的最佳走法。,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,11,選擇目標函數(3),V的設計,對于集合B中的任意棋局b,V(b)定義如下如果b是一最終的勝局,那么V(b)=100如果b是一最終的負局,
8、那么V(b)=-100如果b是一最終的和局,那么V(b)=0如果b不是最終棋局,那么V(b)=V(b’),其中b’是從b開始雙方都采取最優(yōu)對弈后可達到的終局,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,12,選擇目標函數(4),上面設計的缺陷遞歸定義運算效率低不可操作簡評學習任務簡化成發(fā)現(xiàn)一個理想目標函數V的可操作描述。通常要完美地學習這樣一個V的可操作的形式是非常困難的。
9、一般地,我們僅希望學習算法得到近似的目標函數V’,因此學習目標函數的過程常稱為函數逼近。,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,13,選擇目標函數的表示,函數的表示一張大表,對于每個唯一的棋盤狀態(tài),表中有唯一的表項來確定它的狀態(tài)值規(guī)則集合二項式函數人工神經網絡,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,14,選擇目標函數的表
10、示(2),重要的權衡過程一方面,我們總希望選區(qū)一個非常有表現(xiàn)力的描述,以最大可能地逼近理想的目標函數另一方面,越有表現(xiàn)力的描述需要越多的訓練數據,使程序能從它表示的多種假設中選擇,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,15,選擇目標函數的表示(3),一個簡單的表示法,對于任何給定的棋盤狀態(tài),函數V可以通過以下棋盤參數的線性組合來計算。x1,黑子的數量x2,紅子的數量x3,黑
11、王的數量x4,紅王的數量x5,被紅子威脅的黑子數量x6,被黑子威脅的紅子數量,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,16,選擇目標函數的表示(4),目標函數V(b)=w0+w1x1+w2x2+…+w6x6其中,w0…w6是權值,表示不同棋局特征的相對重要性至此,問題轉化為學習目標函數中的系數(即權值),2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾
12、華軍等 講者:陶曉鵬,17,選擇函數逼近算法,每個訓練樣例表示成二元對b是棋盤狀態(tài),Vtrain(b)是訓練值比如,,100>訓練過程從學習器可得到的間接訓練經驗中導出上面的訓練樣例調整系數wi,最佳擬合這些訓練樣例,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,18,選擇函數逼近算法(2),估計訓練值困難處一個簡單的方法,Vtrain(b)=V’(Successor(
13、b))調整權值最佳擬合的定義,比如誤差平方和最小尋找算法,比如最小均方法,LMS Least Mean Squares,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,19,最終設計,,,,,,,,,實驗生成器,執(zhí)行系統(tǒng),泛化器,鑒定器,新問題,解答路線,假設,訓練樣例,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,20,最終設計(2),執(zhí)行
14、系統(tǒng)用學會的目標函數來解決給定的任務鑒定器以對弈的路線或歷史記錄作為輸入,輸出目標函數的一系列訓練樣例。泛化器以訓練樣例為輸入,產生一個輸出假設,作為它對目標函數的估計。實驗生成器以當前的假設作為輸入,輸出一個新的問題,供執(zhí)行系統(tǒng)去探索。,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,21,西洋跳棋學習的更多討論,圖1-2第13章理論上的保證這種學習技術是否確保發(fā)現(xiàn)一個非常
15、接近的近似。更復雜的目標函數其他學習算法最近鄰算法,存儲訓練樣例,尋找保存的最接近的情形來匹配新的情況遺傳算法,產生大量候選的西洋跳棋程序,讓它們相互比賽,保留最成功的程序并進一步用模擬進化的方式來培育或變異它們基于解釋的學習,分析每次成敗的原因,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,22,機器學習的一個觀點,一個有效的觀點機器學習問題歸結于搜索問題本書給出了對一些基本
16、表示定義的假設空間的搜索算法通過搜索策略和搜索空間的內在結構來刻畫學習方法,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,23,機器學習的問題,存在什么樣的算法能從特定的訓練數據學習一般的目標函數呢?如果提供了充足的訓練數據,什么樣的條件下,會使特定的算法收斂到期望的函數?哪個算法對哪些問題和表示的性能最好?多少訓練數據是充足的?怎樣找到學習到假設的置信度與訓練數據的數量及提供給學習器的
17、假設空間特性之間的一般關系?學習器擁有的先驗知識是怎樣引導從樣例進行泛化的過程的?當先驗知識僅僅是近似正確時,它們會有幫助嗎?關于選擇有效的后驗訓練經驗,什么樣的策略最好?這個策略的選擇會如何影響學習問題的復雜性。怎樣把學習任務簡化為一個或多個函數逼近問題?換一種方式,系統(tǒng)該試圖學習哪些函數?這個過程本身能自動化嗎?學習器怎樣自動地改變表示法來提高表示和學習目標函數的能力?,2003.12.18,機器學習-引言 作者:Mitch
18、ell 譯者:曾華軍等 講者:陶曉鵬,24,全書內容簡介,第2章,基于符號和邏輯表示的概念學習第3章,決策樹第4章,人工神經網絡第5章,統(tǒng)計和估計理論的基礎概念第6章,貝葉斯理論第7章,計算學習第8章,基于實例的學習第9章,遺傳算法第10章,規(guī)則學習第11章,基于解釋的學習第12章,近似知識與現(xiàn)有數據的結合第13章,增強學習,2003.12.18,機器學習-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論