視覺(jué)第一講_第1頁(yè)
已閱讀1頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、視覺(jué)視覺(jué)研究的準(zhǔn)備:基本原理與方法,視覺(jué)建模組狄曉斐2010.09.08,提綱,作者介紹 視覺(jué)是什么—導(dǎo)言 視覺(jué)研究的背景 信息處理系統(tǒng) 視覺(jué)的表象框架 總結(jié),提綱,作者介紹 視覺(jué)是什么—導(dǎo)言 視覺(jué)研究的背景 信息處理系統(tǒng) 視覺(jué)的表象框架 總結(jié),David Marr,英國(guó)神經(jīng)科學(xué)家、心理學(xué)家 教育背景Trinity College, Cambridge mathematics BATrinity C

2、ollege, Cambridge physiology PH.D. 把心理學(xué)、神經(jīng)生理學(xué)、人工智能融入到視覺(jué)處理模型 開(kāi)創(chuàng)了計(jì)算神經(jīng)這門(mén)學(xué)科 1945-1980,提綱,作者介紹 視覺(jué)是什么—導(dǎo)言 視覺(jué)研究的背景 信息處理系統(tǒng) 視覺(jué)的表象框架 總結(jié),視覺(jué)是什么?,普通人(包括亞里士多德) 視覺(jué)是一處理過(guò)程:通過(guò)觀看,認(rèn)知有什么東西在什么地方 Marr 等人 視覺(jué),Marr 方法論的要旨在于認(rèn)為視覺(jué)是一種復(fù)雜的

3、信息處理任務(wù),其目的是要把握對(duì)我們有用的外部世界的各種情況,并把他們表達(dá)出來(lái)。-------- T. Poggio,,信息處理,表象,信息處理的觀點(diǎn),應(yīng)信息處理任務(wù)和信息處理機(jī)器的需求而生 與我們周?chē)芏喱F(xiàn)象相關(guān)(進(jìn)化,思想等)特點(diǎn):完整的理解需要多個(gè)層次的解釋,,視覺(jué),普通人的直接經(jīng)驗(yàn),腦科學(xué)家、生理學(xué)家和解剖學(xué)家細(xì)胞級(jí)的認(rèn)識(shí),計(jì)算機(jī)工作者的程序?qū)崿F(xiàn),計(jì)算和計(jì)算機(jī)—不同層次,計(jì)算 具體的信息處理任務(wù) 計(jì)算機(jī)能在程序控制下進(jìn)

4、行運(yùn)算的機(jī)器 正在執(zhí)行某一特殊信息處理任務(wù)的機(jī)器 人腦 不僅僅是一臺(tái)計(jì)算機(jī),而且是一臺(tái)習(xí)慣于執(zhí)行某些相當(dāng)特殊的計(jì)算的計(jì)算機(jī),哲學(xué)依據(jù)--意識(shí)的表象理論,假設(shè)意識(shí)可以利用內(nèi)部表象系統(tǒng) 心理狀態(tài) 判斷內(nèi)部表象當(dāng)前正在說(shuō)明的是哪些內(nèi)容 心理過(guò)程 如何得到這樣的內(nèi)部表象 這些內(nèi)部表象怎樣相互作用,視知覺(jué)研究的有用框架,本理論的出發(fā)點(diǎn),本書(shū)的內(nèi)容安排,第一部分導(dǎo)言(闡明思想方法)、研究方法、表象框架以及如何得到這個(gè)框架 第二部

5、分研究方法和理論框架在視覺(jué)中的體現(xiàn) 第三部分 自問(wèn)自答,闡明研究方法背后的思想方法,提綱,作者介紹 視覺(jué)是什么—導(dǎo)言 視覺(jué)研究的背景 信息處理系統(tǒng) 視覺(jué)的表象框架 總結(jié),視覺(jué)研究的背景,早期階段 牛頓(1704) :顏色視覺(jué) 亥姆霍茲(1910):生理光學(xué) Wertheimer(1923):在像電影那樣依次呈現(xiàn)的圖像中發(fā)生的不是單個(gè)點(diǎn)的運(yùn)動(dòng),而是整體的(即“場(chǎng)”的)視運(yùn)動(dòng) 心理學(xué)格式塔學(xué)派:描述整體的性質(zhì)(共同

6、性、差異性),闡明這些整體發(fā)生的“法則”,知覺(jué)心理學(xué)研究者,研究知覺(jué)的各種性質(zhì)和實(shí)現(xiàn)情況 顏色視覺(jué)的三原色理論 運(yùn)動(dòng)知覺(jué) ? 知覺(jué)的獨(dú)立模塊 Miles(1931) &Wallach and O’Connell(1953) B.Julesz 雙眼隨機(jī)點(diǎn)立體圖,心理物理學(xué)Campbell & Robson(1968) :在我們的知覺(jué)器官的前級(jí),存在著若干個(gè)獨(dú)立的空間頻率調(diào)諧通道,即對(duì)圖像中以一個(gè)特定尺度或空間間隔

7、出現(xiàn)的光強(qiáng)度變化敏感的通道。 表象的提出及解釋 Shepard and Metzler(1971) : 意識(shí)的移動(dòng)實(shí)驗(yàn),電生理學(xué)方法(還原論方法) 盛極一時(shí) 放大技術(shù)使記錄單個(gè)神經(jīng)元的活動(dòng)成為可能 細(xì)胞“感受野”的概念Barlow :對(duì)單個(gè)神經(jīng)細(xì)胞的活動(dòng)以及它對(duì)其他神經(jīng)細(xì)胞影響的反應(yīng)的描述是理解神經(jīng)系統(tǒng)功能的足夠完整的描述 終歸失敗 結(jié)構(gòu)的理解不能啟迪了解運(yùn)動(dòng)系統(tǒng),不能指導(dǎo)寫(xiě)程序 已有的研究重點(diǎn)在描述細(xì)胞行為而不解

8、釋為什么有這樣的行為,視區(qū)在做什么工作?哪些問(wèn)題需要解釋?zhuān)繎?yīng)該在哪個(gè)層面上解釋?zhuān)?Barlow, Hubel and Wiesel: 特征檢測(cè)器 當(dāng)時(shí)視覺(jué)工作者們:從圖像中提取邊緣和線(xiàn)條非常棘手 經(jīng)驗(yàn)方法:邊緣提取算子 分析受限場(chǎng)景(比如:積木世界) Land, McCann and Horn顏色視覺(jué)的銳化處理理論和 Horn 從明暗恢復(fù)形狀Marr and Poggio 存在一個(gè)層次獨(dú)立的對(duì)知覺(jué)過(guò)程中所完成的信息處理

9、任務(wù)進(jìn)行分析和理解,,提綱,作者介紹 視覺(jué)是什么—導(dǎo)言 視覺(jué)研究的背景 信息處理系統(tǒng) 視覺(jué)的表象框架 總結(jié),信息處理系統(tǒng)----表象和描述,表象 一種能把某些實(shí)體或某幾類(lèi)信息表達(dá)清楚地形式系統(tǒng),以及說(shuō)明該系統(tǒng)如何行使其職能的規(guī)則 描述 使用某一種表象描述一個(gè)給定實(shí)體的結(jié)果 表象的特點(diǎn) 使某些信息明確而另一些隱藏 舉例 阿拉伯?dāng)?shù)制、二進(jìn)制,信息處理系統(tǒng)---- 處理,從超級(jí)市場(chǎng)收銀機(jī)入手 這個(gè)裝置做什么?

10、 加法(加法的性質(zhì)) 為什么會(huì)這樣做? 約束條件 怎么做? 加法規(guī)則 物理實(shí)現(xiàn) 晶體管等器件,信息處理系統(tǒng)---- 三個(gè)層次,,三個(gè)層次間存在著一定的邏輯的因果關(guān)系,,這種關(guān)系很松散某些現(xiàn)象可以只在其中一個(gè)或兩個(gè)層次上進(jìn)行解釋,聯(lián)系與區(qū)別,信息處理系統(tǒng)----計(jì)算理論的重要性,構(gòu)成視覺(jué)基礎(chǔ)的計(jì)算的本質(zhì) 研究神經(jīng)元與理解視

11、覺(jué) = 研究羽毛與理解飛行 執(zhí)行某個(gè)任務(wù)的程序與任務(wù)的理論的混淆 特殊機(jī)制解決特殊問(wèn)題的解釋的發(fā)展 做什么與怎么做的理論差別的模糊 阻礙了人工智能和語(yǔ)言學(xué)的交流(Chomsky 轉(zhuǎn)移語(yǔ)法學(xué)的定位),信息處理系統(tǒng)----J.J.Gibson的方法,觀點(diǎn)腦是從我們置身于其中的流動(dòng)著的能量的陣列中尋找并提取與環(huán)境有關(guān)的信息,神經(jīng)系統(tǒng)以某種方式與這些不變量諧振 優(yōu)點(diǎn)知覺(jué)問(wèn)題:從感覺(jué)信息恢復(fù)外部世界有效性質(zhì)的問(wèn)題缺點(diǎn)未能認(rèn)識(shí)到

12、像圖像表面這種物理不變因子的檢測(cè)是信息處理問(wèn)題低估了這種檢測(cè)的困難,信息處理系統(tǒng)----哲學(xué)上探討知覺(jué)問(wèn)題的傳統(tǒng),?。?! 對(duì)知覺(jué)過(guò)程中的信息處理的復(fù)雜性沒(méi)有足夠的重視,Austin 《感覺(jué)和情感》 外部世界存在一個(gè)真實(shí)的形狀,通過(guò)視覺(jué)告訴人們這個(gè)真實(shí)形狀是不可能的,不存在這樣的規(guī)律和具體方法。,我們有辦法以任意一種精度描述這些形狀,也存在這樣的規(guī)律和方法!這正是視覺(jué)要解決的問(wèn)題。,提綱,作者介紹

13、 視覺(jué)是什么—導(dǎo)言 視覺(jué)研究的背景 信息處理系統(tǒng) 視覺(jué)的表象框架 總結(jié),視覺(jué)的表象框架,視覺(jué):一個(gè)處理過(guò)程,能從外部世界的圖像中得到一個(gè)既對(duì)觀察著有用又不受無(wú)關(guān)信息干擾的描述從一個(gè)表象獲得另一表象的一個(gè)映射視覺(jué)目的 決定了一個(gè)表象是否有效人類(lèi)視覺(jué)的精華 物體的形狀表象和物體的用法、用途表象完全不同 即使人們不能理解物體用途,單靠視覺(jué)就能傳遞物體形狀的內(nèi)部描述人類(lèi)視覺(jué)關(guān)注的是形狀、空間及空間位型,視覺(jué)的表象框架,圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論