

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、本文對基于自適應(yīng)神經(jīng)模糊推理與隱馬爾可夫的語音分割進(jìn)行了研究?,F(xiàn)代語音技術(shù)和研究需要高精確度和高可靠性的語音分割。人工分割一直被認(rèn)為是最為可靠和精確的方法。然而,人工分割方法不僅費時費力,還必須由語音專家來進(jìn)行實施。在大數(shù)據(jù)時代,尤其針對大型語音庫,這是一個致命的缺陷。因此,發(fā)展高精確度的自動語音分割技術(shù),是十分必要的。最主要的自動語音分割技術(shù),被稱為強制校準(zhǔn)。在此方法中,隱馬爾可夫模型(HMM)被用于構(gòu)建不同音素的語音模型。而語音信號
2、被提取為一幀一組的特征向量。該模型可以得到音素間大概的語音邊界,但結(jié)果不夠準(zhǔn)確。傳統(tǒng)的基于隱馬爾科夫模型的強制校準(zhǔn)系統(tǒng),在 TIMIT語音庫中,以20毫秒的容忍度來計算,精確度在80%?89%之間。迄今為止,許多方法被提出,用于改善基于隱馬爾科夫的自動語音分割技術(shù)。一些研究人員認(rèn)識到,基于隱馬爾科夫的自動語音分割與人工語音分割之間的差別,是語音專家具有語音分割的相關(guān)知識。而模糊邏輯可以將此類知識,直觀的轉(zhuǎn)化為可用于計算機的模糊規(guī)則。但模
3、糊規(guī)則需要專家精心設(shè)計,且無法保證規(guī)則的完備性。針對這些問題,提出一種更加合適的改善方法,是本研究的目的。
自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)是一種結(jié)合神經(jīng)網(wǎng)絡(luò)與模糊推理系統(tǒng)的機器學(xué)習(xí)方法。與其他機器學(xué)習(xí)方法相比,它具有神經(jīng)網(wǎng)絡(luò)和模糊推理系統(tǒng)的優(yōu)點,且具有較好的性能。其優(yōu)點:實現(xiàn)簡單,非線性,使用模糊推理規(guī)則,非常適合解決我們之前提到的問題。在本課題中,自適應(yīng)神經(jīng)模糊推理系統(tǒng),被用于學(xué)習(xí)如何修正分割點位置,來補償人工分割與機
4、器分割間的差異和隱馬爾科夫模型本身所產(chǎn)生的系統(tǒng)分割誤差。整個實驗分為兩步:第一步,上下文無關(guān)的HMM被用于獲得初始的語音邊界。第二步,訓(xùn)練好的自適應(yīng)神經(jīng)模糊推理系統(tǒng)用于修正第一步所得到的分割邊界。實驗使用TIMIT數(shù)據(jù)庫。實驗的結(jié)果表明,自適應(yīng)神經(jīng)模糊推理系統(tǒng),可以顯著的提高,基于隱馬爾科夫的自動語音分割技術(shù)精確度。在TIMIT語音庫中,以20毫秒容忍度為評價標(biāo)準(zhǔn),自適應(yīng)神經(jīng)模糊推理系統(tǒng)使得精確度從86.25%提高92.08%。這也證明
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于隱馬爾可夫模型和神經(jīng)網(wǎng)絡(luò)的語音識別算法研究.pdf
- 基于小波域隱馬爾可夫模型的自適應(yīng)圖像水印.pdf
- 基于模糊馬爾可夫場的圖像分割算法研究.pdf
- 語音識別中隱馬爾可夫模型的研究.pdf
- 基于隱馬爾可夫模型的跨語種語音合成研究.pdf
- 基于隱馬爾可夫模型的語音識別技術(shù)研究.pdf
- 基于加權(quán)模糊規(guī)則的自適應(yīng)神經(jīng)—模糊推理.pdf
- 基于隱馬爾可夫和人工神經(jīng)網(wǎng)絡(luò)混合模型的語音識別.pdf
- 基于隱馬爾可夫模型的語音識別方法的研究.pdf
- 基于自適應(yīng)神經(jīng)模糊推理的倒立擺控制研究.pdf
- 基于隱馬爾可夫隨機場的脊柱CT圖像分割算法研究.pdf
- 基于隱馬爾可夫模型的跨語種語音合成方法研究.pdf
- 基于模糊-隱馬爾可夫模型的復(fù)合式攻擊預(yù)測方法研究.pdf
- 隱馬爾可夫模型簡介
- 基于隱馬爾可夫模型的指紋匹配研究.pdf
- 基于隱馬爾可夫模型的高表現(xiàn)力語音合成技術(shù)的研究.pdf
- 基于自適應(yīng)神經(jīng)模糊推理的橋梁纜索體系評估.pdf
- 隱馬爾可夫模型技術(shù)
- 基于多分辨率隱馬爾可夫隨機場的動態(tài)紋理分割.pdf
- 基于隱馬爾可夫模型的音頻檢索.pdf
評論
0/150
提交評論