最大信息原理、能量及選擇約束在基因剪接位點預測分析中應用的研究.pdf_第1頁
已閱讀1頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、確定基因組內所有基因并闡明基因的功能,不僅要依靠實驗手段,還需要發(fā)展理論方法對實驗進行指導。最大信息原理(MIP)是非平衡統(tǒng)計理論的一個基本原理,該原理是模擬生物進化中突變—一選擇機制的一個很好的模型,可作為生物信息學提取信息的重要依據。完整基因結構的預測是當前研究的一個重要課題,其中一個關鍵環(huán)節(jié)是剪接位點(包括組成性和可變剪接位點)及各種可變剪接事件的精確識別,而預測已知剪接位點的側翼競爭者是預測可變5’或者可變3’剪接位點事件的關鍵

2、。本文把最大信息原理應用到剪接反應理論分析中,導出了剪接位點片段的反應自由能表達式;通過引入選擇壓力指數概念及相應的約束,導出了序列片段中k-mer的選擇壓力指數表達式。當把理論應用到剪接位點及其側翼競爭者的預測問題時,獲得了較高的預測精度。本研究主要內容級結果如下:
   ⑴從剪接反應的基本物理原則出發(fā),應用傳統(tǒng)最大信息原理分析了剪接位點保守片段。引入剪接位點片段在剪接反應中所涉及的反應自由能概念及相應的約束條件,基于反應自由

3、能加性假設,推導出了剪接位點片段所涉及反應自由能的表達式。作為一個簡化模型,該式能用于估計一個5’或者3’剪接位點片段在剪接反應中所涉及的自由能變化。把它運用到剪接位點的預測問題中進行檢驗時,預測結果精度較高,這說明其較為合理地反映了剪接反應的實際情況。
   ⑵作為剪接反應自由能理論估計的一個開端,精確性仍需提高。我們進一步把反應自由能加性假設改進為包含了剪接位點片段中各堿基之間關聯(lián)的形式,并把傳統(tǒng)的最大信息原理改進為包含背景

4、概率的形式;進而導出一個不但考慮了背景概率影響,而且較全面地包括了片段中各堿基之間關聯(lián)的更精確的剪接位點片段所涉及反應自由能估計表達式。使用該式對剪接位點進行預測時,預測精度與改進前相比有明顯提高,說明改進后的表達式更為成功地符合了剪接反應過程。
   ⑶使用改進后的剪接位點片段反應自由能表達式預測了人類和小鼠基因中的可變和組成性剪接位點及其側翼競爭者,預測結果較好,精度比得上最大熵模型等一些當前流行的方法。對于已知剪接位點側翼

5、競爭者的預測,使用競爭者片段本身的反應自由能估計值預測的精度要高于另一個預測指標——已知剪接位點片段和候選競爭者片段之間的反應自由能估計值之差,這說明就大量剪接位點的總體效果而言,在已知剪接位點片段和側翼競爭者片段之間的反應自由能競爭不是一個決定可變剪接位點選擇的唯一主要因素。
   ⑷為了把序列片段或其中k-mer所受的自然選擇強度數量化,引入選擇壓力指數的概念,并引入相應的約束條件,利用最大信息原理推導出序列片段中k-mer

6、的選擇壓力指數表達式。該式易于和功能聯(lián)系而對某些功能物理量進行定量估計,前面的剪接反應自由能估計方法也可被納入到選擇壓力指數理論框架內。當把理論應用到人和小鼠的組成性和可變剪接位點預測中時,反應自由能估計值和側翼序列中k-mer的平均選擇壓力指數共三個指標用二次判別法整合形成的綜合方法的預測能力與單個反應自由能指標相比有明顯提高。
   ⑸基于序列信息量構造了可用于編碼區(qū)預測的信息差異指數,它的預測能力比得上非均勻指數。使用選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論