藥物發(fā)現(xiàn)的虛擬篩選方法_第1頁(yè)
已閱讀1頁(yè),還剩96頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、藥物發(fā)現(xiàn)的虛擬篩選方法,第一節(jié) 概述,計(jì)算機(jī)模擬與化學(xué)合成、生物測(cè)試的結(jié)合構(gòu)成了后基因組時(shí)代新藥研究的新策略。從已有的化合物,包括合成化合物和天然產(chǎn)物中尋找藥物或先導(dǎo)化合物,是藥物發(fā)現(xiàn)的一個(gè)重要途徑。到目前為止,人們只是針對(duì)大約500 種疾病的治療靶點(diǎn),篩選了現(xiàn)已發(fā)現(xiàn)的2 000 多萬(wàn)種有機(jī)化合物中大約10%的化合物,但仍然有大量的潛在活性化合物未被發(fā)現(xiàn)。,隨著科學(xué)技術(shù)的發(fā)展,各種先進(jìn)技術(shù)應(yīng)運(yùn)而生(X 射線晶體衍射法、多維核磁共振法、掃

2、描隧道顯微技術(shù)等),使得越來(lái)越多生物靶標(biāo)(蛋白質(zhì)、核酸、多糖等)的空間結(jié)構(gòu)被解析。同時(shí)計(jì)算機(jī)科學(xué)的發(fā)展又極大地提高了計(jì)算和分析的速度和精度。因此,自上世紀(jì)90 年代起,合理藥物設(shè)計(jì)就逐漸成為一種實(shí)用技術(shù)接融入到藥物研發(fā)的各個(gè)環(huán)節(jié)。,一、合理藥物設(shè)計(jì),成功例子,奈非那韋(nelfinavir) 抗艾滋病藥物 HIV-1蛋白酶抑制劑依馬替尼(imatinib) 治療慢性骨髓型白血病藥物,二、數(shù)據(jù)庫(kù)空間,研究對(duì)

3、象 化學(xué)信息學(xué):小分子 生物信息學(xué):小分子結(jié)構(gòu)單元構(gòu)成的基因和蛋白質(zhì)等大分子,本質(zhì)上都是 化學(xué)物質(zhì)。計(jì)算方法 基于回歸的聚類分析;支持向量機(jī);神經(jīng)網(wǎng)絡(luò);遺傳算法等。發(fā)揮作用方面 核酸和蛋白質(zhì)功能和結(jié)構(gòu);小分子配體和蛋白質(zhì)受體的相互作用;酶催化 等方面 。,化學(xué)信息學(xué)和生物信息學(xué)的共同點(diǎn),是相互依存,相互影響,需結(jié)合在一起,才能解決大多數(shù)的實(shí)際問

4、題!,虛擬篩選的時(shí)間: 在化合物組合庫(kù)合成和/或篩選之前。虛擬篩選的空間: 在計(jì)算機(jī)上進(jìn)行模擬設(shè)計(jì)和篩選。虛擬篩選的方法: 直接方法:基于分子對(duì)接(molecular docking)的虛擬篩選 間接方法:基于藥效基團(tuán)(pharmacophore)的虛擬篩選,虛擬篩選(virtual screening, VS),虛擬篩選技術(shù)是藥物設(shè)計(jì)方

5、法的延伸和推廣,廣義地講只要是基于某種提問形式,從現(xiàn)有的小分子數(shù)據(jù)庫(kù)中,搜尋符合條件的化合物都可以稱之為虛擬篩選。這其中包括基于某些分子特性的數(shù)據(jù)庫(kù)搜索、基于分子對(duì)接的數(shù)據(jù)庫(kù)搜索、基于藥效團(tuán)的數(shù)據(jù)庫(kù)搜索等,其目的是從幾十乃至上百萬(wàn)個(gè)分子中篩選出新的先導(dǎo)化合物。由于實(shí)體的藥物篩選需要構(gòu)建大規(guī)模的化合物庫(kù),提取或培養(yǎng)大量實(shí)驗(yàn)必須的靶酶或者靶細(xì)胞,并且需要復(fù)雜的設(shè)備支持,因而進(jìn)行實(shí)體的藥物篩選要投入巨額資金。而虛擬藥物篩選是將藥物篩選的過(guò)程在

6、計(jì)算機(jī)上模擬,對(duì)化合物可能的活性作出預(yù)測(cè),這樣就能夠集中目標(biāo),大大降低實(shí)驗(yàn)篩選化合物的數(shù)量,從而縮短研發(fā)周期、節(jié)約經(jīng)費(fèi)開支。雖然早在20 世紀(jì)70 年代虛擬篩選技術(shù)已經(jīng)得到應(yīng)用,但由于技術(shù)本身的不成熟,使得在新藥開發(fā)上仍然主要依靠傳統(tǒng)的實(shí)驗(yàn)篩選。近年來(lái),隨著虛擬藥物篩選成功地發(fā)現(xiàn)了一些有開發(fā)價(jià)值的先導(dǎo)化合物,這項(xiàng)技術(shù)又重新引起大家的重視。,化學(xué)信息學(xué),產(chǎn)生的背景 組合化學(xué)和高通量篩選,出現(xiàn)了巨大的信息,需要快速收集、存儲(chǔ)、分析和

7、處理,隨著信息技術(shù)向化學(xué)領(lǐng)域的滲透,形成了新的交叉學(xué)科——化學(xué)信息學(xué)。研究?jī)?nèi)容 化合物信息在計(jì)算機(jī)中的表示 化合物數(shù)據(jù)庫(kù)的建立、使用和管理 化合物相似性、多樣性及分子類藥性分析 化合物定量構(gòu)效關(guān)系,化學(xué)信息學(xué) Chemoinformatics,chemical informatics,Cheminformatics,chemi-informatics,利用計(jì)算機(jī)信息處理技術(shù)對(duì)化學(xué)分子結(jié)構(gòu)和相關(guān)信息

8、進(jìn)行管理的一種綜合性技術(shù)和學(xué)科應(yīng)用化學(xué)信息學(xué)可促進(jìn)化學(xué)信息的獲取、轉(zhuǎn)化與共享,一、化學(xué)信息的表示方法,化學(xué)分子,一維結(jié)構(gòu):化合物名稱(俗名);線性符號(hào)表示法。,二維結(jié)構(gòu):原子用元素符號(hào),鍵用短線,即化合物結(jié)構(gòu)式。為平面結(jié)構(gòu)。,三維結(jié)構(gòu):原子的空間位置、相互間距離、鍵角和二面角等。,分子表面:建立在三維結(jié)構(gòu)基礎(chǔ)上,能與分子的三維結(jié)構(gòu)一一對(duì)應(yīng)。,苯丙氨酸分子結(jié)構(gòu)表征層次,,,,(一)一維結(jié)構(gòu)表示,SMILES(簡(jiǎn)化分子線性輸入系統(tǒng))編

9、碼的基本原則,原子通常以大寫元素符號(hào)表示(省略氫原子),芳香結(jié)構(gòu)原子則以小寫表示。相鄰原子依次排放在一起,單鍵通常省略,雙鍵和三鍵分別以“=”和“#”表示,芳香鍵以“:”表示,也可省略。分支部分放在括號(hào)內(nèi),環(huán)則打開,并賦予斷開鍵兩端的原子以相同的數(shù)值。雙鍵“/”表示順式,“\”表示反式。原子順時(shí)針排列用@表示,逆時(shí)針排列用@@表示。,甲烷 CH4

10、 C乙醇 C2H5OH CCO氰化氫 HCN C#N環(huán)已烷 C6H12 C1CCCCC1吡啶 C5H5N n1ccccc1異丁

11、酸 (CH3)2CHCO2H CC(C)C(=O)O反式二溴甲烷 Br/C=C/Br 或Br\C=C\Br順式二溴甲烷 Br\C=C/Br 或Br/C=C\BrL-丙氨酸 N[C@@H](C)C(=O)OD-丙氨酸 N[C@H](C)C(=O)O,舉例說(shuō)明,苯丙氨酸,,,,NC(Cc1ccccc1)C(

12、O)=O,,C/C=C\C=\[C@@H](O)C#N,SMILES編碼的立體化學(xué)信息表示,SLN編碼(Sybyl線性標(biāo)記法)的規(guī)則,原子以其元素符號(hào)表示,氫原子也要顯示;單鍵省略,雙鍵、三鍵和芳香鍵分別以“=” “#”和“:”表示;分支也采用括號(hào)表示;環(huán)也打開,依靠環(huán)上一個(gè)預(yù)先定義好的具有唯一編號(hào)的原子及@符號(hào)來(lái)識(shí)別,如環(huán)己烷表示為C[15]H2CH2CH2CH2CH2CH2@15;原子和鍵的屬性(如電荷、立體化學(xué)性質(zhì)等)可通過(guò)

13、方括號(hào)[ ]或尖括號(hào)在該原子后標(biāo)記出;對(duì)大分子的原子,可使用縮寫,如氨基酸可以用其三個(gè)字母縮寫形式表示。,(二)二維結(jié)構(gòu)表示,1、圖論基礎(chǔ)和圖的矩陣表示 一個(gè)簡(jiǎn)單的圖由頂點(diǎn)(V)和邊(E)組成,因此圖被定義為一個(gè)三元組, φ為映射函數(shù)。在下面一個(gè)簡(jiǎn)單的無(wú)向圖中, V={1,2,3,4}, E={e1,e2,e3,e4, e5, e6}。,圖也可用矩陣表示:設(shè)G=為無(wú)向圖,令mij等于頂點(diǎn)vi與邊ej的關(guān)聯(lián)次數(shù),

14、則稱(mij)n*m為G的關(guān)聯(lián)矩陣,記為M(G)。,用圖表示苯丙氨酸的結(jié)構(gòu),2、化合物結(jié)構(gòu)的矩陣表示(1)鄰接矩陣(以乙醛為例),(2)距離矩陣:表示了相應(yīng)原子之間的距離:幾何距離(用Å表示), 拓?fù)渚嚯x(兩原子之間連接的鍵的個(gè)數(shù)) (3)鍵矩陣:矩陣元素為相連接的兩個(gè)原子之間的鍵級(jí)。 雙鍵:2,三鍵:3。(4)關(guān)聯(lián)矩陣:是

15、一個(gè)n×m的矩陣。 頂點(diǎn)(原子)作為列(n),邊(化學(xué)鍵)作為行(m), 如果邊在頂點(diǎn)內(nèi),則相應(yīng)的元素置為1。,3、連接表,20世紀(jì)80年代開始,成為化合物在計(jì)算機(jī)中表示的最主要方法。首先對(duì)每個(gè)原子進(jìn)行編號(hào)并列表然后在另一表格中列出鍵的信息,鍵級(jí)用整數(shù)表示,1表示單鍵,2表示雙鍵。,(三)三維結(jié)構(gòu)表示,1、直接坐標(biāo)法 用迪卡爾

16、坐標(biāo)直接存儲(chǔ)每個(gè)原子的三維坐標(biāo)(x,y,z),2、內(nèi)坐標(biāo)法,每個(gè)原子位置以與其他原子間的3個(gè)相對(duì)位置關(guān)系表示——相對(duì)距離、鍵角、二面角,(四)分子存儲(chǔ)格式及其相互轉(zhuǎn)換,基本存儲(chǔ)分子的元素組成、原子坐標(biāo)、原子連接關(guān)系其他存儲(chǔ)分子子結(jié)構(gòu)信息,適用于生物大分子原子電荷信息,調(diào)用時(shí)不必再計(jì)算確定特定原子化學(xué)環(huán)境的原子類型信息,二、化合物數(shù)據(jù)庫(kù)的生產(chǎn)和管理,目前有很多商業(yè)化合物數(shù)據(jù)庫(kù)可以利用 MDL藥物數(shù)據(jù)報(bào)告(MDDR)含有115

17、000個(gè)類藥性 化合物。 美國(guó)國(guó)家癌癥研究所(NCI)數(shù)據(jù)庫(kù)含有250000個(gè) 化合物。,MDL ISIS化學(xué)數(shù)據(jù)庫(kù)管理系統(tǒng),ISIS系統(tǒng)提供了基于Oracle 數(shù)據(jù)庫(kù)系統(tǒng)的各類化學(xué)信息系統(tǒng)的管理和開發(fā)工具,可以同時(shí)管理化學(xué)結(jié)構(gòu)、化學(xué)反應(yīng)、生物活性及譜圖等多種化學(xué)信息。ISIS已應(yīng)用于全球超過(guò)80%的化學(xué)與制藥企業(yè),已成為事實(shí)上的化學(xué)信息管理系統(tǒng)的工業(yè)標(biāo)準(zhǔn)。,ISIS (Integrated Scientif

18、ic Information Management System)——MDL的綜合性結(jié)構(gòu)和反應(yīng)管理軟件,由三個(gè)主要模塊組成:(1) 化學(xué)信息管理系統(tǒng):ISIS/HOST——主服務(wù)器應(yīng)用程序,進(jìn)行通訊連接,集中數(shù)據(jù)庫(kù)數(shù)據(jù)并作處理(2) 化學(xué)信息生成和管理軟件:ISIS/BASE——用于生成局部數(shù)據(jù)庫(kù)及處理信息(3) 化學(xué)畫圖軟件:ISIS/DRAW——用于輸入結(jié)構(gòu)式和搜尋詢問條件,2D結(jié)構(gòu)輸入,——計(jì)算機(jī)繪制化學(xué)結(jié)構(gòu)式 首先輸入原

19、子和鍵的骨架結(jié)構(gòu),原子數(shù)、電荷會(huì)自動(dòng)變?yōu)樯舷聵?biāo) 軟件的模板中收集大量分子片段 可智能分析結(jié)構(gòu)式,處理結(jié)構(gòu)式的編碼和變換 還可有附加功能,如自動(dòng)命名、化學(xué)計(jì)算、光譜分析等,三維結(jié)構(gòu)的轉(zhuǎn)化,3D結(jié)晶結(jié)構(gòu)參數(shù)轉(zhuǎn)入3D數(shù)據(jù)庫(kù),軟件將2D化學(xué)結(jié)構(gòu)迅速地轉(zhuǎn)為3D模型,三、分子相似性和多樣性分析,分子相似性和多樣性分析方法的原則:結(jié)構(gòu)相似的分子有著相似的性質(zhì)或活性。作用:在識(shí)別新的具有與已知化合物相同性質(zhì)或活性的化合物時(shí)具有十分重要的作用。

20、數(shù)據(jù)庫(kù)的化學(xué)多樣性(chemical diversity): 數(shù)量巨大的、結(jié)構(gòu)不同的貯藏和檢索系統(tǒng)——適用于先導(dǎo)化合物發(fā)現(xiàn) 數(shù)據(jù)庫(kù)的化學(xué)相似性(chemical similarity) 適用于先導(dǎo)化合物優(yōu)化評(píng)價(jià)方法:通過(guò)計(jì)算分子的描述符,并比較化合物描述符的近似程度。,分子描述符,概念:在相似性和多樣性分析中,需要建立化合物結(jié)構(gòu)和它們生 物活性或者理化性質(zhì)的映射,分子

21、描述符就是其中的一種映射。 作用:通常一個(gè)或多個(gè)描述符可以用來(lái)描述分子的結(jié)構(gòu)、性質(zhì)等, 如lgP在一定程度上反映了分子穿透細(xì)胞膜的能力;拓?fù)渲笖?shù)描述 了結(jié)構(gòu)的復(fù)雜性。 描述符的內(nèi)容是由兩方面決定的,一是化合物的分子表示,二是計(jì) 算描述符的算法。,分子描述的分類,分子相似性分析方法,基于定性特征的和基于定量特征的。對(duì)于兩個(gè)化合物A和B, a是A所具有而B不具有的特征數(shù)目 b是B

22、所具有而A不具有的特征數(shù)目 c是兩者共同的特征數(shù)目 d為兩者都不具有的特征數(shù)目 c和d表示了化合物A和B之間的相似性 a和b表示了化合物A和B之間的多樣性 所有的特征數(shù)目為n=a+b+c+d這樣,可以建立一種直觀的相似性評(píng)價(jià)方法:考察所有匹配的特征數(shù)目c+d在所有特征數(shù)目(c+d)+(a+b)中所占的比例,即(c+d)/(a+b+c+d)。這也被稱作為簡(jiǎn)單匹配系數(shù)??梢钥闯觯珹和B均不具有的特

23、征并沒有表達(dá)任何信息,所以,d可以從上面的方法中刪除,得到了Tanimoto相似度計(jì)算公式。,,化學(xué)多樣性的定量表達(dá)——Tanimoto系數(shù),用化學(xué)空間中電荷和電勢(shì)等描述符比較不同分子的性質(zhì) TC = c /(a+b+c) a為A中基礎(chǔ)片斷的描述符的數(shù) b為B中基礎(chǔ)片斷的描述符的數(shù)目 c為

24、A和B中共有的基礎(chǔ)片斷的描述符的數(shù)目相同分子TC = 1;分子沒有共同描述符時(shí)TC = 0,相似性搜尋,根據(jù)分子相似性原理,可以在數(shù)據(jù)庫(kù)中搜尋與目標(biāo)分子具有一定相似性的分子,即相似性搜尋。步驟: 1、目標(biāo)選擇 2、描述符選擇和編碼 3、相似性評(píng)價(jià)方法選擇 4、搜尋語(yǔ)句的輸入 5、相似性打分,四、互聯(lián)網(wǎng)上的化學(xué)信息資源,(一)化學(xué)搜索引擎1、大型通用搜索引擎:Google、百度等。

25、2、專門用于搜索化學(xué)信息的引擎:ChemFinder, MetaXchem…..(二)互聯(lián)網(wǎng)上的化學(xué)數(shù)據(jù)庫(kù)1、文獻(xiàn)數(shù)據(jù)庫(kù)(CA、Medline)2、化合物數(shù)據(jù)庫(kù)(Gmelin, CSD)3、綜合數(shù)據(jù)庫(kù)(Beilstein、PDB),常用化合物數(shù)據(jù)庫(kù),FCD (Fine Chemicals Directory)—— MDL 維護(hù)。收載約90 000化合物和20 000化合物數(shù)據(jù),包括化學(xué)系統(tǒng)名、俗稱、分子式、分子量、供應(yīng)商、價(jià)格、

26、CAS登錄號(hào)、純度等??赏ㄟ^(guò)結(jié)構(gòu)式或其它任何數(shù)據(jù)檢索ACD (Available Chemicals Directory) ——MDL維護(hù)。FCD數(shù)據(jù)庫(kù)加上可大批量供貨的化學(xué)品信息。目前有25萬(wàn)個(gè)化合物CSD(Cambridge Structure Database) —— 20多萬(wàn)個(gè)結(jié)晶的3D結(jié)構(gòu)實(shí)驗(yàn)數(shù)據(jù)及相關(guān)數(shù)據(jù),常用數(shù)據(jù)庫(kù)的網(wǎng)址,生物信息學(xué)(bioinformatics),基于數(shù)學(xué)、生命科學(xué)、化學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科. 利用

27、計(jì)算機(jī)信息處理技術(shù)對(duì)大量生物大分子作信息獲取、加工、儲(chǔ)存、分類、檢索與統(tǒng)計(jì)分析,揭示生物大分子的分子結(jié)構(gòu)、功能、同源性和進(jìn)化關(guān)系. 推動(dòng)生命科學(xué)的發(fā)展,為創(chuàng)新藥物的研究和開發(fā)奠定基礎(chǔ).,生物信息學(xué)的應(yīng)用,核酸序列分析指直接從基因組序列中獲取信息,同時(shí)為后者提供數(shù)據(jù);蛋白質(zhì)序列分析中,大部分是對(duì)同源蛋白序列進(jìn)行比對(duì)分析,以得到不同蛋白質(zhì)之間的序列相關(guān)性,從而推測(cè)蛋白質(zhì)功能等。二者分析方法一致。,生物大分子結(jié)構(gòu)預(yù)測(cè),虛擬篩選,生物大分子包

28、括DNA、RNA、蛋白質(zhì)和脂類。它們的結(jié)構(gòu)預(yù)測(cè)指建立精確的三維構(gòu)象,這對(duì)于生物大分子功能的闡明十分重要。而尚無(wú)晶體結(jié)構(gòu)數(shù)據(jù)的生物大分子,可采用分子模擬的方法預(yù)測(cè)大分子的三維結(jié)構(gòu)。,在進(jìn)行生物活性篩選之前,在計(jì)算機(jī)上對(duì)化合物分子進(jìn)預(yù)篩選,以降低實(shí)際篩選化合物數(shù)目,同時(shí)提高先導(dǎo)化合物發(fā)現(xiàn)效率。,藥物發(fā)現(xiàn)中的生物信息學(xué)方法,一、核酸和蛋白質(zhì)的序列分析,(一) 單個(gè)序列分析 根據(jù)單個(gè)氨基酸物化性質(zhì)推測(cè)整個(gè)蛋白質(zhì)的性質(zhì)

29、,也可對(duì)序列進(jìn)行統(tǒng)計(jì)分析,預(yù)測(cè)二級(jí)結(jié)構(gòu)出現(xiàn)可能性. 20種氨基酸的疏水參數(shù),根據(jù)統(tǒng)計(jì)值:Glu經(jīng)常出現(xiàn)在α-螺旋中;Val常在β-折疊中發(fā)現(xiàn); Pro通常不出現(xiàn)于α-螺旋中和β- 折疊中而傾向于在回折中……,(數(shù)值=1代表偏好處于平均;>1代表偏好大于平均;<1代表偏好小于平均),(二) 雙重序列比較——序列比對(duì),序列對(duì)比可以用各種矩陣表達(dá)并作相似性打分兩個(gè)殘基越

30、相似則打分值越高.,(三) 多重序列比對(duì),多重序列比對(duì)可更多揭示相關(guān)蛋白質(zhì)序列中的保守區(qū)域,進(jìn)而分析蛋白質(zhì)的結(jié)構(gòu)和功能??刹捎枚喾N統(tǒng)計(jì)算法進(jìn)行多重序列比對(duì)。,二、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè),蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的意義,蛋白質(zhì)的二級(jí)結(jié)構(gòu)有α螺旋、β折疊、β轉(zhuǎn)角等。因?yàn)槊恳欢蜗噜彽陌被釟埢哂行纬梢欢ǘ?jí)結(jié)構(gòu)的傾向,而且所有蛋白質(zhì)中約85%的氨基酸殘基處于上述3種基本二級(jí)結(jié)構(gòu)狀態(tài),所以從序列預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)是可行的。,1、Chou-Fasman方

31、法2、GOR方法3、基于氨基酸疏水性的方法,蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的方法,主要預(yù)測(cè)方法,1、從頭預(yù)測(cè)法(ab initio prediction),采用理論計(jì)算(分子力學(xué)、分子動(dòng)力學(xué)、量子化學(xué))方法,直接從分子和原子參數(shù)計(jì)算出蛋白質(zhì)分子的穩(wěn)定構(gòu)象,理論上最理想的方法,但計(jì)算量極大,對(duì)于實(shí)際分子的計(jì)算超過(guò)能力范圍,2、穿針引線法,根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來(lái)預(yù)測(cè)可能的三維結(jié)構(gòu)——基于知識(shí)的預(yù)測(cè)可應(yīng)用于進(jìn)化非常疏遠(yuǎn)的結(jié)構(gòu)預(yù)測(cè)未知蛋白序

32、列與折疊庫(kù)中已知結(jié)構(gòu)的蛋白序列作匹配計(jì)算,將序列吻合的三維結(jié)構(gòu)模塊串連起來(lái),得到整個(gè)蛋白三維結(jié)構(gòu),同源蛋白模建法homologous model building比較分子模擬法comparative molecular modeling同源模建 homology modeling同源蛋白法 protein homology,根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來(lái)預(yù)測(cè)可能的三維結(jié)構(gòu)——基于知識(shí)的預(yù)測(cè)同源蛋白有著相似的來(lái)源、相似

33、的結(jié)構(gòu)和生物功能。通過(guò)比較蛋白序列的相似性,按同源蛋白的三維結(jié)構(gòu)為模板,構(gòu)建未知蛋白的結(jié)構(gòu)一般要求同源性在30%以上,特別是在結(jié)合區(qū)域同源性要好,步驟,(1)根據(jù)未知蛋白質(zhì)的序列,尋找同源蛋白(2)二重或多重序列對(duì)比步驟(3)找出共同的二級(jí)結(jié)構(gòu)區(qū)域,構(gòu)建骨架(4)對(duì)初始模型作能量?jī)?yōu)化(5)判斷結(jié)構(gòu)合理性,三、代表性生物信息學(xué)數(shù)據(jù)庫(kù),(一)核酸數(shù)據(jù)庫(kù)GenBank——NIH所屬國(guó)家生物技術(shù)信息中心NCBINucleic Ac

34、id Database(NDB)—— 由European Molecular Biology Laboratory( EMBL)創(chuàng)建,現(xiàn)由英國(guó)劍橋的歐洲生物信息學(xué)研究所( European Bioinformatics Institute, EBI)維護(hù)DNA Data Bank of Japan(DDBJ)——日本國(guó)立遺傳學(xué)研究所的日本信息生物學(xué)中心( Center for Information Biology, CIB)開發(fā)維

35、護(hù)三大庫(kù)可交互,(二)蛋白質(zhì)數(shù)據(jù)庫(kù),PDB ( Protein Data Bank at Brookhaven National Laboratories ) —— 美國(guó) Research Collaboration for Structural Bioinformatics, RCSB開發(fā)維護(hù)的多肽、酶、病毒、碳水化合物和核酸的三維結(jié)構(gòu)數(shù)據(jù),基于藥效基團(tuán)搜索的方法,藥效團(tuán)的概念早在1909 年就由Ehrilich 提出,特

36、指載有活性必須特征原子的分子框架。現(xiàn)在泛指生物活性分子(一般指小分子)中對(duì)活性起重要作用的“藥效特征元素”的空間排列形式。這些“藥效特征元素”可以是某些具體的原子或原子團(tuán),比如氧原子、苯環(huán)等;也可以指特定的功能結(jié)構(gòu),如疏水基團(tuán)、氫鍵給體、氫鍵受體等。在得到某類抑制劑的藥效團(tuán)模型后,就可以以藥效團(tuán)作為提問結(jié)構(gòu)進(jìn)行數(shù)據(jù)庫(kù)搜索,從數(shù)據(jù)庫(kù)中篩選得到符合該藥效團(tuán)的候選分子,而在這些候選分子中可能包含新的先導(dǎo)化合物。,(1)初篩:其作用是先篩去那些

37、不能與提問結(jié)構(gòu)匹配的分子,減少進(jìn)入下一個(gè)階段的候選分子數(shù)。大多數(shù)軟件都把在該藥效團(tuán)中出現(xiàn)較多的原子或基團(tuán)作為約束條件,含有這些基團(tuán)的則通過(guò)初篩,否則被淘汰。(2)二維子結(jié)構(gòu)匹配:其目的是確定測(cè)試分子中藥效模式間的連接方式是否符合提問結(jié)構(gòu),這是一個(gè)較為耗時(shí)的過(guò)程。(3)三維結(jié)構(gòu)搜索:在通過(guò)二維子結(jié)構(gòu)匹配證明其包含藥效團(tuán)以后,就需要驗(yàn)證它在數(shù)據(jù)庫(kù)中的構(gòu)象和藥效特征元素是否滿足空間限制條件,如果滿足則該分子是一個(gè)命中結(jié)構(gòu)。,基于藥效團(tuán)的搜

38、索一般包含3 個(gè)基本步驟,基于藥效團(tuán)的搜索軟件,CATALYST 是由美國(guó)Accelrys 公司面向藥物研究領(lǐng)域的綜合性開發(fā)軟件,由于這一軟件為藥效團(tuán)模擬提供了完善的解決方案,使得CATALYST 成為近年來(lái)在基于藥效團(tuán)模型的藥物開發(fā)方面使用最廣泛的軟件。它能將抽象的藥效特征元素與靈活的幾何約束條件相結(jié)合,尤其在定義藥效團(tuán)模型時(shí),能夠表達(dá)重要的化學(xué)概念。在進(jìn)行基于藥效團(tuán)模型的數(shù)據(jù)庫(kù)搜索時(shí),其一維限制條件與某些數(shù)據(jù)相聯(lián)系,如分子量、lgP

39、 、pKa 等,從而把搜索限定在某些數(shù)值范圍內(nèi);二維約束支持定義包含子結(jié)構(gòu)或排除子結(jié)構(gòu),如包含芳香環(huán),不包含羰基等;三維檢索時(shí),對(duì)每個(gè)分子在生理?xiàng)l件下可能采取的各種構(gòu)象進(jìn)行搜索。為實(shí)現(xiàn)最佳的檢索性能,CATALYST 經(jīng)過(guò)了高度優(yōu)化,即使最抽象的(化學(xué)表達(dá))檢索也不例外。,UNITY 是另一搜索化學(xué)或生物數(shù)據(jù)庫(kù)的搜索系統(tǒng),由美國(guó)Tripos 公司開發(fā)。包括2D(搜索特殊片段)、相似性、3D(搜索特征的三維結(jié)構(gòu)或藥效團(tuán))、柔性(允許小分子

40、通過(guò)改變鍵角、二面角等方式符合3D 條件)搜索。UNITY 在進(jìn)行藥效團(tuán)搜索時(shí),支持3D/Flex 搜索,檢索的藥效團(tuán)特征包括給體原子(donor atom)、受體原子(accept atom)、給體位點(diǎn)(donor site)、受體位點(diǎn)(accept site)以及疏水中心(hydrophobic center)等。在對(duì)小分子數(shù)據(jù)庫(kù)進(jìn)行藥效團(tuán)搜索時(shí),采用的特征限制條件可以是具體的原子或基團(tuán),如上述的給體原子、受體原子、疏水中心;也可以

41、是某些配體將與之發(fā)生作用的位點(diǎn),即給體位點(diǎn)和受體位點(diǎn)等。,基于藥效基團(tuán)的結(jié)構(gòu)搜尋,1、二維藥效基團(tuán)搜尋,以平面的提問結(jié)構(gòu)搜尋化合物結(jié)構(gòu)式,(1)二維子結(jié)構(gòu)搜尋,搜尋具有與提問結(jié)構(gòu)相同子結(jié)構(gòu)的化合物分子,(2)二維相似性搜尋,搜尋與提問結(jié)構(gòu)某些特征相似的化合物分子,2、三維藥效基團(tuán)搜尋,搜尋具有與相同作用基團(tuán)和空間排布的化合物分子,[例] 新抗生素的尋找,[例] D2/D3受體選擇性拮抗劑藥效基團(tuán)模型,多巴胺D2類受體為抗帕金森癥和安定類

42、藥物的靶點(diǎn)D3/D4受體可能與精神分裂癥有關(guān)D2受體選擇性拮抗劑——取代哌嗪/哌啶類,D3受體選擇性拮抗劑——苯酰胺類和四氫萘類,藥效基團(tuán)模型的建立,挑選26個(gè)D2受體選擇性和22個(gè)D3受體選擇性的化合物分別作為訓(xùn)練集,分別產(chǎn)生D2受體D3受體模型 以Catalyst 將結(jié)構(gòu)式轉(zhuǎn)化為三維構(gòu)象, 用Best conformational analysis進(jìn)行構(gòu)象優(yōu)化用Catalyst/HypoGen產(chǎn)生藥效基團(tuán)。選擇5個(gè)結(jié)構(gòu)特征

43、作為藥效基團(tuán)單元:HB Acceptor,HB Donor, HYDPHOBIC , HYDROPHOB aromatic , RING AROMATIC 為D2/D3受體選擇性拮抗劑分別產(chǎn)生了10個(gè)得分從高到低的Hypothesis,藥效基團(tuán)模型的可信度,對(duì)于D2受體和D3受體產(chǎn)生的藥效團(tuán)模型,每個(gè)藥效基團(tuán)模型的得分與理想模型的得分差值均大于40,說(shuō)明數(shù)據(jù)關(guān)聯(lián)的可能性較大所建立的D2受體和D3受體藥效團(tuán)模型可用于虛擬篩選,未知化合

44、物的活性預(yù)測(cè),以未知化合物作為驗(yàn)證集大部分預(yù)測(cè)值與實(shí)驗(yàn)值處于同一個(gè)數(shù)量級(jí),并反映D2/D3受體的選擇性,D2(左)和D3(右)受體拮抗劑藥效基團(tuán)MAPPING圖,[例] Muscarinic M3 受體拮抗劑的篩選,過(guò)敏性腸道綜合癥與慢性阻塞性氣管病均與受體Muscarinic M3 有關(guān)。1999 年,Marriott 等采用基于藥效團(tuán)搜索的方法進(jìn)行了Muscarinic M3 受體拮抗劑的篩選。他們從文獻(xiàn)中選出3 個(gè)已知的抑制劑,

45、利用DISCO 程序構(gòu)建藥效團(tuán)模型,最終有2 個(gè)四點(diǎn)模型用于數(shù)據(jù)庫(kù)搜索(圖)。數(shù)據(jù)庫(kù)搜索使用UNITY 程序,數(shù)據(jù)庫(kù)為自己課題組所構(gòu)建,2 個(gè)藥效團(tuán)模型篩選得到177 個(gè)完全不同的分子,生物活性檢測(cè)發(fā)現(xiàn)其中有3 個(gè)分子具有較高的活性。,[例]對(duì)MC 增生抑制劑的篩選,腎小球毛細(xì)血管中的血管系膜細(xì)胞(mesangial cell,MC)的增生與許多血管疾病的發(fā)生有關(guān)。2001年,Kurogi 等采用基于藥效團(tuán)的數(shù)據(jù)庫(kù)搜索對(duì)MC 增生抑制劑

46、進(jìn)行了篩選,研究組從現(xiàn)有抑制劑出發(fā),藥效團(tuán)識(shí)別采用CATALYST,構(gòu)建了包含7 個(gè)藥效特征元素的藥效團(tuán)模型。然后CATALYST 搜索了包含47 045 個(gè)分子的數(shù)據(jù)庫(kù),得到41 個(gè)命中結(jié)構(gòu),生物活性檢測(cè)其中4 個(gè)化合物具有明顯的MC 增生抑制活性。,三、基于定量構(gòu)效關(guān)系的虛擬篩選,定量構(gòu)效關(guān)系方法及篩選,定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR)研究方法在現(xiàn)

47、代藥物設(shè)計(jì)方法中占有重要的地位,也是應(yīng)用最為廣泛的藥物設(shè)計(jì)方法。其目的是采用數(shù)理統(tǒng)計(jì)的方法研究和揭示化合物的活性與其分子理化性質(zhì)之間的定量變化規(guī)律。傳統(tǒng)的二維定量構(gòu)效關(guān)系方法,如Hansh 法、模式識(shí)別Free-Wilson 法、電子拓?fù)浞ǖ仍缫褳榇蠹宜熘?。隨著QSAR 理論及統(tǒng)計(jì)方法的發(fā)展,反映更加豐富信息的三維定量構(gòu)效關(guān)系方法如比較分子場(chǎng)分析(CoMFA)方法、距離幾何法及分子形狀分析方法等都迅速得到了廣泛應(yīng)用。,基于定量構(gòu)效關(guān)系

48、篩選的方法也是最早發(fā)展起來(lái)的虛擬篩選方法,并已由平面的2D 發(fā)展至空間的3D 模式。利用軟件(如Tripos 公司的CoMFA 或Accelrys 公司的CATALYST)分析一系列已知化合物的各種性質(zhì)、理化指標(biāo),構(gòu)建定量構(gòu)效關(guān)系。在構(gòu)效關(guān)系確定之后,即可應(yīng)用于搜索各類數(shù)據(jù)庫(kù),篩選常使用的有Cerius2 中的Diversity 模塊。,實(shí) 例,磺酰脲類除草劑最初開發(fā)在20 世紀(jì)70 年代,當(dāng)時(shí)由于目標(biāo)受體ALS 酶的三維結(jié)構(gòu)尚不確

49、定,南開大學(xué)李正名教授課題組從配體出發(fā),選定了32 個(gè)化合物進(jìn)行構(gòu)效關(guān)系研究。利用分子模擬與設(shè)計(jì)軟件包SYBYL 中的CoMFA 構(gòu)建了相應(yīng)的三維定量構(gòu)效關(guān)系模型。利用此模型以及Cerius2 的Diversity 模塊進(jìn)行數(shù)據(jù)庫(kù)的虛擬篩選及活性預(yù)測(cè),并挑選出20 個(gè)預(yù)測(cè)活性高的化合物進(jìn)行合成,取得了較好的結(jié)果。,四、 基于藥代動(dòng)力學(xué)的虛擬篩選,在傳統(tǒng)的藥物設(shè)計(jì)流程中,對(duì)于候選化合物最關(guān)心的往往是其能否與靶酶的活性位點(diǎn)結(jié)合,至于這個(gè)化

50、合物能否在腸道溶解、透過(guò)細(xì)胞膜達(dá)到有效部位等問題考慮的并不多。這也直接導(dǎo)致了在過(guò)去20 年,世界前50 強(qiáng)制藥企業(yè)每年平均花費(fèi)75 億美元僅開發(fā)出21 個(gè)上市新藥,而真正能上市的藥物與候選藥物的比例始終保持在1/10,其中原因絕大部分出在藥代動(dòng)力學(xué)或安全(化合物毒性)問題上。因此,在藥物研制的早期階段對(duì)化合物的藥代動(dòng)力學(xué)和毒性進(jìn)行全面的評(píng)價(jià)也是十分重要的。,得到藥代動(dòng)力學(xué)模型通常包含3 個(gè)步驟:(1)利用小型化技術(shù)(miniatur

51、ization)制作一系列體外培養(yǎng)基。(2)借助計(jì)算機(jī)虛擬篩選一系列化合物,并對(duì)這些培養(yǎng)基進(jìn)行評(píng)價(jià)。(3)對(duì)預(yù)測(cè)模型進(jìn)行實(shí)際檢驗(yàn)并修正,從而這些虛擬模型將最終取代真實(shí)體內(nèi)或體外實(shí)驗(yàn),成為篩選的模型。,Chris Lipinski 及其合作者通過(guò)高通量篩選以及組合化學(xué)取樣,分析了WDI 中的2 245 個(gè)藥物。為了查明普通口服藥物的共同特性,總結(jié)出了著名的Chris Lipinski “5 規(guī)則”,包括分子量不能超過(guò)500、油水分配系

52、數(shù)CLogP 小于5 等。,基于藥代動(dòng)力學(xué)篩選較快捷,主要針對(duì)整個(gè)數(shù)據(jù)庫(kù),通常先于藥效團(tuán)篩選、對(duì)接篩選。因此篩選條件應(yīng)盡量完善,否則很可能剔除潛在先導(dǎo)化合物。除上述“5 規(guī)則”之外,可極化表面積(PSA,一般應(yīng)小于140.2)、在生理?xiàng)l件下油水分配系數(shù)、溶解度、在小腸及腦滲透率都應(yīng)是被考慮的篩選條件,這樣才能保證整個(gè)虛擬篩選過(guò)程準(zhǔn)確性、高效性。,除了上述4 種篩選方法外,還有其它數(shù)據(jù)庫(kù)搜索技術(shù),如子結(jié)構(gòu)匹配篩選、相似性搜索等,這些技術(shù)都

53、已經(jīng)在一些虛擬篩選實(shí)例中得到應(yīng)用。,虛擬藥物篩選面臨的問題,(1)整個(gè)化學(xué)空間十分龐大,人們對(duì)于絕大部分化合物的生物性質(zhì)還不是很清楚或知之甚少。因此所篩選的數(shù)據(jù)庫(kù)通常是依據(jù)經(jīng)驗(yàn)選擇自己所了解的庫(kù),從而給篩選結(jié)果帶來(lái)很大的局限性。(2)受體模型經(jīng)常是一個(gè)十分復(fù)雜的結(jié)構(gòu),例如蛋白質(zhì)、多糖,包含成千上萬(wàn)個(gè)原子,而且在正常體液中一般處于流動(dòng)狀態(tài),因此時(shí)刻都在改變其構(gòu)象。假如以某個(gè)受體采用基于分子對(duì)接的篩選,則必須考慮受體構(gòu)象以及配體構(gòu)象的變化

54、情況。然而分子的構(gòu)象數(shù)隨著柔性鍵的數(shù)目成指數(shù)增長(zhǎng),并且虛擬篩選通常面對(duì)的是包含眾多數(shù)目化合物的數(shù)據(jù)庫(kù),因此計(jì)算量十分巨大。在現(xiàn)有的計(jì)算條件下,仍是一個(gè)值得考慮的問題。(3)結(jié)合自由能是評(píng)價(jià)藥物與受體結(jié)合的指標(biāo),雖然結(jié)合自由能的計(jì)算較為復(fù)雜,但是用熱力學(xué)積分法計(jì)算同類配體與受體的結(jié)合自由能還是可行的。然而數(shù)據(jù)庫(kù)中小分子數(shù)量很多,而且相互之間基本無(wú)關(guān)聯(lián),因而計(jì)算如此多的小分子與受體結(jié)合自由能的計(jì)算量是十分驚人的。,結(jié)語(yǔ),虛擬篩選是創(chuàng)新藥物

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論