計算機如何輔助抗病毒藥物研發(fā)
作者:學CADD的蛋
我原以為,這依然會是一個尋常的寒假。
直到疫情的形勢愈發(fā)嚴峻。
對病毒各類蛋白的調(diào)研任務(wù)分配到遠在五湖四海的每個實驗室成員頭上。沒有瓶瓶罐罐,沒有五花八門的試劑,沒有昂貴精致的儀器。一臺能遠程連上服務(wù)器的電腦,這便是我所擁有的全部。
圖1. 藥物研發(fā)有時只需要一臺能連上服務(wù)器的筆記本(圖片來源:veer圖庫)
很多人以為,藥物的研發(fā)只有在穿著白大褂的實驗室里可以做。然而,隨著近十余年,各類理論方法、計算機硬件、及工業(yè)和學術(shù)專業(yè)軟件的發(fā)展與成熟,計算機輔助藥物設(shè)計(Computer-Aided Drug Design, CADD)的方法已日趨成熟,其應(yīng)用極大地加快了新藥研發(fā)的速度與效率,已成為現(xiàn)代藥物研發(fā)的常規(guī)方法之一[1]。
依賴于這樣的技術(shù),即便我足不出戶,在家遠程工作,也能為尋找治療此次病毒感染的潛在藥物貢獻自己的力量。
尋找關(guān)鍵蛋白質(zhì)
蛋白質(zhì)是生命的物質(zhì)基礎(chǔ),是組成細菌、病毒及動植物的一切細胞、組織的重要成分。各類功能性蛋白質(zhì)在機體中各司其職,維系著整個機體的正常運轉(zhuǎn)。
以病毒為例,病毒是由核酸(DNA或RNA)與蛋白質(zhì)構(gòu)成的非細胞形態(tài),介于生命體與非生命體之間,無法自我復(fù)制與繁殖,需要寄生在活的宿主細胞內(nèi),依賴于宿主細胞的原料、能量供給與場所,完成自我的復(fù)制與釋放[2]。這一過程就好比一個A國的賣假鈔的罪犯(病毒),本身沒有印制A國貨幣的能力;但當他侵入B國的印鈔廠(宿主細胞)后,他就能調(diào)用B國工廠的所有資源,來印制A國的貨幣(病毒的核酸與蛋白)。
病毒的生命周期需要經(jīng)歷吸附、侵入、脫殼、生物合成、組裝和釋放等六大步驟[2],病毒的各類功能性蛋白在這些步驟中分工明確、高度協(xié)作,從而才能完成從感染宿主細胞到復(fù)制病毒的整個周期。目前,研究人員已從新型冠狀病毒(2019-nCov)中分離出orf1ab, S, E, M, N等10條基因組序列,各自編碼相應(yīng)的病毒蛋白。
通過與同為冠狀病毒的SARS病毒類比,我們可以合理地推測出新型冠狀病毒基因編碼的各類蛋白質(zhì)的功能。舉例來講,如,orf1ab基因編碼orf1ab多聚蛋白,參與病毒RNA的轉(zhuǎn)錄與復(fù)制,并具有蛋白酶、甲基轉(zhuǎn)移酶等多個功能;S基因編碼冠狀病毒的表面糖蛋白,也稱為棘突蛋白(Spike Protein),通過與人體內(nèi)的ACE2蛋白質(zhì)結(jié)合,直接介導(dǎo)病毒對宿主細胞的感染及融合,這類蛋白如同日冕般分布在病毒的包膜上,“冠狀病毒”由此得名。這些功能性蛋白質(zhì)對病毒的感染與復(fù)制發(fā)揮著重要的作用,單獨或同時干擾其中的一個或多個蛋白質(zhì)的功能,抑制其活性,便能阻斷病毒感染宿主細胞或在宿主細胞內(nèi)自我復(fù)制的進程,從而起到治療的效果。
因此,一旦獲取了病毒蛋白質(zhì)的晶體結(jié)構(gòu),基于前期對其功能的了解,我們便能利用計算機輔助藥物設(shè)計的技術(shù),針對性地尋找潛在的有效藥物。那么,這一過程是如何進行的呢?
魚與刀,鎖與鑰匙
若是“以貌取物”的話,在以“光滑彈嫩”為美的今天,蛋白質(zhì)表面坑坑洼洼,“長得”可實在不算漂亮??汕∈沁@些坑坑洼洼的空腔,才是真正暗藏玄機的地方。
以SARS病毒orf1ab多聚蛋白中的一段,3C-like蛋白酶,也稱Mpro蛋白為例。這一蛋白主要負責將多聚蛋白水解為功能性的多肽,以發(fā)揮其各自的功能;就好比做魚的時候,用一把鋒利的刀把整條魚除鱗去臟,并分為魚頭、魚身、魚尾,分別預(yù)備燉湯、紅燒、清蒸一樣。這一蛋白酶的活性位點,就好比是這把菜刀的刀刃,就藏身于蛋白質(zhì)表面的空腔(口袋)中(圖2)。
圖2. 坑坑洼洼的SARS Mpro蛋白表面(白色)及其蛋白酶活性位點口袋(紅色圓圈),PDB編號2GX4[3](圖片來源:PyMol作圖)
篩選或合成得到的具有生物活性的小分子可以很好地結(jié)合在這一活性位點的口袋中(圖3),從而抑制蛋白酶的活性,阻止其將多聚蛋白切割為功能性多肽,從而阻止這些多肽在后續(xù)病毒的復(fù)制和感染中發(fā)揮功能。就好比沒收了這把切魚的刀,或者在刀刃上套了一層使其鈍化的保護套,使其無法處理這條魚,從而無法進行后續(xù)的烹飪。
圖3. SARS Mpro蛋白表面(白色)及文獻報導(dǎo)的抑制劑(綠色棍狀),PDB編號2GX4[3](圖片來源:PyMol作圖)
對每一個蛋白質(zhì),尋找具有令人滿意的生物活性的分子的過程,就好比是面對一把精美絕倫的鎖,需要找到一把同樣精美絕倫的鑰匙,來與之緊密契合。而計算機輔助藥物設(shè)計所需要做的,就是以高效和低成本的方式,去找到這樣一把合理的鑰匙;即,基于對蛋白質(zhì)功能的前期了解,及對蛋白質(zhì)結(jié)構(gòu)的系統(tǒng)分析,通過計算的方式,評估各類分子在蛋白質(zhì)口袋中的結(jié)合強度和作用模式,從而篩選或設(shè)計出最有可能成為蛋白功能抑制劑(或激動劑)的分子。
計算機輔助藥物發(fā)現(xiàn)
不幸的是,盡管近年來相關(guān)技術(shù)飛速發(fā)展,但找到這樣一把精美絕倫的鑰匙絕非易事。一個新藥從研發(fā)到上市往往需要消耗數(shù)十年的時間和數(shù)以十億計的美金[4]。但好消息是,總有這樣幾把鎖長得有點像,其鑰匙可以通用,就像艾滋病蛋白酶的抑制劑可能可以作用于冠狀病毒的蛋白酶(如奈菲那韋和洛匹那韋),負責埃博拉或流感病毒RNA復(fù)制的RNA聚合酶(RNA-dependent RNA polymerase,RdRp)抑制劑可能可以作用于冠狀病毒的RdRp一樣(如法匹拉韋和瑞德西韋)[5]。
面對急性爆發(fā)的疫情,從已上市或已在臨床上的“老藥物”中尋找合適的分子顯然是相比從頭研發(fā)新的分子更具時間優(yōu)勢的策略。運用計算機輔助藥物設(shè)計,基于一種叫做分子對接(molecular docking)的技術(shù)進行虛擬篩選(virtual screening),我們可以模擬出每個“老藥”分子在病毒蛋白質(zhì)口袋中的結(jié)合構(gòu)象,通過打分函數(shù)、自由能計算等方式評估其理論上的結(jié)合強度,從而分析該分子成為潛在抑制劑的可能性。就好比當我們已知“鎖”的構(gòu)造時,運用這樣的技術(shù),可以不必親自把每把鑰匙都在鎖孔里插一遍來尋找能開鎖的那把;通過計算機模擬分析的方式,篩選出最可能打開鎖的幾把鑰匙,而后只對這幾把鑰匙進行測試就可以了。
甚至于,利用同源模建(homology modeling)的技術(shù),我們甚至可以不用知道當前病毒蛋白這把“鎖”的構(gòu)造,在僅有蛋白質(zhì)氨基酸序列的情況下,構(gòu)建出病毒蛋白質(zhì)結(jié)構(gòu)可能的模型,從而提交虛擬篩選作業(yè)。盡管據(jù)早期的新聞報導(dǎo),2019-nCov病毒和SARS病毒在基因組水平的相似度只有70%,但事實上,通過對病毒蛋白的序列比對可以發(fā)現(xiàn),此次新型冠狀病毒的某些關(guān)鍵蛋白和SRAS病毒的氨基酸同源性能達到95%以上(例,圖4)。因此,依賴于蛋白質(zhì)晶體結(jié)構(gòu)數(shù)據(jù)庫(Protein Data Bank)中,早年研究SRAS病毒時獲得的SARS病毒蛋白的晶體結(jié)構(gòu),我們便可以構(gòu)建出合理的2019-nCov的相應(yīng)蛋白質(zhì)的結(jié)構(gòu)。
圖4. SARS與2019-nCov的Mpro蛋白氨基酸序列比對(圖片來源:BoxShade作圖)
因此,對急性爆發(fā)的疫情,當結(jié)構(gòu)生物學等基礎(chǔ)研究來不及跟上;當病毒毒性太大,實驗室條件受限、滿足生物安全要求的實驗室較少;或者當待測試分子過多,人員不足,成本過高時,計算機輔助的方式都不失為一種高效的策略,為活性分子的發(fā)現(xiàn)與機制探索提供寶貴的建議,從而為特效藥物的研發(fā)贏得寶貴的時間。
寫在最后的話
我自寒假的第三天開始在家參與此次新型冠狀病毒的相關(guān)工作,至今已過去約兩周的時間。無疑,在博士求學生涯即將結(jié)束的階段,這是我度過的最充實、也是最緊張的一個假期。
但正如前文所述,藥物研發(fā),絕非易事。就像早先一些學者所說的“不管疾病有多嚴重,不管我們期待新藥和新疫苗的愿望是多么迫切,新藥和新疫苗開發(fā)的規(guī)律無法被逾越。”[6]藥物研發(fā)有其固有的規(guī)律,絕非人的意志可以轉(zhuǎn)移。盡管如前所述,現(xiàn)今已有多個藥物在進行臨床或臨床前研究[5],但保護好自己不受感染依然是每個人的當務(wù)之急。
所幸相比17年前,我們現(xiàn)在有了天河,有了神威,用于蛋白體系模擬的算力早與當年不可同日而語,一個又一個課題組及科研工作者,毫不猶豫地犧牲了自己的休息時間參與此次攻關(guān)。
也許就像高中政治課本里所說的那樣吧:“道路是曲折的,前途是光明的!”
(2020年2月寫于等服務(wù)器計算結(jié)果的間隙)
參考資料:
1.Jorgensen, W. L., The many roles of computation in drug discovery. Science 2004, 303, 1813.
2.中科院微生物所, 科學大院, 入侵&反擊!病原體和人體的攻防戰(zhàn). https://mp.weixin.qq.com/s/Zh9-8C-hilrlKk8jrVo60g
3.Yang, S.; Chen, S. J.; Hsu, M. F.; et, al., Synthesis, crystal structure, structure-activity relationships, and antiviral activity of a potent SARS coronavirus 3CL protease inhibitor. J. Med. Chem. 2006, 49, 4971.
4.管麗,科學大院,新藥是如何從實驗室走向市場的?https://mp.weixin.qq.com/s/huwBvSKldeBp0TJBnKY_aQ
5.醫(yī)藥魔方, 醫(yī)藥魔方Info, 重磅!Remdesivir新型肺炎臨床試驗2月3日啟動!海正法匹拉韋緊急申報上市. https://mp.weixin.qq.com/s/Y4NaedCA5dBJoTo6ffILhg
6.王立銘, 賽先生, 新藥新疫苗,我們什么時候能等到?https://mp.weixin.qq.com/s/ceuUYGfP6lW_x0w9ziPbvA
文章首發(fā)于科學大院,僅代表作者觀點,不代表科學大院立場。轉(zhuǎn)載請聯(lián)系cas@cnic.cn??茖W大院是中科院官方科普微平臺,由中科院科學傳播局主辦、中國科普博覽團隊運營,致力于最新科研成果的深度解讀、社會熱點事件的科學發(fā)聲。