泛基因組分析是揭示原核生物基因組動態(tài)變化與遺傳多樣性的關(guān)鍵手段,對理解微生物生態(tài)適應(yīng)具有重要意義?,F(xiàn)有方法普遍難以兼顧精度與效率,且多停留在定性層面,缺乏對基因簇進(jìn)化特征的定量刻畫,難以支撐大規(guī)模基因組數(shù)據(jù)的深入研究。因此,開發(fā)兼具高精度、高可擴展性與定量分析能力的新型工具已成為該領(lǐng)域的重要挑戰(zhàn)。
近日,中心高性能計算部與中國科學(xué)院北京基因組研究所(國家生物信息中心)合作共同開發(fā)出原核生物泛基因組分析綜合工具PGAP2。該工具創(chuàng)新性地結(jié)合雙級區(qū)域限制策略與細(xì)粒度特征分析機制,構(gòu)建基因一致性與共線性網(wǎng)絡(luò),實現(xiàn)了直系與旁系同源基因的高效精準(zhǔn)識別,并引入四個定量參數(shù)以刻畫基因簇的進(jìn)化動態(tài)。在多組模擬與標(biāo)準(zhǔn)數(shù)據(jù)集測試中,PGAP2的準(zhǔn)確率超過99%,性能顯著優(yōu)于主流工具,可在數(shù)分鐘內(nèi)完成上千基因組的分析。利用PGAP2,研究團(tuán)隊構(gòu)建了2794株豬鏈球菌的泛基因組圖譜,揭示其開放型泛基因組特征,為病原菌遺傳多樣性與進(jìn)化研究提供了重要支撐。
該研究成果發(fā)表于Nature Communications(中國科學(xué)院一區(qū)/JCR Q1)。中心博士研究生張鳳年為論文共同第一作者,研究員金鐘為共同通訊作者。該研究成果得到國家重點研發(fā)計劃項目、中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項及國家自然科學(xué)基金項目資助。

PGAP2工作流程圖
相關(guān)成果:
Congfan Bu , Hao Zhang , Fengnian Zhang , Wenhao Liang , Hao Gao , Jing Zhao , Fangming Lv , Ruikun Xue , Qian Liu , Zhewen Zhang , Zhong Jin , Jingfa Xiao. PGAP2: A Comprehensive Toolkit for Prokaryotic Pan-Genome Analysis Based on Fine-grained Feature Networks.Nature Communications(2025). https://doi.org/10.24433/CO.9288245.v2.
責(zé)任編輯:郎楊琴