拓?fù)洳牧涎芯渴悄蹜B(tài)物理與材料科學(xué)的前沿領(lǐng)域,對新一代電子器件和量子計(jì)算技術(shù)發(fā)展具有重要意義。
近日,中心高性能計(jì)算部與中國科學(xué)院物理研究所合作,共同開發(fā)出基于大語言模型和多源知識增強(qiáng)的拓?fù)洳牧现悄軉柎鹂蚣?/span>TopoChat。該系統(tǒng)構(gòu)建了拓?fù)洳牧现R圖譜(TopoKG),整合Materiae、Materials Project等權(quán)威數(shù)據(jù)庫的2.8萬余條拓?fù)洳牧蠑?shù)據(jù),支持精確屬性查詢與智能推薦。同時(shí)引入文獻(xiàn)聚類增強(qiáng)檢索機(jī)制,基于語義相似性匹配、社區(qū)發(fā)現(xiàn)和中心性篩選技術(shù),實(shí)現(xiàn)相關(guān)學(xué)術(shù)文獻(xiàn)的智能檢索與知識片段提取。通過設(shè)計(jì)結(jié)構(gòu)化提示詞策略,TopoChat實(shí)現(xiàn)了結(jié)構(gòu)化知識與非結(jié)構(gòu)化文獻(xiàn)信息的高效融合,顯著提升了專業(yè)領(lǐng)域問答的準(zhǔn)確性與可靠性?;?/span>Qwen2.5、DeepSeek-V3和DeepSeek-R1等主流大模型,系統(tǒng)在材料科學(xué)問答任務(wù)中準(zhǔn)確率分別達(dá)到68.62%、70.62%和93.54%,顯著優(yōu)于基座模型性能,為材料科學(xué)研究提供了高效、可擴(kuò)展的智能問答解決方案。該研究成果為知識增強(qiáng)型大語言模型在專業(yè)科學(xué)領(lǐng)域的應(yīng)用提供了重要技術(shù)路徑。
該研究成果發(fā)表于Journal of Computer Science and Technology(JCST,CCF推薦B類期刊)。中心博士研究生許黃超為論文第一作者,張寶花高級工程師為共同通訊作者。該研究得到國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目支持。

TopoChat框架示意圖
相關(guān)成果:
Xu HC, Zhang BH, Jin Z?et al. TopoChat: Enhancing ftopological materials retrieval with large language model and multisource knowledge. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2026. DOI: 10.1007/s11390-025-5113-9
責(zé)任編輯:郎楊琴