隨著高性能計(jì)算與人工智能融合發(fā)展的不斷深入,三維電磁數(shù)值模擬在雷達(dá)、光子晶體、地球物理勘探等領(lǐng)域的需求日益增長(zhǎng)。作為電磁仿真中的核心方法之一,Crank-Nicolson有限差分時(shí)域(CN-FDTD)方法因其無條件穩(wěn)定性特性,廣泛應(yīng)用于大規(guī)模長(zhǎng)時(shí)間模擬。然而,該方法在每一步時(shí)間推進(jìn)中需求解由雙旋度算子構(gòu)成的大型稀疏線性系統(tǒng),計(jì)算開銷巨大,成為限制其工程應(yīng)用的瓶頸。
近日,我中心高性能計(jì)算部科研團(tuán)隊(duì)提出了一種基于離散變換的子域精確預(yù)處理系統(tǒng)——FlashMP,用于高效求解CN-FDTD方法中的線性系統(tǒng)。該方法首次在GPU集群上實(shí)現(xiàn)了對(duì)電磁方程預(yù)處理求解的實(shí)用加速,顯著提升了大規(guī)模電磁模擬的計(jì)算效率。

基于離散變換與低秩修正的子域精確求解
FlashMP通過奇異值分解(SVD)將雙旋度算子解耦為格點(diǎn)子系統(tǒng),在每個(gè)子域內(nèi)構(gòu)建精確求解器作為預(yù)處理器,顯著降低了迭代次數(shù)。同時(shí),針對(duì)邊界誤差問題,團(tuán)隊(duì)設(shè)計(jì)了一種低秩修正策略。該方法在多GPU環(huán)境下具備良好的可擴(kuò)展性,支持上千GPU并行計(jì)算。實(shí)驗(yàn)結(jié)果表明,在AMD MI60 GPU集群上,FlashMP與主流迭代求解器BiCGSTAB和GMRES結(jié)合使用,相比無預(yù)處理情況,可將迭代次數(shù)減少高達(dá)16倍,整體求解速度提升2.5至4.9倍。在1000 GPU規(guī)模下,FlashMP仍保持84.1%的并行效率,展現(xiàn)出優(yōu)異的弱擴(kuò)展性能。
該研究成果已被IEEE International Conference on Computer Design (ICCD) (CCF B)錄用并發(fā)表。論文第一作者為高性能計(jì)算部博士研究生張浩源,通訊作者為張鑒研究員。本研究得到了中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(XDB0500101)的支持。
相關(guān)成果:Zhang H, Gao Y, Zhang X, Li J, Jin R, Chen Y, Zhang F, Yuan W, Ma W, Liang S, Zhang J, Lu Z. FlashMP: A Fast Discrete Transform-Based Solver for Preconditioning Maxwell's Equations on GPUs[C]//Proceedings of the IEEE International Conference on Computer Design (ICCD). 2025.
責(zé)任編輯:郎楊琴