我中心在GPU加速電磁模擬預(yù)處理技術(shù)方面取得進(jìn)展

2025-11-27 14:31 | 【放大縮小】 |

隨著高性能計(jì)算與人工智能融合發(fā)展的不斷深入，三維電磁數(shù)值模擬在雷達(dá)、光子晶體、地球物理勘探等領(lǐng)域的需求日益增長(zhǎng)。作為電磁仿真中的核心方法之一，Crank-Nicolson有限差分時(shí)域（CN-FDTD）方法因其無條件穩(wěn)定性特性，廣泛應(yīng)用于大規(guī)模長(zhǎng)時(shí)間模擬。然而，該方法在每一步時(shí)間推進(jìn)中需求解由雙旋度算子構(gòu)成的大型稀疏線性系統(tǒng)，計(jì)算開銷巨大，成為限制其工程應(yīng)用的瓶頸。

近日，我中心高性能計(jì)算部科研團(tuán)隊(duì)提出了一種基于離散變換的子域精確預(yù)處理系統(tǒng)——FlashMP，用于高效求解CN-FDTD方法中的線性系統(tǒng)。該方法首次在GPU集群上實(shí)現(xiàn)了對(duì)電磁方程預(yù)處理求解的實(shí)用加速，顯著提升了大規(guī)模電磁模擬的計(jì)算效率。

基于離散變換與低秩修正的子域精確求解

FlashMP通過奇異值分解（SVD）將雙旋度算子解耦為格點(diǎn)子系統(tǒng)，在每個(gè)子域內(nèi)構(gòu)建精確求解器作為預(yù)處理器，顯著降低了迭代次數(shù)。同時(shí)，針對(duì)邊界誤差問題，團(tuán)隊(duì)設(shè)計(jì)了一種低秩修正策略。該方法在多GPU環(huán)境下具備良好的可擴(kuò)展性，支持上千GPU并行計(jì)算。實(shí)驗(yàn)結(jié)果表明，在AMD MI60 GPU集群上，FlashMP與主流迭代求解器BiCGSTAB和GMRES結(jié)合使用，相比無預(yù)處理情況，可將迭代次數(shù)減少高達(dá)16倍，整體求解速度提升2.5至4.9倍。在1000 GPU規(guī)模下，FlashMP仍保持84.1%的并行效率，展現(xiàn)出優(yōu)異的弱擴(kuò)展性能。

該研究成果已被IEEE International Conference on Computer Design (ICCD) (CCF B)錄用并發(fā)表。論文第一作者為高性能計(jì)算部博士研究生張浩源，通訊作者為張鑒研究員。本研究得到了中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)（XDB0500101）的支持。

相關(guān)成果：Zhang H, Gao Y, Zhang X, Li J, Jin R, Chen Y, Zhang F, Yuan W, Ma W, Liang S, Zhang J, Lu Z. FlashMP: A Fast Discrete Transform-Based Solver for Preconditioning Maxwell's Equations on GPUs[C]//Proceedings of the IEEE International Conference on Computer Design (ICCD). 2025.

責(zé)任編輯：郎楊琴

附件下載

上一篇:我中心與廣東車八嶺保護(hù)區(qū)管理局簽署科技合作協(xié)議下一篇:中國(guó)科技云大模型API平臺(tái)新上線Deepseek-OCR模型服務(wù)