近日,針對(duì)計(jì)算離散測(cè)度之間的最優(yōu)傳輸問題,高性能計(jì)算部科研人員提出了一種多尺度稀疏Sinkhorn算法,改進(jìn)了原來的多尺度Sinkhorn算法。通過統(tǒng)一計(jì)算設(shè)備架構(gòu)(CUDA)實(shí)現(xiàn)并優(yōu)化了該算法并應(yīng)用于圖片間的顏色傳輸。該研究成果被國(guó)際頂級(jí)會(huì)議IEEE Conference on Computer Vision and Pattern Recognition(CVPR,CCF A類)錄用。論文第一作者為高性能部博士生陳逸東,導(dǎo)師為陸忠華研究員。
最優(yōu)傳輸用于表示兩個(gè)分布的相似程度,在金融、統(tǒng)計(jì)、物理和機(jī)器學(xué)習(xí)等領(lǐng)域中具有十分重要作用。計(jì)算概率分布之間的最優(yōu)傳輸在算法研究中具有非常高的熱度。采用商業(yè)求解器Cplex求解器計(jì)算兩張像素為256*256圖片間的最優(yōu)傳輸大約需要數(shù)個(gè)小時(shí),消耗接近100GB內(nèi)存。
基于此,研究人員提出了一種在稀疏子集上迭代的算法,并提出了一種多尺度的方法來估計(jì)稀疏子集。研究人員證明了算法的收斂性,通過構(gòu)造李雅普諾夫泛函,得到了所提算法收斂速率的上界估計(jì)。研究人員通過采用核函數(shù)截?cái)喾▉碛?jì)算子集,并首次給出了截?cái)嘞禂?shù)的上界,這是迄今理論上所獲最佳結(jié)果。通過在CUDA上實(shí)現(xiàn)并優(yōu)化該算法,使得計(jì)算256*256的圖片之間最優(yōu)傳輸?shù)臅r(shí)間縮短到了3秒以內(nèi),顯存消耗低于3GB;計(jì)算時(shí)間較商業(yè)求解器提升了1000倍以上,內(nèi)存消耗減少了30倍。(撰稿:陳逸東)
相關(guān)成果:
Yidong Chen, Chen Li, Zhonghua Lu, Computing Wasserstein-p Distance Between Images with Linear Cost. IEEE Conference on Computer Vision and Pattern Recognition. 2022.

圖1 采用多尺度方法估計(jì)子集

圖2 不同求解器計(jì)算時(shí)間與消耗內(nèi)存對(duì)比

圖3 1920*1200圖片的最優(yōu)傳輸與顏色傳輸計(jì)算