浪潮建“NVLink+Volta”的千萬(wàn)億次超級(jí)計(jì)算機(jī)

2017-11-17 11:17 來(lái)源:美通社 作者:Janet

近日,浪潮中標(biāo)華中師范大學(xué),將為其設(shè)計(jì)建造基于“NVLink+Volta”的千萬(wàn)億次超級(jí)計(jì)算機(jī),加速物理前沿科學(xué)和自動(dòng)駕駛AI技術(shù)研究。

這套系統(tǒng)將采用18套浪潮AGX-2超算服務(wù)器作為計(jì)算節(jié)點(diǎn),配置144塊Nvidia最新支持NvLink 2.0的Volta架構(gòu)V100芯片,采用最新的Intel  Xeon SP (Skylake)處理器,通過Mellanox EDR Infiniband網(wǎng)絡(luò)進(jìn)行高速互聯(lián),運(yùn)行浪潮ClusterEngine及AIStation等集群管理套件,系統(tǒng)雙精度浮點(diǎn)性能超過千萬(wàn)億次每秒(1PetaFlops)。由于采用了NVLink2.0高速互聯(lián)技術(shù)和Tesla? V100 GPU,該系統(tǒng)將可同時(shí)很好支持科學(xué)工程計(jì)算和AI計(jì)算。

浪潮AGX-2是全球首款在2U空間內(nèi)高速互聯(lián)集成8顆最高性能GPU的服務(wù)器,在2U空間內(nèi)支持部署8塊NVLink 2.0接口的NVIDIA Tesla? V100 GPU,GPU間單向互聯(lián)帶寬高達(dá)150GB/s,總帶寬達(dá)300GB/s。同時(shí), AGX-2具備良好的I/O擴(kuò)展能力,提供8塊NVMe/SAS/SATA熱插拔硬盤,可支持最多4塊100Gbps的EDR InfiniBand接口卡的高速集群互聯(lián),不僅支持通常的風(fēng)冷散熱方式,還可支持片上水冷以提供更高的計(jì)算能效比。

AGX-2可以極大提升HPC應(yīng)用計(jì)算效率,其單機(jī)雙精度浮點(diǎn)計(jì)算性能突破60萬(wàn)億次每秒。以凝聚態(tài)物理學(xué)和材料科學(xué)領(lǐng)域廣泛使用的VASP軟件為例,在AGX2上使用1塊P100 GPU加速卡,即可達(dá)到使用8臺(tái)雙路主流CPU計(jì)算集群的性能,同時(shí),AGX2提供的Nvlink高通信帶寬使其在多GPU卡并行效率上有出色表現(xiàn),4塊P100 GPU卡并行即可達(dá)到近20臺(tái)雙路主流CPU計(jì)算集群的性能。

在AI計(jì)算上,AGX-2搭載的Tesla V100 配備了深度學(xué)習(xí)高度相關(guān)的Tensor 單元,Tensor 性能可以達(dá)到 120 TFLOPS,配合NVLink 2.0可極大提升深度學(xué)習(xí)框架的訓(xùn)練性能。基于國(guó)際通用的Imagenet數(shù)據(jù)集進(jìn)行深度學(xué)習(xí)模型訓(xùn)練,浪潮AGX-2上表現(xiàn)出優(yōu)異性能,配置8片V100時(shí)在TensorFlow框架的GoogleNet模型訓(xùn)練速度達(dá)到每秒1898張圖片,是單卡性能的7倍,是同數(shù)量配置P100系統(tǒng)性能的1.87倍。

浪潮 NVLink Volta 千萬(wàn)億次超級(jí)計(jì)算機(jī)

相關(guān)閱讀

暫無(wú)數(shù)據(jù)

一周熱門