熱搜:win11繞過硬件限制安裝 一鍵重裝Win10系統(tǒng) 最干凈的u盤啟動盤 真正純凈版的win7系統(tǒng)
編輯:alear 2023-01-21 10:19:15 來源于:快科技
大。813.01 MB類別:驅動下載
2022年3月的GTC技術大會上,NVIDIA正式發(fā)布了首款數據中心CPU——Grace,同時打造了兩顆超級芯片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一。
Grace CPU二合一
Grace CPU+Hopper GPU二合一
現在,NVIDIA官方詳細揭示了Grace Superchip超級芯片的設計與性能、能效。
它通過NVLink-C2C芯片間互連總線,將兩顆Grace CPU整合在一塊基板上,彼此之間的雙向帶寬多達900GB/s。
Grace CPU基于Armv9-A 9.0架構、Neoverse V2 64位內核,以4個128-bit功能單元的方式配置了兩組SIMD矢量指令集,一是SVE 2(縮放矢量擴展第二版),二是NEON(高級SIMD)。
它還支持LSE(大型系統(tǒng)擴展),可提供低成本的原子操作,改進CPU通信吞吐。
NVIDIA聲稱,這種核心的能效,是如今服務器常見x86核心的2倍。
Grace CPU單顆集成72個核心,互相通過3.2TB/s超高帶寬的NVIDIA縮放一致性Fabric總線互連,而二合一的超級芯片上就是144個核心。
每核心64KB一級指令緩存、64KB一級數據緩存、1MB二級緩存,一顆超級芯片的所有核心共享234MB三級緩存。
內存整合封裝了LPDDR5X,最大容量960GB,最高帶寬1TB/s(每一顆500GB/s),還支持ECC。
對比傳統(tǒng)的八通道DDR5,這種設計不但帶寬高出53%,單位功耗也只有1/8。
對比海量帶寬的HBM2e,單位成本只有1/3,容量則可達8倍。
擴展支持八組PCIe 5.0 x16,總帶寬1TB/s,還有用于管理的低速PCIe通道。
性能方面,一顆超級芯片的FP64雙精度峰值浮點性能可達7.1TFlops(每秒7.1萬億次計算),熱設計功耗500W。
NVIDIA對比了AMD Zen3架構的霄龍7763 64核心,雙路組成128核心,號稱性能可領先1.5-2.5倍,能效可領先2.0-3.5倍!
當然,AMD已經有了Zen4架構、最多96核心的霄龍9004系列,NVIDIA Grace依然還沒有商用。
發(fā)表評論
共0條
評論就這些咯,讓大家也知道你的獨特見解
立即評論以上留言僅代表用戶個人觀點,不代表系統(tǒng)之家立場