NVIDIA 攜手微軟，推出滿足 AI 雲端運算需求的超大規模 GPU 加速器

由

2019-06-13

顯示晶片生產廠輝達商 (NVIDIA) 在 9 日宣布，將攜手軟體大廠微軟 (Microsoft)，發展全新專為驅動人工智慧 (AI) 雲端運算的超大規模 (hyperscale) GPU 加速器藍圖「HGX-1 」。全新 HGX-1 架構的設計是為滿足 AI 雲端運算的需求需求而來。其範圍包含自動駕駛、個人醫療照護、超越人類的語音辨識、數據與影像分析以及分子模擬等應用。

輝達表示，全新 HGX-1 是一款結合微軟 Project Olympus 開源設計的超大規模 GPU 加速器，提供超大規模資料中心於人工智慧快速且具彈性的途徑。而且，HGX-1 適用於建構在雲端運算上的人工智慧作業，如同二十多年前為 PC 主機板所推出 ATX (Advanced Technology eXtended) 時的角色一般，HGX-1 建立了一項業界標準，能快速且有效的被採用以協助達到急速增長的市場需求。

輝達共同創辦人暨執行長黃仁勳表示，AI 為全新的運算模型，因此需要全新的架構支援。HGX-1 超大規模 GPU 加速器在 AI 雲端運算所扮演的角色，如同過去 ATX 標準使現在 PC 能夠普及一樣。HGX-1 將使雲端服務供應商能更輕易的透過 NVIDIA GPU 滿足激增的 AI 運算需求。

微軟公司總經理，暨 Azure 硬體基礎架構部門工程師 Kushagra Vaid 也指出，HGX-1 AI 加速器將提供極至的效能擴充，以達成快速成長的機器學習作業負載需求，同時，其特殊的設計使現今全球各地的資料中心皆能輕易採用。對於全球數千家已投資 AI 與採納基於 AI 作業方法的企業與新創公司而言，HGX-1 的架構在雲端上展現了前所未有的配置管理與效能。

根據規劃，未來 HGX-1 在每部主機皆配置 8 顆 NVIDIA Tesla P100 顯示卡。其特色在於使用以 NVIDIA NVLink 互聯技術與 PCle 標準為基礎的創新轉換設計，使 CPU 能夠任意與多顆 GPU 進行連接。這讓在 HGX-1 基礎架構標準化的雲端服務業者，能提供客戶各種 CPU 與 GPU 的機器配置。

由於，雲端作業較以往更加的多樣化且複雜。因此，在 HGX-1 架構下，包括 AI 訓練、推論和高效能運算 (HPC) 作業都可以透過 CPU 連結至不同數量的 GPU，以最佳的方式運行於不同的系統配置中。而不論作業負載量多大，HGX-1 的高度模組化設計，都能使其能以最佳的效能運行。同時，HGX-1 提供較傳統基於 CPU 的伺服器快達 100 倍的深度學習效能，卻僅有五分之一的執行 AI 訓練成本與十分之一的 AI 推論成本。未來，HGX-1 透過與全球各地資料中心合作的高度彈性，提供目前超大規模資料中心用於 AI 領域快速且簡單的途徑。

(首圖來源 : NVIDIA 提供)