顯示晶片生產廠輝達商 (NVIDIA) 在 9 日宣布,將攜手軟體大廠微軟 (Microsoft),發展全新專為驅動人工智慧 (AI) 雲端運算的超大規模 (hyperscale) GPU 加速器藍圖「HGX-1 」。全新 HGX-1 架構的設計是為滿足 AI 雲端運算的需求需求而來。其範圍包含自動駕駛、個人醫療照護、超越人類的語音辨識、數據與影像分析以及分子模擬等應用。
輝達表示,全新 HGX-1 是一款結合微軟 Project Olympus 開源設計的超大規模 GPU 加速器,提供超大規模資料中心於人工智慧快速且具彈性的途徑。而且,HGX-1 適用於建構在雲端運算上的人工智慧作業,如同二十多年前為 PC 主機板所推出 ATX (Advanced Technology eXtended) 時的角色一般,HGX-1 建立了一項業界標準,能快速且有效的被採用以協助達到急速增長的市場需求。
輝達共同創辦人暨執行長黃仁勳表示,AI 為全新的運算模型,因此需要全新的架構支援。HGX-1 超大規模 GPU 加速器在 AI 雲端運算所扮演的角色,如同過去 ATX 標準使現在 PC 能夠普及一樣。HGX-1 將使雲端服務供應商能更輕易的透過 NVIDIA GPU 滿足激增的 AI 運算需求。
微軟公司總經理,暨 Azure 硬體基礎架構部門工程師 Kushagra Vaid 也指出,HGX-1 AI 加速器將提供極至的效能擴充,以達成快速成長的機器學習作業負載需求,同時,其特殊的設計使現今全球各地的資料中心皆能輕易採用。對於全球數千家已投資 AI 與採納基於 AI 作業方法的企業與新創公司而言,HGX-1 的架構在雲端上展現了前所未有的配置管理與效能。
根據規劃,未來 HGX-1 在每部主機皆配置 8 顆 NVIDIA Tesla P100 顯示卡。其特色在於使用以 NVIDIA NVLink 互聯技術與 PCle 標準為基礎的創新轉換設計,使 CPU 能夠任意與多顆 GPU 進行連接。這讓在 HGX-1 基礎架構標準化的雲端服務業者,能提供客戶各種 CPU 與 GPU 的機器配置。
由於,雲端作業較以往更加的多樣化且複雜。因此,在 HGX-1 架構下,包括 AI 訓練、推論和高效能運算 (HPC) 作業都可以透過 CPU 連結至不同數量的 GPU,以最佳的方式運行於不同的系統配置中。而不論作業負載量多大,HGX-1 的高度模組化設計,都能使其能以最佳的效能運行。同時,HGX-1 提供較傳統基於 CPU 的伺服器快達 100 倍的深度學習效能,卻僅有五分之一的執行 AI 訓練成本與十分之一的 AI 推論成本。未來,HGX-1 透過與全球各地資料中心合作的高度彈性,提供目前超大規模資料中心用於 AI 領域快速且簡單的途徑。
(首圖來源 : NVIDIA 提供)