Inter發布新一代AI加速器Gaudi 3,對標NVIDIA H00,官方稱Gaudi 3與NVIDIA H00對比,LLM大模型推理領先50%,訓練時間領先40%,性價比超越NVIDIA高達200%。
Gaudi 3 制造工藝采用臺積電5nm,MME高達8個,MME的TPC擁有8個,總數共計擁有64個,媒體編碼器擁有14個。MME BF16/FP8都是1835 TFlops,矢量BF16為28.8 TFlops,較之前分別提升至320%、110%、160%。
開發方面,Gaudi 3 無縫兼容PyTorch框架、Hugging Face Transformer和擴展模型。
Gaudi3 支持三種形態部署,標準夾層版最高被動散熱峰值功耗900W,液冷峰值功耗1200W;通用基板支持八顆Gaudi 3;HL-338擴展卡可四卡互聯,PCIe 5.0 x16,被動散熱峰值功耗600W。
新浪科技公眾號
“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)