安裝新浪財經客戶端第一時間接收最全面的市場資訊→【下載地址】
美國當地時間11月28日,亞馬遜云科技(AWS)在拉斯維加斯的re:Invent大會上發布了兩款自研芯片Graviton4和Trainium2,并推出企業級AI聊天機器人“Amazon Q”(下稱“Q”)搶占AI硬件市場。
生成式AI熱潮下,盡管云計算廠商對自研AI芯片熱情高漲,但英偉達GPU目前仍是企業進行AI訓練及推理的算力首選。
當天,英偉達創始人兼CEO黃仁勛也穿著標志性的皮衣現身大會現場,與亞馬遜云科技CEO Adam Selipsky一起宣布擴大戰略合作。雙方將聯合推出先進的基礎設施、軟件及服務,包括亞馬遜云科技將支持英偉達最新推出的H200 GPU,托管英偉達的人工智能訓練即服務(AI-training-as-a-service)平臺DGX Cloud。此外,雙方正設計世界上最快GPU驅動的云AI超級計算機,配置16384顆NVIDIA GH200超級芯片,以及構建更多基于英偉達芯片的云實例等,提高生成式AI、HPC高性能計算性能。
作為此次大會的重頭戲,Graviton4和Trainium2分別瞄準數據中心通用計算和人工智能訓練場景。亞馬遜云科技稱,基于Arm架構的服務器芯片Graviton4與前一代Graviton3處理器相比,性能提升30%,獨立核心增加50%以上,內存帶寬提升至少75%。
而Trainium2則是面向AI大模型的高性能訓練芯片,與第一代Trainium芯片相比,Trainium2訓練速度提升至4倍,能夠部署在多達10萬個芯片的計算集群中,大幅降低了模型訓練時間,同時能效提升多達2倍。
據界面新聞了解,目前最先進的大模型通常包含數千億甚至數萬億個參數或變量,這為芯片的計算能力帶來了諸多挑戰,既要保證高性能、安全可靠,也要低成本。Tranium2主要強調的也是低成本、高能效和更快的訓練能力。
Tranium2已有了早期客戶,數據分析平臺公司Databricks以及由亞馬遜支持的OpenAI競爭對手Anthropic都計劃使用Trainium2芯片訓練大模型。
除自研定制芯片外,亞馬遜云科技還推出首個基于生成式AI開發的應用——辦公助手“Q”,可通過聊天方式實現輔助云端開發、服務響應、企業數據查詢等功能。
Q并非面向消費市場,而是圍繞企業需求設計,其定位類似于一個專家助理。但Adam Selipsky特別強調,Q不會使用企業客戶數據來訓練其底層模型,Q的生成結果也不會跨越不同數據權限間的防火墻。Q可以設置為僅對安全團隊的相關安全問題進行響應,非公司內部或與業務無關者,無法獲得安全問題答案。
事實上,在提及亞馬遜云科技此前推出的Bedrock AI基礎模型服務時,Adam Selipsky也重點強調了安全與隱私問題。他還“不點名”地提到了最大競爭對手微軟。
“你不會希望看到云供應商受制于一家模型提供商,而是需要一個真正的選擇……過去10天發生的事件已經非常清楚地表明了這一點。” Adam Selipsky說。他口中的“事件”指的是OpenAI剛剛經歷的一場戲劇性的人事動蕩。
re:Invent至今已舉辦了12年,云市場的競爭環境也增加了很多變量——盡管亞馬遜云科技在公有云領域保持著領先優勢,但競爭對手微軟Azure憑借與OpenAI的深度合作關系,正不斷擴大市場份額。
據市場調查機構Canalys公布的最新報告,亞馬遜云科技今年第二季度占全球云基礎設施服務(IaaS)支出為30%,同比增長12%。與去年同期相比,亞馬遜云科技收入增長已減少一半以上,這也促使該公司加大對人工智能領域投資,以尋找更多增長動力。同期,微軟Azure同比增長了26%,占據26%市場份額,增長率高于亞馬遜云服務。而AI熱潮很可能將進一步促進市場加大對微軟云計算業務的支出,因為Azure承載著OpenAI和Meta等公司的AI計算需求。
責任編輯:李桐
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)