財聯(lián)社9月29日訊(編輯 唐葉天)當?shù)貢r間9月30日,特斯拉的第二個AI Day即將在美國加州開啟,其中最大的看點就是馬斯克調(diào)用Autopilot團隊趕工的特斯拉機器人“擎天柱”原型機首次亮相。而除此之外,特斯拉還預告了“老本行”自動駕駛領(lǐng)域的新進展,包括最受關(guān)注的Dojo超級計算機。
在2021年的AI Day上,特斯拉透露它正在構(gòu)建Dojo超級計算機,其中每個節(jié)點都有自己的CPU、內(nèi)存和通信接口。Dojo超級計算機的單個訓練模塊由25個D1芯片組成,D1是特斯拉自主研發(fā)的神經(jīng)網(wǎng)絡(luò)訓練芯片,單芯片在BF16精度下算力高達362 TFLOPs,功耗卻只有400W,兼具GPU級別的訓練能力和CPU級別的可控性。D1理論上可以無限疊加為超級計算集群。
造汽車的特斯拉,為何要自研芯片?
自動駕駛是智能硬件和軟件結(jié)合的科技尖端技術(shù),為了實現(xiàn)最大協(xié)同,超級計算機Dojo(譯為“道場”)應(yīng)運而生,目的是“訓練”特斯拉汽車。有海外科技博主表示,特斯拉的目標就是制造一款針對其大量視頻AI需求進行自動駕駛優(yōu)化的超級計算機。
如果說此前以純視覺為基礎(chǔ)的完全自動駕駛(FSD)芯片解決的是車端的問題,Dojo所解決的就是云端的深度學習、最終指向純視覺基礎(chǔ)的完全自動駕駛。來自全球超100萬輛特斯拉車輛采集的真實數(shù)據(jù)匯聚在超級計算機上,進行深度機器學習,再反饋給神經(jīng)學習系統(tǒng),幫助特斯拉的Autopilot實現(xiàn)無限“進化”。
時間來到今年,在2022年8月底的Hot Chips 34 (HC34) 大會上,特斯拉已提前分享了Dojo超級計算機的全新面貌。特斯拉在大會上進行的兩場演講一場是關(guān)于Dojo的微架構(gòu),另一場是關(guān)于Dojo的System-on-Wafer解決方案。與會人員認為今年的AI Day上,關(guān)于Dojo的更多細節(jié)將公開。
英偉達的“重磅炸彈”Thor:算力較現(xiàn)行版本提升8倍
無獨有偶,剛剛發(fā)布了40系顯卡的英偉達,也在2022秋季GTC大會上拋出了“重磅炸彈”:自動駕駛芯片DRIVE Thor。
據(jù)黃仁勛介紹,這組被命名為“雷神”的超級計算機在算力上達到了2000 TOPS和2000 TFLOPs,只靠一個基于Thor芯片的系統(tǒng),就能夠運行自動駕駛、數(shù)字儀表盤/車機、車載信息娛樂一整套系統(tǒng)。據(jù)稱,Thor的算力是上一代特斯拉FSD芯片的14倍。
同時,Drive Thor也是英偉達第一個具有Transformer引擎的自動駕駛汽車計算平臺。Transformer引擎在“雷神”GPU單元的H100 Tensor Core中運行,能夠極大提升車載算力的性能,降低了對云端服務(wù)器和連通性的要求。黃仁勛介紹,“車載計算資源的集中化可以將成本降低數(shù)百美元”。無疑,這是英偉達CPU、GPU、引擎技術(shù)協(xié)同的巔峰。
Thor的誕生,取代了英偉達DRIVE原本發(fā)展路線圖中的Atlan,能夠與目前被用于量產(chǎn)汽車、可提供每秒254萬億次浮點運算性能的DRIVE Orin無縫銜接。至于為什么用Thor取代Atlan,黃仁勛解釋稱:“因為出現(xiàn)了令人不可思議的Hopper、AdaGPU和Grace GPU,我們不愿意為此再等兩年,于是決定用Thor取代Atlan,并集成了最新的技術(shù),有了Thor超級芯片。”
目前國產(chǎn)新勢力龍頭蔚來、小鵬等公司的高端車型所搭載的,就是單顆算力為254TOPS的芯片Orin。而現(xiàn)在Thor的算力,較Orin提升了8倍。極氪成為了第一個宣布要搭載Thor的汽車品牌,約于2025年初開始生產(chǎn)。
自動駕駛芯片頂流爭霸,國產(chǎn)新秀紛紛嶄露頭角
這一行業(yè)中也不乏國產(chǎn)玩家。目前世界上主要自動駕駛芯片廠商除了特斯拉、英偉達,還包括Mobileye、高通等國外廠商和地平線、黑芝麻、華為等國內(nèi)廠商。國產(chǎn)自動駕駛芯片已在嶄露頭角,華為2021年發(fā)布的昇騰 810算力高達400+Tops,黑芝麻將在今年內(nèi)推出算力突破250+ Tops的A2000自動駕駛芯片。
申萬宏源汽車團隊表示,目前的“軟件定義汽車”浪潮下,前裝硬件算力需求增大,高算力芯片成為高級別自動駕駛車型主流選擇。在汽車智能化過程中,高算力需求體現(xiàn)在以下三點:①從自動駕駛芯片來看,目前多種類攝像頭、雷達等車載傳感器搭載數(shù)量提升趨勢明顯,同時伴隨未來自動駕駛級別攀升至L3及以上,芯片高算力會是核心需求。
但單純的芯片算力并不能完全代表自動駕駛能力,也要考慮對算力調(diào)用的效率。因此申萬宏源認為,以專業(yè)化架構(gòu)+軟硬結(jié)合的方式實現(xiàn)芯片的高實用性能或成為未來芯片廠商的主流方案。 同時未來的自動駕駛也需要更加開放,一家公司不可能獨攬功能與算法的定義,行業(yè)需要更加合作,才能促使自動駕駛的落地。芯片行業(yè)產(chǎn)業(yè)鏈有望由垂直式鏈條走向“朋友圈”式更開放、更靈活的路徑。
其還認為,面對未來的不確定性,還會需要芯片算力與功能的冗余,芯片算力的軍備競賽還會持續(xù),尤其是在自動駕駛領(lǐng)域,自動駕駛的感知與執(zhí)行器件需要為未來考慮。當下的“硬件預埋”也是這個道理。
“掌”握科技鮮聞 (微信搜索techsina或掃描左側(cè)二維碼關(guān)注)