文/羊城晚報全媒體記者 王丹陽
圖/羊城晚報全媒體記者 湯銘明 曾育文
近日,工業(yè)和信息化部公示了《人工智能賦能新型工業(yè)化典型應(yīng)用入選案例名單》,總部位于廣州的佳都科技申報的“自成長大模型賦能城市軌道交通智能運維生態(tài)系統(tǒng)”成功入選。這個全球首個交通行業(yè)AI大模型究竟是怎樣煉成的?有何不一樣?
“全球首個”有多威?
記者想要了解這個全球首個交通行業(yè)AI大模型究竟有何“過人之處”,卻很難在辦公室約到受訪者——從普通員工到技術(shù)高管,不是當(dāng)“鋼鐵超人”不眠不休在實驗室攻關(guān)研發(fā),就是如“空中飛人”一般在全國各地的真實場景應(yīng)用中去解難題。
“好幾個周末都沒休息,每天都沒時間睡覺。”佳都科技AI首席科學(xué)家、85后的王凱,僅在2024年的最后一周,7天就要高鐵加飛機,跑滿5座城市。“你給我一周21天,我21天都能干滿。”他的聲音略顯嘶啞,雙目卻炯炯有神。
如此高效忙碌的背后,藏著令人驚艷的成績單:全球首個特大城市交通數(shù)字孿生系統(tǒng)、全球首個交通行業(yè)AI大模型都來自這里;僅經(jīng)過為期6個月攻關(guān),全球首個“交通大模型”就開啟推動算力、算法、數(shù)據(jù)、行業(yè)應(yīng)用四位一體AI大模型產(chǎn)品化落地;今年6月,被譽為“大模型全家桶”的佳都知行交通大模型V2.0上線,涵蓋十億至千億不同參數(shù)規(guī)模;目前,全國已開通地鐵的58座城市中,有44個城市有佳都的產(chǎn)品和服務(wù)。產(chǎn)業(yè)鏈正布局出海,未來將在東南亞、中東等地區(qū)輻射國際市場。
研發(fā)直面市場需求
持續(xù)不斷的創(chuàng)新從哪里來?從王凱和他的團隊“知行”中,能找到答案:研發(fā)“人無我有”,直面需求“接地氣”。
來自“廣東造”的佳都知行交通大模型,有這些特征:參數(shù)規(guī)格覆蓋十億至千億、可基于純國產(chǎn)算力進行訓(xùn)練與推理、具備從0到1訓(xùn)練大模型的能力、不依賴任何國外開源代碼……
“最大的挑戰(zhàn)是不單單要把一個模型從0到1訓(xùn)練出來,更重要的是能夠讓這個大模型真正部署在關(guān)系國計民生的場景中。”王凱表示,無論是上百萬元,還是數(shù)千元,他和AI大模型研發(fā)團隊都可以針對客戶可行的成本來進行“量體裁衣”,為他們基于可用的國產(chǎn)算力來進行適配部署。
公共交通、軌道交通的場景萬千,現(xiàn)實場景的定制化需求也“千奇百怪”。為此,王凱和團隊,不分晝夜地密集研發(fā),把大模型從預(yù)訓(xùn)練、指令微調(diào)、人工對齊到高效推理,這樣全棧技術(shù)體系的消化掌握,使得這個“粵造”大模型與國內(nèi)一線廠家站在了起跑線上。
以大模型啟動小樣本學(xué)習(xí)為例,傳統(tǒng)算法需要超1萬個樣本,基于大模型的預(yù)訓(xùn)練底座,現(xiàn)在只需400個樣本就可完成定制。之前一個新算法產(chǎn)生需要一個月,現(xiàn)在只需3天。算法準(zhǔn)確率也超過傳統(tǒng)基于小模型的算法,達(dá)到95%。
勇闖“無人之徑”
廣東制造要成為全球制造業(yè)頂流,科研創(chuàng)新是必選項。
擁有敢吃“螃蟹”的自信,無懼“卡脖子”,也是佳都AI研發(fā)團隊的“知行”答案。
作為清華-加州理工學(xué)院聯(lián)合培養(yǎng)的博士,曾入職中國科學(xué)院從事學(xué)術(shù)科研,也曾當(dāng)創(chuàng)業(yè)者多年的王凱坦言,用英偉達(dá)的算力來訓(xùn)練大模型,在業(yè)界很多團隊都可以做。但如果切換成純國產(chǎn)算力,在國產(chǎn)千卡集群上面完成大模型的預(yù)訓(xùn)練,在業(yè)界卻是一條沒有過多參考輔導(dǎo)和幫助的“無人之徑”。
“當(dāng)走過這樣一個過程,就可以無懼未來美國對我們‘卡脖子’。”王凱介紹,國產(chǎn)算力MFU(模型算力利用率)已接近上一代英偉達(dá)算力的水準(zhǔn)。
在王凱看來,廣東之所以能出現(xiàn)“全球首個”創(chuàng)新,得益于良好的創(chuàng)新土壤。以佳都科技為例,作為廣州人工智能產(chǎn)業(yè)鏈的鏈主單位,只有與產(chǎn)業(yè)鏈上下游的緊密溝通,與“人工智能+”兄弟企業(yè)頻繁互動,才能啟發(fā)更多場景和應(yīng)用機會,在實踐中解決真實問題。
王凱說自己2024年最難忘的一件事,是團隊經(jīng)過日夜攻關(guān),在國產(chǎn)千卡智算集群完成大模型訓(xùn)練驗證的那一刻。意味著即使沒有用英偉達(dá)的算力,也能夠很自信地基于國產(chǎn)集群來做大模型的從0到1的訓(xùn)練。
“這樣的自信無比珍貴。”他說。
在產(chǎn)業(yè)互聯(lián)網(wǎng)時代大背景下,不斷夯實核心競爭力,蓄勢待發(fā)……制造大省挑大梁,廣東人工智能與工業(yè)制造等場景正在深度融合,向“新”實踐。
編輯:鄭健龍
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)