“2023中國AIGC產業(yè)發(fā)展論壇”于9月4日在北京召開。戴爾科技集團人工智能首席技術架構師吳躍出席并演講。
他表示,智能時代AI應用落地在制造、零售、金融、交通、教育等各個領域正加大探索與實踐,面向AI大模型的AI基礎架構平臺是一個多維度的系統(tǒng)工程,包括計算、存儲、網絡、分布式訓練、集群管理與資源編排,是一個綜合性的平臺。戴爾科技集團正在積極打造面向中國AI應用合作伙伴生態(tài),為客戶提供面向AI應用場景化的解決方案。
以下為本次發(fā)言摘錄:
過去幾年我們對于AI基礎架構技術發(fā)展,AI行業(yè)落地一直在做持續(xù)的觀察和研究,同時我們也在戴爾科技集團內部積極應用各種AI技術,來改善我們的生產和運營,并應用于自己的產品和解決方案之中。
比如我們中國研究院的同事設計的生成式AI應用開發(fā)平臺,把我們過去若干年積累的知識文檔數據,通過矢量數據庫和LangChain與大模型相結合,通過自然語言處理、人機對話的方式進行知識管理和檢索。我們也在將AI技術應用到Dell產品的自動化運維,通過Dell服務器、存儲等產品內置傳感器和定時數據采集,通過AI算法對設備的使用率、運行狀況、健康狀況進行實時監(jiān)控和主動性的維護。
前幾年戴爾科技中國研究院和國家賽艇隊、皮劃艇隊共同成立AI與大數據聯合實驗室,通過人工智能、實時視頻分析技術,結合生物力學模型,對運動員訓練過程中動作力度、角度、穩(wěn)定性偏差進行評判和打分,輔助國家隊科學訓練。
在行業(yè)應用中,戴爾科技集團也在積極協同國內AI應用合作伙伴,為國內用戶提供面向AI應用場景化的解決方案。在制造業(yè)領域里,我們過去幾年在光伏、新能源、智能駕駛等先進制造業(yè)領域都有一些落地的AI項目。以光伏行業(yè)為例,中國光伏裝機量和生產量都位列全球第一。國內一些光伏的頭部用戶,基于GPU計算平臺,通過AI機器視覺算法,對光伏組件生產過程中的各類缺陷進行AI質檢,目前整套系統(tǒng)識別準確率已經超過99.95%。在零售商超行業(yè),在自助結算臺,通過攝像頭結合AI算法,進行結算商品的分類識別,與用戶掃描的二維碼進行匹配,幫助商家在日常結算過程中減少流水損失。
無論是過去幾年做過的AI應用,還是今天我們討論的基于AI大模型的生成式AI應用,背后都離不開AI算力、AI基礎架構的支持。過去傳統(tǒng)AI模型參數規(guī)模可能是千萬級別,到億級別;今天的AI大模型參數動輒十億級別,很多商業(yè)化應用模型已經達到百億、千億甚至更大級別,訓練和部署這樣的AI大模型需要更高的算力支持。
同時,越是大的模型需要更多的訓練數據集、行業(yè)語料庫的支持。戴爾科技集團董事長Michael Dell先生曾經說過:如果AI是火箭的話,那么數據就是火箭的燃料。訓練數據決定了AI模型的上限,我們所設計的算法只是盡可能去逼近上限。隨著數據的增加,我們也需要有一個更高性能、擴展性更強的數據平臺。
我們今天面向AI大模型的AI基礎架構平臺,是一個多維度的系統(tǒng)工程,包括計算、存儲、網絡、集群管理與資源編排,是一個綜合性的平臺。如果將AI基礎架構平臺比喻成一輛汽車,AI芯片、數據存儲、網絡、數據中心基礎設施就像是發(fā)動機、油箱、傳動系統(tǒng)、汽車底盤這些關鍵部件,我們希望實現這些部件的協同耦合,避免任何其中一點成為我們AI系統(tǒng)的關鍵短板。
從目前來講,隨著生成式AI的逐漸發(fā)展,對算力平臺特別是對于AI異構加速需求越來越旺盛,從我們戴爾科技集團來講,我們在這個領域里面重點在關注幾個方向:
第一,針對GPU的異構加速平臺的設計。在Dell PowerEdge服務器產品家族中,我們推出了多款專門針對GPU設計和優(yōu)化的計算服務器,在包括供電、散熱、GPU高速通信技術等,均體現在服務器硬件設計之中。我們最近也在參加一些全球知名的AI計算性能的基準測試,例如MLPerf。Dell在今年最新的MLPerf Training和Inference基準測試中,Dell提交的GPU服務器效能數據均處于第一梯隊。
針對AI大模型訓練中的GPU集群分布式訓練技術,去年我們也在國內發(fā)布了戴爾科技AI GPU分布式訓練技術白皮書。 戴爾科技集團內部,我們的AI&HPC創(chuàng)新實驗室,內部建有一個相當規(guī)模的GPU計算集群,主要用于內部研究和測試工作,在2021年全球HPC TOP500的排名中,我們創(chuàng)新實驗室的這套GPU集群排在第233位。
面向邊緣AI的計算平臺設計。邊緣計算的場景會更加復雜,有時在邊緣很難有像數據中心這樣完善的數據中心環(huán)境。Dell基于邊緣計算打造的平臺,對溫度、抗震等環(huán)境有更強的適應能力,之前也通過了像電信、海事一些特殊的行業(yè)標準。
位于AI計算行業(yè)前沿的AI專用加速芯片技術。戴爾此前投資了AI專用加速芯片提供商Graphcore,目前是歐洲估值最高的AI獨角獸企業(yè)之一。Graphcore IPU加速芯片目前已經量產,在國內外AI行業(yè)用戶有正式商用。我們也希望通過專用的AI加速芯片,未來可以給大家提供多元化、更高性價比的解決方案。
第二,針對AI數據存儲平臺的設計與優(yōu)化。針對AI全生命周期的數據管理,包括數據加載、數據治理、AI訓練與推理,我們希望可以為大家提供可根據未來AI平臺實際的性能和容量需求,橫向按需擴展的數據存儲解決方案。通過硬件存儲節(jié)點的增加,存儲性能和容量可以橫向線性擴展;支持多協議的訪問,可以通過不同的協議同時訪問我們后端存儲的數據,而不需要數據的橫向搬遷。針對AI GPU計算場景,現在可以支持以圖形化界面,一鍵式開啟GPU Direct Storage加速。開啟這項功能后,存儲在外置存儲系統(tǒng)中的數據,可以直接加載到GPU服務器的顯存,而不需要首先通過CPU服務器的內存進行預處理,可以提供更高的存儲帶寬和更低的訪問延遲。
第三,除了硬件平臺之外,我們也在關注如何對現在越來越大的GPU計算集群進行統(tǒng)一管理,以及支持AI大模型的工程化部署。在今年的早先時候,戴爾科技集團的COO Jeff Clarke和NVIDIA CEO黃仁勛,一起發(fā)布了面向企業(yè)級的生成式AI平臺解決方案Helix,在提供的預訓練AI大模型基礎上,幫助用戶可以自動化進行模型拆分與運行在多GPU加速環(huán)境下。同時,平臺可以提供大模型的安全護欄機制,控制大模型的調用和數據輸出。
作為持續(xù)深耕數實融合、以“務實的創(chuàng)新”為根本的踐行者,戴爾科技希望與眾多數字決策者們一起深度挖掘數字業(yè)務的新動能,預見技術世界的新秩序,開辟數實融合的新格局。
責任編輯:梁斌 SF055
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)