股市瞬息萬變,投資難以決策?來#A股參謀部#超話聊一聊,[點擊進入]
2024年7月11-13日,2024中國汽車論壇在上海嘉定舉辦,地平線總裁陳黎明出席并演講。
以下內容為現場演講實錄:
上午對業界談得比較多的自動駕駛端到端大模型做了一些分享,同時把地平線在這方面的技術的積累和最新產品做了分享。本場論壇由于時間關系,不能展開,我想簡單談一下端到端大模型產品化。
端到端大模型的核心要素:算法、數據和算力、工程能力,這是我們認為在端到端大模型發展中非常重要的幾個核心要素。對于端到端大模型,大家都談得非常多,大家也都在做,在自動駕駛這個領域,它的落地我們認為不是一蹴而就的,是需要逐步去實現的,為什么這么講?正如我上午所分享的,從規則驅動到數據驅動,技術迭代的“蹺蹺板效應”無法全面提升系統能力。規則驅動的軟件1.0基于大量人工規則,系統上限低,下限可控;數據驅動的端到端系統,能夠實現信息無損傳遞,系統上限高,而下限不可控。
端到端大模型是基于一個概率模型訓練,它有一個問題是對于比較簡單,比較容易描述的場景,往往它的輸出沒有那么精確,它的底線比較低,安全的保障有一些concern。特斯拉在這塊已經做得相當不錯了,但是還沒有完全解決這個問題,我們認為在目前缺乏足夠數據的條件下,還是需要逐步實現端到端,一個模塊、一個模塊去替代,完成端到端的同時做好安全兜底,以這種比較堅實的工程基建和快速迭代的方式,能夠一步步提升系統的性能上限,同時也能夠保證系統性能的下限。這是一方面。
另一方面,整個技術還是在不斷發展,包括模型本身、算法本身也在不斷發展。我們之前用得比較多的神經網絡都是卷積神經網絡(CNN),目前比較流行的是Transformer,Transformer里面有特殊的算子,需要硬件去支持它。這就是為什么我們講新的算法出現以后,前一代的芯片可能計算效能不能很好、很充分地支持最新的算法,這要求我們在硬件設計上更好地支持這些特殊的算子,使得整個計算效率更高。這是逐步實現的過程。
再一個我想講的是數據。我們知道特斯拉今年推出的FSD V12.3版本讓大家很驚艷,它在很短的時間里面用了一千萬個樣本視頻,來訓練它的自動駕駛這部分。一千萬個樣本是從100億個樣本里面提取出來的高質量數據,對于我們自動駕駛在中國落地的話,現在的數據積累遠遠不夠。怎么得到這些數據,也是現在整個行業面臨的挑戰。主機廠的確有很多數據,但很多數據是不是真正高質量有用的?這是一個值得探討的問題。因為對于特斯拉積累的100億的數據,它是基于在標準傳感器的框架下收集起來的,它有延續性,它在過去幾年的積累可以繼續用來訓練它的一些最新的模型。
我們目前遇到的困難是很多車型和傳感器的架構、傳感器的布置和采用等都在不斷變化,我們雖然收集了很多數據,但這些數據不是高質量地積累起來并且能夠持續使用的,這塊也是我們接下來不光是某個企業,而是整個行業要去探討的問題。也就是說,主機廠和科技企業怎么能夠協同起來解決這個問題,這是大家要共同探討的。
我們認為隨著自動駕駛的發展,2010年前后,當時的Google,現在的Waymo第一次把自動駕駛這個話題提出來,十幾年間行業內各個企業大力投入研發,篤行不輟。雖然當前有不同的技術路線,但是地平線認為端到端是目前通往自動駕駛終局的唯一可行方案,需要大家不斷地投入,來共同推動自動駕駛的落地。
我就分享這些,謝謝付會長。
新浪聲明:所有會議實錄均為現場速記整理,未經演講者審閱,新浪網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。
責任編輯:梁斌 SF055
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)