手工勞動/挖哥
手工編輯 /角叔
出品/獨角獸挖掘機
如果哪個大廠還沒做大模型,應該都不好意思跟別人打招呼了。
年初ChatGPT橫空出世,引爆了國內大模型的熱情,各路資金蜂擁而入。其中以百度、阿里、華為、京東等為代表的互聯網大廠更是重金押注、無一缺席。
“我最初以為AI是互聯網10年不遇的機會,但現在,我覺得這是幾百年不遇的,類似發明電的工業革命一樣的機遇。”向來低調的馬化騰也給了AI極高的評價。《中國人工智能大模型地圖研究報告》顯示,我國10億參數規模以上的大模型已發布79個,“百模大戰”一觸即發。
世人皆知大模型香,但也知世上不需要這么多大模型。
在這場未來科技高地的攀巖中,最終能登頂,笑到最后的必然是寥寥無幾,而大廠憑借著先天的資本、算力、大數據等優勢,無疑是百模大戰中的“種子隊”。
本文盤點百度、華為、阿里、騰訊、京東、美團、字節、科大訊飛八家大廠的大模型特點,未來翹楚,應該有他們的一席之地。
01
百度文心一言:最硬核
國內大廠里,百度是最先交大模型作業的。
3月16日,百度發布了生成式AI產品文心一言,發布首日就有超60萬人申請測試。
百度能成為第一個吃螃蟹的大廠,有賴于近些年在人工智能領域的深耕和積累。
早在2019年,百度就推出了知識增強的語義理解框架文心大模型,并廣泛應用于閱讀理解、情感分析等領域。人工智能已成為這家以搜索起家的科技企業的新標簽。在大模型之前,百度在人工智能領域就在自動駕駛、智能云等多個領域進行了前瞻布局,擁有先發優勢。
百度創始人李彥宏更是親自下場,成為大模型的堅強擁躉:“科技創新驅動了大的增長。沿著這個思路,如果讓我來判斷第四次科技革命的標志,我認為是深度學習算法。”
當然,第一個關注度最高,被吐槽也不少,比如,文心一言剛上線,作為新生,在面對車水馬龍、夫妻肺片這些內涵詞時,理解能力還停留在字面意思,像車水馬龍出現了“汽車+龍”的元素疊加圖片。
不過在用戶的反饋下,文心一言很快就學習到正確的理解和繪制方式,能繪制出車馬成群結隊、繁華熱鬧的“車水馬龍”街景。
在IDC最新發布的《AI大模型技術能力評估報告,2023》中,百度文心大模型拿下12項指標的7個滿分,綜合評分第一,尤其是算法模型、通用能力等基礎技術領跑全行業,算法模型獲得唯一一個滿分。
如果說,大模型對其他大廠來說多是副業,對All in人工智能的百度來說,是一號工程,這也讓它擁有了最硬核的實力。
02
華為盤古:最被寄予厚望
作為在國際市場上最能扛的科技企業,華為在5g的強大讓美國不得不窮盡各種手段來打壓,在AI這個國際角逐的新戰場,華為理所當然也被寄予厚望。
7月7日,在華為開發者大會2023上,華為云正式發布盤古大模型3.0。盤古大模型3.0是一個完全面向行業提供服務,以行業需求為基礎設計的大模型體系,包括5+N+X三層架構。
華為盤古大模型早在2020年就啟動研發,華為云CEO張平安表示希望用盤古大模型幫助各行各業,例如在金融、政務、礦山、氣象等行業,在產品研發、生產供應鏈、市場營銷以及數字運作領域,讓盤古大模型為他們賦能。
從華為的策略來看,雖然國內外C端的大模型聲量大,但華為還是做自己擅長的B端市場,并且已經進入實操階段。7月18日,華為聯合山東能源集團舉行發布會,宣布華為盤古大模型在礦山領域實現首次商用。
從通信網絡設備到5G手機、智能駕駛,華為都展現了其強大的科技底蘊和技術實力,在AI領域,華為自然也承擔著更高的期望。
03
京東靈犀:最懂產業
7月13日,在2023京東全球科技探索者大會暨京東云峰會上,京東正式推出靈犀大模型。
與其他通用大模型相比,京東靈犀可謂是“從產業中來,到服務產業中去”,融合了70%通用數據與30%數智供應鏈原生數據,具有“更高產業屬性、更強泛化能力、更多安全保障”的優勢,深入零售、物流、金融、健康、政務等知識密集型、任務型產業場景,解決真實產業問題。
對于大模型價值的思考,京東也提出了自己的獨到見解:大模型的價值=算法×算力×數據×產業厚度的平方。
京東CEO許冉認為,前三個指標固然重要,但技術在產業場景落地應用,創造實際價值才是關鍵。當產業效率和產業的邊界拓展得到質的提升以后,大模型才有了更重要的實際價值和意義,這將不亞于又一次工業革命。
從京東的發展史來看,產業早已融入京東的基因和血脈中,從產業場景切入做大模型,做的也是京東非常擅長的領域,訓練出的大模型天然具備“產業基因”。
04
阿里通義千問:最強算力
4月11日,阿里云宣布推出大語言模型“通義千問”,并表示包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等阿里巴巴所有產品,未來都將接入“通義千問”大模型全面改造。
阿里云總裁張勇談到阿里云戰略的核心,表示未來要做好兩件事情——讓算力更普惠、讓AI更普及。其中的算力是阿里做大模型的核心競爭力。
大模型背后的海量數據,需要有強大的算力作為支持。某種程度上,大模型之爭說到底也是云服務之爭、是算力之爭。
在數字基礎設施,阿里云擁有國內最強的智能算力儲備,阿里云的智算集群可支持最大十萬卡GPU規模,承載多個萬億參數大模型同時在線訓練,為大規模AI集群提供無擁塞通訊的自研RDMA網絡架構和低成本高可靠的高性能存儲CPFS。
在國際權威機構Gartner榜單中,阿里云是亞洲第一、全球第三的云計算服務商。在2021年底Gartner對云廠商整體能力評估中,阿里云IaaS基礎設施能力拿下全球第一,在計算、存儲、網絡、安全四項核心評比中均斬獲最高分。
05
騰訊混元助手:最擅社交
作為初代互聯網BAT三巨頭之一,騰訊在大模型領域上表現得比較內斂。
去年 4 月,騰訊首次對外披露了混元 AI 大模型的研發進展,這是一個包含 CV(計算機視覺)、NLP(自然語言處理)、多模態內容理解、文案生成、文生視頻等方向的超大規模 AI 智能模型。
今年 2 月底,在 ChatGPT熱潮下,騰訊也被曝出成立了混元助手項目組,這個項目組將聯合騰訊內部多方團隊構建大參數語言模型。
千呼萬喚始出來,6月19日,在行業大模型及智能應用技術峰會上,騰訊第一次公布了騰訊云行業大模型的研發進展,圍繞B端需求,騰訊反復強調大模型是為“具體場景設計的具體應用”。
沒有哪家大廠比騰訊更懂社交,憑借著龐大的用戶基數和強大的技術實力,騰訊在大語言模型AI的布局,尤其是類ChatGPT聊天機器人,有著別人無法比擬的優勢。
對于騰訊的聊天機器人是集成到QQ、微信,還是通過騰訊云向B端用戶服務,騰訊云與智慧產業事業群CEO湯道生表示:“都會有。”
06
美團光年之外:最命運多舛
光年之外由美團聯合創始人王慧文在今年2月創立,彼時王慧文已經處于“退休”狀態,大模型讓他重燃了創業激情。肩負起打造“中國OpenAI”的使命。
在短短兩個月時間里,光年之外吸引了眾多人工智能領域頂級專家和創業者的加入,完成了以產品和技術人才為主的團隊搭建。
王慧文自帶的創業成功者光環,還有王興以個人身份投資的加持,光年之外從成立第一天起,就站在了聚光燈下,成為大模型賽道里的初創企業的明星。然而,出師未捷身先傷,雄心勃勃的王慧文出現個人健康原因,不得不離崗就醫。
群龍無首之時,王興出手了。6月29日,美團的一紙公告宣布完成光年之外境內外主體100%股權的收購,收購價約為20.65億人民幣。
從這筆收購來看,既幫助了兄弟,又增強了美團的大模型實力。
王興與王慧文是清華上下鋪的室友,從攜手創辦校內網到美團,兩人從同窗到創業伙伴,成就了彼此。另外,美團自身也有做大模型的需求,通過這次收購,美團獲得領先的AGI技術及人才,可以加強其于快速增長的人工智能行業中的競爭力。
雖然有些命運多舛,但最后的歸宿還是很不錯。
07
科大訊飛訊飛星火:最有學問
4月24日,科大訊飛星火認知大模型官網正式上線。
作為AI語音龍頭,訊飛星火認知大模型圍繞“知識問答、代碼編程、數理推算、創意聯想、語言翻譯”等場景布局。
上線一個月后,訊飛星火認知大模型各項能力持續提升,且在綜合能力上實現三大升級:開放式知識問答取得突破,多輪對話、邏輯和數學能力再升級。擁有如此強大的學習能力,也讓訊飛星火的“學問”越來越大。
在應用落地上,科大訊飛重點是推動星火認知在教育、醫療、工業、辦公等領域落地。比如,在教育領域,科大訊飛已經在學習機上嘗到甜頭,在星火大模型與教育垂直場景的深度融合下,有望廣泛應用于教師備授課、作文批閱、學生語言學習、心理健康監測等常見場景。
憑借著AI語音和知識問答上的優勢,訊飛星火在定位上,可能是與ChatGPT最接近的大模型。
08
字節火山方舟:最低調
當其他大廠一把手掛帥親自站臺,對大模型不吝贊美之詞時,已與BAT平起平坐的字節卻相對低調得多。
直到6月28日,字節跳動公布了大模型業務最新進展,在火山引擎主辦、英偉達合作舉辦的“V-Tech體驗創新科技峰會”上,火山引擎發布大模型服務平臺“火山方舟”,面向企業提供模型精調、評測、推理等全方位的平臺服務。
集成多個大模型,供客戶直接對比,火山方舟避開烽火連天的大模型大戰,選擇做大模型服務平臺,以賣水者身份殺入大模型賽道。
選擇這條路,字節也有自己的考量,與其他大廠布局多年對比,字節雖然在算力、算法等AI基礎設置上不遜色,但還是慢了一拍,字節語言大模型團隊今年初才成立。
在沒有先發優勢的情況下,又不想缺席大模型盛宴,選擇為大模型客戶提供算力AI基礎設施,幫助做好大模型開發,這樣的另辟蹊徑也不失為理智的選擇。(完)
(聲明:本文僅代表作者觀點,不代表新浪網立場。)