安裝新浪財經客戶端第一時間接收最全面的市場資訊→【下載地址】
來源:華爾街見聞 趙穎
下一步,谷歌需要把Gemini大模型整合進旗下產品,同時又不蠶食搜索等現有業務份額。
今年年初OpenAI的崛起令全球震驚,而微軟將ChatGPT嵌入必應更是令谷歌倍感威脅,谷歌是如何用一年時間在AI競賽中重新站穩腳跟?
根據媒體發布的一篇文章,這家科技巨頭首先平息內斗,合并兩大人工智能部門,其次加速研發AI模型,推出多模態模型意圖趕超OpenAI,最后憑借在芯片、模型框架等全方位布局,推出強大的Gemini模型開始反攻。
現在,谷歌走到了最困難一步——將Gemini大模型整合進旗下產品。
以下為華爾街見聞編譯的原文:
不管是谷歌還是其他公司,這都是一個值得回顧的時刻,他們顯然戰勝了那些末日論者。
上周,谷歌發布了備受期待的新人工智能模型Gemini,而在此近一年前,一些評論家曾預測OpenAI 的 ChatGPT 可能會挑戰谷歌在搜索領域的領導地位。谷歌積極應戰OpenAI,領導層設法讓公司內部相互競爭的部門開始合作,共同制定應對方案,從而擊退了那些認為谷歌變得過于優柔寡斷和官僚主義的人。如今谷歌在搜索領域的主導地位依舊,就連其股票也在今年一路上漲。
現在艱苦的工作開始了,在接下來的幾個月里,谷歌必須證明自己能夠將Gemini整合到旗下的產品中,同時又不蠶食搜索等現有業務份額。
該公司已經將一個簡化版本的Gemini應用到Bard中,該聊天機器人是該谷歌為與ChatGPT競爭而創建的,但迄今為止使用率似乎有限。兩位熟知內情的人士說,未來,該公司計劃將Gemini應用于幾乎整個產品線,從搜索引擎到生產力應用軟件,以及Pixel設備獨有的AI助手Pixie。據一位了解內部討論情況的人士說,產品還可能包括可穿戴設備,比如眼鏡,它可以利用人工智能識別佩戴者看到的物體的能力,然后該設備可以向佩戴者提供建議,比如如何使用工具、解決數學問題或演奏樂器。
谷歌在做這些事情的同時,還必須小心翼翼地與監管機構周旋。該公司正處于兩場關于其搜索引擎和廣告業務的反壟斷斗爭中。反壟斷官員正密切關注谷歌的人工智能工作,并將其視為谷歌如何利用在某一領域的優勢在另一領域取勝的范例。在這種情況下,谷歌利用其搜索中的網站數據以及數十億客戶的數據來訓練新的人工智能。
人工智能的成功對于谷歌的云計算業務也至關重要,對計算要求極高的人工智能模型正在激發對云服務的需求。微軟與OpenAI 建立了緊密的合作關系,其云業務的增長速度已經超過了谷歌和亞馬遜。
雖然ChatGPT因其對話式AI而聞名,但其背后的技術已被證明在整個商業領域都非常有效,從自動化客戶服務和軟件編碼,到快速生成營銷方案,以及幫助華爾街公司理解大量數據。谷歌面臨的問題是,OpenAI 和微軟在向消費者和企業銷售這項技術方面已經占得先機,為他們提供了寶貴的數據和反饋,他們可以利用這些數據和反饋來改進產品。
“只有親?試了之后,才能夠判定是人們能用它創造出什么,我們才剛剛開始看到這一點,但已經看到的是非常了不起”,Madrona Venture Group 的合伙人Jon Turow指出,他曾在亞馬遜云計算部門負責人工智能產品。
Gemini是谷歌25年歷史上投入最大的努力之一,隨著谷歌步入中年,其核心廣告業務繼續創造巨額利潤,這也為其母公司Alphabet在自動駕駛汽車、健康保險和生物技術等新業務上的一系列押注提供了資金,但是這些下了十年的賭注都沒有得到回報。
因此,越來越多的投資者要求谷歌領導層削減18.2萬人的成本,今年的大規模裁員打擊了員工士氣。同時,谷歌正準備在新的一年里進行更多的裁員,但目前還不清楚裁員的范圍是廣泛的還是針對特定群體。
人工智能是另一個賭注,需要公司投入巨額資金,支付從人員到硬件的一切費用。一位與Gemini團隊關系密切的人士表示,谷歌需要投入巨資來抵御人工智能團隊向OpenAI倒戈的威脅。
谷歌還選擇了一種特別昂貴的技術方法,即設計自己的人工智能芯片。這一決定使谷歌在硬件上獨立于英偉達,后者是人工智能服務器芯片的主要供應商。OpenAI等競爭對手依賴于英偉達和其他公司生產的硬件。
谷歌還希望消除人們對它的看法,即它的成果不過是靠幾十年前的創新成果。多年來,谷歌通過 Google Brain 和 DeepMind 兩個獨立的部門為人工智能研究投入了大量資金。谷歌甚至還發明了transformer的底層技術,該技術是OpenAI創建的GPT系列人工智能模型的核心。
但是,OpenAI的崛起讓人們擔心,谷歌可能會像之前的許多其他老牌科技巨頭一樣,在技術上失去領先地位。據一位直接了解谷歌與微軟討論情況的人士透露,在谷歌內部,微軟在今年2月將 ChatGPT納入必應搜索引擎,這讓谷歌的高管們尤其感到不安。
谷歌發言人未就此事發表評論。
AI部門內斗
多年來,谷歌和 Alphabet 的首席執行官桑達爾-皮查伊一直向同事抱怨,他無法讓旗下的兩個人工智能研究部門進行合作。谷歌2014 年收購了DeepMind,該公司首席執行官Demis Hassabis長期以來一直堅持獨立于母公司,他認為這樣的安排可以讓公司更好地實現開發通用人工智能的目標。
與此同時,DeepMind的姊妹部門Google Brain專注于研究如何將AI應用于谷歌的產品,并孵化了機器學習領域的重要進展,如transformer,這一發明為谷歌和其他公司訓練更復雜的模型鋪平了道路。該部門由Jeff Dean領導,他是一名資深工程師,在谷歌成立初期,他的編碼工作幫助谷歌將搜索引擎擴展到數十億用戶。
兩個部門之間的分歧很深,Google Brain的總部位于加州山景城的谷歌總部,而Hassabis和他的團隊則在倫敦國王十字車站附近的辦公室。
一位曾在DeepMind工作過的人士說,隨著公司規模的擴大,DeepMind不遺余力地避免與谷歌大腦合作。例如,在谷歌大腦當時沒有主要業務的城市,如巴黎和阿爾伯塔省的埃德蒙頓等地開設辦事處。DeepMind的研究人員可以訪問Google Brain編寫的代碼,但反之不行。一些員工認為這是 DeepMind 過度保密的表現,甚至在谷歌員工中也是如此。當Hassabis想采取措施保持 DeepMind 的獨立性時,他會直接與聯合創始人Larry Page溝通,后者與聯合創始人Sergey Brin一起主導了收購,并擁有 Alphabet的控股權。
一位知情人士說,隨著時間的推移,Hassabis希望將DeepMind 與谷歌更徹底地分開,因為他越來越擔心這家龐大的公司會如何使用這項技術,包括將其出售給軍方。他萌生了創建一家獨立公司的想法,該公司將擁有DeepMind 的知識產權。但在2021年,Hassabis告訴DeepMind的員工,在皮查伊承諾向該公司提供更多資金用于包括人工智能倫理在內的目的后,脫離谷歌的努力已經結束。
多年來,對資源的爭奪加劇了兩家公司之間的緊張關系。谷歌向其人工智能研究人員發放的服務器芯片數量有限。隨著全行業對人工智能的狂熱促進了對芯片的需求,這些芯片變得更加稀缺。
與此同時,隨著谷歌高管深陷內部政治泥潭,公司的著名人工智能研究人員也開始紛紛出走。其中一些人成立了自己的公司,他們對谷歌的官僚文化感到沮喪,因為在 OpenAI推出類似ChatGPT的服務之前,谷歌的官僚文化早已阻礙了ChatGPT的發布。還有一些人則被OpenAI收購,OpenAI是馬斯克和其他知名人士于2015年以非營利形式創辦的一家初創公司,部分原因是他們擔心谷歌將擁有人工智能的未來。OpenAI的創始人之一是Ilya Sutskever,他是谷歌大腦的一名重要工程師,后來領導了多項進展,比如創造出可以通過推理解決未曾遇到過的問題的人工智能。
去年11月,當 OpenAI 發布 ChatGPT 時,公眾的反應在整個谷歌引起了震動。這家400人的初創公司竟然擊敗了谷歌,推出了一個可以令人信服地回答各種主題問題的聊天機器人,這讓谷歌的競爭力受到了質疑。
不過,谷歌的一些領導似乎并沒有被這個互聯網新寵兒嚇到。一位知情人士說,在 ChatGPT 推出幾周后的一次員工會議上,Dean在回答有關聊天機器人的問題時說,谷歌不會對其他初創公司的做法做出反應。
但到了二月份,微軟宣布將在其必應搜索引擎中應用ChatGPT是。一些投資者認為,聊天機器人可能會削弱谷歌在搜索領域的主導地位,這一觀點令谷歌的高管們感到危險。
思想的融合
谷歌需要做一些事情,而且要快。
于是,谷歌在短短幾個月內拼湊出了Bard聊天機器人,并于今年3月正式發布。在谷歌內部,這項工作引起了軒然大波,因為谷歌的一位著名研究員Jacob Devlin向皮查伊和其他高管提出了對谷歌使用 ChatGPT 的數據來訓練人工智能模型的擔憂,隨后他辭職了。他立即加入了 OpenAI,但僅僅幾個月后,他又回到了谷歌,原因不得而知。
谷歌的另一個回應是最終結束了DeepMind和Google Brain之間的內斗。谷歌從這兩個團隊中選拔研究人員,建立了一個新的模型:Gemini模型由Dean和DeepMind高級研究員Oriol Vinyals領導,后者曾與Dean在大腦共事。
今年4月,谷歌宣布合并Google Brain和DeepMind。Hassabis接管了新實體--谷歌 DeepMind,而Dean則退居二線,成為谷歌的首席科學家。這一舉動讓許多谷歌工程師感到震驚,他們認為,鑒于Dean的成就和在公司工作已久,他本應成為該部門的領導者。
領導者們試圖把合并說成是合并后部門的勝利,Google Brain負責研究的副總裁Zoubin Ghahramani訪問了 DeepMind 的倫敦辦公室,在宣布變革的那一周召開的全體會議上向員工解釋了重組的原因。Google Brain為自己的員工單獨召開了一次會議。Hassabis告訴員工們,谷歌DeepMind將匯集世界上最好的兩個人工智能研究團隊。
但谷歌的人工智能員工很快就意識到,工作重點也在發生變化。谷歌DeepMind的領導層縮減了對打造有競爭力的人工智能產品并不重要的研究項目。這些人說,失去資源的項目包括一個名為Gato的多模態模型以及一個名為GenRL的研究團隊,該團隊建立的人工智能系統能夠在虛擬環境中導航,就像雅達利游戲中的虛擬環境一樣。
高管們說,這些變化還有一個額外的好處,減少工作重疊,削減優先級較低的項目,意味著員工們不必再為獲得用于研究的芯片而爭得頭破血流。
在山景城,分布在公司園區多棟大樓的人工智能員工搬到了位于園區中心的一間辦公室,目的是加強研究人員之間的合作。
隨著OpenAI爆炸性崛起的沖擊逐漸消退,谷歌終于迎來了反擊的機會。
“秘密武器”
盡管如此,谷歌仍然面臨著一個巨大的挑戰:建立一個表現優于OpenAI最先進模型GPT-4的模型。
從一開始,這就意味著研究人員必須在最后期限前完成模型開發。為了在緊迫的時間內完成任務,員工們不分晝夜地工作,這種自上而下的工作方式與谷歌以往對研究實驗室放手不管的做法大相徑庭。一位與這項工作關系密切的人士說,一些員工每周工作80小時已成為常態。
即使在公司的人工智能之外,谷歌員工也被要求迅速掌握這項技術。據兩位知情人士透露,在這一年里,谷歌云要求員工通過人工智能方面的測試,并為銷售等非技術崗位的員工提供額外的材料,從而推動員工提高人工智能知識水平。
谷歌的目標是通過賦予Gemini理解各種不同媒體(包括文本、圖像、視頻和音頻)的能力,從而較OpenAI更有優勢,例如,人工智能可以用通俗易懂的英語解釋和說明復雜圖表的內容。皮查伊后來說,Gemini將從頭開始 根據這些類型的數據進行訓練。皮查伊很清楚,今年3 月,OpenAI 曾宣布為GPT-4 提供類似的圖像識別功能,但最初并沒有廣泛提供這些功能。這讓谷歌有機會在 OpenAI 發布之前,通過Gemini發布一套廣泛的多模態模式。
谷歌還有一個秘密武器:YouTube。兩位熟知內情的人士說,谷歌研究人員在很大程度上依賴于谷歌擁有的流媒體服務,這些數據包括圖像、視頻和音頻字幕文本,對于訓練人工智能模型非常寶貴。
這讓谷歌獲得了比OpenAI和AI圖像初創公司Midjourney等競爭對手豐富得多的信息庫。這些人說,這也意味著谷歌必須滿足法律部門的要求,比如確保如果YouTube用戶刪除了視頻,谷歌也會從其模型使用的數據集中刪除該內容。
谷歌的另一個優勢是計算能力,與依賴微軟服務器的OpenAI 不同,谷歌擁有自己的數據中心。為了更高效地運行軟件,谷歌甚至打造了自己的專用人工智能芯片——張量處理單元(TPU)。谷歌為 Gemini計劃積累了數量驚人的芯片--7.7 萬個代號為Pufferfish的第四代張量處理單元。第三季度,谷歌未分配的企業成本(包括在 DeepMind 上的支出)猛增近 40%,達到16億美元。
當倫敦的員工結束一天的工作,而山景城的員工開始一天的工作時,Gemini的領導者通過每天與監督項目部分工作的員工舉行會議,隨時了解研究人員的進展情況。一位人士說,主持會議的有Dean、Vinyals和研究副總裁Koray Kavukcuoglu。
高級管理人員也在戰壕里工作,Dean率先改進軟件,幫助公司的算法處理海量數據。聯合創始人Sergey Brin曾因辦公室戀情丑聞而與谷歌保持距離,但他在山景城與Gemini研究人員并肩工作,定期在公司食堂與他們共進午餐。
一路上也有一些尷尬的時刻,在今年 2 月為 Bard 公司做的一次演示中,聊天機器人在詹姆斯-韋伯太空望遠鏡的問題上犯了一個事實錯誤,這讓正努力追趕 OpenAI 的谷歌十分尷尬。兩天后,當這個錯誤廣為人知時,谷歌股價下跌了 9%。
今年 5 月,谷歌在年度開發者大會上的一次演講中首次披露了Gemini的存在,華爾街對此印象深刻:公司股價當天躍升了 4% 以上。
蓄力趕超
在接下來的幾個月里,谷歌逐漸接近發布 Gemini,9 月份谷歌讓一些開發人員使用了較小版本的Gemini進行測試。
但就在同一個月,OpenAI推出了GPT-4 with Vision,在多模態功能上擊敗了谷歌,這也為其技術帶來了更多的關注,同時也帶來了新的業務。一位與該團隊關系密切的人士說,消費者對 Bard 的使用讓團隊內部的一些高管感到失望。就在微軟宣布其 Azure 云計算部門收入增長 29%,令人印象深刻的同一天,谷歌在10月份披露其云計算部門第三季度收入增長乏力,僅為 22%。這只會增加Gemini團隊的壓力,迫使他們拿出大手筆。
然后,大約在11月,在對新產品進行行政審查時,本應與GPT-4 競爭的最先進的Gemini模型在英語以外的語言中難以正常工作。
讓谷歌稍感安心的是,OpenAI 也在處理自己的問題。2023 年中期OpenAI廢棄了一個名為 Arrakis 的重要新模型,因為它在訓練中表現不佳。11月底,OpenAI 董事會解雇了首席執行官Sam Altman,OpenAI 幾近崩潰。Altman在這一事件后重返OpenAI,似乎暫時穩住了這艘船。
最后,在12月初,谷歌拉開了 Gemini 的帷幕。它公布的測試結果顯示,性能最強的版本 Gemini Ultra 在多項行業標準基準測試中的表現優于 GPT-4,盡管許多研究人員對這些說法提出了質疑。谷歌公司自己也承認,該視頻夸大了Gemini的功能。該視頻的發布讓公司一些事先沒有看過視頻的普通員工感到沮喪,但一連串的聲明傳遞了一個強烈的信息:谷歌已經做好了競爭的準備。
一位高管甚至發起了攻勢,抨擊微軟依賴 OpenAI 開發其尖端技術。谷歌和Alphabet 全球事務總裁Kent Walker在新聞媒體 Semafor 舉辦的一次活動上說,公司不相信“外包”人工智能開發。
現在,谷歌面臨的考驗是將Gemini到各個產品應用中,就像微軟對 OpenAI 技術所做的那樣。但谷歌有一個對手不具備的優勢:Pixel 硬件設備組合,包括手機、手表和耳塞,都能從人工智能中受益。其中一個版本的 Gemini 就是專門為在 Pixel 手機上運行而設計的,Pixel手機使用的是谷歌定制的人工智能芯片。
在科技公司競相將自己的硬件與新的人工智能功能整合在一起的時候,Pixel設備專用的人工智能助手的推出可能會促進谷歌硬件業務的發展。據一位知情人士透露,Pixie 將使用客戶手機上的信息,包括來自谷歌地圖和 Gmail 等產品的數據,進化成更加個性化的谷歌助手。這位知情人士稱,該功能最快將于明年在Pixel 9和9 Pro上推出。
最終,谷歌希望把這項功能帶到普通手機和手表等設備上,該公司將需要越來越先進的機型來支持其所有的產品理念。不過,谷歌似乎正在抓緊時間,確保自己不會再次陷入困境。據一位熟知內情的人士透露,谷歌已經在訓練下一代大模型Gemini 2。
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
責任編輯:郭明煜
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)