來源:鈦媒體AGI
OpenAI GPT-4o發(fā)布24小時之后,美國科技巨頭谷歌(Google)全力反擊。
北京時間5月15日凌晨,谷歌I/O開發(fā)者大會主題演講上,谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)發(fā)布幾十款Google和 AI 結(jié)合產(chǎn)品,堪稱“全家桶”界別,以對戰(zhàn)OpenAI。
包括支持200萬token長文本的Gemini 1.5 Flash,谷歌版Sora技術(shù)Veo,對標(biāo)GPT-4o的Project Astra,最強(qiáng)開源模型Gemma 2,支持生成式搜索的AI Overviews、第六代TPU等。
這場110分鐘演講中,皮查伊提及 AI 的次數(shù)竟然高達(dá) 121 次(根據(jù)谷歌自己的統(tǒng)計)。
皮查伊表示,谷歌正在為 AI 做著“艱苦工作”。他強(qiáng)調(diào),谷歌正處于Gemini時代當(dāng)中,采取大膽而負(fù)責(zé)任的方法,讓 AI 造福每個人。
“盡管如此,我們?nèi)蕴幱?AI 平臺轉(zhuǎn)變的早期階段。對于創(chuàng)作者、開發(fā)者、初創(chuàng)公司和每個人來說,我們看到了巨大的機(jī)遇。幫助推動這些機(jī)會就是我們Gemini時代的意義所在。”皮柴稱。
然而,對于華爾街來說,這一系列更新似乎沒能讓人興奮,遠(yuǎn)低于其預(yù)期。
截至鈦媒體App發(fā)稿前,谷歌母公司Alphabet(NASDAQ: GOOG)股價一夜僅漲了0.60%。
狂卷長文本!Gemini家族迎來重大更新
過去一年,谷歌在生成式 AI 領(lǐng)域?qū)崿F(xiàn)從“落后”到追趕,再到如今全面發(fā)力大模型的應(yīng)用,度過了極不平凡的一年。
2023年12月,谷歌推出全球最強(qiáng)大、最通用的多模態(tài)通用大模型:Gemini,中文稱“雙子座”,共包括三個不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),全面內(nèi)置最新、最強(qiáng)大的自研 AI 超算芯片Cloud TPU v5p。
谷歌表示,在六項基準(zhǔn)測試中,Gemini Pro性能表現(xiàn)優(yōu)于GPT-3.5;而在30項性能基準(zhǔn)測試中,Gemini Ultra超越了目前最強(qiáng)模型GPT-4,甚至在數(shù)學(xué)、物理、法律等57個領(lǐng)域測試中成為全球第一個超越人類專家水平的 AI 模型。
自Gemini發(fā)布至今,谷歌持續(xù)在 AI 方面“狂飆”。
今年1月,谷歌宣布在全球一項模型基準(zhǔn)測試中Gemini超越GPT-4;2月,谷歌宣布對標(biāo)ChatGPT的 AI 聊天機(jī)器人平臺Google Bard更名為Gemini,以及發(fā)布史上性能和功能最強(qiáng)大的Gemini Ultra 1.0模型等;2月底,全球最強(qiáng)開源大模型Gemma發(fā)布,谷歌聲稱,Gemma 模型18個語言理解、推理、數(shù)學(xué)等關(guān)鍵基準(zhǔn)測試中,有11個測試分?jǐn)?shù)超越了Meta Llama-2等更大參數(shù)的開源模型,引發(fā)全球廣泛關(guān)注。
今年5月,谷歌在 AI 領(lǐng)域更進(jìn)一步,旗下DeepMind和其英國子公司Isomorphic Labs聯(lián)合團(tuán)隊在《自然》雜志上發(fā)表一份共46頁的重要成果,聯(lián)合發(fā)布全新AI蛋白質(zhì)結(jié)構(gòu)預(yù)測模型AlphaFold 3,對于蛋白質(zhì)與其他分子的相互作用,與現(xiàn)有預(yù)測方法相比,AlphaFold 3改進(jìn)了至少50%;對于一些重要的相互作用領(lǐng)域,AlphaFold 3預(yù)測精(準(zhǔn)確)度提高一倍(100%),可準(zhǔn)確預(yù)測蛋白質(zhì)、DNA、RNA、配體等的結(jié)構(gòu)以及它們?nèi)绾蜗嗷プ饔?,有望幫助人們治療癌癥、免疫性疾病等。
發(fā)布至今,谷歌不僅全面統(tǒng)一AI 人才和算力資源,而且全力投資Gemini,“任何輸入到任何輸出”。
在Google I/O主題演講中,皮查伊透露,截至目前,短短 3 個月內(nèi)”就有 100 萬+ Gemini Advanced 注冊;有20億用戶產(chǎn)品(user products)全部使用 Gemini;超過 150 萬開發(fā)者使用 Gemini。
“我們正處于 AI 平臺轉(zhuǎn)變的早期階段?!?font cms-style="font-L">皮查伊表示。
此次演講開始,谷歌全面發(fā)布Gemini 1.5 Pro,可提供具有增強(qiáng)的性能和突破性、最高200萬Token長文本能力,并且已經(jīng)向全球開發(fā)者開放。
據(jù)悉,全新Gemini 1.5 Pro具有原生音頻理解、系統(tǒng)指令、JSON 模式等,能夠使用視頻計算機(jī)視覺來分析圖像(幀)和音頻(語音)的視頻,這使其具有人類水平的視覺感知。使用深度神經(jīng)網(wǎng)絡(luò),Gemini 1.5 可以以超人的精度識別圖像(和視頻幀)中的物體、場景和人物。
隨后,谷歌推出全新Gemini 1.5 Flash 模型。
DeepMind 首席執(zhí)行官 Demis Hassabis認(rèn)為,成本問題一直是大模型開發(fā)的痛中之痛,某些應(yīng)用程序需要更低的延遲和更低的服務(wù)成本。而為了解決這一痛點,谷歌推出Gemini 1.5 Flash 模型——比 1.5 Pro 更輕的模型,該模型旨在兼顧快速和成本效益。
“Gemini 1.5 Flash 擅長摘要、聊天應(yīng)用程序、圖像和視頻字幕、從長文檔和表格中提取數(shù)據(jù)等,”Demis稱,谷歌創(chuàng)建 Gemini 1.5 Flash 是因為開發(fā)人員需要一個比 Gemini 1.5 Pro 更輕、更便宜的模型。
具體來說,Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之間,是針對開發(fā)者的大模型。盡管比 Gemini Pro 輕,但它的功能同樣強(qiáng)大,谷歌表示這是通過“蒸餾”的方式來實現(xiàn)的,將 Gemini 1.5 Pro 中最重要的知識和技能轉(zhuǎn)移到較小的模型上。這意味著 Gemini 1.5 Flash 將獲得與 Pro 相同的多模式功能,以及其長上下文窗口(AI 模型一次可以攝取的數(shù)據(jù)量),100 萬個 token。
目前,1.5 Pro 和 1.5 Flash 均已推出公共預(yù)覽版,并在Google AI Studio和Vertex AI中提供 100 萬個Token上下文窗口?,F(xiàn)在,1.5 Pro 還通過候補(bǔ)名單向使用 API 的開發(fā)人員和Google Cloud 客戶提供了 200 萬個Token上下文窗口。
最大的更新尚未到來——谷歌宣布今年晚些時候?qū)⒛P偷默F(xiàn)有上下文窗口增加一倍,達(dá)到 200 萬個 token。這將使其能夠同時處理 2 小時的視頻、22 小時的音頻、超過 60,000 行代碼或超過 140 萬個單詞。
谷歌的Josh Woodward 詳細(xì)介紹了 Gemini 1.5 Pro 和 Flash 的定價。Gemini 1.5 Flash 的價格定為每 100 萬個token 35 美分,這比 GPT-4o 的每 100 萬個token 5 美元的價格要便宜得多。
值得一提的是,此次大會谷歌重磅宣布推出基于 Gemini 1.5 Pro 的 Gemini Advanced。升級后的 Gemini Advanced 可以處理“多個大型文檔,總計最多 1,500 頁,或匯總 100 封電子郵件”。支持 35 多種語言和 150 多個國家 / 地區(qū)。而其“即將”推出的功能是能夠“處理一個小時的視頻內(nèi)容或超過 30,000 行的代碼庫”。
全球最強(qiáng)長文本能力可謂實至名歸。
反擊OpenAI,對標(biāo)GPT-4o、Dall-E、Sora
谷歌推出一眾生成式 AI 產(chǎn)品
隨后,谷歌宣布推出五款基于Gemini的通用AI Agent子系列產(chǎn)品音頻NotebookLM、助手Project Astra、音樂的Music AI Sandbox、視頻的Veo、圖像的Imagen 3,直接對標(biāo)OpenAI發(fā)布的GPT-4o、Dall-E和Sora。
首先是Project Astra智能助手,它和NotebookLM一起直接對標(biāo)GPT-4o。
Project Astra通過智能手機(jī)攝像頭分析世界,并與用戶進(jìn)行對話,類似一款以取景器作為主界面的應(yīng)用程序。谷歌在演講中展示了一個人拿著手機(jī),將攝像頭對準(zhǔn)辦公室的各個地方,并用語言與其交互。
“當(dāng)你看到有東西發(fā)出聲音時,請告訴我?!痹谶@段視頻演示中,Project Astra能識別各種物體甚至代碼,并實時與人類進(jìn)行語音互動。
在視頻中,Astra 的反應(yīng)很快。Demis稱,之所以能實現(xiàn)這一目標(biāo),是因為這些Agent可以通過連續(xù)編碼視頻幀、將視頻和語音輸入組合到事件時間線中,并緩存這些信息以進(jìn)行有效回憶,從而更快地處理信息。
甚至,當(dāng)谷歌在眼鏡上演示“Project Astra”時,“Gemini Live”可讓您與 Gemini 交談。
其次是NotebookLM。
這是去年谷歌發(fā)布的一個實驗性產(chǎn)品,由Google 實驗室的一個小團(tuán)隊構(gòu)建,旨在利用語言模型的強(qiáng)大功能和前景與現(xiàn)有內(nèi)容相結(jié)合,更快地獲得關(guān)鍵見解。將其視為虛擬研究助理,可以總結(jié)事實、解釋復(fù)雜的想法并集思廣益新的聯(lián)系。
今年,NotebookLM再度升級,采用全新Gemini 1.5 Pro模型,實現(xiàn)類似語音助手的音頻功能,分析材料,并可以用自然理解能力解釋它,甚至回答問題。
谷歌認(rèn)為,NotebookLM和傳統(tǒng) AI 聊天機(jī)器人之間的一個關(guān)鍵區(qū)別在于,NotebookLM 可以讓您在筆記和來源中“扎根”語言模型。在Google 文檔中,它可以實現(xiàn)獲取摘要、提出問題、產(chǎn)生想法等。
整體來看,無論是Project Astra智能助手,還是NotebookLM,這兩款產(chǎn)品可以直接對標(biāo)OpenAI昨日發(fā)布的GPT-4o模型,產(chǎn)生一種 AI 助手能力。
另外,谷歌宣布,已經(jīng)與YouTube合作全新音樂工具M(jìn)usic AI Sandbox。該AI音樂創(chuàng)作工具將與Suno等AI音樂應(yīng)用展開競爭。
最后,谷歌重磅推出了 AI 媒體創(chuàng)作模型 Veo 和 Imagen 3,直接對標(biāo) Sora類型的視頻生成技術(shù)和Dall-E文生圖技術(shù)。
據(jù)介紹,Veo 可以制作“高質(zhì)量”1080p 視頻,Imagen 3 是最新的文本到圖像框架。這兩個聽起來都不是特別革命性的,但它們是谷歌繼續(xù)對抗 OpenAI 的 Sora 視頻模型和 Dall-E 3 的一種方式,Dall-E 3 實際上已經(jīng)成為 AI 生成圖像的代名詞。
谷歌聲稱 Veo 具有“對自然語言和視覺語義的高級理解”,可以創(chuàng)建用戶想要的任何視頻。AI 生成的視頻可以持續(xù)“超過一分鐘”。Veo 還能夠理解電影和視覺技術(shù),例如延時拍攝的概念。
很顯然,在OpenAI聲量“遙遙領(lǐng)先”下,谷歌全力發(fā)起技術(shù)追趕和對齊。
Gemini 能力加持,谷歌搜索引擎迎來顛覆式變革
隨后,谷歌搜索負(fù)責(zé)人 Liz Reid上臺,宣布對全球主導(dǎo)搜索引擎進(jìn)行 AI 驅(qū)動的重大變革。
在此之前,當(dāng)用戶在使用搜索引擎時,通常以文字或圖片形式呈現(xiàn)。而如今,作為推動將生成式 AI 添加到搜索中的一部分,谷歌引入了一個新的轉(zhuǎn)折點:搜索生成體驗(SGE)。
從今天開始,Google 將使 SGE 的“AI Overviews”成為搜索中的默認(rèn)體驗。
在 Gemini 的支持下,這種新的搜索體驗將看到許多查詢(谷歌表示,當(dāng)系統(tǒng)確定生成式人工智能可能有幫助時,它們就會出現(xiàn)),這些查詢將返回到搜索引擎,并將傳統(tǒng)結(jié)果推到頁面下方。人工智能概述往往會在每個查詢中顯示一些鏈接,盡管它們并不總是出現(xiàn),而且通常只有在您單擊展開完整的人工智能生成的響應(yīng)后才會出現(xiàn)。
谷歌指出,今天開始向美國所有用戶推出該服務(wù),其他國家“很快”也會跟進(jìn)。
同時,谷歌搜索還引入視頻。Gemini 會讓用戶上傳演示其要解決的問題的視頻,然后啟動搜索在論壇和互聯(lián)網(wǎng)的其他區(qū)域以找到解決方案。
另外,除了將 Gemini 能力加持到搜索引擎外,谷歌還將為 Gmail 應(yīng)用程序提供一些有趣的新功能,包括長電子郵件線程的摘要。用戶還可以直接與 Gemini 聊天,從整個收件箱中查找詳細(xì)信息。
而為了提供更個性化的體驗,Gemini Advanced 訂閱用戶很快將能夠創(chuàng)建 Gems —— Gemini 的定制版本。Gems 可以讓用戶個性化地創(chuàng)建聊天機(jī)器人,有點像在 Character.AI 中制作自己的“數(shù)字人”,從而讓用戶與流行角色和名人的虛擬版本甚至虛擬心理醫(yī)生交談。
谷歌表示,你可以讓 Gemini 成為你的健身伙伴、副主廚、編碼伙伴、創(chuàng)意寫作指南或任何你能想到的東西。
下一代開源模型Gemma 2登場,性能媲美Llama 3 70B
會上,谷歌還分享了開源大模型Gemma一系列更新。
谷歌表示,全新Gemma 2是一系列輕量級、最先進(jìn)的開放式模型,依然采用與創(chuàng)建 Gemini 模型相同的研究和技術(shù)構(gòu)建,旨在用于負(fù)責(zé)任的AI 創(chuàng)新的下一代開放模型。
同時,Gemma 2還采用全新架構(gòu),提供 27B(270億)參數(shù)大小的尺寸,其性能可與 Llama 3 70B 相媲美,但尺寸卻只有 Llama 3 70B 的一半。從而實現(xiàn)突破性的性能和效率。
其次,為了降低部署成本,Gemma 2 的高效設(shè)計使其所需的計算量少于同類模型的一半。27B 模型經(jīng)過優(yōu)化,可以在英偉達(dá)的 GPU 上運(yùn)行,也可以在 Vertex AI 中的單個 TPU 主機(jī)上高效運(yùn)行,從而使更廣泛的用戶更易于部署且更具成本效益。
再次,Gemma 2 將為開發(fā)人員提供跨越不同平臺和工具生態(tài)系統(tǒng)的強(qiáng)大調(diào)優(yōu)功能。從基于云的解決方案(如Google Cloud)到流行的社區(qū)工具(如Axolotl),微調(diào) Gemma 2 將比以往更容易。
最后,Gemma 家族也在隨著 PaliGemma 的擴(kuò)展而擴(kuò)展。據(jù)悉,PaliGemma 是谷歌受 PaLI-3 啟發(fā)的第一個視覺語言模型。而且,谷歌還使用 LLM Comparator 升級了 Responsible Generative AI Toolkit,用于評估模型響應(yīng)的質(zhì)量。
谷歌表示,Gemma 2將在未來幾周內(nèi)正式公開上線和發(fā)布。
Android 15 將深度集成 Gemini
每屆I/O大會上,必不可少的就是要談Android操作系統(tǒng)。
自2007年Google宣布與84家硬件制造商、軟件開發(fā)商及電信營運(yùn)商成立開放手持設(shè)備聯(lián)盟來共同研發(fā)Android,基于Android安卓開源系統(tǒng)的智能手機(jī)已經(jīng)廣泛應(yīng)用于全球消費級用戶。
2017年3月,Android全球網(wǎng)絡(luò)流量和設(shè)備超越Microsoft Windows,正式成為全球第一大操作系統(tǒng)。截至2023年2月,根據(jù)StatCounter統(tǒng)計,除了美國、英國、加拿大、巴哈馬、冰島、挪威、瑞典、丹麥、瑞士、科索沃、日本、臺灣和澳大利亞外,在其他所有國家和地區(qū)Android都是最被廣泛使用的智能手機(jī)操作系統(tǒng)。
谷歌于 2023 年 10 月發(fā)布了 Android 14,此次大會之前,谷歌已經(jīng)發(fā)布了 Android 15 的第一個測試版,內(nèi)部代號為“香草冰淇淋( Vanilla Ice Cream)”,正式版本即將推出。
此次I/O大會上,谷歌提到了即將推出的安卓新版本Android 15,是以 AI 為核心的 Android,今年將實現(xiàn)三項突破:在 Android 上提供更好的搜索、Gemini 正在成為你的 AI 助手,以及設(shè)備上的 AI 將解鎖新的體驗。
搜索方面,Android 15上的Google搜索全面集成Gemini能力。其中,Android全新Circle to Search功能,現(xiàn)在可以幫助學(xué)生解決數(shù)學(xué)和物理作業(yè),該功能現(xiàn)在將能夠向他們展示“一系列物理和數(shù)學(xué)應(yīng)用題”的分步說明。他們只需長按主頁按鈕或?qū)Ш綑冢缓笕Τ鲎屗麄兏械嚼Щ蟮膯栴}即可激活該功能,盡管有些數(shù)學(xué)問題需要用戶注冊谷歌的實驗性搜索實驗室功能。
其次,Gemini AI 聊天機(jī)器人全面升級,Gemini 正在“成為 Android 上新的人工智能助手”。
最后,與底層操作系統(tǒng)的集成后,就能實現(xiàn)一些更酷的功能。Android 上的 Gemini 具有更強(qiáng)的上下文感知能力,可以覆蓋在正在使用的任何應(yīng)用程序之上,因此你無需來回切換。還有一個巧妙的功能,可以讓你將圖像從 Gemini 應(yīng)用程序拖放到另一個應(yīng)用程序中。
谷歌表示,它“剛剛開始研究設(shè)備上的人工智能如何改變你的手機(jī)的功能”,因此我們想象未來至少會與 Uber 和 Doordash 等應(yīng)用程序集成。
現(xiàn)場谷歌還展示直接通過 Pixel 8a 手機(jī)上的 Google Messages 應(yīng)用程序使用 Gemini 的不同方式。它包括能夠分析 PDF 或視頻并向 Gemini 提出問題,獲得清晰(并引用)的答復(fù)。
谷歌表示,這些功能將在“未來幾個月”出現(xiàn)在更多設(shè)備上。
低調(diào)官宣第六代 TPU芯片,峰值計算性能提高 4.7 倍
在演講期間,皮查伊低調(diào)宣布了谷歌的第六代張量處理單元 (TPU) ,稱為Trillium。
包括Gemini 1.5 Flash、Imagen 3和Gemma 2等新型號在內(nèi),所有這些模型都經(jīng)過 TPU 訓(xùn)練并提供服務(wù)。
實際上,十多年前,谷歌認(rèn)識到需要首款用于機(jī)器學(xué)習(xí)的芯片。2013年,谷歌開始開發(fā)世界上第一個專用 AI 加速器 TPU v1,隨后于 2017 年推出了第一個 Cloud TPU。
谷歌表示,如果沒有 TPU,Google 的許多最受歡迎的服務(wù)(例如實時語音搜索、照片對象識別、交互式語言翻譯以及 Gemini、Imagen 和 Gemma 等最先進(jìn)的基礎(chǔ)模型都是不可能的。而TPU 的規(guī)模和效率為谷歌搜索的Transformers基礎(chǔ)工作奠定了基礎(chǔ),而 Transformers 是現(xiàn)代生成式人工智能的算法基礎(chǔ)。
據(jù)介紹,作為“迄今為止性能最強(qiáng)、能效最高的 TPU”,Trillium 宣稱與 TPU v5e 相比,每個芯片的峰值計算性能提高了 4.7 倍(470%)。
同時,新的TPU將高帶寬內(nèi)存 (HBM) 容量和帶寬增加了一倍,并將 TPU v5e 的芯片間互連 (ICI) 帶寬增加了一倍。
此外,Trillium還配備了第三代SparseCore——專用加速器,用于處理高級排名和推薦工作負(fù)載中常見的超大嵌入。Trillium TPU 可以更快地訓(xùn)練下一波基礎(chǔ)模型,并以更少的延遲和更低的成本為這些模型提供服務(wù)。至關(guān)重要的是,Trillium TPU 的能效比 TPU v5e 高出 67% 以上。
值得一提的是,Trillium 可以在單個高帶寬、低延遲 Pod 中擴(kuò)展到多達(dá) 256 個 TPU。除了這種 Pod 級可擴(kuò)展性之外,借助多切片技術(shù)和Titanium 智能處理單元 (IPU ),Trillium TPU 還可以擴(kuò)展到數(shù)百個 Pod,從而連接建筑物級超級計算機(jī)中的數(shù)萬個芯片,這些芯片通過每秒數(shù) PB 的速度互連數(shù)據(jù)中心網(wǎng)絡(luò)。
Gemini 完全在谷歌的第四代和第五代 TPU 上接受訓(xùn)練和服務(wù)。包括 Anthropic 在內(nèi)的其他領(lǐng)先 AI 公司也在 TPU 上訓(xùn)練了他們的模型。而對 Trillium TPU 上長上下文、多模式模型的訓(xùn)練和服務(wù)的支持也將使Google DeepMind能夠比以往更快、更高效、延遲更低地訓(xùn)練和服務(wù)未來幾代 Gemini 模型。
谷歌表示,Trillium TPU 將為下一波 AI 模型和代理提供動力,包括自動駕駛汽車公司Nuro、藥物發(fā)現(xiàn)公司Deep Genomics、德勤等企業(yè)也采用其TPU產(chǎn)品進(jìn)行應(yīng)用。
因此,Trillium TPU將是 Google Cloud人工智能超級計算機(jī)的一部分,這是一種專為尖端 AI 工作負(fù)載而設(shè)計的突破性超級計算架構(gòu),它集成了性能優(yōu)化的基礎(chǔ)設(shè)施(包括 Trillium TPU)、開源軟件框架和靈活的消費模型。
谷歌表示,Trillium TPU將于今年晚些時候向其云客戶提供。
皮查伊表示:“25 年來,我們投資建設(shè)了世界一流的技術(shù)基礎(chǔ)設(shè)施。從支持搜索的尖端硬件,到支持人工智能進(jìn)步的定制張量處理單元。我們將于 2024 年末向我們的云客戶提供 Trillium?!?/p>
總結(jié):谷歌反擊OpenAI,皮查伊想證明 AI 巨頭能力
作為全球在 AI 領(lǐng)域投入最多的科技巨頭,隨著 OpenAI 推出 ChatGPT 這一劃時代的產(chǎn)物,并迅速席卷全球 AI 領(lǐng)域,谷歌 AI 巨頭地位受到了前所未有的挑戰(zhàn)。
在此次演講中,谷歌全面展示 AI 領(lǐng)域的重要突破,也是皮查伊想證明這家 AI 巨頭的未來發(fā)展能力。
一周前,皮查伊接受彭博采訪時講到,谷歌年度開發(fā)者大會較少聚焦于特定的產(chǎn)品發(fā)布,而更多地聚焦于正在經(jīng)歷的旅程,如何設(shè)想 AI 改變谷歌產(chǎn)品的愿景,以及如何逐步將這些變革引入現(xiàn)實。
他表示,谷歌已經(jīng)在搜索中運(yùn)用了 Transformer 技術(shù),這一技術(shù)極大地提升了谷歌搜索的質(zhì)量,“因此,我們已經(jīng)在所有產(chǎn)品中融入了 Transformer 技術(shù)。”
皮查伊反復(fù)強(qiáng)調(diào)創(chuàng)新,他認(rèn)為這些產(chǎn)品革新對谷歌來說非常重要。
“在技術(shù)領(lǐng)域,如果你不持續(xù)創(chuàng)新以保持領(lǐng)先,那么任何公司都將不可避免地走向衰敗”,皮查伊這種想法與Meta CEO扎克伯格類似,后者直接表示,如果Meta無法創(chuàng)新,他就要完了。
過去十年,谷歌一直自詡為“ AI 領(lǐng)先公司”。如今新的生成式 AI 時代下,皮查伊則認(rèn)為谷歌不能被微軟牽著鼻子走,需要有自己的方式。
談到與OpenAI 的競爭,皮查伊直言不諱地表示,這并不是一個零和游戲。在他看來,所有人向 AI 的轉(zhuǎn)變是多么深刻,AI 還處于早期階段,前方充滿了無限的機(jī)會。
“我從長遠(yuǎn)的角度說,當(dāng)互聯(lián)網(wǎng)剛剛出現(xiàn)時,谷歌當(dāng)時甚至不存在,對吧?所以我們不是第一家做搜索的公司,我們不是第一家做電子郵件的公司,我們不是第一家構(gòu)建瀏覽器的公司。我們還有很長的路要走,我們正處于這場技術(shù)革命的初期階段。”皮查伊表示。
當(dāng)被問及“是否對AI生成的內(nèi)容可能破壞搜索感到擔(dān)憂”時,皮查伊稱,對于每個人來說,如何在充斥著大量合成內(nèi)容的世界中區(qū)分客觀和真實,既是挑戰(zhàn),也是機(jī)會。
他認(rèn)為,這將是未來十年定義搜索的一部分。他說,人們經(jīng)常會使用谷歌來驗證在其他地方看到的內(nèi)容是否屬實,這已經(jīng)成為常見的搜索模式。在這方面,谷歌正取得進(jìn)展,但這將是一個持續(xù)的過程。
皮查伊強(qiáng)調(diào),未來,AI 技術(shù)將影響每一家公司的每一種產(chǎn)品,包括作家、會計師、建筑師以及軟件工程師等知識型員工將被取代。而未來10年,人們就將擁有某種形式的、非常強(qiáng)大的 AI 助手,可以做許多令人驚嘆的事情。
谷歌曾指出,人們應(yīng)該學(xué)會和機(jī)器并肩工作,理解這些技術(shù)如何輔助人們完成現(xiàn)有工作。
很顯然,AI 已經(jīng)在改變我們的生活。但是,無論是怎樣對標(biāo),谷歌作為全球科技巨頭,每年擁有數(shù)百億美金的現(xiàn)金流,各種 AI 人才和 AI 資源能力,都是谷歌有望全面贏得生成式 AI 領(lǐng)域桂冠的重要能力。
而未來,我們可以發(fā)現(xiàn),需要新的芯片和計算機(jī)架構(gòu)才能實現(xiàn)通用人工智能(AGI)。不管Sora還是chatGPT,又或者是Gemini,都不是通用的人工智能,也沒有自主意識,兩次因果放大,跨越三個空間層級是自主信息系統(tǒng)的特點。
DNA通過RNA讀取信息,表現(xiàn)在蛋白質(zhì)等生物大分子上,維持細(xì)胞運(yùn)轉(zhuǎn),這是一次因果放大,更微觀層面的擾動引起DNA的突變,也是一次因果放大,所以,以DNA為主信息系統(tǒng)實現(xiàn)了兩次因果放大,跨越了三個空間層級。
同樣,大腦思考學(xué)習(xí)表現(xiàn)在身體行為上,是一次因果放大,自主意識、偶發(fā)靈感亦源于更微觀層面的擾動,也是一次因果放大,所以說大腦-神經(jīng)系統(tǒng)也做到了兩次因果放大,跨越了三個空間層級。
因此,很顯然,基于腦機(jī)接口、生命科學(xué)、量子計算等技術(shù)的 AI 技術(shù)能力,將成為未來真正 AGI 時代的發(fā)展目標(biāo),而谷歌正在努力做到這一切。
責(zé)任編輯:尉旖涵
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)