新的變革已經(jīng)到來(lái)
硅星人 文| 油醋 VickyXiao 編輯| VickyXiao
面對(duì)ChatGPT的來(lái)勢(shì)洶洶,谷歌徹底慌了。
OpenAI發(fā)布ChatGPT也不過(guò)是4個(gè)月之前。但是在這4個(gè)月里,已經(jīng)有不少預(yù)言,稱(chēng)ChatGPT帶來(lái)的變革,將會(huì)顛覆谷歌的現(xiàn)有搜索產(chǎn)品和商業(yè)模式。
于是,谷歌CEO桑達(dá)爾·皮柴(Sundar Pichai) 開(kāi)啟“戰(zhàn)備”狀態(tài):先是在ChatGPT問(wèn)世兩周內(nèi)就拉起了“紅色警報(bào)”,然后創(chuàng)始人拉里·佩奇和謝爾蓋·布林時(shí)隔3年再度被緊急喚回。
今天皮柴更是在官網(wǎng)上稱(chēng),谷歌一直在研發(fā)一款名為Bard的實(shí)驗(yàn)性對(duì)話(huà)AI服務(wù),今天起,谷歌將把它對(duì)信任的開(kāi)發(fā)者開(kāi)放,然后將在接下來(lái)的幾周內(nèi),把它向更廣泛的受眾開(kāi)放。
谷歌終于加入了這場(chǎng)智能聊天機(jī)器人對(duì)搜索引擎發(fā)動(dòng)的大戰(zhàn)。
01 谷歌宣戰(zhàn)
谷歌的第23號(hào)員工,Gmail的締造者保羅·布赫海特在2月1號(hào)發(fā)推悲觀(guān)表示,谷歌將會(huì)在一兩年內(nèi)被徹底顛覆——當(dāng)人們的搜索需求能夠被封裝好的、語(yǔ)義清晰的答案滿(mǎn)足,搜索廣告將會(huì)沒(méi)有生存余地。而占據(jù)全球接近84%搜索市場(chǎng)的谷歌,到現(xiàn)在仍然是一家50%營(yíng)收直接來(lái)自搜索廣告的公司。
圖源:推特
眼看ChatGPT引起的戰(zhàn)火燒到了自家主場(chǎng),谷歌終于反應(yīng)過(guò)來(lái),在今天宣布推出類(lèi)ChatGPT產(chǎn)品——一款實(shí)驗(yàn)性的對(duì)話(huà)AI服務(wù)Bard。
皮柴在今天發(fā)出的博文里稱(chēng),谷歌一直希望通過(guò)大語(yǔ)言模型,把這些深度研究和突破變成產(chǎn)品來(lái)幫助人們。兩年前,谷歌推出了大語(yǔ)言模型LaMDA,此后,谷歌就在LaMDA的基礎(chǔ)上,開(kāi)發(fā)出了Bard。
今天,谷歌將先對(duì)信任的開(kāi)發(fā)者開(kāi)放這項(xiàng)服務(wù),然后將在接下來(lái)的幾周內(nèi),把它向更廣泛的受眾開(kāi)放。
谷歌強(qiáng)調(diào),巴德會(huì)把世界上的信息知識(shí)和谷歌的大語(yǔ)言模型所帶來(lái)的能力和智能相結(jié)合,它會(huì)獲取網(wǎng)絡(luò)上的信息,來(lái)提供新鮮的、高質(zhì)量的回復(fù)。這意味著和ChatGPT受限于2021年以前的數(shù)據(jù)不同,巴德會(huì)是基于實(shí)時(shí)網(wǎng)絡(luò)數(shù)據(jù)的,谷歌將把它與LaMDA的輕量級(jí)模型版本一起發(fā)布。
從博文里的圖片來(lái)看,Bard也是和ChatGPT類(lèi)似的聊天框形態(tài),能做的事除了簡(jiǎn)化復(fù)雜的主題,比如”向9歲的孩子解釋NASA的韋伯望遠(yuǎn)鏡帶來(lái)的新發(fā)現(xiàn)“,還能幫助人們做一些復(fù)雜的任務(wù),包括”計(jì)劃朋友的新生兒派對(duì)“、”比較兩部奧斯卡提名的電影“和”根據(jù)冰箱里的食物給出一些午餐點(diǎn)子”等。
圖源:谷歌
在谷歌看來(lái),這個(gè)小得多的模型需要更少的算力,從而可以擴(kuò)展到更多的用戶(hù),獲得更多的反饋。他們會(huì)將外部反饋與自己的內(nèi)部測(cè)試相結(jié)合,以確保 Bard 的回答在質(zhì)量、安全性和真實(shí)信息的基礎(chǔ)性方面達(dá)到高標(biāo)準(zhǔn)。谷歌希望通過(guò)這一階段的測(cè)試,來(lái)提高 Bard 的質(zhì)量和速度。
皮柴還在博文里稱(chēng),很快,谷歌還將很快在搜索中整合基于A(yíng)I的功能。除了像ChatGPT一樣會(huì)將復(fù)雜的信息和多個(gè)視角提煉成易于理解的回答,谷歌還將進(jìn)一步提供更多網(wǎng)頁(yè)信息的選擇。
不過(guò),根據(jù)硅星人獲得的消息,Bard大部分由華人團(tuán)隊(duì)開(kāi)發(fā),而且這次Bard的發(fā)布有點(diǎn)趕,在內(nèi)部算不上完全準(zhǔn)備好,所以才在現(xiàn)在以面向有限開(kāi)發(fā)者的形式推出,而非像ChatGPT一樣,一開(kāi)始便開(kāi)放給大眾使用。
同時(shí),谷歌內(nèi)部對(duì)ChatGPT感到恐懼的另外一層原因,是人才的流失。和很多公司一樣,谷歌內(nèi)部也采用賽馬制,有好幾個(gè)做類(lèi)似模型的團(tuán)隊(duì),但內(nèi)部其它大語(yǔ)言模型團(tuán)隊(duì)向OpenAI流失人才的情況比較嚴(yán)重。
當(dāng)然,不管內(nèi)里如何焦慮,皮柴至少在博文里信心滿(mǎn)滿(mǎn)地宣布,下個(gè)月,谷歌將開(kāi)始讓個(gè)人開(kāi)發(fā)者、創(chuàng)作者和企業(yè)嘗試自家的生成語(yǔ)言 API (Generative Language API),該 API 最初會(huì)由 LaMDA 提供支持,并有一系列模型可供選擇。“隨著時(shí)間的推移,我們打算創(chuàng)建一套工具和 API,讓其他人可以輕松地使用 AI 構(gòu)建更具創(chuàng)新性的應(yīng)用程序。”
與此同時(shí),ChatGPT開(kāi)發(fā)者OpenAI背后的金主微軟,也在緊鑼密鼓地想要把ChatGPT整合進(jìn)自己產(chǎn)品中。
微軟正在與OpenAI洽談一筆100億美元的投資,并在年初傳出計(jì)劃將ChatGPT添加到自己的搜索引擎Bing中,搜索結(jié)果將首次顯示為帶有信息來(lái)源的完整句子,這個(gè)新的版本會(huì)在3月左右發(fā)布。
而就在皮柴的博文發(fā)出不久,微軟就宣布,將在明天召開(kāi)一場(chǎng)發(fā)布會(huì),主要就是關(guān)于微軟和OpenAI的合作,以及ChatGPT和微軟Bing搜索的整合。
與此前的危機(jī)都不同的是,這是谷歌的搜索根基在20多年后第一次受到挑戰(zhàn)。幾年以后“Google it.”會(huì)不會(huì)讓位給“ChatGPT it.”?這是讓人興奮的地方。Bing和百度們想追上谷歌,谷歌不想變成雅虎。
谷歌的搜索霸權(quán)會(huì)在今年被動(dòng)搖嗎?
02 停滯的搜索
讓我們的目光先回到谷歌誕生之初。
拉里·佩奇和謝爾蓋·布林在千禧年前夕嗅到了互聯(lián)網(wǎng)繁榮在即與信息檢索陳舊邏輯之間的間隙,貫穿谷歌生命的算法Page Rank由此誕生。
20世紀(jì)90年代,互聯(lián)網(wǎng)僅僅是一個(gè)為全球2%的人受用的先鋒概念。網(wǎng)絡(luò)資源匱乏,雅虎甚至以手工錄入的方式就足夠建立起最初的互聯(lián)網(wǎng)搜索概念。1995年Alta Vista出現(xiàn),互聯(lián)網(wǎng)歷史上有了第一個(gè)全網(wǎng)頁(yè)內(nèi)容的索引工具,后者第一次設(shè)計(jì)出爬蟲(chóng)技術(shù)(web crawl),并在1995年8月完整完成了第一次網(wǎng)絡(luò)爬取。
圖源:源于網(wǎng)絡(luò)
但以Alta Vista為首的搜索工具對(duì)搜索關(guān)鍵詞與索引結(jié)果之間的關(guān)聯(lián)分析仍然十分薄弱,這很大程度源于搜索工具最初的受用人群。在互聯(lián)網(wǎng)普及之前,信息搜索只是服務(wù)于文獻(xiàn)查找的工具,其框架長(zhǎng)久建立在學(xué)術(shù)圈以關(guān)鍵詞加權(quán)平均為信息搜索基礎(chǔ)的邏輯上。
極度理性且表達(dá)精確的學(xué)術(shù)內(nèi)容搜索邏輯并不適用于互聯(lián)網(wǎng)的信息抓取。反映在A(yíng)lta Vista上,就是它能搜索到大量信息,但準(zhǔn)確性卻非常低。
只有拉里·佩奇注意到了互聯(lián)網(wǎng)信息之間關(guān)聯(lián)性的利用潛力。
他將互聯(lián)網(wǎng)想象成一個(gè)多節(jié)點(diǎn)的矩陣,每一個(gè)網(wǎng)頁(yè)都是“點(diǎn)”,網(wǎng)頁(yè)之間的超鏈接關(guān)系則是“邊”。指向一個(gè)網(wǎng)頁(yè)的超鏈接越多,則這個(gè)網(wǎng)頁(yè)被判斷為越重要,這個(gè)過(guò)程中每個(gè)網(wǎng)頁(yè)都可以找到統(tǒng)一標(biāo)尺下的重要性參數(shù)。
圖源:推特
這個(gè)這是日后知識(shí)圖譜技術(shù)甚至圖計(jì)算的最初想象,也是算法作為一種思維第一次進(jìn)入搜索領(lǐng)域。
受制于互聯(lián)網(wǎng)的發(fā)展階段,雅虎和Alta Vista是不可能產(chǎn)生算法思維的,而Page Rank對(duì)Alta Vista的取代則成為“搜索”歷史上最閃耀的時(shí)刻。
但至今關(guān)于“搜索”的所有變革,也在24年前Page Rank誕生那一刻就宣告結(jié)束了。
無(wú)論是2001年出現(xiàn)的百度,2009年出現(xiàn)的Bing(當(dāng)然也包括使用Bing核心搜索技術(shù)的雅虎),都再也沒(méi)有逃出以Page Rank所建立起的邏輯框架,即把用戶(hù)的開(kāi)放性問(wèn)題轉(zhuǎn)換成互聯(lián)網(wǎng)信息圖譜上具有關(guān)聯(lián)性?xún)?yōu)先級(jí)的、一個(gè)更具體的選項(xiàng)擴(kuò)列,再還給用戶(hù)去甄別。
2021年新興的搜索引擎You.com,最大的賣(mài)點(diǎn)僅僅是集成式的把推特等其他平臺(tái)的搜索結(jié)果分門(mén)類(lèi)得納入到了信息搜索結(jié)果中,并且賦予用戶(hù)對(duì)于信息來(lái)源平臺(tái)一定的權(quán)重設(shè)計(jì)能力。
在搜索的發(fā)展停滯中,這樣一個(gè)“谷歌的挑戰(zhàn)者”就足夠獲得2000萬(wàn)美元的種子輪融資。
中文互聯(lián)網(wǎng)世界里沒(méi)有另一個(gè)綜合搜索引擎獲得長(zhǎng)期繁榮,反倒是在移動(dòng)互聯(lián)網(wǎng)信息孤島的壓迫下,微信和字節(jié)跳動(dòng)提供的更垂直的搜索服務(wù)開(kāi)始占領(lǐng)百度的內(nèi)容盲區(qū)。
類(lèi)似You.com的搜索引擎短期內(nèi)仍然不會(huì)在國(guó)內(nèi)出現(xiàn),這是百度遺憾的地方。而無(wú)論抖音搜索或是微信搜一搜,也都沒(méi)有從搜索技術(shù)效率上取代百度的野心。一個(gè)自有生態(tài)內(nèi)的內(nèi)容連接器角色已是這類(lèi)垂直搜索服務(wù)的上限,這本質(zhì)上是新的互聯(lián)網(wǎng)巨頭們適應(yīng)各自商業(yè)邏輯所做的模式創(chuàng)新,而非技術(shù)創(chuàng)新。
所以抖音搜索們對(duì)抖音重要,對(duì)“搜索”卻不重要。
2002年加入谷歌并主導(dǎo)設(shè)計(jì)了后者日中韓文搜索算法的吳軍在2012年出版的《浪潮之巔》中這樣描述Page Rank:
“雖然今天Google和其他搜索引擎相比當(dāng)初的Google已有了長(zhǎng)足的進(jìn)步,但是這種進(jìn)步基本上屬于量變。搜索引擎領(lǐng)域迄今為止的質(zhì)變只有Page Rank取代Alta Vista那一次。”
這個(gè)判斷到現(xiàn)在仍不過(guò)時(shí),直到ChatGPT帶著生成式搜索的面目出現(xiàn)。
03 未必顛覆一切
ChatGPT可以寫(xiě)代碼、需求文檔甚至初步實(shí)現(xiàn)所有辦公軟件的AI化,但大部分人用不著這些——就像大部分搜索引擎的用戶(hù)只是簡(jiǎn)單的提問(wèn),然后要一個(gè)答案。
于是撇開(kāi)這些,ChatGPT與谷歌(或者百度)相比最大的優(yōu)勢(shì),是它可以——幾乎是畢其功于一役的——生成一個(gè)極高質(zhì)量的首條信息結(jié)果。
康乃爾大學(xué)的研究人員曾經(jīng)通過(guò)眼部追蹤實(shí)驗(yàn)獲得了精確的谷歌搜索結(jié)果的用戶(hù)行為分析。分析結(jié)果顯示,首條結(jié)果獲得了 56.38% 的搜索流量,第二條和第三條結(jié)果的排名依次降低,但遠(yuǎn)低于排名第一的結(jié)果。
圖源:Search Engine Journal
這十分考驗(yàn)ChatGPT生成內(nèi)容的準(zhǔn)確性,而這個(gè)大型語(yǔ)言模型背后是一個(gè)信息來(lái)源與即時(shí)性的黑盒。
由于ChatGPT的回答中并不展示信息來(lái)源,用戶(hù)目前無(wú)法從回答中分辨信息真?zhèn)巍?/p>
在即時(shí)性上,ChatGPT無(wú)論是以頻繁增加標(biāo)注數(shù)據(jù)并一次次重新對(duì)模型進(jìn)行預(yù)訓(xùn)練的方式,還是用Fine-Ture的思路來(lái)修改現(xiàn)成的訓(xùn)練結(jié)果,都會(huì)遇到新的問(wèn)題。前者是極大的算力成本,后者是新知識(shí)對(duì)原有知識(shí)的過(guò)度覆蓋隱患。
ChatGPT是搜索領(lǐng)域苦等的一次效率革命,被認(rèn)為是一種“導(dǎo)彈”對(duì)“弓箭”的降維打擊。但如果說(shuō)Page Rank是算法邏輯第一次進(jìn)入搜索領(lǐng)域,ChatGPT也并沒(méi)有背離這個(gè)技術(shù)原點(diǎn)。
ChatGPT的成功基于一場(chǎng)以1萬(wàn)個(gè)英偉達(dá)V100 GPU支撐、用深度學(xué)習(xí)和人工智能對(duì)人類(lèi)信息歷史反復(fù)咀嚼的苦功。從這個(gè)角度上看,它仍然是漸進(jìn)式的,并非一個(gè)完全的顛覆者。
而哪怕谷歌本身,也并不意外ChatGPT在技術(shù)層面所實(shí)現(xiàn)的東西,
去年開(kāi)發(fā)者大會(huì) I/O 上,谷歌展示了大語(yǔ)言模型LaMDA如何以冥王星作為對(duì)話(huà)主體來(lái)與人進(jìn)行交流,這種回答是即時(shí)生成的,并不是學(xué)習(xí)了大量預(yù)定義的結(jié)果。大語(yǔ)言模型LaMDA和多模態(tài)多任務(wù)模型MUM所表現(xiàn)出來(lái)的素質(zhì),意味著谷歌已經(jīng)具備與ChatGPT相近的AI能力。
圖源:源于網(wǎng)絡(luò)
而讓皮柴感到緊張的是,ChatGPT在上線(xiàn)五天就成功吸引了超過(guò)100萬(wàn)的用戶(hù),這個(gè)數(shù)字在兩個(gè)月后漲到1億。
OpenAI做了第一個(gè)吃螃蟹的人,而大眾接受了它。
而一家市值超過(guò)1.4萬(wàn)億美元的大公司注定比小型創(chuàng)業(yè)公司更保守。
谷歌人工智能負(fù)責(zé)人杰夫·迪恩在幾個(gè)月前對(duì)員工表示,倘若通過(guò)(ChatGPT)這樣的服務(wù)提供錯(cuò)誤信息,會(huì)給谷歌帶來(lái)更大的“聲譽(yù)風(fēng)險(xiǎn)”。
谷歌的一位高級(jí)工程師曾在去年公開(kāi)表示大語(yǔ)言模型LaMDA“有意識(shí),有靈魂”,隨即被勒令停職。他在被停職的前一天把一些包含谷歌及其技術(shù)涉嫌宗教歧視的證據(jù)交到了一名美國(guó)參議員的辦公室。
種種困擾,讓谷歌即使有了大語(yǔ)言模型LaMDA,也無(wú)法輕易拋出一個(gè)可能會(huì)亂說(shuō)話(huà),又容易動(dòng)搖自己商業(yè)化根基的聊天機(jī)器人。
但OpenAI可以冒這樣的風(fēng)險(xiǎn)。
這看起來(lái)就像曾經(jīng)拉里·佩奇和謝爾蓋·布林在對(duì)雅虎所做的事。現(xiàn)在時(shí)隔多年再次因?yàn)樗阉鳂I(yè)務(wù)現(xiàn)身谷歌硅谷辦公室所需要面對(duì)的,是一個(gè)神奇,卻仍然算力成本困擾籠罩,生成內(nèi)容充滿(mǎn)漏洞的ChatGPT,兩人或許在OpenAI的莽撞中看到了曾經(jīng)的自己。
1997年,拉里·佩奇和謝爾蓋·布林在買(mǎi)下google.com域名后,提著窮的叮當(dāng)響的西裝口袋為谷歌找了一年的投資,最后終于在1998年遇到了斯坦福校友、太陽(yáng)公司創(chuàng)始人安迪·貝托謝姆的一張10萬(wàn)美元的支票。
今時(shí)已不同往日,根據(jù)CB Insights提供的市場(chǎng)情報(bào),與生成式AI概念相關(guān)的初創(chuàng)公司已經(jīng)達(dá)到250家以上,其中有接近7成已經(jīng)拿到至少天使輪的融資,其中11%的公司已經(jīng)走到B輪以上。在這眾多初創(chuàng)公司中,價(jià)值最高的就是OpenAI。
那張陳年的10萬(wàn)美元支票打開(kāi)了一扇互聯(lián)網(wǎng)搜索引擎的門(mén),而人們現(xiàn)在對(duì)于ChatGPT的信心和期望,也幾乎是從那個(gè)成功的谷歌延續(xù)而來(lái)。
谷歌也在近日拿出了3億美元提前布局與OpenAI的攻守戰(zhàn)。這筆投資給到了Anthropic——一家以前OpenAI核心員工為骨干,同樣做生成式AI,并且此前估值已高達(dá)50億美元的人工智能公司——換取了后者10%的股份,以及一個(gè)獨(dú)家云提供商的身份。
此外,谷歌選擇對(duì)內(nèi)部的類(lèi)ChatGPT項(xiàng)目Bard壓下重注。
與ChatGPT不同的是,Bard在描述中可以涉及當(dāng)下的時(shí)事,這意味著其可以解決ChatGPT所欠缺的信息即時(shí)性問(wèn)題。
百度的“ChatGPT計(jì)劃”也將以生成式搜索的形式出現(xiàn)。目前在內(nèi)部“高度機(jī)密”,甚至不可以被公開(kāi)討論,最終這項(xiàng)會(huì)融入目前的百度搜索引擎中。
李彥宏在去年年底的一次內(nèi)部講話(huà)中表示,AIGC和ChatGPT這些新的技術(shù)進(jìn)展會(huì)變成什么樣的AI產(chǎn)品,
仍然有很多不確定性,但這件事“百度必須做”。對(duì)于這個(gè)即將在下個(gè)月面世的項(xiàng)目,李彥宏給出的定位是“引領(lǐng)搜索體驗(yàn)的代際變革”。
現(xiàn)在無(wú)論主動(dòng)還是被動(dòng)的,蝴蝶效應(yīng)已起。
“搜索”這片已經(jīng)平靜20多年的湖面,一顆石子久違地拋下了。
*參考資料:
《浪潮之巔》,吳軍
《百度將推出類(lèi)似ChatGPT服務(wù)》,財(cái)經(jīng)網(wǎng)
(聲明:本文僅代表作者觀(guān)點(diǎn),不代表新浪網(wǎng)立場(chǎng)。)