ChatGPT會(huì)取代搜索引擎嗎?

ChatGPT會(huì)取代搜索引擎嗎?
2022年12月09日 10:46 市場(chǎng)資訊
機(jī)器人(圖片來(lái)源:Unsplash)機(jī)器人(圖片來(lái)源:Unsplash)

  作者|林志佳

  來(lái)源:鈦媒體

  過(guò)去一周風(fēng)靡社交網(wǎng)絡(luò)的人工智能(AI)產(chǎn)品,非ChatGPT莫屬。

  12月5日,微軟投資的美國(guó) AI 實(shí)驗(yàn)室 OpenAI 創(chuàng)始人兼CEO Sam Altman在社交媒體上宣布,其11月30日發(fā)布的聊天機(jī)器人模型ChatGPT,上線短短五天,用戶已經(jīng)突破了100萬(wàn)。

  所謂ChatGPT,就是模仿人類說(shuō)話風(fēng)格的同時(shí)回答大量的問(wèn)題,通過(guò) OpenAI 的新模型生成一些語(yǔ)義答案,利用網(wǎng)頁(yè)應(yīng)用形式與用戶對(duì)話互動(dòng),實(shí)現(xiàn)簡(jiǎn)單聊天、信息咨詢、撰寫(xiě)詩(shī)詞作文、修改代碼等。

  由于其較高質(zhì)量的回答、高效獲取信息的方式以及上癮式的交互體驗(yàn),ChatGPT引起了國(guó)內(nèi)外社交媒體的廣泛傳播與關(guān)注,而且產(chǎn)生取代谷歌等搜索引擎的討論與可能性。

  連世界首富、特斯拉CEO馬斯克也稱:“許多人陷入了該死的瘋狂ChatGPT循環(huán)中。”甚至已經(jīng)有國(guó)內(nèi)投資人開(kāi)始尋找ChatGPT背后的 OpenAI 公司,求購(gòu)其股份。

  盡管對(duì)其有大量贊揚(yáng)的聲音,但程序員聚集的問(wèn)答社區(qū)Stack Overflow已經(jīng)宣布禁止使用ChatGPT生成的機(jī)器回復(fù),而且ChatGPT存在輸出結(jié)果不穩(wěn)定、沒(méi)有糾錯(cuò)體系、商業(yè)落地難、數(shù)據(jù)安全難保護(hù)、對(duì)中國(guó)境內(nèi)的實(shí)名用戶不友好、關(guān)鍵模型不開(kāi)源、AIGC(人工智能內(nèi)容生產(chǎn))賽道引發(fā)的創(chuàng)業(yè)與投資泡沫等問(wèn)題,已引發(fā)業(yè)內(nèi)廣泛討論。

  接受鈦媒體App獨(dú)家采訪時(shí),京東集團(tuán)副總裁、IEEE Fellow何曉冬博士表示,中國(guó)應(yīng)該要發(fā)展自己的ChatGPT模型產(chǎn)品。

  “坦白講,(語(yǔ)音機(jī)器人)這個(gè)方向是對(duì)的,以后會(huì)有這個(gè)市場(chǎng)需求。”何曉冬強(qiáng)調(diào),除了在研究方面繼續(xù)向前探索外,在文本生成上,ChatGPT有獨(dú)到的體驗(yàn)和價(jià)值,已經(jīng)快要接近可商用的地步了。

  ChatGPT到底是怎么形成的?能否取代搜索引擎?

  “AI 快要成精了!”有投資人玩ChatGPT之后在朋友圈這樣感慨。

  那么,什么是ChatGPT?

  你可以理解為,ChatGPT偏任務(wù)型的多輪對(duì)話或問(wèn)答系統(tǒng),定位于“通用型 AI 技術(shù)助理”。相比蘋(píng)果Siri 和小愛(ài)同學(xué)的“訂餐、訂票、訂賓館”,ChatGPT更多執(zhí)行開(kāi)放域任務(wù),即問(wèn)答、閱讀理解、推理、頭腦風(fēng)暴、寫(xiě)作文、改錯(cuò)等,可以說(shuō)是“AI 版的知乎”。

  今年3月4日,OpenAI 團(tuán)隊(duì)在預(yù)印版網(wǎng)站arxiv上提交了一篇題為“訓(xùn)練語(yǔ)言模型以遵循人類反饋的說(shuō)明”的論文,詳細(xì)闡述了ChatGPT背后基于擁有13億個(gè)參數(shù)的InstructGPT大模型的技術(shù)能力。

  OpenAI 在論文中指出,ChatGPT核心在于InstructGPT模型輸出,更深層次是基于 OpenAI 研發(fā)的GPT-3.5基座能力。盡管InstructGPT模型參數(shù),比NLP預(yù)訓(xùn)練模型——GPT-3 1750億個(gè)參數(shù)少100倍,但前者的數(shù)據(jù)模型有所甄選、校準(zhǔn)和微調(diào),訓(xùn)練出來(lái)的結(jié)果更精準(zhǔn),能夠更簡(jiǎn)單的優(yōu)化語(yǔ)言模型。

  該團(tuán)隊(duì)稱,ChatGPT大部分沿用了InstructGPT的訓(xùn)練方式,在數(shù)據(jù)收集階段招聘了人類 AI 訓(xùn)練師,同時(shí)扮演用戶和 AI 助理角色收集數(shù)據(jù)。在此過(guò)程中,這些 AI 訓(xùn)練師可以根據(jù)初始模型的結(jié)果修改模型生成的回復(fù),從而被用于有監(jiān)督地精調(diào)訓(xùn)練模型。隨后,工程師會(huì)對(duì)模型的多個(gè)生成結(jié)果進(jìn)行比較,從中甄選數(shù)據(jù)中更加符合人類偏好的輸出信息,甚至存在持續(xù)學(xué)習(xí)能力。OpenAI 統(tǒng)計(jì)發(fā)現(xiàn),其API用戶在超過(guò)70%的情況下更喜歡InstructGPT。

  目前,ChatGPT仍處于免費(fèi)測(cè)試階段,不限量向公眾開(kāi)放。而基于其破百萬(wàn)的用戶數(shù),平臺(tái)所花費(fèi)的成本不算小。馬斯克曾詢問(wèn)“每次聊天的平均費(fèi)用是多少”,Altman回復(fù):“用戶平均每次聊天所花費(fèi)的可能是個(gè)位數(shù)美分。”

  鈦媒體App也第一時(shí)間嘗試使用ChatGPT模型,簡(jiǎn)單問(wèn)了三個(gè)關(guān)于芯片相關(guān)的問(wèn)題。我們發(fā)現(xiàn),ChatGPT有些信息非常精準(zhǔn),有點(diǎn)像知乎或百科的回答,有時(shí)候像谷歌、Bing的搜索引擎結(jié)果。但它的答案精準(zhǔn)度依然有待商榷。

  • 1、摩爾定律什么時(shí)候會(huì)終結(jié)?
  • 2、英特爾未來(lái)能否超越AMD和英偉達(dá)?
  • 3、幫我寫(xiě)一篇芯片的七言絕句

  清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授、博導(dǎo),聆心智能創(chuàng)始人黃民烈告訴鈦媒體App,ChatGPT展示了新一代 AI 技術(shù)的能力,或許不遠(yuǎn)的未來(lái),一定程度的AGI(通用人工智能)可以做到。至少無(wú)縫人機(jī)交互是樂(lè)觀的。他指出,InstructGPT的數(shù)據(jù)很好,勝在數(shù)據(jù)質(zhì)量高、多樣性、RLHF算法。其中,強(qiáng)化學(xué)習(xí)帶來(lái)的增益非常之大。

  目前來(lái)看,ChatGPT的升級(jí)在于更多是算力與語(yǔ)料調(diào)教后的技術(shù)成果。

  何曉冬則對(duì)鈦媒體App表示,ChatGPT模型在使用體驗(yàn)上確實(shí)讓人感覺(jué)耳目一新。無(wú)論是流暢性,還是邏輯感都非常強(qiáng),邏輯強(qiáng)于內(nèi)容。但“干貨”量偏低,缺少一些知識(shí)的準(zhǔn)度,“其實(shí)某種意義上,我覺(jué)得它的實(shí)用價(jià)值現(xiàn)在還是比不上谷歌(搜索)的。”

  前Google總部科學(xué)家、出門問(wèn)問(wèn)創(chuàng)始人李志飛接受采訪時(shí)表示,相對(duì)于語(yǔ)音助手和搜索引擎,ChatGPT還有很多不能干或干不好的事情。ChatGPT的“認(rèn)知”建立在虛擬訓(xùn)練文本上,沒(méi)有跟實(shí)時(shí)的數(shù)據(jù)庫(kù)或信息連接,仍有些“空中樓閣”的味道,所以特別適合插科打諢。

  有用戶總結(jié),目前ChatGPT不能回答的話題包括:不能預(yù)測(cè)可能會(huì)但從未發(fā)生過(guò)的事件及其后果;不能OpenMind或打破常規(guī)建立新規(guī)則和新模式;不能深入問(wèn)題的細(xì)節(jié)去回答而是停留概要層面;無(wú)法區(qū)分是否為事實(shí)問(wèn)題,一些非事實(shí)問(wèn)題無(wú)法得到回答;很偏門的問(wèn)題(可能從未有人這么想過(guò)的問(wèn)題)不會(huì)回答;不能列出非主流觀點(diǎn);對(duì)話語(yǔ)境不能跳躍太大,領(lǐng)域跨度太大等。

  但專欄作家Parmy Olson卻認(rèn)為,相比谷歌搜索抓取數(shù)十億個(gè)網(wǎng)頁(yè)內(nèi)容編制索引,然后按照最相關(guān)的答案對(duì)其進(jìn)行排名,包含鏈接列表來(lái)讓你點(diǎn)擊。ChatGPT卻直接基于它自己的搜索和信息綜合的單一答案,回復(fù)流程更加簡(jiǎn)便。

  針對(duì)外界認(rèn)為ChatGPT能否取代搜索引擎的討論,ChatGPT自己卻給出了“否定”回答:ChatGPT并不是搜索引擎。它的目的不是提供信息搜索。相對(duì)于搜索引擎通過(guò)索引網(wǎng)頁(yè)并匹配搜索詞來(lái)提供信息,ChatGPT則是通過(guò)對(duì)自然語(yǔ)言問(wèn)題的回答來(lái)幫助用戶解決問(wèn)題。因此,它們之間沒(méi)有直接的競(jìng)爭(zhēng)關(guān)系,并不能相互顛覆。

  早前,OpenAI還發(fā)布了DALL·E 2——可以通過(guò)文本描述中生成圖像的 AI 程序。國(guó)盛證券指出,相比于此前的AI繪畫(huà),ChatGPT更具有將AI能力與工作流程相結(jié)合的潛力,如果將ChatGPT與Midjourney等創(chuàng)作工具融合,有可能直接輸出設(shè)計(jì)圖稿等內(nèi)容。而ChatGPT和DALL·E兩個(gè)產(chǎn)品都是AIGC技術(shù)帶來(lái)的新變革。

  “我認(rèn)為 AI 的潛力還可以進(jìn)一步放大和挖掘。回看過(guò)去這十年,AI 技術(shù)的進(jìn)步確實(shí)超出想象。10年前你可以看到圖像、語(yǔ)音識(shí)別有突破,但肯定不會(huì)想到繪畫(huà)、文章也可以通過(guò) AI 生成邏輯性產(chǎn)品,這兩者是不同的。這十年 AI 在不停的超越和突破很多人的預(yù)期和想象,這還是挺了不起的。”何曉冬對(duì)鈦媒體App表示,這次ChatGPT最大的創(chuàng)新點(diǎn)在新的半監(jiān)督學(xué)習(xí)算法,使得它對(duì)用戶的意圖理解,可能快達(dá)到大規(guī)模商用的搜索引擎水平。

  何曉冬認(rèn)為,相較于之前大量使用無(wú)監(jiān)督深度學(xué)習(xí)算法,ChatGPT模型背后的算法和訓(xùn)練過(guò)程更加新穎。如果沒(méi)有人的數(shù)據(jù)甄選,這個(gè)模型參數(shù)即便大十幾倍,也很難達(dá)到這個(gè)效果。尤其ChatGPT把生成的文本模型更加“組織化”,這是非常大的技術(shù)創(chuàng)新。

  “在某種意義上,這其實(shí)是對(duì)過(guò)去一味追求(參數(shù))大和追求無(wú)監(jiān)督學(xué)習(xí)的一個(gè)路線修正。”何曉冬表示。

  OpenAI 于2021年底已經(jīng)完成了2.5億美元的A輪融資,投資人包括微軟、馬斯克、谷歌風(fēng)投、老虎基金、A16z以及Altman前東家Y-Combinator等。據(jù)The Information報(bào)道,成立七年的 OpenAI 公司估值已經(jīng)接近200億美元,是其2022年預(yù)計(jì)收入的500-800倍。

  在2020年 OpenAI 發(fā)布GPT-3之后,微軟于當(dāng)年9月22日取得獨(dú)家授權(quán)。報(bào)道指,OpenAI 每年在微軟云計(jì)算上花費(fèi)約為7000萬(wàn)美元。

  中國(guó)應(yīng)該有自己的ChatGPT

  事實(shí)上,盡管ChatGPT海外爆紅、服務(wù)器被擠垮,百萬(wàn)網(wǎng)友使用,但不包括中國(guó)境內(nèi)的實(shí)名用戶。很多擁有國(guó)內(nèi)+86電話用戶無(wú)法使用ChatGPT。雖然有很多替代的網(wǎng)站或方案,或直接到非官方渠道購(gòu)買 OpenAI 網(wǎng)站賬號(hào),但仍引發(fā)很多用戶抱怨,國(guó)內(nèi)用戶體驗(yàn)大打折扣。

  “中國(guó)必須要有自己的基座大模型,應(yīng)用大模型。很簡(jiǎn)單,OpenAI 關(guān)鍵模型不開(kāi)源,只給API,中國(guó)還不能隨便用,已經(jīng)是‘卡脖子’了,所以我們?yōu)槭裁床蛔鲞@樣的事情。”黃民烈對(duì)鈦媒體App表示,包括百度、聆心等國(guó)內(nèi)很多團(tuán)隊(duì)正在(對(duì)AIGC)做決心與相關(guān)資源投入解決相關(guān)問(wèn)題。

  告別硅谷崇拜,在中國(guó)互聯(lián)網(wǎng)世界中,國(guó)內(nèi)應(yīng)該建立有中國(guó)創(chuàng)新特色的ChatGPT,甚至是超越OpenAI能力的中國(guó) AI 公司。這已經(jīng)成為中國(guó) AI 產(chǎn)業(yè)發(fā)展的必答題。

  事實(shí)上,2022年也因此被稱為“AIGC元年”,生成式 AI 發(fā)展迅速。今年9月一篇文章中提到,生成式 AI 可以處理的領(lǐng)域包括了知識(shí)工作和創(chuàng)造性工作,涉及數(shù)十億的人工勞動(dòng)力。生成式AI 可以使這些人工的效率和創(chuàng)造力至少提高10%,有潛力產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。

  根據(jù)中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟發(fā)布的《中國(guó) AI 數(shù)字商業(yè)展望2021-2025》報(bào)告預(yù)計(jì),至2025年,中國(guó) AI 數(shù)字商業(yè)核心支柱產(chǎn)業(yè)鏈規(guī)模將達(dá)到1853億元,未來(lái)五年的復(fù)合增長(zhǎng)率約為57.7%。國(guó)泰君安則預(yù)測(cè),未來(lái)五年,或?qū)⒂凶疃?0%的圖片內(nèi)容由 AI 技術(shù)參與生成,相應(yīng)有600億以上的市場(chǎng)規(guī)模。

AIGC產(chǎn)業(yè)鏈(來(lái)源:行業(yè)報(bào)告)AIGC產(chǎn)業(yè)鏈(來(lái)源:行業(yè)報(bào)告)

  在國(guó)內(nèi),AIGC概念企業(yè)正逐步成長(zhǎng),包括奇績(jī)創(chuàng)壇、聯(lián)想創(chuàng)投、華創(chuàng)資本、唯獵資本等機(jī)構(gòu)都在觀望或關(guān)注。今年12月,AI生成3D內(nèi)容的數(shù)字品牌AVAR獲得天使+輪融資,成立一年間已連續(xù)完成三輪;另一家跨越星空也在半年內(nèi)連續(xù)完成兩輪共數(shù)千萬(wàn)元融資。未來(lái)是否存在類似 AI 繪畫(huà)平臺(tái)Stable Diffusion背后的Stability AI 的獨(dú)角獸公司,依然需要時(shí)間等待。

  何曉冬表示,目前GPT(AIGC)創(chuàng)業(yè)價(jià)值有兩點(diǎn):一是如果從研究角度看,國(guó)內(nèi)會(huì)繼續(xù)往算法技術(shù)創(chuàng)新上探索;二是產(chǎn)業(yè)價(jià)值,特別在文本生成上有獨(dú)到的體驗(yàn)和價(jià)值,本身已經(jīng)接近可商用的地步了。未來(lái)可能需要考慮具體場(chǎng)景應(yīng)用以及準(zhǔn)確性等,尤其是垂直的專業(yè)知識(shí)。

  “現(xiàn)在確實(shí)是 AI 應(yīng)用發(fā)展的好時(shí)機(jī),尤其是應(yīng)用落地的時(shí)機(jī)。我對(duì) AI 比較樂(lè)觀,而且我認(rèn)為 AI 未來(lái)肯定要走產(chǎn)業(yè)路線。我越來(lái)越感覺(jué)到產(chǎn)業(yè)界應(yīng)用機(jī)會(huì)比學(xué)術(shù)界更大。”何曉冬認(rèn)為,AI 技術(shù)慢慢地會(huì)從一個(gè)“作坊式”研究探索變成“工業(yè)級(jí)”工程或系統(tǒng)落地。目前,何曉冬團(tuán)隊(duì)正在對(duì) AI 語(yǔ)音交互、多模態(tài)智能、數(shù)字人等諸多技術(shù)產(chǎn)品展開(kāi)探索與研發(fā)落地。

  對(duì)于有行業(yè)人士稱,ChatGPT存在輸出結(jié)果不穩(wěn)定,商業(yè)落地并不容易,還需深耕,而且很難找到工業(yè)端應(yīng)用范圍,尤其它需要大量算力。

  黃民烈向鈦媒體App回應(yīng)稱,ChatGPT定位為通用任務(wù)型助理,作為工具,容易被很多人用到。當(dāng)然這里面商業(yè)成本是必須要考慮的,但他認(rèn)為未來(lái)一定是成本下行的趨勢(shì),一定會(huì)產(chǎn)生很多商業(yè)應(yīng)用。可以參考現(xiàn)在很多文生圖的公司和應(yīng)用、感知和認(rèn)知領(lǐng)域的 AIGC等。“所以我絕對(duì)是積極樂(lè)觀的。”

  此外,AIGC帶來(lái)的法律版權(quán)、種族和性別偏見(jiàn)、倫理等問(wèn)題不可忽視。據(jù)Axios報(bào)道,Adobe正在考慮將 AI 生成的圖片以付費(fèi)形式售賣,消息一出引起廣泛討論。

  大成律師事務(wù)所肖颯法律團(tuán)隊(duì)在公眾號(hào)發(fā)文指出,一般情況下 AI 創(chuàng)作并不會(huì)發(fā)生侵權(quán)行為,但如果 AI 在創(chuàng)作某一幅具體的畫(huà)作的過(guò)程中使用了過(guò)多某作品中的元素,或者是作為模板的作品本身屬于侵權(quán)作品,那么該 AI 生成的畫(huà)作就可能被認(rèn)定為侵權(quán)作品,從而存在侵權(quán)的可能性。“必須明確的是,AI 雖然能夠?qū)W習(xí),但本身并不懂法律,更不懂得侵權(quán)的概念,任憑其自由發(fā)展是完全不可取的。”

  據(jù)財(cái)新,小冰公司CEO李笛表示,大家現(xiàn)在的熱情很容易被點(diǎn)燃,是因?yàn)镃hatGPT的對(duì)話質(zhì)量超出預(yù)期,但真實(shí)商業(yè)化不像投資人想得那么簡(jiǎn)單,ChatGPT的工業(yè)應(yīng)用還有很長(zhǎng)的路要走。

ChatGPT
相關(guān)專題: ChatGPT會(huì)取代搜索引擎嗎
新浪科技公眾號(hào)
新浪科技公眾號(hào)

“掌”握科技鮮聞 (微信搜索techsina或掃描左側(cè)二維碼關(guān)注)

創(chuàng)事記

科學(xué)探索

科學(xué)大家

蘋(píng)果匯

眾測(cè)

專題

官方微博

新浪科技 新浪數(shù)碼 新浪手機(jī) 科學(xué)探索 蘋(píng)果匯 新浪眾測(cè)

公眾號(hào)

新浪科技

新浪科技為你帶來(lái)最新鮮的科技資訊

蘋(píng)果匯

蘋(píng)果匯為你帶來(lái)最新鮮的蘋(píng)果產(chǎn)品新聞

新浪眾測(cè)

新酷產(chǎn)品第一時(shí)間免費(fèi)試玩

新浪探索

提供最新的科學(xué)家新聞,精彩的震撼圖片