克雷西 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
OpenAI o1的橫空出世,開啟了大模型演化的新范式——Inference law(推理定律)。
正如英偉達AI科學家Jim Fan所說,o1的出現(xiàn)標志著大模型研發(fā)者開始把集中在訓練階段的投入,開始轉(zhuǎn)移到了推理過程。
Jim還引用了機器學習先驅(qū)Rich Sutton的經(jīng)典文章《苦澀的教訓》中的話說,只有兩種技術(shù)可以讓(AI)計算的潛能無限擴展——學習和搜索。
而現(xiàn)在,是時候把目光聚焦在后者了。
在推理側(cè)投入更多資源,模型也就有了更完備的思考過程,投入的增加換來的是質(zhì)的提升。
在國內(nèi),360創(chuàng)始人周鴻祎的理念與之不謀而合,而且360更早就提出了“慢思考”的理念,并在技術(shù)架構(gòu)和產(chǎn)品中都付諸了應用。
同時,360還在其AI產(chǎn)品中強調(diào)多模合作,讓來自不同廠商的大模型“抱團取暖”,為國內(nèi)模型追趕OpenAI,找到了一條可行的道路。
從o1看大模型“慢思考”
雖然o1的具體思考過程始終是OpenAI的至高機密,但可以肯定的是,思維鏈(Chain of Thought, CoT)在其中扮演了重要角色。
OpenAI在關(guān)于o1的報告中表示,思維鏈能讓模型學會認識并糾正錯誤,學會將棘手的步驟分解為更簡單的步驟,甚至學會嘗試不同方法,極大地提高了模型的推理能力。
今年的AI頂會ICLR上,谷歌大腦推理團隊創(chuàng)建者Denny Zhou,清華姚班校友、斯坦福助理教授、斯隆獎得主馬騰宇等人的一篇論文,更是揭開了思維鏈的無限潛能。
透過現(xiàn)象看本質(zhì),從某種程度上看,思維鏈的本質(zhì)就是2002年諾貝爾經(jīng)濟學獎得主卡尼曼在《思考快與慢》中提出的“系統(tǒng)2”,也就是“慢思考”系統(tǒng)。
所謂“系統(tǒng)2”或“慢思考”,是指復雜、有意識的推理,與之相對的是“系統(tǒng)1”或“快思考”,即簡單無意識的直覺。
而o1的表現(xiàn)證明,這種適用于人類的“慢思考”理念,對大模型來說同樣適用。
但應當注意的是,這兩種系統(tǒng)在人腦中是同時存在、相互配合的,在大模型當中也不應被割裂開來。
周鴻祎認為,o1遵循的可能就是“雙系統(tǒng)理論(Dual Process Theory)”,其核心在于快慢兩種系統(tǒng)的協(xié)同運作。
作為“百模大戰(zhàn)”的選手,周鴻祎和360,也是“慢思考”以及“多系統(tǒng)協(xié)同”的思考者和先行者。
7月底的ISC.AI大會上,周鴻祎就宣布,要“打造慢思考系統(tǒng),從而增強大模型的慢思考能力”。
基于“多系統(tǒng)協(xié)同”機制,360利用多個模型組成的智能體框架,實現(xiàn)了大模型從“快思考”到“慢思考”的轉(zhuǎn)變,并打造出了兩款明星AI產(chǎn)品——360AI搜索和360AI瀏覽器。
讓不同大模型“抱團取暖”
360AI搜索一共有簡潔回答、標準回答和深入回答三種模式,其中一次深入回答會可能就要涉及7-15次的大模型調(diào)用。
比如可能會涉及1次意圖識別模型調(diào)用,1次搜索詞改寫模型調(diào)用,5次搜索調(diào)用,1次網(wǎng)頁排序調(diào)用,1次生成主回答調(diào)用,1次生成追問調(diào)用……
在多個模型的協(xié)同配合下,360AI搜索形成了這樣的工作鏈路:
首先利用意圖分類模型,對用戶的問題進行意圖識別;
接著用任務路由模型對問題進行拆解,不同的問題可以劃分成“簡單任務”、“多步任務”和“復雜任務”,對多個模型進行調(diào)度;
最后構(gòu)建AI工作流,使多個大模型協(xié)同運作。
比如面對一道古詩詞中譯英題目,路由模塊就會調(diào)用起翻譯、反思等多個模型,讓這些模型分工配合、共同完成任務。
而且最新版本還在生成答案過程中進一步加強了多模型協(xié)作,將其作為了一種獨立的回答模式。
三個不同模型分別扮演生成初步答案的專家、檢查回答的反思者和最終給出答案的總結(jié)者。
例如在這個案例中,作為專家的Kimi提到了問題的關(guān)鍵,但表述不夠鮮明,在反思模型360智腦的建議下,豆包進行了重新總結(jié),形成了直擊問題的解答。
這樣的工作模式不僅將快慢思考協(xié)同和反思機制引入了AI應用,更通過不同模型的交叉驗證,進一步提高了整體表現(xiàn)。
在另一款AI產(chǎn)品——360AI瀏覽器當中,16家廠商的54款大模型也已齊聚一堂,可以實現(xiàn)多種傳統(tǒng)瀏覽器所不具備的能力。
AI瀏覽器可以10秒鐘總結(jié)上萬字英文學術(shù)論文,針對其中的細節(jié)也可以盡情發(fā)問。
可以沉浸式翻譯pdf文檔,原文和譯文同步滾動、隨時對照。
還能化身“AI省流俠”,分分鐘幫忙總結(jié)在線視頻內(nèi)容并劃出重點,還能根據(jù)視頻架構(gòu)繪制腦圖,甚至分析創(chuàng)作風格……
不僅在線文檔和視頻可以解析,這一系列分析功能,對于本地文件也同樣適用。
更為方便的是,360AI瀏覽器還有移動端版本,在手機上也能隨時利用AI輔助上網(wǎng)沖浪。
已經(jīng)入駐360AI瀏覽器、同樣基于CoE架構(gòu)的AI助手(bot.360.com),則可根據(jù)任務類型和模型特長自動調(diào)度最合適的大模型。
無需切換平臺,就能直接對話54款大模型,或者對話更加強大混合大模型,想選哪個就選哪個。
AI助手同樣支持「多模型協(xié)作」,用戶可以從54款模型中任選3款,分別做專家、反思者和總結(jié)者。
未來,360還會推出由五個甚至更多模型協(xié)作完成任務的版本。
還是在360AI瀏覽器中,AI助手還上線了“模型競技場”(bot.360.com),支持54款大模型產(chǎn)品的“同臺競技”,最新版本中還上線了“組隊較量”、“匿名比拼”、“隨機對戰(zhàn)”等功能。
總的來說,360AI搜索還是360AI瀏覽器雖然側(cè)重點有所不同,但背后體現(xiàn)的還是那個核心理念——
在進行“慢思考”的同時,不卷單一模型的能力,而是讓模型“抱團取暖”,博采眾長,形成“眾人拾柴火焰高”的局面。
當然,這樣做的意義,也不僅僅是為用戶帶來了更好的AI體驗,對各大模型的開發(fā)者而言同樣是一種激勵。
我們知道,大模型研發(fā)投入巨大,唯有足夠多的用戶才能夠收回成本。
而依托360AI搜索、瀏覽器、安全衛(wèi)士等入口,360將能夠觸達10億用戶的入口開放給了大模型開發(fā)者。
這也是阿里、騰訊、百度等大廠,以及大模型六小虎紛紛加入360AI架構(gòu)的重要原因。
所以,360與這十多家廠商雙向奔赴,實現(xiàn)了模型與AI應用相互促進、彼此發(fā)展的良性循環(huán)。
模型競技場更是給國產(chǎn)大模型提供了一個在競爭中學習的平臺,以及獲得用戶評價的絕佳機會,塑造了更加積極進取的氛圍。
“消滅”Prompt工程
從技術(shù)層面上看,在理念與產(chǎn)品之間架起橋梁的,是360獨創(chuàng)的CoE(Collaboration-of-Experts,專家協(xié)同)架構(gòu)。
CoE架構(gòu)集合了數(shù)量更多的大模型和專家模型,通過思維鏈和“多系統(tǒng)協(xié)同”的方式實現(xiàn)了“快思考”和“慢思考”的有機結(jié)合。
在思路上,CoE與o1選擇了相近的路線,但是在深度上走得更遠——
o1無論再怎么融合,也無外乎是OpenAI的自家模型,CoE卻是海納百川,集合了數(shù)量更多的大模型和專家模型。
而且,CoE架構(gòu)中還接入了很多十億甚至更小參數(shù)的專家模型,使得整個系統(tǒng)更加智能,在獲得高質(zhì)量回答的同時,節(jié)約推理資源、提升響應速度。
早在CoE架構(gòu)剛發(fā)布的時候,基于CoE集各家所長的混合大模型能力就超過了(當時最強的)GPT-4o。
該混合大模型在翻譯、寫作等12項指標的測試中取得了80.49分的綜合成績,超越了GPT-4o的69.22分;而且除了代碼以外,其余11項指標均優(yōu)于GPT-4o。
而且CoE架構(gòu)對所有模型都敞開懷抱,比OpenAI在開放協(xié)作的道路上走的更遠……
另外,無論是OpenAI的o1,還是360的CoE,都將讓大模型的發(fā)展走向一個新的趨勢——
復雜的人工環(huán)節(jié)將實現(xiàn)自動化,具體到大模型當中,就是“消滅”Prompt工程。
乍一看有些反直覺,因為在我們使用大模型時,提示詞的好壞對生成內(nèi)容有著決定性的影響,其重要性不言而喻。
但仔細想想又并不矛盾——大模型等AI應用,歸根結(jié)底是要為了人類而服務;
而提示工程卻是讓人類去適應模型的工作方式,簡直“倒反天罡”。
所以,提示工程固然重要,但不該成為普通用戶使用大模型的“絆腳石”。
解決的思路就是將提示詞的設(shè)計工作,像其他任務一樣,作為思維鏈中的一環(huán),交給大模型來做。
這樣的模式下,提示工程的靈魂依然被保留,但在用戶的視野當中逐漸淡化,形成一種“消亡”的感觀。
這種模式背后所反映的,也是360對AI未來發(fā)展的一點期許——
實現(xiàn)AI向著更多人的普惠,讓大模型不再“高居廟堂”,而是成為萬家燈火。
(聲明:本文僅代表作者觀點,不代表新浪網(wǎng)立場。)