股市瞬息萬變,投資難以決策?來#A股參謀部#超話聊一聊,[點擊進入超話]
原創:吳洋洋
來源:新皮層NewNewThing
‘技術發展太快了,需要留點時間討論’
AI之所以值得關注,不止因為它是一類夠fancy的技術,更因為它關乎我們人類的命運。我們將在這個“對話”欄目中推出一系列訪談,持續討論“技術與人的未來”相關議題,訪談對象包括創業者、大公司主管、技術領袖、學者、律師、政策制定者、最早看到未來將改變的人以及那些被技術深刻影響的個體。
這是第一篇。為防止閱讀時間過長,今天只發布上半部分,下半部分請關注明天的發布。
Key Points
2016年王小川就認識到,一旦機器掌握了語言,通用人工智能就來了。
上個時代還是信息時代,最多叫數據智能,我認為這次才真正開始進入到了AI時代。
(IBM的)Watson是要取代醫生的,它失敗了,因為它并不能通過一些考試,或者比醫生干得更好。這次真的有機會了。
辦公領域會出現“端到端”的行業結構,寫文案這種中間過程的企業會消亡。
AI醫生、AI教授、AI律師、甚至AI司機出現的時間不會太久,大概就3-5年。
比較成熟的領域已經有To C產品覆蓋的時候,我們就做To B。但是對于增量的、大家沒見過的產品,我們會做To C。
大語言模型已經被學界稱為“foundation model”——基礎模型。未來不僅是做機器人,還是做無人駕駛,都會基于這個基礎大模型往上生長。
科技預言大師雷·庫茲韋爾(Ray Kurzweil)說人工智能的奇點——機器智慧超過人類——會發生在2045年,王小川的判斷比這更激進,他認為這一天會提早到2033年到來,理由是人工智能技術的迭代周期成倍遞減:專家系統走過了40年,學習系統20年,深度學習10年,接下來,只需要再有5年、2.5年、1.25年、0.625年,轉折點就會到來。
這個預測有待時間檢驗。如果預測成真,包括王小川在內的大模型(Large Language Models,大語言模型)創業者,就會是在飛船已經開始滑行才跳上甲板的人。
4月10日,王小川對外宣布成立百川智能,研發通用人工智能模型及應用。他搬回了舊部——大約一半百川智能的人來自原來的搜狗團隊,還找到了5000萬美元的啟動資金。
留給王小川這樣的創業者的時間并不多。王小川宣布上述消息的同一周,阿里巴巴在北京發布了其大模型“通義千問”。一個月前,百度發布了“文心一言”。前美團聯合創始人王慧文所創立的光年之外,則已收購一家開發深度學習框架的科技公司一流科技OneFlow。
王小川已給出一個聽起來激進的模型迭代計劃:今年年中(大概一兩個月后),他就要發布對標GPT-1的第一代模型;年底,對標GPT-3.5的模型就要推出。作為對照,從GPT-1到GPT-3.5,OpenAI花了四年多時間。
王小川本人并不認為這個計劃激進,也不認為做出這個計劃純粹是出于競爭壓力。“該不該做到和可行性上能不能做到是兩個問題。”他說,從“應該”的層面,他判斷大模型領域今年的競爭核心是能否成功構建基礎模型,明年,市場就會進入對應用場景的競爭階段。說到“可行性”層面,王小川表示自己并不是今年才開始做大模型,而是早在2021年他就在做大模型了。
“除了OpenAI,我并沒有看到任何一個公司或者個人,特別國內的人,認為通用人工智能到來了。”王小川說,決定大模型及其應用勝負的,將會是“認知”。
我們同王小川聊了聊他對大模型終局的認知,他向我們描繪了醫療、教育、辦公、自動駕駛等所有今天已有AI涉足的領域將會如何被大模型改變,也聊了當下階段中國公司在開發基礎模型上的共同挑戰和可能的捷徑,以及GPT的不足和留給后來者的創新機會。
持續的創業命題:為生命建立數學模型
新皮層:你宣布創立百川智能的時候寫了封公開信,主要想傳達什么信息?
王小川:我覺得通用人工智能(Artficial General Intelligencce,簡稱AGI)到來了,這是最大的判斷。這一波的突破是語言AI,它跟互聯網時代、工業文明、文藝復興是什么關系,我在信中都做了相應判斷。以及為什么我要做這事兒(指創立百川智能),就是要繁榮和延續人的文明。
新皮層:你經常提到你對生命科學很感興趣,為什么會對這樣的議題感興趣?
王小川:我讀研究生期間,做的題目就與基因相關,做基因測序的拼接算法。當時科學界發現,從DNA到人的過程是個足夠混沌和復雜的事。基因背后的演化也非常復雜,原本會出現混沌或不可預測的結局,但最后它變成了生命,變成了人,有兩只手、10個手指頭,甚至還跟爸媽長得像。這個事情在數學或物理上講沒有算法可以解釋。
我們已經掌握了蘋果掉在地上因為有萬有引力,天上的星星如何運動我們也能算得很清楚,但是生命背后的數學模型我們還沒有建立,這是我從讀研究生開始就特別感興趣的一件事,如何用科學甚至用數學模型去建立對生命的理解。
新皮層:這是個特別學術性的問題?
王小川:有實操性的,比如說2021年,AlphaFold干的就是這件事情,它能夠把基因到蛋白質結構的關系用AI模型建立起來。給一個基因,模型就能告訴你它的三維蛋白質結構長啥樣。它用數學或者計算機解決了一個生命現象問題。
新皮層:當時你并沒有像現在跟進GPT一樣跟進AlphaFold?
王小川:因為AlphaFold雖然很性感,但是離解決人的健康問題之間的路還非常遠。我當時更愿意走另一條路。2021年搜狗并給騰訊之后,我就說我要做與生命科學相關的事,走的并不是AlphaFold的那條道路。它只是把蛋白質結構變成數學模型了,并沒有端到端地把健康變成數學模型。
新皮層:意思是從蛋白質到人還有很遠距離?
王小川:沒錯,距離特別遠,就像做自然語言處理的模型只學了分詞,距離做出一個GPT還有非常遠的路。所以我認為有其他更多實操性的方法,可以用來研究生命健康的數學問題。
新皮層:GPT讓你離接近這個問題更近了嗎?
王小川:GPT跟我之前的工作經歷高度相關。搜狗之前做搜索和輸入法,研究的就是語言里的規律。搜索其實是猜你想要什么,輸入法是猜你想表達什么,背后都有復雜的語言模型。技術上我們也從原來的符號處理走向了深度學習。當時我們就提出一個觀點,語言其實是這個世界上相當難解決的一種問題,我們稱為“自然語言處理”,是人工智能皇冠上的明珠。2016年我就已經認識到了,一旦機器掌握了語言,通用人工智能就來了。
甚至當時我們也提到,說搜索的未來是問答,給個問題就回答,而不是輸入個關鍵詞后給你10條鏈接。在那個時代,我們也提到了搜狗未來的方向是讓表達和獲取知識更簡單。以前,搜索是讓你獲取信息的,但是它不能讓你有知識。今天這些全都到來了。因此今年1月份開始使用ChatGPT的時候,我就深刻感受到機器已經掌握語言,而且通用人工智能時代已經到來了。
新皮層:在搜狗出售給騰訊的時候,GPT-3就已經出來了。
王小川:對,那會兒我會看一些論文,但是那個時候我主要在思考怎么把生命變成數學問題、變成數學模型。所以看到GPT這種突破的時候,我印象很深刻的是,在提問題的時候,加上一個prompt咒語“think step by step”,讓GPT再仔細想一想,它的回答就變得更好,預示著這個機器開始有一些更智能的模式。
但不管學術界也好,包括我們自己,都沒有想到這樣一個東西離通用人工智能有多遠。因為它是一個To B的系統,不是只看文章就能對它有認知的。直到去年年底,ChatGPT發布,你才能去體驗它,看文章和親自體驗它是兩個不同的事情。
新皮層:你是技術背景,你會不會偶爾也會想,為什么不是我或者我的團隊做出了這樣的技術突破,或者說更早看到了GPT的潛力,而不是這么晚進場?
王小川:你的晚是指的從2021年開始做,還是從今年開始做?
新皮層:你不認為你是從今年開始?
王小川:搜狗2021年的時候就在做大模型,在國內的GLUE榜單(Chinese Language Understanding Evaluation,中文語言理解測評)上拿了兩次第一。
新皮層:你當時沒有今天的這些認知,沒有預料到AGI會來?
王小川:對,就是我們知道大模型長啥樣,但確實沒有預料到這個技術的突破。這不是我一個人沒想到,這是除OpenAI以外所有人都沒想到的事。GPT-2和3出來的時候,除了OpenAI,我并沒有看到任何一個公司或者個人、特別國內的人認為通用人工智能到來了,甚至直到ChatGPT到來之后,我也沒看到其他人講通用人工智能到來了。
新皮層:離開搜狗之后,你還有過一個創業項目,是與大模型有關嗎?
王小川:搜狗是做語言AI的,搜狗出售給騰訊后,我切換到了用數學模型解構生命,(做大模型)中間有一個暫停的過程。我今天做的事情和這兩件事都可以連接。
因為當你想用機器為生命建數學模型,甚至幫你做健康管理的時候,你可能也需要一個虛擬醫生或護士做溝通,不管見面手段還是后期健康管理,都需要有一個伙伴去支撐。所以今天大模型帶來的可能是超級助手,能夠讓健康管理的閉環更容易完成。
新皮層:可不可以理解為你在用新一輪的AI技術重做上一份創業內容?
王小川:新技術能夠對之前的工作帶來精神上的鼓勵,但并不能覆蓋對生命的探索和相應的數據處理方法。大模型是以語言為核心的,它并沒有對你生命指標各方面的監測,或者從某個生理指標的數據中發現生命規律,所以不是相互取代。就像無人駕駛一樣,大模型提供的是同樣的基礎。
新皮層:你要做的話,會做To B還是To C的產品?
王小川:比較成熟的領域已經有To C產品覆蓋的時候,我們就做To B。但是對于增量的、大家沒見過的產品,我們會做To C。比如說在教育領域,現在已經有很多教育網站了,他們可能會在中間構造一種虛擬老師,那我會做To B的事情。但是像醫療、法律領域,從來沒有存在過這種虛擬的知識供給,那我們就可以做To C的。
終局:GPT不只是語言模型,而是未來所有AI的基礎模型
新皮層:你覺得GPT-4在哪方面的能力超出你的預期?讓你覺得它非常有商業潛力?
王小川:GPT的核心就是機器掌握了語言,它變成了一個懂表達、善于表達的機器,同時它還擁有世界常識。整個世界上已經發生的事、知識、常識甚至簡單的推理,它都掌握了,這是非常了不起的一個突破。
新皮層:機器掌握了語言后,你認為它能夠做到的事會是什么?
王小川:有這個能力之后,它能做的第一件事就是把人類已經遺留的以文字承載的知識都學習了。第二,它能跟人做正常的溝通交流,你給它一個命令,它能夠理解它、解釋它、完成它。
這時我們對它有個重新定義,它不再只是個工具,而是人類開始擁有的一個伙伴、一個助手,這是從來沒有的事情。以前人類發明的火、輪子,甚至計算機,都只是工具,它們不具有跟你對話的能力。
新皮層:具體到產品形態上,可能誕生哪些超級應用?
王小川:比如說出現很多虛擬伙伴,它能夠在情感上陪伴,或者有足夠素質的護士、醫生、律師、老師,這樣的產品叫助理也好、咨詢顧問也好,這是以前沒存在過的東西。
新皮層:上一個AI時代已經出現過一些AI產品和商業成功的公司,GPT時代會有什么不同?
王小川:首先上個時代還是信息時代,最多叫數據智能,我認為這次才真正開始進入到了AI時代。通用人工智能來了,機器開始學會學習了,有常識了,能跟人溝通了。以前還是靠人喂很多數據進去,在專項里解決一個垂直問題。ChatGPT的發布代表新時代的開啟,兩個時代是不一樣的。
在上個時代,一個做圖像識別的公司需要做大量的定制化服務,很難有通用模型,成本也非常高。所以之前這個時代里的公司雖然已經發展到很大的收入規模,還是很容易虧損,所以我并不認為它是一種成功的AI范式。
新皮層:IBM曾經嘗試開發名叫“Watson”的AI醫生,沒有成功,大語言模型可以把這件事做成嗎?
王小川:Watson是要取代醫生的,它失敗了,因為它并不能通過一些考試,或者比醫生干得更好。這次真的有機會了。ChatGPT參加考試的確能夠考到專家的水平,甚至它能跟人溝通互動,不管在醫院里撰寫病例,還是幫醫生檢索數據,或者居家陪伴給病人提供安慰、做抑郁相關問題的問診,這些事終于開始能夠做到了。
上個時代里的AI產品即使能夠看醫學影像,也不能取代一個學了8年的醫生,它們取代的只是中間看片子的技師角色,并沒有豐富的醫學知識。
新皮層:未來醫院可能雇傭ChatGPT這樣的員工?
王小川:對,與其講醫院場景的雇傭,我更看好每個家庭,甚至每個人都開始擁有自己的一個私人的家庭醫生。
新皮層:如何解決它一本正經胡說八道的問題,這個問題在醫療領域后果很嚴重?
王小川:我認為今天的生成式模型只是剛剛開始,這個問題需要生成模型與信息檢索的合作,再加上大量的強化學習,是否能夠從強化學習里面把這個能力調教好?未來很多工作要去做。
沒必要用AGI元年的技術去判斷未來發展。我是非常樂觀的,再往下機器輔助醫生,甚至取代醫生是必然會發生的。
新皮層:很多公司已經在競爭辦公領域,讓辦公工具更智能,你認為有前景嗎?
王小川:短期里面會有變化,讓機器寫文案或者輔助寫文案會十倍、百倍提高人的效率。但我看重的變化是在終局里面,為什么還要寫文案?人并沒有寫文案的需求,寫文案也不是創造力的一個核心。
新皮層:可能是他客戶的需求,他老板的需求?
王小川:對,所以往后發展,會有大量的這種寫文案的工作崗位會消亡,會出現叫“端到端”的行業結構,寫文案這種中間過程的企業會消亡。
新皮層:GPT現在看起來只是一個語言模型,它的能力邊界在哪里?比如未來它可以駕駛汽車嗎?
王小川:GPT非常大的價值是試圖讓機器掌握智能、掌握認知。我們找到了一條通往AGI的道路,就是“大語言模型(Large Language Model, LLM)”。在此之前,做無人駕駛或做機器人都只是在做圖像處理,機器并沒有理解這些物體。
今天的大語言模型已經被學界稱為“foundation model”——基礎模型。我們開始有種共識,未來不僅是做機器人,還是做無人駕駛,都會基于這個基礎大模型往上生長。這是我們第一次通過大模型找到了一條認知世界的通路,這條通路可以成為解決其他更遠期AI問題的基石。
新皮層:你看到的終局:AI醫生、AI教授、AI律師、甚至AI司機,大概是多久之后會發生的事?
王小川:我覺得這個時間不會很久,大概就3-5年吧。
新皮層:到時,商業模式會發生變化嗎?
王小川:我們認為免費、羊毛出在豬身上的模式會慢慢被歷史淘汰掉。隨著機器越來越強大,它跟用戶的關系就變成一種伙伴,你很難說一個伙伴說陪伴你的時候是免費的,我再從其他地方去賺錢。
用戶會更希望他的伙伴足夠忠誠、足夠專業,能提供足夠有價值的服務,因此商業模式方面未來很有可能是個人直接向產品付費,而不是原來免費的廣告模式。
新皮層:如果大模型未來變成很多公司都能掌握的技術呢?
王小川:比如做搜索,好像這東西誰都會做,但最后有幾家公司真的做成了搜索引擎?
新皮層:我們聽到兩種觀點,一種認為未來的產業生態會是小部分公司開發大模型,大部分公司做下游的接口應用;另一種觀點認為,大語言模型會逐漸變成每家公司都能掌握的技術,類似上一個時代的推薦算法、圖像識別,很快競爭重心就會轉到對商業場景、產品形態的把握,而不是模型訓練本身。
王小川:我認為開發大模型的公司未來不會特別多,而是掌握在少數幾個公司手上。因為大模型是一個技術高度發達的東西,會有一定的技術擴散,做一些更加簡易的小模型,在垂直場景里應用,但這種可能性可能只占一半。
更有可能是一個大模型覆蓋很多小模型做的事情。所以我更相信未來的生態是由少數幾家大模型公司,再加上一些小模型的公司構成的,而不是每家公司都掌握一個這樣的技術。這個技術不像圖像識別那樣簡單。
也蠻難有公司能夠既掌握大模型又掌握場景。OpenAI做到了,比如它的ChatGPT,就是蠻有想象空間的一個應用。我周邊很多人已經開始減少對搜索的使用。
(這是我們與王小川對話的上半部分,想了解他在“大語言模型開發中的實際挑戰、AGI的未來技術趨勢”方面的觀點,請關注明天的發布。)
-END-
責任編輯:周唯
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)