金磊 夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI
一覺醒來,萬眾期待的GPT-4,它來了!
OpenAI老板Sam Altman直接開門見山地介紹說:
這是我們迄今為止功能最強大的模型!
有多強?
根據OpenAI官方的介紹,GPT-4是一個超大的多模態模型,也就是說,它的輸入可以是文字(上限2.5萬字),還可以是圖像。
(看圖)手套掉下去會怎樣?
它會掉到木板上,并且球會被彈飛。
拍一張照片上傳給GPT-4,它就可以立馬生成網站的HTML代碼!
在性能表現上,OpenAI直接甩出一句話:
在各種專業和學術基準上和人類相當!
而且不只是發布GPT-4這么簡單,OpenAI這次“啪的一下”把相關“大動作”一步到位了:
不僅如此,傳聞的“必應早就用上了GPT-4”在今天也得到了微軟方面的證實:
沒錯,確實是這樣的!
不得不說,自打ChatGPT問世以來,微軟和谷歌之間打響的數輪科技戰役,微軟這次又雙叒叕贏麻了。
甚至這一次,不少網友都發出了“見證歷史”的感慨:
史上最強大模型
正如之前傳言,GPT-4確實擁有多模態能力,可以接受圖像輸入并理解圖像內容。
并且可接受的文字輸入長度也增加到3.2萬個token(約2.4萬單詞)。
升級之后,GPT-4在各種職業和學術考試上表現和人類水平相當。
比如模擬律師考試,GPT-4取得了前10%的好成績,相比之下GPT-3.5是倒數10%。
做美國高考SAT試題,GPT-4也在閱讀寫作中拿下710分高分、數學700分(滿分800)。
那么GPT-4這些新能力實際用起來是什么樣的?技術報告中也給出不少展示。
首先,看圖能力可以用來解釋表情包、梗圖。
提問這張圖哪里好笑?GPT-4可以按順序描述出每一格的內容,并總結出笑點:
用巨大的過時VGA接口給小巧的現代智能手機充電。
更進一步,GPT-4可以理解圖表中數據的含義,并做進一步計算。
文字輸入長度限制的增加,也大大擴展了GPT-4的實用性。
發布會直播上,OpenAI總裁Gregman現場表演了一波GPT-4給代碼修Bug。
出現問題啥也不用想,直接把1萬字的程序文檔一股腦扔給GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V。
再最后附上出現的問題,在幾秒鐘內瞬間得到解決辦法。
在API方面,GPT-4還開放了一個使用功能,允許修改“系統提示”。
之前ChatGPT的回答總是冗長而平淡,這是因為系統提示中規定了“你只是一個語言模型……你的知識截止于2021年9月”。
現在通過修改這句話,GPT-4就可以展現出更多樣的性格,比如扮演蘇格拉底。
也可以指定之后所有回答的形式,比如全用json格式。
雖然GPT-4這波能力大升級,但之前ChatGPT會出現幻覺、胡說八道的毛病還是沒能完全改掉。
從前面的官方示例也可以看出,要想最大程度發揮GPT-4的能力,最好還是用上思維鏈路提示(Chain-of-thought Prompt)。
操作起來也非常簡單,只需在提問的時候額外提醒AI給出步驟,就能大大提高推理和計算的準確率。
谷歌依舊在跟
就在GPT-4發布前,谷歌方面為了迎戰微軟,宣布將一系列即將推出的AIGC功能,應用到自家產品中。
包括谷歌 Docs(文檔)、Gmail、Sheets(表格)和 Slides(幻燈片)。
但不同于微軟和OpenAI的“發布即可用”,谷歌只會先將Docs和Gmail中的AI工具,在月底提供給一些“值得信賴的開發人員”。
而其它功能則將是在今年晚些時候向公眾開放。
至于具體時間,谷歌方面并沒有具體說明。
而外界對此評價是谷歌希望搶先微軟原定于本周四的發布。
但從今天的結果上來看,微軟依舊提前“搶灘登陸”。
One More Thing
在GPT-4發布之前,便有網友做出了GPT-3和GPT-4參數量的對比圖,并猜測GPT-4的參數量將達到100萬億。
這一次亦是如此。
有網友預言,未來GPT-5的參數量,會是這樣的:
但無論如何,這一次,我們離真·人工智能,更近了一步。
參考鏈接:
[1] https://openai.com/research/gpt-4
[2] https://blogs.bing.com/search/march_2023/Confirmed-the-new-Bing-runs-on-OpenAI%E2%80%99s-GPT-4
[3] https://www.youtube.com/watch?v=outcGtbnMuQ
(聲明:本文僅代表作者觀點,不代表新浪網立場。)