多模態(tài)超出預期 GPT-4掀起更大產業(yè)變革

多模態(tài)超出預期 GPT-4掀起更大產業(yè)變革
2023年03月16日 03:00 市場資訊

  炒股就看金麒麟分析師研報,權威,專業(yè),及時,全面,助您挖掘潛力主題機會!

  上海證券報

  多模態(tài)的引入,讓OpenAI最新發(fā)布的GPT-4明顯“更上一層樓”。對比來看,GPT-4可以接受圖像和文本輸入,ChatGPT只接受文本;GPT-4在各種專業(yè)和學術基準上的表現達到“人類水平”,在事實性、可引導性和可控制方面取得了“史上最佳結果”;當任務的復雜性達到足夠的閾值時,GPT-4比ChatGPT更可靠,更有創(chuàng)造力,能夠處理更細微的指令

  ◎孫小程 記者 羅茂林

  全球各界還在消化ChatGPT帶來的顛覆性意義,OpenAI已經用更強大的GPT-4革了自己的命。

  美國東部時間3月14日,OpenAI宣布推出大型的多模態(tài)模型GPT-4。“GPT-4比以往任何版本更具創(chuàng)造性和協作性”,并且“有更廣泛的常識和解決問題的能力,可以更準確地解決難題”。OpenAI的CEO山姆·阿爾特曼說:“這是我們迄今為止功能最強大的模型。”

  以名列前茅的成績通過高難度考試、分析圖片中的符號意義、在10秒時間內生成耗費程序員數十小時的代碼……GPT-4展示出的能力讓人欣喜,甚至恐慌。“科技狂人”馬斯克感嘆道:“人類還能做什么?”

  從聊天機器人到生產力工具

  “我們創(chuàng)建了GPT-4,這是OpenAI努力擴展深度學習的最新里程(維權)碑。GPT-4是一個大型多模態(tài)模型(接受圖像和文本輸入,提供文本輸出),雖然在許多現實世界場景中的能力不如人類,但在各種專業(yè)和學術基準上表現出人類水平。”O(jiān)penAI介紹道。

  與上一個版本相比,GPT-4強在哪?OpenAI稱,雖然這兩個版本在隨意的談話中看起來很相似,但“當任務的復雜性達到足夠的閾值時,差異就會出現”,GPT-4更可靠、更有創(chuàng)意,并且能夠處理更細微的指令。

  對比來看,GPT-4可以接受圖像和文本輸入,ChatGPT只接受文本;GPT-4在各種專業(yè)和學術基準上的表現達到“人類水平”,在事實性、可引導性和可控制方面取得了“史上最佳結果”;當任務的復雜性達到足夠的閾值時,GPT-4比ChatGPT更可靠,更有創(chuàng)造力,能夠處理更細微的指令。

  OpenAI展示的一個示例便可以窺探出GPT-4的智能:用戶給出一張圖片,詢問GPT-4為什么好笑,GPT-4精準描述了圖片內容,回答道:“這幅圖的幽默之處在于,把一個大而過時的顯示接口插入一個小而現代的智能手機充電端口是荒謬的。”識別圖片是各大搜索引擎早有的功能,但對圖片中的元素進行拆解并分析符號意義,卻是首例。

  OpenAI稱,他們花了6個月時間使GPT-4更安全、更具一致性。在內部評估中,與GPT-3.5相比,GPT-4對不允許內容做出回應的可能性降低82%,給出事實性回應的可能性高40%。GPT-4引入了更多人類反饋數據進行訓練,不斷汲取現實世界使用的經驗教訓進行改進。

  總體上,多模態(tài)的引入,讓此次發(fā)布的GPT-4明顯“更上一層樓”。上一代ChatGPT展示出的能力還屬于聊天機器人范疇,GPT-4綜合體感均有所完善,被視為強大的生產力工具。

  商用化場景更為明朗

  如果說ChatGPT的橫空出世,主要給文字從業(yè)者帶來了職業(yè)焦慮,那么GPT-4的推出,則是大幅加劇了程序員的恐慌感。

  在此次發(fā)布會上,OpenAI總裁格雷格·布羅克曼在現場演示了GPT-4在這方面的能力。他直接在紙上畫了一個潦草的示意圖,拍照發(fā)給GPT,并要求其按照這個布局寫網頁代碼。幾乎只需要數秒鐘的時間,相應的代碼就完成了生成。發(fā)布會還展示了一個GPT-4的使用場景,把程序運行出錯的信息甚至錯誤信息截圖提交給GPT-4,僅憑這部分圖片信息,GPT-4都能自動查出錯誤。

  “這對于整個編程行業(yè)來說是具有顛覆性意義的。”一位互聯網從業(yè)人士表示,未來大量基礎性的編程都將由人工智能接手。據他透露,目前國內許多的互聯網公司已經引入GPT,輔助編寫程序,“以后這種替代的比例會進一步提高”。

  正因如此,此次發(fā)布會上,OpenAI明確表示,將在ChatGPT Plus上提供GPT-4,并將其作為API提供給開發(fā)人員構建應用程序和服務,這意味著,任何公司和個人都可以在自己的程序中自由調取GPT-4的相關功能。定價方面,每1000次調用花費在0.03美元至0.06美元。

  “ChatGPT開放商用API接入,意味著其成本已經足夠低廉到一般企業(yè)可以支付。”一位市場人士直言,在商業(yè)化的邏輯下,許多小公司在性能上無可比擬ChatGPT的同時,成本上或許也將被其碾壓。

  除了微軟的新版必應搜索引擎,目前還有多家公司將GPT-4搭載到他們的產品中,包括語言學習工具軟件多鄰國(Duolingo)、幫助視障用戶的軟件BeMyEyes、移動支付公司Stripe、國際性金融服務公司摩根士丹利等。

  以摩根士丹利為例,在OpenAI的GPT-4的幫助下,摩根士丹利正在改變其財富管理人員定位相關信息的方式。摩根士丹利維護著一個內容庫,其中包含數十萬頁涵蓋投資策略、市場研究和評論以及分析師見解的知識和洞見。這些大量的信息分布在許多內部網站上,主要以PDF形式呈現,需要顧問們?yōu)g覽大量信息才能找到特定問題的答案。

  從去年開始,摩根士丹利開始探索如何利用GPT的嵌入和檢索功能來利用其智庫。摩根士丹利主導該項目的分析、數據與創(chuàng)新主管表示,目前已經使用GPT-4技術將所有智庫內容轉化為更易于使用和操作格式;該行此前一直在用300名顧問測試這款工具,并計劃在未來幾個月廣泛推廣。

  不過,OpenAI也坦承,GPT-4還不完美,在許多情況下,它的能力不如人類。OpenAI表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。”在GPT-4發(fā)布之后,山姆·阿爾特曼表示:“它仍然是有缺陷的、有限的,在你花了更多的時間第一次使用它時,它似乎比實際情況更令人印象深刻。”

炒股開戶享福利,送投顧服務60天體驗權,一對一指導服務!
新浪聲明:此消息系轉載自新浪合作媒體,新浪網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
海量資訊、精準解讀,盡在新浪財經APP

責任編輯:凌辰

山姆

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

7X24小時

  • 03-17 海通發(fā)展 603162 37.25
  • 03-17 科瑞思 301314 63.78
  • 03-17 未來電器 301386 29.99
  • 03-17 蘇能股份 600925 6.18
  • 03-16 聯合水務 603291 5.86
  • 產品入口: 新浪財經APP-股票-免費問股
    新浪首頁 語音播報 相關新聞 返回頂部