專題:OpenAI將開啟線上直播 發(fā)布ChatGPT新功能和升級版GPT-4
機器之心報道
編輯:山茶花
OpenAI 真是把大家的胃口吊足了,大家再忍忍就等到了。
OpenAI 有了新動向!
今日凌晨 OpenAI 官宣,將于美國時間 13 日上午 10 點進(jìn)行一場直播。Sam Altman 隨即轉(zhuǎn)發(fā)這一消息,并表示「不是 gpt-5,不是搜索引擎,但我們一直在努力開發(fā)一些我們認(rèn)為人們會喜歡的新東西!我感覺這就像魔法一樣。」
關(guān)于即將發(fā)布的內(nèi)容,OpenAI 官方帖子提供的唯一細(xì)節(jié)是,此次發(fā)布將更新 ChatGPT 及其最新模型 GPT-4。
OpenAI 員工程博文(Bowen Cheng)跟了個帖,「比 gpt-5 更酷」,不過又迅速刪帖。
OpenAI 的葫蘆里到底賣的什么藥?據(jù)報道,OpenAI 開發(fā)了一款 AI 語音助手,具有音頻輸入、音頻輸出功能和更好的推理能力,甚至在某些方面擊敗了 GPT-4 Turbo。該 AI 語音助手很可能就在周一的這場直播中公開亮相。
不管怎樣,OpenAI 此番舉動著實吊足大眾胃口。
OpenAI 計劃推出 AI 語音助手
據(jù)報道,OpenAI 正在構(gòu)建一款 AI 語音助手,它能通過聲音和文本與人類對話,并能識別物體和圖像。據(jù)兩位接觸過這項新 AI 的人士透露,ChatGPT 的開發(fā)者已經(jīng)向一些客戶展示了部分功能,這些功能在邏輯推理方面超越了其現(xiàn)有產(chǎn)品。
OpenAI 首席執(zhí)行官 Sam Altman 的目標(biāo)是最終開發(fā)出可高度響應(yīng)的人工智能,類似于電影《她》(Her)中的虛擬助手,提升蘋果 Siri 等現(xiàn)有語音助手的可用程度。一名知情人士表示,這個 AI 語音助手可能會在 OpenAI 周一的直播中公開亮相,趕在谷歌發(fā)布一系列 AI 產(chǎn)品之前搶得先機。
OpenAI 認(rèn)為,具備視覺和音頻能力的智能助手擁有與智能手機相媲美的變革性潛力。理論上它能夠做到當(dāng)前無法做到的事情,比如充當(dāng)學(xué)生的家庭教師,輔助撰寫論文或解決數(shù)學(xué)難題,或者翻譯交通標(biāo)識、指導(dǎo)解決汽車故障等。
不過,這類技術(shù)目前無法在個人設(shè)備上運行,用戶可以在短期內(nèi)使用基于云的版本來獲取這些功能,如自動化服務(wù) Agent。知情人士表示,新語音助手的音頻功能可以幫助客服人員更好地理解來電者的語氣。
OpenAI 已經(jīng)推出具備音頻轉(zhuǎn)錄、文本轉(zhuǎn)語音等功能的軟件,不過這些功能是基于獨立的對話 AI 模型實現(xiàn),而新的語音助手則將這些功能整合在一起,使其在圖像和音頻理解方面更勝一籌,并且速度更快。
目前尚不清楚 OpenAI 何時會將這些新功能提供給付費客戶,但知情人士透露,這些功能將被納入 ChatGPT 的免費版本中,旨在使其運行成本低于 GPT-4 Turbo。該人士還表示,AI 語音助手在回答某些類型的問題上表現(xiàn)優(yōu)于 GPT-4 Turbo,但仍存在「幻覺」。
對此 OpenAI 發(fā)言人未作回應(yīng)。
OpenAI 可能會在今年年底發(fā)布 GPT-5
其實,利用 AI 開發(fā)強大的助手,谷歌早有此想法。去年 12 月,谷歌發(fā)布了一則 Gemini 的視頻,它能夠?qū)崟r響應(yīng)人的語音命令,并識別出人正在看的圖像。然而,谷歌后來解釋說,這些功能需要研究人員用圖像和文本指令提示模型,而不是視頻中演示的簡單對話。而 OpenAI 推出語音助手主要為了「狙擊」谷歌、蘋果。
不得不說,OpenAI 上新的速度太快了。
除了即將發(fā)布的具有音頻和視覺功能的模型外,OpenAI 一直計劃推出 AI 搜索引擎,旨在與谷歌競爭。此外,OpenAI 還在開發(fā)一種被稱為「計算機使用 Agent」的自動化軟件,可以加速軟件開發(fā)和其他基于計算機的任務(wù)。
更重要的是,GPT-5 也在馬不停蹄地研發(fā)中。據(jù)一位與 OpenAI 領(lǐng)導(dǎo)層討論過此事的人士表示,OpenAI 可能會在今年年底完成 GPT-5 并公開發(fā)布。
OpenAI 還計劃發(fā)布一個新的定價模型。據(jù)知情人士透露,如果客戶預(yù)付費用來預(yù)訂 tokens,他們可能會獲得高達(dá) 50% 的折扣。目前,OpenAI 主要提供按需定價,每百萬 tokens 的價格為幾美分到 120 美元不等,一些較大的客戶會獲得批量折扣。今年 4 月 OpenAI 推出了 Batch API,該應(yīng)用程序編程接口會提供更便宜的價格。
不過,OpenAI 在產(chǎn)品和 AI 模型開發(fā)上的迅猛勢頭也導(dǎo)致之前發(fā)布的一些項目備受「冷落」。例如,OpenAI 曾承諾,到今年第一季度,開發(fā)者就能通過為其商店構(gòu)建定制聊天機器人來賺錢,但截至目前 OpenAI 也未兌現(xiàn)承諾。
蘋果計劃改造 Siri 來應(yīng)戰(zhàn)
OpenAI 的來勢洶洶,讓蘋果有了危機感。
據(jù)報道,蘋果公司計劃將其虛擬助手 Siri 引入生成式 AI。知情人士透露,新的 Siri 將變得更加「對話化和多功能化」,并將采用生成式 AI 驅(qū)動的系統(tǒng),使其能夠總結(jié)短信內(nèi)容并進(jìn)行對話,而不僅僅是逐個回應(yīng)問題。Siri 和蘋果公司的其他 AI 產(chǎn)品預(yù)計將在 6 月 10 日的蘋果年度開發(fā)者大會上亮相。
去年年初,蘋果公司的高管們在把玩 OpenAI 的 ChatGPT 后,發(fā)現(xiàn) Siri 相形見絀,于是決定對 Siri 進(jìn)行升級。這也促使蘋果進(jìn)行了十多年來最重要的重組,以便在這場激烈的人工智能「軍備競賽」中迎頭趕上。
但是,蘋果并未選擇發(fā)布一款與 ChatGPT 直接競爭的產(chǎn)品,而是決定提高 Siri 作為虛擬助手處理其已經(jīng)能夠完成的任務(wù)的能力。新 Siri 的宣傳點在于它比其他 AI 工具更私密,因為用戶請求將在 iPhone 上處理,而不是在數(shù)據(jù)中心。但是,這種做法也有其缺點,與大型 AI 系統(tǒng)相比,小型 AI 系統(tǒng)更容易產(chǎn)生幻覺。
蘋果還計劃在其新款 iPhone 中增加內(nèi)存,以支持 Siri 的 AI 功能,并一直在與谷歌和 OpenAI 等競爭對手洽談,旨在將最新的 AI 模型整合進(jìn)下一代 iPhone 操作系統(tǒng)。
據(jù)最新報道,蘋果已接近與 OpenAI 達(dá)成協(xié)議,將在下一代 iPhone 操作系統(tǒng) iOS 18 中使用 ChatGPT;與谷歌尚未達(dá)成協(xié)議,但談判仍在進(jìn)行中。
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)