蘋果研究團隊曾測試20款先進AI模型 在有干擾項下簡單算術題表現甚至不如小學生

蘋果研究團隊曾測試20款先進AI模型 在有干擾項下簡單算術題表現甚至不如小學生
2024年11月02日 18:03 市場資訊

@全體股民:《投資研報》巨額特惠,滿3000減1000,滿1500減500!【歷史低價手慢無,速搶>>

  IT之家 11 月 2 日消息,《洛杉磯時報》昨日(11 月 1 日)發布博文,報道稱蘋果研究團隊測試了 20 個最先進的 AI 模型,發現在有干擾項存在的情況下,它們處理簡單的算術問題時表現不佳,甚至不如小學生。

  蘋果公司用以下這道簡單的算術題測試 20 多個最先進的 AI 模型,IT之家附上題目如下:

  Oliver 在星期五采摘了 44 個獼猴桃、然后他在星期六采摘了 58 個獼猴桃,星期日采摘的數量是星期五的兩倍,不過其中有 5 個獼猴桃的塊頭要比平均值要小,請問 Oliver 這三天共摘了多少個獼猴桃?

  正確答案是 190 個,計算公式為 44(星期五)+58(星期六)+88(44*2,星期日)。

  不過測試的 20 多個最先進 AI 模型無法排除干擾項,通常不理解獼猴桃的大小和數量無關,大部分的結果是 185 個。

  蘋果團隊發現,當問題包含看似相關但實際上無關的信息時,AI 模型的表現急劇下降。對此研究認為,AI 模型主要依賴于訓練數據中的語言模式,而非真正理解數學概念。

  蘋果的研究表明,目前的 AI 模型“無法進行真正的邏輯推理”。這一發現提醒我們,盡管 AI 在某些任務上表現出色,但其智能并不如表面看起來那樣可靠。

  蘋果團隊指出,簡單地擴展數據或計算能力并不能根本解決這個問題,蘋果的論文并非旨在削弱對 AI 能力的熱情,而是提供一種理性的認知。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:郭明煜

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 11-08 壹連科技 301631 --
  • 11-08 金天鈦業 688750 --
  • 10-29 聚星科技 920111 6.25
  • 10-25 港迪技術 301633 37.94
  • 10-25 健爾康 603205 14.65
  • 新浪首頁 語音播報 相關新聞 返回頂部