OpenAI的o1模型推理時蹦出中文 專家猜:AI可能只想用最高效的語言來思考

OpenAI的o1模型推理時蹦出中文 專家猜:AI可能只想用最高效的語言來思考
2025年01月15日 01:08 市場資訊

  來源:華爾街見聞

  o1模型為何在推理時使用中文或其他語言來思考尚不得而知,但有專家猜測,原因可能是模型在訓練時使用了中文或其他語言的數據標注,也有可能是模型傾向于自行選擇它們認為最能有效實現其目標的語言,或者出現了幻覺。

  媒體報道,在OpenAI 發布其首個“推理”AI模型o1不久后,有用戶注意到一種奇怪的現象:即使用戶是用英語提問,這一模型有時會在回答問題時突然“轉而用”中文、波斯語或其他語言“思考”。

  例如,當被問及“單詞‘strawberry’中有多少個‘R’?”時,o1會開始其“推理”過程,通過一系列推理步驟得出答案。如果問題是用英語寫的o1的最終回答會是英語,但在得出結論之前,它可能會在某些步驟中使用其他語言。

  一位Reddit用戶表示,“o1在中途隨機地開始用中文思考?!?另一位用戶在X發文詢問:“為什么o1會隨機開始用中文思考?整段對話(超過5條信息)都沒有使用中文?!?/p>

  OpenAI尚未對o1的這種奇怪行為作出解釋,也沒有正式承認這一現象。AI專家對此也沒有明確答案,但他們提出了一些猜測。

  使用中文數據標注引起?

  包括 Hugging Face 的首席執行官 Clément Delangue等人表示,像o1這樣的推理模型接受了大量包含中文字符的數據訓練。谷歌DeepMind的研究員Ted Xiao聲稱,包括OpenAI在內的一些公司使用中國的第三方數據標注服務,而o1轉向中文可能是“推理過程中受到中文語言影響”的一個例子。

  Ted Xiao在X上寫道:

“OpenAI和Anthropic等實驗室利用[第三方]數據標注服務,為科學、數學和編程領域的高水平推理數據提供支持,而許多數據提供商都位于中國?!?/p>

  在AI訓練領域,標注(Labels,也稱為標簽或注解)在訓練過程中幫助模型理解和解釋數據。例如,用于訓練圖像識別模型的標注可能包括為對象周圍添加標記,或為圖像中的每個人、地點或物體提供描述。

  研究表明,帶有偏見的標注可能會導致帶有偏見的模型。例如,普通標注員更可能將非標準英語(如美國黑人英語,AAVE)標記為“不健康”(toxic)語言,這導致基于這些標注訓練的AI毒性檢測器更傾向于認為AAVE 是“不健康”的。

  不過,也有一些專家并不認同“中文數據標注”的猜測。他們指出,o1同樣可能在解決問題時切換到印地語、泰語或其他語言。

  AI只想使用最高效的語言來思考?

  另一種觀點認為,o1和其他推理模型可能只是使用了它們認為最能有效實現其目標的語言(或出現了幻覺)。

  阿爾伯塔大學的助理教授、AI 研究員Matthew Guzdial在接受TechCrunch采訪時說,“模型并不知道語言是什么,也不知道語言之間有區別。對它來說,這些只是文本而已?!?/p>

  實際上,模型并不直接處理單詞,而是處理“標記”(tokens)。標記可以是單詞(例如“fantastic”),也可以是音節(例如“fan”、“tas”和“tic”),甚至是單詞中的單個字符(例如“f”、“a”、“n”、“t”、“a”、“s”、“t”、“i”、“c”)。

  像標注一樣,標記也可能引入偏見。例如,許多從單詞到標記的轉換器假設句子中的空格表示一個新單詞的開始,而實際上并非所有語言都使用空格來分隔單詞。

  Hugging Face的軟件工程師Tiezhen Wang贊同這一觀點,認為推理模型的語言不一致性可能源于模型在訓練期間與特定語言建立的某些關聯。

“通過接納每一種語言的細微差別,我們擴展了模型的世界觀,使模型能夠全面學習人類知識。例如,我喜歡用中文做數學,因為每個數字只有一個音節,這讓計算更簡潔高效。但在討論諸如‘無意識偏見’之類的話題時,我會自動切換到英語,因為我最初就是通過英語學習和吸收這些概念的。”

  AI模型是概率機器,通過大量示例的訓練學習模式,并據此作出預測。然而,非盈利組織艾倫人工智能研究所的研究科學家Luca Soldaini警告說,“我們無法確定模型內部的運行邏輯。對已經部署的AI系統進行這類觀察,由于其高度不透明性,是無法支持任何結論的。這也說明了為什么在構建AI系統時保持透明性至關重要。”

  風險提示及免責條款

  市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:丁文武

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 01-16 亞聯機械 001395 19.08
  • 01-16 海博思創 688411 19.38
  • 01-14 富嶺股份 001356 5.3
  • 01-13 興福電子 688545 11.68
  • 01-13 超研股份 301602 6.7
  • 新浪首頁 語音播報 相關新聞 返回頂部