來源:財聯社
據媒體報道,在人工智能(AI)研究公司OpenAI 發布其首個推理AI模型o1不久后,人們發現了一個奇特的現象,即使在用英文提問的情況下,o1有時會中途使用中文、波斯語或其他語言進行推理。
例如,當被問到“Strawberry”(草莓)這個單詞里有幾個字母“r”時,o1會通過一系列推理步驟得出答案。如果問題是用英文寫的,o1的最終回答通常也會是英文,但在推理過程中,它可能會用另一種語言處理部分步驟,然后得出結論。
一些人在網絡社區討論了這一現象。“(o1)推理到一半時突然開始用中文‘思考’了,”一位 Reddit用戶寫道。
另一位X平臺上的用戶發帖詢問:“為什么(o1)會突然用中文思考?整段對話(超過5條消息)里完全沒有涉及中文。”
OpenAI尚未對o1的這種怪異行為作出解釋,也沒有承認這一現象的存在。AI專家對此也沒有確切答案,但提出了一些理論。
AI 專家眾說紛紜
在X平臺上,包括AI初創公司Hugging Face首席執行官Clément Delangue在內的多人提到,像o1這樣的推理模型是用包含大量中文字符的數據集訓練的。
谷歌DeepMind的研究員Ted Xiao指出,包括OpenAI在內的公司使用了來自中國的第三方數據標注服務,而o1切換到中文可能是“中文語言對推理的影響”的一個例子。
標注在模型訓練過程中幫助模型理解和解釋數據。例如,訓練圖像識別模型的標注可能包括圍繞物體的標記或描述圖像中每個人、地點或物體的文字說明。
然而,其他專家并不認同關于“o1使用中文數據標注”的猜測。他們指出,o1在推理過程中同樣可能切換到印地語、泰語或其他非中文的語言。
這些專家認為,o1和其他推理模型可能只是選擇了它們認為最有效的語言來完成任務,或者是出現了“幻覺”。
“模型并不知道語言是什么,也不知道語言之間的區別,”阿爾伯塔大學的 AI 研究員兼助理教授Matthew Guzdial表示。“對它來說,一切都只是文本。”
Hugging Face軟件工程師Tiezhen Wang同意Guzdial的觀點,他認為,推理模型的語言不一致性可能源于模型在訓練期間與特定語言建立的某些關聯。
“通過接納每一種語言的細微差別,我們擴展了模型的世界觀,讓它從全方位的人類知識中學習,”Wang在X上寫道。“比如,我喜歡用中文做數學計算,因為每個數字都只有一個音節,這讓計算變得簡潔高效。但在涉及無意識偏見這樣的話題時,我會自動切換到英語,主要因為這些概念是我最初用英語學習和吸收的。”
非營利組織艾倫人工智能研究所的研究科學家Luca Soldaini則指出,目前無法確定造成這一現象的真正原因。
“由于這些模型非常不透明,對已部署的AI系統的這種觀察是無法證實的。這正是為什么AI系統開發過程中的透明性至關重要的原因之一,”Soldaini表示。
責任編輯:丁文武
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)