馬斯克:AI訓練去年就已耗盡現實世界的所有資料

馬斯克:AI訓練去年就已耗盡現實世界的所有資料
2025年01月13日 17:42 快科技

快科技1月13日消息,馬斯克在CES期間接受采訪時指出,現實世界能用來訓練AI模型的資料,已經消耗的差不多了。

馬斯克表示,基本上,AI訓練已經將人類累計的知識全數耗盡,而這個時間點就是去年(2024年)。

馬斯克的這一觀點呼應了OpenAI前科學長Ilya Sutskever在去年12月機器學習會議“NeurIPS”上的說法,Sutskever當時表示,AI產業能夠消耗的數據已經達到了頂峰。

面對現實世界數據的枯竭,馬斯克暗示合成數據(synthetic data)將是未來的發展方向。

他指出,補充現實世界數據的唯一方法就是合成數據,由AI自行生成用于訓練的數據,通過合成數據,AI將能夠為自己打分,并展開自我學習的過程。

事實上,許多科技巨頭已經開始使用合成數據來訓練AI模型,微軟、Meta、OpenAI及Anthropic等企業已經在其AI模型訓練中廣泛應用合成數據。

科技市場研究機構Gartner估計,2024年AI及分析項目使用的數據中,約60%是合成數據。

例如,微軟在1月8日開源的AI模型“Phi-4”就是通過合成數據結合現實世界數據進行訓練的,谷歌的“Gemma”模型也采用了類似的方法。

Anthropic使用部分合成數據開發了表現最佳的系統之一“Claude 3.5 Sonnet”,而Meta則運用AI生成數據來微調其最新推出的Llama系列模型。

【本文結束】如需轉載請務必注明出處:快科技責任編輯:黑白文章內容舉報

【本文結束】如需轉載請務必注明出處:快科技

責任編輯:黑白

伊隆-馬斯克AI
新浪科技公眾號
新浪科技公眾號

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)

創事記

科學探索

科學大家

蘋果匯

眾測

專題

官方微博

新浪科技 新浪數碼 新浪手機 科學探索 蘋果匯 新浪眾測

公眾號

新浪科技

新浪科技為你帶來最新鮮的科技資訊

蘋果匯

蘋果匯為你帶來最新鮮的蘋果產品新聞

新浪眾測

新酷產品第一時間免費試玩

新浪探索

提供最新的科學家新聞,精彩的震撼圖片