什么是開源AI?官方定義終于來了 Meta Llama模型沒過關

什么是開源AI?官方定義終于來了 Meta Llama模型沒過關
2024年10月29日 01:42 市場資訊

@全體股民:《投資研報》巨額特惠,滿3000減1000,滿1500減500!【歷史低價手慢無,速搶>>

  來源:華爾街見聞

  長期致力于定義和“管理”所有開源事務的開放源代碼倡議(OSI),周一發布了其開源AI定義(OSAID)1.0版。根據OSAID,AI模型若要被視為開源,必須提供足夠的信息,使任何人都可以“實質性地”重建該模型。模型還必須披露與其訓練數據相關的任何重要細節,包括數據的來源、處理方式以及獲取或許可的方式。然而,Meta并不認可這一定義,認為不存在單一的開源AI定義。

  開源AI終于有了“官方”定義。

  長期致力于定義和“管理”所有開源事務的開放源代碼倡議(OSI),周一發布了其開源AI定義(OSAID)1.0版。根據OSAID,AI模型若要被視為開源,必須提供足夠的信息,使任何人都可以“實質性地”重建該模型。模型還必須披露與其訓練數據相關的任何重要細節,包括數據的來源、處理方式以及獲取或許可的方式。

  OSAID還列出了開發者使用開源AI時應享有的使用權,例如可以為任何目的使用和修改模型,而無需獲得他人許可。

  OSI執行副總裁Stefano Maffulli表示,制定開源AI官方定義主要目的是,讓政策制定者和AI開發者達成一致。

“監管機構已經在關注這一領域。我們明確向各方利益相關者和社區進行了推廣,甚至還試圖聯系那些經常與監管機構交流的組織,來獲取早期反饋。”

“開源AI是一種允許你完全理解其構建方式的AI模型,這意味著你可以訪問所有組件,比如用于訓練和數據過濾的完整代碼。最重要的是,你應該能夠在其基礎上構建。”

  OSI并不強制施壓開發者遵守OSAID定義,但打算對那些不符合該定義卻被描述為“開源”的模型進行標記。“我們希望當有人試圖濫用這個術語時,AI社區會說,‘我們不承認這是開源’,并加以糾正。”Maffulli說道。

  Meta:我反對

  目前,許多初創企業和大型科技公司,尤其是Meta,稱其AI模型發布策略為“開源”,但很少符合OSAID的標準。研究人員發現,許多“開源”模型實際上只是名義上開源,但實際訓練模型所需的數據是保密的,而且運行這些模型所需要的計算能力超出了許多開發者的能力范圍。

  例如,Meta要求月活躍用戶超過7億的平臺獲得特殊許可才能使用其Llama模型。Maffulli公開批評Meta將其模型稱為“開源”的做法。而谷歌微軟在與OSI討論后,已經同意不再將不完全開放的模型稱為“開源”,但Meta并未這么做。

  此外,長期宣傳其模型為“開源”的Stability AI要求年收入超過100萬美元的企業獲得企業許可,而法國AI新創公司Mistral的許可證則禁止將某些模型和輸出用于商業用途。

  Meta自然不認同這一評估。盡管該公司參與了定義的起草過程,但對OSAID的措辭表示異議。Meta發言人稱,Llama的許可條款和隨附的可接受使用政策對有害應用提供了防護。Meta還表示,在加州AI相關法規正在演變之際,該公司對共享模型細節的做法是“謹慎的”。

“我們在許多方面與OSI的伙伴立場一致,但我們以及業內其他公司都不同意他們的新定義,我們認為沒有單一的開源AI定義,因為過去的開源定義無法涵蓋當今迅速發展的AI模型的復雜性。我們讓Llama免費公開使用,并通過許可和使用政策來確保安全。無論技術定義如何,我們將繼續與OSI和其他行業團體合作,增加免費AI使用的便利程度。”

  分析認為,Meta不愿公開訓練數據,很可能與其自身及大多數AI模型的開發方式有關。

  AI公司從社交媒體和網站上收集大量圖像、音頻和視頻等數據,并以這些“公開可用數據”訓練模型。在如今競爭激烈的市場中,數據集的收集和優化方法被視為競爭優勢,公司常以此為由拒絕披露。

  但訓練數據的細節也可能讓開發者面臨法律風險。作者和出版商聲稱,Meta使用了受版權保護的書籍進行訓練。藝術家們也對Stability AI提起訴訟,指控其使用其作品而未給予認可,將其行為比作盜竊。

  因此,OSAID的開源AI定義,可能會給那些試圖順利解決訴訟的公司帶來問題,特別是如果原告和法官認為該定義足夠合理而在法庭上引用。

  風險提示及免責條款

  市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:李桐

AI Meta 許可 開發者

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 10-29 聚星科技 920111 6.25
  • 10-25 港迪技術 301633 37.94
  • 10-25 健爾康 603205 14.65
  • 10-22 科拜爾 920066 13.31
  • 10-21 強達電路 301628 28.18
  • 新浪首頁 語音播報 相關新聞 返回頂部