Meta推出新的AI模型 可轉錄和翻譯近百種語言

Meta推出新的AI模型 可轉錄和翻譯近百種語言
2023年08月23日 00:03 媒體滾動

  財聯社

  當地時間周二(8月22日),Meta發布了一個名為SeamlessM4T的人工智能(AI)模型,可以翻譯和轉錄近百種語言。

  據Meta介紹,SeamlessM4T可以翻譯近100種語言的語音到文本和文本到文本。對于語音轉語音和文本轉語音的操作,它可以識別100種輸入語言,并將其轉換為35種輸出語言。

  SeamlessM4T是根據知識共享許可(CC) 協議4.0發布的,允許研究人員對其進行迭代。

  除了SeamlessM4T,Meta還發布了其開放翻譯數據集SeamlessAlign的元數據。

  Meta表示:“建立一個通用語言翻譯器,例如像《銀河系漫游指南》中虛構的巴別魚那樣,是具有挑戰性的,因為現有的語音對語音和語音對文本系統只覆蓋了世界語言的一小部分。”

  《銀河系漫游指南》是由英國作家道格拉斯·亞當斯所寫的一系列科幻小說,而巴別魚是這部作品所創造的一種神奇生物,體型小到足以放進人的耳朵,靠接受腦電波為生。如果將巴別魚放到耳朵里,人們可以理解任何語言。

  對于SeamlessM4T模型,Meta研究人員在一篇研究論文中表示,他們從400萬小時的原始音頻中收集了音頻訓練數據,這些音頻來自一個公開的抓取網絡數據存儲庫,但沒有說明是哪個存儲庫。

  研究報告稱,文本數據來自去年創建的數據集,這些數據集從維基百科和相關網站上提取了內容。

  Meta表示,SeamlessM4T代表了一個重大突破,因為這個模型可以一次性完成整個翻譯任務,而不像其他大型翻譯模型那樣,將翻譯分成不同的系統。

  SeamlessM4T建立在Meta之前的翻譯模型之上。Meta去年發布了支持200種語言的文本到文本的翻譯模型。它開發了用于多語言語音到語音翻譯的數據集,以及用于語音識別的大規模多語言語音。Meta去年展示了它的通用語音翻譯器,可將閩南語轉化為英語。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:周唯

Meta AI

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

7X24小時

  • 08-30 熱威股份 603075 --
  • 08-29 福賽科技 301529 --
  • 08-28 中巨芯 688549 --
  • 08-28 威爾高 301251 --
  • 08-23 金帝股份 603270 21.77
  • 股市直播

    • 圖文直播間
    • 視頻直播間
    新浪首頁 語音播報 相關新聞 返回頂部