王士進:有些時候,大模型理解問題會出現“幻覺”

王士進:有些時候,大模型理解問題會出現“幻覺”
2023年09月15日 14:49 市場資訊

  “2023中國AIGC產業發展論壇”于9月4日在北京召開。科大訊飛副總裁、研究院常務副院長、認知智能國家重點實驗室副主任王士進出席并演講。

  以下為演講實錄:

  大家好,非常高興能夠參加服貿會AIGC論壇。下面我給大家匯報一下科大訊飛在大模型上做的一些技術和應用的創新。

  人工智能在感知智能領域已經取得很大的進展,對語音識別、圖像識別整體能力都已經達到、甚至在很多領域甚至超過人的水平。在認知智能領域,其實原來在一些很多專業領域的小場景里,通過認知和感知技術,也取得一些不錯的成績。但是如果我們希望計算機可以像人一樣去理解、去思考,還是有很大的挑戰。

  我們對圖像和語義的理解,不同的人看了以后理解不是一樣的,讓不同的機器看和理解也是不一樣的。現在計算機可以通過大規模的模型訓練,使得它可以更好理解語言和生成。我們看到這樣一些技術發展非常快,比如看到去年11月30號ChatGPT的正式發布,最近兩天也被曝出正在訓練GPT-5。本質上這和人腦在認知記憶上非常相似,(圖)中間是大模型,和人腦的突觸很類似。

  我們看到大模型現在也只是剛剛起步,現在看到它令人驚訝的很多性能,它還有更多的成長空間。同時大模型從文本到圖像到視頻,到真實或虛擬世界的交互,像動態智能等,都可以基于語義的空間再做進一步的延伸?;谶@樣的能力持續擴展,我們看到現在越來多的行業或領域里,大模型都在發揮越來越大的價值。

  從現在的產業來看,大模型還有很多的問題需要克服,很多時候大模型在理解問題的時候經常會出現“幻覺”,或者很多時候不知道什么知識是對的還是錯的。其次,模型原來通過不斷學習個人數據可以持續優化,現在模型再次訓練時間比較長,如何做更好的優化?這塊需要克服。第三,模型需要從文本往多模態去遷移,怎么更好地去遷移,最后能不能在某一個模型里去沉淀,這些值得我們去克服。

  科大訊飛從成立起專注于智能語音技術,之后在計算機視覺、認知智能等領域也擁有深厚積累,承建了語音及語言信息處理國家工程研究中心、認知智能全國重點實驗室,以及國家新一代人工智能開放創新平臺。在去年12月,我們正式啟動了內部大模型的攻關,大模型的體系稱之為“1+N”,“1”是要構建大模型不斷能力提升的技術底座,“N”是教育、醫療、辦公、工業互聯網等行業。

  我們經過半年多的時間,在今年5月6日正式發布科大訊飛星火認知大模型。6月9日進行了V1.5版本升級發布,在開放式知識問答、邏輯推理能力和數學能力、多輪對話能力有了顯著突破和提升;8月15日,大概就在兩周前我們做了一次比較大的升級,訊飛星火升級V2.0。

  在多模態能力上,現在大模型無論是對于圖片的理解,還是根據文字的描述生成圖片,都可以在最新的版本里進行體驗,相比于業內很多的大模型訊飛星火擁有了更多特色。

  第二是代碼能力,目前訊飛星火在代碼生成、補齊、單元測試樣例等方面都有很好的效果,大家可以通過多端的訊飛星火來體驗這些功能。

  在5月6日發布訊飛星火的時候,我們就確定了今年內訊飛星火升級的幾個重要節點。

  再看一下訊飛星火和不同行業結合的應用成果。原來我們在教育領域做非常多的應用是語言學習,有兩個非常典型的場景,第一是學生的作文,原來評分很好,對于作文的診斷評語原來只能用套路話來解決,現在用大模型可以實現更精準的層層批改。

  在辦公場景里也是,原來只能把一場會議內容記錄下來,現在有了訊飛星火就可以輔助實現一鍵成稿,把6000、7000字的會議內容自動生成摘要,現在訊飛星火都具備這樣的能力。

  汽車領域也是一樣,原來交互是比較單一的,現在結合大模型可以把交互做得更自然。

  這是我們公司大概2000多名程序員使用大模型代碼能力產品的效果——大家知道代碼流程是比較長的,從設計到最后的檢驗,(在使用了大模型代碼能力應用產品iFlyCode1.0后)整體的效能提升15%以上,這樣的能力會使得整個軟件研發效率有更大的提升。

  在多模態能力上,訊飛星火賦能的訊飛智作2.0可以實現一句話完成視頻智能配音,以及一句話完成圖文轉視頻。

  做完以后,我們對這個領域有一些思考,大模型直接用于行業領域還是有很多挑戰,怎么用好可能要關注幾大特點。

  第一是技術可達性,我們做大模型時候也會看,大模型并不是馬上能解決你所有的業務所有的問題,一定要判斷這個性能的邊界在什么地方,基于這個邊界逐步做好你的設計。

  第二是經濟實用性,大家知道大模型不斷發展,訓練成本會非常高,整個產品、業務模型是否能夠接受大模型運營成本,也是我們考慮的非常的關鍵點。

  第三個是應用邊界性,大模型不能解決所有的問題,大模型怎么樣和小模型結合、怎么樣和語音識別等不同技術結合,形成很好的客戶體驗,這個是非常重要的。

  同時大模型也需要科學評測體系,通用大模型到底能力如何?如果有一個客觀的大模型評測體系,就能指導模型怎么樣訓練才能變得更好。

  同時大模型不僅僅只是解決我們一些場景、單領域的問題,更多時候通過模型快速適配場景,可以解決更多行業的問題。

  無論是訊飛星火的能力開放,還是助手、插件、培訓的課件,我們也希望通過這樣的努力,使大家把原來的工作和大模型做更好的結合。

  通用人工智能一定會在中國大地上形成燎原之勢,我們也期待與大家一起用人工智能去建設更加美好的世界,謝謝。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:梁斌 SF055

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 09-22 中集環科 301559 --
  • 09-21 浩辰軟件 688657 --
  • 09-19 三態股份 301558 --
  • 09-18 愛科賽博 688719 69.98
  • 09-14 萬邦醫藥 301520 67.88
  • 新浪首頁 語音播報 相關新聞 返回頂部