朱民:2021年我國人工智能論文總量首次超過美國,2025年將成世界最大數據國

朱民:2021年我國人工智能論文總量首次超過美國,2025年將成世界最大數據國
2023年02月24日 15:22 睿見Economy

股市瞬息萬變,投資難以決策?來#A股參謀部#超話聊一聊,[點擊進入]

  由《財經》、《財經智庫》、財通匯主辦的第五屆全球財富管理論壇于2023年2月24日-26日在北京舉行。中國國際經濟交流中心副理事長 、國際貨幣基金組織前副總裁朱民出席并演講。

  朱民表示,雖然chatGPT在全球掀起熱潮,但更應該關注的是其背后的大模型。“國內也一直在做大模型,但我們是落后的,落后兩年左右”,他說。

  朱民稱,2021年,我國關于人工智能的論文總量首次超過了美國,在兩年前,人工智能的專利也超過了美國,趕超非常厲害,但我國在大模型上是落后的,特別是現在算力,芯片被卡住以后,要思考如何向前推進。

  “我們要圍繞AI的2.0,重新制定自己的人工智能發展戰略”,朱民強調,要發揮我國的數據優勢。

  “三年以后,預計2025年中國的數據會超過美國,成為世界上最大的數據之國”,他說,因為物聯網的發展,中國的數據質量會很好,要讓數據流動起來,變成資源、資產、財富。

  “讓數據變成生產力是我們迎接科學革命、迎接大模型的最根本的一條,只有在這個基礎上,我們才能把大模型的應用和商業化、企業化的發展結合起來,才能走上我們的趕超之路”,朱民說。

  以下為演講實錄:

  朱民:今天我是作為經濟學家跨界演講,我講的是chatGPT,所有的網上都在講,它確實厲害,很驚艷,前景非常好,大家都在講怎么追,怎么做自己的chatGPT,各個網站現在討論很多,我借這個機會,把我的觀察給各位嘉賓做一個匯報。

  chatGPT很有意思,很有未來,它的基礎是大模型,它的基礎是GPT,它是延伸到GPT3.5的往前的一個應用。人工智能發展的核心是GPT、是大模型,不是chatGPT,我覺得這個概念特別重要,理解這一點的話,我們要把所有的工作重點、趕超的重點、研究的重點放到大模型,放到GPT上來,而不是放在chatGPT。

  當然我們應該承認,我們在chatGPT,在大模型上落后,特別是美國對我們制裁以后,算力上的約束在實現趕超上的困難很大,但是怎么發揮我們的優勢,這是在人工智能、也是在中國未來科技創新,也是未來的經濟金融的發展當中,特別重要的一戰,這確實是科技走到今天的一個重大轉折點。所以我們要跨越chatGPT,看到大模型和AI 2.0的未來。

  chatGPT橫空出世,chatGPT的出現有點像2016年阿爾法戰勝了韓國的世界冠軍一樣,引起了所有輿論的關注,它的應用場景確實很多,比如財富管理中心,每個人都要填表,要做風險測試,以后就可以用chatGPT,做風險測試,把你的偏好需求全部搞清楚,剩下的就是機器和機器交換,構造財富管理的產品,做風險管理,做整個后臺,精準度可以大大提高,產品也可以大大豐富,所以chatGPT是一個很有意思的產品。

  比如,醫院里,第一個給你看病的醫生是chatGPT,它可以把你的基本問題全部搞清楚,剩下的就是機器和機器的溝通和交流,給你做基本的解答,再加上人的輔助,做最終的解答。在這個過程中,把數據全部留下來,這是了不得的事情。

  chatGPT本質是一個語言大模型,它是WEBGPT的基礎,最早是教上網查詢的機器,但它主要應用了生成AI,它可以不斷推演,不斷反饋,使得它的反饋學習加強,訓練加強以后,能夠把語言模型的輸出和用戶的意圖連起來,反饋和強制訓練強化一下就爆發了,這還是很厲害的。

  GPT3.5基礎上的應用,它的好處很多,能記住大量的信息,搜索量真的很高,它給我做經濟學研究的文獻索引不亞于我的助理,因為它的面廣。

  它能夠保持對話和對話的一致性很有意思,但它也能承認錯誤,與此同時,它支持多種任務,支持藝術創造、改故事,我有一次讓chatGPT給我做翻譯,翻譯的非常優美,很有意思,它可以編碼,可以寫辦公郵件,它的用途是很廣的,這就使得它特別火爆。用它參加考試的話,可以考到“中等”以上的水平,這是很不容易的,當然它有自身的局限性,主要是輸入的知識的局限性,它的時間點基本在2021年以前,我們用最新的東西試它,就有點跟不上

  從大的應用來看,它是從2020年5月份的GPT3開始的,一直到DALLE生成,到chatGPT,是從大模型的過程長出來的一個東西。國內也一直在做大模型,但我們是落后的,落后兩年左右,我們的生態也不夠,所以不能從大模型衍生出chatGPT應用。

  歸根結底要回到什么地方呢?回到大模型,我們現在在chatGPT熱的時候,需要在更深的層面上考慮問題,我們要看的是大模型的發展,這是影響今天、影響未來、影響中國、影響世界的最根本的科技發展。

  大模型還是從GPT3開始,1150億個變量,一路過來,我們有盤古,也有百度,清華最近也出了一個GRM,現在世界上從GPT3已經走到GPT4,所以大模型的發展應用是很厲害的。在大模型層面上走的最快的是深層次的人工智能,深層次人工智能能從文字轉到圖形,文字轉到編程,文字轉到影像錄像,然后走向3D,一旦走向3D就很厲害了,現在生成AI就是做蛋白質的三維的結構分析,深層AI在整個大模型基礎上走,這是未來的一個特別重要的方面。

  與此同時,從文字到圖像生成的模式,從GPT3開始,到DALLE,到DALLE2是一個突破點,從文字到圖像的過程是走的很快的。我剛才講對蛋白質的分析,我們可以對190萬個蛋白質用人工做三維的結構圖,大概占了我們已知蛋白質的1/100,不能小看這個數,這是一個很短的時間。再仔細想人是什么?人是蛋白質組成的,如果我們能把蛋白質全部數字化,還不能說把蛋白質合成一個人,但可以合成新的物種,所以蛋白質的應用現在也是走的特別厲害的。

  這后面一個核心的變化是人工智能從1.0走向2.0,1.0是以編程為中心,2.0是以數據為中心的,這是一個特別大的區別。1.0的時候聚焦的是算法、模型、程序,是軟件工程師在主導,2.0的時候是數據,數據越多越精越好,機器自己通過數據學習反饋優化不斷生成、迭代,幾乎就是一個無限的過程,它就離開了人腦,這是大模型和AI 2.0最大的潛力和最大的遠景。

  我們已經看到了人工智能可能可以離開人已有的智能走向一種新的智能。這個智能并沒有被人所意識到,這個事情就很有意思了,所以在這個基礎上大模型產生,基礎模型是GPT3,現在出現因果人工智能,這是巨大的發展,最后是神經,因為一切是神經AI的網絡,神經AI現在走得很快。我現在列的這些最新籃球模型,在整個曲線下都是在兩年到五年的階段成熟,科技的浪潮厲害的不得了。

  在這種情況下,產生另一個更大的變化,就是人工智能脫虛向實,虛就是人工智能以前是服務于虛擬世界的,搜索、資訊、信息等等,但有了大模型以后,特別生成人工智能以后,人工智能逐漸走向物理世界,在大模型的基礎上,通常走的是文字到圖像,到音頻、視頻、到三維、到蛋白,但未來是什么?在這條線以前,人工智能服務的是虛的,在這條線以后,人工智能服務是實的,是走向物理世界。第一個突破是蛋白,第二個突破是材料,這以后會走的特別厲害,這是因為在大模型的情況下,科學研究的方式發生了根本的變化,我們稱之為科學研究的第四范式。

  牛頓和愛因斯坦時期,科學研究的簡單方式是通過觀察,觀察把數學模型化,這是最簡單的第一方式。第二是用模型推演,第三是用計算機仿真,這不是很成功。進入近代以后,我們發現最大的問題是你觀察到的東西沒辦法寫成數學方程式,因為維度太高,在科學研究上有一個概念叫維度的詛咒,特別是量子物理學的角度沒法計算,大模型出現以后,現在可以做1024到2048個維度,這已經不完全是個空間概念。兩千億到一萬億的變量,方程可以做到兩千億個變量,這個世界上還有什么方程是不可解的,這在根本上改變了科學研究的方式。以前是慢慢做,細細做,現在是用數據大規模的做,這個世界就真的變了。

  這就是為什么最近在有色領域突破特別快,生化、藥、材料,都是因為人工智能的原因。根本的科學研究的方式變了,以前科學研究是從最早的原理一步一步往前走,現在科學是從數據逆向倒推,整個思維方式根本變了。大模型現在幫助科學家人工智能進入物理學,特別在數學和材料學,現在用一個數學家和機器合作來探索新的材料,這里有很多邏輯、很多理論,就不細說了,特別也取得了一些很有意思的進展,因為數學家的核心是把所有的一切數學化,能夠用公式表達才有應用,不能用公式表達就不能作為產品,就不能生產。做藥,最近的生物藥研究的時間短了一半,成本下降一半,就是因為大模型的幫助,從數據著手,生物進展很快。

  材料,德州用大模型做耐高溫耐氧化的高熵的合金,材料科學將來會走的很快,新的材料會出來,會有無限想象的空間,它的算力如此之大,算法效率如此之高,第一次我們可以把物理世界和信息世界、虛擬世界連起來,物理世界的數字在虛擬世界經過大模型回到物理世界去操縱物理世界,這個世界真的變了。現在用的最多的是什么?戰爭,現在戰爭的電子演習已經做的很大規模和經濟化。現在由人工智能主導運營數字化的過程,因為數字的產生和迭代效率特別高,這個過程也在不斷加速自動化,而且在提升自動化的效率。

  這種對物理世界的管理和深化,影響是巨大的。大模型帶來了巨大的想象空間,大模型特別在推動科學實驗方面空間是很大的,它對生命科學、藥物研發空間很大,材料科學空間很大,能源科學空間很大,電子工程和計算機科學空間也很大,當然環境地球空間就更大了。大模型現在變成了工程學,變成了一個輔助工具,變成了我們今天所有一切超高級超高速效率的輔助工具,這個世界在這個基點上變了。

  我們必須承認人工智能走的很快,中國在2021年第一次人工智能的論文總量超過了美國,中國在兩年前人工智能的專利超過了美國,我們趕超非常厲害,但是我們在大模型上是落后的,特別是現在算力,芯片上卡住以后怎么往前走,所以我們需要圍繞趕超的過程,圍繞AI的2.0重新制定自己的人工智能發展戰略,因為這個世界從根本上變了。

  第二條是特別重要的,就是發揮我們的數據、人工智能三項核心的資源,算力、算法、數據。算力現在已經被卡死了,因為芯片。算法我們有優勢,但在沒有芯片的情況下,算法要發揮優勢也很難,而我們真正的優勢是數據。

  三年以后,我們預計2025年中國的數據會超過美國,成為世界上最大的數據之國,因為物聯網,中國數據的質量也會很好,所以讓數據流起來變成資源、變成資產、變成財富,就是今天這個論壇的主題,讓數據變成生產力是我們迎接科學革命、迎接大模型的最根本的一條,只有在這個基礎上,我們才能把大模型的應用和商業化、企業化的發展結合起來,才能走上我們的趕超之路。

  好,這就是我的簡短匯報,謝謝大家!

  新浪聲明:所有會議實錄均為現場速記整理,未經演講者審閱,新浪網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:梁斌 SF055

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

7X24小時

  • 03-01 上海建科 603153 --
  • 02-27 寶地礦業 601121 4.38
  • 02-27 華塑科技 301157 56.5
  • 02-24 鐵大科技 872541 3.38
  • 02-24 茂萊光學 688502 69.72
  • 產品入口: 新浪財經APP-股票-免費問股
    新浪首頁 語音播報 相關新聞 返回頂部