江小涓等:數據驅動的科技與產業創新所呈現的特征

江小涓等:數據驅動的科技與產業創新所呈現的特征
2024年12月25日 21:04 北京日報客戶端

轉自:北京日報客戶端

人工智能驅動的科學研究(AI for Science)在科學界早有探討,普遍認為海量數據和智能分析工具正在推動科學研究向數據驅動的科研范式轉變。創新不僅涉及科學研究,更要向技術開發、產業轉化、市場應用和收益回報等產學研用全鏈條推進,形成完整的商業模式。迄今學術界較少關注海量數據出現帶給創新鏈產業鏈全鏈的系統性影響及其對社會經濟體系的整體影響。

科技創新在不同時代呈現不同特點。從數據生成、傳遞和獲取,數據交互能力,數據共享能力以及數據數量、深度和廣度等維度,觀察分析數字時代的科技與產業創新,能夠為回顧創新范式演進歷程提供新的視角。當前,科技創新進入新的時期,一個顯著特征是數據數量和關系重新定義創新鏈條上各方的交互方式和地位作用,各種創新力量的地位作用重新分化組合。

創新源泉:數據洞察能力與理論邏輯能力交互耦合的雙驅型創新

因果關系作為演繹法和歸納法的基礎假設,是理論邏輯推理的重要機制。數學理論模型作為一種抽象思維工具,特別適用于對變量進行形式邏輯處理,識別和揭示變量之間的因果關系,成為物理學、化學、生物學、醫學等學科的重要研究進路。但受限于理論認知邊界、模型結構形式、計算復雜性等因素,過往數學理論模型能夠處理的數據量小、數據維度少、數據關系相對簡單。進入數字時代,宏觀社會運行和微觀主體活動都以數字化形式呈現,數據關系的復雜性急劇增加,變量之間更易表現出非線性、時變性和非平穩性特征,以因果律為基礎的理論模型方法在刻畫和理解復雜現象的結構特性、交互關系以及演化行為等方面遇到前所未有的挑戰。

相對于因果邏輯分析,數據驅動的研究更加強調對各要素復雜相關關系的探求。從廣義角度看,大數據相關關系呈現的是一個無限蔓延的分布,具有深層因果關系意蘊:因果關系是對因素相互作用方向、過程及其效應之間的描述;相關關系則是因果派生關系的描述。這一具有極強滲透力、洞察力的創新方式在以往小數據無法解決的問題領域顯示出極強能力——尤其在未知復雜關系洞察方面取得顯著成績,甚至在更高層次推進了復雜因果概念的整體刻畫,賦予創新嶄新的動能。近幾年,大型數字企業憑借數據洞察力占據前沿科技新創企業投資的半壁江山。

從創新源泉角度看,超過60年的人工智能發展歷史可大致以2010年為界分為兩個階段。2010年以前,人工智能的前沿研究成果主要由理論邏輯能力驅動,而在此后,數據洞察能力成為人工智能創新發展的核心推動力。

新一代人工智能的發展,在更深層展示出理論邏輯能力和數據洞察能力是一個迭代累進過程。深度神經網絡、機器學習等理論模型的發展帶來多模態數據處理能力的極大提升,數據驅動力的增強使得大模型出現“智能涌現”,衍生出通用人工智能的部分能力。然而,人工智能基礎大模型逐漸面臨復雜度急劇攀升、算力需求激增、摩爾定律逐步失效等“瓶頸”,并不足以支撐從感知人工智能到認知人工智能的跨越,包括數學、心理學、腦科學在內的理論研究對人工智能發展非常關鍵。在可預測的未來,數據洞察能力和理論邏輯能力交互耦合的雙輪驅動依然重要,但每個階段前期理論積累帶來的突破點不同,當前正是需要加快利用數據帶來創新突破的關鍵時期。

創新主體:規模涌現規則與大平臺創新優勢

規模報酬是經濟學的一個基礎概念。以往實體產品為主的時期,企業達到一定規模后,規模報酬呈現出報酬遞減的規律。進入網絡時代,軟件和各種數字產品呈現出規模報酬遞增的特點,產出增加比例大于投入增加比例。這是網絡空間數字產品可以復制復用的特性帶來的,更多銷售并無需更多產出。

海量數據和AI時代,規模報酬出現了本質變化。規模報酬遞增的特點由“邊際增量”改變為“新能力涌現”。為了描述分析這種新類型的收益遞增,本文借用深度學習領域的一個重要概念——Scaling Law(即規模涌現規則),這個概念描述了模型性能與模型規模(如參數數量、數據規模和計算資源)之間的關系。其基本原理是,隨著模型規模的增加,模型的性能也會提高。這一發現激勵著研究者投入更多資源構建更大規模的模型,以期獲得更好的性能響應。研究者對這個規則的未來適用邊界有不同看法,但對其在當前階段的適用性大都贊同。從現實情況來看,頭部企業擁有數據和算力方面的優勢,當規模越過一個閾值后,就會涌現出后來者無法企及的全新能力,包括深度泛在的感知能力、對多元變量關系的洞察能力、對高度復雜問題的預測能力等,為企業帶來強大市場競爭力。

從創新角度看,由于存在規模涌現規則,先行大企業在創新鏈條中的地位大幅提升,位勢不斷增強。大型數字平臺連接上億消費者和百萬級、千萬級生產者,實時生產和匯聚海量數據,在強大的算力和算法支持下,具備自動提取經驗數據特征和規律并進行推理決策的能力,能夠準確感知并捕捉創新資源維度和交易資源維度下的市場需求及變化趨勢。同時,研發結果可以直接應用于海量用戶,用戶使用反饋也能快速傳遞給研發團隊,持續的數據交互使研發方向能夠根據環境變化進行靈活調整,更好優化相關服務。大型平臺的優勢還來自數據交互形成研發簇群,平臺大場景運作、跨產業運營、多領域并進,能夠匯聚各創新主體之間的場景化數據,并基于大規模的算法能力打造創新知識生態,增強具象場域中研發成果和終端產品的良性交互,極大促進創新。

平臺的上述創新優勢對高端人才和投資者形成強吸引力,因而成為數字前沿技術和基礎研究的重要創新力量。

創新組織:數據能力與邊界開放型創新組織形態

隨著數據成為重要創新要素,任何一個創新組織鏈接數據愈多、更新愈快、交互愈強,其創新能力就愈強。因此,能夠最大程度獲得數據、挖掘數據深度和廣度、增強數據交互和共享的開放式產業組織成為重要的創新組織形態。

在數字時代之前,開源開放已經成為重要的創新模式。全球97%的軟件開發者和99%的企業使用開源軟件,全球70%以上的新立項軟件項目采用開源模式。雖然目前的人工智能大模型的領先者還是采用閉源模式,但由于大模型的訓練和調整需要極其巨大的數據、算力和算法的投入以及海量場景的支撐,后繼者很可能采用開源模式與之競爭。

開放科學以“自由、開放、合作、共享”為理念,以海量數據匯聚和處理為手段,推動大規模科學項目研究。數據生成、傳遞和交互方式的不斷演進,使開放科學逐漸成為創新范式變革的一類趨向性目標。在天文學、高能物理、生命科學、空間科學等領域,國際大科學項目成為推動重大科學發現的主流模式,各國或國際組織均致力于大科學數據的開放共享,并將各國科學家聯合起來開展分布式協作研究。

數字時代,數據匯聚和交互能力成為驅動創新的重要引擎,任何主體具備的數據資源、專業知識都可能成為創新起點,也可能鏈接到創新鏈條中,與其他主體的數據交互還可能帶來新增的知識或發展,因而邊界開放對于創新的意義比以往任何時期都重要。從數據角度看,開放型組織能夠獲取多樣化的互補數據資源,包括市場需求數據、技術開發數據、行業發展數據等,提升創新能力。從主體角度看,開放型組織可以廣泛連接用戶、供應商、技術服務商等,提供了創新匯聚的樞紐,通過數據交互激發組織創新活力,形成多元主體驅動的創新模式。未來可能會有多種形態的開放組織出現,但有競爭力的組織形態必然與其數據匯聚和交互能力匹配。

數據驅動的創新不僅能夠揭示海量數據間的復雜關系,洞察顆粒化場景并賦能,而且能夠推進和深化理論機制的多樣化探索路徑,甚至帶來新能力的動態涌現。可以預期,這種新型創新范式將成為科學發現最重要的范式和路徑。

創新倫理:普遍參與、負責任創新與維護競爭的公共價值

區別于以往傳統技術革新帶來的倫理問題,數字時代的科技倫理生發于創新過程本身,數據、數據關系成為科技發展方向的重要引導,以介入社會基礎運行的方式徹底重塑人的主體性與獨特性,導致自然秩序和社會關系的多元改變。數據驅動下的社會發展趨向、數字平臺成為新型社會基礎設施帶來的變革,以及創新效率提升中的壟斷等都成為新的難題與挑戰。

科技發展方向:公眾知情與參與的重要性。當下科技創新產生的一些影響一旦發生則不可逆轉,這就使得傳統的社會適應機制——試錯并糾正——變得不再適用。為避免少數專業修養深厚但全局知識和責任感不足的科技專家倉促作出影響長遠的科研決策,公民對相關科技發展趨向應具有平等的知情權和發言權,開源開放的創新特征也正與這一挑戰形成呼應。與民眾重要權益相關的數據,應秉持以開放為原則的價值理念,最大限度保障公眾利益和社會福利。總之,在數據與數據關系驅動的科技創新范式中,透明公開是首要的倫理遵循,以保障科技發展促進人類文明進步與福祉增加。

負責任創新:數據、算法黑箱與風險治理。由于數據量大、復雜度高,數據驅動的算法決策往往具有內部機制不透明的“黑箱”特點,且隨著數據交互能力與共享能力不斷提升,給用戶和社會帶來未知風險的概率也越大。近些年來,創新范式越來越強調“負責任”的維度以應對這些風險,國內外提出的諸多新興科技治理理念,如“建構性技術評估”“預期性治理”等,更多標志著倫理維度的深度嵌入。“負責任研究與創新”的理念更是將倫理考量直接納入創新過程本身,確保科技進步不僅僅追求經濟效益,更重要的是要在尊重人類價值觀、社會規范和環境保護的前提下開展創新。

制約大企業壟斷:為開源開放賦予新的倫理價值。數字時代的創新范式演進更多依賴數據、數據關系交互共享產生的正向循環,也因此更容易導致壟斷的產生。當前的壟斷形式正在從傳統的價格壟斷轉變為平臺壟斷,大型平臺企業通過提供免費服務的方式掌握數據流量,規模經濟和范圍經濟效應十分顯著,規模效應遞增的特點也由“邊際”轉變為“質變”甚至“涌現”,有可能導致市場結構和競爭關系的根本改變。同時,市場內生的制約因素也在不斷涌現,開源開放這類創新組織有可能削弱先行者的市場支配地位。在數字時代,由于對數據和應用場景的巨大需求,開源開放有可能成為非頭部企業發展的內在訴求。但由于先行者的優勢更加突出,需要加大對開源開放的鼓勵和引導,使之成為企業社會責任的標識和追求,成為社會認同的創新文化,以約束頭部大型平臺企業的壟斷風險,提升創新效率,促進創新收益的公平分享。

(作者分別為中國社會科學院大學教授、中國社會科學院財經戰略研究院博士后、清華大學講師)

閱讀鏈接

數據在本質上體現為一種關系性

大規模數據的意義在于可以通過算法找出更多的數據關系。從宏觀角度看,數據在本質上體現為一種關系性。尋求相關關系或因果關系的定量分析,就是為了探求數據之間的關系。同時,數據具有可以無限次復用和融合的性質,數據之間產生交互、融合和分享的過程,就是數據關系的形成過程。同一組數據,分享愈多、交互和融合愈多,就會產生疊加和倍增效應,創造的價值也就愈大。(鄭明輯)

作者: 江小涓 宮建霞 李秋甫

海量資訊、精準解讀,盡在新浪財經APP

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 12-30 鈞崴電子 301458 --
  • 12-30 賽分科技 688758 --
  • 12-24 星圖測控 920116 6.92
  • 12-23 黃山谷捷 301581 27.5
  • 12-20 天和磁材 603072 12.3
  • 新浪首頁 語音播報 相關新聞 返回頂部