導讀:在基礎數據層面全鏈條治理的基礎上,運用大數據技術讓金融統計分析更“實”,更“全”,更“快”和更“準”
作者|阮健弘‘中國人民銀行調查統計司司長、金融基礎數據中心主任’
文章|《中國金融》2022年第2期
大數據、人工智能的出現和應用,為金融統計分析工作的高質量發展提供了堅實基礎。近年來,全球主要央行在金融統計分析方面加快應用大數據技術,在分析經濟金融運行、預調微調貨幣政策、前瞻識別金融風險等方面提供了關鍵支撐。人民銀行認真貫徹落實習近平總書記關于金融業綜合統計的指示精神,在基礎數據層面全鏈條治理的基礎上,守正創新,穩中求進,運用大數據技術讓金融統計分析更“實”,更“全”,更“快”和更“準”。
大數據技術讓金融統計分析更“實”
大數據技術有效填補數據缺口,打破統計“數據孤島”,讓底層數據更“實”
大數據技術顯著提升數據采集和數據挖掘的效率,增強金融統計數據的可得性,顯著擴大數據分析維度和覆蓋范圍,有效緩解信息不對稱問題。
一是從傳統的樣本數據升級為“全量數據”,極大增加了數據信息量。在大數據時代,統計數據從少量、靜態、單一的樣本數據轉變為海量、動態、多樣的“全量數據”,樣本更多、數據顆粒度更細、數據維度更多。對大數據技術的應用,擴大了數據的覆蓋面,提高了數據的時效性,使數據資源的容量得到極大提升。
二是有助于打破統計“數據孤島”,深度挖掘數據之間的關聯關系。大數據的知識圖譜、人工智能等技術方法可以迅速將海量數據進行智能關聯和分析挖掘,可以有效應用于貨幣政策評估、風險監測、壓力測試等領域,從而彌補傳統分析方法在處理海量數據方面的諸多不足。
三是數據呈現方式多元化,可視化技術提升數據的可接受度。隨著云計算、數據挖掘、數據可視化等大數據技術分析方法的發展,大數據產品日趨多樣化、目錄化,基于追蹤、畫像、提示、匹配、優化等多種功能,可以根據不同的場景開發對應的可視化工具,以滿足特定的數據需求,精準實現數據供需匹配。
大數據技術突出問題導向,提升數據生產效率,滿足數據使用需求能力更“實”
面對日益增長、復雜多變的數據需求,統計供給出現了一些挑戰。一是關聯性統計的挑戰。實現數據之間的聯動分析、鉆取分析,才能更好地展現經濟金融現象間的有效聯系。二是靈活性的挑戰。各類結構性政策的制定與實施迫切需要多角度的靈活數據展現。三是時效性的挑戰。由于熱點重點問題切換太快,從數據需求的提出到需求的滿足,要求的時間越來越短。
大數據技術能有效改善金融統計需求和供給的關系,數據使用方能夠從數據源頭對金融統計供給提出需求。一是大數據智能工具的發展,使數據加工處理和分析應用更加便利高效,數據需求方可以輕松了解數據標準、數據來源與結構,實現數據的高效利用。二是通過細顆粒度的基礎數據和集中的數據存儲,為應對復雜問題提供更加精細和關聯性更強的數據源。三是使用方更熟悉供給,提高金融統計數據的響應效率。在大數據技術支持下,統計更加便捷,多數數據挖掘可以智能實現,能極大程度提高統計效率。
大數據技術在實踐中不斷突破,形成了一批高水平金融大數據分析人才,協同工作能力更“實”
金融統計服務的內涵外延和深化,不僅包含統計報表,還包括數據分析,而且數據分析工作還是連接統計供需的橋梁。大數據技術的快速發展,打破了數據融合分析應用的技術壁壘,深刻影響著分析人員進行數據搜集、挖掘、整理、加工和分析的全鏈條工作,對分析人員的能力素質也提出了更高要求。
我們在利用大數據技術助力金融統計分析能力提升方面開展了多方面理論探索和實踐,在干中學,在學中干,將大數據技術與金融統計緊密結合,注重實操和工作落地。圍繞“建設符合現代中央銀行需要的經濟金融大數據統計復合型人才隊伍”,在金融數據分析人才的培訓途徑、培訓方案方面進行了創新。大數據與金融深度融合,催生層出不窮的新業態新模式。對于金融數據分析人才來說,大量的數據分析工作需要跨部門調集領軍人才,組建攻堅團隊。目前,在中國人民銀行黨委領導下,金融基礎數據中心正在積極探索人才工作新思路和新舉措。以建設國家戰略人才力量為目標,圍繞“高精尖缺”人才,探索形成領軍人才、創新團隊和青年后備人才團結協作、接續奮斗的人才梯隊。
大數據技術讓金融統計分析更“全”
一是以分析為驅動,建立維度更“全”的金融基礎數據統計制度,從600多個細顆粒維度采集金融基礎數據。在傳統的統計框架下,從數據統計到實現分析的流程較長,統計供給在滿足日益豐富的分析需求方面存在困難。要滿足多樣分析需求,需要建立信息含量豐富、使用靈活的分析型數據庫。2020年7月,人民銀行建立金融基礎數據統計制度,金融基礎數據統計制度以標準化逐筆統計方式,涵蓋存款、貸款、同業、債券、股權、特定目的載體等各類金融工具、600多個維度指標,以及金融機構信息和客戶信息等明細數據。數據采集范圍覆蓋全國所有的銀行業金融機構。統計制度通過統一的機構代碼、工具代碼和客戶代碼實現數據的連通、融合,大大拓展了統計數據的廣度和深度。金融基礎數據庫以服務金融分析為主、編制統計報表為輔開展工作,金融統計數據服務分析需求的能力大幅提升。
二是以分析為驅動,制定以人工智能為主導的更“全”的數據質量治理體系。大數據的金融統計內容較多,采用傳統方式進行數據質量治理存在效率不高的問題,需要制定新的數據質量治理體系,一方面,運用大數據的方法設計算法,發現數據質量問題;另一方面,將分析中發現的問題及時形成校驗規則,不斷豐富校驗規則庫,穩步提高數據質量。通過數據地圖實現數據資產智能管理。數據地圖主要面向數據開發者,匯聚用戶所有數據信息,通過元數據信息收集、數據血緣探查、數據權限申請授權等手段,完成數據信息的收集和管理。分析人員通過數據地圖工具能夠實現數據的統一查詢,解決“有哪些數據可用”“到哪里可以找到數據”的難題,并且提升數據資源的利用率。
三是以分析為驅動,構建分析視角更“全”的數據結構模型體系。數據結構模型關乎數據信息的組織方式。良好的數據結構模型能夠為算法運行提供服務。在金融研究中,分析人員往往從現實問題出發,確定分析主題,建立分析目標,設定模型算法。模型算法從海量數據入手,通常復雜度較高,運行時間較長,系統資源耗用較多,這就對如何提升效率提出了更高要求。分析人員能夠根據數據的內在關聯性,挖掘出數據的結構性特征,從而構建具有層次、網狀、關系的數據結構模型體系,為模型算法的高效運行做好前置性工作。
從最終效果看,大數據技術保障分析的驅動力切實可行、行之有效。從實踐看,數據供給到需求的鏈條大大縮短,這需要大數據技術的保障,使得數據供給更加簡單,容易操作。目前,大數據技術主要通過三種手段提供保障。一是實現大量數據的集中存儲,包括大部分數據需求;二是以分析需要規劃建設數據中臺,分層管理數據,實現數據的快速調用;三是提供了更多的便捷式工具,使數據使用更便捷。大數據技術在這三個方面不斷完善,使分析驅動的統計業務能夠可持續發展。
大數據技術讓金融統計分析更“快”
一是熟練使用數據字典,探查數據血緣關系,實現數據“快速”關聯穿透提升分析深度。數據字典是描述數據的信息集合,是對數據項、數據結構、數據流、數據存儲及處理邏輯進行定義和描述的目錄。在海量數據的匯總分析中,分析人員往往首先觀測到異常指標。在由指標到記錄、由宏觀到微觀,追根溯源式地拆解指標、挖掘指標異常變化原因的過程中,查閱數據字典如同瀏覽數據加工廠生產線的紀錄片,對于回溯指標“前世今生”、探查數據血緣關系、實現數據有效穿透意義重大,是提升分析深度、提高分析效率的利器。
二是熟練操作數據庫,跨領域“快速”開展數據融合應用。使用ETL工具,打通各平臺數據庫,實現跨領域多源數據融合。根據分析目標,利用關聯、篩選、計算、排序、分類匯總等多種數據庫數據處理手段,有針對性地構造融合數據集。融合數據集具有多領域的豐富維度,各領域數據之間能夠相互印證,從而檢驗數據的準確性和真實性。使用融合數據集在提高數據利用價值的同時,也有效拓展了金融統計分析的廣度。
三是熟練加工處理數據,“快速”洞察數據質量,提升數據分析可信度。從人民銀行金融基礎數據治理的實踐來看,數據治理范圍涵蓋了金融機構端業務數據庫、金融基礎數據采集平臺和終端大數據平臺。其中,大數據平臺的數據治理主要通過數據分析展開。由于數據分析能夠從應用角度出發,方便觀測到異常匯總指標,并具有跨表、跨周期的數據檢驗能力,因而成為開展數據治理最重要的環節。分析人員能夠通過多樣的分析手段和工具,在有效識別臟數據、評估數據報送質量、對銀行端形成信息反饋的同時,也提升了應用數據的可靠性,為分析結果的可信度提供了堅實的數據基礎。
四是熟練使用大數據智能分析工具,鉆取數據底層的邏輯,“快速”提高分析關聯度。大數據智能分析涵蓋了數據加載、統計挖掘、關聯分析及可視化等內容。熟練使用大數據智能分析工具,整合多源數據,穿透鉆取數據底層的關聯邏輯,實現對數據的深層次探索挖掘。熟悉數據多源特性,接入和整合多種異構源數據,對多源數據進行標準化和規范化處理,根據相同字段對數據進行動態關聯,完成大規模數據的快速整合。利用統計挖掘功能,對數據進行基本的探索分析。按照場景需求,創建自定義度量指標,并利用統計、篩選、排序等功能,有針對性地對數據進行挖掘分析,自定義實現可視化的圖表內容。運用聯動分析功能,挖掘數據底層關聯關系。通過使用下鉆、上卷、旋轉、聯動等功能,實現基于不同分析維度,對圖表內容的穿透鉆取,立體、多角度地挖掘數據的關聯關系,洞察數據背后的深層次問題。
大數據技術讓金融統計分析更“準”
一是圍繞黨和國家大局,加強形勢預研預判,為宏觀調控提供前瞻性、針對性信息支持。習近平總書記在黨的十九大、全國金融工作會議上,強調服務實體經濟、防控金融風險、全面深化改革,這對我國宏觀調控提出新要求。近年來,國內國際形勢復雜嚴峻,在新冠肺炎疫情沖擊下,全球經濟的深層次問題更快更徹底地顯現,我國經濟增長動能、經濟結構也都在悄然改變,這對央行履職提出了新挑戰,對形勢分析的前瞻性、精準性和靶向性提出了更高的要求。應加強形勢預研預判,下好先手棋、打好主動仗,更快、更準地捕捉經濟發展的規律性變化,監測經濟金融運行的趨勢和拐點,前瞻性做好政策儲備。與此同時,大數據技術助力金融統計實現跨越式發展,為形勢分析提供了更為豐富、精準、及時的數據資源,數據綜合分析應用的場景也不斷豐富。針對同業業務、銀行企業共貸關系等熱點問題,強化對重點領域的風險監測和評估,助力防范化解金融風險;開展疫情防控復工復產調查、居民收入恢復情況調查,助力服務實體經濟。大數據技術助力形勢分析更加高效、精準,為宏觀調控政策決策提供更高效的信息支持。
二是充分發揮“情報站”“信息港”功能,有效開展輿情監測。隨著信息技術的快速發展,公眾獲得的信息量呈指數型增長,公眾利用公開信息能更及時捕捉宏觀政策操作意圖,但也容易產生一致性預期錯判情況。因此,如何從正面加強輿情監測和引導公眾預期是一個重大問題。及時發現公眾一致性預期錯判,進行合理引導,能有效避免微觀行為主體預期錯判影響宏觀調控政策效果。大數據技術為有效開展輿情監測提供了可能,也是提升數據治理能力的一個有益嘗試。充分發揮海量數據的“情報站”“信息港”功能,我們嘗試開展公眾貨幣政策松緊度感受、兩會期間金融熱點輿情監測等分析應用,有效填補了數據缺口,為宏觀決策提供信息支持。
三是及時跟蹤政策方向,利用快捷、靈活、廣覆蓋的經濟監測“信息港”體系,圍繞經濟結構轉型等重大問題,提供信息支持。通過對大數據信息的深度挖掘和分析,形勢分析的廣度和深度均明顯延展。堅持以需求、問題為導向,圍繞經濟金融領域的熱點和難點問題,利用大數據技術,深入解剖和展現復雜經濟金融運行中的各種結構性問題,迅速響應、精準聚焦政策方向和經濟金融領域潛在問題、苗頭性趨勢,高效服務精準調控的宏觀政策。
四是熟練運用機器學習模型,做好模擬和預測,提高分析精細度。機器學習模型是挖掘大數據核心價值的有效方法。理解機器學習模型的運作原理,熟練運用機器學習模型,抽象出數據潛在的知識和規律,并對未知數據進行預測和分析,有助于提高金融分析的精細度。了解機器學習模型的理論邏輯,實現不同需求和環境下機器學習模型的構建、運行和部署。在特定金融分析場景中應用機器學習模型,做好模擬和預測。例如,利用機器學習模型模擬研究產業政策、經濟事件、金融環境等真實社會狀態,對政策實施、金融風險等特定事件的產生機制和影響因素進行推演,實現對特定事件發生的提前預判和有效評估。利用多維度數據更新優化模型,提高模型的泛化能力。隨著金融業綜合統計工作的穩步推進,金融統計數據量快速增長,使用多源、高維度的數據對模型進行迭代更新,完善模型的金融場景適用性,提升模型的預測效果,拓寬模型的應用范圍。
責任編輯:李琳琳
投顧排行榜
收起APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)