股市瞬息萬變,投資難以決策?來#A股參謀部#超話聊一聊,[點擊進入]
第21屆中國國際金融論壇于2024年12月19日-20日在上海召開,主題為“金融高質量服務新質生產力發展”。中國農業銀行數據中心技術管理部總經理魏坤出席并演講。
以下為演講實錄:
各位領導各位專家大家好,我是農業銀行數據中心的魏坤,很高興借此機會與各位同仁共同探討一下“新形勢下金融機構如何更好地開展算力基礎設施的建設工作”。
當下算力作為新質生產力的核心要素,已經成為社會經濟高質量發展的重要驅動。因此快速推進算力基礎設施的高質量發展,已經成為金融機構的一個重要課題。今天我將結合金融算力基礎設施內外部的發展要求,著重圍繞我行的工作實踐,給大家做一個簡要的匯報。
去年10月,國家6部委印發了《算力基礎設施高質量發展行動計劃》,這里的算力是廣義的算力,具體包括信息計算力、網絡運載力以及數據存儲力行動計劃提出了算力基礎設施高質量發展,應遵循多元供給、優化布局、需求牽引、強化賦能、創新驅動、匯聚合力、綠色低碳安全可靠這四個原則。
我感覺這四點原則總結得非常好,就是簡要而又全面,他為我們金融業的算力基礎設施的建設提供了非常清晰的一個指導方向。
在內部業務需求方面,對于我們這種大型商業銀行而言,用戶數量非常龐大,就拿農行來說,我們現在有8億多的個人客戶,還有1000萬的企業客戶,掌銀的月活已經超過了2.4億。
此外銀行的業務復雜度還是非常高的,各類金融服務層出不窮,并且隨著金融業數字化轉型步入深水區,業務產品和服務模式持續快速的創新,對通用與智能算力的多元供給,算力資源的快速交付,還有基于業務量的靈活的彈性伸縮等服務能力,提出了更高的要求。
更重要的是大型商業銀行作為社會經濟系統的壓艙石,它的穩定性是頭等大事,安全穩定是不可打破的底線。基于以上的內生需求,農行的行黨委提出了平穩、高效、安全、精準、敏捷、簡單這十二字方針,這和算力基礎設施高質量發展行動計劃里面,剛才提到那4條原則是非常契合的。
綜合分析國家的政策要求和內生業務發展需求。那么如何打造高質量金融算力技術措施,概括起來需要回答這四個問題。
第一個是如何優化算力布局,匹配國家的“東數西算”的戰略;
第二個是如何開展高可用建設,構建可靠安全的金融IT架構;
第三個是如何以原生創新驅動滿足資源供給的敏捷高效;
第四個是如何落實雙碳戰略,構建綠色低碳的基礎設施;
下面我來匯報一下農行針對這四個問題的回答。
為了有效應對算力基礎設施面臨的新形勢和挑戰,農行主動融入和構建新發展格局,堅持統籌高質量發展和高水平安全,扎實開展提質增效,降本三維工程,全面打造了“東西協同,總分協同”的高效算力基礎設施,大力推動云原生數據庫等技術引入落地,初步建成了算力一體協同,然后架構可靠安全,全棧深入深度云化,運營敏捷高效,運轉綠色低碳的現代化計算運載及存儲中心,為農行的業務發展提供了更為精準高效的算力支持。
下面我分別對這五方面的工作進行匯報。在布局方面,農行積極落實國家的“東數西算”的戰略,綜合考量業務和技術發展趨勢,災備體系布局,啟動了內蒙古數據中心的建設,將大數據以及AI算力全部由西部數據中心承接,充分利用西部的算力資源來支撐東部的數據處理,實現算力布局的提質。
去年我們在完成大數據規模化遷移工程以及分行數據全面上云以后,農行算是初步完成了算力布局和信息系統部署的優化,至此基本實現了東西部算力高效互補,總分行一體協同聯動。
此外在算力布局條例的基礎上,我們也加速構建高效靈活的算力調度體系,持續優化提升通用算力和智能算力的協同供給能力。通過智能編排、彈性調度等策略,實現了算力的高效流動,達到算力需求和供給的平衡,能夠快速滿足上層應用多元化的算力需求。
在架構建設方面,這里面有兩個重點,一個是可靠,一個是安全。在可靠上我們是構建了一套非常可靠的一個高可用架構。農行是按照日常生產、同城災備、異地容災、節點保障,這幾個維度的需求,計劃構建了設備級、園區級以及區域級的多層級高可靠的算力架構,持續推進雙活加災備的容災工程建設,打造了全天候、全場景、全鏈路的容災業務連續性保障體系。
我們針對高等級的應用現在已經全部高標準地完成了同城的雙活建設,為事件處置等提供了快速高效的應急手段。在歷年的人行壓力測試演練中,我們的同城以及異地的切換的速度一直保持同業領先。
第二大方面就是安全,我們是打造了全周期、全覆蓋、全資產一體化的立體縱深網絡安全防御體系。
(1)是構建了全生命周期貫通的研發運營安全體系,將安全防控左移。
(2)是構建了全覆蓋的四橫一縱的機房架構,實現對總分行境外機構,子公司深度賦能。
(3)構建了基于全量資產的新一代脆弱性管理平臺,實現主動安全防護。
(4)構建了企業級一體化安全運營中心,實現威脅發現、監測預警,應對處置效率的顯著提升,堅持堅實地保障了農行全量的個人客戶和企業客戶的資金與信息安全。
農行還開展了全棧的深度云化。我們是整合了IaaS和PaaS平臺,在技術架構業務應用、架構安全領域全面落地了云原生技術,打造了業內首個全域通過云原生成熟度優秀級評估的云平臺,建成了三地六中心加分行的分布式云,再加邊緣設備的分布式算力網絡,支撐農銀集團分布式核心業務,集團的子公司的業務,電子銀行業務、辦公業務等全業務場景。
目前農行的云原生已經全面建成,IaaS的云化率達到了99%,容器云的云化率達到了92%。目前已經承載了一千多個系統模塊,有14萬個容器在穩定地運行。
基于剛才提到的云原生2.0的體系,農行實現了各類資源的敏捷高效供給能力。在算力體系打造方面,以一云多芯的金融云平臺為依托,提供CPU、GPU算力資源的統一管理和靈活的調度能力,構建了混合池化、算力拆解的異構算力體系。
在高速存儲方面,我們基于NoF+技術構建了無損以太網絡,實現了與傳統光纖交換網絡相當的一個IO吞吐表現,深入探索并實施了數據庫加全閃存的存算分離架構解決方案,有效地提升了數據處理的速度和效率。在支持存算分離架構和AIGC大模型訓練等方面,展現出了資源和投入之間的良好平衡。
在激發數據要素的潛能方面,以上云和存算分離為重點,打造企業級數據能力中樞,建設數據處理架構和數據存儲和計算統一的規范化實時數倉,提升數據服務的實效,為農行智慧銀行建設提供堅實的數據支撐。在這個企業級的網絡架構方面,我們創新應用基于SRV6的IPV6+的網絡技術,實現了三個協同:首先是云網協同,實現了骨干網與內網絡的無縫銜接,云間協同實現了數據中心之間的資源共享和靈活調度,云端協同實現了端到端的網絡服務貫通和服務質量保障。
最后是在智能運維賦能方面,我們基于AIOps的理念,聚焦監控應急變更等領域,構建涵蓋多維分析,運行風險預測、故障智能診斷、無閾值告警,指標化運營等方面的AI運營體系,有效提升全局的分析能力和應急處置效率。
基于以上的技術創新應用,農行的算力基礎設施能夠有效地對各類算力業務場景進行支撐,可以實現5分鐘拆解4000核的資源快速交付,提供業務峰值60萬TPS的性能支撐,以及跨層跨域的千卡調度的智算能力。
在綠色低碳方面,農行積極響應國家的雙碳戰略,根據不同地區的氣候特點,資源情況等因素,因地制宜地選取合適的綠色低碳技術。我們新機房采用了間接蒸發冷卻、氟泵雙循環、光伏發電等技術,節能技術應用水平處于行業內的領先水平,同時結合云原生+AI的效能管理理念,進一步實現了降本增效。第一個是引入研究生彈性擴縮融合智能推薦的算法,智慧調度提升資源的使用率。第二個是通過對數據中心制冷系統運行數據進行加工整合訓練,建立制冷能效AI預測的模型,實現能效的智能尋優,有效節約用電成本。第三個是試點打造無人機房,并在無人維護時打造黑燈機房,實現PUE的進一步下降。
在最后我想針對金融算力基礎設施的未來發展,談一下自己的理解。
未來金融算力基礎設施作為向社會提供公共服務的重要主體之一應持續關注安全穩定,多元算力,然后智能算網、綠色低碳四個方向:
一是針對金融機構的關鍵信息基礎設施的這個測評工作已經逐步落地了。金融機構要履行好關基運營者的職責,依據關基條例的各項要求,進一步強化算力網絡的安全保障。
二是目前各行都在開展金融行業的大模型的引入和試點應用,后續隨著各類AI場景的落地和深化,金融業應更加注重高性能計算以及大規模數據處理能力的提供,同時要增強智能算、網和儲在建成后的運營能力。
三是算力網絡,經歷了算網融合的發展,最終將演進為云網一體。未來金融業的算力基礎設施應更加注重網絡協同,通過對算力設施網絡資源以及業務場景的協同感知,智能化的將業務調度到合適的節點,實現算網資源統一編排,統一運維,統一優化。
四是綠色高效的數據中心建設已經成為行業的共識。金融業需要進一步引入綠色能源,采用源網荷儲一體化技術,積極地推動算力基礎設施綠色低碳發展。
以上是我的分享,請各位領導專家批評指正,謝謝。
新浪聲明:所有會議實錄均為現場速記整理,未經演講者審閱,新浪網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。
責任編輯:王翔
VIP課程推薦
APP專享直播
熱門推薦
收起24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)