來源:輕金融摘自《雲原生金融核心系統白皮書》第四部分“雲原生銀行核心系統行業實踐”
白皮書作者:雲 應用現代化推進中心 中國農業銀行 中國郵政儲蓄銀行 中信銀行
導語:核心系統是金融機構的心臟,也是其數字化水平的重要體現。隨著雲原生理唸的推廣與技術的成熟,在業務創新、流程最佳化、降本增效等因素的驅動下,雲原生逐步成為銀行核心系統最佳化轉型的最優路徑。
本白皮書聚焦銀行業,從宏觀角度分析了數字時代背景下金融科技的需求與發展趨勢,梳理了金融核心系統的發展脈絡,指出現代化金融核心系統的建設要點、建設思路與痛難點,歸納出一套現代化金融核心系統建設方法論。同時,本白皮書詳細闡明瞭雲原生金融核心系統架構,從實踐角度介紹了雲原生金融核心系統的落地思路與實施路徑,並給出了典型商業銀行的優秀實踐。
期望本白皮書能夠為雲原生在金融業的廣泛應用提供落地參考,推進銀行業充分採用雲原生理念與技術建設符合現代化需求的金融核心系統。
以下為白皮書第四部分“雲原生銀行核心系統行業實踐”
4.1 農業銀行分散式新核心雲原生實踐
4.1.1 農業銀行分散式核心系統建設概況
面對業務爆發增長對核心系統的新挑戰,在“打造自主可控新技術棧,提升業務連續性保障能力”的新形勢要求下,農業銀行按照“積極探索、搭建平臺、試點推進、深入轉型”的規劃路線開展工程實施。
分散式核心系統基於雲平臺、技術底座,依託資料中臺和全棧式技術中臺,採用服務化的設計思想,抽象賬務、合約、客戶資訊等公共基礎服務,建設個人負債、公司業務、貸記卡等產品服務;對接 DevOps 工具鏈以實現應用持續整合、持續交付;對接全行生產運維平臺以實現應用監、管、控、配聯動;透過兩地三中心單元化雙活提升業務連續性水平;透過雲安全架構體系建設支撐更高資訊保安和網路安全要求,最終將在開放平臺建成採用分散式、微服務、容器化技術架構的分散式核心系統群。
4.1.2 農業銀行信用卡分散式核心系統建設
信用卡是農業銀行核心系統的重要模組之一,在分散式核心系統建設整體框架下,信用卡分散式核心系統建設於 2020 年 9 月啟動,2022 年 10 月完成全量功能投產,2023 年 4 月完成億級客戶規模的資料遷移和流量切換。信用卡是農業銀行分散式核心系統首個完成下移的高敏感、高併發大型應用,具有代表性的意義。
信用卡核心系統面對近年來信用卡業務的快速發展,疊加客戶、同業、風險等多方面因素的發展變化,系統的服務能力面臨多種挑戰:
一方面是傳統的集中式系統架構因缺乏快速有效的橫向擴容能力,單體規模過於龐大,難以有效應對網際網路類業務的瞬時高併發、大資料量、快速迭代等發展需要;另一方面是信用卡業務呈現渠道線上化、產品多元化的趨勢,原有的業務架構底層設計難以滿足場景額度、靈活計價等方面的新需求。
在架構轉型的過程中同樣面臨著多項技術挑戰:在基礎設施方面,基於大型主機的集中式架構難以滿足全新技術棧和業務創新需要;在架構設計方面,分散式微服務架構增加了設計、研發、運維的複雜度;在服務能力方面,核心系統對業務連續性和事務一致性有極高的要求,並要求支援海量高併發的交易場景;在系統關聯方面,信用卡系統與其他核心系統、眾多外圍系統間存在緊密的互動關係,內外部關聯影響複雜。
農業銀行構建了跨部門、跨專業、跨領域的分散式核心工程團隊,重點對設計開發、技術支援、運維保障等方面進行統籌協調和集中攻堅。信用卡分散式核心系統在實施路徑上綜合評估業務需求迫切度和技術實施可行性,選擇了技術架構升級與應用重構並行的方案;在技術方案上基於農業銀行分散式核心技術棧,結合信用卡業務特點,開展了各項專題攻關工作。
一是基礎設施與技術棧全面替換,為業務快速發展提供能力保障。信用卡分散式核心系統由基於大型機、封閉式中介軟體的架構,轉向基於“雲平臺+分散式資料庫”的技術路線,構建高效能、高可用、易擴充套件的分散式核心信用卡系統,大幅度提升橫向擴縮容能力和容災能力,針對當前新型業務的瞬時高併發、大資料量、產品創新及市場活躍快速迭代等特點實現有效支撐。透過雲原生容器環境,構建了安全穩定執行的雲平臺,實現了應用全面上雲;利用分散式資料庫,提升靈活擴充套件能力,可以滿足大容量、高併發和突發峰值場景的需求,為億級客戶的經營與管理提供安全穩定的資料服務支撐。
二是基於微服務的應用架構轉型,提供更好的業務能力支撐。將原有的集中式單體化應用逐步按照業務模組進行拆解,根據交易型別細分成多個微服務,形成了高內聚、低耦合、規模適中的獨立功能模組,將原有集中式架構逐步拆解,實現了應用架構解耦。透過明確模組功能和微服務邊界,各模組獨立開發提高交付效率,獨立執行提高系統健壯性,獨立擴充套件提升彈性擴縮容能力。有效提升應用自動部署與持續交付能力,更好地融入了 DevOps 流水線體系,使研發、測試、投產部署、運維管控等形成了一鍵式的體系化、流程化貫通,能夠更加敏捷高效安全的快速迭代和持續交付。
三是單元化分散式資料架構,構建面向客戶的高可用資料服務能力,提升容災水平。信用卡分散式核心建設中,採用分割槽多活架構設計,資料採用單元化多分片形式,透過分散式資料庫支撐了上層微服務應用單元化能力。
資料分佈上,信用卡採用一主多副本方式部署,在資料全生命週期管理方面,形成了線上、近線、離線的多層次資料分佈規劃,全面提升了資料應用和資料安全服務能力,夯實以客戶為中心的多級資料服務基石。
應用部署上,將重要業務和其對應的系統橫向切分為若干單元,每個單元都具備全量服務能力。在容災能力上,構建了“同城雙活+異地災備”的容災體系,提供了灰度釋出和快速故障隔離能力,實現故障情況下應急切換,重要資料有備份,重要業務不中斷,有力保證業務連續性。
四是分散式事務解決方案,保證業務流程合規和資金安全。針對信用卡多樣化的交易場景,設計滿足信用卡特色的分散式事務處理方案,為賬務等具備資料強一致性要求的業務場景提供高效能、一致性的事務保障。基於農業銀行基礎平臺公共技術元件,以保障客戶資金安全為出發點,逐場景、逐交易設計和編排分散式事務,切實提升事務一致性能力防控資金風險,保障信用卡交易的安全、穩定、高效。
完善異常差錯處理機制,打通跨服務、跨資料庫、跨資料分片的流程斷點,實現分散式異常差錯資訊的實時共享、業務集中處理、服務無縫對接,保障客戶服務的及時性和賬務處理的準確性,切實增強風險管控和自動化處置能力。
五是提升一體化運營能力,保障安全生產。構建運維能力成熟度模型,實現模型全自動化評級,全面衡量系統應用運維自動化水平,引導應用運維能力全面提升。圍繞新技術底座,深度適配分散式核心新技術棧,提升分散式核心平臺化運營能力,透過統一規劃、專項匹配方式,實現分散式核心平臺化運營能力下沉,充分支撐分散式核心系統“監、控、管、配、析”一體化運營能力,保障分散式核心生產執行的穩定性。
目前,信用卡分散式核心系統執行平穩,聯機交易效能同業可比,批次處理時長顯著縮短,平穩支撐“雙十一”等瞬時高併發場景執行,有力支援多項新型業務產品的發行。
4.1.3 農業銀行信用卡分散式核心系統未來展望
農業銀行信用卡分散式核心系統在原有主機系統功能實現全產品、全場景、全渠道業務可覆蓋及全相容的基礎上,對客戶化、數字化、數字貨幣等市場和產品的發展趨勢進行前瞻性架構設計及功能儲備,構建了信用卡新一代額度架構、交易子賬戶體系、差異化定價體系等多種關鍵能力來滿足未來業務與市場發展需求。未來,信用卡分散式核心系統將充分挖掘雲原生架構的潛力,推進信用卡業務流程升級最佳化,使業務流程與分散式系統的原生能力相融合,更好的為業務發展賦能。
同時,在主機下移到分散式系統的架構變化下,IT 系統複雜度大幅上升。公共技術平臺、雲計算、分散式資料庫等新技術底座,為分散式核心提供了統一、可複用的技術能力,實現高可用、高可靠、高效能的支撐,但另一方面也客觀地將風險分散與擴大了,作為金融業的核心繫統,保障系統的安全執行是科技工作的重中之中。農業銀行將結合分散式系統運維實際,以生產運維平臺提供的各項智慧監控、分析、處置能力為基礎,結合 AI 學習能力,探索分散式核心系統智慧化運維的新場景。
4.2 分散式雲原生架構和開源實踐
面對數字化浪潮帶來的快速變革,郵儲銀行在十四五規劃明確了共享技術平臺、智慧郵儲大腦、開放共贏生態及極致使用者體驗四個關鍵領域,打造科技金融四橫三縱金融科技能力。2022 年郵儲銀行基於單元化架構的新一代個金核心全量投產;對公核心完成平臺驗證;前端渠道業務的手機銀行 8.0 投產。為了這些關鍵業務系統提供執行相匹配的高可靠、高可用、高效能、可服務的基礎環境,郵儲開展藍圖先行,自上而下進行頂層設計和資源規劃:國芯規劃:全棧- 全雲服務- 全應用的國芯支援,實現從晶片、作業系統、基礎設施到 IaaS、PaaS 和應用層的全系列自主可控。安全合規:滿足金融行業的強網路安全管控要求,普通業務符合等三,核心業務符合等四,容器要符合行裡的安全能力標準和實施規範。
高可用性:匹配業務場景要求的同城和異地容災規劃,故障下可快速熔斷並及時切換恢復。以使用者轉賬場景為例,單元化架構下轉賬資料要支撐跨中心的產品及方案設計,服務治理也要具備跨中心高可用設計。
擴充套件性強:平臺在架構、規模、雲服務、功能等充分發揮分散式架構特徵,可快速、大規模靈活擴充套件。以平臺為例,可為上層應用供給各類商用或自研中介軟體。
可服務性:具備資源和應用維度的智慧化運維、快速定障、根因分析以及故障恢復,在業務雲化由單體變分散式後可獲得原極簡的服務能力。
其中在 2022 年 11 月全新推出新一代手機銀行,新一代手機銀行系統以客戶為中心,以資料為驅動,不斷豐富場景應用,為客戶提供更安全、更便捷、更高效、更智慧移動金融服務,為全行超 6 億客戶打造數字化智慧服務新體驗。
新一代手機銀行全面採用國產化的軟硬體體系,在架構設計上摒棄 了 傳 統 單 體 架 構 設 計 模 式 , 採 用 分 布 式 雲 原 生 架 構 , 以Docker+Kubernetes 為容器底座和麒麟/統信國產化作業系統,結合軟負載均衡、高效能網路等雲原生能力承載容器化 4-7 層應用訪問,運用領域設計理念對系統進行子域和限界上下文劃分,梳理出清晰的微服務邊界,形成可持續演進的分散式微服務架構體系。在技術架構上引入單元化設計思想提升系統彈性伸縮能力和高可用能力,一方面將各個微服務的資料和邏輯進行立體拆分,劃分成更細粒度的服務單元,具備強大的水平擴充套件能力;另一方面一個單元出現故障不會影響其他單元執行,實現了單元粒度的高可用能力。
手機銀行技術架構
在雲原生建設方面,新一代手機銀行以容器雲平臺為中心、雲原生技術為基礎,建立了統一程式碼基線、規範的依賴製品倉庫和分離的構建、釋出、執行流水線,消除了專案的部署環境差異,實現一鍵部署、快速複製、持續整合的目標。同時引入 DevOps 研發運維一體化工具讓研發更專注於業務需求的交付,提升敏捷開發、快速迭代水平。在基於雲原生的系統設計與部署方面,新一代手機銀行進行了基礎元件、管理類任務、應用服務與配置的分離設計,疊加埠繫結、優雅啟停等技術,實現微服務應用的無狀態部署。藉助雲平臺的服務狀態感知、壓力驅逐等特性,系統具備限流、擴縮容、降級、重啟、回滾、切流等一系列的故障快速恢復能力。建設了高度自動化、智慧伸縮的應用部署及執行平臺,實現自動化、智慧化運維,具備大規模叢集排程能力,單中心服務節點高達上千個。
在運維監測方面,基於“無法度量,就無法管理”的理念,新一代手機銀行系統圍繞延遲、流量、錯誤和飽和四類指標標準,定製化交易類、作業類、配置類、微服務類、中介軟體類和自身類六大類監控目標,共 50 餘項核心指標,結合容器化監控元件,從多個視角監控服務狀態,來感知和預知手機銀行系統的執行狀態,建立全景可觀測的監控能力和智慧化運維體系。從指標(Metrics)、日誌(Logging)、跟蹤(Tracing)三個資料維度提供了全鏈路監控能力和全鏈路問題快速發現能力。
多維度監控關聯
對於需要容器化執行環境的應用系統(以手機銀行為例),容器資源要滿足以上的設計要求和規範,不僅要考慮優秀架構和功能豐富的容器元件引入,也要在部署上按行裡的業務要求進行容災規劃,並基於行裡的運維規範進行 API 的封閉和對接;同時在分散式雲邊端設計、全域性的可觀測性、灰度釋出能力、雲原生市場、容器安全等能力進行完整的平臺功能規劃設計和分階落地。
手機銀行業務架構
新一代手機銀行實現了更快的響應速度、更優的互動體驗、更強的系統性能。在系統高可用上採用雙中心雙活模式,RPO 小於 10 分鐘,RTO 小於 5 分鐘,整體服務成功率全年保持在 99.99%以上。單中心繫統容量可達 50000TPS(實測),並且具備快速水平擴充套件能力,能夠根據業務發展情況進行分鐘級擴縮容。在紀念幣預約、保險開門紅等搶購場景中系統平穩執行,峰值高達 10 萬 TPS。
未來,新一代手機銀行會繼續堅持科技引領,持續擁抱雲原生,引入新技術,以打造使用者體驗良好、效能卓越、高效穩定的移動金融服務為目標,全面構建“場景+金融”智慧服務強生態,更好地滿足人民群眾的移動金融服務需求。
郵儲銀行容器雲平臺已完成一雲多芯、高效能網路、可觀測性和多叢集設計的規劃與建設:支援一雲多芯:鯤鵬和麒麟、統信等國產伺服器與 OS 的支援;高效能網路:基於 Underlay 模式的高效容器網路;可觀測性:基於大規模的容器指標、告警、日誌一體化可觀測平臺能力構建,支援秒級監控能力、採集監控資料的統一上報、自定義指標的採集;多叢集設計:與業務模型、網路隔離、容災訴求相結合的多 K8S 叢集設計規劃,實現業務按照例項、叢集、資料中心、地域等多種層次的冗餘保障。未來還會探討結合應用場景的超大規模容器叢集高階方案設計和應用推廣。
4.3 中信銀行核心系統分散式化及雲原生演進
中信銀行凌雲分散式核心系統,於 2020 年 5 月投產,將原有 IBM主機系統“一次性、全業務、零差錯”全部遷移到開放平臺分散式系統上。投產後,系統執行平穩,能夠滿足業務發展需求,為銀行業核心系統轉型提供了“中信模式”的解決方案,促進中國銀行業核心業務系統下移的速度。中信銀行分散式核心系統整體建設歷程如下:
2019 年 10 月,基於雲架構的信用卡分散式核心系統投產。2020 年 5 月,基於開放平臺的分散式技術和分散式資料庫的總行核心系統投產(凌雲系統)。2021 年 10 月,由分散式核心系統拆分出的凌雲快捷支付服務和凌雲組合閘道器投產,採用容器雲部署,並支援 service mesh 服務網格接入。2021 年 11 月,凌雲海外核心繫統投產,全部使用容器雲部署。2022 年 3 月,採用凌雲平臺底座研發的理財平臺投產,全部使用容器雲部署。2022 年 12 月,整合分散式核心系統和外圍系統登記簿體系的資金簿中心投產,全部使用新的全棧雲部署,中信銀行分散式核心系統初步實現了“多雲多芯”的部署架構。2020 年 5 月投產的凌雲工程,將執行在主機的銀行核心系統一次性遷移到基於國內創新的資料庫和伺服器的大中型銀行核心分散式系統,率先在大中型銀行中實現了銀行核心系統分散式架構轉型。
中信銀行核心系統分散式架構轉型框架
凌雲工程以技術創新為驅動力,著重強化突破新技術、探索新工藝和構建新體系,降低實施風險,提高實施質量和提升實施效率和組織創新能力。該工程的主要特點如下:一是突破新技術,聯合研製了金融級分散式資料庫,達到銀行核心系統的高穩定性、高可靠性和高安全性要求,透過研發程式碼翻譯技術、模擬比對技術和創新資料遷移技術,實現核心系統一次性整體遷移、業務無感、核心應用全繼承,工程實施時間短、投入少;二是探索革新工藝,基於生產模擬工藝,最大化地緩釋未知技術風險;三是構建新體系,強本固基,立足“平臺化運維”,建立“全域覆蓋、全時自動、全程可控”的分散式核心運維體系。透過程式碼翻譯技術和模擬測試工藝的運用,大幅降低了核心系統重構的成本。較採用 AS/400 主機核心相比,在系統容量提升的前提下,建設成本下降 50%以上,建設週期縮短 40%以上,而且質量高、風險小,投產前無遺留缺陷,業務功能零遺漏。
中信銀行凌雲工程研發工程
此外,中信銀行透過凌雲工程,統一了核心系統與行內其他系統的技術棧,從科技人力資源,到基礎軟硬體資源,以及應用研發與運維體系,實現全系可複用。凌雲工程中金融級分散式資料庫成功研製,並探索出一種加速基礎產品成熟的研發模式,成為共建共享、優勢互補、快速迭代,成為產用結合、聯合研發的典範。凌雲系統投產上線後,日均交易量超億筆,峰值系統處理能力超 3 萬筆/秒,可用率超過99.99999%。系統表現穩中有進,有效支撐了中信銀行各業務條線發展。凌雲系統創新實現了國有大中型銀行的核心繫統主機遷移,其成功投產為中國銀行業核心系統的分散式轉型闖出一條路,證明了金融行業使用開放平臺和國內創新伺服器的可行性;驗證了國內創新的資料庫完全勝任銀行核心系統的實施性;加速了銀行業核心系統分散式轉型的程序。
未來,中信銀行將依託企業級業務建模,深化核心系統服務化建設,加強資料能力,建設綠色高可用資料中心,夯實一體化運營中臺,健全自動化風險控制機制。進一步提高科技架構支撐能力,構建賦能開放生態、數字化業務發展的核心業務系統。
【輕金融好文】
1、
2、
3、
4、
5
6、
7、
8、
9、
10、