當前,伴隨信息技術的持續(xù)變革與發(fā)展,以數(shù)字經濟為代表的新經濟將成為發(fā)展新動能。以云計算、大數(shù)據(jù)、人工智能等為代表的數(shù)字技術不斷涌現(xiàn),快速向經濟社會各領域融合滲透。以數(shù)據(jù)為核心的數(shù)字化轉型已是大勢所趨。金融業(yè)是數(shù)據(jù)密集型行業(yè),在生產經營過程中積累了海量的數(shù)據(jù)資源,對數(shù)據(jù)資產進行管理、應用、治理成為金融機構探索和實踐的重要方向。在本篇文章中,我們將結合金融機構在數(shù)據(jù)治理過程中的具體實踐,一起探討軟件定義存儲技術能夠在數(shù)據(jù)治理體系中發(fā)揮怎樣的價值。
金融機構數(shù)字化轉型中數(shù)據(jù)治理的困難與挑戰(zhàn)
金融機構作為數(shù)字化轉型的親身實踐者,在過去的實踐中積累了較為豐富的數(shù)據(jù)治理經驗。但是面對數(shù)據(jù)的海量增長,如何科學地管理和使用數(shù)據(jù),“盤活”數(shù)據(jù)價值,使經濟利益和社會效益最大化,依然面臨著諸多困難與挑戰(zhàn)。
困難一、缺乏統(tǒng)一數(shù)據(jù)視圖,難以發(fā)現(xiàn)價值數(shù)據(jù)
由于歷史原因,多數(shù)金融機構的數(shù)據(jù)資源散落在多個業(yè)務系統(tǒng)中,缺乏統(tǒng)一的數(shù)據(jù)視圖,管理人員和業(yè)務人員無法及時感知數(shù)據(jù)分布情況,無法快速找到符合自己需求的數(shù)據(jù),也無法發(fā)現(xiàn)有價值的數(shù)據(jù)并納入數(shù)據(jù)資產。
困難二、數(shù)據(jù)孤島普遍存在,跨業(yè)務共享效率低
金融機構將數(shù)據(jù)作為戰(zhàn)略性資源,因數(shù)據(jù)共享機制不完善、各機構數(shù)據(jù)接口不統(tǒng)一等問題,導致數(shù)據(jù)難以互聯(lián)互通,形成“數(shù)據(jù)煙囪”,不利于開放共享。
困難三、數(shù)據(jù)質量低下,業(yè)務決策根基不牢
數(shù)據(jù)質量是金融服務與創(chuàng)新的重要基礎。由于缺乏完善的數(shù)據(jù)治理體系,金融機構在數(shù)據(jù)采集、存儲、處理等環(huán)節(jié)存在不科學、不規(guī)范等問題,無法確保數(shù)據(jù)的完整性和準確性。
困難四、科技研發(fā)投入不足,數(shù)據(jù)場景融合不足
金融機構的數(shù)據(jù)規(guī)模十分龐大,從中挖掘高價值、關聯(lián)性強的高質量數(shù)據(jù),需要高效的信息技術支撐和可靠的基礎設施保障。然而,部分機構科技研發(fā)投入相對不足,導致海量數(shù)據(jù)資源無法盤活,數(shù)據(jù)價值難以充分釋放。
困難五、缺乏安全的數(shù)據(jù)環(huán)境,數(shù)據(jù)流程存在風險
倘若擁有龐大的數(shù)據(jù)資源,但缺乏安全的數(shù)據(jù)環(huán)境,同樣危險重重。常見的安全風險包括數(shù)據(jù)泄露、數(shù)據(jù)濫用等,潛藏在數(shù)據(jù)的采集、存儲、共享等各個流程中。
困難六、缺乏數(shù)據(jù)治理體系,數(shù)據(jù)“不善用、不盡用”
部分金融機構尚未建立起有效管理和應用數(shù)據(jù)的模式,對數(shù)據(jù)服務和應用缺乏合規(guī)性指導。由于法律法規(guī)尚不健全、數(shù)據(jù)治理體系還不完善、機構合規(guī)意識不足,數(shù)據(jù)“不善用”的問題突出,過度采集數(shù)據(jù)、違規(guī)使用數(shù)據(jù)、非法交易數(shù)據(jù)等問題屢見不鮮。
概括而言,一是數(shù)據(jù)組織形態(tài)和架構的問題,即如何將數(shù)據(jù)納入統(tǒng)一視圖、讓數(shù)據(jù)跨業(yè)務共享;二是數(shù)據(jù)管理策略和安全的問題,即如何提高數(shù)據(jù)的質量、深化數(shù)據(jù)與應用的融合、保障數(shù)據(jù)環(huán)境的安全;三是數(shù)據(jù)價值發(fā)現(xiàn)的問題,即如何釋放數(shù)據(jù)價值。
面對上述困難和挑戰(zhàn),金融機構如何解困破局、實現(xiàn)數(shù)據(jù)有序治理和高效利用,探索數(shù)據(jù)治理之“道”成為迫在眉睫的問題。
三大策略指引金融機構從數(shù)據(jù)管理到數(shù)據(jù)治理轉型跨越
針對以上困難和挑戰(zhàn),金融機構如何制定數(shù)據(jù)治理策略、完善數(shù)據(jù)治理體系、做好數(shù)據(jù)資產管理和價值評估至關重要。所謂數(shù)據(jù)治理,就是處理數(shù)據(jù)的策略,即如何存儲、訪問、驗證、保護和使用數(shù)據(jù)。數(shù)據(jù)治理必須涵蓋數(shù)據(jù)的全生命周期,即從數(shù)據(jù)的獲取、存儲到管理、應用再到歸檔、刪除的全流程。
按照數(shù)據(jù)生命周期的特點,可以將數(shù)據(jù)治理策略分為三個部分,即數(shù)據(jù)的獲取和存儲、數(shù)據(jù)的管理和安全、數(shù)據(jù)價值的釋放。
策略一、數(shù)據(jù)的獲取和存儲
數(shù)據(jù)生命周期管理的起點,是數(shù)據(jù)的獲取和存儲,這也是數(shù)據(jù)治理最先面對的環(huán)節(jié)。若要解決統(tǒng)一視圖、跨業(yè)務共享的問題,需要對數(shù)據(jù)資源制定標準、建立模型,并確定元數(shù)據(jù)和主數(shù)據(jù)的存儲方式,可概括為數(shù)據(jù)標準管理、數(shù)據(jù)模型管理、元數(shù)據(jù)管理、主數(shù)據(jù)管理四個方面。
數(shù)據(jù)標準管理可確保大數(shù)據(jù)平臺數(shù)據(jù)的完整性、有效性、一致性、規(guī)范性,推動數(shù)據(jù)共享開放。數(shù)據(jù)模型管理將所有數(shù)據(jù)納入統(tǒng)一視圖,便于數(shù)據(jù)整合。元數(shù)據(jù)管理實現(xiàn)關鍵信息的追蹤、記錄和快速檢索。主數(shù)據(jù)管理實現(xiàn)跨系統(tǒng)使用一致的和共享的主數(shù)據(jù),降低成本和復雜度。
策略二、數(shù)據(jù)的管理和安全
如何對數(shù)據(jù)進行管理、評估和共享呢?這便進入數(shù)據(jù)治理的第二階段,即數(shù)據(jù)的管理和安全,該階段的主要措施可概括為質量管理、安全管理、共享管理等三個方面。
質量管理幫助金融機構獲得干凈、結構清晰的數(shù)據(jù),極大提升數(shù)據(jù)質量;安全管理確保數(shù)據(jù)資產在“存、管、用”等環(huán)節(jié)中的安全,做到“事前可管、事中可控、事后可查”;數(shù)據(jù)共享管理通過搭建統(tǒng)一共享平臺,打通跨部門共享瓶頸,提高利用價值。
策略三、數(shù)據(jù)價值的釋放
數(shù)據(jù)治理的最終目的是釋放數(shù)據(jù)價值。數(shù)據(jù)價值管理是數(shù)據(jù)治理體系中的關鍵環(huán)節(jié),是對數(shù)據(jù)內在價值的度量,主要從數(shù)據(jù)資產的分類、使用頻次、使用對象、使用效果等方面計量。數(shù)據(jù)價值管理可以實現(xiàn)數(shù)據(jù)成本的有效控制,優(yōu)化數(shù)據(jù)服務方式,提高數(shù)據(jù)應用價值。
以上各個環(huán)節(jié)之間環(huán)環(huán)相扣,只有緊密協(xié)同才能發(fā)揮更大作用。完善的數(shù)據(jù)治理體系幫助金融機構找準高質量數(shù)據(jù)、深挖高價值數(shù)據(jù),最終實現(xiàn)數(shù)據(jù)資產效益最大化的目標,解決金融機構的數(shù)據(jù)治理之“困”。
軟件定義存儲助力數(shù)據(jù)治理體系建設
為構建數(shù)據(jù)治理體系,金融機構不僅要結合業(yè)務需求合理規(guī)劃,更要依托信息技術梳理數(shù)據(jù)內容、安全存儲數(shù)據(jù)、高效利用數(shù)據(jù),存儲系統(tǒng)必然是重要支撐。
現(xiàn)階段,多數(shù)金融機構傾向于通過搭建數(shù)據(jù)湖(Data Lake)來存儲包括結構化、半結構化、非結構化數(shù)據(jù)在內的數(shù)據(jù)資源,以供上層調用。這樣一來,軟件定義存儲(Software Defined Storage,簡稱SDS)在金融機構數(shù)據(jù)治理體系中,無疑扮演著重要角色。那么,什么是軟件定義存儲?軟件定義存儲、數(shù)據(jù)湖、數(shù)據(jù)治理之間有何關系呢?
本質上,軟件定義存儲是提供存儲功能和特性的軟件,它將數(shù)據(jù)從硬件架構上解放出來,使用戶專注于數(shù)據(jù)蘊含的價值。軟件定義存儲通過統(tǒng)一的虛擬管理平臺,與前端應用、管理程序、物理空間進行交互,極大簡化數(shù)據(jù)管理。數(shù)據(jù)湖是以自然格式存儲的數(shù)據(jù)的系統(tǒng),一般包括結構化數(shù)據(jù)、半結構化數(shù)據(jù)、非結構化數(shù)據(jù)和二進制數(shù)據(jù)等全部原始數(shù)據(jù)資源。簡而言之,要實現(xiàn)數(shù)據(jù)存儲和管理的優(yōu)化,基于軟件定義存儲搭建統(tǒng)一數(shù)據(jù)湖無疑是極佳的選擇。
圖1:基于SDS的數(shù)據(jù)管理架構圖
軟件定義存儲以分布式架構、彈性擴展、海量數(shù)據(jù)支撐、管理運維簡單等優(yōu)勢,幫助金融機構搭建穩(wěn)定可靠的數(shù)據(jù)平臺,輕松實現(xiàn)海量數(shù)據(jù)的存儲和管理,依靠AI后處理框架挖掘數(shù)據(jù)價值,成為金融機構治理數(shù)據(jù)的好幫手。主要體現(xiàn)在以下幾個方面:
優(yōu)勢一、解決海量存儲需求
針對金融機構缺乏統(tǒng)一數(shù)據(jù)視圖、存在數(shù)據(jù)孤島等問題,軟件定義存儲因其抽象化、池化等特性,從根本上解決了這類問題。軟硬件解耦使得存儲軟件不再依賴于專有硬件;通過虛擬化,將物理存儲空間虛擬成統(tǒng)一資源池,建立統(tǒng)一命名空間,構建多業(yè)務共享的數(shù)據(jù)湖;
其全分布式架構,彈性擴展靈活,支撐EB級容量,滿足金融機構對容量、性能等需求。
優(yōu)勢二:解決智能管理需求
軟件定義存儲提供豐富的API,根據(jù)業(yè)務應用要求,自動按需部署存儲資源,實現(xiàn)基于存儲策略的自動化管理目標,極大地簡化管理,節(jié)省基礎設施投入,降低運維成本。其自定義管理的策略,實現(xiàn)生命周期自動化管理;通過智能緩存、數(shù)據(jù)分層等特性,讓存儲介質“物盡其用”,在數(shù)據(jù)訪問性能和存儲成本之間實現(xiàn)平衡。
優(yōu)勢三:解決釋放數(shù)據(jù)價值需求
伴隨AI技術的興起,數(shù)據(jù)治理開始向“智能化”轉變。與傳統(tǒng)存儲不同,軟件定義存儲能夠實現(xiàn)內容感知,配合前端應用對海量數(shù)據(jù)進行大數(shù)據(jù)分析和價值挖掘。以杉巖數(shù)據(jù)為例,其對象存儲產品中集成了AI后處理框架,支持包括OCR識別/人臉識別、語音識別等AI插件,幫助金融客戶更好的實現(xiàn)AI賦能和價值挖掘;同時還支持 Hadoop、Spark等大數(shù)據(jù)分析系統(tǒng),充分釋放數(shù)據(jù)價值。
面對諸多難題,軟件定義存儲幫助金融機構打造智能化的數(shù)據(jù)治理平臺,解決數(shù)據(jù)的存儲、管理、共享等一系列問題,極大地提升數(shù)據(jù)治理水平,為數(shù)字化轉型提供有力支撐。
數(shù)據(jù)中臺解決方案助推金融機構數(shù)字化轉型
在金融機構數(shù)字化轉型中,每家機構業(yè)務基礎不同、戰(zhàn)略重點不同,數(shù)字化轉型中是不能套用一套模板的,需結合宏觀架構和具體應用場景進而深入融合,才能助力金融機構在全面數(shù)字化轉型中夯實“科技+開放”能力,與金融機構共建數(shù)字金融快車道,提升金融服務實體產業(yè)的質效。金融非結構化數(shù)據(jù)中臺解決方案就是這樣一個代表性的方案。
圖2:金融非結構化數(shù)據(jù)中臺解決方案拓撲圖
數(shù)據(jù)中臺解決方案,以軟件定義存儲作為能力后臺,為數(shù)據(jù)中臺提供存儲支撐。基于分布式架構搭建統(tǒng)一存儲池;通過生命周期管理、智能QoS等實現(xiàn)自動化管理;集成AI后處理框架,整合金融機構的 AI 能力,將數(shù)據(jù)價值最大化釋放,為金融機構提供數(shù)據(jù)治理的技術支撐。
數(shù)據(jù)中臺解決方案能夠幫助金融機構解決數(shù)據(jù)孤島、實現(xiàn)數(shù)據(jù)有序治理和高效利用。
一.實現(xiàn)能力平臺化,使數(shù)據(jù)的存儲、共享趨于服務化。面對需求變化,快速響應開發(fā),通過數(shù)據(jù)與應用深度融合實現(xiàn)一次處理、多處應用,避免重復開發(fā)帶來的效率損失。
二.解決數(shù)據(jù)孤島問題。可實現(xiàn)跨業(yè)務檢索、數(shù)據(jù)共享更加便捷,便于數(shù)據(jù)整合分析。解決業(yè)務性能彈性擴展,輕松支撐EB級容量、百億文件高并發(fā)訪問。
三.實現(xiàn)統(tǒng)一的基礎設施資源管控,讓數(shù)據(jù)治理更加場景化、模式化、體系化、標準化。統(tǒng)一的數(shù)據(jù)管理,保障數(shù)據(jù)完整性、準確性和一致性,減少重復收集造成的資源浪費和數(shù)據(jù)冗余。數(shù)據(jù)的規(guī)范共享,提升數(shù)據(jù)利用效率和應用水平,實現(xiàn)數(shù)據(jù)多向賦能。
金融科技蓬勃發(fā)展,金融業(yè)正處于以科技賦能實現(xiàn)發(fā)展、大變革的關鍵時期。數(shù)據(jù)作為戰(zhàn)略資源,加快數(shù)據(jù)治理進程、完善數(shù)據(jù)治理體系已經成為金融機構的重要工作。數(shù)據(jù)治理的核心環(huán)節(jié)是數(shù)據(jù)應用,要從算力、存儲、網絡等維度加強技術支撐,切實增強數(shù)據(jù)應用能力。對存儲而言,探索、交叉融合、數(shù)據(jù)安全等數(shù)據(jù)存儲方案是穩(wěn)步推動分布式數(shù)據(jù)庫金融應用的基石,實現(xiàn)數(shù)據(jù)高效存儲和智能管理是目標。
在金融科技驅動的數(shù)字化轉型進程中,一些金融機構已取得突破,如:中國金融認證中心、廣發(fā)證券、中國人民保險、招行信諾等,基于數(shù)據(jù)驅動業(yè)務發(fā)展需求,采用數(shù)據(jù)中臺解決方案,提升了一站式技術能力、統(tǒng)一數(shù)據(jù)管理能力、快速配置開發(fā)業(yè)務能力,通過數(shù)字化轉型帶來了數(shù)據(jù)融合和技術融合,滿足了數(shù)據(jù)中臺的建設需求。
金融業(yè)的數(shù)字化轉型的快速發(fā)展,離不開像華為、杉巖數(shù)據(jù)等云計算企業(yè),大家深刻認識數(shù)據(jù)資源對金融業(yè)數(shù)字化轉型的重要意義,切實助力金融業(yè)把數(shù)據(jù)存儲、管理、應用做到按需規(guī)劃,推動金融業(yè)向數(shù)字化的落地。國產自主研發(fā)的軟件定義存儲作為數(shù)據(jù)存儲+數(shù)據(jù)共享的平臺,為金融業(yè)提供了更快的性能、更高的靈活性和開放性、更強的擴展性,實現(xiàn)更便捷的管理、更簡單的運維以及更少的投入,幫助金融機構“數(shù)據(jù)治理”駛入快車道。
評論