8.1 數(shù)據(jù)生命周期管理及意義
數(shù)據(jù)的生命周期管理最初是由美國的存儲技術公司StorageTek提出來的,經過這些年的發(fā)展和宣傳,目前逐漸開始進入市場化階段。數(shù)據(jù)的生命周期管理作為一項企業(yè)信息化戰(zhàn)略,是一項相對長期的工作。
早期銀行的金融產品較少,主要以存貸匯為主,而且數(shù)據(jù)以省(市)為單位分布存放,數(shù)據(jù)量相對較少。此外,由于還沒有數(shù)據(jù)集中挖掘與分析的需求,日常處理對象主要是短期數(shù)據(jù),時間跨度小,處理的數(shù)據(jù)規(guī)模相對可控。但是,隨著各家銀行的數(shù)據(jù)大集中以及業(yè)務的快速發(fā)展,客戶群體越來越大,客戶發(fā)生的交易行為也越來越頻繁,尤其是在大數(shù)據(jù)、互聯(lián)網金融時代,銀行業(yè)集中存放和處理的數(shù)據(jù)量急劇增加,有些銀行的數(shù)據(jù)容量甚至達到了PB級。有種說法是:“今天一個現(xiàn)代人一天所吸收的信息,比莎士比亞一生所獲得的信息還要多。”由此可見,當今社會信息量是呈爆發(fā)式增長的。對銀行來說,一方面數(shù)據(jù)成為銀行的重要資產,對于分析客戶行為、評價客戶信用、提升營銷精準度等方面都起到了重要的作用;但是,另一方面日益增大的數(shù)據(jù)量對系統(tǒng)存儲、訪問效率造成越來越大的壓力。因此,必須權衡效率和需求之間的關系,合理保留數(shù)據(jù)。
正常情況下,數(shù)據(jù)生成時間越長,其獲得的訪問頻率則越低。但是,數(shù)據(jù)總量越來越大,如果將不活躍的數(shù)據(jù)進行遷移,則可以降低企業(yè)的擁有成本。
數(shù)據(jù)生命周期中數(shù)據(jù)生成時間、數(shù)據(jù)訪問頻率、數(shù)據(jù)總量等參數(shù)間的關系如圖8-1所示。
倘若不對數(shù)據(jù)進行有效的數(shù)據(jù)生命周期管理,則會出現(xiàn)系統(tǒng)問題。例如,數(shù)據(jù)增長過快導致的系統(tǒng)資源浪費;又如,表數(shù)據(jù)量過大導致訪問效率過慢等情況。以某商業(yè)銀行為例,早期因為沒有進行勢據(jù)生命周期管理,出現(xiàn)了各種問題,極大地影響了系統(tǒng)服務效率和客戶服務水平。從以下兩個例子可以看出數(shù)據(jù)生命周期管理的重要性。