動態數據倉庫的商務智慧型系統分析論文

從軟體系統套用角度看是數據倉庫、在線上分析處理、數據挖掘等技術方法和工具在商業活動中的集中套用。其工作原理是從企業各類數據源收集數據,經過抽取(extract)、轉化(transform)、載入(load),送入數據倉庫,使用數據查詢分析工具、數據挖掘工具和在線上分析處理工具對信息進行處理,並以定製的動態報表實時展示,從而將信息轉變為輔助決策的知識,最終呈現給用戶。商務智慧型軟體的功能有:多維數據分析及展現、報表工具、趨勢分析、可視化工具、數據挖掘等。

在滿足商務智慧型各基本功能的前提下,企業對如何保證獲取和分析數據的實時性更為關注。即:數據抽取、轉換、載入、集成的實時性和分析,以對決策提供實時支持。

動態數據倉庫是對傳統數據倉庫的延伸和擴展,通過動態數據載入,動態事件驅動和動態數據訪問,對不同用戶群體(管理層、分析師、業務員)進行分門別類的決策支持,將原來後台的商務智慧型推向前端,使實時商務智慧型[2]成為可能。

數據倉庫作為商務智慧型的重要依託,是對“海量數據”、“大數據”進行分析處理的核心物理架構。藉助數據倉庫技術,可以將來自於不同數據源平台 (如crm、scm、erp、oa以及企業外部的系統和零散數據)格式不一的數據處理成語義格式一致的多源數據進行存儲。以往數據倉庫很強調海量,但隨著商業機會出現的周期越來越短,只有少數行業壟斷企業憑藉海量數據獲得商業智慧型素材,對於大多數企業而言必須快速地掌握信息變化,即便是小量、甚至個別的信息也有商機可挖。由此可見,更快的動態數據日益成為今後的主流。相比傳統數據倉庫,動態數據倉庫強調數據的及時性和同步,其實質是將數據倉庫和一個運作數據存儲結合起來,以便對數據同時更新,並從同一個中央倉庫中獲得時間敏感性數據和詳細歷史數據。

動態數據倉庫關鍵是動態載入數據,也就是數據倉庫的etl過程。etl是將業務系統的數據源按一定順序進行採集,然後按照數據存儲結構進行合理的轉換,並將源數據中出現的二義性、重複、不完整、違反業務或邏輯規則等問題統一進行處理,最後按照數據倉庫的結構進行數據載入,也就是常說得數據抽取、轉化、裝載。這一過程實現了多種類、多平台數據源的整合,解決數據在時間、不穩定性、依賴性等方面的差異,保證數據一致性,達到正確理解數據業務含義的目的,這也是etl技術核心所在。數據的實時載入有多種方法,早期有短時間間隔內批量數據抽取盒利用eai訊息佇列的數據傳輸,後有利用soa框架和xml 統一數據格式解決數據與數據源的實時同步問題[34]。