當前位置:係統粉 >   IT資訊 >   微軟資訊 >  微軟BI SSAS漸悟之構建數據倉庫五步法

微軟BI SSAS漸悟之構建數據倉庫五步法

時間:2017-04-04 來源:互聯網 瀏覽量:

每日幹貨好文分享丨請點擊+關注

歡迎關注天善智能微信公眾號,我們是專注於商業智能BI,大數據,數據分析領域的垂直社區。

對商業智能BI、大數據分析挖掘、機器學習,python,R等數據領域感興趣的同學加微信:tstoutiao,邀請你進入頭條數據愛好者交流群,數據愛好者們都在這兒。

一、確定主題

即確定數據分析或前端展現的主題。(以汽車行業的KPI管理分析係統為例)

例如:我們希望分析某年某月某區域某門店銷售情況,這就是一個主題。

主題要體現出某一方麵的各分析角度(維度)和統計數值型數據(量度)之間的關係,確定主題時要綜合考慮。統計數值型數據(量度)存在於中間的事實表;分析角度是各個維度;我們將通過維度的組合,來考察量度。

那麼,“某年某月某某一地區某一門店的銷售情況”這樣一個主題,就要求我們通過時間、地區和門店三個維度組合,來考察銷售情況這個量度。

從而,不同的主題來源於數據倉庫中的不同子集,我們可以稱之為數據集市。數據集市體現了數據倉庫某一方麵的信息,多個數據集市構成了數據倉庫。

二、確定量度

在確定了主題以後,我們將考慮要分析的技術指標,諸如:年銷售額之類。它們一般為數值型數據。

我們或者將該數據彙總,或者將該數據取次數、獨立次數或取最大值最小值等,這樣的數據稱為量度。量度是要統計的指標,必須事先選擇恰當,基於不同的量度可以進行複雜關鍵性能指標(KPI)等的設計和計算。

三、確定事實數據粒度

在確定了量度之後,我們要考慮到該量度的彙總和不同維度下量度的聚合情況。考慮到量度的聚合程度不同,我們將采用“最小粒度原則”,即將量度的粒度設置到最小。

例如:假設目前的數據最小記錄到月,即數據庫中記錄了每月的交易額。

那麼,如果我們可以確認,在將來的分析需求中,交易額隻需要精確到月就可以的話,我們就可以在ETL處理過程中,按月為單位來彙總銷售數據,此時,數據倉庫中量度的粒度就是“月”;反過來如果我們不能確認將來的分析需求在銷售額上是否需要精確到月,那麼,我們就需要遵循“最小粒度原則”,在數據倉庫的事實表中保留每日的銷售數據,以便日後對“天”進行分析。

舉例:汽車行業KPI分析係統中,需求變更要求以天為單位分析門店的銷售情況。

四、確定維度

1、如何理解維度?及維度的層次(Hierarchy)和級別(Level)

a、維度是指分析的各個角度。例如我們希望按照時間,或者按照地區,或者按照門店名稱進行分析,那麼這裏的時間、地區、門店就是相應的維度。基於不同的維度,我們可以看到各量度的彙總情況,也可以基於所有的維度進行交叉分析。

b、維度的層次(Hierarchy)和級別(Level)

層次:時間維表結構為例,年-半年-季度-月-半月-旬-周-日

級別:門店維表結構為例,門店集團分類、門店類型分類等等

2、什麼是緩慢變化維度?

維度表隨時間變化的問題,我們稱其為緩慢變化維度。

以客戶維度表結構為例,每月所屬有限公司發生變化,客戶代碼、客戶標識、源客戶標識、客戶全稱、分公司編號、分公司名稱、曆史標識(T/F)等變化。

五、創建事實表

a、了解

在確定好事實數據和維度後,我們將考慮加載事實表。

事實表裝有企業的度量數據,度量以及事實表才是最終用戶真正想要看的內容,維表是事實表數據的入口,事實隻有通過維度解釋才會變得有意義

b、如何創建?

做法:將原始表(OLTP)與維度表進行關聯,生成事實表

注意點:在關聯時有為空的數據時(數據源髒),需要使用外連接,連接後我們將各維度的代理鍵取出放於事實表中,事實表除了各維度代理鍵外,還有各量度數據,這將來自原始表,事實表中將存在維度代理鍵和各量度,而不應用存在描述性信息,即符合“瘦高原則”,即要求事實表數據條數盡量多(粒度最小),而描述性信息盡量少。

事實數據表是數據倉庫的核心,需要精心維護,在JOIN後將得到事實數據表,一般記錄條數都比較大,我們需要為其設置複合主鍵和索引,以實現數據的完整性和基於數據倉庫的查詢性能優化。事實數據表與維度表一起放於數據倉庫中,如果前端需要連接數據倉庫進行查詢,我們還需要建立一些相關的中間彙總表或物化視圖,以方便查詢。

天善學院微軟BI課程精華推薦:

微軟BI SSIS 2012 ETL 控件與案例精講、

SSRS 2012 Metro UI 高端報表視頻教程【全國首家】

鏈接:https://edu.hellobi.com/course/15

微軟BI SSAS漸悟之構建數據倉庫五步法(1)

對商業智能BI、大數據分析挖掘、機器學習,python,R等數據領域感興趣同學加微信:tstoutiao,邀請您加入頭條數據愛好者交流群,數據愛好者們都在這兒。

微軟BI SSAS漸悟之構建數據倉庫五步法(2)

本文來源自天善社區悟的博客。

原文鏈接:https://www.hellobi.com/u/lovezsr 。

我要分享:

最新熱門遊戲

版權信息

Copyright @ 2011 係統粉 版權聲明 最新發布內容 網站導航