什麼是商業智能(BI),就看這篇文章足夠瞭

01、什麼是商業智能BI?

商業智能BI – 派可數據商業智能BI可視化分析平臺

首先要瞭解什麼是商業智能BI( Business Intelligence )?百度商業智能BI有很多很多官方的定義,各種解釋,實際上從這麼多年的經驗出發,對商業智能BI的定義我認為不需要弄得很復雜,就三條:

第一,商業智能BI是一套完整的由數據倉庫、查詢報表、數據分析等組成的數據類技術解決方案。

第二,商業智能BI可以將企業不同業務系統( ERP、OA、CRM 等 )中的數據進行打通並進行有效的整合。這個打通和整合就包括瞭:ETL 過程、取數、業務邏輯規則像數據規則的轉變、數據倉庫建模等。

第三,商業智能BI最終利用合適的查詢和分析工具快速準確的提供可視化分析或報表,為企業提供決策支持。

商業智能BI – 派可數據商業智能BI可視化分析平臺

商業智能BI需要講解的那麼高大上嗎? 不需要,其實簡單就看三層:

第一層,可視化分析展現層 – 即商業智能BI的需求層,代表用戶的需求,用戶要看什麼,要分析什麼就在這一層進行展現。

第二層,數據模型層 – 即商業智能BI的數據倉庫層,代表數據的分析模型,完成從業務計算規則向數據計算規則的轉變。

第三層,數據源層 – 即商業智能BI的數據層,各個業務系統底層數據庫的數據通過 ETL 的方式抽取到 商業智能BI 的數據倉庫中完成 ETL 過程,建模分析等等,最終支撐到前端的可視化分析展現。

02、商業智能BI在企業IT信息化中的位置

這一點是所有企業如果規劃要上商業智能BI項目的時候必須弄明白的:商業智能BI在IT信息化中到底處於一個什麼樣的位置?弄清楚定位是信息化規劃建設的重要前提。

通常情況下,我們會在規劃商業智能BI項目前,把企業的 IT 信息化分為兩個階段:一個是業務信息化,一個是數據信息化。這樣對比講,一般的用戶更容易理解一些。

企業信息化 – 派可數據商業智能BI可視化分析平臺

業務信息化 – 企業使用的 ERP、CRM、OA、MES、自建的業務系統等,業務系統的建設都統稱為業務信息化。業務信息化的主要作用是管理企業的業務流程,標準化、線上化,以提高生產運營效率、降低企業成本、為商業智能BI的建設打下數據基礎、是業務管理思路的體現,也是現代的企業管理方式。

數據信息化 – 像我們經常所聽到的大數據、商業智能 BI 、數據分析、數據挖掘等我們都統稱為數據信息化。數據信息化可以幫助企業全面的瞭解企業的經營管理,從經驗驅動到數據驅動,形成業務決策支撐,以提高決策的準確性,這是企業更高層次的企業管理方式。

沒有業務系統的建設,就不會有數據的沉淀,就沒有建設商業智能 BI 的基礎。同時,商業智能 BI 的建設能夠反向推動業務信息化的建設。

企業信息化 – 派可數據商業智能BI可視化分析平臺

業務信息化的主要使用形式 – 表單式的、以業務用戶錄入為主的、數據的增刪改操作居多,是對業務過程數據、業務流程進行管理的軟件系統。

數據信息化的主要使用形式 – 例如商業智能BI主要是對業務結果數據進行整體分析呈現和局部洞察,旨在打通各類業務系統的數據,跨業務、跨系統整合數據。以數據查詢和分析為主,通過聯動、鉆取、關聯等圖表可視化的方式來看數據指標。

03、誰是商業智能BI的主要用戶?

商業智能BI – 派可數據商業智能BI可視化分析平臺

業務信息化的主要使用對象 – 一線業務執行層,更多是從業務視角出發,錄入數據、記錄流程、查看業務信息。

數據信息化的主要使用對象 – 管理決策層,更多的是從管理視角通過商業智能BI可視化分析去定位問題、分析問題,最終形成業務決策。

兩個細節要點:

第一,沒有任何一個管理決策層、領導會沒事打開財務系統看財務數據,打開 OA 系統看看合同信息,高層領導不會看這些明細數據細節,也不會進到各個系統裡面去看。也就是說,業務信息化不是給這一層領導來使用的。

第二,管理決策層是不是一定是指的企業最高層的領導,不見得,可以是企業各個組織層次中帶有管理決策屬性的人員,這些管理決策人員都可以通過商業智能BI提供決策支持。

04、數據孤島到底說明瞭什麼?

消滅數據孤島為什麼就一定要用商業智能BI,誰要求要消滅數據孤島的?業務部門會覺得有數據孤島的問題嗎?我就用我的財務系統做賬,數據孤島就孤島唄,我喜歡孤島,我的財務數據就我們自己看,領導看,我一點都不孤島。我就管個庫存,數據孤島就孤島唄,我也用不著管其他的,我的報表夠看就可以,孤島跟我有什麼關系?

所以,我們在講商業智能BI,講數據孤島的時候不是給一線業務部門講的,而應該是給跨業務、跨部門、跨組織的這些管理層講的,隻有從他們的視角裡,這些業務系統和數據才是真正的孤島。

商業智能BI – 派可數據商業智能BI可視化分析平臺

深層次的原因是什麼?深層次的原因就是:這些業務信息化系統並不是為管理層服務的,是為一線業務部門服務的。管理層不是這些業務系統的用戶,他們絕對不會沒事一個系統一個系統的登錄進去看數據,他們沒有這種使用習慣,他們更不會關註到各個業務系統的微觀層面。所以,大多數情況下隻有這些跨組織、跨業務的管理層才會認為有數據孤島的存在,所以是他們要求解決數據孤島。

由於商業智能BI是天然解決數據孤島問題的,所以商業智能BI是為誰服務的,是為管理層服務的數據信息化系統。商業智能BI要打破數據孤島,全面的看數據,全面的管業務,商業智能BI就是業務管理視角的自然延伸,要廣度、要深度。

管理駕駛艙 – 派可數據商業智能BI可視化分析平臺

所以,站在不同的角度,有的人認為是有數據孤島存在的,一定要解決。有的人是不認為有數據孤島存在的,即使存在對他們也沒有影響,所以不用解決,其根本原因是沒有把握商業智能BI真正的服務對象。

通過數據孤島,我們能夠把一些問題看的更加清楚一些。

05、商業智能BI從業務系統取數據取數的方式

商業智能BI不是像業務系統與業務系統之間的接口開發取數方式,而是通過訪問和連接業務系統數據源數據庫的方式來進行取數的,不管是什麼樣類型的數據庫,商業智能BI通過ETL連接方式連接數據庫抽取業務系統原表數據到數據倉庫中加工處理,最後支撐到前端的可視化分析報表展現。

商業智能BI – 派可數據商業智能BI可視化分析平臺

之前有朋友這麼提問的:數據源層是需要開發接口嗎?

這是回答:

除非一種情況,這個業務系統是公有雲,純 SAAS 模式,這種情況下就隻能通過軟件對外開放的 API 接口取數瞭。

某建築行業集團看板 – 派可數據商業智能BI可視化分析平臺某汽車行業售後業務分析 – 派可數據商業智能BI可視化分析平臺

06、數據中臺、商業智能BI、大數據之間的關系應該如何理解?

大傢在瞭解商業智能BI的時候,不可避免的會瞭解到大數據,數據中臺等一些概念,如何正確理解他們之間的差別呢?大數據、數據中臺都是商業智能BI發展到一定階段的產物,核心都是圍繞數據,數據采集、數據處理能力、算力的提升催生瞭大數據,數據資產和數據服務催生瞭數據中臺,核心的數倉建模自 商業智能BI 一脈相承未曾改變,最終出口還是 商業智能BI 可視化,所以商業智能BI的位置處於整個信息化建設的最頂端。

07、關於商業智能 BI 認知上的幾大誤區

關於商業智能BI的介紹,網絡上有太多的雜音,總而言之會把商業智能BI講解的貌似很簡單,感覺上買瞭一個工具就可以解決所有的問題,這其實是一個非常大的誤區。

商業智能BI – 派可數據商業智能BI可視化分析平臺

我這裡總結瞭一下,大傢對商業智能 BI 的理解常會碰到的一些誤區:

1.商業智能 BI 就是報表可視化,就是一堆可視化圖表,商業智能BI 就是前端可視化。

2.商業智能BI就是一個拖拉拽的分析工具產品。

3.商業智能BI就是商業智能BI,跟數據倉庫沒有關系。

4.有瞭商業智能BI就不需要數據倉庫建模,業務人員就可以自己做商業智能BI分析,就可以拖拉拽做商業智能BI分析。

5.商業智能BI 就是業務驅動的,不需要 IT 人員支撐,敏捷商業智能BI不需要 IT 介入。

6.商業智能BI直連不香嗎?直接連接數據源不就可以做分析,不需要數據倉庫。

首先簡要糾正一下對於這些問題的理解。

1.商業智能 BI 就是報表可視化,就是一堆可視化圖表,BI 就是前端可視化。

商業智能 BI 是一套完整的有數據倉庫、數據分析、數據報表等組成的數據技術類的解決方案,在一個 BI 項目中,20% 的時間做前端分析報表,80% 的時間都在底層數據倉庫的設計、ETL 的開發、取數開發等工作。

所以可視化報表隻是商業智能 BI 的最終呈現,但不是 商業智能BI 的全部。

2.商業智能 BI 就是一個拖拉拽的分析工具產品。

拖拉拽的可視化分析工具準確來講隻能解決 商業智能BI 的一部分,即可視化分析。但其實 商業智能BI 所包括的技術范圍還是比較廣的,涉及到從底層數據取數到前端展現分析的各個方面。以微軟為例,早在 SQL Server 2005 的時候就可以看到完整的 Integration Service( SSIS )、Reporting Service ( SSRS )、Analysis Service ( SSAS ),這三個服務加上 SQL Server 自身構成瞭微軟的商業智能 BI 解決方案。( SQL Server 2000 的 DTS 不知道還有多少人記得 )Reporting – 可視化展現隻是 商業智能BI 解決方案的一部分。

SSIS 是解決什麼的 – ETL 工具,Extraction 抽取 – Transformation 轉換 – Loading 加載,做整個 ETL 的可視化設計、包的管理、ETL 包調度管理,包含瞭 Package – Control Flow – Data Flow 做整個數據抽取的管理。數據倉庫 DW 的分層設計,例如 ODS / Staging 層、Dimension 層、Fact 層( 從 DW 到 DM )層的邏輯表數據抽取也都是可以放到 SSIS 中完成的。

我之前就是微軟 商業智能BI 技術線的,早些年的時候積累過不少的 商業智能BI 技術博客 – BIWORK 的技術博客

SSRS 是解決什麼的 – Reporting 報表展現,當初的報表展現比較薄弱。在 2012 Windows 8 Metro UI 設計剛出來的時候,我們在 SSRS 中借鑒瞭 Metro UI 的樣式,算是比較前衛和驚艷的瞭。

客觀來講,很多國內外報表工具都借鑒過 SSRS 的數據集模式( 寫一條 SQL 查詢或者存儲過程返回一個查詢的結果綁定到一個數據集 Dataset 中,圖表與數據集綁定,圖表的字段引用自數據集 ),但這種方式也有它的限制使用場景或者使用前提,後面會陸續講到這個問題。

SSAS 是解決什麼的 – 空間換時間的多維分析實現,OLAP、CUBE 立方體。例如在分析報表中多個維度 ( Dimension ) 可以和多個度量( Measure ) 組合,以時間、區域、產品三個維度和銷售收入這個度量為例子,在用戶打開一個報表,根據報表的字段可能組合的查詢就是:

有可能是這樣的一個查詢

當底層數據表數據量過大、聚合查詢和復雜,各種維度和事實度量組合的 SQL 查詢大量的發往數據倉庫查詢,這種查詢效率可能會變得非常的差,因為數據查詢 SQL 本身就可能需要執行很長時間,還不算返回到前端報表的中間數據傳輸過程、前端報表的渲染時間等等,所以通過 SSAS 實現一個 CUBE 立方體,本質就是相當於把各種維度和度量的這種聚合查詢( 各種聚合函數,可以選擇 ) SQL 給提前執行瞭,最後將各種維度和度量 SQL 查詢的值提前存儲起來。前端報表連接到 CUBE 中直接使用預計算好的值就可以瞭,而不再需要通過 SQL 到數據倉庫層查詢,這就是空間換時間的原理。

講到這裡說明瞭一個什麼問題,就是一套完整的 商業智能BI 實際上包括的有很多東西,有底層數據處理的 ETL 過程,也有前端可視化分析報表的。

在 ETL 工具層面:微軟 SSIS、Informatica、IBM DataStage、Pentaho、Kettle、DataWatch 等等。

在 報表 Reporting 工具層面:早期的微軟 SSRS、IBM Cognos、Oracle BIEE、SAP BO 等等。

單純的拖拉拽的 BI 可視化分析工具嚴格來講隻能定位於個人和部門級的 商業智能BI 分析工具,因為單純的上一個 商業智能BI 分析工具解決不瞭 商業智能BI 的全部,也代替不瞭 商業智能BI 的全部。

3.以前也總有人說商業智能BI就是業務驅動,商業智能BI就是 BI,跟數據倉庫沒有關系。

有瞭 商業智能BI 就不需要數據倉庫建模,業務人員就可以自己做 商業智能BI 分析,就可以拖拉拽做 商業智能BI 分析,,不需要 IT 人員支撐,敏捷 商業智能BI 不需要 IT 介入,不需要建數據倉庫,我以前有段時間也是這麼認為的。但是再沉淀瞭一段時間,對這種方法論進行過一段時間的追蹤,最後發現其實是存在很大問題的。

管理駕駛艙大屏 – 派可數據商業智能BI可視化分析平臺

但凡有任何 商業智能BI 的銷售或者售前告訴用戶,你們企業的 商業智能BI 項目不需要構建數據倉庫,直接通過 商業智能BI 分析工具拖拉拽就可以搞定企業裡面所有的分析,不需要 IT 人員支撐,業務人員完全可以自己搞定… 類似於敢這樣承諾的,要麼是對 商業智能BI 不懂,要麼就是真忽悠。

在企業級的 商業智能BI 項目建設中,真正能做到完全靠業務人員簡單拖拉拽一些就能隨便實現數據可視化分析,至少在我個人從業的十幾年工作經驗中,95%以上的企業都做不到。我服務過的重點企業包括:SHP( Security Health Plan )、微軟(中國)、微軟(美國)、VWFC( 大眾金融 )等。

VWFC 做的算是非常不錯的,少有的業務人員自己動手做很多報表,線上跑瞭幾千張報表。為什麼? 因為底層數據倉庫就搭建瞭很多年,底層數據架構相對比較規范。Business Driven 業務驅動,它的前提是什麼?

1) 底層數據質量很規范,數據倉庫架構很完整,不讓業務人員碰底層數據,ETL、取數、指標計算等等統統都是 IT 部門來維護。

2) 業務人員通過培訓要熟練掌握商業智能BI前端報表工具的使用,要很懂放出來的數據分析模型接口。

3) 業務人員要非常熟悉業務和數據。

第 2)和第 3)條很多企業沒有問題,第 1)條直接弄個前端 商業智能BI 工具讓業務人員解決,能解決掉嗎? 很顯然業務人員是不具備這種能力的。

這就是一到培訓的時候,商業智能BI工具使用起來很簡單,但是一旦到實際的企業 商業智能BI 項目開發就發現寸步難行。因為培訓的時候,給出的數據表都是經過選擇的,永遠都是質量很高的、規范的隻需要簡單左表連右表例如銷售訂單表、訂單明細表,自然很容易把可視化報表給實現出來。

數據可視化 – 派可數據商業智能BI可視化分析平臺

但是在實際企業 商業智能BI 項目分析中,分析指標的計算規則絕非簡單幾張表關聯就可以解決的,不信的話可以挑戰一下一個實際的指標計算邏輯:挑戰一個 ETL 數據清洗的小案例 在數據庫中就一張數據表,數據理解起來也很簡單,但很多 商業智能BI 開發人員做起來也需要廢很大的精力,就更別談業務人員自助 商業智能BI 分析瞭。

講這麼多不是為瞭一味否定自助式 商業智能BI 它的作用和能力,自助式 商業智能BI 有它的使用場景,也確實幫助我們簡化瞭很多的 BI 工作,但從專業角度出發,特別反感是部分商業智能BI 廠商以一種不負責任的方式反復向市場強化類似於這樣的概念:商業智能BI 就是可視化報表、商業智能BI 不需要數據倉庫建模、傳統數據倉庫建模很落後、商業智能BI 就是自助分析、商業智能BI 自助分析很簡單、業務用戶簡單幾天培訓就可以學會並且想怎麼分析就怎麼分析…

從市場宣傳和銷售的角度來說,簡化產品的復雜度和上手難度的宣傳是沒有問題的,有問題的是以一種錯誤的講解、不專業的講解最終誤導企業接受瞭這些不正確的概念,並以這些不正確的概念來評估與規劃 商業智能BI 項目的建設,沒有充分預計到 商業智能BI 項目建設過程中可能會遇到的挑戰與風險,最後導致項目的不成功與失敗、反復建設。

我們在北京就有一個客戶之前花瞭一百多萬上瞭一套所謂的 商業智能BI 項目,項目上線瞭一年左右,到最後完全推不動,失敗瞭。後續找到派可數據,我們給他們上瞭派可數據商業智能BI分析平臺,這個項目我們連續做瞭好幾期,客戶還寫瞭感謝信。之前為什麼推不動、項目會失敗:不重視數據倉庫的規劃。因為他們的業務是連續的、變動的,每年的需求都是需要動態調整的,數據持續增加,分析的深度和廣度都是在不斷變化,沒有一個好的底層數據架構來支撐,光靠 SQL 取數、建數據集出報表的形式是不可能支撐一傢企業未來 3-5 年甚至更長遠的業務分析需求變化的。

除瞭這個案例之外,在我的手機上有很多之前上過 商業智能BI 最終失敗、沒有做好,找過來聊天吐槽的記錄,是真的產品不好嗎?我也客觀的幫助他們分析過:這些產品本身有的是 Gartner 魔力現象 Leader 象限的產品,你說產品行不行? 有的產品是國內商業智能 BI 領域很多年的老品牌,你說產品行不行? 客觀來講,這些產品從我個人角度來說,這些產品其實都很優秀,產品本身是沒有太大問題的。

問題在於,這麼多從零到一需要上 商業智能BI 的企業不知道一個 商業智能BI 項目中原來還有那麼多坑,很多 商業智能BI 廠商會不會去把這些點給企業客戶講清楚,一個 商業智能BI 項目到底怎麼幹、中間有什麼樣的風險、以後還會遇到什麼樣的問題、應該怎麼解決這些問題、有什麼樣的方法論和手段… 如果隻是為瞭賣一套 商業智能BI 產品或者工具,你覺得這些 商業智能BI 銷售會跟客戶講這些東西嗎? 不會的,至少不會講的太深太全,因為這麼一講把 商業智能BI 難度講太復雜瞭,一旦沒有講好,反而降低瞭客戶的信任。

有的時候不講,是因為怕講復雜瞭,讓企業客戶決策周期拉的太長瞭。有的時候不講,是因為不懂。你不講,客戶不知道,客戶也沒有經驗,後續商業智能BI項目建設就會出問題。

在一次大會上,某商業智能BI廠商一位高級售前技術專傢在跟客戶交流時說過的一句話:商業智能BI直連不香嗎?直接連接數據源不就可以做分析,不需要數據倉庫。無知者無畏,實在聽不下去,就打斷直接溝通瞭一下。通過溝通,可以判斷這個所謂的技術專傢基本上沒有做過完整的 商業智能BI 項目經驗,從零到一搭建一個 商業智能BI 項目的能力等於零。以這樣的一種能力跟客戶來引導一個 商業智能BI 項目,這種 商業智能BI 項目的質量能有保證嗎,很難的。

這也就是我們派可數據、我個人做視頻號《呂品聊數據》的原因,客觀的講講 商業智能BI、客觀的講講數據,普及一下我們認為正確的 商業智能BI 知識和概念。告訴我們廣大的 商業智能BI 用戶,商業智能BI 到底應該怎麼理解、怎麼認知,商業智能BI 到底有什麼樣的坑需要我們的企業註意。

我們不能說我們派可數據在 商業智能BI 領域講的知識和概念就一定是放之四海而皆準的,但是我們歡迎任何 商業智能BI 廠商或者任何 BI 個人愛好者就 商業智能BI 的一些知識和概念來向我們挑戰,來看看派可數據所普及的一些 商業智能BI 知識概念到底對不對。如果普及的對,說明這些問題大傢確實都碰到瞭,這些知識和概念對於企業而言就是難得的經驗。如果普及的不對,不對又是在什麼地方,指出來大傢一起看看,一起探討一下,我們還可以為企業做些什麼。

08、報表工具是怎麼來的?

這十幾年我一直在技術領域、信息化領域、商業智能BI 行業,一直沒有出這個圈。做過 JAVA ( AWT、SWING、JSP、Hibernate、Spring、ibatis )、.NET ( ASP、http://ASP.NET、C#.NET )、Object-C 、JS 等等技術開發,業務軟件系統平臺開發。

早期前端技術很弱,AJAX 的實現也都需要手寫,要實現一個表單內數據的點擊編輯和修改需要自己用 JS DOM 操作。做報表基本上就是 JSP、ASP 腳本語言在前端嵌套 HTML 做循環輸出,報表樣式很原生很醜陋,稍微復雜一點的表格報表樣式都需要用 JS 來調整。

那個時候用過的報表像 Crystal Report 水晶報表、潤乾報表等等,在前端腳本語言中有標簽直接可以引用,報表生成代替瞭大量的手寫代碼。早期的前後端技術是不分傢的,http://ASP.NET 還稍微好一些,前端逐步有一些集成控件可以直接使用,JAVA 是真沒有。上面說到的這個階段大概在什麼時候呢,2005年前後,2007年我覺得已經使用的很廣泛瞭,老的 CSDN 上應該還能找到很多原始的報表標簽帖子。

像老一批報表還有像金峰報表 Jreport、思達報表 StyleReport 等等在國內也有一定的市場。早在 2010 年之前,有些報表廠商的收入規模就已經突破瞭一個億,說明基礎報表這個市場還是非常不錯的。

那個時候的報表定位是什麼,就是純粹的 Report 報表,通過程序從後臺數據庫中查詢返回的數據聚合 List 再到前端腳本頁面上綁定一下就生成瞭各種報表,實際上就是用在各個業務軟件系統之中的報表展示,還遠遠沒有到 商業智能BI分析這個層面。

並且還有大量的軟件開發廠商實際上已經具備瞭很強的報表能力,不過這些報表能力並沒有單獨拿出來作為報表產品在市面上運營而已。

逐步的,隨著前端技術、前端框架的完善,從傳統表格技術開始到瞭各類柱狀圖、條形圖、餅狀圖的可視化展示,到瞭這個階段,報表和商業智能BI的邊界越來越模糊。為什麼?商業智能BI的報表展現能力也就和傳統報表效果大致相當,還沒有出現那種自助分析、自助拖拉拽就可以實現快速多維分析的能力。

講這麼多主要想說的是我們所看到的很多商業智能BI項目都是拿報表思維去實現的,就是 SQL 到數據集到前端展現。而真正的商業智能BI思維應該是什麼呢? 多維思維、模型思維,這一點決定瞭一個 商業智能BI 項目的最終走向,後面會具體講到這些點。

09、商業智能BI的本質 – 企業業務管理思維的落地

商業智能BI的本質 – 派可數據商業智能BI可視化分析平臺

商業智能 BI 到底是什麼?技術?產品?還是其它?我們把對於 BI 的理解再提升一個層次:商業智能 BI 是一傢企業業務和管理思維的落地。這個怎麼來理解呢?簡單來說,就是在可視化報表上呈現的內容就是一傢企業真正關註的內容,這裡面有管理高層重點關註的企業經營性的分析指標,也有某具體部門的。

10、商業智能BI 和數據倉庫 Data Warehouse 有什麼區別和聯系?

經常會碰到有人問商業智能BI和數據倉庫有什麼區別,實際上這個問題的背後能反映出來一些朋友對商業智能BI的理解還是有些不準確和偏差,這個問題實際上從概念上把BI和數據倉庫人為的割裂瞭。這種情況其實也比較正常,因為大傢對商業智能BI的第一印象就是各種炫酷的可視化圖表、報表,再加上市面上有很多輕量的前端可視化商業智能BI分析工具,就造成大傢對BI的認知就停留在可視化這部分瞭。

準確的來說,商業智能BI不僅僅包含前端可視化分析、報表展現的能力,更包含瞭底層數據倉庫的建設過程。Gartner 在上世紀九十年代就已經提到瞭商業智能 Business Intelligence,它更多的認為:BI是一種數據類的技術解決方案,將許多來自不同企業業務系統的數據提取有分析價值的數據進行清洗、轉換和加載,就是抽取Extraction、轉換 Transformation、加載Loading 的ETL過程,最終合並到一個數據倉庫中,按照一定的建模方式例如Inmon 的3NF 建模、Kimball 的維度建模或者兩者都有的混合式架構模型,最終在這個基礎上再利用合適的分析展現工具來形成各種可視化的分析報表為企業的管理決策層提供數據決策支撐。

商業智能BI – 派可數據商業智能BI可視化分析平臺

所以,可以從這裡能夠看到數據倉庫Data Warehouse 的位置是介於可視化報表和底層業務系統數據源之間的這一層,在整個商業智能BI項目解決方案中起到的是一個承上啟下的作用。如果把商業智能BI比作是一個人的話,上半身特別是臉這個部分就是顏值,下半身腳踏實地吸取大地的精華,中間這部分的腰腹核心、核心力量就是數據倉庫。

籃球之神喬丹不光光有顏值,滯空能力是頂尖的存在,才會在上籃的時候有各種讓人驚嘆的動作,能夠支撐這些動作其實靠的是什麼?就是喬丹的腰腹核心力量。

所以,商業智能BI在前端可視化分析層面要玩出各類精彩的動作,沒有數據倉庫這個核心力量的支撐是很難做到的。

那大傢也會問到,市面上不是有很多直接鏈接數據源就可以拖拉拽分析的商業智能BI工具產品嗎,不也一樣可以做商業智能BI分析報表嗎?這種獨立的、單獨的面向前端的商業智能BI分析工具,他們更多的定位是部門級和個人級的商業智能BI 分析工具,對於深層次的需要復雜數據處理、集成、建模等很多場景是無法解決的。最好的方式就是底層構建一套完整的數據倉庫,把很多分析模型標準化,再利用這些前端商業智能BI分析工具結合起來,這樣才能真正的把前端商業智能BI分析能力給釋放出來。

很多企業認為隻要買一個前端商業智能BI分析工具就可以解決企業級的商業智能BI所有問題,這個看法實際上也不可行的。可能在最開始分析場景相對簡單,對接數據的復雜度不是很高的情況下這類商業智能BI分析工具沒有問題。但是在企業的商業智能BI項目建設有一個特點,是一個螺旋式上升的建設過程。因為對接的業務系統可能會越來越多,分析的深度和廣度會越來越多,數據的復雜度也會越來越有挑戰性,這個時候沒有一個很好的數據倉庫架構支撐,光靠前端BI分析工具基本上是無法搞定的。

數據倉庫 – 派可數據商業智能BI可視化分析平臺

就像去中藥店抓藥一樣,之所以抓藥很快,是因為在抓藥前,別人已經把各種原生的中藥材(原始數據源的數據)分門別類清理幹凈放好瞭,這樣想怎麼搭配藥材(維度指標組合的可視化)就很快瞭。

這樣的企業在國內有很多,也是因為對商業智能BI理解的深度不夠導致瞭在商業智能BI項目建設上一些方向性的錯誤,最後導致商業智能BI項目很難繼續推進。

所以在企業中,我們需要明確我們的商業智能BI建設是面向企業級的還是個人和部門的分析工作。如果是個人數據分析師,使用這類前端商業智能BI分析工具就足夠瞭。如果是需要構建一個企業級的商業智能BI項目,就不能隻關註前端可視化分析能力這個層面,更應該關註到底層數據架構的構建,也就是數據倉庫這個層面。

11、數據倉庫的建模方法論 Kimball vs Inmon 以及混合架構

數據倉庫建模時商業智能BI項目建設中的重中之重,Inmon 的三范式 3NF 建模和 Kimball 的維度建模都是 商業智能BI 數據倉庫建模的方法論,這兩種商業智能BI建模的方式有什麼區別和聯系。

12、實際開展一個 BI 項目的時候對於需求的落地的方法論

商業智能BI是一個完全需求驅動的,既然是需求就需要做訪談和調研。

13、什麼樣的企業應該要上商業智能 BI 瞭?

什麼樣的企業適合上商業智能BI?看業務基礎信息化程度和日常業務管理的細致程度和顆粒度。業務基礎信息化程度就是企業自身的IT業務系統基礎建設,沒有業務系統的支撐,做商業智能BI就缺乏數據基礎;第二就是業務管理的顆粒度,企業自身業務管理程度是不是比較細致瞭,急需通過商業智能BI來提升業務管理、決策支撐的效率。

14、如何高效的給高層領導做商業智能BI數據分析匯報總結

做完商業智能BI項目,還要考慮最終如何跟老板匯報的問題,掌握商業智能BI數據分析思維框架和匯報的五個重點:用戶業務層次與范圍、工作成果、計劃執行復盤、問題反饋、展望規劃與願景。

15、商業智能BI與企業經營管理的結合度

商業智能BI分析跟企業的經營管理分析高度結合,ROE 高的企業有可能是利潤高像茅臺、珠寶行業,有可能是周轉快比如像零售行業,也有可能是融資能力比較強會利用杠桿,從ROE 歸因分析看行業特點。

16、商業智能BI項目行業和業務知識的積累

做商業智能BI還必須熟悉行業和業務知識,不結合行業業務知識,商業智能BI的項目是很難落地的。

17、關於商業智能 BI 實時性處理的話題

商業智能BI 對數據的處理存在一定的滯後性,通常采用T+1模式,主要原因是ETL數據處理過程是需要有大量的時間損耗,通常是采用空間換時間的方式。

將以前按照商業智能BI 數據倉庫分層的ETL調度設計成可按單獨指標並自動尋找依賴的調度就大大的增加瞭對個別指標調度和準實時處理的靈活性。

離線數據與實時處理針對的業務場景不同,背後的技術方式實現不同,資源投入也不同,瞭解它們之間的定位差異有助於選擇合適的方案以最小的資源投入達到企業既定完成商業智能BI 項目建設目標。


關於派可數據 商業智能BI可視化分析平臺:

北京派可數據科技有限公司成立於2016年,總部位於北京,在華東、華中、華南、西南開設有分公司和辦事處,服務覆蓋全國。

公司自成立以來一直專註於大數據、商業智能 BI、數據分析領域,推出的一站式企業級 BI 可視化分析平臺具備端到端的從底層數據倉庫構建到前端可視化分析展現的全平臺能力。目前產品已經廣泛服務於進出口貿易、能源、化工、教育、交通物流、零售、汽車、房地產建築、生產制造等各個行業,廣受客戶贊譽。

赞(0)