1、 前言 當前的時代是信息爆炸的時代, 數據已經成為新的生產要素, 其價值愈發凸顯。 作為數據的生產者和消費者, 企業需要思考的是如何利用生產運營過程中產生的數據反哺生產運營。 數據驅動決策的需求正在不斷地推動 企業尋找信息化建設與數字化轉型的新方式, 而商業智能便提供了一個絕佳的思路。 商業智能問世已有二十余年, 受到廣大企業的青睞與追捧, 碩果累累。 雖然不少企業沒有特別強調商業智能這 一概念, 但是商業智能的廣泛應用已成既定事實。 商業智能市場規模增長迅速, 國內市場增速更是大于全球 市場。 Gartner 在 Market Share: Analytics and Business In
2、telligence, Worldwide, 2018 報告中指 出, 分析和商業智能軟件市場在 2018 年增長了 11.7, 達到 216 億美元。 現代 BI 平臺繼續以 23.3的速度 增長, 增速最快, 其次是數據科學平臺, 增長 19.0。 帆軟數據應用研究院發布的 2019 年中國大數據 BI 行 業預測報告 顯示, 國內 BI 市場在 2018 年增速達到 25.8%, 高于全球市場增速。 企業數字化轉型進程已經 邁入商業智能階段。 盡管商業智能已被企業廣泛應用, 概念上的普及卻 “相形見絀” , 國內民眾對商業智能的認知仍是千人千面。 一方面, 商業智能起源于國外, 信息化基
3、礎的差異讓商業智能的引入過程發生了 “變異” 。 另一方面, 我國缺乏 類似 Gartner 的研究機構來持續教育與引導國內市場。 市場需要教育和孵化, 相較歐美, 我國還任重道遠。 因此, 帆軟數據應用研究院結合文獻材料、 企業調研以及我國的市場環境, 形成本白皮書。 本白皮書旨在明晰商業智能的概念、 價值、 功能技術、 工具等內容, 并基于我國的市場環境、 企業需求, 對商業 智能工具的概念進行重新梳理, 同時在此基礎上引入生態學思維, 構建商業智能生態系統模型, 以期統一商 業智能的大眾認知, 規范國內的市場行為, 指導我國企業的商業智能建設與數字化轉型。 前言 目錄 contents
4、商業智能的概念 1.1 由來與發展 1.2 企業從業人員的認知 1.3 國內用戶對商業智能的訴求 1.4 商業智能與商業智能工具 商業智能的價值 2.1 支撐管理決策 2.2 提升管理水平 2.3 提高業務運營效率 2.4 改進優化業務 01/ 02/ 02 10 商業智能的功能與技術 3.1 功能架構 3.2 商業智能的主要技術 3.3 功能需求與技術趨勢 商業智能工具 商業智能生態系統 總結與展望 參考文獻 03/ 04/ 05/ 06/ 14 22 18 26 27 3 商業智能的 概念 01 商業智能(BI)白皮書 2 01/ 商業智能的概念 商業智能 (Business Intell
5、igence, 以下簡稱 BI) , 也被稱為商業智慧或商務智能。 早在 1958 年, IBM 的研究員 Hans Peter Luhn 就將 “智能” 定義為 “對事物相互關系的一種理解能力, 并依靠這種能力去指導 決策, 以達到預期的目標。 ” 這期間出現的領導信息系統 (EIS, Executive Information System) 和決策支 持系統 (DSS, Decision Support System) 等技術應用, 可以看作是 BI 的前身 1。 但是由于技術、 企業環境 現狀等因素的限制, BI 經歷了一段漫長的探索期。 1996 年, 知名咨詢機構 Gartner
6、集團正式提出 BI 的定義: 一類由數據倉庫 (或數據集市) 、 查詢報表、 數 據分析、 數據挖掘、 數據備份和恢復等部分組成的、 以幫助企業決策為目的的技術及其應用。 由此看出 BI 并 不全是新的技術, 而是對一些現代技術的綜合運用。 BI 技術提供使企業迅速分析數據的技術和方法, 包括收 集、 管理和分析數據, 將數據轉化為有價值的信息, 并分發到企業各處, 讓企業決策有數可依, 從而減少決策 的盲目性, 理性地驅動企業管理和運營。 2013年,Gartner集團對BI的概念進行了更新與擴展,在 “Business Intelligence”一詞中加入“Analytics”,合 并成
7、“Analytics and Business Intelligence” (ABI, 分析與商業智能) , 并且納入應用、 基礎設施、 工 具、 實踐等多項內容, 將其定義為 “An umbrella term that includes the applications, infrastructure and tools, and best practices that enable access to and analysis of information to improve and optimize decisions and performance” 2。 如果說最初的BI 還不夠
8、智能, 其中的 “Intelligence” 翻譯為 “情 報” 可能更為恰當, 那么 “Analytics and Business Intelligence” 則是融合了計算機、 統計學等相關知識, 隨 著技術的發展, 未來 Intelligence 將成為真正的 “智能” 。 除去 Gartner 等研究機構, 國內外的學者在一些文獻和書籍中, 也對 BI 進行了類似的定義。 表 1 對 Gartner 和部分文獻書籍中的 BI 定義進行了整理。 1.1 由來與發展 3 時間來源定義 國外國內 幫助你把一些數據轉化成具有商業價值的, 而且可以獲取的信息和知識, 同時在最恰當 的時候, 通
9、過某種方式把信息傳遞給需要的人。 從專業的角度來說, 商業智能就是利用數據倉庫、 數據分析和挖掘技術, 以抽取、 轉換、 查詢、 分析和預測為主的技術手段, 幫助企業完成決策分析的一套解決方案。 表 1商業智能的主流定義 由表1看出, 國內外對BI的定義存在較多類似之處, 學界的共識即核心觀點均是從數據中獲取知識, 輔助決策。 具體地, 我們將 BI 的定義拆分為四個方面來理解: 輸入: 數據 (內部、 外部; 結構、 半結構、 非結構) 、 事實、 關系; 方法: 數據存儲、 ETL、 數據分析、 多維分析、 預測等技術; 產物: 有價值的知識、 信息; 目的: 輔助科學決策、 發掘商業價值
10、。 Gartner Gartner Negash&Gray3 Muriithi,G.M.&J. E.Kotz4 SteveWilliams5 余長慧, 潘和平 6 鄭洪源, 周良 7 王飛, 劉國峰 8 1996 2008 2013 2013 2016 2002 2005 2014 一類由數據倉庫 (或數據集市) 、 查詢報表、 數據分析、 數據挖掘、 數據備份和恢復等 部分組成的、 以幫助企業決策為目的的技術及其應用。 BIisadatadrivenprocessthatcombinesdatastorageandgatheringwith knowledgemanagementtoprov
11、ideinputintothebusinessdecisionmaking process. Anumbrellatermthatincludestheapplications,infrastructureandtools,and bestpracticesthatenableaccesstoandanalysisofinformationtoimproveand optimizedecisionsandperformance Aconceptualframeworkfordeliveringcosteffectivebusinessintelligence solutionsasaservi
12、ce. Anumbrellatermthatencompassesprovisionofrelevantreports,scorecards, dashboards,e-mailalerts,prestructureduser-specifiedqueries,adhocquery capabilities,multi-dimensionalanalyses,statisticalanalyses,forecasts,models, and/orsimulationstobusinessusersforuseinincreasingrevenues,reducing costs,orboth.
13、 商業智能是從大量的數據和信息中發掘有用的知識, 并用于決策以增加商業利潤, 是一 個從數據到信息到知識的處理過程。 商業智能是構筑在企業業務系統基礎之上, 以知識獲取和共享為目的的解決方案。 它通 過對企業內外數據的整合、 分析, 提取出有價值的信息, 幫助用戶在加強管理、 促進營 銷和企業發展方面做出及時、 正確、 科學的決策 ,并分析、 發現和把握新的商機。 商業智能(BI)白皮書 4 圖 1企業從業人員的整體認知圖 2IT 部門和業務部門從業人員的認知 基于以上疑問, 我們對 770 多家企業的 1400 多名從業人員 (多為企業 CIO 和業務管理人員) 進行了調研。 通 過對調研數
14、據的整理、 清洗和分析, 制作了圖 1 和圖 2 所示的詞云圖, 并由詞云圖得出以下結論: 整體上來看, 國內企業人員對 BI 的認知處于宏觀目標層面, 對 BI 功能的認知集中在數據分析與數據可 視化上; 國內企業中 BI 的主要表現形式仍然是報表系統; 工作內容和工作性質的區別使得 IT 部門和業務部門的從業人員對 BI 的認知存在不同之處, IT 部門更 重視技術, 業務部門則更重視 BI 帶來的業務價值, 不同業務部門的理解存在差異。 1.2 企業從業人員的認知 雖然 BI 問世已有二十余年, 學術界和 Gartner 等商業咨詢機構也都對 BI 的概念做出了較為清晰的解釋, BI 卻
15、并沒有想象中的 “如雷貫耳” , 有些企業從業人員甚至沒有聽說過 BI。 造成這一現象的原因可能是以下幾點。 首先, 企業界和學界存在一定的邊界; 其次, 有些小型企業用不上 BI, 有些企業雖然擁有報表系統、 數據倉庫 等 BI 技術, 但是并沒有特意提及 “BI” 一詞; 另外, 技術門檻使得最開始的 BI 只和少部分 IT人員有關; 最后, 除去互聯網企業和各行業龍頭企業, 我國也是在近幾年才真正掀起 BI 熱潮。 因此企業從業人員對 BI 存有困 惑也在情理之中。 那么我國企業從業人員對 BI 的理解如何? 是否與專業定義存在區別? 有沒有偏離 BI 原有 的含義? 拆分后, BI 的
16、概念更加清晰且易于理解: BI 是一種解決方案, 它以輔助決策為目的, 通過相關的數據技術方 法來處理企業各類數據, 產出可量化的、 可持續的數據價值, 這些價值表現在幫助企業實現業務監測、 業務洞 察、 業務優化、 決策優化甚至數據盈利。 此外, 表 1中的相關定義還呈現出一個明顯的趨勢: 無論是國內還是國外, 隨著時間的推移, BI 概念發展得 越來越廣泛, 涵蓋的內容越來越多。 從最初的技術應用到處理過程, 再到一整套的解決方案, BI體系日益龐大。 這一趨勢也對應了信息技術和企業數據的發展過程, BI 在輸入和方法層面逐漸吸納擴充了較多的內容。 (a) IT 部門從業人員認知(b) 業
17、務部門從業人員認知 數據來源: 帆軟數據應用研究院, 2019 5 與研究機構和書籍文獻中的定義相比, 我國企業從業人員對 BI 的理解側重于數據的分析和展示, BI 更多地 被等同于數據分析與數據可視化。 因此在大多數企業中, BI 更多地是指分析和前端展示工具, 而不是一個完 整的體系。 這一理解偏差帶來的結果就是 BI 正逐漸走向狹義, 即狹義的 BI 就是指 BI 工具, 而 BI 工具即指數據分析 與展示工具。 國內企業的理解認知正確與否我們無法斷言, 畢竟這些認知來源于企業的反復實踐, 但是長此 以往勢必會帶來不少問題。 一方面, 企業容易忽略 BI 數據底層的基礎, 一味地追求數
18、據分析與展示, 不能系 統地看待 BI。 另一方面, 我國的信息化環境與歐美發達國家不同, 企業規模大小不一, 信息化水平參差不齊, 市場上缺乏類似 Gartner 的研究機構引導, 并且Gartner 的結論不一定適用于我國的企業, 如果不形成統一 的 BI 認知, 將不利于中國 BI 行業的健康發展。 1.3 國內用戶對商業智能的訴求 我們調研發現, 當前國內企業應用 BI 產品, 最期待獲得的數據價值, 一是數據整合, 二是數據展示效率, 三 是輔助管理決策。 72.8% 的受訪企業最想獲得的數據價值是整合多系統數據, 打通多系統的數據, 解決掉數 據壁壘問題, 實現信息透明。 69.1
19、% 的企業想要提高報表的輸出效率, 期望能夠更快更準更省事。 53.7% 的企 業則希望通過數據分析, 輔助企業決策, 實現科學化、 數據化的決策。 商業智能(BI)白皮書 47.8% 50.0% 51.4% 53.7% 69.1%72.8% 圖 3企業期望獲得的數據價值 整合多系統數據, 打通數據壁壘 驅動產品服務, 引導創新改良 提高制表效率, 更快更準更省事 數據結合管理, 優化管理方式 輔助管理預測, 提高決策成功率 其他 提高生產效率,降低 人力成本 業務監管分析, 促進業務增值 數據來源: 帆軟數據應用研究院, 2019 6 在數據展示方式的選擇上, 幾乎所有的企業都會使用傳統的數
20、據報表來展示信息, 有 84.3% 的企業會選擇 使用酷炫的圖形圖表來制作報表。 Gartner 在 Survey Analysis: Traditional Approaches Dominate Data and Analytics Initiatives 報告中也提到 “報表能力” 和 “儀表板能力” 是 BI 平臺最關鍵的部分。 圖 4國內企業的數據展現方式 對于 BI 功能, 企業比較看重報表能力、 移動端、 填報錄入、 管理駕駛艙這幾項。 超過半數的企業非常重視常 規報表制作與展示和移動端 BI 功能。 接近一半的企業, 期待用數據填報來解決企業內部數據采集和錄入的 問題, 數據填
21、報也是解決數據分散在 Excel、 Word 中的有效辦法。 對于機器學習、 自然語言識別、 人工智能 這些未來 BI 的功能, 企業并不感冒, 僅有一成的企業表示關注。 這些功能更多地是停留在概念層面, 目前仍 處于炒作期, 實際的使用場景還不多。 0 0.2 0.40.60.81 96.4% 84.3% 數據報表圖形圖表數據來源: 帆軟數據應用研究院, 2019 53.8% 53.1% 49.6% 48.2% 43.3% 36.8% 34.3% 13.5% 24.4% 10.1% 00.10.20.30.40.50.6 常規報表制作與展示 移動 BI/ 移動端數據展示 數據填報 / 錄入
22、管理駕駛艙 大屏數據可視化 / 展示 數據挖掘 自助數據準備 機器學習與分析 自然語言識別 / 語義分析 數據來源: 帆軟數據應用研究院, 2019 圖 5國內企業選型 BI 時的功能考慮 7 商業智能(BI)白皮書 從部門層級來看, 企業更多地希望 BI 能服務領導層與業務管理層。 調研數據顯示, 超過 80% 的企業希望通 過 BI 解決領導層與業務管理層的數據分析需求。 其他層級尤其是 IT 的需求相對較低。 這也表明國內企業對 BI 的主要期待在于尋求管理層的決策支撐, BI 結合業務才能體現真正的價值。 100%80%60%40%20%0% 領導層 業務管理層 業務執行層 IT 層
23、81.7% 88.6% 56.72% 35.08% 數據來源: 帆軟數據應用研究院, 2019 圖 6國內企業各部門層級的數據分析需求 1.4 商業智能與商業智能工具 基于前文所述, 我國企業亟需形成對 BI 的統一認知, 并將 BI與 BI 工具進行區分, 從而共建穩定的市場環境, 促進我國 BI 產業發展。 在文獻研究和企業調研的基礎上, 結合我國的市場環境, 我們對 BI 作出如下定義。 商業智能 (BI) 是利用數據倉庫、 數據可視化與分析技術, 將指定的數據轉化為信息和知識的解決方案, 其價 值體現在滿足企業不同人群對數據查詢、 分析和探索的需求, 實現對業務的監測和洞察, 從而支撐
24、管理決策、 提升管理水平、 提高業務運營效率、 改進優化業務。 企業部署應用到實際生產環境中的 BI, 通常被稱為數據 決策系統、 報表分析系統、 數據分析項目等, 我們在此統稱為 BI 系統。 BI 系統一般符合三層技術架構, 即數 據底層、 數據分析層、 數據展示層, 后文將詳細介紹。 8 數據 數據 API 數據資源 行業應用 基礎架構分析工具 數據可視化 BI 工具 數據挖掘 圖 7數據領域生態圖譜簡圖 結合國內外 BI 工具的能力現狀、 企業需求和應用情況, 以及 BI 工具在數據領域生態圖譜中所處的位置, 我 們對 BI 工具做出如下定義: 商業智能 (BI) 工具即狹義的商業智能
25、, 是指以數據可視化和分析技術為主, 具備 一定的數據連接和處理能力的軟件工具,使用者能通過可視化的界面快速制作多種類型的數據報表、圖形圖表, 滿足企業不同人群在一定的安全要求和權限設置下, 實現在 PC 端、 移動端、 會議大屏等終端上對數據的查詢、 分析和探索。 在數據領域生態圖譜中, 我們認為 BI 工具作為大數據領域下一個細分領域, 與數據可視化工具、 數據挖掘工 具同處于分析工具子領域中。 因此 BI 工具與數據可視化工具、 數據挖掘工具存在交集, 如一些 BI 工具已經 具備數據挖掘功能。 但是三者之間的區別也很明顯。 數據可視化工具, 專攻于讓數據更炫更精美的展示, 有較 高的技
26、術門檻, 如 Echarts, 它是一個純 java 的數據可視化庫。 數據挖掘工具, 則是專攻于從大型數據集中 發現并識別模式, 如 R 語言、 weka 等。 9 商業智能 的價值 02 商業智能(BI)白皮書 10 02/ 商業智能的價值 BI 的價值在于滿足企業不同人群對數據查詢、 分析和探索的需求, 幫助企業實現業務監測、 業務洞察、 業務優 化、 決策優化甚至數據盈利。 實現業務監測、 洞察、 優化以及決策優化的前提是數據統一準確, BI 系統的上線 會極大的推動企業數據標準的統一, 解決數據孤島等問題, 否則 BI 也就喪失了業務監測、 洞察的能力, 無法 為企業運營和管理賦能。
27、 具體地, BI 價值體現在支撐管理決策、 提升管理水平、 提高業務運營效率和改進優 化業務四個方面。 2.1 支撐管理決策 企業數據驅動決策的需求促使了 BI 的誕生, 因此支撐管理決策是 BI 最核心的目的, 也是其最直接的價值。 某時裝企業的 BOSS 交互屏系統, 通過對已有的業務系統數據信息進行高效地分析, 并將分析結果展示在領 導辦公室的顯示屏上, 讓領導能直觀、 便捷地查看各個管理部門的財務數據指標, 合理調度配置資源。 該企業 旗下 500 多個店鋪的庫存和財務數據, 領導都能在交互屏和移動端上直接查看。 據業務部門反饋, 上線 BI 后, 領導再也沒有通過電話的方式向其索要財
28、務數據。 同時, 業務部門每次匯報可直接參照辦公室交互屏, 邊匯 報邊操作, 集中精力進行業務分析, 減少了在查看報表、 核對數據上的時間浪費。 某化工集團通過 BI 系統對全國各地的耕地面積和施肥量進行了分析。 化肥的使用量與有效耕地面積和作物 種類有直接關系, 所以及時了解各地的耕地面積變化和作物類型, 對于評估市場容量、 制定市場政策有重要 作用。 該集團的數據中心實現了與外部大數據平臺的對接, 能夠及時了解全國各地耕地面積和施肥量需求變化, 為管理層制定地區布局和銷售策略提供了有力的依據。 某電氣企業, 利用 BI 對銷售渠道的維護與拓展進行了梳理和分析, 按照時間維度和區域維度對拓展
29、計劃達成 率進行統計和對比, 將渠道進行分類, 統計不同渠道的銷售額貢獻情況, 再與投入的資源做對比, 從而輔助決 策后續各渠道的資源投入占比, 實現無效渠道的快速準確定位, 避免浪費。 11 2.2 提升管理水平 在支撐管理決策的基礎上, BI 還能夠進一步幫助企業基于數據的透明和流程化, 促進 PDCA 高效循環, 并 能形成一定的激勵機制, 提升管理水平。 某醫院的高層領導每年會給各科室分配年度收入任務,該醫院在BI系統上設計了年度科室總收入TOP10報表, 高層領導發現積極優秀的科室后, 及時進行表彰, 并開展經驗交流分享, 幫助其他科室提高進步。 中層領導在 BI 系統上根據自身科室
30、的收入構成, 來進一步分析需要提高哪部分的收入, 或者如果發現部分收入異常, 如 何調整。 這樣一來, 醫院的各級人員都有很明確的目標引導, 整個醫院的管理水平有了很大改善。 某連鎖超市利用 BI 系統將 KPI 體系和賽馬體系結合運營管理, 在強化管理的同時又能調動業務部門的積極 性和創造性。 KPI 體系主要是上下級的任務分配, 用懲罰施加壓力。 賽馬體系則是同級之間的相互競爭, 用獎 勵引導積極性。 并且個人績效獎懲和團隊績效獎懲并重, 最終激發出業務部門的強大活力和創造力。 2.3 提高業務運營效率 除了管理層面上的價值, BI 在業務層面上也有出色的表現, 最明顯的一點是提高業務運營
31、效率。 業務運營過 程中涉及的大量手工報表、 人工統計、 逐級取數等操作, 都可以由 BI 來代替, 既能減少人為干涉錯誤, 提高數 據的準確性, 又可以提高效率, 節省時間成本。 某行業的一家領軍企業, 其 OA 軟件已經上線了 13 年, 但在辦事效率上并沒有感受到明顯的提升, 員工在軟 件原因和人的原因中搖擺不定, 爭論不休, 然而工作效率并沒有任何起色。 信息中心主動承擔需求, 開發流程 績效分析報表, 每天通過微信和短信推送流程執行排名, 并將此排名和人事部門績效相結合。 工具端和制度 端雙管齊下后, 該企業的辦事效率提高了 80%。 很多企業每月都有經營會議, 使用 PPT 來復盤
32、、 分析工作的完成情況。 但是在執行操作時, 往往會出現表面意 義大于實際內涵的情況。 花費大量時間和精力制作的 PPT 并不能保證數據的完全準確, 而且無法進入數據 倉庫產生再利用價值。 某家化工企業利用 BI 工具進行了創新, 讓 IT 部門對月度經營分析報表進行信息化, 并 在每個會議室配備一個 iPad。 此后的月度經營會議只需要報告者打開 iPad, 基于數字演講, 開會時間直接 從月中提前到了月初。 還有某服裝企業, 利用 BI 系統將數據打通, 生成實時報表, 僅月報一項就減少了 20 個 人的工作量。 商業智能(BI)白皮書 12 2.4 改進優化業務 提高業務運營效率更多的是
33、改善數據的準確性, 減少相應的人力成本。 而改進優化業務則是 BI 在業務層面上 更重要的價值, 能夠從業務本身出發, 完善整個業務體系, 從而提升業務價值。 某電商公司為品牌商和零售商提供服務。 作為服務商, 核心競爭力就在于提供優質的服務, 但是服務質量的評 判成了一大難題。 以前, 該公司更多的是通過直觀感受和個人經驗, 人為判斷的結果可想而知。 現在, 該公司 上線了 BI 系統, 搭建了投訴分析模塊, 對每個部門制定了投訴指標。 通過投訴分析模塊, 可以實時查看到當前 各部門、 各人員的被投訴數據和排名。 有了量化后, 下一步就是進行改善。 在 BI 系統上對被投訴原因進行分析 并采
34、取處理措施后, 經過近 1 年的努力, 將月均投訴從 33 次減少到月均 7 次的水平, 降幅達 79%, 而且月均 投訴次數仍在持續下降中。 可以說 BI 對公司整個業務的改進優化起到了決定性的作用。 某集團年產值近 600 億, 每年花在輔料采購上的費用高達 30 多億。 該集團的輔料采購依賴于一個經驗豐富 的采購員, IT 部門將他的采購經驗固化為一些分析報表, 并嵌入到采購系統中作為參考, 經過一年的統計, 在 銷售額不斷增長的情況下, 采購費用反而下降了 5.1億, 整個采購業務得到了極大的優化。 某連鎖零售企業, 利用 BI 有效地改善了生鮮業務運營過程中的庫存盤點與出清, 銷售預
35、測、 產品定價等問題, 實現了數字化生鮮運營。 最終精簡了 30% 的非生鮮 SKU, 生鮮折價損失額下降 20%, 線上訂單數月環比增長 高達 65%, 生鮮業務的價值大幅提升。 13 商業智能的 功能與技術 03 商業智能(BI)白皮書 14 3.1 功能架構 按照從數據到知識的處理過程, 一般 BI 系統的功能架構如圖 8 所示, 分為數據底層、 數據分析和數據展示 三個功能層級。 其中數據底層負責管理數據, 包括數據采集, 數據 ETL, 數據倉庫構建等; 數據分析主要是利 用查詢、 OLAP、 數據挖掘, 以及數據可視化等分析方法抽取數據倉庫中的數據并進行分析, 形成數據結論; 最終
36、通過數據展示呈現報表和可視化圖表等數據見解。 報表、 可視化圖表 查詢、 OLAP分析、 數據挖掘、 可視化分析 數據倉庫 ETL 數據源 1 數據源 2 數據源 3 數據展示數據分析數據底層 圖 8商業智能系統的功能架構 3.2 商業智能的主要技術 對照 BI 的功能架構, BI 的主要技術也可以分為展示類、 分析類和支撐類三個層級, 如圖 9 所示。 ETL OLAP 數據倉庫 元數據管理 大數據 數據挖掘 數據可視化 展示類技術 分析類技術 支撐類技術 圖 9商業智能的主要技術 15 最核心的是展示類的數據可視化技術, 拋開企業數據量級的不同和深度分析的需求, 數據可視化技術能夠滿 足最
37、基本的 BI目標, 即將數據轉化為信息并輔助決策; 數據可視化的具體形式又分為報表和可視化圖表兩大 類, 其中報表是我國大多數企業目前的主要數據展示形式。 數據可視化旨在借助于圖形化手段, 清晰有效地傳達與溝通信息。 其基本思想是將數據庫中每一個數據項作 為單個圖元素表示, 大量的數據集構成數據圖像, 同時將數據的各個屬性值以多維數據的形式表示, 可以從 不同的維度觀察數據, 從而對數據進行更深入的觀察和分析。 例如柱形圖、 折線圖和餅圖等一些基礎的圖表 就可以直觀地展示出數據。 當數據較為復雜時, 可以通過復雜圖表搭配多樣的交互效果來將數據直觀化。 其次是 OLAP、 數據挖掘等分析類技術,
38、 能夠基于現有數據提供更深入的洞察。 數據挖掘技術需要一定數據 量的支撐, 而企業不一定要等到數據量足夠大時才能應用 BI, 結合我國企業的信息化現狀, 數據挖掘目前并 不是 BI 系統的關鍵技術需求。 聯機分析處理 (OLAP, Online Analytical Processing) 主要關注多維數據庫和多維分析。 OLAP 委員會對 聯機分析處理的定義為: 使分析人員、 管理人員或執行人員能夠從多種角度對從原始數據中轉化出來的、 能夠 真正為用戶所理解的、 并真實反映企業維特性的信息進行快速、 一致、 交互的存取, 從而獲得對數據更深入了 解的一類軟件技術。 最后是支撐類技術, 包括E
39、TL、 數據倉庫、 元數據管理和大數據技術等, 用于管理繁雜的、 不斷增長的企業數據, 為整個 BI 系統體系提供持續的、 強力的、 穩定的支撐。 數據倉庫 (Data Warehouse) 是一個面向主題的 (Subject Oriented) 、 集成的 (Integrated) 、 相對穩定 的 (Non-Volatile) 、 反映歷史變化 (Time Variant) 的數據集合, 用于支持管理決策 (Decision Making Support) 。 數據倉庫的出現, 并不是要取代數據庫。 大部分數據倉庫還是用關系數據庫管理系統來管理的, 數據庫、 數據倉庫相輔相成、 各有千秋。
40、 ETL 是 Extract-Transform-Load 的縮寫, 用來描述將數據從來源端經過抽取 (Extract) 、交互轉換 (Transform) 、 加載 (Load) 至目的端的過程。 它是構建數據倉庫的關鍵環節, 數據倉庫主要是為決策分析 提供數據, 所涉及的操作主要是數據的查詢, 所以 ETL過程在很大程度上受企業對源數據的理解程度的影響, 也就是說從業務的角度看數據集成非常重要。 大數據 (Big Data) 是指無法在一定時間范圍內用常規軟件工具進行捕捉、 管理和處理的數據集合, 是需要新 處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信
41、息資產。 顧名思義, 大數據技術就是收集、 存儲、 處理、 分析大數據的相關技術。 當前大部分企業已滿足大數據的 5V 特征, 因此, BI引入大數據技術, 旨在從大數據中快速獲取價值。 元數據 (Metadata) 又稱中介數據、 中繼數據, 用于描述數據屬性的信息, 是描述數據的數據 (data about data) 。 其使用價值主要在于在識別資源、 評價資源、 追蹤資源在使用過程中的變化、 實現簡單高效地管理大 量網絡化數據、 實現信息資源的有效發現、 查找、 一體化組織和對使用資源的有效管理。 由于元數據也是數據, 因此可以用類似數據的方法在數據庫中進行存儲和獲取。 商業智能(BI
42、)白皮書 16 3.3 功能需求與技術趨勢 隨著企業信息化水平的不斷提高, 在輔助決策這一核心目標不變的條件下, BI 在展示類、 分析類和支撐類技 術層面上都會進一步擴張, 納入更多的新興技術。 面對未來更快的數據增長、 更多的數據類型, 以及更復雜的 數據應用場景, 如何提供更強力的支撐, 如何產出更精準的數據見解來輔助決策將是企業需要重點考慮的問 題。 目前大數據技術已經趨于成熟, 支撐類技術在一段時間內將減緩甚至停止擴張, 未來 BI 的功能和技術需 求將圍繞精準決策發展。 (1) 國內外信息化水平和市場環境存在差異, BI 發展趨勢需要因地制宜。 Gartner 在 2019 年的
43、Magic Quadrant for Analytics and Business Intelligence Platforms 報告中 對 2020 年BI 產品的發展趨勢進行了預測, 其中, 引入增強分析、 自然語言處理和語音生成等AI技術將是主流。 需要注意的是, 與歐美發達國家相比, 我國信息化水平整體較為落后, 尤其是非互聯網行業。 現階段 AI 技術 還不夠智能, 成熟度仍有待提升, 在 BI 中貿然引入 AI 反而可能會帶來消極影響, 我國的 BI更需要貼合中國 的市場環境和中國企業的實際需求。 我們針對國內 BI 市場的調研數據表明, 我國企業對 AI+BI 模式暫無明 顯需求
44、, 目前 AI 與 BI 僅存在極小的重合部分, 仍是泡沫。 表 2 中整理了國內外研究機構對 BI 發展趨勢的不同預測。 國外國內 到 2020 年, 增強分析將成為新用戶購買 BI 產品、 數據科 學和機器學習平臺、 以及嵌入式分析的主要驅動力。 到 2020 年, 有 50% 的分析查詢會通過搜索、 自然語言處 理或語音生成, 或者自動生成。 到 2020 年, 為用戶提供對內部和外部數據策劃目錄的訪 問權限的組織將從分析投資中獲得兩倍的業務價值。 到 2020 年, 業務部門的數據和分析專家數量的增速將是 IT 部門專家的 3 倍, 這會迫使企業重新考慮其組織模式和 技能。 到 202
45、1 年, 自然語言處理和會話分析這兩個功能, 會在新 用戶、 特別是一線工作人員中, 將分析和商業智能產品的 使用率從 35% 提升到 50% 以上。 易用性、 穩定型、 功能、 大數據分析能力是當前我國企 業選型 BI 時的主要考慮因素。 報表制作、 移動端、 填報錄入、 管理駕駛艙是當前我國 企業選型 BI 時重點關注的功能。 我國企業 2 年內最需要的 BI 功能中, 圖像處理、 語音 工程和文本分析等功能排在最后。 我國企業未來 35 的將會應用的 BI 功能中, 圖像處理、 語音工程和文本分析等功能依然排在最后, 占比均不足 20%。 我國企業的 BI 建設在未來 5 年內將仍然以數
46、據管理和 數據分析為主; 預計在 2025 年左右, 我國的 BI 將邁入 智能化階段。 表 2國內外 BI 功能需求與發展趨勢預測 數據來源: Gartner/ 帆軟數據應用研究院, 2019 17 (2) 根據國內外的不同趨勢預測, 結合國內市場環境, 我們得出以下結論: BI 未來最主要的趨勢是與 AI 技術融合, 但是目前在中國仍是泡沫; 我國企業的 BI 建設在未來 5 年內將仍然以數據管理和數據分析為主; 預計在 2025 年左右, 我國的 BI 將開始邁入智能化階段。 當然, 隨著 AI 技術和 BI 系統的不斷成熟, AI 在 BI 中的應用將會越來越多, 二者重合的部分也越來
47、越多, 但 是因為它們存在本質上的區別, 因此不會完全重合。 201920252030 數據挖掘 預測分析 自然語言生成 增強數據發現 . 嵌入式分析 圖分析 會話分析 . 圖 10國內企業 BI 與 AI 技術融合的發展趨勢 商業智能(BI)白皮書 18 商業智能 工具 04 19 04/ 商業智能工具 BI 工具是以數據可視化和分析技術為主, 具備一定的數據連接和處理能力的軟件工具, 使用者能通過可視化 的界面快速制作多種類型的數據報表、 圖形圖表, 可以滿足企業不同人群在一定的安全要求和權限設置下, 實 現在 PC 端、 移動端、 會議大屏等終端上數據的查詢、 分析和探索。 按照技術發展
48、和對用戶需求的響應, 當前 BI 工具可以分為報表式 BI、 傳統式 BI 和自助式 BI 三類。 1. 報表式 BI 報表式 BI 工具主要面向 IT人員, 適用于各類固定樣式的報表設計, 通常用來呈現業務指標體系, 支持的數 據量相對不大。 國內的報表式 BI 于1999 年左右開始起步, 在 2013 年趨于成熟。 由于國內企業對于格式的糾 結和堅持, 當前我國非常多的企業對表格式報表仍然情有獨鐘, 解決中國式復雜報表經常成為企業選型的重 點需求。 報表式 BI 大多都采用類 Excel 的設計模式, 雖然主要面向的對象是 IT 部門, 但是業務人員也能快速學習和 掌握, 并在既定的數據
49、權限范圍內, 制作一些基本的數據報表和駕駛艙報表。 例如 FineReport 自主研發的 HTML5 圖表, 可以滿足不同人群的視覺展示需求, 也可以進行一些簡單的即席分析操作, 如圖表類型的切換、 排序、 過濾等。 2 傳統式 BI 傳統式 BI 同樣面向 IT人員, 但是側重于 OLAP 即席分析與數據可視化分析。 傳統式 BI 以 Cognos 等國外 產品為代表, 其優勢是在大數據量上的性能和穩定性, 劣勢也十分明顯數據分析的能力和靈活性差。 據 Forester 報告顯示, 在擁有傳統式 BI 的企業或機構中, 83以上的數據分析需求無法得到滿足, 這表明很 多企業重金打造的 BI 系統幾乎成了擺設, 收效甚微。 此外, 項目耗資不菲、 實施周期極長、 項目風險大、 對人 才要求高等特征, 也不利于傳統 BI 的推廣和普及。 3. 自助式 BI 由于傳統式 BI 的缺陷屢遭詬病, 以及業務人員數據分析需求的增長, 自助式 BI 開始快速成長起來。 自助式 BI 面向業務人員, 追求業務與 IT 的高效配合, 讓 IT人員回歸技術本位, 做好數據底層支撐; 讓業務人員回歸 價值本位, 通過簡單易用的前端分析工具