《工業互聯網產業聯盟:2018工業大數據技術架構白皮書1.0(111頁).pdf》由會員分享,可在線閱讀,更多相關《工業互聯網產業聯盟:2018工業大數據技術架構白皮書1.0(111頁).pdf(111頁珍藏版)》請在三個皮匠報告上搜索。
1、 工業大數據技術架構白皮書 1.0 工業互聯網產業聯盟 工業大數據特設組 2018 年 5 月 編 寫 說 明 黨的十九大報告中提出要“加快建設制造強國,加快發展先進制造業,推動互聯網、大數據、人工智能和實體經濟的深度融合” 。再一次強調了運用新興技術促進信息化和工業化的深度融合,以實現制造強國的戰略目標。 工業是國民經濟的主導,每一次工業屆的重大變革都會對社會發展形成重大的影響。 我國政府高度重視并積極推動以互聯網為代表的新一代新興技術與工業系統深度融合,以加速工業體系的智能化變革。工業互聯網產業聯盟(AII)在2016 年發布的工業互聯網體系架構(1.0) 中將工業互聯網的建設重點概括為“
2、網絡” 、 “數據” 、 “安全” 三大領域, 而 “數據” 是實現工業智能化的核心驅動。在工業領域中合理地運用大數據技術能有效促進企業信息化發展, 提升企業生產運行效率、加速生產信息在制造過程中的流動、助力企業升級轉型并形成全新的智能制造模式。 為了加速新一代信息技術與傳統產業的融合,工業互聯網聯盟(AII)針對工業領域的技術創新、標準制定、試驗驗證、應用實踐等進行了一系列調查研究,在工業大數據領域也開展了相關工作,先后發布了中國工業大數據技術與應用白皮書 , 工業大數據創新競賽白皮書風機結冰故障分析指南等成果,以推動大數據技術在工業領域的深入應用。 本白皮書從實際出發,在現有研究的基礎上,
3、結合生產過程中的經典案例,介紹和分析了工業生產環境中大數據技術的應用方法, 為工業企業建設大數據系統提供了基礎架構層面的建議和指導,從數據的采集與交換、集成與處理、建模與分析、決策與控制幾個層面,形成完整的大數據管理與分析架構,供相關行業伙伴參考使用,適用于廣義的工業領域,包括制造業、采伐工業、原材料工業以及其他衍生的工業范圍。 牽頭牽頭編寫單位:編寫單位:中國信息通信研究院 參與參與編寫單位:編寫單位:清華大學、富士康科技集團、華為技術有限公司、中國聯合網絡通信集團有限公司、北京理工大學、北京工業大數據創新中心、中國移動通信集團有限公司、工業大數據應用技術國家工程實驗室、上海理想信息產業(集
4、團)有限公司、聯想(北京)有限公司、天津愛波瑞科技發展有限公司、北京東方國信科技股份有限公司、上海優也商務信息咨詢有限公司 編寫組編寫組成員:成員: 中國信息通信研究院:魏凱、姜春宇、王妙瓊、馬鵬瑋 清華大學:王建民、任艮全 富士康科技集團:范治民、徐長愷、李喬如、董吉雄 華為技術有限公司:侯曉鈞、殷宏 中國聯合網絡通信集團有限公司:王非、賀曉偉 北京理工大學:李慧芳 北京工業大數據創新中心:王晨 中國移動通信集團有限公司:毛峻嶺、何震宇、劉琨、曹雪峰 工業大數據應用技術國家工程實驗室:祝守宇、紀豐偉、郭睿、劉泓汛 上海理想信息產業(集團)有限公司:吳珉杰、余江、尹超迎 聯想(北京)有限公司:
5、肖軍、黃卓磊、魏星 天津愛波瑞科技發展有限公司:王洪艷、許立紅、廖少華、張紀九 北京東方國信科技股份有限公司:趙紅衛、梁張偉 上海優也商務信息咨詢有限公司:傅源、李志芳、林詩萬 法 律 聲 明 本報告所載的材料和信息,包括但不限于文本、圖片、數據、觀點、建議,不構成法律建議,也不應替代律師意見。本報告所有材料或內容的知識產權歸工業互聯網產業聯盟所有(注明是引自其他方的內容除外) ,并受法律保護。如需轉載,需聯系本聯盟并獲得授權許可。未經授權許可,任何人不得將報告的全部或部分內容以發布、轉載、匯編、轉讓、出售等方式使用,不得將報告的全部或部分內容通過網絡方式傳播,不得在任何公開場合使用報告內相關
6、描述及相關數據圖表。違反上述聲明者,本聯盟將追究其相關法律責任。 工業互聯網產業聯盟 秘書處 聯系電話:010-62305887 聯系郵箱: 1 目 錄 第一章 工業大數據系統綜述. 1 1.1 建設意義及目標. 1 1.2 重點建設問題. 2 第二章 工業大數據技術架構概述. 3 2.1 數據采集與交換. 5 2.2 數據集成與處理. 6 2.3 數據建模與分析. 8 2.4 決策與控制應用. 9 2.5 技術發展現狀. 10 第三章 工業大數據技術架構實現. 12 3.1 技術組件選擇. 12 3.1.1 數據采集. 12 3.1.2 數據存儲. 16 3.1.3 數據計算. 17 3.1
7、.4 混合云架構. 18 3.2 建設標準. 19 3.2.1 基礎業務能力. 19 3.2.2 數據管理能力. 20 3.2.3 運維管理能力. 21 3.2.4 安全管理. 22 2 3.2.5 性能要求. 23 3.2.6 開放與兼容性. 24 第四章 總結與展望. 25 附錄一:典型案例. 26 一、 富士康 NPI 制造大數據 . 26 1、 案例背景與業務痛點. 26 2、 解決方案. 27 3、 實施效果與推廣意義. 32 4、 案例亮點. 32 二、 中國聯通工業大數據采集分析平臺. 33 1、案例背景與業務痛點. 33 2、解決方案. 34 3、實施效果與推廣意義. 37 4
8、、案例亮點. 37 三、 華為云 EI 企業智能打造智能化九州通 . 37 1、案例背景與業務痛點. 38 2、解決方案. 40 3、實施效果與推廣意義. 45 4、案例亮點. 46 四、 濰柴工業大數據平臺. 47 1、案例背景與業務痛點. 47 2、解決方案. 48 3、實施效果與推廣意義. 51 4、案例亮點. 51 3 五、 中國移動 OneNET 助力工業資產管理 . 52 1、案例背景與業務痛點. 52 2、解決方案. 54 3、實施效果與推廣意義. 57 4、案例亮點. 58 六、 聯想工業大數據平臺 LEAP. 59 1、 案例背景與業務痛點. 59 2、 解決方案. 59 3
9、、 實施效果與推廣意義. 63 4、 案例亮點. 64 七、 格力電器工業大數據平臺. 64 1、 案例背景與業務痛點. 64 2、 解決方案. 65 3、 實施效果與推廣意義. 69 4、 案例亮點. 70 八、合力叉車工業互聯網平臺. 71 1、案例背景與業務痛點. 71 2、解決方案. 76 3、實施效果與推廣意義. 82 4、案例亮點. 82 九、東方國信大數據助力聯合利華能源管理. 85 1、案例背景與業務痛點. 85 2、解決方案. 86 3、實施效果與推廣意義. 90 4 4、案例亮點. 90 十、優也基礎工業大數據平臺在鋼鐵能效的應用. 91 1、案例背景與業務痛點. 91 2
10、、解決方案. 93 3、 實施效果與推廣意義. 95 4、案例亮點. 97 附錄二:參考文獻. 98 附錄三:縮略語. 99 1 第一章 工業大數據系統綜述 1.1 建設意義建設意義及目標及目標 工業大數據是工業生產過程中全生命周期的數據總和, 包括產品研發過程中的設計資料;產品生產過程中的監控與管理數據;產品銷售與服務過程的經營和維護數據等。從業務領域來看,可以分為企業信息化數據、工業物聯網數據和外部跨界數據。 現階段工業企業大數據存在的問題包括數據來源分散、數據結構多樣、數據質量參差不齊、數據價值未有效利用等情況。 工業大數據技術的應用,核心目標是全方位采集各個環節的數據,并將這些數據匯聚
11、起來進行深度分析, 利用數據分析結果反過來指導各個環節的控制與管理決策,并通過效果監測的反饋閉環,實現決策控制持續優化。如果將工業互聯網的網絡比做神經系統,那工業大數據的匯聚與分析就是工業互聯網的大腦,是工業互聯網的智能中樞。 工業大數據系統的建設首要解決的是如何將多來源的海量異構數據進行統一采集和存儲。工業數據來源廣泛,生產流程中的每個關鍵環節都會不斷的產生大量數據,例如設計環節中非結構化的設計資料、生產過程中結構化的傳感器及監控數據、管理流程中的客戶和交易數據、以及外部行業的相關數據等,不僅數據結構不同,采集周期、存儲周期及應用場景也不盡相同。這就需要一個能夠適應多種場景的采集系統對各環節
12、的數據進行統一的收集和整理, 并設計合理的存儲方案來滿足各種數據的留存要求。 同時需要依據合適的數據治理要求對匯入系統的數據進行標準和質量上的把控,根據數據的類型與特征進行有效管理。之后就需要提供計算引擎服務來支撐各類場景的分析建模需求, 包括基礎的數據脫敏過濾、關聯數據的輕度匯總、更深入的分析挖掘等。這些都需要為工業大數據系統選擇合適的基礎架構作支撐。 建設工業大數據系統能有效地整合工業生產各個環節零散的數據, 進行統一的收集、管理和應用,在產品設計環節,全面地收集用戶需求,在生產環節有效 2 地提高設備運行可靠性、提升產品生產效率,在銷售環節增強用戶體驗、提升服務質量,實現制造-服務-用戶
13、之間狀態和數據的互聯互通,使企業能獲得全方位的數據感知,及時調整運行模式,做出合理決策。 1.2 重點重點建設建設問題問題 建設企業級工業大數據系統,需要解決多個層面的問題,業務層面需要對各個環節的數據進行梳理和分析,形成完善的數據體系,來描述完整的工業生產流程; 技術層面需要建立統一的大數據系統來匯集和處理工業全流程的數據, 其中需要根據具體的業務場景選擇合適的技術架構, 系統建設中需要重點考慮的問題包括以下四個方面: 如何采集來自多種數據源的異構數據; 如何按照不同的數據留存需求進行高效存儲; 如何按照業務需求選擇數據計算引擎和處理工具; 如何保障系統的安全和穩定運行。 本白皮書將圍繞這些
14、要點對工業大數據系統的架構做詳細的描述。 3 第二章 工業大數據技術架構概述 本白皮書中描述的工業大數據架構體系,是基于 2016 年工業互聯網產業聯盟發布的工業互聯網體系架構(1.0) 中對工業互聯網數據體系架構描述的細化,見圖 1。 圖1 工業互聯網體系架構(1.0)中的數據體系參考架構 可以總結為數據采集與交換、數據集成與處理、數據建模與分析和數據驅動下的決策與控制應用四個層次,功能架構見圖 2。 4 圖2 工業大數據功能架構 采集交換層:主要指從傳感器、SCADA、MES、ERP 等內部系統,以及企業外部數據源獲取數據的功能,并實現在不同系統之間數據的交互。 集成處理層:從功能上,主要
15、將物理系統實體的抽象和虛擬化,建立產品、產線、供應鏈等各種主題數據庫,將清洗轉換后的數據與虛擬制造中的產品、設備、 產線等實體相互關聯起來。 從技術上, 實現原始數據的清洗轉換和存儲管理,提供計算引擎服務,完成海量數據的交互查詢、批量計算、流式計算和機器學習等計算任務,并對上層建模工具提供數據訪問和計算接口。 建模分析層:功能上主要是在虛擬化的實體之上構建仿真測試、流程分析、運營分析等分析模型,用于在原始數據中提取特定的模式和知識,為各類決策的產生提供支持。從技術上,主要提供數據報表、可視化、知識庫、機器學習、統計分析和規則引擎等數據分析工具。 決策控制層:基于數據分析結果,生成描述、診斷、預
16、測、決策、控制等不同應用,形成優化決策建議或產生直接控制指令,從而對工業系統施加影響,實現個性化定制、智能化生產、協同化組織和服務化制造等創新模式,最終構成從數據采集到設備、生產現場及企業運營管理優化的閉環。 功能架構在對應到具體的技術實現時可以參考下圖中的技術架構。 5 圖3 工業大數據技術架構 2.1 數據采集與交換數據采集與交換 將工業互聯網中各組件、各層級的數據匯聚在一起,是大數據應用的前提。要實現數據從底層向上層的匯集,以及在同層不同系統間傳遞,需要完善的數據采集交換技術支持。 工業互聯網系統是一個分布式系統, 有眾多不同的組件組成,為了避免在不同系統間建立連接導致的 N 平方復雜性
17、,一般采取消息中間件(Message-oriented middleware)技術來實現。如下圖所示,消息中間件的主要功能是實現消息傳輸管理、隊列管理、協議轉換等功能。主流消息中間件產品包括IBM 的 MQ、Oracle 公司的 JMS、微軟的 MSMQ 等。消息中間件通過 MQTT、DDS、AMQP、XMPP 等協議與不同系統對接。 圖4 工業大數據采集交換層技術 6 一個比較大的工業互聯網系統中,數據來源和數據需求系統可能有成百上千個,為了簡化數據交換,一般采取“發布/訂閱”模式傳遞消息。數據生產者將數據發送給消息中間件,數據消費者則向消息中間件發出一個訂閱條件,表示對系統中的哪些數據感興
18、趣,如果不再感興趣,則可以取消訂閱;而消息中間件則根據一定的路由算法,將生產者發布的事件及時、可靠地傳送給所有對之感興趣的消費者。信息的生產者也稱為發布者(Publisher) ,信息的消費者稱為訂閱者(Subscriber) 。 數據采集是對各種來自不同傳感器的信息進行適當轉換例如采樣、量化、編碼、傳輸。一個數據采集系統,一般包括數據采集器、微機接口電路、數模轉換器。 數據交換是指工業大數據應用所需的數據在不同應用系統之間的傳輸與共享,通過建立數據交換規范,開發通用的數據交換接口,實現數據在不同系統與應用之間的交換與共享,消除數據孤島,并確保數據交換的一致性。 工業系統中,數據采集與交換是工
19、業系統運作的基底,從微觀層每一個零部件信息,到宏觀層整個生產流水線信息,如何基于各種網絡鏈接實現數據從微觀層到宏觀層的流動,形成各個層、全方位數據鏈條,并保證多源數據在語義層面能夠互通,降低數據交換的時延,以實現有效數據交換,技術上是一個比較大的挑戰。 2.2 數據集成與處理數據集成與處理 工業大數據集成就是將工業產品全生命周期形成的許多個分散的工業數據源中的數據,邏輯地或物理地集成到統一的工業數據集合中。工業大數據集成的核心是要將互相關聯的分布式異構工業數據源集成到一起, 使用戶能夠以透明的方式訪問這些工業數據源,達到保持工業數據源整體上的數據一致性、提高信息共享與利用效率的目的。 工業大數
20、據處理是利用數據庫技術、數據清洗轉換加載等多種工業大數據處理技術,將集成的工業數據集合中大量的、雜亂無章的、難以理解的數據進行分 7 析和加工,形成有價值、有意義的數據。 工業大數據集成處理層,主要涉及數據的抽取轉換加載(ETL)技術、數據存儲管理技術、數據查詢與計算技術,以及相應的數據安全管理和數據質量管理等支撐技術。其中,ETL、數據查詢與計算等技術,與互聯網大數據技術相似,而基于開源的 Hadoop 等技術將成為未來的發展趨勢,具體如圖 4 所示。 圖5 工業數據集成處理框架 其中,ETL 包括三部分:數據抽取、清洗轉換與加載。數據抽取主要將分散的、異構工業數據源中的數據如關系數據、平面
21、數據文件等抽取到臨時中間層;數據清洗是對抽取到臨時中間層的數據進行審查、過濾和校驗,旨在去除噪聲數據、刪除重復信息、糾正錯誤,并維護數據的一致性;數據轉換主要包括數據格式規范化與數據拆分等, 數據規范化實現字段格式的約束定義,以利于數據的建模與分析;數據加載是將已經加工好的數據加載到數據倉庫中。 由于加載到數據倉庫中數據量巨大,且包含結構化、半結構化和非結構化數據,傳統的關系型 SQL 數據庫難以滿足大數據的存儲與管理。因此,需要借助實時數據庫、關系數據庫、NoSQL 數據庫,實現工業大數據的存儲與管理。實時數據庫是基于實時數據模型建立,用于處理不斷更新、快速變化以及具有時間限制的數據,隨著技
22、術的演進,時序數據庫也逐漸興起,在部署方式、檢索性能及使用成本上對比傳統實時數據庫均有優化; 關系型數據庫是采用關系模型來組織數據,用于處理永久、穩定的數據;NoSQL 數據庫是指非關系型的數據庫, 8 具有靈活的可擴展性,在大數據量下具有非常高的讀寫性能。 數據查詢與計算主要采用 SQL 查詢引擎、批處理、流處理、機器學習等方法。其中,SQL 查詢引擎將用戶輸入的 SQL 語句序列轉換為一個可執行的操作序列, 并返回查詢結果集; 批處理主要操作大容量靜態數據集, 并返回計算結果;流處理則對實時進入系統的數據進行計算,處理結果即時可用,并將隨新數據的到達持續更新。 數據服務層的主要作用是提供數
23、據服務的接口,以實現工業大數據的訪問、更新等基本功能。 2.3 數據建模與分析數據建模與分析 數據建模是根據工業實際元素與業務流程,在設備物聯數據、生產經營過程數據、 外部互聯網等相關數據的基礎上, 構建供應商、 用戶、 設備、 產品、 產線、工廠、工藝等數字模型,并結合數據分析提供諸如數據報表、可視化、知識庫、數據分析工具及數據開放功能, 為各類決策提供支持。 工業大數據分析建模技術,已經形成了一些比較成熟穩定的模型算法。 從大的方面可以分為基于知識驅動的方法和基于數據驅動的方法。 有時候數據可視化技術本身也被稱為一種數據分析方法。工業大數據建模分析技術體系如圖 5 所示。 圖6 工業大數據
24、分析技術體系 9 知識驅動的分析方法,是基于大量理論模型以及對現實工業系統的物理、化學、生化等動態過程進行改造的經驗,建立在工業系統的物理化學原理、工藝及管理經驗等知識之上,包括基于規則的方法、主成分析技術、因果故障分析技術和案例推理技術等。其中,知識庫是支撐這類方法的基礎。 數據驅動的分析方法,很少考慮機理模型和閉環控制邏輯的存在,而是利用算法在完全數據空間中尋找規律和知識,包括神經網絡、分類樹、隨機森林、支持向量機、邏輯回歸、聚類等機器學習方法,以及基于統計學的方法。兩類方法的對比如表 1 所示,分別適用于不同的場景。 表 1:工業數據分析的兩類主要方法對比 方法 知識驅動的分析方法 數據
25、驅動的分析方法 優勢 1.有理論基礎和確定的因果關系 2.直觀,容易理解 3.數據量和計算量需求小 1.可以動態調整 2.對先驗知識的依賴程度低 3.建模周期短 劣勢 1.是靜態模型,離線無法動態調整 2.創新理論和模型建立周期比較長 1.數據量和計算量需求大 2.因果關系不明確,可解釋性較差 3.置信度難以達到工業級要求 2.4 決策與控制應用決策與控制應用 根據數據分析的結果產生決策,從而指導工業系統采取行動,是工業大數據應用的最終目的。工業大數據應用可以分為以下 5 大類: (1)描述類(descriptive)應用:主要利用報表、可視化等技術,匯總展現工業互聯網各個子系統的狀態, 使得
26、操作管理人員可以在一個儀表盤 (dashboard)上總覽全局狀態。 此類應用一般不給出明確的決策建議, 完全依靠人來做出決策。 (2)診斷類(diagnostic)應用:通過采集工業生產過程相關的設備物理參數、工作狀態數據、性能數據及其環境數據等,評估工業系統生產設備等運行狀態并預測其未來健康狀況,主要利用規則引擎、歸因分析等,對工業系統中的故障給出告警并提示故障可能的原因,輔助人工決策。 10 (3)預測類(predictive)應用:通過對系統歷史數據的分析挖掘,預測系統的未來行為。 主要是利用邏輯回歸、 決策樹等, 預測未來系統狀態, 并給出建議。 (4)決策類(deceive)應用:
27、通過對影響決策的數據進行分析與挖掘,發現決策相關的結構與規律,主要是利用隨機森林、決策樹等方法,提出生產調度、經營管理與優化方面的決策建議。 (5)控制類(control)應用:根據高度確定的規則,直接通過數據分析產生行動指令,控制生產系統采取行動。 基于大數據的工業決策控制技術的框架如下圖所示。 圖7 工業大數據決策與控制應用技術 2.5 技術發展技術發展現狀現狀 現階段工業大數據的建設仍處于發展極不均衡的狀態,部分先進的工業企業已經利用大數據技術整合各環節數據資源,為生產和服務提供精準的數據支撐,但仍有部分工業企業尚未實現信息化或信息化程度不高, 需要從最底層的設備開始更新與改造,以適應新
28、的數字化生產流程,規范各環節數據資料,結合大數據技術進一步地優化生產過程和服務質量。 在發展工業大數據的各階段下主要出現 11 了以下三個問題: (1) 設備設備老舊老舊導致數據采集困難導致數據采集困難: 在許多制造行業中, 由于仍然使用傳統的生產設備, 并且因為各類原因對產線設備進行更新換代較為困難,一些關鍵的生產數據無法采集,不能全面的監控產線的生產情況。這種情況下,需要在設備上加裝外置傳感器,并對傳感器采集到的生產數據進行實時地匯集監控,來全面感知產線的生產情況。 (2) 數據數據跨平臺跨平臺跨部門跨部門整合整合耗時耗時: 在工業領域進行業務分析時, 往往需要整合多個數據源的信息,這些數
29、據種類繁多、數據量大、數據質量參差不齊,有時甚至需要跨部門溝通,走繁瑣的審批流程,在經過了一系列關卡收集并整理好數據后,由于耗費時間太長,一些具有時效性的數據就會產生價值流失。需要建設持續的、自動化的、全量的數據采集機制,來保證數據的價值被有效地利用。 (3) 初期初期缺乏規劃缺乏規劃導致導致應用豎井應用豎井: 在開展大數據應用的初期, 由于大部分是業務驅動,各項目單獨建設大數據系統,缺乏統一規劃,容易造成應用豎井,數據重復采集、基礎信息不一致,從而不可避免的出現資源浪費、數據關聯性差,無法高效的利用數據價值。所以需要企業有全面的大數據系統建設規劃,對數據進行統一采集和管理,為后續各種場景的分
30、析應用提供良好的數據環境。 12 第三章 工業大數據技術架構實現 3.1 技術組件選擇技術組件選擇 3.1.1 數據采集 隨著工業制造中各層的精細化與制程的高密度化,工業制造所產生的數據必然形成好幾個等級的增長。 面對如此龐大與多樣的數據整合問題, 企業必須有整體統一的數據匯聚與應用策略,設計通用可靠的數據采集機制,來滿足各方面的數據采集需求。數據采集的完整性、準確性,決定了數據應用是否能真實可靠地發揮作用。因此,在建設數據采集系統時,建議著重考慮以下五個要求: (1)數據接口通用性:由于新技術更新換代較頻繁,需要進行版本管理,并定期更新接口,建議用統一的數據交換格式來適應接口頻繁更新的情況,
31、使接口能夠快速調整。 (2)支持廣泛的數據源:采集技術需支持盡可能多的數據源端。 (3) 支持橫向擴展: 當設備增加時, 所造成的性能瓶頸須能通過橫向擴展的方式解決。 (4) 保證數據不遺失: 采集過程中須確保數據準確地、 不遺失地送達處理層與儲存層。 (5) 避免增加基礎建設復雜度: 在不斷擴充設備的情況下, 采集技術不應增加基礎建設擴展時的負擔。 從工業數據的來源進行分類,主要包括管理系統、生產系統、外部數據三大方面的數據來源。 從數據采集的全面性上看, 不僅要涵蓋基礎的結構化交易數據,還將逐步包括半結構化的用戶行為數據,網狀的社交關系數據,文本或音視頻類型的用戶意見和反饋數據,設備和傳感
32、器采集的周期性數據,以及未來越來越多有潛在意義的各類數據。 下表整理出了一些工業大數據系統中常見的數據源及其數據特性,供參考: 13 表 1:常見工業數據源分類 分類分類 系統類型系統類型 典型系統典型系統 數據結構數據結構 數據特點數據特點 實時性實時性 管理系統 設計資料 產品模型、圖紙文檔 半結構化/非結構化 類型各異、更新不頻繁、是企業核心數據 批量導入 價值鏈管理 供應鏈 SCM、客戶關系 CRM 結構化/半結構化 沒有嚴格的時效性要求,需要定期同步 批量導入 資源管理 ERP/OA、MES、PLM、環境管理系統、倉庫管理系統、能源管理系統 結構化 沒有嚴格的時效性要求,需要定期同步
33、 批量導入 生產系統 工業控制系統 DCS、PLC 結構化 需要實時監控,實時反饋控制 實時采集 生產監控數據 SCADA 結構化 包含實時數據和歷史數據 實時采集/批量導入 各類傳感器 外掛式傳感器、條碼、射頻識別 結構化 單條數據量小,并發度大,結合 IoT網關 實時采集 其他外部裝置 視頻攝像頭 非結構化 數據量大、低時延,要求網絡帶寬和時延 實時采集 外部數據 外部數據 相關行業、法規、市場、競品、環境數據 非結構化 數據相對靜止,變化較小,定期更新 批量導入 管理系統數據采集管理系統數據采集: 這里討論的管理系統的數據包括了工業產品的設計資料、價值鏈管理數據及生產過程中的資源管理數據
34、。 1.設計資料:設計資料大多來源于傳統工業設計和制造類軟件,如:CAD、CAM、CAE、CAPP、PDM 等。這類數據主要是各類產品模型,以及相關的圖紙或電子文檔, 大多數為非結構化數據。 這些設計類數據的采集對時效性要求不高,只需定期批量導入大數據系統。 2.價值鏈管理數據: 價值鏈數據主要指企業生產活動中上下游的信息流數據,主要來源于供應鏈管理系統(SCM) 、客戶關系管理系統(CRM)等。這類數據主要包含供應鏈信息和客戶信息,通常是規范的結構化數據,采集時對時效性要求不高,只需按業務分析要求的更新周期定期批量導入大數據系統。 3.資源管理數據:資源管理數據的來源主要是生產環節的各類管理
35、系統,包括企業資源計劃(OA/ERP) 、生產過程執行系統(MES) 、產品生命周期管理 14 (PLM) 、環境管理系統(EMS) 、倉庫管理系統(WMS) 、能源管理系統等。這類數據主要描述了生產過程中的訂單數據、排程數據、生產數據等,大多數為標準的結構化數據,采集時對時效性要求不高,只需按業務分析要求的更新周期定期批量導入大數據系統。 生產系統數據采集生產系統數據采集:這里討論的生產系統數據主要來自工業控制系統、生產監控系統、各類傳感器以及其他外部裝置。 1.工業控制系統數據:工業控制系統數據的來源主要包括分布式控制系統(DCS) ,以及可編程邏輯控制器(PLC)這類系統。通常 DCS
36、與 PLC 共同組成本地化的控制系統,主要關注控制消息管理、設備診斷、數據傳遞方式、工廠結構,以及設備邏輯控制和報警管理等數據的收集。此類數據通常為結構化數據,且數據的應用通常對時效性要求較高, 需要數據能及時地上報到上層的處理系統中。 2.生產監控數據:生產監控數據主要來源于以 SCADA 為代表的監視控制系統。SCADA 系統的設計用來收集現場信息,將這些信息傳輸到計算機系統,并且用圖像或文本的形式顯示這些信息。這類數據也是規范的結構化數據,但相對DCS 和 PLC 系統來說,SCADA 系統可以提供實時的數據,同時也能提供歷史數據。 因此在考慮數據的采集策略時,需要根據上報數據的類型來選
37、擇是實時采集或是批量導入。 3.各類傳感器:在生產車間的很多生產設備并不能提供生產數據的采集和上傳, 因此需要通過外接一套額外的傳感器來完成生產數據的采集。外掛式傳感器主要用在無生產數據采集的設備或者數據采集不全面的設備上、 以及工廠環境數據的采集。同時外掛式傳感器根據使用現場的需求,可以采用接觸式的傳感設備和非接觸式的傳感設備。此類數據的單條數據量通常都非常小,但是通信總接入數非常高,即數據傳輸并發度高,同時對傳輸的實時性要求較高。 4.其他外部裝置:其他外部裝置產生的數據以視頻攝像頭為例,數據主要來源于對產品的質量監控照片、視頻,或者是工廠內的監控視頻等。此類數據的特點是數據量大,傳輸的持
38、續時間長,需要有高帶寬、低時延的通信網絡才能滿足 15 數據的上傳需求。對于其他不同于視頻數據的外部裝置數據,需要針對數據的特性進行采集機制的選擇。 外部系統數據采集外部系統數據采集:外部系統數據主要來源于評價企業環境績效的環境法規、預測產品市場的宏觀社會經濟數據等, 此類數據主要用于評估產品的后續生產趨勢、產品改進等方面,與管理系統的數據采集類似,可以通過標準的 RJ45 接口進行數據的傳輸。 通常本類數據相對靜止, 變化較小, 因此數據的上傳頻次較低。 綜合上述多類數據源的采集場景和要求,系統的集成導入應同時具備實時接實時接入入 (如: 工業控制系統、 生產監控數據、 各類傳感器) 和批量
39、導入批量導入 (如管理系統、外部數據)的能力,同時能根據需要提供可定制化的 IoT 接入平臺。具體建設要求如下: (1) 對于需要實時監控、 實時反向控制類數據, 可通過實時消息管道發送,支持實時接入; 如: 工業控制系統數據、 生產監控系統數據等。 建議可采用如Kafka、Fluentd 或是 Flume 等技術,這類技術使用分布式架構,具備數據至少傳輸一次的機制,并為不同生成頻率的數據提供緩沖層,避免重要數據的丟失。 (2) 對于非實時處理的數據, 可采取定時批量地從外部系統離線導入, 必須要支持海量多源異構數據的導入; 如: 資源管理數據、 價值鏈數據、 設計資料等。建議可采用 Sqoo
40、p 等數據交換技術, 實現 Hadoop 與傳統數據庫 (MySQL、 Oracle、Postgres 等)間大批量數據的雙向傳遞。 (3) 當系統中有大量設備需要并發且多協議接入時, 如各類傳感器件, 可部署專業 IoT 接入網關, IoT 接入平臺需同時具備支持 TCP、 UDP、 MQTT、 CoAP、LWM2M 等多種通信協議的能力。在面對各類傳感器的數據采集時,可以結合 RFID、條碼掃描器、生產和監測設備、PDA、人機交互、智能終端等手段采集制造領域多源、異構數據信息,并通過互聯網或現場總線等技術實現源數據的實時準確傳輸。有線接入主要以 PLC、以太網為主。無線接入技術種類眾多,包
41、括條形碼、PDA、RFID 、Zigbee、WiFi、藍牙、Z-wave 等短距離通信技術和長距無線通信技術。 其中, 長距離無線技術又分為兩類, 包括工作于未授權頻譜的 LoRa、SigFox等技術和工作于授權頻譜下傳統的2/3/4G蜂窩技術及其3GPP支持的LTE 16 演進技術,如 LTE-eMTC、NB-IOT 等。 3.1.2 數據存儲 工業大數據系統接入的數據源數量大類型多,需要能支持 TB 到 PB 級多種類型數據的存儲,包括關系表、網頁、文本、JSON、XML、圖像等數據庫,應具備盡可能多樣化的存儲方式來適應各類存儲分析場景,總結為如下表格: 表 2:各類存儲對應適用場景 類型
42、類型 典型介質典型介質 適用場景適用場景 海量低成本存儲 對象存儲、云盤 海量歷史數據的歸檔和備份 分布式文件系統 HDFS、Hive 海量數據的離線分析 數據倉庫 MPP、Cassandra 報表綜合分析、多維隨機分析 NoSQL 數據庫 HBase、MongoDB 各類報表文檔,適用于簡單對點查詢及交互式查詢場景 關系型數據庫 MySQL、SQLServer、Oracle、PostgreSQL 適用于交互式查詢分析 時序數據庫 InfluxDB、Kdb+、RRDtool 依據時間順序分析歷史趨勢、周期規律、異常性等場景 內存數據庫 Redis、Memcached、Ignite 數據量不大且
43、要求快速實時查詢場景 圖數據庫 Neo4j 分析關聯關系及具有明顯點/邊分析的場景 文本數據索引 Solr、Elasticsearch 文本/全文檢索 在不同的工業數據應用場景中,數據存儲的介質選擇十分重要,下面列舉一些經典的使用場景來介紹如何選擇存儲技術: (1) 實時監控數據展示: 通常情況下實時采集的監控數據在進行輕度的清洗和匯總后會結合 Web UI 技術實時展現生產線的最新動態。這類及時性互動性高的數據一般使用內存數據進行存儲,如 Redis、Ignite 等技術,可以快速響應實時的查詢需求。 17 (2) 產線異常的分析與預測: 使用機器學習技術對產線數據進行深入挖掘分析運行規律,
44、可以有效地對產線的異常進行分析和預測,進而改善制程、減少損失、降低成本及人為誤判的可能性。這類用于分析的歷史數據一般選擇使用HDFS、Cassandra 等分布式儲存,適用于海量數據的探索和挖掘分析。同時,對于這類與時間順序強相關的分析場景,數據的存儲可以選擇 InfluxDB 這類時序數據庫,可以極大提高時間相關數據的處理能力,在一定程度上節省存儲空間并極大地提高查詢效率。 (3) 商業智能: 如果需要整合多種數據來制作商業策略性報表, 適合使用結構化儲存,比如傳統的關系型數據庫,MySQL、Oracle 等。如果需要考慮性能和及時性, 可以考慮分類存儲至 NoSQL 數據庫, 如 Cass
45、andra、 HBase 與 Redis 等。 3.1.3 數據計算 大數據系統通常需要能夠支持多種任務, 包括處理結構化表的 SQL 引擎、 計算關系的圖處理引擎和進行數據挖掘的機器學習引擎,其中面向 SQL 的分析主要有交互式查詢、報表、復雜查詢、多維分析等。 表 3:各類計算引擎對應適用場景 類型類型 典型介質典型介質 適用場景適用場景 實時計算引擎 Storm、Spark Streaming、Flink 設備監控、實時診斷等對時效性要求較高的場景 離線計算引擎 MapReduce、Spark、Hive 適用于大數據量的,周期性的數據分析,例如階段性的營銷分析,或生產能耗分析等 圖計算引
46、擎 Graphlab、GraphX 適用于事件及人之間的關聯分析,比如建立用戶畫像進行個性化定制或營銷 數據綜合分析 OLAP MPP 產線或銷售環節的綜合報表分析 業務交互查詢 OLTP MySQL、SQLServer、Oracle 交互式查詢分析 分布式數據庫中間件 Cobar、TTDL、MyCAT 海量數據高并發時的彈性擴容解決方案 數據挖掘能力 Spark、TensorFlow 需要迭代優化的數據挖掘場景,如故障預測、用戶需求挖掘等 18 1.實時計算引擎,包括 Storm、Spark Streaming、Flink 等業界通用架構,適用于基于窗口或消息的實時數據處理,結果響應的時延要
47、求在毫秒級; 2.離線計算引擎,包括 MapReduce、Spark、Hive,適用于批數據分析和定時分析等; 3.圖計算引擎,適用于事件及人之間的關聯關系分析; 4.數據綜合分析 OLAP,如 MPP 數據庫,適用于綜合報表分析; 5.業務交互查詢 OLTP,如 MySQL、SQLServer、Oracle、PostgreSQL 等,適用于交互式查詢分析; 6.分布式數據庫中間件,可解決數據庫容量、性能瓶頸和分布式擴展問題,提供分庫分表、 讀寫分離、 彈性擴容等能力, 適用于海量數據的高并發訪問場景,有效提升數據庫讀寫性能。 7.數據挖掘能力,為了能夠匹配工業大數據決策與控制應用的 5 大場
48、景,特別是診斷類、預測類、決策類應用閉環的要求,系統應該具備完善的機器學習、深度學習、圖計算等平臺級能力。機器學習能力如基于開源 Spark 框架推出的算法庫 MLlib、 GraphX 等;深度學習有 TensorFlow、Caffe、MXNet 等平臺;圖計算能力,業界相對比較流行的開源產品有 Titan,另外還有很多優秀的商業產品可供選擇。 總體來說,大數據平臺的計算組件應該能夠支持批量和實時兩大類任務,同時具備精細化的任務和資源調度的能力。 3.1.4 混合云架構 結合工業企業的 IT 現狀和對數據安全、建設成本等因素的綜合考量,可以引入混合云架構來滿足現代工業大數據建設的訴求。對實時
49、性要求高,與生產強相關, 特別是需要及時閉環控制的應用系統可部署在線下, 而大數據量的分析類、預測類應用可以部署在云上,尤其是偏物聯網的應用, 這樣可以有效均衡架構的私密性、便捷性、可維護性及性價比。 19 表 4:部署選型建議 類型類型 建議建議 本地化部署 控制系統、 ERP、 MES 等需要實時反饋或者對數據安全要求較高的適合本地化部署 云上部署 偏物聯網相關分析類、 預測類應用可以選擇云上部署 3.2 建設標準建設標準 3.2.1 基礎業務能力 首先要考慮工業大數據系統功能的完整性,即支撐大數據應用全生命周期的基礎業務能力,例如接入、存儲、分析等?;A業務能力的考慮方向主要包括數據導入
50、、存儲與計算、多任務引擎等三方面。 數據導入。大數據系統必須要支持海量多源異構數據導入,具體來說需要支持傳統數據庫、本地、FTP 等多種數據源;支持結構化、半結構化和非結構化數據的導入;支持定時、實時、循環任務的數據導入方式。 數據標準化。系統需要提供能夠對數據進行有效處理和管理的工具能力,使進入系統的數據符合企業的數據治理要求,保證平臺數據的完整性、有效性、一致性、規范性、開放性和共享性。 數據存儲和計算。大數據平臺應該能支持 TB 到 PB 級多種類型數據的存儲,包括關系表、網頁、文本、JSON、XML、圖像等數據庫。平臺的計算組件應該能夠支持批量和實時兩類任務, 同時具備精細化的任務和資
51、源調度的能力。 多任務引擎。 數據平臺需要能夠支持多種任務, 包括處理結構化表的 SQL引擎、計算關系的圖處理引擎和進行數據挖掘的機器學習引擎。其中面向SQL 的分析主要有交互式查詢、報表、復雜查詢、多維分析等。 基礎分析模型。大數據系統應具備基礎的業務分析模型,能夠針對特定場景的分析要求,進行自動化的業務自助分析。 20 可視化報表工具。 大數據系統應能提供生產可視化報表的能力,需要提供常用的折線圖、柱狀圖、餅圖、表格等組件,并支持自定義可視化組件或第三方可視化工具。 3.2.2 數據管理能力 工業大數據系統的基礎數據管理能力1應包括以下幾項: 數據標準制定: 工業大數據系統需要支持統一的數
52、據標準制定,使用合理的數據標準, 可以有效約束平臺數據的完整性、 有效性、 一致性、 規范性、開放性和共享性,從而提高企業進行數據治理的水平。 數據模型管理:數據模型是對數據特征的抽象,用于描述一組數據的概念和定義。大數據系統中的數據模型管理應支持數據模型的設計、數據模型和數據標準詞典的同步、數據模型的審核發布、差異對比、版本管理等。能有效指導企業進行數據整合,提高數據質量。 元數據管理:元數據是描述數據的數據。大數據系統中的元數據管理能對數據進行有效地解釋說明并有助于企業理解數據的真實含義。 數據質量管理:數據質量是保證數據應用的基礎。大數據系統中的數據質量管理機制需要能保證數據的完整性、規
53、范性、一致性、準確性、唯一性和關聯性,來幫助企業獲得高質量的、結構清晰的數據,以更好的服務上層應用。 生命周期管理:生命周期管理是指對數據產生、存儲、傳輸、使用和刪除的全過程進行管理, 依據不同數據在不同階段的價值實施不同的管理策略,降低存儲成本,提升數據價值,以達到最高效的管理效果。 1了解更多行業通用數據治理要求可參考數據中心聯盟發布的數據管理實踐白皮書(1.0 版) 21 數據安全管理: 大數據系統應具備針對數據的安全管理策略, 從隱私保護、信息加密、 鑒權控制、 日志審計等多個方面確保數據安全, 做到事前可管、事中可控、事后可查。 數據開放:數據開放主要指基于數據資源,開展數據共享和交
54、換,通過各種管控機制的保障,使數據能通過標準化接口方式提供給外部需求方,發揮更大的價值。 3.2.3 運維管理能力 大數據平臺在生產環境下的部署、運行與維護,需要做到高可靠、簡操作、易擴展,避免后期維護產生高昂成本。需要從大數據平臺的運維能力、彈性擴展能力和安全防護能力等幾個維度考慮。 運維能力。支持一鍵式或者向導式的安裝部署;支持集群平滑升級;能夠對集群、各類組件、任務狀態進行監控,進行啟動、停止、增加、卸載等常規操作,并能夠配置集群的各項參數;能夠收集集群和組件的運行的日志,對日志進行檢索和下載;能通過界面、郵件、短信等形式對集群的各類故障進行告警,能夠在界面對告警值域進行配置;支持運維用
55、戶的角色分類,支持用戶賬號的增、刪、改,細粒度的權限分配。 彈性擴展能力。 大數據系統需要能隨著數據和業務的快速發展而自由擴展,可擴展性是大數據平臺的重要能力之一, 一是要支持集群的水平與垂直擴展,提升大數據平臺的存儲和計算能力,二是實現數據的快速分布和自動均衡,無需人工過多干預。 高可用。大數據系統需要支持包括數據節點、服務節點、網絡環境的主備切換能力,從而保證服務的延續性。 備份管理。 大數據系統需要具備風險預防機制和災難恢復措施,系統中的數據需要按照不同類別進行不同周期、不同方式和地理位置的區分備份。 22 3.2.4 安全管理 安全管理的目的是為了保證系統安全運行,與此同時防止系統受到
56、外來攻擊、破壞和非法訪問,需要在不同層次利用多種手段來保證系統的安全。安全管理主要包括系統的主機安全、網絡安全、數據安全、應用安全、以及數據訪問審計日志等功能。 安全指標考量大數據系統是否能夠提供基本的安全方案,以防止惡意的訪問和攻擊,防止關鍵數據的泄露,可以從以下幾個方面考量: 主機安全:大數據系統需要選擇安全的操作系統版本,并對操作系統進行基礎的安全配置和安全加固,以確保系統安全、可靠、高效地運行。 網絡安全:網絡系統和服務器系統具有入侵檢測的功能,可監控可疑的連接、非法訪問等,采取的措施包括實時報警、自動阻斷通信連接或執行用戶自定義的安全策略。網絡和服務器系統能定期檢查安全漏洞及病毒,根
57、據掃描的結果更正網絡安全漏洞和系統中的錯誤配置;使用加密技術對在互聯網上傳輸的重要數據進行加密。與外部系統連接配置防火墻設備,并定義完備的安全策略。 數據安全:數據安全是保證數據庫和其它文件只能被授權用戶訪問和修改,防止在本地存儲或者網絡傳輸的數據受到非法篡改、刪除和破壞。數據相關的安全控制包括數據加密、訪問控制、數據完整性、數據防篡改。 應用安全:需要對賬號進行集中管理和統一認證,并對操作進行記錄和審計,防范 SQL 注入、防范跨站攻擊等。 日志審計:對設備日志、操作系統日志、系統平臺日志、應用日志等進行留存和審計。 23 3.2.5 性能要求 需要全面考察平臺在不同數據規模和任務場景下的性
58、能表現。主要的指標有吞吐量、響應時間、最大并發等。實際性能表現需要對平臺進行測試,典型的測試場景包括根據自身業務確定的單項任務和多種混合任務測試, 以及壓力測試和穩定性測試??紤]到大數據系統運營的基本需求,需要考察以下性能項: 平臺性能 計算引擎處理能力 請求響應時延 支持用戶數 支持并發數 數據抽取性能 準實時數據更新時延 日增量數據更新時延 月數據更新時延 網絡傳輸性能 網絡傳輸速度 數據導出性能 數據導出吞吐量 可靠性性能 主備機保證系統 7*24 小時不間斷工作 告警通知時延 每年例外停機時間 主備機切換間隔 系統平均無故障時間 24 3.2.6 開放與兼容性 大數據系統的建設,還需要
59、考慮到開放性與兼容性,能夠與既有系統無縫銜接,能夠兼容支持各類數據源、外圍協同系統及上層各類應用。 開放性。 要求能夠支持主流的開源技術, 比如 Hadoop、 Spark、 MySQL、Greenplum 等開源社區技術,能夠對相關的組件進行替換和更新,方便集成與優化。同時提供開放接口,支持與各類外部系統的對接。 兼容性。由于傳統用戶的大部分數據分析任務是以結構化數據為主的SQL 任務,為了節約學習成本,實現平穩過渡,大數據系統要求能兼容更多的 SQL 的標準和語法;其次需要支持 JDBC、ODBC 等通用接口, 從而保證對接傳統的數據庫、 上層 BI 工具等各類上下游產品, 方便系統和應用
60、開發的便捷性;系統還需要能夠支持異構的硬件和不同的操作系統,從而保證上層應用對于異構軟硬件設備透明能力,充分利用各類資源。 25 第四章 總結與展望 隨著對工業大數據體系架構研究的不斷深入,我們將現階段工業大數據系統建設的幾個要點列舉如下: 一是跨層次跨環節的數據整合。當前的工業數據以水平來看分散在研發設計、生產管理、企業經營等各個環節,垂直來看分散在生產現場、企業管理等不同層次, 為了更好地支撐生產經營各環節的應用分析需求,需要更深入完整地進行數據整合。 二是選擇合適的架構進行系統的部署及數據的集成。大數據系統的實施需要充分考慮企業現狀,以及對數據安全、建設成本等多項因素的要求,有效結合本地
61、化服務與云服務,以達到最佳的使用效果。 三是建立適合企業的資產管理機制,將數據看作企業資產,梳理并明確各類數據的意義,形成企業級甚至行業級的通用數據模型,制定數據安全管理規范,對數據進行高效管理,提升數據質量,以實現更大的價值。 四是關聯工業生產各環節的數據進行分析。工業生產流程和經營流程環環相扣, 每一步的變動都可能影響到下一步的發展,數據分析也應與工業系統的各環節緊密結合, 以形成閉環的設備、 生產現場及企業運營管理優化的整體態勢分析。 本白皮書描述了工業大數據系統在建設初期最基礎的技術架構要求,而工業企業建設大數據系統的最終目的是為了解決生產和經營中的實際問題, 為企業切實地節省資源成本
62、,帶來利潤地增長。大數據價值的實現是很長的一段路,需要我們不斷地進行摸索,使數據真正地運用起來。在互聯網時代,各家企業不僅需要在技術上深耕, 更要以開放的眼光看待整個產業, 積極地貢獻和分享建設經驗,使好的案例能在行業快速的復制推廣,在實現自身價值的同時,加速推進整個產業的變革。 26 附錄一:典型案例 一一、 富士康富士康 NPI 制造大數據制造大數據 1、 案例背景與業務痛點 新產品制造在 NPI(New Product Introduce, 新產品導入)階段需在有限的時間內使得每個步驟都達到客戶的規格要求。整個 NPI 的生命周期可以分成: (1)Proto 原型機階段 (2)EVT 工
63、程驗證測試階段 (3)DVT 設計驗證測試階段 (4)PVT 生產驗證測試階段 (5)Ramp 快速爬坡 (6)MP 量產階段 也因此,在每一個階段工程單位與測試單位都需要完整的生產信息與關鍵物料信息的整合,協助 FA(Failure Analysis)工程師與 RD 工程師合作,進行問題分析與解決方案設計。 由于每一個階段都是分秒必爭,并且還要能快速反應問題,求新求變,必須在限定時間內分析所有的問題且找出原因(當天的問題當天解決) 這將是一個高度困難的挑戰與目標。而為能加快 FA 工程師分析的速度以及有更多的時間做進階數據分析,快速收集所有生產信息,甚至往前追溯上游供應鏈關鍵信息都是非常必要
64、的,但卻又相當耗費時間。 依據過去的經驗,工程師通常會花費 80%的時間做數據收集與整合,卻只用20%的時間做數據分析與問題診斷。 我們期望一個完善的 NPI 大數據平臺能夠扭轉這個局面, 讓工程師只需要投入 20%的時間做數據收集, 而能夠留下 80%的時間做深入的數據分析與解析。因此,NPI 制造大數據平臺確實有其必要性,并且 27 非常適用于各個制造行業在新產品開發時的業務需求。 NPI 制造大數據平臺主要解決以下兩個業務痛點: 1. 數據收集整合耗時且復雜: 由于分析所需的數據橫跨五個以上的孤島系統、且涉及不同部門,工程師需要與不同部門進行溝通,并且切換不同系統以取得數據;而取得的數據
65、格式不盡相同,甚至有些數據為非電子文件,工程師需手動一一將各個脫機數據進行輸入、整合、清洗、整理成自已分析所需的格式,如此一來,僅一個問題的數據收集就花費 4 個小時以上了。 2. 涉及信息太多: 數據包含產品各階段的生產數據(產品測試數據、產線組裝數據、進料檢驗數據、關鍵物料數據、供貨商數據等) ,且各類數據量都很大(例如工站的監測項就有上千個, 甚至上萬個) ; 手動整理數據容易發生錯誤, 且不易查覺錯誤點;再者,各分析軟件有處理數據量的上限,使用分析軟件進行實時數據增加、刪除皆屬不易,如此一來,真是耗時耗人力。 2、 解決方案 本案例主要采集來自不同系統的數據,并通過數據整合處理運算及應
66、用模塊(DIF&SMC)進行數據集成與處理并建立分析工作流模塊、數據查詢模塊以及知識庫檢索模塊(KM)作為數據建模與分析層來分別提供通用性分析應用、FA分析平臺決策及知識庫驅動分析應用。實施概況如下。 1. 數據來源 (1)產品測試數據 該數據為產品在各工站的檢測數據,來源包含四個異質系統。 (2)產線組裝數據 該數據為產品在工站中的組裝流水線信息,來源包含兩個異質系統。 28 (3)進料檢驗數據 該數據為產品的物料在進貨時的檢驗數值,來源包含兩個異質系統。 (4)關鍵物料數據 該數據為產品上所使用關鍵物料的相關數據,來源包含兩個異質系統。 (5)產品組合數據 該數據為產品的各模組元件相關數據
67、,來源為一個系統。 (6)關鍵尺寸數據 該數據為產品的尺寸相關數據,來源為一個系統。 2. 技術方案 (1)NPI 大數據平臺整體架構 此平臺以基礎數據為基底,通過 SMC(Spark, Mesos, Cassandra)三套開源大數據產品將關聯性數據進行整合,再由 DIF(Data Integration Framework) 架構進行數據處理運算提供多維度整合性數據至 DSP(Data Service Provider) API、分析工作流等服務, 系統應用層利用多維度數據進行通用性分析、 FA 分析及查詢服務。如圖 1 所示,分述如下: 數據采集層:數據采集層應考慮應業務需求如何有效且完
68、整的取得異質系統的數據。因采集的數據來源有內部系統、外部系統、及非系統化的本地文件等,所以需要根據各異質系統進行數據交換,分別利用系統接口、 網絡爬蟲轉換文件格式儲存及電子郵件方式等交換取得各數據。 數據處理層:此層級運行包含 SMC、DIF 及 KM。數據處理層主要考慮為各異質系統數據進行關聯整合, 因此必須著重于數據清洗、 數據理解及數據的關聯,才能夠提供分析層有效的模型處理。 a) KM 主要接收各類型文檔進行分類儲存、解析內文、并利用 Elastic Search(一套支持全文檢索的開源項目)進行建立索引庫及支持文件內全文檢索服務。 29 b) SMC 及 DIF 另述于后。 數據分析
69、層:數據分析層包含三個項目,分別為 DSP API、分析工作流、KM API。分析層構建 API 主要是為了提供分析模型并有效率地產生關聯性數據的業務需求而構建分析工作流。 a) DSP AIP:通過 API 方式將產品關聯性數據提供給 FA 分析平臺。 b) 分析工作流:用戶自定義需求數據字段通過 stored procedure 定期向DIF、SMC 索取關聯數據,并整合成多維度大表數據,提供數據應用層分析功能使用。多維度大表在本項目中是一個非常重要的核心功能,透過多維度大表將各種數據源依據用戶單位本身業務上的需求,進行數據的關聯性分析與整合, 所涵蓋的數據屬性(Attribute)數量從
70、上百個多至上千個字段,滿足用戶單位在海量數據信息中,挖掘對于業務問題能夠使用的關鍵小數據,進行問題成因分析。 c) KM API:數據應用層透過 API 進行檔案增、刪、修行為,且進行字段式及全文檢索式的檔案搜查。 數據應用層: NPI 大數據系統包含三大應用模塊,分別為 FA 分析平臺、通用性分析、以及知識庫搜尋模塊,分述如下。應用層實現用戶在單一平臺中快速取得需求數據,可于八成時間內處理日常作業(FA 分析平臺) ,并可利用其余二成時間進階分析數據(通用性分析) 。再者,知識庫可以滿足工程師之間的技術傳承及新人訓練,幫助自主學習成長,并減少工程師的溝通教學時間。此應用讓工程師的時間得到最有
71、效的利用。 a) FA 分析平臺:工程師在進行 FA (Failure analysis)時,通過 API 實時取得產品組裝、測試結果、物料資訊等更多相關數據,減少工程師四處搜集數據,加速問題解決,可取得更多的時間進行更多、更進一步的分析作業。 b) 通用性分析:工程師于 FA 工作之時或之余,利用通用性分析工作流提供的多維度表分析批量數據, 通過七大分析工具 (散點圖、 箱體圖、常態分布圖、直方圖、線圖、良率報表、測項名稱比對)洞察數據潛 30 在的問題;并可針對 golden case 建立定期報表,由系統自動根據設定條件定期檢驗潛在問題,工程師可偵測問題并實時解決問題。 c) 知識庫搜尋
72、模塊:工程師在解決問題時可通過搜索模塊來取得相似問題查看,無需一一向他人詢問,即可以學習前人經驗,以達到在線學習及經驗的傳承。 圖1 平臺整體架構圖 (2)數據流 本案并沒有通過傳感器直接讀取產品參數,因為本項目所收集的數據主要以工程導入及測試記錄為主,故可以分成三大類: 1.通過生產系統的接口獲取數據,2. 制造單位定時發送email提供物料組合配方信息 3. 利用網絡爬蟲掃描系統接口查詢報表轉換數值數據等三個主要方式。收集的數據類型包括了:產品測試及組合、產線組裝、進料檢驗、關鍵物料及關鍵尺寸數據等。構建數據整合與應用模塊,將收集到的數據進行清洗、整理等工作,并依需求產制相關多維度大表提供
73、應用,以達到基礎數據完整的目標。 31 圖2 系統數據流示意圖 (3)基礎數據整合架構 DIF 主要包含三個模塊:數據整合、數據處理運算、及信息呈現。 數據整合(Collection Modules、Transfer Modules)方式主要透過實現一個真實案例所需的數據來源,為驗證案例并進行調整。 數據運算(Analysis Modules)則是將真實案例所需要的參考信息,預先整理(計算、 統計、 多系統串連) 匯整成一信息整合包, 形成一個數據分析處理流程。 信息呈現 (新應用模塊) 提供一個符合用戶需求的操作接口及相關應用工具,并整合于原系統中,產生新的應用模塊。 圖3 DIF 架構圖
74、32 3. 項目其他亮點 在大數據平臺中特別增加兩種矩陣式分析模型:工站良品率分析矩陣圖及物料組合優化矩陣圖。工站良品率分析矩陣圖: 主要查看工站測項在不同時間段下的趨勢表現。物料組合優化矩陣圖:主要不同物料在不同供貨商組合之下的趨勢表現。 用戶可通過工站良品率分析矩陣圖得知表現最差的測項, 并通過物料組合優化矩陣分析圖來針對該測項取得最佳物料的供貨商組合, 以達到良品率的提升。 3、 實施效果與推廣意義 1. 時間短:數據整合收集所需時間大幅減少,由以前耗時 24 小時,提升至數分鐘以內。 2. 數據廣:整個 NPI 周期大約會生產 5 萬個產品,而 NPI 產線大約 150 個相關產品測試
75、數據完整收集,涵蓋 400 多個關鍵物料及平均 2000 個測試項目,特定工站更高達 4 萬個測試項目。NPI 大數據平臺每日數據吞吐量大約 22 萬筆原始數據檔案。 3. 效率快:工程師將原來數據收集的時間專注用來解決問題,并可利用剩余時間進一步分析預見問題。扭轉過去 80/20 法則,讓工程師只用 20%時間收集數據整理數據,便能充分投入 80%時間專注在問題解決上。 4. 傳承快:前輩工程師將個人的經驗時時累積于平臺上,新人工程師可隨時事半工倍地學習前人的知識。 4、 案例亮點 利用 NPI 大數據提升 FA 工程師的數據分析能力。 分析工程師依經驗及型態可區分為五種類型。經驗值較一般的
76、分析工程師可在 FA 分析平臺上解決問題并同時學習前人的經驗;經驗值較高的分析工程師則在通用性分析中預見問題,以加速預防問題;有經驗及具備統計軟件使用經驗的分析工程師可利用多維度大表分析解決客戶問題; 具備研發能力的分析工程師可 33 運用建模軟件進行分析模型研究; 具備算法能力的分析工程師則通過程序開發最新且先進的模型研究。每個步驟都是可累積經驗并進行學習成長的。 此平臺不僅可解決問題、預見問題、累積知識、經驗傳承,并通過多維度數據的串聯供不同階段工程師進行開發、研究以及回饋,使得工程師與系統共同成長。 圖4 數據分析階段性應用 二二、 中國聯通工業大數據采集分析平臺中國聯通工業大數據采集分
77、析平臺 1、案例背景與業務痛點 為貫徹落實中華人民共和國國民經濟和社會發展第十三個五年規劃綱要和促進大數據發展行動綱要 ,加快實施國家大數據戰略,推動大數據產業健康快速發展,工信部編制了大數據產業發展規劃(20162020 年) 。中國聯通大數據業務開展的非常早, 多年數據的持續積累為后續大數據分析和應用提供了良好基礎。 中國聯通大數據平臺可以實現對 IT 生產系統、 業務平臺、 通信網絡、外部互聯網、合作伙伴 5 大類數據采集,覆蓋客戶數達到 4 億,日處理數據超4000 億條, 高價值結果數據沉淀超過 17PB。 大數據水平處于國內行業領先地位。工業行業是中國聯通產業互聯網戰略的重點方向,
78、 而在當前的制造工業實施過程當中, 很多的機床由于歷史原因,無法通過數據總線采集上報機床的關鍵運行數 34 據,企業在生產過程當中對產品的品質控制、良品率的提升無法開展。因此在國內大部分制造企業不更新換代設備的基礎上,如何采集、分析生產過程中的各種關鍵數據,是目前實施工業互聯網戰略的重要難題。 1.1. 項目簡介及目標 中國聯通工業大數據采集分析平臺針對生產車間內的機床、環境等各種可能影響產品質量和成品率的因素進行了采集, 通過大數據的方式實現對生產過程的優化、機床配置數據的改進等,以提高企業的生產制造良品率。 2. 項目目標 平臺的目標是通過工業級的采集傳感器進行第一手關鍵生產數據的采集,通
79、過無線物聯網的方式回傳至大數據平臺, 以大數據分析的結果反向回饋到生產制造的設備配置、使用、工藝改進等一系列過程中,以便企業能有效的提高產品的質量和成品率。 2、解決方案 1. 數據來源 大數據平臺數據來源主要包含三大類: (1)生產傳感器數據 主要包含了機床生產制造過程環節數據,主要有類似應力、表面溫度、傳輸壓力、傳輸流量等數據。目前以單車間 1000 個采集傳感器來計算,平均每 20 秒上報一次數據,數據包大小以 200KB 為平均量,那么單個車間每天將有 824GB的數據量產生。 (2)車間環境傳感器數據 環境傳感器采集工廠內部的各種環境數據,提供對機床設備運行和設備使用壽命,工廠內工作
80、人員的健康狀態的影響評估。采用 NB-IoT 物聯網絡進行數據實時采集傳輸。 35 (3)現場總線上報數據 主要針對工廠內機床設備的對應配置參數,可以提供總線數據開放的部分進行采集。 (4)生產系統數據 對接生產系統的排產計劃,產品的技術檢驗技術要求等數據 2. 技術方案 中國聯通大數據采集分析平臺主要集成工廠數據采集、大數據分析平臺能力,具備支持各類合法的通訊芯片和模組、傳感器、連接管理平臺、計量器等儀器儀表設備接入,加工并處理數據資源,支持多種應用的分發和部署,實現資源、組件能力的快速部署、管理,解決工業互聯網設備的數據接入問題,降低使用的技術門檻及運營成本,提升開發效率。在系統層面上,平
81、臺具有向上與微服務和能力化應用對接,提供基于工廠生產數據的服務,向下具備收集基于工廠傳感器數據,兼容各種物聯網設備,支持數據的實時和非實時傳輸。 在能力層面上,平臺應具備數據采集能力及大數據能力,涉及數據存儲、清洗過濾、分析挖掘、接口封裝等過程,實現各類資源的統一調度以及各種能力的快速部署。 物聯網大數據平臺類框架如圖 1 所示。 36 圖1 物聯網大數據平臺框架 大數據平臺提供工廠內大數據應用所要求的各個性層次、規模層次的數據存儲、數據加工作業、數據分析挖掘、數據安全審計等功能,保障用戶數據安全和服務穩定,并提供一系列工具協助用戶開發調試、監控性能和優化任務執行的大數據能力平臺。工業大數據平
82、臺架構主要包括數據接入層、數據匯聚層、數據挖掘層、數據應用層、以及相關的數據接口等部分。 (1)數據接入層和數據匯聚層:解決數據獲取和管理 數據接入層主要功能是通過通訊芯片、模組、傳感器、連接管理平臺、計量器、以及終端設備等儀器儀表獲取的環境、資產、運營狀態等數據信息,是數據匯聚、存儲、加工等操作的前提條件。 數據匯聚層主要功能是將傳感器終端設備采集的數據信息,按照相關要求進行清洗、入庫、存儲操作。 數據匯聚層數據交換(Restful /Thrift/API)數據挖掘層工業大數據應用層機床自優化配置接入層MysqlOracleImpalaHbaseRedisMRHiveSparkFlumeSt
83、ormKafkaSMP DBMPP DBK-V DB計算數據清洗數據解析 數據告警報表分析大數據分析 實時計算(Storm/Spark Streaming)離線計算(MapReduce/Hive)工藝偏差糾正產品良品優化計劃質量預測 通訊芯片/模組傳感器大數據分析挖掘模塊采集終端狀態采集終端歷史狀態/軌跡指令下發數據訂閱與發布終端設備北向接口計量器連接管理平臺專用網元排產計劃平臺南向接口 37 (2)數據挖掘層:解決物聯網數據實時和非實時處理 數據挖掘層主要功能指對經過清洗加工后的數據進行數據分析挖掘操作,按照實際需求,通過數學建模等手段,充分挖掘采集到的數據中所包含的信息。 (3)數據應用層
84、:解決工廠內大數據應用模式問題 數據應用層的主要功能是將平臺功能與實際行業相結合,提供基于真實的應用案例的若干典型應用模型框架供用戶直接使用,也提供復雜應用定制的服務。 3. 項目其他亮點 工業級的傳感器數據采集解決方案為工廠內特殊環境的數據采集提供可靠的解決方案,解決目前常見環境的傳感器無法應用與工業生產環境的問題。 3、實施效果與推廣意義 客戶企業在應用本平臺解決方案后,有效提高了生產設備數據采集效率,并對設備的維護效率有很大提升。 同時通過大數據的采集和分析提高產品的良品率,達到了降本增效的目標。保守估計,項目解決方案全面部署后,每年將為客戶節省約 3000 萬成本。 4、案例亮點 采用
85、外部傳感器數據采集方式完成非開放總線數據生產設備和非數據化生產設備的數據采集工作,將無法聯網無法數據化的生產過程進行數據化,在線化管理,為工廠生產過程中的工藝改進,良品率提升提供了數據基礎。 三三、 華為云華為云 EI 企業智能打造智能化九州通企業智能打造智能化九州通 九州通是一家以藥品、 醫療器械、 生物制品、 保健品等產品批發、 零售連鎖、藥品生產與研發及有關增值服務為核心業務的大型企業集團。 目前公司針對 B 端客戶有 15 萬多家,C 端客戶已達 1050 萬以上。旗下醫藥流通公司達 130 多家,覆蓋了中國整個行政區域 95%以上,在新疆、西藏都有子公司,并在未來三年, 38 公司計
86、劃拓展到 300 到 400 家的規模。2016 年,九州通的營業額達 615 億,不過九州通的野心遠遠不止是數字的增長, 除了要在 2019 年營業收入達到 1016 億之外,還要實現一個智能化的九州通。 同時,九州通認為自己面臨兩大挑戰:第一是持續創新,只有創新,才能從容面對市場競爭,有助于構建企業自身核心競爭力;第二是對市場變化和企業自身業務發展需求的快速響應,傳統靠業務驅動 IT 的發展方式是不夠的,九州通認為更應該是戰略驅動 IT, 要更多關心企業將來發展戰略方向是什么, 所以未來九州通的企業定位是要做業務創新的推動者。 而 IT 或技術本身就是第一生產力,在業務同質化的今天,更多的
87、是強調 IT 的創新,現在 IT 創新就是要依靠云技術。這時,九州通和華為云走到了一起。 1、案例背景與業務痛點 現如今,在阿里巴巴,京東等企業的帶領下,物流行業發展迅速,先后實現了無人倉,機器人揀貨等快速物流作業方式,而九州通依舊沿用人工揀貨方式。導致在企業業務快速發展的同時,物流卻止步不前,越來越無法滿足業務的需求。 1. 揀選路徑優化 在醫藥行業中,發貨時比較零碎并且不集中的情況比較嚴重,九州通下屬的二級公司 1 個揀貨員一天揀貨平均明細為 1,000 條,步數 30,000 步(約為 20 公里) ,導致揀貨員超負荷作業,并且效率有明顯的不足,急需優化揀貨路徑,提升效能。 2. 派車路
88、徑規化 目前九州通的訂單量在醫藥行業是比較大的,每天的訂單量動輒上千,派送車輛動輒幾十輛。在調度每輛車的派送訂單和送貨路線時,調度員依據經驗選擇訂單集合和派送點集合。結果是,車輛軌跡在地圖上十分混亂,整體成本居高不下。 39 3. 智能裝車 目前九州通的配送模式為當天配送,但是在配送過程中對于客戶的距離遠近及配送順序都是憑借配送司機經驗來進行選擇性的配送, 在這個過程中無法準確的判斷哪些客戶群體距離比較近、配送比較快;哪些客戶距離比較遠、需要最后進行配送等,并且在配送過程中對于小客戶很多時候無法很好的支持配送到位,對于客戶方面,客戶也無法具體知道自己的藥品當前還需要多久送到。因此希望通過智能裝
89、車與配送達到根據客戶距離遠近及配送緊急程度等要求, 來計算出最優配送線路與到達每個客戶的時間點, 以便于配送員配送且能讓客戶知曉當前配送狀態以及何時能到貨。同時,針對部分小客戶也能達到支持配送的目標,提高小客戶滿意度與訂單數。在裝車的過程中,若能告知如何裝車,則能夠將車輛的容積利用最大化,減少車輛利用率。 4. 篩選熱銷品種,提升出庫效率 在醫藥行業中,物流倉庫的貨位零散多變,對于熱銷品并沒有固定貨位,也無法根據季度來判斷哪些是熱銷品,因為貨位的多變, 很多熱銷品就藏茫茫貨位中,揀貨員總是要去尋找,耗時耗力。若能通過計算一個月及一個星期的效率來進行預判, 哪些品種當前會銷售多少,將熱銷品的貨架
90、固定在距離復核臺最近的地方,在揀貨員作業時,能達到 80%的時間都是在熱銷區域進行作業,這樣針對作業效率的提升有助于當前整個作業的提升。 5. 識別商品電子監管碼 按照國家藥監局的要求,每個藥品都需要追溯其流向,而電子監管碼就是藥品追溯的唯一條碼,在公司進行物流作業的同時,需要將其錄入到系統中,方便追溯,現有模式是采用掃描槍進行掃碼復核,一個任務若有 100 個商品,則需要花費 30s 左右,若利用 OCR 技術進行識別掃碼,希望可以達到 10s 完成。 6. 發票識別 按業務日常需要, 在勾兌上游客戶發票的時候, 必須要發票和單據明細掛鉤,現在的處理是要采購員來對著發票內的明細進行一一勾兌和
91、錄入,操作簡單,但繁瑣耗時間,若能夠通過 OCR 技術實現自動勾兌自動錄入,則會很大部分的節 40 省人員時間,提升效率。 7. 銷售預測 對各零售平臺的數據無法準確預測,指導生產和物流。 8. 大數據平臺 集中平臺,無法將能力較好的開放出去給其他營業部門使用 2、解決方案 九州通公司基于華為云建設工業領域集成平臺,聯接企業、供應商和客戶,打通業務全流程,打造全面協同的醫藥產業鏈。九州通公司希望通過“云和物”實現全聯接,做智能化九州通公司。 本項目中主要業務痛點和項目目標為: (1) 派車路徑規化派車路徑規化: 調度車輛和送貨路線時, 依據經驗選擇訂單集合和派送點集合。導致車輛軌跡在地圖上十分
92、混亂,整體成本居高不下。 (2) 倉儲規劃倉儲規劃: 物流倉庫的貨位零散多變, 揀貨員總是要去尋找, 耗時耗力。 (3)發票識別發票識別:靠人工發票內的明細進行勾兌和錄入,繁瑣耗時間。 (4)銷售預測銷售預測:對各零售平臺的數據無法準確預測,指導生產和物流。 (5) 大數據平臺大數據平臺: 集中平臺, 無法將能力較好的開放出去給其他營業部門使用。 41 圖1 九州通 EI 企業智能解決方案架構圖 1. 路徑規劃方案路徑規劃方案 華為云智能物流服務通過高效的機器學習和優化算法解決了多個物流場景的優化問題,并同時能滿足實際場景中的多項限制條件。路徑規劃是其中一個場景。 圖2 華為智能物流整體解決方
93、案 路徑優化關鍵輸入、輸出分析詳解: 該服務主要解決多訂單多地址運輸的物流優化,根據訂單信息以及地圖信息,在滿足訂單限制和運輸工具限制的前提下, 基于用戶給定的距離信息或地圖信息,給出最優的運輸策略, 降低運輸成本。 該服務的輸入是訂單以及運輸工具的信息,輸出為運輸工具的運送策略。 42 圖3 路徑優化方案架構設計 方案方案亮點亮點: (1)提供兩套算法(蟻群和遺傳) ,根據實時性要求進行選型: 高實時性(1 分鐘內) :蟻群算法,少量迭代能獲得次優解; 低實時性(半小時內) :遺傳算法,收斂時間長,能獲得更優解; 訓練好的模型, 直接發布使用; 客戶直接遠程進行 API 調用即可, 使用簡單
94、。 (2) 通過先全局分區域聚類訂單再局部優化路徑, 能達到更加優化的效果。 2. 大數據大數據平臺平臺云上遷移云上遷移方案方案 圖4 九州通大數據平臺云上遷移方案架構 43 數據數據來源來源: (1)ERP 系統銷售數據 (2)門店發票 (3)倉庫管理系統 (4)運輸管理系統 (5)已有大數據平臺 實施方案:實施方案: (1)數據源存儲在原始 Oracle、MySql 等數據庫中,數據通過已有的數據采集軟件和公有云實時消息 DIS 服務,用于實時增量抽取數據上公有云; (2)對于生產業務系統,搬遷上云后,采用華為 CCE 云容器技術,方便應用的快速遷移和擴、減容;同時傳統 MySql 數據庫
95、可以用公有云服務 RDS 來替換; (3)需要實時處理的數據一部分會通過 SparkStreaming 做基于窗口的實時統計分析,一部分會基于 Elasticsearch 構建分詞檢索,用于后續日志查詢; (4)所有原始數據無需存儲在本地 HDFS 盤中,只需存儲在 OBS 對象存儲中,通過 MRS 集群及時分析,結果寫回 OBS,極大降低了成本。 方案方案亮點:亮點: (1) 大數據技術棧的全集, 全面兼容開源大數據接口, 方便線下大數據快速上云 (2)集群全托管模式,自動集群創建、擴減容管理 (3)按需使用,存儲、計算分離,節省 50%以上成本 (4)入門簡單,界面友好,簡單點擊幾個按鈕就
96、可完成 (5)無需購買安裝服務器、手工部署和調優 Hadoop、Spark 44 3. 銷售銷售預測分析預測分析方案方案 圖5 銷售預測分析流程圖 通過 23 年的每天的歷史銷售數據,預測下周或下月的銷售額度,項目中涉及近 3 年各類千余種藥品的大量銷售數據,幾百萬條銷售記錄。 (1) 異常異常數據數據識別識別分析:分析: 原始數據中有客戶是累計幾天才上報一次, 導致某天的銷售額極高,影響正常數據的預測。通過 PCA 統計分析模型,提前將異常數據過濾掉,保障數據的精確性。 (2)數據數據預測周期分析:預測周期分析:一般周六、周日銷售額都比較低,如果按天維度進行預測,會出現很大的波動;后面統計認
97、為,按周分析是最佳度量。 (3)預測預測算法:算法:采用時間序列模型分析,能夠對長期趨勢、季節變動、循環變動等進行建模預測。 (4)模型模型固化:固化:模型固化成 Notebook 模板,需要預測時只需要更新原始數據,直接 Run 一遍即可。 方案方案亮點:亮點: (1)全流程平臺化操作,支持 Workflow 和 Notebook 拖拉拽方式建模 (2)能夠固化算法模型,后面數據定時導入預測,模型自動修正預測 (3)算法模型可方便共享發布,支持標準 PMML 模型文件和 jar 文件方式 (4)訓練的模型、評估結果每個階段均可視化支持,提升模型的可解釋性 45 4. OCR 增值稅發票增值稅
98、發票單據識別單據識別方案方案 圖6 OCR 單據識別架構圖 通過 3 個多月,針對近 5,000 張原始單據以及近 10,000 張其他單據的訓練,識別準確率提升到 98%以上; 并集成常用藥品名稱語料庫, 大幅提升識別準確率;內置了表格自動識別算法、文字分離模型、小數點、字符等后處理增強算法。 方案方案亮點亮點: 能較好的處理如下場景: (1)圖像模糊、扭曲、傾斜、噪聲 (2)中英文混合、小數點、特殊字符 (3)蓋章、錯行支持 (4)表單格式多樣支持 3、實施效果與推廣意義 1. 派車路徑規化: 經過使用華為云倉庫揀零路徑規劃服務后,揀貨員的揀貨路徑明顯規律許多,總體揀選步行里程減少到 20
99、,000 步出頭,效果提升近 30%。 經過使用華為云路徑規劃服務的優化后,車輛配送效率顯著提高,在嚴格滿足運行時間的限制條件下,同一批訂單派送所需車輛有效減少,平均每輛車的派送能力提升近 5 倍。 在采用華為云智能裝車服務后,由于送貨批次在裝車時已經考慮,所以在裝卸貨時的效率提升;同時,車輛的裝載率也提升了 10%,結合較優的路徑規劃結 46 果,整體配送成本大幅降低。 2. 倉儲規劃: 通過使用華為云倉庫入庫儲位優化,計算出藥品的整體重要程度,然后將重要性高的藥品擺放到出庫成本低的儲位,大大降低了揀貨員的作業成本。 3. 發票識別: 通過使用華為 OCR 識別服務進行掃碼識別, 藥品復核時
100、間從 30s 降低到 10s內,大大提升業務效率。 通過使用華為 OCR 識別服務進行發票識別,實現信息自動勾兌錄入,大大提升采購員的效率,節省人力成本。 4. 銷售預測: 更有效的指導生產,同時能實時更新預測模型。 5. 云上大數據平臺: 讓開發和平臺能力共享更加的便捷,降低九州通公司自身運維成本。 4、案例亮點 項目的先進性與創新點在于充分利用華為云所提供的企業智能服務 (EI) , 用人工智能、大數據等技術,同時采取公有云和線下結合的方式,精準找到企業可快速改進點,迅速落地,幫助九州通公司改善物流路線規劃、倉儲規劃、發票識別、銷售預測等業務需要,一步步朝著智能的九州通公司邁進。 (1)
101、智能物流服務: 提供靈活可定制的 API, 能滿足客戶不同的個性化需求。 (2)OCR 服務:通過高效的深度學習和圖像處理算法,實現了多種類型單據的文字內容識別,滿足客戶信息自動化錄入需求,大大降低客戶人力成本。算法的性能和精度均領先同行。 (3)機器學習平臺:通過 Notebook 可編程方式,固化銷售預測模板。 (4) 大數據云平臺: EI 大數據平臺遷移線下系統, 更利于全國接入提供服務。 47 四四、 濰柴濰柴工業大數據工業大數據平臺平臺 1、案例背景與業務痛點 濰柴工業大數據平臺是工信部 “智能制造” 專項項目大數據平臺的重要組件,同時也是智能制造必要的平臺和支撐。智能制造對 IT
102、技術提出更高要求,急需工業大數據平臺做支撐。 多個智能制造項目均需分別建立大數據平臺。平臺重復建設耗費精力,項目數據之間無法互聯互通,制約數據關聯及價值挖掘的潛力前提下,需要全新的技術能力與架構提供更強大的數據存儲、治理、計算和調度能力。同時濰柴搭建統一的大數據運營管理平臺需求明確,建設企業統一的大數據運營管理平臺,做數據積累,提升數據價值密度,為后期數據挖掘提供平臺支撐。 1. 項目背景及業務痛點 濰柴作為中國傳統制造業的杰出代表,需要進一步適應工業發展潮流,占領工業 4.0 時代的科技制高點,引領行業發展。濰柴傳統制造業轉型升級的方向就是邁向智能制造。在“中國制造 2025”框架下,智能工
103、廠的標準體系是非常重要的一個環節。濰柴當下正在積極實施工業 4.0 的建設,搭建工業大數據平臺,從底層實現數據采集和互聯互通,從數據層面洞察制造信息,進而打通從研發到生產管理的整個流程,為企業的生產和發展提供新的模式和思路。 通過電信對濰柴大數據團隊培養,可獲得大數據系統建設能力。本項目將獲得與中國電信共有的大數據服務能力,通過二次定制開發,電信可支撐濰柴對外提供相關服務,將能力有效商品化。在支撐濰柴內部業務同時,可適時商品化成為一家專業的工業大數據服務提供商,填補國內工業大數據服務空白,增加工業制造領域影響力。為我國智能制造樹立標桿,將產生廣泛的社會價值。 生產排程管理作為智能制造的一個重要
104、環節,本項目通過融合生產排程與工業大數據技術,可以提供精準化、智能化的生產排程能力。 2. 項目簡介 48 濰柴大數據平臺圍繞“互聯網+工業制造”建立一套互聯網+制造融合創新模式平臺,平臺在工業應用云、公有數據云、私有數據云建立智能應用平臺。通過電信的云基礎平臺結合工業 PON、LTE 專網實現工業智能網關的感知并接入生產相關制造數據,形成濰柴工業大數據云。 應用層主要實現企業內工業的微應用連接, 包括智能制造類、 產品設計類等。企業外工業微應用連接包括協同化設計、預知性維護、服務轉化型等等。以工業連接為起點,實現用戶中心與生態協同的應用連接,以數據數字驅動為導向建立標準體系平臺。 3. 項目
105、目標 打造自主工業大數據平臺,建立引領行業的工業大數據標準。 提升企業在行業領域的品質競爭力和成本競爭力,依托工業大數據平臺,在數據算法模型研究應用領域形成核心技術能力。 (1)業務優化目標 利用大數據分析技術對生產節拍數據進行洞察,對各種影響生產節拍的因素進行特征提取,建立相關因素的關聯規則,結合發動機訂貨信息,形成工業 4.0架構下的精益排程,進而對潛在的問題進行分析預警。 (2)系統建設目標 本次項目建設包括產節拍數據的自動化采集、工業大數據平臺和生產排程應用三部分。 2、解決方案 大數據平臺建立基礎大數據平臺及系統優化,搭建大數據存儲相關計算平臺,大數據分布式系統。建設全文檢索平臺,開
106、放全文檢索數據訪問接口及集成大數據存儲接口。 建設數據接入層服務框架, 基于 HTTP 和 FTP 相關數據接入服務,基于 Agent 的海量數據實時接入及傳輸服務。 1. 數據來源 49 (1)濰柴測試機床擰緊機相關數據 擰緊機在配合擰緊程序會產生擰緊過程并在擰緊過程中產生數據,通過擰緊機自帶程序對采集到的數據進行匯總并上傳至本地存儲服務器完成原始數據采集。 (2)濰柴測試機床節拍器相關數據 生產節拍數據需要采集全部產線的工位節拍數據,數據采集分為兩種情況:第一種是工位節拍數據已經保存到企信部歷史數據庫中, 可以手動或定時將數據從歷史數據庫中導出,并上傳到工業大數據平臺;第二種是新增的圖像采
107、集點,直接把圖像識別的數據上傳到工業大數據平臺。 2. 技術方案 (1)大數據能力平臺架構 圖1 濰柴工業連接+大數據平臺的總體架構 基于 FTP 的文件型數據采集服務 大數據平臺通過 FTP 的 get 服務去其他數據源獲取數據,并存儲到大數據平 50 臺。 基于 Agent 的海量數據實時接入及傳輸服務 在數據源初部署 Flume agent,通過 Flume 獲取數據源數據,并存儲到大數據平臺。 關系型數據庫數據接入服務 提供關系型數據庫和 Hadoop 平臺之間數據相互轉移的功能。 基于 Http 的數據接入服務 數據源通過 HTTP 服務發送數據到大數據平臺。 全文檢索和大數據存儲平
108、臺接口集成 實現 ES 中索引數據和 HBase、HDFS 中原始數據的關聯的建立,對外提供一致的索引和原始數據的訪問接口。 關系型數據庫數據接入服務高可靠性組件開發 基于開源 Sqoop 數據抽取框架高可靠性開發,避免數據丟失。 (2)大數據平臺功能架構 圖2 工業連接+大數據平臺功能架構 51 通過數據傳輸、 大數據本身數據處理能力, 來展示大數據平臺的能力 (包括CPU/內存、存儲能力,數據傳輸能力等) 。點擊傳輸的數據,可以從時間維度清晰了解數據產生的趨勢和工廠設備運轉的關系。 3、實施效果與推廣意義 定量指標:經濟效益(直接收益) 、工作質量(出錯率、廢品率等) 、工作時間 (標準作
109、業時間) 、工作強度(操作簡化、步驟減少) 、人力節省、風險控制(風險概率減少) 、損失控制(損失減少) 。 定性指標:流程優化,管理效益(內部客戶滿意度、人才培養、知識轉移) ,協同效益(對現有平臺的充分利用集成) ,社會效益(安全環保、節能減排) 。 4、案例亮點 大數據平臺通過數據采集后對螺栓擰緊的擰緊方式、 參數進行分析, 通過 基于過程數據的螺栓緊固工藝研究建議書對螺栓數據進行分析。大致的分析結果從扭矩、角度、斜率等結果來判斷螺栓一致性,例如在分析某螺栓數據形成過程結果如下: (1)采集各項系數分析對機器螺栓扭矩對角度分布; (2) 大部分螺栓擰緊機分為兩個步驟完成擰緊流程, 同時可
110、以查看每個螺栓擰緊角度、扭矩、以及第二階段的斜率進行查詢,也可以進行特定時間范圍內同樣的擰緊數據進行對比分析。算法分析模型采用線性回歸,利用稱為線性回歸方程的最小平方函數對一個或多個自變量和因變量之間關系進行建模的一種回歸分析,這種函數是一個或多個稱為回歸系數的模型參數的線性組合。 對曲線進行清洗后,分段進行線性回歸,可以得出每顆螺栓,在每一段(階段 1 和階段 2)的回歸線斜率(T/A)然后對相同種類多顆螺栓進行匯總統計,通過統計圖的特征,判斷螺栓的一致性是否良好(曲線越瘦高說明螺栓一致性越好) 52 圖3 螺栓斜率統計圖 圖4 螺栓清洗過程趨勢 通過一定的數據清洗算法將與擰緊過程不相關的數
111、據去除如上圖紅色部分。 利用大數據分析技術對生產節拍數據進行洞察,對各種影響生產節拍的的因素進行特征提取, 建立相關因素的關聯規則, 結合發動機訂貨信息, 形成工業 4.0架構下的精益排程,進而對潛在的問題進行分析預警。 五五、 中國移動中國移動 OneNET 助力助力工業資產管理工業資產管理 1、案例背景與業務痛點 制版企業生產設備資產管理項目是中國移動物聯網開放平臺 OneNET 為制版企業的核心制造機床設備-電雕機以及其他制造設備提供的工業物聯網設備資產管理解決方案。該項目提供了設備定位、生產監控、產能分析、異常告警、 53 耗材預測、故障診斷和資產管理等一系列功能,充分利用了中國移動在
112、無線蜂窩網絡 (NB-IoT/LTE) 、 物聯網平臺設備接入和大數據分析處理等方面的技術優勢,通過資產建模、數字孿生等技術方案,有效地實現了設備的數字化,同時提供了一個可復制、可持續發展的工業模式,推動了該工廠在工業互聯網方面的創新發展。通過對其數據進行工業大數據分析,還可以及時發現管理上的漏洞,有效避免資源浪費,進一步提升資產利用效率,精益化生產,為企業的生產經營管理提供更好的支撐。 1. 項目背景 客戶企業是全球規模領先的專業制版企業,擁有近千臺業界高端的電子雕刻機、激光雕刻機,在全球擁有近百家工廠。公司規模的龐大帶來了管理和生產上的諸多問題: 問題一:如何更有效的管理子公司核心生產設備
113、資產? 分散在各地的大量子公司、工廠使得集團總公司以及各地總公司的管理費用極劇提高,尤其是跨國管理海外資產,企業獲取真實有效且實時的信息需要投入大量人力財力,如何更高效的實時在線監控高價值生產設備的產能,進行數據統計分析,從而提升核心資產利用效率成為企業制約企業發展所面臨的巨大挑戰。 問題二:如何更好的管理耗材庫存? 核心資產在生產中往往需要消耗大量的配件耗材來配合生產, 如何對耗材庫存進行優化,降低耗材閑置周期,減少耗材虛報,從而提高現金流降低成本,是企業進一步降本增效的關鍵點。 問題三:如何提前發現生產中的問題? 生產環節中出現的問題往往要等產生了嚴重的后果之后才能發現,如何及時準確的發現
114、異常來大大降低企業的損失,如何減少人力投入來節省質量成本,以及如何實現預防性維護和故障診斷都是企業迫切希望解決的問題。 問題四:如何解決私自生產,虛報產量的問題? 在生產管理方面,特別是在公司龐大,工廠數量多,工廠 IT 系統不完備的情 54 況下,各地工廠可能存在私自生產,虛報產量,篡改生產數據等問題。企業集團亟需未經污染的真實數據作為憑證手段進行企業生產管理。 2. 項目簡介 制版企業生產設備資產監控項目是中國移動物聯網有限公司為制版企業的核心制造設備-電雕機提供的工業物聯網端到端的解決方案以及方案實現。中國移動物聯網公司利用其在物聯網接入、大數據分析、應用使能等方面的技術優勢幫助制版企業
115、成功實現設備資產云端數字化,3D 虛擬巡檢、產能監控和資產管理等功能,進而推動了該產業在工業互聯網方面的創新發展,特別是利用大數據分析和數字孿生技術初步實現了智慧工廠的部分功能。 3. 項目目標 該項目核心是實現制版企業核心制造設備的云端數字化、產能監控和維護性優化,具體目標有三: 目標一:實現對核心制造設備的數據采集和云端 3D 數字孿生。 目標二:利用大數據分析實現核心制造設備的產能監控、故障診斷和耗材維護預測,生成相關統計報表。 目標三:構建生產設備資產管理應用服務,實現生產設備資產監控、管理和維護流程,對接企業 ERP 系統。 2、解決方案 本項目基于中國移動 OneNET 物聯網開放
116、平臺使能, 借助 OneNET 的后臺大數據能力實現離線數據分析和實時數據分析,并由 OneNET 團隊為客戶定制相關企業應用服務。 1. 數據來源 (1)物聯網設備采集 為實現機床狀態的實時監測,項目中為客戶目標機床量身定做了相應的物聯 55 網采集設備,通過接入機床電源和植入安裝傳感器的方式,可以準確實時采集目標機床的電流、電壓、轉速、機頭位置、加工物尺寸、位置、環境溫度、濕度和噪音等信息。 物聯網采集設備通過本地網絡或者蜂窩模組接入到中國移動 OneNET 物聯網平臺中,實時上報綁定機床的狀態信息。 項目中,設備每 3 秒采集一次傳感器數據,每 15 秒向 OneNET 平臺上報一次數據
117、記錄。每臺機床每次上報數據量約為 1KB。 (2)企業 ERP 系統 項目中機床的資產信息、財務信息和耗材記錄,通過企業 ERP 系統接口獲取, 注入到相應的虛擬機床設備數據記錄中,該虛擬機床設備與機床上的物聯網采集設備綁定。 (3)車間報表 機床的生產記錄、維護記錄和故障記錄等信息,客戶原來通過車間紙質報表的方式記錄。 項目中通過車間報表采集錄入相關數據,并注入到相應虛擬機床的數據記錄中。 2. 技術方案 (1)系統架構 本項目軟件系統分為企業應用服務、數據訪問服務、數據分析服務、物聯網應用使能服務和物聯網接入服務等幾大部分,具體如圖 1 所示。 56 圖1 核心機床設備資產監控系統 (2)
118、企業應用服務 企業應用服務是項目中直接面向客戶的應用服務,主要從機床設備資產管理和監控的角度為客戶提供重要機床設備的產能監控、故障監控和實時監控服務,通過數據可視化和統計報表的方式為用戶提供相關信息。 為了滿足客戶的需求,在企業應用服務中,系統實時采集機床數據并且建立了機床 3D 模型,為客戶提供了基礎的數字孿生功能,方便客戶以遠程方式實現機床車間的巡檢。 另外企業應用服務還對接了客戶企業 ERP 系統, 根據產能監控信息、 耗材預測信息和故障監控信息,實現相關的資產管理和維護管理流程。 (3)物聯網服務 物聯網接入服務基于 OneNET 物聯網開放平臺實現。機床狀態采集設備采用 EDP 協議
119、接入 OneNET 平臺,根據配置的元數據模版,將時間戳,電流、電 57 壓、轉速、機頭位置、加工物尺寸、位置、環境溫度、濕度和噪音等信息以時間序列數據流的方式上報。 物聯網應用使能服務同樣基于 OneNET 平臺使能。 根據條件告警配置, 平臺提供位置圍欄、環境溫度、環境濕度和噪音的閾值告警。 根據訂閱配置,平臺將收到的數據實時分發到實時數據分析服務進行流計算分析。 (4)數據服務 離線數據分析服務基于 Hadoop 和 Spark 實現, 通過 ETL 的方式導入OneNET 采集的機床狀態歷史數據、車間生產記錄數據、車間故障記錄數據和企業 ERP 系統的資產信息和耗材數據進行數據挖掘,獲
120、取生產狀態判決模型,故障診斷模型和耗材維護預測模型。 實時數據分析服務基于 OneNET 實時計算引擎實現, 以流計算的方式接收并處理 OneNET 采集的機床實時數據,根據計算模型進行分析并將分析結果寫入實時數據庫中,用于后續用戶實時交互式查詢和統計。 數據訪問服務用于為客戶提供安全的標準化的數據訪問接口??蛻粝到y可以通過數據訪問服務查詢實時分析或者離線分析后的結果數據, 或者導入要進行離線分析的數據集和元數據定義。 3. 項目其他亮點 本項目的亮點功能主要有: (1)3D 虛擬機床巡檢,利用了 3D 建模技術并結合實時狀態實現了機床 3D動態顯示,方便管理人員在線巡檢。 (2) 基于流計算
121、的實時生產狀態判決、 故障診斷和耗材維護預測, 提升了資產利用效率,優化了耗材庫存。 3、實施效果與推廣意義 客戶企業在應用本項目解決方案后,有效實現了提高生產設備資產利用,達到了降本增效的目標。 58 依據項目提供的產能報表,客戶企業在小范圍區域內試進行了資產優化,有效降低了電雕機產能閑置,減少了 5%8%工廠的電雕機浪費,提升了現有電雕機 10%15%的利用效率,并削減了當年的電雕機采購計劃。 依據項目提供的資產維護功能,客戶在試點工廠發現了耗材的異常使用情況,降低了 20%左右的耗材庫存并減少了耗材虛報現象。 保守估計,項目解決方案全面部署后,每年將為客戶增加約 3000 萬利潤。 4、
122、案例亮點 1.1. 項目先進性及創新點 (1)數字化孿生 項目初步實現了電雕機設備的云端數字化孿生,支持多類資產信息和狀態信息的查閱,并提供 3D 虛擬視圖,如圖 2 所示,可以直觀快速的查看到電雕機實時的生產狀態數據以及工作情況。 圖2 電雕機 3D 虛擬視圖 (2)用大數據分析實現設備隱態監測 項目借助大數據分析和機器學習技術實現了對電雕機生產狀態、耗材消耗狀態和故障狀態等傳感器無法直接感知狀態的監測。 59 六、六、 聯想工業大數據平臺聯想工業大數據平臺 LEAP 1、 案例背景與業務痛點 全球工業正面臨深刻的變革,一方面工業企業日益關注小批量個性化生產,爭奪快速增長的“用戶定義制造”市
123、場藍海;另一方面,新技術的飛速發展以及在各個領域的快速滲透, 使得工業企業的傳統模式變革以及新型業務模式創新成為可能。為了實現工業轉型升級,工業企業需要推動自身業務系統和流程的全面升級,在這個過程中需要解決如下挑戰: (1) 企業內多個異構系統間的數據無法有效整合,直接導致企業采購、 生產、物流、銷售等環節割裂,效率降低; (2) 企業無法對生產設備進行實時數據采集和統一靈活控制, 導致企業難于實現生產工藝流程的最優化,以達成大規模個性化定制; (3) 隨著海量新舊數據的不斷積累沉淀, 企業需要可靠的低成本方案提高數據存儲和計算能力,實現對海量數據的高效管理; (4) 企業智能化分析門檻高,
124、難于整合分散在業務中碎片化領域知識, 實現跨業務和跨領域的業務流程再造; (5) 在實現數據價值變現的同時, 企業也必須構建基于硬件的大數據安全防護體系,保障數據資產和核心工業流程的安全。 只有通過構建企業級工業大數據平臺,構建產業生態,實現多個工業軟件的云化協同,才能為網絡眾包、協同設計、大規模個性化定制、精準供應鏈管理、全生命周期管理、電子商務等新模式下的企業生產經營帶來價值鏈體系重塑。 2、 解決方案 聯想工業大數據解決方案包含了大數據智能平臺 LEAP AI、大數據計算平臺LEAP HD、物聯網采集及邊緣計算 LEAP Edge Server、數據集成平臺 LEAP DataHub、
125、數據治理平臺LEAP DataGov和可信計算引擎LEAP Trusted等產品線, 60 包含了數據整合、計算引擎、數據分析算法和模型、數據治理、數據安全保護及行業解決方案等各個層次的服務。實施概況如下。 1. 數據來源 (1)關鍵工業設備數據 該數據包括工業傳感器、數控/模擬機床,工業機器人,產線檢查設備,現場監控設備等工業終端數據。 (2)工業系統數據 該數據包括 ERP、CRM、MES、SCM、PLM 等系統數據。 (3)外部數據 該數據包括網絡爬蟲抓取的互聯網數據、設備及網絡獲取的用戶和社交數據、權威機構發布的產業數據等。 2. 技術方案 (1)LEAP 大數據平臺整體架構 聯想 L
126、EAP 工業大數據方案包括三個功能層次: 其一,LEAP 平臺提供不同技術手段保證了企業內外部數據的高效聯通,其完善的數據集成工具支持對多源異構數據的高效集成與處理, 工業物聯網采集及邊緣計算能力能夠實時采集企業設備數據及生產數據; 其二,基于 LEAP 產品家族,聯想構建了企業統一數據湖方案,可以幫助制造企業高效融合 OT,IT 以及 DT 數據,打通制造企業內部的關鍵設備與工業系統中的數據孤島,以私有云、公有云或混合云的方式實現企業內部的數據互通和與外部關聯企業間的知識共享; 其三,根據不同制造業細分領域客戶的應用需求,LEAP 提供了豐富的、可集成的行業應用集合,通過 LEAP 產品家族
127、的行業算法庫快速構建分析模型,提供制造流程中關鍵場景業務優化能力。 其技術架構如下圖所示。 61 圖3 聯想工業大數據方案技術架構 (2)數據集成平臺 LEAP DataHub 聯想數據集成平臺 LEAP DataHub 支持對多源異構數據的高效集成與處理。它支持批量、 流式、 網絡爬取等多種數據采集方式, 支持各類數據的 ETL(抽取、轉換、加載)過程,支持多種任務調度方式,以滿足不同的數據處理需求,并且能夠根據企業的需求快速擴展。 LEAP DataHub覆蓋50余種主流數據庫/數據接口,能滿足企業在復雜業務場景下的各類數據整合要求。同時,它提供全圖形化的數據處理工具,通過拖拽方式設計各類
128、 ETL 過程,簡便易用。 (3)工業物聯網集成平臺 LEAP EDGE 聯想工業物聯網集成平臺 LEAP EDGE 幫助用戶從物聯網大數據分析中獲取最大業務價值。它提供強大的多源異構的海量數據采集與整合能力,支持多種物聯網設備和工控系統的采集方式,能夠根據企業的需求方便地快速擴展,支持海量、多樣的物聯網數據的接入、集成與分發。同時 LEAP EDGE 具備實時的物聯網大數據分析能力,能夠通過實時采集、實時處理,相關的分析規則和分析算法,可以進行實時分析、實時預警。 (4)大數據計算平臺 LEAP HD 聯想大數據計算平臺 LEAP HD 是整個大數據存儲處理和分析的核心基礎平臺。它基于 Ha
129、doop/Spark 生態系統,引入了多種核心功能和組件,對復雜開源技術進行高度集成和性能優化。在分布式存儲系統的基礎上,建立了統一資源調 62 度管理系統,深度優化大規模批處理、交互式查詢計算、流式計算等多種計算引擎。LEAP HD 整體性能超群,具有海量數據實時處理能力,支持物聯網實時業務分析,具有使用簡便、運行高效、易于擴展、安全可靠等特點。 (5)數據智能平臺 LEAP AI 聯想數據智能分析平臺 LEAP AI 提供深度學習分布式框架、機器學習工具箱、預測庫、優化庫、知識庫等建模工具,具備特征工程、數據建模以及機器算法學習庫的功能,可以輔助用戶發掘隱藏在數據背后的巨大商業價值,加快從
130、數據到業務的價值實現。系統支持 50 多種分布式統計算法和機器學習算法,不僅提供傳統數據挖掘算法,還提供了自然語言處理、文本分析、水軍識別、信息傳播等原創前沿機器學習組件。除此之外,聯想對算法精度進行深度優化,優化后的性能比開源算法庫提速 310 倍。 (6)數據資產管理 LEAP DataGov 數據資產管理 LEAP DataGov 將數據對象作為一種全新的資產形態, 圍繞數據資產本身建立一個可靠可信的管理機制,提供數據標準管理、數據資產管理、元數據管理、數據質量管理、數據安全等功能,為數據管理人員、運維人員、業務人員和應用開發者提供全方位服務與支撐。 (7)可信計算引擎 LEAP Tru
131、sted 聯想可信計算引擎 LEAP Trusted 是聯想基于自身多年安全防護實踐經驗和對企業級復雜安全業務需求的充分了解所打造的安全可信產品。 基礎硬件平臺采用基于 TPM/TCM 可信技術的硬件 Server,從硬件到 BIOS,再到 OS,再到大數據平臺,進行逐級可信驗證,確保整個平臺的可信安全。同時提供可信接口,可以實現對第三方應用的可信驗證。對數據進行整個生命周期的安全管理,包括數據的安全采集、數據的安全存儲、數據的分析挖掘、數據資產管理以及運維服務等。實現全體系監控,提供用戶日志、行為積累以及大數據平臺的審計。 3. 項目其他亮點 聯想依托自身軟硬件一體化的優化能力, 全球化的業
132、務能力, 打造了開放的、 63 可信的企業級一站式大數據平臺,為解決企業大數據問題,提供了一站式的解決方案。通過聯想大數據平臺,可以輕松完成異構數據、分散數據的整合,實現企業內部分散數據和外部數據的融合,進行供應鏈、客戶經營、產品設計、質量等方面的優化,快速發掘隱藏在數據背后的巨大商業價值。 3、 實施效果與推廣意義 1. 聯想設備銷售激活分析 通過該大數據分析平臺,聯想集團完成了近 5 年生產、銷售、物流和設備激活等數據存儲和分析處理,實現了分地域、國家的設備銷量的統計分析,生產和銷售部門根據設備的區域銷售情況及時合理調整生產和銷售策略等重要功能。 聯想集團僅通過對印度地區的生產、物流和銷售
133、渠道的調整,便促進設備銷量提升18%, 節省生產物流費用近千萬美元。 2. 聯想設備全生命周期管理 利用大數據,聯想首次實現了 12 天完成一次產品質量迭代,遠遠優于基于傳統方法一至幾個月的迭代周期。每年節省六百萬美金的設備維修費用,新版本發布速度提升 610 倍,產品投訴率下降 63.6%。 在采用大數據解決方案之前,提升產品的質量最大的問題在于數據來源少,例如一個典型的質量優化流程,從用戶發現缺陷,到最終技術人員解決缺陷并發布到用戶設備上,往往需要一個甚至幾個月,大大降低了用戶對產品的滿意度。而通過利用大數據技術,聯想可以通過在全量移動設備上的數據跟蹤,實時/非實時獲得產品軟硬件數據,捕獲
134、產品各類異常問題。 3. 某鋼鐵企業需求預測分析 通過大數據分析系統,整合了內外部各類相關數據,借助機器學習和知識圖譜來發現和探索,發掘出數據和業務之間的聯系。相對于過去采用首席專家憑經驗預估市場需求量,機器智能預測的方案大幅度提升了預測準確率和客觀程度。 針對主要 6 個區域,利用歷史數據為評測指標,針對給定的某一個歷史時間 64 點,預測以它為起點一個月后的需求量相對誤差15%,6 個月后的相對誤差30% ;針對主要 6 個大客戶,利用歷史數據為評測指標,針對給定的某一個歷史時間點, 預測以它為起點一個月后的產量相對誤差20%, 6 個月后的相對誤差35%。 4、 案例亮點 聯想工業大數據
135、平臺依托于聯想軟硬件一體化的優化能力,全球化的業務能力,通過深入優化開源和硬件創新,打造了一個開放的、可信的全球大數據和云計算的基礎業務平臺,并幫助中國骨干企業實現全面的大數據業務能力構建,實現了企業的管理和創新能力提升,具有很高的應用價值和行業示范效應。聯想大數據平臺涵蓋大數據領域的多個核心技術,并構建了面向骨干企業的供應鏈優化、客戶經營、產品優化、質量控制等諸多方面的全面大數據和云計算創新行業解決方案能力,有力的支持了產業轉型升級和企業間數據合作。聯想工業大數據解決方案通過在生產設備實時分析、多源異構管理系統整合、可信數據安全、領域知識場景化、自動流程管理等方面的自主技術創新,構建了覆蓋全
136、球的大規模工業大數據實時分析集群,并成為國內制造領域的最大工業大數據集群實踐。 七、七、 格力電器工業大數據平臺格力電器工業大數據平臺 1、 案例背景與業務痛點 珠海格力電器股份有限公司是一家多元化的全球型工業集團,主營家用空調、中央空調、智能裝備、生活電器、空氣能熱水器、手機、冰箱等產品,2017 年格力電器實現營業總收入 1500.20 億元。 格力集團在多年的發展中積累了大量的生產經營數據及豐富的數據分析經驗,格力集團通過與航天云網合作,建設具有格力集團特色的工業大數據平臺,通過大數據分析企業運營狀況,支撐集格力家用機、商用機等主流產品的設計、 65 生產、物流、銷售、服務為一體的智慧企
137、業的運行,完成格力電器智能化轉型。 格力工業大數據平臺通過生產經營及智能產品數據的集成、處理、分析、挖掘等,實現設備故障診斷、故障預測、產品統計、實時查詢、營銷支持、智能搜索等功能,將互聯網、大數據、人工智能技術與家電制造業融合,實現企業經營精準化、生產現場透明化、產品服務遠程化等目標,實現企業數據驅動的持續優化。 格力工業大數據平臺的核心功能包括: 1、實時數據接入大數據平臺,離線、在線數據的接入; 2、智能業務系統數據互通和智能化分析; 3、基于機器學習的智能大數據分析; 4、工業大數據語音檢索; 5、工業大數據平臺的管理與運維。 2、 解決方案 格力工業大數據平臺以在線實時同步的方式接入
138、了集團內部的 ERP、 MES 等業務系統數據,同時以在線及離線的形式接入了上百萬臺設備的測試、調試、運行數據, 數據總量在千億級以上, 數據接入速度達到 8.66 萬條/秒、 5.65G/分鐘,數據處理速度達到 9.58 萬條/秒、6.25G/分鐘;智能平臺通過后臺智能運算和機器學習,實現了工業生產各個環節的自動預測協調和資源的智能配置,構建了數據驅動的現代化智慧企業。平臺的功能架構如圖所示: 66 圖1 格力工業大數據平臺功能架構 數據采集平臺是整個大數據平臺的數據源,負責對接所有的外部數據。在實際環境中, 外部接入的數據源種類繁多, 包括來自生產設備采集的非結構化數據,來自日志系統等的外
139、部文件數據, 各信息系統原有的關系型數據庫接入和實時的流式數據。為了平臺更好的兼容性和擴展性,數據采集平臺采用多種接入策略。實時數據可通過 kafka 作為消息服務接入,非結構化的互聯網數據、文件數據和傳統的關系型數據庫數據可通過 Apache Flume 接入,并對原始數據做一定的初級數據清理加工處理。 大數據分析管理平臺是整個大數據平臺的核心,承擔著數據存儲、數據分析的核心功能。主要核心技術基于 Hadoop 生態圈,在基礎的分布式文件系統之上(HDFS), 主要由存儲系統和計算系統構成。 針對數據特點, 存儲系統由 HDFS 和面向列存儲的 Hbase 構成。計算系統利用 Hadoop
140、YARN 做統一的資源管理,基于內存的 Spark 和傳統的 MapReduce 結合,充分利用兩大計算框架的優勢和資源。Mahout 和 Spark MLib 提供了豐富的數據挖掘、機器學習服務,Spark SQL有著強大的關系型數據處理能力,Spark GraphX 可完美應對大規模圖計算的需 67 求,Spark Streaming + Storm 的解決方案可以滿足實時計算需求。 在大數據分析管理平臺之上,可通過統一的數據總線與上層應用系統和其他服務對接。 其他服務對整個大平臺的支撐起重要作用, 包括業務數據的存儲管理、分布式的緩存系統、運維平臺的監控告警等等。通過與大數據分析管理平臺
141、的交互,可以靈活構建豐富的上層數據應用,比如數據質量的監控、關聯分析、語義分析、自動的模型建立與優化、知識庫指標庫的構建等。 圖2 格力工業大數據平臺技術架構 1、大數據采集技術 大數據采集系統包括非結構化數據及結構化數據的采集,非結構化數據采用FlumeNG采集, Oracle/SQLServer/MySQL關系數據庫中的結構化數據采用Sqoop收集。此外還有以下實時流數據采用分布式消息隊列采集。 (1)Flume 收集非結構化數據 Flume 是高可用、高可靠、分布式的海量數據采集、聚合和傳輸系統,Flume 68 支持定制各類數據發送方,用于收集數據。同時,Flume 提供對數據進行簡單
142、處理,并寫到各種數據接受方的能力。非結構化離線數據寫入 HDFS 流程,采集層生成壓縮文件到磁盤目錄,采用 Flume spooling source 監聽文件目錄,每 500ms掃描一次文件目錄,有新產生的文件時,立刻讀取文件入庫。 (2)Sqoop 收集結構化數據 Sqoop 用于在 Hadoop 與傳統的數據庫間進行數據的傳遞,將關系型數據庫中數據導進到 Hadoop 的 HDFS 中,必要時也用于將 HDFS 的數據導進到關系型數據庫中。Sqoop 使用元數據模型來判斷數據類型并在數據從數據源轉移到Hadoop 時確保類型安全的數據處理, Sqoop 通過分割數據集并創建 Hadoop
143、 任務來處理每個區塊。 (3)Kafka 收集實時數據 Kafka 作為一種高吞吐量的分布式發布訂閱消息系統,在格力工業大數據平臺中用于處理消費者規模的所有動作流數據。 這些數據通常是由于吞吐量的要求而通過處理日志和日志聚合來解決。對于像 Hadoop 的一樣的日志數據和離線分析系統, 但又要求實時處理的限制, 這是一個可行的解決方案。 Kafka 通過 Hadoop的并行加載機制來統一線上和離線的消息處理,通過集群機來提供實時的消費。在實時數據處理上,通過采集層數據通過消息隊列組件 Kafka 接入到 Spark Streaming 里,Spark Streaming 實時處理后把結果存到
144、Hbase 或 Mysql 等關系數據庫中供用戶查詢。 2、大數據分析技術 大數據分析系統以機器學習、數據挖掘等作為核心技術,構建于大數據管理系統和云計算平臺之上。其中,大數據管理系統提供數據的存儲與查詢功能,云計算平臺提供分布式并行計算服務。 通過分布式計算與統計分析服務器訪問大數據系統,實現 KPI 與報表統計分析服務。 格力工業大數據平臺采用 Mahout、Spark MLlib 構建在 Hadoop 上對大數據進行挖掘處理,實現故障預測、配件庫存優化、報表分析、日志檢索等深度數據挖掘。在項目中,我們通過 Hadoop 系統 MapReduce 實現數據挖掘引擎的并行計 69 算。在使用
145、 MapReduce 模型進行大規模數據處理時,重點是編寫 Map 和 Reduce函數,其它并行計算中的復雜問題諸如分布式文件系統、 工作調度、 容錯、 機器間通信等由 MapReduce 系統處理,提升了系統研發的效率。 3、大數據管理技術 大數據管理系統具有高可靠的架構設計,完全分布式的、多副本機制的、對等的、不共享系統,沒有單點故障或瓶頸。這使得系統線性增長,每新加一個節點可以同時增加系統的性能和存儲容量,具備好的擴展性能。 系統具備以下特點:扁平化設計,彈性擴展,系統采取扁平化設計,節點之間完全對等,都可以對外提供服務。柔性多引擎技術,對于不同的應用需求可以使用不同的引擎來對外提供服
146、務,支持異構數據, 結構化, 半結構化, 非結構化數據的統一檢索。高效分區索引機制,可根據應用的查詢特點,將數據自動分區索引, 適應海量數據的集中索引和快速索引的應用需求,分區索引還可以減少檢索時的索引匹配范圍,縮短檢索響應時間?;旌纤饕绞?,提供按詞索引、按字索引、 字詞混合索引方式, 滿足不同應用場景對查全和查準的不同需求。 異步檢索,支持異步檢索模式,適應大并發的應用場景要求,避免了同步檢索模式時消耗太多線程資源的問題。 3、 實施效果與推廣意義 格力集團董事長兼總裁董明珠在某次大型講座上表示,“我們用互聯網、 大數據做空調,格力空調運行得怎么樣,我們在珠海就可以監控到相關數據。 ” 截
147、至2017 年 12 月,格力多聯機空調每天返回數據處理中心的機器運行數據超過 1.5億條記錄,目前采集數據超過 100T,格力通過故障數據分析指導工程安裝,提高工程安裝質量, 欠氟和漏氟故障率下降 22.5%, 電子膨脹閥故障率下降 21.3%??傮w來看,格力工業大數據平臺實施效果及意義主要有以下幾點: 1、故障診斷: 大數據平臺處理、分析商用空調運行時采集回傳的工況數據,及時、準確定位運行故障并給出大致原因,為維護部門維修空調設備和系統提供信息支撐,降 70 低故障定位的時間、范圍和工作量,縮短停機時長并提高客戶滿意度。 2、故障預測: 大數據平臺利用數據挖掘、 機器學習技術, 通過學習已
148、存在的設備故障數據、信息,尤其是發生故障的前兆數據,歸納故障發生的特點、規律知識,并利用流計算相關技術及時發現潛在的故障及風險,及時預警,減少停機的次數及停機時長。 3、實時查詢: 大數據平臺利用 New SQL 存儲技術存放設備數據,提供特定編號設備、一段時間內工況信息的實時查詢功能,用于業務人員分析、判斷特定設備在查詢時間范圍內的工作狀態,總結、發現業務規律。 4、營銷支持: 大數據平臺利用集成的內外部產品及銷售數據進行統計分析,挖掘其中的重復購買、交叉購買等特定行為的規律,分析產品銷售情況,客戶行為信息,特定產品的銷售規律、特點及變化趨勢,指導業務部門進行產品的個性化設計及精準推廣營銷。
149、 4、 案例亮點 格力工業大數據平臺是航天云網工業大數據技術實踐與應用典型案例之一,平臺實現了設備數據的自動采集、實時同步、智能清洗、自動聚類、在線分析、數據挖掘、深度學習、分析展示、智能語音語義檢索、用戶行為分析、工業生產決策等功能,該平臺的亮點可以概括為平臺交互、設備運維、企業運行的“三個智能化” : 1、平臺交互的智能化 采用 HTK 和 JuliusJS 組件將語音轉換成文本,采用 mmseg4J 技術對語言文本進行分詞,通過應用交互式探查分析,根據搜索內容,推測查詢目的,根據歷史機器學習數據,即時構造查詢,系統還可以根據查詢內容進一步實現查詢結果 71 的過濾、分析和保存等操作,實現
150、企業大數據平臺交互的智能化。 2、設備運維的智能化 大數據平臺通過對商用空調歷史運行數據的挖掘與學習,歸納故障的特性與規律,建立設備故障信息模型。在設備運行過程中,通過流計算等技術對設備的潛在風險進行實時預警。設備運行過程產生的故障模型數據,如停機模式、相關規律等,定期形成報告推送至產品設計部門、生產制造部門業務系統中,對產品設計優化、生產工藝優化提供數據支撐的指導意見。 3、企業運行的智能化 格力工業大數據平臺高效整合企業信息化數據、設備物聯數據及外部關聯數據等海量異質異構數據源,通過全面數據匯聚分析,在生產現場有效保障設備的健康運行,在企業經營管理領域提供商業決策支撐,在產品服務端實現設備
151、的實時監控和預測維護。在企業全方位數據感知的基礎上提供合理優化建議,推動企業經營管理的智能化轉型。 八、合力叉車工業互聯網平臺八、合力叉車工業互聯網平臺 1、案例背景與業務痛點 叉車是工業搬運車輛,國際標準化組織 ISO/TC110 稱為工業車輛,廣泛應用于車站、港口、機場、工廠及倉庫等各個國民經濟部門,是機械化裝卸、堆垛和短距離運輸的高效設備。從叉車應用范圍來看,其應用領域很廣,幾乎包括國民經濟方方面面,因此,整個行業景氣度與宏觀經濟息息相關。 安徽合力股份有限公司是中國工業車輛的領軍企業,已連續 27 年排名行業第一;2011 年進入了福布斯中國 500 強;2016 年進入世界工業車輛行
152、業七強。 合力自 1992 年開始了企業信息化的征程,20 多年來積累了大量的工程與運營數據。 2011 年啟動了以信息化引領管理變革、 以大數據應用推動運營轉型的第 72 五次管理革命,陸續在總部、各網點和分子公司全面上線運營管理與數據分析系統;2014 年,啟動實施了以整車寶、維修寶、報工寶、收發寶等為代表的十八項具有自主知識產權的工業互聯網 APP,囊括了銷售、生產制造、采購供應、售后維修等所有環節,實現了傳統企業生產運營模式工業互聯網升級;2016 年以傳感、通信、機器自感知和數據采集為核心的叉車車隊管理系統,有效為客戶在駕駛叉車時提供實時分析、維修預告和精準路線服務;2017 年合力
153、自主研發的無人駕駛叉車, 成功實現自動出入庫作業, 集成調度系統、 貨物識別裝置等軟硬件,成功實現了無人化、智能化倉儲物流搬運作業。 安徽合力以改革促轉型、創新真升級,應用移動互聯網、云計算、大數據等技術,搶占工業車輛行業“制空權” ,服務于工業車輛行業的市場營銷、研發設計、生產制造、物流搬運、售后服務、車輛租賃和金融租賃等業務,通過在擁有自主知識產權的工業互聯網大數據平臺,為客戶提供全面的物流搬運解決方案。 1. 項目背景及業務痛點 從行業的宏觀背景上看,工業車輛行業的企業現在面臨的競爭環境已與過去完全不同,多品種、中小批量、多配置代替了過去的標準化產品,多樣化市場從統一的市場中迅速成長,產
154、品生命周期和開發周期日益縮短。 過去,企業通常要么追求低成本,要么追求品種多樣化,而如今他們則越來越明確地認識到, 必須采取能夠同時實現效益生產和小批量定制化生產的企業策略。 為了不再大規模地生產標準化產品或者高成本地生產多品種的產品,企業會發現,可以通過“模塊化設計,標準化生產”的生產方法,同時達到產品的低成本和品種多樣化的目的。簡言之,多品種、中小批量、多配置模式是指對標準化的產品和服務進行個別的規?;a。它將“標準化”與“定制化”這兩個表面上矛盾的概念組合在一起,其背后隱藏著極其深刻的邏輯關系,并將給當前眾多工業車輛行業企業的經營運作與管理體系帶來巨大的沖擊與改變。 在以客戶、競爭和變
155、化為特征的新經濟時代,企業要想在市場競爭中獲得競爭優勢,以確保企業的生存和長期發展,都必須要回答這樣一個問題:如何滿足并快速響應客戶的個性化需求?為了找到正確的答案, 企業需要正視以下這些挑 73 戰,并在新的“模塊化設計,智能化生產”模式中得到解決。 1) 需求的分化,統一的大市場已日益多元化。統一的市場變成很小的細分市場,市場正在向這樣的顧客轉移他們需要高質量并且更加接近他們個性化需求的品。 2) 個性化產品的需求是不穩定的。過去對標準產品的大量需求已分割成對相似產品不同“風味”的需求。 3) 按以前的生產方式已不能保持原有的利潤,因此,追隨具有多樣化需求的細分市場并盡量滿足這些細分市場中
156、不斷變化的需求, 似乎更為可取。使用以前的生產方式來定制面向細分市場的產品(通常通過服務)也可以做到這一點,但成本太高。而增加產品多樣化最終還必須通過生產來實現。 4) 在生產中建立豐富的多樣化,不能通過專用的規?;a技術來實現。實現產品的多樣化,需要制造過程的靈活性和適應性,這與規?;a方式是矛盾的。 5) 生產模式必須改變?,F代生產模式是由市場和客戶驅動的,必須以很短的生產周期生產大量不同品種、高質量的產品。這需要有柔性能力的制造裝備和較高綜合技能的工人。 6) 由于新產品極大程度地滿足了客戶的需求,所以一般可以取得一些額外的收益。這樣得到的利潤差彌補了由于產量低帶來的低效率。隨著在規
157、?;ㄖ七^程中經驗的積累,會經常發現具有多品種的產品能夠以與標準產品相同或更低的成本生產出來。 7) 由于細分市場規模越來越小且不斷變化,只有以更快的速度生產出更多品種的產品才能不斷取得成功。產品技術變化的速度日益加快,因此必須以同樣的速度縮短產品開發周期。 8) 隨著產品開發周期的縮短,產品生命周期也在縮短。為了最大程度地滿足客戶的需求,產品和技術應不斷地改進和更新。 74 2. 項目簡介 合力工業互聯網平臺是通過數據+模式的方式為用戶提供服務, 囊括了銷售、生產制造、采購供應、售后維修等所有環節,實現了傳統企業生產運營模式工業互聯網升級;應用移動互聯網、云計算、大數據等技術,服務于工業車輛
158、行業的市場營銷、研發設計、生產制造、物流搬運、售后服務、車輛租賃和金融租賃等業務;結合企業車聯網數據感知體系建設、車聯網云平臺建設以及 AGV 無人駕駛體系建設。 圖1 合力工業互聯網平臺服務模式 通過叉車車載終端設備,如定位設備、重量傳感器、紅外傳感器、胎壓監測儀等,結合無線通訊與企業網/互聯網,將基于 CPS 系統的車輛運行情況進行采集、處理、分析、統計,從而實現叉車的監控、調度、管理等功能的跨行業跨領域綜合工業互聯網平臺。 該平臺可實現遠程采集數據協助合力對叉車的研發提供數據,以及對車隊系統進行升級;幫助企業更好的使用合力叉車,提高安全性、效率及經濟性。同時優化整個供應鏈體系, 促進關鍵
159、體系的綜合集成、 協同與創新, 業務的緊密協同,為合力及相關方提供全面的移動互聯網與工業融合的工業車輛生態圈解決方案。 3. 項目目標 75 合力工業車輛互聯網平臺,為工業車輛行業實現五大目標: 第一,從面向信息化管理的應用平臺轉為智能制造的支撐平臺。通過各種各樣以 SaaS 軟件和工業 APP 形式呈現出來的服務,能夠提供從單體叉車、到生產線、到產業鏈、再到產業生態系統的系統級優化,實現從局部優化到全局優化。 第二, 從以往的單一功能平臺變為創新驅動引擎。 在工業里很多技術、 知識、經驗、 方法創新需要從 0 開始, 知識復用水平較低。 而構建一個工業互聯網平臺,將大量的工業技術原理、行業知
160、識、基礎工藝、模型工具、業務流程以及老專家腦子里面的幾十年的經驗進行規則化、軟件化、模塊化,以數字化模型的形式沉淀在這個平臺上。沉淀完之后就不需要再做重復性工作,可以直接調用、復用、傳播,重構我們的工業創新體系,大幅度降低創新成本和風險,提高研發、生產和服務效率。 第三,從內部封閉平臺需要轉為開放的生態平臺。通過構建精準、實時、高效的數據采集互聯體系,建立面向工業大數據存儲、集成、訪問、分析、管理的開發環境,實現工業技術、經驗、知識的模型化、標準化、軟件化、復用化,不斷優化研發設計、生產制造、運營管理等資源配置效率,形成資源富集、多方參與、合作共贏、協同演進的制造業新生態。 第四,從由服務合力
161、轉為服務生態鏈客戶。合力發展需要構建生態鏈,可持續性的良性收益更是建立在以客戶為本的各個環節配合之上,高質量、強依賴度的服務,是企業生態鏈中最重要的一環。合力需要整合“平臺提供商+應用開發者+海量用戶”生態資源,搶占工業大數據入口主導權、培育海量開發者、提升用戶粘性,構建基于平臺的制造業生態鏈,不斷鞏固和強化制造業競爭優勢,實現從成本中心向效益中心的轉變。 第五,實現重點領域關鍵技術自主知識產權化。從當前現狀來看,我國 AGV發展歷程較短,國外廠商的 AGV 技術已日趨成熟。合力的 AGV 導航控制模塊由于采用了國外廠商的解決方案,為了降低產品成本,實現國產替代,提升企業核心競爭力,需要在核心
162、技術上加快研發和消化吸收,逐步擺脫對國外廠商的依賴,全面實現國產化。 76 2、解決方案 平臺建立基礎大數據平臺及系統優化,搭建大數據存儲相關計算平臺,大數據分布式系統, 通過大量的工業APP應用和車聯網實現數據采集和敏捷可視化,通過工業車輛的無人駕駛實現智能制造和智能物流方案。 1. 數據來源 (1)用戶需求數據采集 通過移動設備與客戶進行產品推薦、視頻展示及需求反饋,根據客戶瀏覽行為,將客戶進行記錄分類,為后續精準銷售提供數據支持。 (2)銷售訂單數據 銷售人員通過移動設備進行訂單錄入,含車輛基礎配置信息、用戶相關信息等,上傳至云平臺,通過接口轉至生產系統進行排產,后期可以在移動設備中查看
163、生產及運輸進度,與生產系統無縫集成。 (3)物料轉移數據 生產過程中頻繁出現物料的移動,對物料每一次移動進行記錄上傳至云平臺,為精準庫存管理提供基礎數據支持。 (4)加工過程輔助數據 進行零部件加工時,通過云平臺提供的與設計系統的接口按需調用設計相關圖紙及數據或變更信息,有助于提高加工精確度。 (5)生產進度數據 提供移動端及客戶端多種方式,支持一線生產員工實時進行生產過程匯報,協助管理部門有效進行生產力分配,提高產能。 (6)生產質量檢測數據 對已經下線的車輛按質量管控要求進行質量檢測,將檢測數據上傳至云平臺,形成質量檢測數據庫,輔助生產過程質量管控。 77 (7)車輛關鍵零部件數據 車輛生
164、產及組裝過程中,對涉及到的后期維護或保養或確定為車輛的關鍵零部件的相關信息通過掃碼槍或其他掃描設備進行采集上傳至云平臺, 車輛生命周期全過程均可通過云平臺接口進行調用。 (8)車輛性能檢測數據 車輛在出廠前需要經過一系列性能檢測,根據研發及實際工況要求,通過實驗臺對相關數據進行采集分析整理, 上傳至云平臺車檢數據庫完成基礎數據采集。 (9)售后維修數據 在用戶現場通過語言、文字、圖片實時進行維修數據上傳,在云平臺形成維修數據庫,可以進行后續相關產品質量或其他維度分析,為產品后生命周期管理提供原始真實數據。 (10)新產品試驗數據 新產品批量上市前需要經過大量多方面實驗驗證,通過云平臺記錄新產品
165、各方面試驗數據,進行匯總分析,對新產品進行多層面考證,為批量穩定上市提供準確數據分析支持。 (11)工業車輛運行的實時狀態數據 內燃和電動叉車的實時工作狀態,歷史數據等信息,通過叉車上安裝的傳感器和 CAN 總線的數據流,對采集到的數據進行匯總并按照基于 TCP/IP 為基礎的底層通訊協議,發送原始數據至服務器,解析后在平臺展示。 (12)工業車輛運行時的報警信息數據 采集安裝在整車上的傳感器數據,內燃整車采集油量、碰撞、超速和駕駛員離位報警信息;電動叉車,除電量、碰撞、車速和駕駛員離位信息外,還包括電池終端單獨采集的電流、 電壓等信息, 并根據相應算法, 判斷電池的充放電狀態。 2. 技術方
166、案 (1)總體架構 78 平臺通過建設物聯網平臺、業務層、數據層和應用層,來形成整個工業互聯網的平臺架構。物聯網平臺提供基礎支撐和物聯網通用能力,業務層提供物聯網應用設備能力,數據層提供數據存儲、分析和應用集成等能力,應用層提供工業應用的接入能力。 圖2 合力叉車工業互聯網平臺整體方案架構 其中的工業大數據平臺實現了工業大數據的采集、交換、消洗與集成。數據源既包含來自傳感器、SCADA、MES、ERP 等內部系統的數據,也包含來自企業外部的數據。平臺具有以下功能: a) 大數據清洗與存儲:首先針對采集數據進行數據清洗工作,對數據進行重新審查和校驗,具體包括:一致性檢查以及無效值和缺失值的處理。
167、一致性檢查是根據每個變量的合理取值范圍和相互關系,檢查數據是否合乎要求,發現超出正常范圍、邏輯上不合理或者相互矛盾的數據并剔除;無效值和缺失值的處理方法有:估算,整例刪除,變量刪除和成對刪除等。最終將臟數據轉化為滿足數據質量要求的數據。然后根據數據的具體類型格式存儲至關系型數據庫或者非結構化數據庫中。數據存儲 79 是數據以某種格式記錄在計算機內部或外部存儲介質上的過程、方式和結果。通過非分布式數據庫,對文本數據及圖片數據進行存儲管理;通過對數據讀寫操作的分布式處理,可提升數據庫整體數據寫入和查詢性能,滿足數據快速檢索要求;通過批處理計算集群,實現數據離線式的挖掘分析處理要求;通過流式計算集群
168、,采用內存數據庫技術,實現數據在線分析處理。 b) 數據挖掘:通過指定的規則和算法,從大量的數據中自動搜索隱藏于其中的、有著特定關系性信息的過程。針對具體業務需求,采用大數據與機器學習技術,通過合適的數學模型,對采集數據進行深度挖掘計算。如建立叉車維保數據模型,利用歷史及實時數據對叉車全生命周期進行預測性健康管理;研發叉車智能調度算法,搭建任務環境知識庫,針對具體任務能夠提供實時分析規劃,合理安排等。 c) 資源池管理:將多個異構資源池整合成一個更大的資源池,進行統一管理和資源分配。資源池管理包括對資源池的擴充和縮減,暫停使用某些資源池等操作。平臺設計充分考慮數據集中管理的要求,對資源池進行了
169、分類和分級設計,通過資源的當前使用情況和歷史使用情況形成性能曲線,并預測剩余資源的使用時限,能夠提供參考依據,保證了資源池設計可行性,并根據業務實際需求進行資源配置,且有一定的預留,保證資源池的合理性和可落地性。平臺的一種可行技術架構如下: 圖3 平臺使用的技術架構 (2)主要組成 80 1) 工業物聯網+車聯網 工業車輛的傳統模式已經受到大趨勢的威脅,二十多年沒有變化的銷售,服務模式面臨新的挑戰。 在新商業模式和資本的驅動下, 創新顛覆模式正在孕育中。工業車輛企業要主動規劃轉型, 以傳統的叉車產品為中心的模式向以客戶為中心的互聯網模式轉變, “互聯網+”將更聚焦和關注工業車輛產業鏈,工業車輛
170、上下游之間的跨界競爭。以叉車產品為載體,提供用戶物料搬運服務??蛻魧硪呀洸蛔⒅赝ㄟ^購買來獲得產品的所有權,更傾向于獲得產品的使用權,利用金融支持的工業車輛租賃和物料搬運服務將推向更高的層次。 企業從賣產品, 到賣服務,再到賣共用共享服務的模式。 工業車輛企業將從產品市場份額的競爭轉移到物料搬運服務市場份額的競爭, 移動互聯網讓互聯網共享工業車輛搬運服務成為可能。資本進入物流領域將力促更高效,更智能化工業車輛進入物流服務領域。電動汽車的分時租賃模式和專車的模式隨著互聯網+,也將進入工業車輛領域。 2) 工業云應用+工業 APP 通過構建基于工業 APP 的工業車輛制造服務生態圈,實現資源共享協
171、同的生產組織方式,實現供應鏈協同;滿足個性需求的制造,實現產品銷售、設計和制造配置化模式;提升用戶端設備,大幅度提高信息化覆蓋率,打造智能綠色的生產運營;利用大數據進行行為分析,了解市場需求,實現精準營銷;提供工業車輛融資租賃模式,發揮互聯網金融參與度高、協作性好、中間成本低、操作便捷的優勢;發揮工業 APP 對企業生產經營各環節的持續滲透與影響作用,利用工業 APP 實現企業內外全業務全流程互聯互通、協作共享,提升生產效率和決策水平、降低成本、建立企業“互聯網+”與“中國制造 2025”相融合的新優勢。 3) 工業大數據體系 工業大數據的目的是為了改變以往工業價值鏈從生產端向消費端、上游向下
172、游推動的模式,實現以客戶價值為核心的定制化產品和服務,以及與之相適應的全產業鏈協同優化。為此,工業大數據應滿足用戶需求定義、工業智能制造、活動協同優化三方面的應用。 工業大數據和互聯網大數據的技術架構都具備數據環境、知識環境和應用環境三個層面。 81 從數據環境來看,工業大數據的數據環境,不但關注數據持久化,更關注數據采集的能力。工業大數據的數據采集依賴于物聯網(IOT)的實現,IOT 關注的采集的可靠性, 實現數據接入的總線化, 但工業大數據對 IOT 提出了更多的需要。 從知識環境角度,工業大數據需要對數據進行分析、處理,以獲得相應的知識,用以支撐上層業務應用。工業大數據應用的模型相關性較
173、強,工業大數據的知識環境的技術平臺是 CPS(信息物理系統 Cyber-Physical Systems) ,云計算是CPS 的一個組成部分。 CPS 關注的是物理實體映射的邏輯實體的管理, 提供邏輯實體的關系、協作,以對稱的方式來演進,體現與物理實體的相關性,實現知識的挖掘。 從功能上來說,工業大數據管理技術分為四部分:數據采集與交換、數據預處理與存儲、數據工程與數據建模。數據采集與交換層主要負責從機器設備實時采集數據,也可以從業務系統的關系型數據庫、文件系統中采集所需的結構化與非結構化業務數據。 數據預處理與存儲層主要負責對采集到的數據進行數據解析、格式轉換、元數據提取、初步清洗等預處理工
174、作,再按照不同的數據類型與數據使用特點選擇分布式文件系統、NoSQL 數據庫、關系數據庫、對象存儲系統、時序數據庫等不同的數據管理引擎,實現數據的分區選擇、落地存儲、編目與索引等操作。數據工程層主要完成對工業大數據的治理并支撐對數據的探索能力,以供應用開發與分析對數據的方便使用。 數據模型層主要完成對底層數據模型的工業語義封裝, 構建基于用戶、 產線、 工廠、 設備、 產品等對象的統一數據模型,對各類統計分析應用與用戶實現更加便捷、易用的數據訪問接口。 工業大數據分析技術分為兩大部分:分布式計算框架與工業大數據分析算法庫。 分布式計算框架主要負責對分析在線實時分析任務與離線批量數據分析任務的調
175、度與執行,特別是針對大數據的分布式數據密集型計算。工業大數據分析算法庫除了典型的機器學習算法模型外,需要針對工業特有的穩態時間序列、時空等數據提供豐富的特征模板庫, 方便對典型物理事件在時域和頻域上的精確描述;另外,還應提供豐富的時間序列、時空模式、序列模式的深度挖掘算法庫。 82 3、實施效果與推廣意義 1. 實施效果 1) 通過工業互聯網平臺為工業車輛用戶提供智能調度等服務,實現從傳統制造業向工業智能服務業的轉變, 實現全價值鏈的業務打通和數據共享,在本行業形成典型示范效應; 2) 通過工業互聯網平臺對車輛的監控預警,和在焊接、涂裝等存在職業傷害的生產環境使用無人 AGV 作業,確保生產安
176、全,降低職業傷害; 3) 通過本項目的實施,實現國內龍頭制造企業、骨干設計院所、軟件實施單位、 核心設備廠家的集成, 為中國智能制造自主化、 集成化積累經驗、培養人才、探索標準和規范; 2. 推廣意義 1) 通過本項目的設備異常檢測和預防性維保提醒功能,提高工業車輛可靠性,降低用戶的使用成本; 2) 通過本項目的智能調度功能,合理分解組合任務、優化搬運路徑,實現工業車輛的智能運維,提高用戶的使用效率; 3) 自主無人工業車輛的研發應用,符合工業車輛發展趨勢,對當前市場上的主流無人駕駛車形成較強的性能與成本優勢,未來將提升企業經濟效益和競爭力。 4、案例亮點 平臺三大亮點: 1. 實現了工業車輛
177、企業管理的移動可視化 平臺基于工業 APP 的工業車輛制造服務生態圈, 實現資源共享協同, 通過生產類、銷售類和管理類 APP,與企業資源計劃管理系統(ERP) 、產品全生命周期管理系統(PLM) 、人力資源管理系統(HCM) 、業務流程管理系統(BPM) 、 83 制造執行系統(MES) 、客戶關系管理系統(CRM) 、供應商關系管理系統(SRM)以及整車管理系統(VMS)等核心業務系統的高度集成,為企業市場營銷、研發設計、生產制造、物流搬運、售后服務、車輛租賃和金融租賃等業務提供移動端應用。 圖4 高度集成的可視化移動端應用 2. 實現了工業車輛產品的車聯網化 平臺基于車聯網實現工業車輛車
178、隊資源共享、車輛狀態實時掌控、叉車駕駛員信息、形成統計分析報表。通過底層硬件信息采集,GPRS 信息傳輸數據,人車卡綁定輔助智能報表分析,平臺閾值設定下發至終端實現車輛控制,開關機狀態位實時監控與稱重、行走狀態合并運算實現車輛狀態的實時監控,通過狀態監控提取數據統計分析進而實現車隊智能報表,平臺各功能模塊高度集成,形成工業車輛企業管理的車聯網化, 解決車隊使用過程中, 管理者對叉車自身狀態不明、駕駛員工作情況的掌握不及時等問題,為叉車租賃市場、物流搬運等行業提供解決方案。 84 圖5 工業車輛產品車聯網化 3. 實現了工業車輛駕駛的無人化 平臺實現合力自主研發的無人駕駛叉車,成功實現以 ERP
179、、WMS、MES 等系統為上位系統,以上位系統調度任務的方式,通過無人叉車任務調度系統合理分配任務、優化行走路徑,實現物料搬運的自動化、高效化、準確化搬運。配合多種自動化設備、傳感器系統等實現物料的系統化管理,使得合力成為無人化、智能化的物流解決方案供應商。 圖6 工業車輛駕駛無人化 85 九、東方國信大數據助力聯合利華能源管理九、東方國信大數據助力聯合利華能源管理 1、案例背景與業務痛點 東方國信成立于 1997 年,是國家規劃布局內的重點軟件企業,公司成立 21年來專注于大數據核心技術研發,2011 年在深圳創業板上市后,連續 6 年入選福布斯中國最具潛力上市企業榜單。憑借深厚的大數據技術
180、積累和行業沉淀,東方國信已成為我國大數據龍頭企業和工業互聯網平臺領先企業。 東方國信自主研發跨行業、跨領域的綜合性工業互聯網平臺 Cloudiip,平臺以助推中國制造 2025 為己任,以助力工業企業實現精益研發、智能生產、高效管理、精準服務為目標,已發展成為國內領先、國際先進的可擴展云化操作系統。目前 Cloudiip 已在 50 余個國家成功應用,接入 20 余類工業門類幾十萬臺設備,匯聚全球數千余名活躍開發者,逐漸形成資源富集、開放共享、創新活躍、高效協同的平臺生態,創造巨大的經濟和社會效益。 基于 Cloudiip 工業互聯網平臺,東方國信為工業企業提供能源管理大數據系統,采用工業大數
181、據、云計算、網絡通訊、智能硬件等先進技術,實時采集工業現場的數字儀表、傳感器數據,針對海量數據進行在線分析和挖掘,為企業能耗管理、設備效率提升、廢棄物減少、生產計劃安排等提供分析決策,助力企業進行能源管理對標和優化,可為企業帶來 5%-15%的節能效益。 1. 項目背景 聯合利華是全球最大的日用消費品公司之一,公司成立于 19 世紀,在全球100 個國家和地區擁有 163,000 名雇員,在六大洲擁有 264 個生產基地,產品涵蓋食品、 飲料、 家庭及個人護理產品, 旗下 14 個品類的 400 個品牌暢銷全球 170多個國家和地區。 聯合利華不斷追求在安全、高效、優質與環保等方面更優異的表現
182、,其生產技術和設備非常先進,能源使用效率也位居世界前列。為進一步降低生產成本、 86 提高產品競爭力,聯合利華提出每年在上一年基礎上減少能耗 5%。在多年技術升級改造的基礎上,能源的生產和使用已成為一個龐大的系統,進一步的節能減排變得愈加困難,通過常規的技術改造難以挖掘節能潛力, 利用大數據提升其能源管理水平成企業的重要課題。 2. 項目簡介 東方國信基于工業互聯網平臺,為聯合利華構建能源管理大數據系統,在聯合利華全球 100 多個工廠進行實施, 將各分廠的能源數據采集并傳送到總部云平臺,在總部云平臺上對所有數據進行分析處理。 3. 項目目標 該項目旨在為聯合利華建設能源管理大數據系統,具體目
183、標有以下四點: 對企業能耗數據進行實時監測和可視化展示; 對能源生產、轉換和消耗進行在線平衡; 以能源系統角度發現節能機會,挖掘節能潛力; 實現企業能源使用效率的提升,促進節能減排。 2、解決方案 1. 數據來源 數據主要來源有: (1)機器數據:設備及傳感器數據、PLC、DCS (2)業務數據:BMS、MES、SCADA 采集模塊或采集軟件定時采集儀表或控制系統能效數據, 將全廠能效數據進行匯總,統一發送到云平臺上的數據庫。系統支持各種標準接口協議,從儀表或已有控制系統采集數據,也可以通過手工錄入抄表記錄,支持將 Excel 歷史數據批量導入, 將能效相關數據采集到數據中心。 每個工廠平均
184、500 多個數據采集點,為了滿足后臺計算需要,更新頻率采用 1 分鐘一次,能源管理系統累計采集 50多億數據點,1500 多個活躍用戶。 87 2. 技術方案 聯合利華能源管理大數據系統基于東方國信工業互聯網平臺 Cloudiip,融合云計算、 大數據、 物聯網等相關技術, 包含數據采集、 工業 IaaS 層、 工業 PaaS層以及工業 SaaS 層。 圖1 東方國信能源管理大數據系統技術架構 數據采集及邊緣計算 數據采集層通過不同協議及接口完成深層次數據采集并實現不同協議數據基層匯聚,作為工業互聯網平臺驅動源頭。依托傳感器、工業控制系統、物聯網技術,面向設備、系統、產品、軟件等要素數據開展實
185、時采集。利用以智能網關為代表的新型邊緣計算設備, 實現智能傳感器、設備數據和邊緣分析結果云端匯聚集成。 工業 IaaS 層 工業 IaaS 層為工業互聯網平臺提供所需的基礎設施環境,包括存儲、虛擬機、網絡等,支撐資源的動態擴展和彈性分配服務,是工業互聯網平臺的重要保障及支撐。 工業 PaaS 層 工業 PaaS 層集成工業微服務、大數據服務、應用開發等功能,一方面將工 88 業領域積累的專業技術與知識經驗進行模型化、組件化、微服務化,提供云化工業軟件開發工具與應用環境,另一方面提供工業大數據系統環境,支撐海量大數據的接入、 存儲、 分析和模型、 共享, 保障數據安全, 形成完整的工業數據服務。
186、 工業 SaaS 層 工業 SaaS 層面向工業能源管理場景,提供綜合能耗分析與預測預警、機會識別量化與節能量化監測、 故障預測和設備整體效率分析及能源專家系統等應用。 綜合能耗分析與預測預警 使用各種分析模型,識別工藝積極或者非積極生產狀態,找到與能耗變化高度相關性的關鍵參數(比如產量、度日數等),建立合理的能效績效目標來監控能源消費。計算單位產品能耗,根據產品設置回歸分析的目標值并設置警報,對比能源消耗和產量發現節能機會。 圖2 能耗指標可視化監控 機會識別、量化與節能量監測 對各類生產設備進行實時能耗監控, 并根據總體消耗及分類消耗能源數據對比, 識別能效改進方法, 并對此做出量化。 利
187、用累計和圖分析技術監測累計偏差,分析積極或者消極的能耗趨勢,量化分析和監測節能量和浪費情況。 89 圖3 可視化分析能耗趨勢 故障預測和設備整體效率分析 通過夾點、資產可用性及瀑布模型,開展故障預測和設備整體效率分析,使設備管理各環節得到系統性提升,為企業節約維修和停產費用。 能源專家系統 基于大數據分析, 通過計算不同類別能源數據, 建立涵蓋兩千多個方案的知識庫,以此為基礎形成鍋爐專家系統、電機專家系統、蒸汽專家系統、制冷專家系統和壓縮空氣專家系統。 1) 鍋爐專家系統通過耗差分析實時調整運行參數, 使原有的運行模式受到重新評估,監視蒸汽負荷狀態進行優化,確保鍋爐始終處于最佳運行狀態。 2)
188、 電機專家系統基于系統負載因數和運行狀態 (運行小時數、 相差、 震動、電機溫度、啟停次數),自動生成能耗及可靠性的改善建議。 3) 蒸汽專家系統實時計算蒸汽平衡,對散熱、泄漏等超標損失及時發現并報警。系統疏水器實現在線監測,徹底杜絕了因疏水器失效造成的蒸汽損失。對蒸汽系統通過建模做到了逐級使用,閃蒸汽、凝結水回收率有效提升。 4) 制冷專家系統通過監控制冷環境并優化的冷卻負荷, 實現工廠可靠和高效方面的改進。將 PLC 系統與平臺相連接, 通過 HMI 和傳感器陣列計算 90 出實時的系統性能系數,優化冷凝和蒸發溫度來減少末端冷負荷。 3、實施效果與推廣意義 1. 實施效果 截至目前, 東方
189、國信能源管理大數據系統已完成聯合利華全球 100 多家工廠的能源數據的接入和分析,已接入的碳排放數據占全部排放的 50%,能耗數據占全部能耗的 54%,水耗數據占全部水耗的 64%。能源管理大數據系統的實施大大提高了聯合利華的能源管理效率和水平,平均為每個工廠實現能源節約 5%-15%,節水 5%-30%,減少原材料 1%-3%,節約包裝 5%,取得了巨大的經濟效益和社會效益。 2. 推廣意義 目前,我國工業企業的能源需求十分龐大,并存在能源利用效率低、結構不合理、供需不平衡、污染排放嚴重等問題,具有巨大的節能減排空間。能源管理大數據系統對推動“互聯網+”智慧能源發展,推進能源監測、能量計量、
190、調度運行和管理智能化體系建設,提高能源發展可持續自適應能力具有重要意義。 4、案例亮點 東方國信提供的能源管理大數據系統: 1) 采用了工業大數據、網絡通訊、智能硬件、云存儲等先進技術; 2) 實時采集工業現場的數字儀表、傳感器數據; 3) 平臺有更好的交互性和易操作性(通過簡單拖拉拽實現),能無編碼操作,界面友好,支持個性化定制,用戶體驗好; 4) 數據采用云存儲,磁盤容量無限制,可根據存儲數量進行自動擴展; 5) 授權用戶不受地域限制,也無需安裝客戶端軟件,可以通過瀏覽器,輸入網址,隨時隨地訪問系統; 91 6) 平臺可進行海量數據在線加工、統計、分析和挖掘,將能源與生產數據轉化成易于管理
191、和指導生產的簡潔信息。 十、優也基礎工業大數據平臺在鋼鐵能效的應用十、優也基礎工業大數據平臺在鋼鐵能效的應用 優也致力于運用工業互聯網和工業大數據技術來提升基礎工業的資源效率和運營績效。優也根據具體的工業場景,以運營績效的評估和診斷咨詢為切入點,在能效管理,設備管理,排產優化和運營效率等方面,通過數據算法模型和工業互聯網平臺技術的深度耦合,開發整合成數字化智能化的專屬解決方案, 為基礎工業的客戶切實解決實際問題,提高資源效率,最終實現利潤提升的目標。 1、案例背景與業務痛點 我國鋼鐵行業每年消耗 6 至 7 億噸標準煤,約占全國煤炭消耗總量的兩成,是我國節能降耗的重點行業。世界上主流鋼鐵企業多
192、為鋼鐵聯合企業,即囊括了從煉鐵、煉鋼到軋鋼的多個工序。這樣配置的一個重要原因就是有利于鐵素(鐵水、鋼水、板坯)和煤氣中能量的有效利用。其中,煉鐵單元高爐、焦爐等設備產生的煤氣用于軋鋼等工序,可以讓能源使用成本大幅降低、利用率顯著上升。 由于鋼鐵聯合企業的構成非常復雜, 能效提升的推動過程會遇到各種困難。典型問題之一是煤氣產生和消耗往往是不同步的:有時候產生多、消耗少;有時則產生得少、 消耗得多, 而每個工序都可能出現異常, 帶來整個管道壓力的波動。如果不能保證有效的平衡, 就可能導致無效放散或需要外購高價煤氣以保證生產的正常運營。煤氣波動過大時造成燃燒效率降低,即使已投用自動燃燒系統的爐窯也很
193、難達到經濟區間。 煤氣壓力過低會造成之后工序因生產條件無法滿足而臨時停產。這樣不僅會造成巨大的經濟損失,也會造成環境污染。為了解決這個問題,需要有效地協調煤氣跨工序的產生和使用。然而,要解決這個問題存在很多 92 困難: 1) 空間距離: 涉及煤氣生產和使用的包括高爐、 焦爐、 熱風爐、 轉爐、 連鑄、加熱爐、鍋爐等非常多的設備。這些設備往往分布在鋼廠的不同區域、距離常常相隔數公里,而且管路復雜, 歸屬不同的生產管理部門。每一個工序主操都處于孤島狀態,只按本工序的需求來指導操作,導致總體協調控制困難。 2)信息系統問題:數據來自于不同的設備和部門,形成信息孤島,難以有效地集成和實時互連。煤氣系
194、統運行調配的決策依據與生產制造信息、工藝設備運行工況存在信息脫節,導致無法全面準確判斷和給予精準決策。 3) 部門利益沖突: 煤氣相關的設備往往歸屬不同部門, 各自的考核指標和利益訴求,難以從公司總體利益最大化角度優化煤氣使用的配置。 4)綜合平衡問題:冶金行業的煤氣系統種類繁多,都存在一個供需平衡,一個與產氣裝置、輸配設施、使用設備緊密關聯的動態的平衡系統。行業目前缺乏跨系統綜合供需平衡及系統間平衡策略決策支持的軟件應用。 5) 工況變化與異常的應對及時性: 在這種大型生產系統中, 不同工序都會遇到不可預料的異常狀況,例如高爐修風,熱風爐延遲換爐,鍋爐負荷超載等等,而這種變化要求整個系統要對
195、用氣進行重新計算和分配, 目前缺乏實時計算和調度功能。 6) 行業內已有的煤氣信息化系統缺少人機交互的應用環境, 系統使用者積累的寶貴的運行管理經驗和調配策略知識無法有機植入系統, 系統無法通過自我完善適應和滿足不斷變化的管理要求。 該案例針對東部地區某鋼鐵聯合企業,該企業年產鋼約 500 萬噸,該企業的煤氣系統在不同程度上存在上述的問題。 各生產廠相距數公里,五臺產氣高爐數十個用氣設備,各部門各設備之間的協同調度相當困難,生產過程中時有因煤氣不足停產或煤氣壓力過高放散的問題,各部門的考核指標不盡一致甚至沖突,沒有達成全網優化的統一策略。 下面我們就以優也在該鋼鐵企業的高爐煤氣智能平衡調度系統
196、來介紹如何利用工業互聯網和工業大數據技術解決鋼鐵行業的煤氣實時尋優調配問題,感謝北京天澤智云在案例中提供的技術支持。 93 2、解決方案 1. 系統研發路線 對于高爐煤氣系統平衡調配的智能化開發,需摸索高爐煤氣自身系統的最佳運行優化方式、影響煤氣使用制約因素等,更須考慮上述跨領域跨專業的結合和關聯,從而實現高爐煤氣系統內外兼顧的全方位智能聯調運行。 通過對大數據的抽取歸集與深度挖掘,建立一個基于經驗關系、機理模型、數字模型等方法融合和關聯的多維度信息庫, 以此形成高爐煤氣系統信息價值鏈,將影響高爐煤氣系統供需平衡的各類因素信息化、網絡化、價值化,并貫穿平衡運行全過程。 2. 系統整體架構 如下
197、圖所示為高爐煤氣智能平衡系統架構,系統分為 5 個架構層:設備層,資源層,數據與分析層,應用層和管理層。 圖1 高爐煤氣智能平衡系統架構 1 1) 設備層) 設備層: 涵蓋鋼鐵廠的設備, 跨越多個工藝流程, 一般由一個或多個 SCADA 94 系統連接和管理。 2 2) 資源層) 資源層: 涵蓋支撐本解決方案基于云計算技術和微服務框架的計算和網絡資源。系統本身可以在共有云,私有云以及企業內部的數據中心部署,目前基于可靠性、時延以及安全性的考慮,系統部署在企業內部的數據中心里。 3 3)數據與分析層:)數據與分析層:涵蓋總體數據采集、處理與分析的功能,以支撐上層的智能應用。 數據收集、 聚合和處
198、理的功能, 主要解決在生產過程中設備數據的多源異構、數據量大、并發性強、時延要求高以及一些數據質量參差不齊的問題。 數據儲存的功能,包括歷史數據(經過過濾處理過的設備在生產過程中的狀態數據,用于建立和驗證數字和機理模型)、設備參數(關于設備的規格、配置和設備之間的關系等數據)和生產過程的規則參數(用于配置生產過程規則的執行)。由于在生產過程中設備狀態數據的采集量大,而高質量數字模型的建立和驗證也需要大量的歷史數據, 歷史數據的儲存和分析需要采用大數據的技術框架。 支持數字模型、機理模型和生產規則模型的建立、驗證和運行的功能。數字和機理模型主要用于對煤氣的產用進行預測, 而機理和生產規則模型則用
199、于根據預測的結果為各個工藝環節提出優化的煤氣使用策略。 模型建立和驗證是以離線的方式進行。模型在經過嚴格的驗證之后,部署在系統上根據實時收集的數據提供在線的分析結果。 本解決方案從 SCADA 數據庫里實時抽取與高爐煤氣系統相關運行數據與產供用等各環節工況參數,包括產氣、用氣、輸配、貯存以及放散等關鍵數據。由于大部分冶金行業的 SCADA 數據相對完備,所以在一般的情況下,本方案的實施不需要另外加裝傳感器。 但是原始數據也存在一些問題比如某些流量計不準,無效數據, 數據延時等問題, 這些都需要在數據采集和處理過程中進行有效處理。 4 4) 應用層:) 應用層: 涵蓋以數據分析的結果驅動的實現全
200、網煤氣調度優化決策的各個具體應用,包括終端客戶的使用界面,提供針對具體工藝流程環節煤氣使用的優化決策,由生產人員操作執行,系統對執行以及效果進行記錄和反饋評估,也提供整個系統在生產過程中的實時狀態的可視化, 增加生產管理人員管理的透明度。 95 5 5)管理層:)管理層:為整個系統提供系統管理、用戶管理和安全管理的功能。未來保障系統的可擴展性、可靠性和可管理性,系統統一采用微服務框架實施內置系統服務和具體的客戶端應用,并利用云計算技術對系統的計算資源包括數據、服務和應用進行統一的管理。 3. 面向用戶的功能模塊 高爐煤氣智能平衡系統根據不同的用戶日常操作和管理特點設置這 6 大功能,包括: 1
201、) 對多個可能影響煤氣平衡的因素實施信息跟蹤和異常點分析,揭示即時的煤氣產用的平衡動態。 2)按“宏觀-微觀” 、 “淺顯-深究”的方式,從幾個維度“產供平衡” 、 “工序區域” 、 “單體機組” ,運用統計分析工具,建立分析邏輯、經驗計算等模型。 3) 通過對高爐未來產氣量,預警波動并提前計算分配下游的用量并給出調節指導。 4) 從煤氣保供、經濟運行角度,梳理出相互關系,煤氣與產線、其他能源介質系統的關聯制定煤氣調整的調度方式,覆蓋煤氣多種生成情況。 5) 整個管網策略里,將規則轉化為專家系統,根據預先設定的安全限制與調度規則,自動指導緩沖調節。通過專家決策系統固化和執行運營調度規則。 6)
202、 在不同模式下的經濟核算和預估,以低成本運行和高利潤為主旨,利用模型算法提出煤氣調配策略下最佳成本路線, 供用戶交互式選擇參數并測算該策略下的經濟情況。 3、實施效果與推廣意義 高爐煤氣智能平衡調度系統在這家年產 500 萬噸的鋼廠上線以來,真正實現下面 5 個方面的顯著效果: 96 1)保生產: 系統上線前, 因為煤氣壓力過低造成軋鋼的停線平均每月一次,占總產量的 1%,而系統上線后,這種問題被徹底消除,以噸鋼凈利潤 500 元計算,每年因提產可以帶來 2500 萬元的年化凈利潤收益。 2) 減放散:煤氣壓力過高會造成放散帶來能源損失,系統上線后減少高爐煤氣總量 3%的放散,以每立方米高爐煤
203、氣 0.1 元測算,約合年化 1700 萬的能源節降。 3) 降波動:原來管網壓力在選定區間的穩定率在 78%的中位值左右,系統上線后壓力穩定率上升到了 95%的中位值,并且波動幅度極大縮小,其結果是煤氣使用效率的大幅提高和放散率的大幅降低。 4) 提效率:系統通過模型化軟件化將人的知識和經驗傳承下來,指導一線生產人員進行標準化操作,將操作從基于模糊經驗化轉變為科學化,并為其提升提高了積累的基礎,提升決策敏捷性和精準性,實現標準化操作的傳承和提升。 5) 精管理:系統自動預警產用氣異常,并對異常原因進行量化追蹤,輔助調度對煤氣管網進行精細化管理,實現了實時預警和異常追溯從無到有的突破。 該案例
204、的原理有關如何運用工業互聯網和工業大數據技術, 通過管理運營改善、運行信息關聯、分析計算建模和工業互聯網平臺技術的深度耦合,不僅適合鋼鐵行業,還適合于有色、石油、化工等大型流程行業的燃氣系統智能平衡與決策, 圍繞燃氣系統消除信息孤島, 破除協同壁壘, 追蹤運行動態, 識別異常事件,輔助決策,優化供需調配。 優也不僅用此原理和方法解決單一燃氣系統優化決策問題, 也用于解決單一能源介質的多系統優化決策,甚至是多能源介質的智能平衡優化決策。將此案例的原理和方法推廣具有 3 方面的意義: 1)直接價值:給企業帶來直接的效益回報,無論是從降低波動,提升產能這個角度,還是從降低能耗這個角度都有直接可核算的
205、經濟效益。 2)間接價值:該系統降低了燃氣壓力波動,為生產安全和環境保護提供了不可忽略的價值。 3)社會價值:燃氣系統在基礎工業里是非常普遍的一個生產系統,試想如 97 果能在這些基礎工業里都能夠應用起來, 對于國家的節能減排以及提升整體的工業效率將有深遠的影響。 4、案例亮點 運用工業大數據技術最終目的是為了解決生產和經營中的實際問題, 為企業切實地節省資源成本,帶來利潤地增長。本案例的核心亮點有下面 6 點: 1) 價值驅動與數據驅動:優也秉承頂級咨詢公司的管理思路和方法論結合資深運營和產業專家的洞見,找到與企業的利潤、成本和其它經濟價值有關的關鍵創造點,并選取工序多,維度廣,計算需求量大
206、,很難通過人力能夠做好的復雜場景來進行應用,解決關鍵問題來進行價值創造和管理提升 2) OT、IT 和 DT 深度耦合:同生產運營、調度策略等專家經驗知識深度耦合, 以生產規則和機理模型為根基,形成通過大數據建立的數字模型進行輔助決策,實時指導生產操作并形成反饋閉環,OT、IT 與 DT 相互融合與加強。 3) 基于工業互聯網的實時優化決策:對于遠距離,跨工序的全網協同才能實現時空范圍優化、資源配置。 4) 工業大數據支撐:基礎工業的數據條件相對完備,但是缺乏對數據的處理能力,運用工業大數據的采集,交換,處理,存儲,建模,分析等技術能夠實現不同設備,系統間的數據融合,最終可以基于數據提煉出來的
207、信息,知識來進行優化決策。 5) 知識傳承與智能化:傳統的操作和調度知識經驗存在于每個個體身上,無法進行共享和傳承, 通過對把行業中沉淀下來的知識和經驗模型化算法化和軟件化,將人的智能轉移到系統的智能從而實現了知識的傳承。 6) 管理水平提高:通過系統化重要指標分析和系統化優化策略入手形成一套自上而下的管理思路,不僅從管理思維上進行了梳理,更是通過智能化系統的固化將這種管理思維落實到日常的管理中,例如如何分析關鍵指標,如何追溯異常,如何快速響應和問題解決。 98 附錄二:參考文獻 1 工業互聯網產業聯盟.中國工業大數據技術與應用白皮書R.2017 2 數據中心聯盟.數據管理實踐白皮書(1.0
208、版)R.2017 3 數據中心聯盟.大數據平臺選型與建設指南白皮書(1.0 版)R.2017 4 鄭樹泉, 宗宇偉, 董文生, 丁志剛. 工業大數據:架構與應用M. 上海:上??茖W技術出版社, 2017 99 附錄三:縮略語 縮略詞縮略詞 英文全稱英文全稱 中文名稱中文名稱 AMQP Advanced Message Queuing Protocol 高級消息隊列協議 APS Advanced Planning and Scheduling 高級計劃與排程 CAD Computer Aided Design 計算機輔助設計 CAE Computer Aided Engineering 計算機輔
209、助工程 CAM computer Aided Manufacturing 計算機輔助制造 CAPP Computer Aided Process Planning 計算機輔助工藝過程設計 CRM Customer Relationship Management 客戶關系管理 DDS Direct Digital Synthesizer 直接數字式頻率合成器 DCS Distributed Control System 分布式控制系統 EMS Environmental Management System 環境管理體系 ERP Enterprise Resource Planning 企業資源計
210、劃 ETL Extract-Transform-Load 抽取-轉換-加載 IoT Internet of things 物聯網 JMS Java Message Service Java 消息服務 MES Manufacturing Execution System 制造執行系統 MPP Massively Parallel Processing 大規模并行處理 100 MQTT Message Queuing Telemetry Transport 消息隊列遙測傳輸 MSMQ MicroSoft Message Queuing 微軟消息隊列 OA Office Automation 辦公自
211、動化 PCS Process Control System 過程控制系統 PDM Product Data Management 產品數據管理 PLC Programmable Logic Controller 可編程邏輯控制器 PLM product lifecycle management 產品生命周期管理 RFID Radio Frequency Identification 射頻識別 SCADA Supervisory Control And Data Acquisition 數據采集與監視控制系統 SCM Supply Chain Management 供應鏈管理 SQL Structured Query Language 結構化查詢語言 WMS Warehouse Management System 倉庫管理系統 XMPP Extensible Messaging and Presence Protocol 可擴展通訊和表示協議