《【2023數棲大會】高新民_重視數據基礎設施建設 .pdf》由會員分享,可在線閱讀,更多相關《【2023數棲大會】高新民_重視數據基礎設施建設 .pdf(29頁珍藏版)》請在三個皮匠報告上搜索。
1、重視工業數據基礎設施建設重視工業數據基礎設施建設 重視數據基礎設施建設重視數據基礎設施建設 高新民高新民 2 2023.05 023.05 杭州杭州 對數字化轉型的理解對數字化轉型的理解所有生產業務經營活動網絡化、數字所有生產業務經營活動網絡化、數字化、智能化化、智能化,由聯結匯聚數據由聯結匯聚數據,由數據由數據產生智能產生智能,由智能科學決策由智能科學決策,本質上是本質上是以數據要素優化其他生產要素的配置以數據要素優化其他生產要素的配置和運營和運營,以達到全產業鏈、全價值鏈以達到全產業鏈、全價值鏈高質量發展的目標高質量發展的目標工業互聯網平臺基礎功能工業互聯網平臺基礎功能聯接聯接數據數據智能
2、智能 數字基礎設施(功能視角數字基礎設施(功能視角)通信網絡基礎設施(光纖、通信網絡基礎設施(光纖、5G)5G)存儲基礎設施(存儲基礎設施(IDCIDC)算力網絡基礎設施(東數西算)算力網絡基礎設施(東數西算)數據網絡基礎設施(?)數據網絡基礎設施(?)數據的重要性已有共識數據的重要性已有共識數字經濟,指直接或間接利用數據來引導資源發揮作用,通過物聯網、大數據、5g等手段推動生產力發展的經濟形態。數據作為基礎要素數據作為基礎要素數據與埸景數據與埸景融合產生效益融合產生效益數據作為生產要素數據作為生產要素流通產生價值流通產生價值 目前面臨問題不少目前面臨問題不少數據使用過程中普遍存在數據使用過程
3、中普遍存在“不愿、不敢、不能不愿、不敢、不能”共享的問題,導致海量共享的問題,導致海量“三異三異”數據散落在眾數據散落在眾多機構和信息系統中,形成數據孤島多機構和信息系統中,形成數據孤島”,同時,同時流通機制不靈活、不清晰。流通機制不靈活、不清晰。數據來源眾多、體量龐大、結構各異、關系復數據來源眾多、體量龐大、結構各異、關系復雜。從如此繁雜的海量數據中挖掘高價值、關雜。從如此繁雜的海量數據中挖掘高價值、關聯性強的高質量數據,需要高效可靠的數據基聯性強的高質量數據,需要高效可靠的數據基礎設施保障。礎設施保障。鼓鼓據流通不暢據流通不暢,有數據不能用有數據不能用融合應用不足融合應用不足有數據不會用有
4、數據不會用。高質量數據成為服務與創新的重要基礎,也是高質量數據成為服務與創新的重要基礎,也是提升機構數據價值的前提。然而,數據質量不提升機構數據價值的前提。然而,數據質量不高的現象依然突出,給數據深入挖掘與高效應高的現象依然突出,給數據深入挖掘與高效應用帶來困難。用帶來困難。數據質量不高,數據質量不高,有數據不好用。有數據不好用。出路何在?出路何在?理順流轉思路理順流轉思路建設基礎設施建設基礎設施 數據流通機制多元化,清晰化數據流通機制多元化,清晰化數據要素資產化的前提數據要素資產化的前提:有邊界,可識別,有潛在有邊界,可識別,有潛在價值。價值。數據要素價值實現取決流通,與埸景強相關,數據要素
5、價值實現取決流通,與埸景強相關,流流通機制依埸景而多元通機制依埸景而多元,才是正道。,才是正道。數據流通機制中,數據流通機制中,市場化是一重要選項市場化是一重要選項,但不宜,但不宜成為唯一。成為唯一。更應倡導數據共享更應倡導數據共享(在共同體內在共同體內),數,數據開據開放,后兩者也要明確尊重數據主權原則放,后兩者也要明確尊重數據主權原則異構、異主、異地(異構、異主、異地(“三異三異”)數據的數據的流通的基流通的基礎是數據的互操作礎是數據的互操作,然后依埸景及規則選擇流轉,然后依埸景及規則選擇流轉機制機制多元流通機制多元流通機制:自用機密數據,共享數據,開自用機密數據,共享數據,開放教據,交易
6、數據放教據,交易數據重視工業數據基礎設施建設重視工業數據基礎設施建設重視工業數據基礎設施建設重視工業數據基礎設施建設 工業數據基礎設施工業數據基礎設施工業數據基礎設施包括數據互操作基礎設工業數據基礎設施包括數據互操作基礎設施和數據建?;A設施,施和數據建?;A設施,兩者又由技術架構和制度架構支撐兩者又由技術架構和制度架構支撐數據互操作是基本要求,共享和交換是有數據互操作是基本要求,共享和交換是有約束條件的:需求、主權、安全約束條件的:需求、主權、安全 工業數據互操作基礎設施架構工業數據互操作基礎設施架構工業數據互操作基礎設施工業數據互操作基礎設施研發數據研發數據生產數據生產數據經營數據經營數據
7、行業數據行業數據.例如例如FAIR FAIR 原則原則制度架構制度架構例構例構DOA,IDSDOA,IDS技術架構技術架構例:例:FAIRFAIR原則原則數據利用面臨的重大挑戰之一,就是通過機器發現、訪問、數據利用面臨的重大挑戰之一,就是通過機器發現、訪問、整合和分析與任務相適應的數據及其相關算法和工作流程,整合和分析與任務相適應的數據及其相關算法和工作流程,來促進知識發現。來促進知識發現。在這里,在這里,FAIRFAIR指導原則,使數據具有可發現性、可訪問性、指導原則,使數據具有可發現性、可訪問性、互操作性和可重用性?;ゲ僮餍院涂芍赜眯?。FAIRFAIR一詞是在一詞是在20142014年的洛
8、倫茲研年的洛倫茲研討會(討會(Lorentz WorkshopLorentz Workshop)上發起的,由此產生的)上發起的,由此產生的FAIRFAIR原則于原則于20162016年發布。年發布。FindableAccessibleInteroperableReusableFAIRFAIR原則原則2016年3月一部分科學家和組織組成的聯合體在數據科學中明確了“FAIR原則”,用于科學數據管理。FindableFindable可發現性可發現性AccessibleAccessible可訪問性可訪問性InteroperableInteroperable互操作性互操作性ReusableReusabl
9、e可重用性可重用性使用數據的第一步是找到它們。元數據和數據都應該讓人類元數據和數據都應該讓人類和計算機能夠很容易的找到。機器可讀的元數據是自動發現和計算機能夠很容易的找到。機器可讀的元數據是自動發現數據集和服務的必要條件,因此這是數據集和服務的必要條件,因此這是FAIRFAIR化過程中的一個重化過程中的一個重要組成部分。要組成部分。FAIR的最終目標是優化數據的再利用。為了實現這一目標,元數據和數據應該得到很好的描述,以便它們能夠在不同的元數據和數據應該得到很好的描述,以便它們能夠在不同的環境中被復制和環境中被復制和/或組合?;蚪M合。一旦用戶找到所需的數據,她一旦用戶找到所需的數據,她/他需要
10、知道如何他需要知道如何訪問這些數據,可能包括認證和授權訪問這些數據,可能包括認證和授權。這些數據通常需要與其他數據進行整合。此外這些數據通常需要與其他數據進行整合。此外,數據還數據還需要與應用程序或工作流進行互操作,以便進行需要與應用程序或工作流進行互操作,以便進行分析、存儲和處理。分析、存儲和處理。這些原則涉及三類主體:數據(或任何數字對象)、這些原則涉及三類主體:數據(或任何數字對象)、元數據(關于數字對象的信息)和基礎設施。元數據(關于數字對象的信息)和基礎設施。1 13 32 24 4FAIRFAIR化數據的細則要求化數據的細則要求FindableFindable可發現性可發現性F1.
11、(F1.(元元)數據也需要被分配一個全數據也需要被分配一個全球唯一的、永久的標識符(球唯一的、永久的標識符(IDID)。)。F2.F2.用豐富的元數據描述數據。用豐富的元數據描述數據。F3.F3.元數據清楚明確地包括它們所元數據清楚明確地包括它們所描述的數據的標識符。描述的數據的標識符。F4.(F4.(元元)數據在可搜索的資源中注數據在可搜索的資源中注冊或編制索引。冊或編制索引。AccessibleAccessible可訪問性可訪問性A1.(A1.(元元)數據可以使用標準化的通數據可以使用標準化的通信協議通過其標識符進行檢索。信協議通過其標識符進行檢索。A1.1 A1.1 協議是開放的、免費的
12、、可協議是開放的、免費的、可普遍實施的;普遍實施的;A1.2 A1.2 協議允許在必要時采用認證協議允許在必要時采用認證和授權程序。和授權程序。A2.A2.即使在數據不再可用的情況下即使在數據不再可用的情況下,元數據也可以訪問。,元數據也可以訪問。InteroperableInteroperable互操作性互操作性I1.(I1.(元元)數據使用一種正式的、可數據使用一種正式的、可訪問的、共享的和廣泛適用的語言訪問的、共享的和廣泛適用的語言來表示信息(知識來表示信息(知識knowledgeknowledge)I2.(I2.(元元)數據使用遵循數據使用遵循FAIRFAIR原則的原則的詞匯表。詞匯表
13、。I3.(I3.(元元)數據包括對其他數據包括對其他(元元)數據的數據的有條件參考有條件參考ReusableReusable可重用性可重用性R1.R1.對元對元(數據數據)的描述應當豐富的描述應當豐富,具有多種準確和相關的屬性。,具有多種準確和相關的屬性。R1.1.(R1.1.(元元)數據的發布要有明確的數據的發布要有明確的、可獲取的數據使用許可證;、可獲取的數據使用許可證;R1.2.(R1.2.(元元)數據與詳細的出處有關數據與詳細的出處有關;R1.3.(R1.3.(元元)數據符合領域相關的社數據符合領域相關的社區標準。區標準。認識到計算機必須能夠在沒有或很少認識到計算機必須能夠在沒有或很少
14、人的干預下自主地訪問數據,實現異人的干預下自主地訪問數據,實現異構、異主、異地數據互操作是構、異主、異地數據互操作是FAIRFAIR原原則的核心。則的核心。FAIRFAIR不等于開放。不等于開放。FAIRFAIR中的中的“A A”標識標識“在明確規定的條件在明確規定的條件下可以使用下可以使用”,任何數據在多,任何數據在多大程度上可用,完全由數據所大程度上可用,完全由數據所有者決定,可有者決定,可包含權限控制的包含權限控制的可訪問可訪問性性對對FAIRFAIR指導性原則的認識指導性原則的認識數字對象體系架構(數字對象體系架構(Digital Object Digital Object Archi
15、tectureArchitecture,DOADOA)是互聯網體系架構的邏輯擴展,滿足了支撐數據管理的需求,而不僅僅是將數字結構的信息傳輸,提供一套基礎架構,實現各種“三異”信息系統之間數據安全互操作,構建數字對象的互聯網。ITU認為DOA是下一代互聯網的關鍵基礎設施。安全性安全性標識注冊、解析與信息管理的安全兼容性兼容性兼容現有各種標識體系可擴展性可擴展性分布式架構、開放式框架、標準協議唯一性唯一性全球范圍內唯一標識互操作性互操作性提供基礎設施服務,促進各種信息系統之間的互操作性 例:數字對象體系架構例:數字對象體系架構(DOADOA)HandleHandle協議(協議(Handle Pro
16、tocol Handle Protocol):):分配數字對象的全球唯一標識符分配數字對象的全球唯一標識符把標識解析為對應的數字對象信把標識解析為對應的數字對象信息息提供標識的分布式管理提供標識的分布式管理內嵌的密鑰和安全機制內嵌的密鑰和安全機制DOIPDOIP協議(協議(Digital Object Interface ProtocolDigital Object Interface Protocol):):指定數字對象交互的標準方式指定數字對象交互的標準方式提供安全的數字對象的訪問框架提供安全的數字對象的訪問框架數據標識、解析、管理數據標識、解析、管理數據互操作數據互操作DOADOA體系架
17、構的兩個協議體系架構的兩個協議DOADOA契合契合FAIRFAIR如:如:FindableFindable可發現性可發現性HandleHandle信信息標識息標識F1.(F1.(元元)數據數據也需要被分也需要被分配一個全球配一個全球唯一的、永唯一的、永久的標識符久的標識符(IDID)。)。HandleHandle的的信息定義信息定義F2.F2.用豐富用豐富的元數據描的元數據描述數據。述數據。HandleHandle的的信息定義信息定義F3.F3.元數據清元數據清楚明確地包括楚明確地包括它們所描述的它們所描述的數據的標識符。數據的標識符。全球的注冊全球的注冊解析服務解析服務F4.(F4.(元元)
18、數據在數據在可搜索的資源中可搜索的資源中注冊或編制索引。注冊或編制索引。地地址址元元數數據據數數據據本本體體數字對數字對象象基于數字對象的數聯網:軟件定義的數據基于數字對象的數聯網:軟件定義的數據基礎設施基礎設施互聯網互聯網數字對象倉庫數字對象地址系統數字對象注冊表數字對象數字對象地址系統數字對象注冊表數字對象地址系統數字對象注冊表數字對象地址系統數字對象注冊表數聯網自治域數聯網自治域C C數聯網自治域數聯網自治域B B數聯網自治域數聯網自治域D D數聯網自治域數聯網自治域A A數字對象數字對象數據發現域間域內數聯網的建設數聯網的建設“行業主導、共建共治、域內自主、域行業主導、共建共治、域內自
19、主、域間協同間協同”元數據注冊元數據注冊地址申請地址申請數據尋址工業數聯網科學數聯網臨床數聯網科研數聯網能源數聯網衛星數聯網先行先試先行先試領域數聯領域數聯網網入選入選20222022年世界互聯網領先科技成果(北京大學年世界互聯網領先科技成果(北京大學 等)等)廣域數聯網廣域數聯網 例:國際數據空間(例:國際數據空間(IDSIDS)德國工業德國工業4 4。0 0的數據空間的數據空間歐盟的數據基礎設施歐盟的數據基礎設施試圖成為國際數據互聯生態試圖成為國際數據互聯生態 國際數據空間(IDS)基本理念國際數據空間由所有通過數據空間連接器連接到空間的端點組成。沒有一個中央機構負責數據管理或監督數據治理
20、原則的遵守情況。它代表了一種不同于集中式數據管理概念和分散式數據網絡(通常沒有普遍適用的“游戲規則”)的替代架構。最終使用什么樣的體系結構取決于每個體系結構對每個應用程序場景的實際效益。工業數據空間計劃從一開始就假定了各種共存的架構。例:工業數據空間(例:工業數據空間(IDSIDS)參考架構)參考架構 1 1業務架構:包含數據治理,協同數業務架構:包含數據治理,協同數據管理,商業模型,每個模塊都是獨據管理,商業模型,每個模塊都是獨立的功能模塊,可以自由配置。立的功能模塊,可以自由配置。數據和服務架構數據和服務架構 包含工業數據空間包含工業數據空間App StoreApp Store,Broke
21、Broke,ConnectorConnector,每個模塊也可,每個模塊也可以自由配置以自由配置。軟件架構軟件架構 包含外部和內部國際數據空間連包含外部和內部國際數據空間連接器接器EXICEXIC和和INICINIC,實現數據高效流通,實現數據高效流通。安全架構安全架構 包含網絡安全、身份認證、數據包含網絡安全、身份認證、數據使用限制、安全運行環境等功能模塊使用限制、安全運行環境等功能模塊。業務架構業務架構數據和服務架構數據和服務架構軟件架構軟件架構安全架構安全架構IDSIDS IDS-基本原則 (1)數據主權(數據主權(Data Sovereignty)安全數據交換(安全數據交換(Secur
22、e Data Exchange)分布式模式(分布式模式(Decentral Approach)數據治理(數據治理(Data Governance)IDS-基本原則 (2)平臺和服務網絡化(平臺和服務網絡化(Network of Platforms and Services)規模經濟和網絡效應(規模經濟和網絡效應(Economies of Scale and Networking Effects)開放架構(開放架構(Open Approach)可信參與(可信參與(Certified Participants)明新國(教授、博導)明新國(教授、博導)13918034401 5/29/2023Cop
23、yrights Copyrights Since Since 2005 SJTU-CIM2005 SJTU-CIM24IDSIDS生態角色及模型架構生態角色及模型架構 倡導面向產業的倡導面向產業的工業數據共同體工業數據共同體由業務強關聯的企業參與,按由業務強關聯的企業參與,按共識制度和技術架構共建共享共識制度和技術架構共建共享,實現數據流轉通暢化,數據,實現數據流轉通暢化,數據價值最大化,支持產業高質量價值最大化,支持產業高質量發展的數據利益共同體發展的數據利益共同體傳統網絡安全措施MDOS 2.0MDOS 2.0IDS(International Data Spaces)統一模型數據空間專業
24、模型數據空間企業模型數據空間行業模型數據空間SEPB數據建模引擎模型數據計算知識數據建模認知全域唯一資源編碼C-UMF統一建??蚣芄芾砉こ腆w系模型技術工程體系模型各領域及其子領域的知識數據樞紐C-KDHC-KDH原始知識圖譜規范知識圖譜專項應用知識圖譜優化知識圖譜C-ASC-AS創新應用創新應用應用系統改造升級應用系統改造升級合規管理監管與溯源自我診斷優化能力的共享、協同與交易能力與數字化轉型評估DCMM評估MESERPPDMCRMSOLIDWORKCATIAAnsysUG/Pro/ENFT數字孿生工業元宇宙管理輸出驅動引擎(管理駕駛艙、BIM、VR、BI)DTREE 3.1DTREE 3.1
25、數據互操作基礎設施-分布式可信資源賦能引擎(DOA/IDS)可信存儲可信解析可信賬本可信鑄碼賦碼可信通訊可信身份權限矩陣區域區塊鏈局域區塊鏈廣域區塊鏈工業可信數鏈網數數據據建建模?;A礎設設施施API 層 結論結論數字化轉型數字化轉型本質上是以數據要素優化其他生本質上是以數據要素優化其他生產要素的配置和運營產要素的配置和運營,以達到高質量發展的以達到高質量發展的目標目標發揮數據價值發揮數據價值的關鍵是理順流轉思路的關鍵是理順流轉思路,建設建設基礎設施基礎設施數據要素價值實現取決流通,與埸景強相關數據要素價值實現取決流通,與埸景強相關,流通機制依埸景需多元化流通機制依埸景需多元化 結論結論 “三異三異”數據的流通的基礎是數據的互操作數據的流通的基礎是數據的互操作,然后依埸景及規則選擇流轉機制,然后依埸景及規則選擇流轉機制數據基礎設施包括數據基礎設施包括數據互操作基礎設施數據互操作基礎設施數據數據建?;A設施,兩者又建?;A設施,兩者又由技術架構和制度架由技術架構和制度架構支撐構支撐倡導面向產業的倡導面向產業的工業數據共同體工業數據共同體重視數據建模及知識圖譜大模型學習重視數據建模及知識圖譜大模型學習 謝謝!