《CSA GCR:2024數據分類分級實踐指南2.0(128頁).pdf》由會員分享,可在線閱讀,更多相關《CSA GCR:2024數據分類分級實踐指南2.0(128頁).pdf(128頁珍藏版)》請在三個皮匠報告上搜索。
1、數據分類分級實踐指南2.02024 年 11 月 15 日22024 云安全聯盟大中華區版權所有 2024 云安全聯盟大中華區-保留所有權利。你可以在你的電腦上下載、儲存、展示、查看及打印,或者訪問云安全聯盟大中華區官網(https:/www.c-)。須遵守以下:(a)本文只可作個人、信息獲取、非商業用途;(b)本文內容不得篡改;(c)本文不得轉發;(d)該商標、版權或其他聲明不得刪除。在遵循 中華人民共和國著作權法相關條款情況下合理使用本文內容,使用時請注明引用于云安全聯盟大中華區。32024 云安全聯盟大中華區版權所有42024 云安全聯盟大中華區版權所有致謝致謝數據分類分級實踐指南 2.
2、0由 CSA 大中華區數據安全工作組內數據分類分級項目組專家撰寫,感謝以下專家和單位的貢獻:組長:組長:艾龍專家組:專家組:卜宋博賀志生何伊圣羅智杰潘萬鵬唐宇王彪王瑋謝雄葉柱楊歲立楊天識于海南編委會:編委會:王安宇陳宏偉黃鵬華黃圣超胡峰姚凱李安倫謝江廖聰城鹿淑煜馬兆銘劉楚楚劉玉紅劉永亮李臘梅李敏波王亮王曦光胡志輝仇蓉蓉葉紅星王興王貴宗袁榮婷研究協調員:研究協調員:黃家棟梁嘉榮易利杰52024 云安全聯盟大中華區版權所有貢獻單位:貢獻單位:天融信科技集團股份有限公司北京啟明星辰信息安全技術有限公司中興通訊股份有限公司上海觀安信息技術股份有限公司中國電信集團有限公司數篷科技(深圳)有限公司北京數安
3、行科技有限公司新華三技術有限公司(以上排名不分先后)關于研究工作組的更多介紹,請在 CSA 大中華區官網(https:/c- CSAGCR 秘書處給予雅正!聯系郵箱 researchc-;云安全聯盟 CSA 公眾號。62024 云安全聯盟大中華區版權所有序言序言事物分類的管理哲學源于人類對復雜事物進行認知和有效管理的需求。享有“全球第一 CEO”美譽的杰克韋爾奇曾說過:“管理就是把復雜的問題簡單化,把混亂的事情規范化?!痹诜诸惞芾淼倪^程中,確定管理對象類型化的重要因素就是提煉其共同特征,對事物進行類型化的作用,不僅可以幫助我們對于單個事物的深入認知,還可以促進我們明晰辨別單個類型與整體集群之間
4、的關聯關系,讓每一個類型在整體中都能進行歸類。分級則可以理解為是能夠體現數據重要性的一種特有分類,至于為何將分級從其他類別屬性中凸顯出來,我們可以認為是為了更好地平衡數據的利用與保護,這也正符合我國數據安全法的立法原則。數據作為數字經濟時代的核心要素,是國家基礎性戰略資源,其規模龐大、種類繁多、狀態多變。我們在面對數據這一復雜性、抽象性的事物時,深入理解不同的數據屬性,對其進行類型化分析,做好數據的分類與分級,是實現精細化數據安全治理的基礎,是平衡數據安全保護和流通利用的必經之路。本指南在 1.0 版本基礎上擴大知識半徑、加深知識理解,從國內外數據分類分級管理現狀、數據分類分級概述、數據分類分
5、級能力建設、數據分類分級方法、數據分類分級實施方案、數據分類分級應用等六個方面展開探討與分析,并提供了國內典型數據分類分級產品介紹、數據分類分級模板工具、數據分類分級參考資料、數據分類分級關鍵技術與方法、典型行業標準解讀、數據分類分級詞典示例、文件識別規則示例等參考性、資料性附錄。在數字化與智能化交相輝映的時代,我們希望為數據治理、數據安全等領域的從業者及研究者提供有效參考和切實幫助,點亮探索之燈。李雨航 Yale LiCSA 大中華區主席兼研究院長72024 云安全聯盟大中華區版權所有目錄目錄致謝致謝.4序言序言.6目錄目錄.7一、國內外政策和現狀一、國內外政策和現狀.101.1 國內外政策
6、現狀.101.2 國內外技術發展現狀.121.3 數據分類分級的目標和意義.14二、數據分類分級概述二、數據分類分級概述.152.1 數據分類分級概念.152.2 數據分類分級面臨的挑戰.15三、數據分類分級能力建設三、數據分類分級能力建設.183.1 數據分類分級職能架構.183.2 數據分類分級管理體系.203.3 數據分類分級系統建設.243.4 數據分類分級監督.27四、數據分類分級方法四、數據分類分級方法.284.1 數據分類分級原則.284.2 數據分類分級依據.294.3 數據分類方法.294.4 數據分級方法.314.5 數據分類分級變更.34五、數據分類分級實施方案五、數據分
7、類分級實施方案.355.1 數據分類分級實施過程.355.3 數據資產發現.355.2 業務活動識別.355.4 數據資產識別.365.5 分類分級規則制定.385.6 數據標識標記.39六、數據分類分級的應用六、數據分類分級的應用.396.1 滿足合規監管要求.406.2 優化數據資產監測.406.3 開展數據處理活動管控.416.4 細化數據安全風險及事件管理.4182024 云安全聯盟大中華區版權所有6.5 實現數據安全保護聯動.41附錄附錄 A-典型數據分類分級系統介紹典型數據分類分級系統介紹.43A1 天融信數據安全分類分級系統.43A2 觀安觀智敏感數據發現軟件.48A3 山石網科
8、數據安全綜合治理平臺.51A4 大道云隱密數萬象數據資產管理系統.57A5 神州數碼數據分類分級系統.61A6 昂楷數據安全分類分級系統.64A7 美創暗數據發現和分類分級系統(DDAC).66A8 明朝萬達 Chinasec(安元)智能數據治理平臺.70附錄附錄 B-數據分類分級參考模板數據分類分級參考模板.73B1數據資產清單模板.73B2數據分類分級標記模板.74附錄附錄 C-數據分類分級參考資料數據分類分級參考資料.75C1 個人信息識別參考.75C2 重要數據識別參考.76C3 數據分級要素參考示例.79C4 數據影響對象識別參考示例.79C5 數據分類分級變更參考示例.81附錄附錄
9、 D-數據分類分級關鍵技術與方法數據分類分級關鍵技術與方法.82D1 關鍵字匹配.82D2 正則表達式檢測.82D3 指紋匹配.83D4 自然語言處理(NLP).84D5 機器學習.85D6 規則引擎.87D7 元數據分析.87附錄附錄 E-典型行業數據分類分級標準解讀典型行業數據分類分級標準解讀.89E1 政務.89E2 金融.91E3 電信.95E4 醫療.98E5 教育.101E6 工業.102E7 國際標準.102附錄附錄 F-典型行業數據分類分級詞典示例典型行業數據分類分級詞典示例.10292024 云安全聯盟大中華區版權所有F1 政務.102F2 金融.109F3 電信.113F4
10、 醫療.115F5 教育.118F6 工業.119F7 煙草.120附錄附錄 G-非結構化文件識別規則示例非結構化文件識別規則示例.123參考文獻參考文獻.127102024 云安全聯盟大中華區版權所有一、國內外政策和現狀一、國內外政策和現狀1.1 國內外政策現狀國內外政策現狀隨著數字化、智能化時代的到來,數據已成為推進組織數智化轉型的關鍵生產資料,數據安全的重要性日益彰顯,數據分類分級已成為數據治理非常重要的環節。2021 年9 月 1 日,中華人民共和國數據安全法正式施行,明確規定“國家建立數據分類分級保護制度”,提出“根據數據在經濟社會發展中的重要程度,以及一旦遭到篡改、損毀、泄露或者非
11、法獲取、非法使用,對國家安全、公共利益或者個人、組織合法權益造成的危害程度,對數據實行分類分級保護”。2024 年 9 月 24 日發布的網絡數據安全管理條例,第二十九條提出“國家數據安全工作協調機制統籌協調有關部門制定重要數據目錄,加強對重要數據的保護。各地區、各部門應當按照數據分類分級保護制度,確定本地區、本部門以及相關行業、領域的重要數據具體目錄,對列入目錄的網絡數據進行重點保護?!眹鴦赵嚎偫砝顝娫诘谑膶萌珖嗣翊泶髸诙螘h上做的政府工作報告中,共提到 19 次“數字”和 5 次“數據”,充分體現了我國對數字經濟及數據安全的重視程度。中共中央、國務院印發的 關于構建數據基礎制度
12、更好發揮數據要素作用的意見(以下簡稱數據二十條)提出了建立公共數據、企業數據、個人數據的分類分級確權授權制度。數據二十條強調,對于公共數據,要加強匯聚共享和開放開發,強化集中授權使用和管理,推進互聯互通,打破“數據孤島”,以實現數據要素市場化配置的基礎,同時也是數據安全高效流通的前提。這些措施將為我國的數據治理提供重要的制度保障。在標準規范方面,2024 年 3 月 15 日國家標準化管理委員會發布的數據安全技術 數據分類分級規則(GB/T 43697-2024)國家標準中,對數據分類規則、數據分級規則、數據分類分級流程等方面給出了清晰的指導。近年來我國各行業各領域在數據分類分級方面持續探索,
13、結合行業特點和業務屬性,相繼出臺了多項數據分類分級標準和規范。金融、工業等行業的監管部門制定了相關配套標準指引,如 金融數據安全 數據安全分級指南和工業數據分類分級指南(試行);在地方層面,上海、浙江、貴州及武漢等地也相繼發布了公共數據開放分類分級的試行指南,加強對政務數據的保護,為落實數據分類分級管理提供了指導性參考。同時,這些地方指南為公共數據治理112024 云安全聯盟大中華區版權所有提供了良好的保障,有助于提高數據的共享和開放水平。截至目前,我國已有三十余項數據分類分級標準,涵蓋金融、證券期貨、醫療、電信、互聯網、民航、工業、海洋、卷煙制造、能源、媒體、高校及政務等十三個行業(見圖 1
14、 數據分類分級標準及歸類)。這些標準的出臺和落實標志著我國數據分類分級工作已從理論指導階段全面進入實踐階段,逐步形成了完整的數據分類分級體系。國際上,數據分類分級一般統稱為 Data Classification,根據需要對分類的級別(Classification Levels)和種類(Classification Categories)分別描述。例如,在云安全聯盟(CSA)發布的 CSA 數據安全詞匯表 文檔中,數據分類(Data Classification)被定義為一種安全策略及其實施方法,目的是將信息分為若干類別,每個類別都有相應的安全策略。這些策略可適用于服務器、端點等其他資產,并且
15、某些數據只能在具有相同分類級別的計算機上處理或存儲。這一定義反映了數據分類的重要性,尤其是分類后的數據在不同級別上需要采取相應的安全策略。與我國國家標準GB/T 37988-2019 信息安全技術數據安全能力成熟度模型相似,國際數據分類的實踐同樣強調對不同級別數據的全生命周期保護,要求根據數據的重要性采取不同的保護措施。具體來說,重要數據和核心數據在訪問控制、數據加密等方面有著更高的要求,確保數據的機密性、完整性和可用性。這些措施有助于提升數據的安全性,并減少因數據泄露或濫用而帶來的風險,為數字經濟的發展奠定堅實的基礎。圖 1 數據分類分級標準及歸類122024 云安全聯盟大中華區版權所有1.
16、2 國內外技術發展現狀國內外技術發展現狀根據 Gartner最新發布的2024 年中國數據、分析和人工智能技術成熟度曲線(見圖 2 2024 年中國數據、分析和人工智能技術成熟度曲線),數據和人工智能領域在未來兩到五年內將迎來一系列具有顛覆性或高影響力的創新技術的主流應用。這些技術包括復合型 AI、決策智能、國產 AI 芯片、大語言模型(LLM)以及多模態生成式 AI(GenAI)。這些新興技術的普及將顯著推動數據分析與人工智能的創新與發展。圖 2 2024 年中國數據、分析和人工智能技術成熟度曲線數據分類分級的實現方式,一般分為三種模式。一是人工執行。這是最傳統且最常用的數據分類分級方式,實
17、施人員通過類似 Excel 工具表的方式收集供方資產的元數據信息,結合分類分級標準策略進行人工手動執行。該方式要求執行人員熟悉標準策略,完全依賴人工的執行方式雖然靈活性高、可控性強,適用于數據量較少且敏感性較高的情況,但因耗時較長,其分類準確性容易受到人員經驗和責任心的影響,整體效率較低。二是人工與工具相結合的方法。人工干預為數據分類提供上下文理解,而技術工具則實現高效的策略執行。這種方式通常在對數據進行初步分類后,通過智能工具自動分級,再由人工進行校驗和補充。這種方式的優點在于精準度高,充分利用了人機協作的優勢,是目前分類分級準確度最高的一種方式,但實施成本較高,且執行時間較長。三是工具13
18、2024 云安全聯盟大中華區版權所有自動執行。該方式通過標簽體系、知識圖譜和人工智能等技術,工具與供方資產進行對接掃描,以獲取元數據并自動執行分類分級。自動執行速度較快,能夠基于已有的標準策略快速實施分類分級,同時還能識別出第一種方式未發現的數據資產。這種方式提高了業務效率,也能幫助供方更全面地識別已知及未知的資產信息,是目前國內主流的分類分級方式,受到主流安全廠家和互聯網廠家的廣泛推崇。其優點是速度快、覆蓋面廣,但缺點是對技術工具和系統資源要求較高。國際上,Gartner 在其2024 年數據管理成熟度曲線(見圖 3 2024 年數據管理成熟度曲線)中指出,數據分類技術正處于穩步爬升復蘇期,
19、但國內的技術發展緊隨其后,僅比國際領先水平滯后 1 至 3 年。在政府的大力推動下,國內的數據分類分級能力逐步提升,正在趕超國際水平。例如,國際上的數據管理技術在數據治理、數據共享和數據資產管理等方面已取得顯著進展,這為國內的技術發展提供了良好的借鑒和對標參考。圖 3 2024 年數據管理成熟度曲線142024 云安全聯盟大中華區版權所有1.3 數據分類分級的目標和意義數據分類分級的目標和意義數據分類分級的主要目標是幫助企業合理分配安全資源,提高數據安全管理的有效性,并確保數據在其全生命周期內得到適當的保護和利用。通過明確數據的價值和敏感性,企業可以制定針對性的數據保護措施,從而降低數據泄露的
20、風險,提升數據管理效率。數據分類分級有助于推動企業實現以下目標:1.提高數據管理效率:數據分類分級將數據按照主題、類型或其他相關屬性進行組織,使用戶能夠更快速地使用所需的數據,提高數據的使用效率。通過對數據進行分類分級,組織能夠完成數據資產的梳理,建立數據資產目錄,從而有助于組織恰當地管理數據,使數據的存儲和使用更加高效和便捷。2.支撐數據分析和決策:通過對數據進行分類分級,可以幫助企業更好地理解數據的含義和價值,從而支持數據分析和決策。不同級別的數據可能具有不同的分析需求和應用場景,因此分類分級可以提供更精確的數據選擇和使用指南。3.有效控制風險:根據數據的分類分級,有針對性地進行風險評估和
21、控制,對數據采取適宜的安全措施,如訪問控制、脫敏、加密等,減少數據泄露和安全事故的發生,確保數據的機密性(Confidentiality)、完整性(Integrity)、可用性(Availability)等安全保障的同時,促進數據的開發利用。4.合規要求的滿足:相關法律法規、國家標準、行業標準對數據的分類分級有明確的規定。組織需遵循相關合規要求,根據規定對數據進行分類分級,并根據合規要求采取相應的安全措施,確保符合法律法規和行業標準,避免違規行為和相關的法律風險。5.促進數據開發利用:通過對數據進行分類分級,可以促進數據共享和協作。不同級別的數據可以在不同的范圍內共享,使得不同用戶或組織可以根
22、據其權限和需求訪問和使用數據,促進數據的開發利用。6.降低成本:通過對數據進行分類分級,可以根據不同級別數據的特點和需求,合理分配資源和投入,避免資源的浪費和無效使用。綜上所述,數據分類分級的目標是為了更好地管理和保護數據,確保數據的安全。通過合理的分類和分級,提高數據管理效率,支撐數據分析和決策,有效控制風險,保152024 云安全聯盟大中華區版權所有護數據安全,在滿足合規要求的前提下,促進數據開發利用,降低成本,為組織的可持續發展提供支撐。二、數據分類分級概述二、數據分類分級概述2.1 數據分類分級概念數據分類分級概念數據安全法提出“國家建立數據分類分級保護制度”,確定分類分級是國家治理數
23、據安全的重要且基礎的工作。在組織實務中,分類分級也是數據管理的重要基礎性工作,但沒有定義什么是分類什么是分級,不同的法律法規、標準對分類和分級有不同的表述,在實際工作中可能會引起工作結果不一致的情況。為了更好地理解分類分級的概念,本文從相關的法律法規、標準指南分析出發,深入分析數據分類和分級的內涵和概念。國家標準GB/T 38667-2020 信息技術 大數據 數據分類指南 中將大數據分類定義為:“根據大數據的屬性或特征,將其按一定的原則和方法進行區分和歸類,并建立起一定的分類體系和排列順序的過程?!辟F州省地方標準DB52T 1123-2016 政府數據 數據分類分級指南中將政務數據分類定義為
24、:“根據政府數據的屬性或特征,將其按照一定的原則和方法進行區分和歸類,并建立起一定的分類體系和排列順序,以便更好地管理和使用政府數據的過程?!睂⒄諗祿旨壎x為:“按照一定的分級原則對分類后的政府數據進行定級,從而為政府數據的開放和共享安全策略制定提供支撐的過程?!彪娦判袠I標準YDT3813-2020 基礎電信企業數據分類分級方法中將數據分類定義為:“根據基礎電信企業業務運營和企業自身管理特點,按照樹形結構,建立數據資源分類目錄樹。并將整理后的數據資源列表對應到目錄樹,確定數據資源列表中每個數據項在目錄樹中所在的位置,即確定該數據項的數據類型?!睂祿旨壎x為:“根據基礎電信企業數據重要程
25、度和敏感程度,確定數據資源的安全等級?!闭憬〉胤綐藴蔇B33/T 23512021 數字化改革 公共數據分類分級指南中將數據分類定義為:“按照公共數據具有的某種共同屬性或特征(包括數據對象、重要程度、共享屬性、開放屬性、應用 場景等),采用一定的原則和方法進行區分和歸類,以便于管理和使用公共數據?!睂祿旨壎x為:“按照公共數據遭到破壞(包括攻擊、泄露、篡改、非法使用等)后對國家安全、社會秩序、公共利 益以及個人、法人和其他組織的合法權益(受侵害客體)的危害程度對公共數據進行定級,為數據全生命周期管理的安全策162024 云安全聯盟大中華區版權所有略制定提供支撐?!眹覙藴?數據安全技術
26、數據分類分級規則(GB/T 43697-2024)中也強調和說明了數據分類分級的相關原則和方法。綜合以上我們認為,數據分類的概念可以歸納為:根據數據的屬性或特征,按照規定的原則和方法區分和歸類,并建立起一定的分類體系和排列順序,以便更好地管理和使用數據的過程。數據分級的概念可以歸納為:根據數據的重要程度,以及一旦遭到篡改、破壞、泄露或者非法獲取、非法利用,對國家安全、公共利益或者個人、組織合法權益造成的危害程度按不同等級加以區分,從而確定保護程度的過程。數據分類是建立統一、準確、完善的數據架構的基礎,是實現集中化、標準化管理的基礎,而數據分級則是數據管控和保護的前提條件。2.2 數據分類分級面
27、臨的挑戰數據分類分級面臨的挑戰2.2.1 數據量大且復雜度高數據量大且復雜度高隨著數字化社會的發展,組織在業務運營過程中通常擁有大量數據,包括結構化數據、半結構化數據(如日志文件、XML 文件)或非結構化數據(如文檔、圖像、視頻等)。不同行業數據的格式和規范往往大不相同,甚至同一行業的不同企業在設計數據目錄的結構和元數據的規范都不相同,給企業分類分級規則的制定帶來了巨大挑戰。隨著時間推移,數據量不斷增長,并且數據產生的速度也在不斷地加快?,F有技術只能做到存量數據的分類分級,而對于實時生成,不斷流動的數據分類分級的工作,在選擇合適的技術解決方案并將其整合到現有系統中則可能會面臨技術挑戰,需要龐大
28、的系統資源和計算能力解決數據格式不一致、數據存儲在多個地點等的問題。2.2.2 人為因素引起的判斷誤差人為因素引起的判斷誤差對數據分類和定級的判斷比較依賴人員的經驗和對業務的理解。不同的人員的理解和操作方式可能存在差異,可能導致數據分類分級的結果的不一致性。實施人員有意或無意的行為可能導致數據分類和分級的標記錯誤。例如,某些員工可能會有意或無意將數據錯誤地分類為非敏感數據,從而造成相關安全控制措施無法及時、準確地實施,為數據分類分級的審核工作帶來了挑戰。2.2.3 如何選擇分類維度的問題如何選擇分類維度的問題172024 云安全聯盟大中華區版權所有數據分類具有多維屬性,不同的維度有著不同的應用
29、目標和價值導向。首次開展數據分類時,如何選擇最合適的維度對數據分類,以達到短期應用效益的最大化,是困擾組織開展數據分類的基礎問題。很多時候需要通過一個分類維度實現多個目標,或者將兩個分類維度混合以便分類,選擇維度過于單一無法滿足合規要求和應用需求,選擇維度過多,便會造成工作量和資源投入的倍增。組織面對此類局面難以選擇。同時,分類維度的不清晰會導致后續基于分類的很多操作都存在問題。2.2.4 數據等級無法定量判斷數據等級無法定量判斷針對數據的分級,需要根據數據內容確定其影響對象、影響范圍、損害程度等。目前尚無科學的方法和公式支撐構建數據內容的數學模型,因此很難準確定量地對數據內容描述判斷。2.2
30、.5 數據級別數量選擇問題數據級別數量選擇問題目前數據到底應該分幾個級別尚未形成統一,在數據分級時,核心是需要識別核心數據、重要數據和一般數據,在此基礎之上,組織需要結合自身業務需求,將一般數據適當劃分為更多的子級別,找到合適的級別數量,使得在使用過程中達到效率和安全管控的平衡。過多的分級會給組織管理和實際使用帶來不必要的成本和資源投入,級別數量過少又會使得部分場景管控難以得到精細化的管控,出現管控過度或管控不足的情況。2.2.6 分類分級落地實施困難分類分級落地實施困難數據分類分級如果要做到全閉環管理,需要包括數據資產梳理、數據確權、數據分類分級制度規范制定、元數據標識及管控權限對接,數據分
31、類分級最終目的是要實現數據分級管控,現實情況是大部分組織只能基于國家標準制定數據分類分級制度,并不能完全地理解和掌握其后的邏輯。一方面缺乏相應的數據資產識別和分類分級標識工具技術,另一方面因為分類分級結果無法和系統平臺關聯,導致數據分類分級結果無法運用,數據分類分級僅停留在制度規范中或紙面上。182024 云安全聯盟大中華區版權所有三、數據分類分級能力建設三、數據分類分級能力建設數據分類分級是一項需要多角色協同的、持續的、復雜的、系統性的工程項目,建立成熟的數據分類分級能力體系是保障數據分類分級和安全分級管控工作能夠常態化有效運行的前提。一個成熟的數據分類分級體系需要將組織的業務需求、法律法規
32、、數據的重要性和價值等多種因素結合起來。通過全員廣泛參與、構建持續性的工作流程、明確的監督機制,以及對動態變化的適應能力,構成了確保數據分類分級工作順利實施和長效保障的基石,實現數據安全的精細化管理,從而降低數據安全風險,提升數據利用的效率,促進數據共享和業務創新。數據分類分級能力建設包含數據分類分級職能架構、管理制度和流程、技術工具建設、持續運營機制等四個主要環節,如下圖所示。圖 4 數據分類分級能力框架3.1 數據分類分級職能架構數據分類分級職能架構3.1.1 職能劃分職能劃分數據分類分級職能劃分是組織開展數據分類分級的首要步驟,組織決策團隊通過理192024 云安全聯盟大中華區版權所有解
33、數據分類分級的目標、意義和必要性,明確組織內部各角色、各部門在數據分類分級工作中的職責和協作機制,是確保數據分類分級工作能夠高效、有序、可持續運營的前提。在開展數據分類分級工作前,組織應當詳細說明各部門角色的工作職能,明確數據分類分級決策方、數據分類分級管理方、數據分類分級監督方、數據分類分級運營方、數據分類分級執行方、數據使用方等角色職能。各角色的職能需要更加具體化和詳細化,以便小組成員明確自己的工作范圍和期望結果。數據分類分級決策方。數據分類分級決策方。在組織首次開展數據分類分級工作時,若業務條線足夠復雜、數據種類和規模足夠龐大的情況下,建議組織成立數據分類分級專項工作組作為數據分類分級決
34、策方,由高層領導擔任組長、各部門主管領導擔任成員,確保數據分類分級工作得到充分的重視和足夠的資源投入。負責確定數據分類分級工作目標和管理要求,負責確保數據分類分級工作的總體方向與組織的數據治理策略一致,定期聽取數據分類分級工作匯報,并指導、監督數據分類分級管理工作。數據分類分級管理方。數據分類分級管理方。由數據分類分級專項工作組指派中高層管理人員作為管理負責人。負責制定和維護數據分類分級管理制度、技術規范和業務指導,定期與業務部門溝通,確保標準的實用性和適應性,組織各部門有序執行數據分類分級工作。數據分類分級監督方。數據分類分級監督方。負責監督、指導數據分類分級管理制度建設、技術工具建設,明確
35、監督檢查方式和方法,負責定期監督檢查各部門數據分類分級考核指標達成情況,定期提出改進建議。數據分類分級運營方。數據分類分級運營方。負責建設數據分類分級技術工具,維護數據分類分級成果,監測數據資產分布與流轉態勢,監測數據分類分級的效果。數據分類分級執行方。數據分類分級執行方。各業務系統的歸口管理部門負責本領域業務數據的分類分級工作,并依據數據分類分級結果,在數據全生命周期執行數據安全管理要求。數據使用方。數據使用方。內部各業務部門和外部合作組織作為數據使用方,應依據數據安全級別在數據使用過程中嚴格執行數據安全防護工作。在數據分類分級過程中,職責的劃分不是絕對的,不同組織可以有不同的劃分方式。重要
36、的是需要建立一個明確的數據分類分級責任體系,確保數據的正確分類分級和處理。同時,需要加強跨職能部門的溝通和協作,確保數據的分類分級工作與組織的業務需求和戰略目標保持一致。202024 云安全聯盟大中華區版權所有3.1.2 協作與溝通協作與溝通各角色之間的協作和溝通機制也十分關鍵。組織需要建立一個協作平臺,比如定期的工作會議、工作報告制度,以及在線協作工具,以促進信息共享和解決問題。特別是在跨部門協作方面,需要明確接口和溝通頻次,確保數據分類分級工作不受部門壁壘的影響。3.1.3 評價與改進評價與改進評價與改進包括定期的績效評價、目標設定以及激勵措施,確保各角色能夠高效地完成既定任務。同時,應當
37、設立機制鼓勵創新和提出改進建議,持續優化分類分級的工作流程和標準。在開展數據分類分級管理時,全員持續參與至關重要。從最高決策層到日常操作人員,每個人都需對數據分類分級的重要性有所認識,并將之融入其日常職責中。這種全面的參與確保了分類分級的原則和流程能夠在組織中得到一致的理解和執行,從而增強了數據安全治理的整體效力。同時,這也意味著數據分類分級工作不僅需要頂層的推動,還需要形成一種貫穿組織文化的自下而上的支持力量。3.2 數據分類分級管理體系數據分類分級管理體系3.2.1 數據分類分級制度規范數據分類分級制度規范數據分類分級管理方應當制定并維護數據分類分級管理制度,明確數據分類分級的要求和規范,
38、確保組織管理要求與國家法律法規、組織業務戰略、數字化轉型戰略目標相一致。一般情況下,組織的數據分類分級管理制度可以由數據分類分級管理辦法數據分類分級規范數據分類分級業務指導及對應的執行模板等幾個部分組成。數據分類分級管理辦法 可以包括數據分類分級管理工作的目的依據、適用范圍、基本管理原則、管理主體、執行主體、數據分類分級各項工作要求、監督管理、罰則等主要內容。其中數據分類分級各項工作要求應當重點明確數據分類、數據分級、級別變更、數據匯聚等重點場景下的要求。數據分類分級規范作為管理辦法的下級文件。應當針對數據分類分級的原則、數據分類方法、數據分級方法、數據分類分級變更、數據分類分級流程等內容進行
39、規范說明,用于形成組織內部一致的方法論和技術規范。212024 云安全聯盟大中華區版權所有數據分類分級業務指導 應當從數據分類分級實施執行的視角,明確業務活動識別、數據發現、數據識別、分類分級規則制定、分類分級標記等操作方法和過程,為各部門按照規范、使用技術工具和模板開展數據分類分級提供實操指導。數據分類分級執行模板應當包括但不限于業務活動識別模板、數據清單模板、數據分類分級模板、重要數據目錄模板、數據報送表模板等相關執行文件。3.2.2 數據分類分級工作流程數據分類分級工作流程數據分類分級工作是一項持續管理的工作,主要涉及兩個場景:全量數據分類分級流程和增量數據分類分級流程。全量數據分類分級
40、是數據分類分級執行方依據組織 數據分類分級規范對各自責任范圍內的全部數據數據分級,形成數據分類分級清單,并提交數據分類分級管理方審核。數據分類分級管理方審核提交的數據分類分級清單,確定結果符合數據分類分級原則和規范,并應指出分類分級不合理情況,并協助數據分類分級執行方調整定級結果,由數據分類分級管理方匯總合理的定級結果。圖 5 全量數據分類分級流程圖222024 云安全聯盟大中華區版權所有職責分工數據分類分級執行方,作為數據分類分級主體責任方,負責數據梳理、數據類別識別、定級要素識別及數據安全級別判定,形成數據分類分級清單。數據分類分級管理方審核確認數據分類分級執行方的分類分級結果,對分類分級
41、不合理結果則協助數據分類分級執行方調整定級。對合理結果匯總并組織開展數據安全保護工作。數據分類分級運營方負責將分類分級結果錄入數據分類分級工具。流程步驟表 1 全量數據分類分級流程步驟編號編號責任方責任方過程過程描述描述產出產出1數據分類分級管理方下發任務下發數據全面分類分級任務數據分類分級清單數據分類分級結果聲明及授權2數據分類分級執行方接收任務接收定級任務,獲取數據分類分級清單模板3數據分類分級執行方數據梳理對業務系統的全量數據進行全面梳理。4數據盤點定期對全部存量數據進行盤點。5分類屬性識別分級要素識別根據 數據分類分級規范 進行分類分級要素識別。6數據分類分級標記系統上線前完成數據分類
42、分級工作,結果提交數據分類分級管理方。7數據分類分級管理方定級結果審核匯總對分類分級結果進行審核,不合理結果協助定級方調整。數據分類分級清單匯總8合理結果匯總9數據分類分級運營方固化分類分級結果將數據分類分級清單 錄入數據分類分級工具。10數據分類分級管理方數據安全管理及保護根據分類分級結果,組織開展數據安全管理及保護。232024 云安全聯盟大中華區版權所有增量數據是指信息系統在已完成數據分類分級的基礎上,由于系統升級、數據采集或導入等操作導致數據庫結構發生變化而新增的數據。一旦出現增量數據,數據分類分級執行方應再向數據分類分級管理方重新提出分類分級申請。增量數據分類分級場景中,應基于數據的
43、提供方、生產方、采集方提供的數據資產清單對采集、導入的增量數據加以梳理和分類分級,并在數據進入存儲環境前完成數據分類分級。圖 6 增量數據分類分級流程圖職責分工數據分類分級執行方作為數據分類分級主體責任方,負責數據資產梳理、分類分級要素識別及數據分類分級判定,形成數據分類分級清單。數據分類分級管理方審核確認數據分類分級執行方分類分級結果,對定級不合理結果則協助數據分類分級執行方調整定級。對合理結果進行匯總,并組織開展數據安全保護工作。數據分類分級運營方負責將分類分級結果錄入數據分類分級系統。流程步驟表 2 增量數據分類分級流程步驟編號編號責任方責任方過程過程描述描述產出產出1數據分類分級執行方
44、提出申請信息系統出現增量數據時,提出增量數據分類分級申請。增量數據分類分級申請模板數據分類分級清單2數據分類分級管理方接收申請接收增量分類分級申請,并下發增量分類分級任務242024 云安全聯盟大中華區版權所有3數據分類分級執行方接收任務接收分類分級任務,獲取數據分類分級清單模板4數據分類分級執行方數據增量清單梳理對采集、導入的數據增量進行清單梳理。5定級要素識別根據數據分類分級規范進行分類分級要素識別。6數據安全定級系統上線前完成數據分類分級工作,結果提交數據分類分級管理方7數據分類分級管理方定級結果審核匯總對定級結果進行審核,不合理結果協助分類分級方調整。數據分類分級清單匯總8合理結果匯總
45、9數據分類分級運營方固化分級結果將數據分類分級清單錄入數據分類分級工具。10數據分類分級管理方數據安全管理及保護根據分類分級結果,組織開展數據安全管理及保護。3.3 數據分類分級系統建設數據分類分級系統建設數據分級分類系統是一種能夠發現、識別、分類分級標記數據的自動化工具,目前在各行業各領域已有廣泛的應用。隨著數據的快速增長和數字化轉型的加速,個人信息保護和數據合規成為企業和組織面臨的重要挑戰,通過建立科學合理的數據分類分級系統,企業可以更好地管理和利用自身的數據資源,提高運營效率和競爭力,同時滿足合規需求。3.3.1 系統功能概述系統功能概述數據分類分級系統應當是能夠充分利用關鍵字匹配、正則
46、表達式匹配、特征訓練模型、自然語言處理、機器學習、大模型等技術,實現自動或半自動發現數據源、識別數據源、標記數據類別與級別,以提升數據分類分級效率與準確性為目標的技術工具。數據源發現數據源發現功能應能實現主動嗅探發現和被動監測發現兩種模式。主動嗅探發現可以實現探測指定網絡范圍,識別數據載體 IP、端口、版本等數據源信息。應能識別關系型數據庫、非關系型數據庫、數據倉庫、FTP/TFTP/SMB 文件系統等各類數據載體,支持周期性自動觸發、事件觸發、手工觸發或其他啟動方式。采用被動監測發現模式時,252024 云安全聯盟大中華區版權所有應當能夠監測和分析數據源所在網絡的流量,應在有效識別各類數據源
47、基本信息的基礎上,實現數據接口的發現,并正確識別數據接口地址、類型等數據源信息。數據分類分級規則管理數據分類分級規則管理功能可以建立和維護數據分類分級規則庫,為自動化識別數據、標記數據提供知識積累??梢愿鶕延械姆诸惙旨壏椒ㄖ贫ê梅诸惡头旨壧卣髅枋龊陀成潢P系,數據分類分級的識別標記過程可以采用模板中的分類規則、分類規則等作為識別和標記的標準。數據識別數據的識別是數據分類分級系統的核心能力,數據分類分級系統可以識別各類數據載體中的數據,在對結構化數據識別時,應根據數據特點采用相適應的自動化算法,可包括關鍵字匹配算法、正則表達式匹配算法、特征訓練模型算法、自然語言處理、機器學習、大模型等技術。特征
48、庫可以定期進行維護和更新。在對非結構化數據識別時,應根據數據的特點支持文本、圖片、辦公文檔、XML、HTML、各類報表、音頻、視頻、壓縮文件等各類格式的數據。數據識別的執行方式包括:定時任務的方式、增量執行方式等。數據標記數據的標記是數據分類分級實施工作的主要目的,是形成數據分類分級清單的關鍵操作。數據標記是在數據發現、識別、標記規則設計的基礎之上開展的,對結構化的數據標記包括但不限于:庫名、表名、字段名、級別、所屬大類、子類等信息,對非結構化數據對象的標記應包含但不限于:文件服務器地址、文件目錄、文件類型、文件名、級別、所屬大類、子類等信息。最后,通過人工對數據標記結果進行修訂和確認。管理與
49、維護數據分類分級系統可以從各級別分布、各類別分布等維度充分展示數據在數據載體中的分布情況,可以通過過濾數據源名稱、數據地址、數據庫名、表名、文件服務器、文件、分級、所屬分類、子類等各類條件通過可視化表格、統計圖等形式查詢和展示??梢酝ㄟ^對數據安全管理平臺或安全組件提供 API 接口實現數據分類分級結果在數據安全風險監測、數據安全態勢感知、數據安全策略聯動等方面的應用。3.3.2 系統建設過程系統建設過程262024 云安全聯盟大中華區版權所有3.3.2.1 需求分析與確認需求分析與確認根據企業的目標和業務流程的特點,分析企業在數據分類分級方面的具體需求,如需要對哪些數據分類分級、分類分級的標準
50、是什么、分類分級后的數據如何予以安全防護、是否涉及安全工具的聯動對接等等。數據需求:明確需要對哪些存儲系統內的哪些數據分類分級,包括數據的來源、格式、類型等,或者優先對哪些應用系統的數據進行梳理,數據量大概在什么級別。數據處理需求:確定如何處理和分析數據,包括數據的清洗、整合、轉換等操作。例如,是否需要對數據進行去重、填充缺失值、轉換數據格式等操作,以滿足后續的分類分級需求。系統功能需求:明確數據分類分級系統的功能和性能要求,包括支持的數據源種類、數據智能識別準確度、可視化展示的多樣性、系統對接能力等??紤]系統的可擴展性,例如數據量巨大時,如何保證分類分級的處理效率。3.3.2.2 制定目標與
51、計劃制定目標與計劃根據需求分析結果,制定詳細的數據分類分級系統建設計劃,包括項目范圍、項目時間規劃、資源分配等。組建評審小組,可以包含數據分類分級決策方、數據分類分級管理方、數據分類分級監督方、數據分類分級運營方、數據分類分級執行方、數據使用方。3.3.2.3 工具選型與測試工具選型與測試功能評估:根據需求分析結果,評估不同數據分類分級產品的功能,如數據資產發現能力、敏感數據發現能力、數據類別級別標記能力、可視化展現等。例如系統是否支持主動探測發現數據源,是否支持非結構化文本、圖片、視頻等數據的處理,數據標記的準確度等。性能評估:評估分類分級系統的性能,如數據掃描的速度、系統穩定性、是否支持高
52、可用架構等,確保能夠滿足企業的實際需求。服務評估:綜合對比廠商的行業項目經驗、平均交付時間和產品迭代頻率等,通過對這些關鍵指標的綜合對比,企業能夠更準確地評估廠商的服務質量和能力,最終選擇最佳的系統供應商。272024 云安全聯盟大中華區版權所有產品測試:結合組織實際業務場景,圍繞數據分類分級系統各項功能,制定場景化測試用例,開展全面的功能和性能測試,包括但不限于:基本功能執行效果、數據源識別準確率、數據識別準確率、數據識別任務吞吐率等內容。3.3.2.4 部署運行及優化部署運行及優化部署運行:部署數據分類分級系統,對接各業務系統,充分結合工具技術能力,常態化開展數據分類分級全流程工作。審核發
53、布:人工審核和完善系統自動標記的結果,審批通過后批準發布,形成數據資產分類分級清單。此過程需要評審小組審核分類分級結果,審核通過后即可作為最終的分類分級結果清單。持續優化:數據分類分級是一個持續的、動態的過程,隨著業務需求的變化和數據量的不斷增加,需要定期評估和完善數據分類分級結果,同時定期優化系統的分類分級策略,確保其持續有效。3.4 數據分類分級監督數據分類分級監督數據分類分級工作的監督是組織內部控制體系中的核心組成部分,它承擔著確保數據管理符合既定流程和政策的重要職責。通過持續開展監督指導,組織可確保數據分類分級策略的嚴密性和準確性,同時也能夠在發現不符合預定策略或法規要求的做法時,迅速
54、采取糾正措施。組織應當成立專向監督小組,圍繞數據分類分級的全過程開展細致的監督和評估,確保從數據的收集、處理到最終的銷毀,每一步都遵循規定的標準,且有明確的責任歸屬和記錄留痕。監督團隊不僅關注流程的規范性和記錄的完整性,還著眼于評估流程的實際執行情況,確保數據管理的準確性和有效性,以及組織對數據資產的全面掌控。隨著組織環境和業務需求的變化,數據分類分級監督的內容也在不斷拓展。未來的監督將更加注重評估數據分類分級的合理性,以及分類分級結果的準確性和有效性。這意味著監督不僅僅局限于合規性檢查,更包含了對分類分級標準是否與業務需求相匹配、是否能夠適應數據安全要求的評估。此外,監督還將評估分類分級結果
55、在實際數據保護和使用中的應用情況,包括分類分級是否有助于提高數據處理的效率、是否能夠增強數據安全治理的效果。監督團隊需要持續更新監督方案,以應對技術進步和市場變化,確282024 云安全聯盟大中華區版權所有保監督活動能夠持續為組織提供價值。監督活動的重要性不容小覷,它不僅保障了數據分類分級管理的合規性,更是組織評估和改進數據管理實踐的關鍵工具。通過系統的監督流程,組織可以及時發現流程的缺陷和風險點,進而采取措施加以改進。這種持續的自我完善機制不僅提高了數據的安全性和管理質量,也為組織在快速變化的商業環境中保持靈活性和競爭力提供了支持。四、數據分類分級方法四、數據分類分級方法數據分類分級方法可參
56、考 2024 年 3 月 15 日發布的國家標準 數據安全技術 數據分類分級規則(GB/T 43697-2024),結合組織所屬行業要求、地區要求和指導規范,根據組織實際情況開展工作。圖 7 數據分類分級方法框架4.1 數據分類分級原則數據分類分級原則數據分類分級工作是一項涉及數據全生命周期、業務各個方面以及全員參與的持續性工作。這項工作的核心在于其動態性,要求組織在數據的價值、使用模式和業務需求發生變化時,能夠靈活地調整分類分級策略。管理原則強調了數據分類分級不是一個靜態的框架,而是一個能夠適應組織演變的動態系統。這意味著管理策略須隨著組織的發292024 云安全聯盟大中華區版權所有展和外部
57、環境的變化而發展,確保數據分類分級始終保持相關性和有效性。組織數據分類分級可參照 數據安全技術 數據分類分級規則(GB/T 43697-2024)中的科學實用、邊界清晰,就高從嚴、點面結合、動態更新原則,同時,根據自身業務實際可參考擴展下述原則。數據分類應充分考量組織數據特性,基于組織業務特點,構建層層劃分、層層隸屬、從總到分的分類體系,每一次劃分應有單一、明確的依據。數據類目排列應依據數據類目主題之間的內在聯系,遵循最大效用原則,將全部類目系統地組織起來,形成具有隸屬和并列關系的分類體系,能揭示不同數據在業務歸類之間的聯系和區別。同時,還需要考慮穩定性、擴展性的原則:穩定性原則:數據分類應選
58、擇分類對象最穩定的本質特性作為數據分類的基礎和依據。擴展性原則:在數據類目的設置或層級的劃分上,應當保留適當余地,利于分類數據增加時可擴展。數據分級應以數據的重要性、敏感性和遭受破壞后的損害程度為依據,遵循分級層次合理、界限清晰、數據安全防護策略合理的原則。組織在開展數據分類分級工作時應在此基礎上堅持合理性、實用性、擴展性的原則:合理性原則:數據分級應合理,不能將所有數據全部劃分到某一個級別中。實用性原則:應根據組織數據的多維特征及其相互間客觀存在的邏輯關聯進行科學和系統化的數據分級,數據分級結果能夠為數據的應用、共享、開放過程中的數據安全策略制定提供有效決策和依據。擴展性原則:數據分級方法應
59、具有概括性和包容性,能實現各種類型、場景的數據安全分級,滿足組織各類信息系統、數字化基礎平臺和業務平臺中可能出現的數據類型和安全需求。4.2 數據分類分級依據數據分類分級依據組織在針對數據資產開展數據分類分級工作時,首先應根據中華人民共和國數據安全法中華人民共和國個人信息保護法網絡數據安全管理條例數據安全技術 數據分類分級規則(GB/T 43697-2024)信息安全技術 個人信息安全規范(GB/T35273-2020)等數據分類分級政策和法律法規,再根據組織所在行業監管單位發布302024 云安全聯盟大中華區版權所有的關于本行業本領域的數據分類分級標準、規范等,最后結合組織自身數據資產特點和
60、數據安全管理的需要,按照數據的所屬類型劃分,對數據應用過程中涉及的數據分類,并根據該數據類型一旦遭到泄露、丟失、篡改、非法獲取或非法使用后對客體的危害程度、范圍等,對該數據類型根據數據安全級別劃分。4.3 數據分類方法數據分類方法4.3.1 明確總體思路明確總體思路組織開展數據分類工作時,應實行先按照行業領域分類、再按照業務屬性分類的總體數據分類思路開展相關工作。數據分類方式包含線分類法、面分類法、混合分類法。本文推薦采用混合分類法,以線分類法為主,并結合不同數據維度的面分類法。詳細的分類分級要素說明請參考附錄 C-數據分類分級參考資料。不同行業的典型標準和實踐案例,請參閱附錄 E-典型行業數
61、據分類分級標準解讀。數據分類應當根據組織所屬行業數據使用及管理需求,結合業務屬性細化數據分類,形成從總到分的樹形分類邏輯體系結構。數據分類維度多樣,可根據數據的結構化狀態、數據加工狀態、數據的業務來源、數據是否包含個人信息、使用場景等情況來選取數據分類維度。部分維度示例如下:數據結構化維度:結構化數據、非結構化數據、半結構化數據數據加工維度:原始數據、加工數據個人信息維度:普通個人信息數據、個人敏感信息數據、非個人信息數據業務維度:生產業務、管理運營業務使用場景:數據分析、數據交易本指南重點以業務維度展開數據分類描述,在實際分類工作中,組織應盡量選取業務分類維度應根據管理及實際使用需求選取維度
62、分類,或同時結合多個分類維度混合分類。4.3.2 明確數據范圍明確數據范圍此環節應當梳理組織的所有數據資源,可根據實際情況明確組織所管理的數據范圍,并開展數據分類分級工作。312024 云安全聯盟大中華區版權所有4.3.3 細化業務分類細化業務分類根據組織所屬行業數據使用及管理需求,使用線分類方法,一般可將數據大類分為生產業務類、管理運營類的一層類別。生產業務類下一般包含工程建設、產業生產、設備運維、營銷、監督等;管理運營類下一般包含:戰略規劃管理、人力資源管理、供應鏈管理、財務管理等。各組織可結合實際業務情況將二級類別下的數據細化形成三級、四級類別,最終形成從總到分的樹形邏輯體系結構。4.3
63、.4 分類屬性細分分類屬性細分基于業務屬性進行一、二級類別的劃分后,根據實際情況,宜依據業務的不同屬性來對三級及更低層級的類別進行細化分類。細化分類可進一步參考責任部門、描述對象、數據主體、數據用途、數據處理、數據來源等屬性。如果組織的數據資產涉及法律法規中有專門管理要求的數據類別(如個人信息)時,應按照信息安全技術 個人信息安全規范(GB/T 35273-2020)等有關規定或標準,對業務涉及的個人信息進行識別和標記,以便在個人信息保護、數據跨境等專項場景下能夠快速、準確地識別數據類型、履行合規義務。4.3.5 確定分類規則確定分類規則梳理各二級分類下的業務情況,根據不同行業的數據管理和使用
64、情況,進一步明確組織的數據分類細則。應采取“業務條線關鍵業務業務屬性分類”的方式給出數據分類規則;應對關鍵業務的數據分類結果進行歸類分析,將具有相似主題的數據子類進行歸類。4.4 數據分級方法數據分級方法4.4.1 明確總體思路明確總體思路按照重要性和安全風險程度,組織可將數據分為一般數據、重要數據和核心數據三個基礎等級。根據行業業務及數據特征,數據級別可進行細分,根據數據重要程度由低到高一般可以分為 35 個級別。其中,一般數據中根據數據的重要程度由低到高分為13 個級別,重要數據和核心數據分別設置為一個級別。開展數據分級可實現組織對322024 云安全聯盟大中華區版權所有數據的分級管控、分
65、域存儲,保證組織結構化數據資產在使用過程中達到效率和安全管控的平衡。4.4.2 確定分級對象確定分級對象開展數據分級時應先確定數據分級的對象,以結構化數據為例,常見的數據分級的對象為數據的庫、表、字段或部分表、字段的集合??筛鶕祿w量大小確定數據分級對象的精度,如數據體量過大,無法在單次數據分類分級工作中細分到字段級別,可先以數據表或字段集合作為分級對象,在后續分類分級工作中逐步細化到字段。4.4.3 識別分級要素識別分級要素通過識別數據的各類分級要素,來確定數據的影響對象和數據的影響程度。數據分級要素廣泛,包含數據的領域、群體、區域、精度、規模、深度、覆蓋度、重要性、敏感性等,數據分級要素
66、識別應符合 GB/T 43697 的規定,數據分級要素內容見附錄 C。4.4.4 影響對象識別影響對象識別此環節需要分析發生數據安全風險事件時所受到損害的對象。劃分可以按照群體影響數據、個體影響數據、單位自身影響數據。數據影響對象識別因素的相關內容見附錄 C。群體影響數據:影響國家安全、公共利益、社會秩序、經濟運行等數據;個體影響數據:影響個人及法人的人身權、財產權、隱私權、個人信息權益等數據;單位自身影響數據:影響組織自身或其他組織的生產運營、聲譽形象、公信力、知識產權等數據。4.4.5 影響程度識別影響程度識別數據安全影響程度是指數據安全屬性遭到破壞后,直接或間接造成的全部影響或損害的程度
67、,從低到高劃分為:無影響、輕微影響、一般影響、嚴重影響、特別嚴重影響5 個層級。為準確判斷數據級別,應參照表 3 數據安全影響程度定義判斷數據安全影響程度。表 3 數據安全影響程度定義332024 云安全聯盟大中華區版權所有序號序號程度程度定義定義1無影響對數據資產價值、依賴數據的業務、數據主體(個人、企業、組織及單位自身等)、國家安全、社會秩序及公眾利益等完全無任何影響。例如:依照法律規定進行數據公開發布。2輕微影響對數據資產價值、依賴數據的業務、數據主體(個人、企業、組織及單位自身等)、國家安全、社會秩序及公眾利益等僅造成一定干擾,其造成結果能自行恢復或容易補救。例如:業務效率短時間內下降
68、、任務進度可接受程度的推遲、造成 1W以下敏感客戶數據泄露、業務恢復時間超過 2 小時等。3一般影響對數據資產價值、依賴數據的業務、數據主體(個人、企業、組織及單位自身等)、國家安全、社會秩序及公眾利益等造成一定損害,其造成結果不可逆,但能采取一些措施降低損失、消除影響。例如:企業或個人財產損失、單位形象損失、造成 1 萬以上 10 萬以下敏感客戶數據泄露、業務恢復時間超過 6 小時等。4嚴重影響對數據資產價值、依賴數據的業務、數據主體(個人、企業、組織及單位自身等)、國家安全、社會秩序及公眾利益等造成較嚴重破壞,其造成結果不可逆,雖能采取一些措施挽救,但難度較大、成本較高。例如:人身傷害、企
69、業破產、單位嚴重損失、造成 10 萬以上 100 萬以下敏感客戶數據泄露、業務恢復時間超過 12 小時等。5特別嚴重影響對數據資產價值、依賴數據的業務、數據主體(個人、企業、組織及單位自身等)、國家安全、社會秩序及公眾利益等造成特別嚴重破壞,其造成結果不可逆且破壞性巨大,其影響是全局性、戰略性的。例如:危害人民生命安全、造成單位特別嚴重損失、國家政治經濟利益等巨大損失、造成 100 萬以上敏感客戶數據泄露、業務恢復時間超過 24 小時等。4.4.6 數據級別判定規則數據級別判定規則結合數據影響對象及數據影響程度,數據級別判定規則的相關信息見表 4 數據分級規則,以 5 個級別的劃分方法舉例:針
70、對各對象但無影響程度的數據可視為公開數據,一般可作為 1 級數據處理;針對單位自身的數據,造成輕微、一般影響的為 2 級數據,造成嚴重的為 3 級數據,特別嚴重影響的為 4 級數據;針對公民個人的數據,造成輕微影響的為 2 級數據,造成一般影響的為 3 級數據,造成嚴重影響及特別嚴重影響的為 4 級數據;針對公共利益的數據,造成輕微影響的為 3 級數據,造成一般影響的為 4 級數據,造成嚴重、特別嚴重影響的為 5 級;針對國家安全的數據,造成輕微影響的為 4 級數據,造成一般、嚴重、特別嚴重影響的為 5 級數據。表 4 數據分級規則342024 云安全聯盟大中華區版權所有影響對象影響對象影響程
71、度影響程度無影響無影響輕微影響輕微影響一般影響一般影響嚴重影響嚴重影響特別嚴重影響特別嚴重影響群體影響國家安全1 級4 級5 級5 級5 級公共利益1 級3 級4 級5 級5 級個體影響公民個人1 級2 級3 級4 級4 級自身影響單位自身1 級2 級2 級3 級4 級4.5 數據分類分級變更數據分類分級變更4.5.1 數據分類分級變更情形數據分類分級變更情形數據在類別與級別確定后不是確定不變的,當出現數據體量變更、數據聚合、數據時效性變更、數據脫敏、數據加工等情形時,數據的業務屬性、重要程度、可能造成的危害程度也會發生變化,此時應根據實際情況更新數據的類別和級別。4.5.2 數據分類分級變更
72、場景數據分類分級變更場景(1)數據體量明顯增加或減少時(如超過 20%),考慮到發生數據風險事件時,影響對象及程度可能會提高,應根據實際情況,提高或降低數據級別;(2)將來自不同途徑或不同系統的數據匯聚在一起,數據的原始用途或所在系統發生改變,需對數據進行重新確定類別并分級,匯聚后的數據級別應不低于原始級別。(3)當數據超過使用時效后,應根據實際情況,降低數據級別。(4)當數據經過刪除、去標識化、匿名化處理等脫敏手段后,應根據實際情況,降低數據級別。(5)當發生數據安全事件,導致數據受到泄露、損害等情況時,應根據實際情況,提高數據級別。352024 云安全聯盟大中華區版權所有五、數據分類分級實
73、施方案五、數據分類分級實施方案5.1 數據分類分級實施過程數據分類分級實施過程數據分類分級實施階段主要包含:業務活動識別、數據資產發現、數據資產識別、分類分級策略制定和數據標識標記。各階段的流程如下圖所示:圖 8 數據分類分級實施流程5.2 業務活動識別業務活動識別本階段需識別和梳理全部業務活動(或增量業務活動),采取的主要方式為人工訪談、資料查閱和系統查驗。人工訪談:與相關業務負責人進行訪談,了解當前的業務領域和細分業務條線,整理形成業務清單。資料查閱:查閱系統相關的開發設計文檔、操作手冊等說明性資料,了解系統承載的業務情況。系統查驗:對相關業務系統的功能模塊、承載的業務情況進行查驗,梳理各
74、業務活動,整理形成業務清單。業務活動識別的主要內容包含:業務領域、業務大類、業務子類、業務條線、業務操作描述、關聯結構化數據集描述、關聯非結構化數據集描述。5.3 數據資產發現數據資產發現數據資產發現階段,首先發現和識別數據載體,進而發現不同數據載體中包含的數據內容。詳細的系統功能和典型案例,請參考附錄 A-典型數據分類分級系統介紹。相關關鍵技術的詳細描述見附錄 D-數據分類分級關鍵技術與方法。5.3.1 數據載體發現數據載體發現數據載體發現一般從兩方面開展,一是針對已知的數據載體進行盤點和梳理,二是對未知的數據載體進行探測和發現。362024 云安全聯盟大中華區版權所有已知數據載體結構化數據
75、通常的載體為包含 Oracle、MySQL、MSSQL、DB2、達夢、人大金倉、南大通用、ES、Hive、PostgreSQL 等在內的數據庫系統,需完整地進行盤點和梳理,包含網絡地址、端口、用戶名、口令等信息。非結構化數據通常的載體為文件服務器、移動存儲介質、終端等。未知數據載體針對未知的數據載體,需要通過數據資產探測技術探測和發現。通過主動向目標網絡發送探測數據包,對存有數據資產的存活主機、服務器執行探測掃描。主動探測前,需要確認掃描的網段、所使用的數據庫等,然后再有針對性地掃描。主動探測能夠掃描設定范圍內,網絡可達的所有數據資產。通過主動探測掃描技術,能夠自動發現數據庫的基本信息,包括:
76、端口號、數據庫類型、數據庫實例名、數據庫服務器 IP 地址等。針對結構化數據,主流的可探測的數據包協議包括:TCP/IP 協議族,HTTP 等應用層協議。同時,可對當前主流的數據庫及其默認端口掃描,如 MySQL(3306)、Oracle(1521)、SQL Server(1433)、DB2 數據庫(5000)、PostgreSQL(5432)、DM 達夢(5236)等。針對非結構化數據,主流的可探測的數據包協議包括:TCP/IP協議簇,HTTP、HTTPS、FTP、SFTP、TFTP 等應用層協議。5.3.2 數據內容發現數據內容發現完成數據載體發現后,分別針對結構化數據載體和非結構化數據載
77、體中的數據執行內容發現。結構化數據載體針對結構化數據載體中的數據,需要識別出數據庫名稱、數據表名稱、字段名稱,這些名稱通常是英文的。非結構化數據載體針對非結構化數據載體中的數據,需要識別出數據文件存儲路徑、數據文件名稱、數據文件格式、數據文件量級、數據文件屬性。數據文件存儲路徑一般指絕對路徑;數據文件量級是指文件的字節大小。5.4 數據資產識別數據資產識別372024 云安全聯盟大中華區版權所有5.4.1 結構化數據結構化數據在結構化數據內容發現的基礎上,進一步明確各數據庫、數據表、數據字段的英文名稱所對應的中文名稱,字段說明(字段說明是指字段中存儲的真實值的取值示例,如“name”字段對應的
78、字段說明為“張三或李四”)、字段長度以及數據字段對應的數據所有方、數據使用方和數據管理方,形成標準的結構化數據資產清單,包含:應用系統名稱、數據庫名稱、數據庫中文名、數據表名稱、數據表中文名、字段名稱、字段中文名、字段說明、字段長度、數據所有方、數據使用方、數據管理方。標準模板的具體內容可參考附錄 B-數據分類分級參考模板。5.4.2 非結構化數據非結構化數據在非結構化數據內容發現的基礎上,進一步明確各數據文件的內容描述、所有方、使用方和管理方,形成標準的非結構化數據資產清單,包含:應用系統名稱、數據文件存儲路徑、數據文件名稱、數據文件格式、數據文件量級、數據文件內容描述、數據文件所有方、數據
79、文件使用方、數據文件管理方。如附錄 B 所示。數據文件內容描述是指文件內容的摘要,可通過技術工具,結合工具的識別算法和規則、特征庫,去識別已知格式文件的內容;未知格式文件的內容需要通過人工調研、核查識別。當前常用的識別技術有 NLP、OCR、視頻文件處理、音頻文件處理等技術,如下圖所示:382024 云安全聯盟大中華區版權所有圖 9 常用數據識別技術NLP,即自然語言處理,主要用于文檔類型文件的處理,如 doc、txt、pdf 等格式,需要識別其中的關鍵內容。NLP 的基本步驟為:斷句、分詞、標記詞性、識別命名實體、去停用詞。OCR,即光學字符識別,主要用于識別圖片中的數據,如 bmp、jpg
80、、png、tif、gif 等格式。OCR 的基本步驟為:圖像預處理、字符分割、字符識別、字符組合、文字處理。視頻文件處理,主要用于識別視頻文件中的數據,如 mp4、avi、flv 等格式。視頻文件處理的基本步驟為:提取幀、過濾幀、圖像內容識別、文字處理。音頻文件處理,主要用于識別音頻文件中的數據,如 mp3、wav、flac 等格式。音頻文件處理的基本步驟為:音頻轉文字、文字處理。有關非結構化數據識別的規則示例,請參見附錄 G。5.5 分類分級規則制定分類分級規則制定本階段工作在實施過程中,項目組需要考慮企業所在行業的監管單位是否已經發布了數據分類分級相關的標準、規范和指南等文件,并根據企業所
81、在行業是否存在數據分類分級標準的情況,參考第四章節方法,按照以下兩種方式完成本次項目數據分類分級規則的設計。所在行業有數據分類分級標準若組織所屬行業的監管單位已經發布了數據分類分級標準、規范、指南等文件,則應在行業已經發布的數據分類分級標準的基礎上,結合梳理得到的 數據資產清單 等,并根據組織的數據安全管理和業務發展的需要,對行業監管單位發布的數據分類分級標準進行優化,形成組織的數據分類分級規則,應確保優化后的數據類別可以覆蓋組織業務中涉及的所有數據內容。所在行業無數據分類分級標準若組織所屬行業暫未發布數據分類分級相關的標準、規范、指南等,則應根據梳理得到的數據資產清單等,以及組織的數據安全管
82、理和業務發展的需要,依據第四章節的方法或者參考其他行業成熟的數據分類分級規則,進行深度的分類設計。數據分類規則設計過程中,應逐層對數據分類分級策略進行細化,直至細化后的每一個數據類別392024 云安全聯盟大中華區版權所有均對應到業務中最小一類的數據資產,并且應確保細化后每一個子類之間不存在交叉重復情況,以及所有子類匯總后可以覆蓋業務中涉及的所有數據資產內容;在進行數據分級規則設計時,應通過綜合考慮定性與定量的思想,充分考慮該類型的數據一旦遭到泄露、篡改、破壞或者非法獲取、非法利用、非法共享后可能影響的對象、影響范圍、影響程度等因素,從而設計分級策略。5.6 數據標識標記數據標識標記本階段需要
83、依據數據分類分級規則,為數據資產進行標識標記。數據分類方面,應當結合識別的業務活動和確定的數據分類規則確定分類標識,再開展標記工作;數據分級方面,應當先確定數據分級對象(如數據項、數據集、衍生數據、跨行業領域數據等),然后識別分級要素(如數據的領域、群體、區域、精度、規模、深度、覆蓋度、重要性等),再根據分級要素識別情況分析數據一旦遭到泄露、篡改、損毀或者非法獲取、非法使用、非法共享可能影響的對象和影響程度,綜合確定分級標識,最后開展標記工作。分類分級標記過程中,可通過工具預定義的規則庫實現自動標記,再通過人工審核和糾錯的方式,核查數據標記的正確性、完整性,最終形成數據分類分級清單,如附錄B
84、所示。數據標記方法主要有元數據標記和原始數據標記兩種。元數據標記法是指通過數據資產梳理建立結構化和非結構化數據的資產清單,然后標記數據字段、表、庫、文件等表結構名稱,然后通過建立映射表尋找相關數據內容的一種方法。映射表則主要用來存放鍵值對,如果提供相應的鍵,就能查到相應的值。原始數據標記法在實現方式上可分為“字段標記法”和“數據水印法”。字段標記法是指把標記“打”在某一個公共訪問的字段上,這個字段往往代表數據的一種屬性,從而能夠作為區分數據資產方式的一個重要依據。數據水印法是指通過數據水?。〝祿∈且环N將標識信息通過一定的規則與算法隱藏在結構化數據和非結構化數據中的技術)的方式,為數據資產打
85、標。需要注意的是,采取原始數據標記法會涉及數據內容的變更,需在使用前評估。402024 云安全聯盟大中華區版權所有六、數據分類分級的應用六、數據分類分級的應用圖 10 數據分類分級成果應用6.1 滿足合規監管要求滿足合規監管要求自中華人民共和國數據安全法中華人民共和國個人信息保護法發布以來,針對數據分類分級、重要數據目錄報送等要求,各部委、行業監管單位相繼出臺了一系列政策要求、行業要求,如工信部下發的工業和信息化領域數據安全管理辦法工業數據分類分級指南,國家金融監督管理總局下發的銀行保險機構數據安全管理辦法中都明確要求了所管轄行業的數據分類分級的要求,細化到各個行業,如電信、金融、能源、政務、
86、醫療等各行業都相繼發布了行業標準、團體標準。從整體政策發布趨勢來看,對數據分類分級的政策要求、行業要求越來越完善,越來越嚴格。完成數據分類分級工作后,可梳理分類分級結果與識別的重要數據,并按規定模板填寫及報送主管單位。同時在數據跨境場景中,企業應首先識別自身主體身份,根據分類分級結果,判定是否含有重要數據或個人信息,并統計重要數據和個人信息的體量,決定是否需要執行數據出境安全評估,滿足數據出境的安全合規要求。6.2 優化數據資產監測優化數據資產監測412024 云安全聯盟大中華區版權所有數據作為關鍵生產要素,為實現充分發展數據要素的各項政策接連推出。對各企業來說,要充分釋放數據要素價值,首先就
87、需要梳理自身數據資產情況,完成數據分類分級。通過數據分類分級工作,企業可以更有效地了解和展示企業數據資產的類別與級別情況。在完成數據資產梳理工作后,可以以數據的類別、級別,數據的體量,數據在不同系統的分布情況,數據的使用情況等維度,進行關聯展示與分析,根據不同關聯的維度在各安全場景下進行安全預警,為后續的數據安全保護做準備。6.3 開展數據處理活動管控開展數據處理活動管控在數據的收集、存儲、使用、加工、傳輸、提供、公開、銷毀等數據處理活動中,可結合數據分類分級的結果執行安全管控,如在數據存儲過程,可結合數據的級別執行分域分層存儲;在數據使用環節中,可對高級別敏感數據的應用和流轉執行安全監測;在
88、數據的共享、交換環節,針對不同級別的數據設置不同的審批流程;在數據的銷毀環節,對高級別的數據設立更嚴格的數據銷毀程序等等。6.4 細化數據安全風險及事件管理細化數據安全風險及事件管理隨著數據安全威脅的日益加劇,開展數據安全風險評估,確保安全風險可控成為企業數據安全建設的工作重心。開展數據安全風險評估時,數據的重要性是確定風險危害程度分析的關鍵要素,數據分類分級可以作為精細化風險評估工作的前置條件,數據級別越高代表數據重要性越高,個人信息規模和數據敏感程度可以作為判斷數據重要性的衡量因素。在開展數據安全事件管理時,應根據數據分類分級的結果,將事件涉及的數據類別、級別、規模等要素與事件預警級別進行
89、有效關聯,并根據不同的事件預警級別選擇對應的處理策略,在事前、事中、事后同步提升數據安全管理能力。6.5 實現數據安全保護聯動實現數據安全保護聯動企業為提高數據安全保護能力,可充分應用數據分類分級結果,聯動各項數據安全保護措施,包括不限于:數據加密、數據脫敏、數據防泄露、訪問控制、數據水印等。設立具有針對性的安全保護策略,提升數據安全保護能力,降低數據安全保護成本,針對一般數據、重要數據、核心數據的安全保護策略示例如下:422024 云安全聯盟大中華區版權所有表 5 數據分級保護策略示例級別級別保護方法(示例)保護方法(示例)加密脫敏防泄露標識標簽備 份 容災鑒別認證記錄審計一般數據一般數據按
90、需按需按需需要,標識數據的類別、級別、責任人需要,定期備份按需需要,接入及行為記錄,定期審計重要數據重要數據需要,對存儲 數 據 進行 分 級 加密需要,且具備泛化、抑制、干擾等脫敏技術或算法需要,且內 容 級 檢測及阻斷需要,標識數據的類別、級別、責任人、使用場景需要,定時備份,并 異 地容災需要,進行雙 因 素 鑒別需要,接入及行為實時監控及時審計,數據操作行為異常監測督促整改核心數據核心數據需要,傳輸加密,采用有 128 位或以 上 強 度的 國 產 密碼技術需要,且具備泛化、抑制、干擾等脫敏技術或算法需要,且內 容 級 檢測及阻斷需要,標識數據的類別、級別、責任人、使用場景需要,實時備
91、份,并 異 地容災需要,進行雙 因 素 鑒別,并授權訪問控制,限 制 訪 問范圍、頻率需要,接入及行為實時監控及時審計,數據操作行為異常監測督促整改,數據安全風險監測432024 云安全聯盟大中華區版權所有附錄附錄 A-典型數據分類分級系統介紹典型數據分類分級系統介紹A1 天融信數據安全分類分級系統天融信數據安全分類分級系統 產品功能介紹產品功能介紹圖 11 天融信數據安全分類分級系統天融信數據安全分類分級系統(TopDCS),致力于為企業級用戶提供一體化數據安全感知中心、決策中心和指揮中心。圍繞著國家監管、行業監管等保合規、安全運營等多種場景需求而設計研發。系統以數據安全治理為基礎,數據安全
92、防護為手段,數據安全生命周期為管理核心,數據安全服務為支撐,基于以數據為中心的安全架構 DigitalContainer Shipping Association(簡稱“DCSA”)技術架構,利用大數據、機器學習技術,對全網數據安全信息進行采集與分析,實現數據資產全面識別與統一管理、快速定級與備案管理、組件備案與精準防護、風險發現與監測告警,實現全面合規、協同智能、統一集中的數據安全管控。天融信數據安全分類分級系統采用 DCSA 技術架構,目標是解決跨多個產品應用分類、保護、訪問控制、權限、監控、警報和審計。數據分類分級系統能夠靈活應對邏輯隔離、物理隔離、跨地域等多種網絡隔離場景下的數據分類分
93、級需求。通常情況下客戶使用系統進行分類分級工作,但在網絡存在隔離的情況下,比如邏輯隔離、物理隔離和網絡不通,數據量超大情況下,僅靠系統難以滿足需求,因此需要數據安全分類分級442024 云安全聯盟大中華區版權所有系統對網絡隔離/不聯通的情況下完成數據分類分級工作,并將結果同步至系統。同時采用多種方式自動識別多樣性數據資產,實現數據分類分級以及敏感數據目錄標定;實現呈現數據安全總體態勢,包括數據資產態勢、告警風險態勢等,從用戶側各業務的數據全生命周期提供安全防護服務。按照一體化、標準化、智能化、可視化要求,快速掌握全面數據安全態勢、掌握數據面臨的安全風險、隱患、及時發現、實現對數據安全告警進行及
94、時處置,圍繞數據安全生命周期建立數據安全防護機制和技術支撐體系,為各業務數據提供安全防護能力,減少數據安全事件造成的損失、提升數據安全防護能力。實現數據生命周期的可信、可管、可控、可追溯的目標。態勢監測分析數據安全管理整體情況,持續監測分析數據資產的態勢信息并進行展示。從資產分布、重要數據分布等多個角度可視化呈現組織內數據安全情況,展示包括數據資產多級別分布、數據資產類別分布以及重要數據的級別分布,幫助運營人員全面掌握數據資產態勢。數據資產管理管理數據庫資產,為組織提供高效、可靠的數據庫資產維護和檢索機制,便于維護數據庫資產信息。對納管的數據庫資產通過列表清單形式展示和維護管理,清晰了解網絡中
95、的數據庫資產及其變化的過程,方便對數據庫資產進行記錄維護。數據資產管理管理數據資產,集中、高效、安全地管理數據資產。對納管的文件服務器資產通過列表清單的形式維護管理,包括新增、查看、編輯、刪除、導入、導出,詳細了解文件服務器資產及其變化過程。數據資產探測全面、高效、自動化識別網絡中存在的數據資產和資產的元數據結構。創建針對目標 IP 范圍的數據資產探測任務,自定義任務名稱、掃描類型、IP 范圍、任務時間,采用混合掃描技術探測識別數據庫、文件服務器、設備資產等類型的資產,管理控制探測任務,包括啟動、停止、查詢、刪除、導入、導出等,查看掃描結果信息,包括 IP、端口、推薦資產類型、主庫添加狀態,并
96、可對其進行主庫添加。備庫管理精準、全面地管理數據資產探測任務中待確認的備庫資產。對探測結果中的元數據452024 云安全聯盟大中華區版權所有進一步劃分,實現探測數據的主備庫管理和備庫回收站管理,支持但不限于刪除、導出、主庫添加、誤刪恢復等操作,支持以列表清單的形式查看備庫資產信息,展示 IP、端口、資產類型、來源、主備庫狀態、時間等信息,形成多信息要素的備庫資產展示。數據資產掃描全面、自動化、自定義掃描網絡中的數據資產并展示數據資產的詳細信息,幫助運營人員更加快速、直觀了解數據資產狀況。支持自定義掃描模式、數據特征、執行方式等信息創建資產掃描任務進行數據資產掃描,并通過列表清單的形式展示數據資
97、產掃描任務,展示信息包括資產名稱、IP、端口、資產類型、來源方式、執行方式等,可對任務進行編輯、啟停、離線特征分析、查看結果等操作。元數據管理提供數據庫、文件服務器、應用接口的綜合性、集中化的元數據管理功能。支持多種數據類型混合掃描結果綜合顯示,提供集中化、綜合性的元數據管理手段,包括數據掃描、元數據掃描、離線數據導入得到的數據庫元數據、文件服務器元數據應用接口元數據,通過列表清單集中呈現,展示項包括數據庫名稱、資產 IP、字段名稱、數據特征、業務系統、文件路徑等信息。分類分級查看精細化、高效化實現分類分級查看功能。對數據資產進行分類分級管理,對數據資產的編目、標準化、管理有指導作用,分類分級
98、查看支持業務系統、數據庫、文件服務器多個維度對分類分級結果進行查看,顯示的信息包括資產 IP、業務系統、文件總數、已分級數量、敏感數量、重要數量、個人信息數量等,便于運營人員查詢、識別、管理、保護和使用數據。分類分級檢索提供分類分級檢索功能,有效避免在海量信息中迷失方向。支持數據庫檢索、文件系統檢索、應用接口檢索,支持 IP、業務系統、文件服務器多維度進行分類分級檢索,并以列表清單的形式呈現檢索結果,呈現的信息包括且不限于資產 IP、業務系統、字段名稱、數據特征、分類分級信息、數據標簽等信息,便于運營人員捕捉數據資產的關鍵信息。(6)分類分級任務通過創建分類分級任務對目標資產實現準確、可靠的分
99、類分級。支持對已掃描的數462024 云安全聯盟大中華區版權所有據資產進行分類分級,也可以先創建數據掃描任務、再對其進行分類分級任務,并通過列表清單的形式展示已經創建的數據分類分級任務,呈現的信息包括任務名稱、策略名稱、目標數據資產、任務狀態等,可對分類分級任務進行查看、增加、編輯、刪除、執行等操作,實現分類分級任務的全流程管理,幫助運營人員提升分類分級任務管理效率。(7)分類分級策略通過創建分類分級策略幫助實現數據的精細化管理,提高數據的使用效率和安全性。系統支持自定義分類分級策略,能夠根據行/企業標準定義分類分級策略,包括自定義分級信息和數據標簽,支持模板導入功能,能夠快速實現分類分級策略
100、制定,并支持對已有的分類分級策略進行查看、編輯、刪除、復制等操作。(8)數據識別規則管理提供數據識別規則管理功能,自動化匹配數據特征。識別規則域包含多種類型識別規則,對數據庫、文件服務器、應用接口等多種識別對象使用關鍵詞、正則表達式、詞典等多種識別方式自動化匹配,可根據數據識別的分級分類結果以列表清單形式進行呈現,支持自定義維護數據標簽,可手動對數據特征進行編輯修改,實現分級分類打標自由化,同時提供批量導入和導出功能,為運營人員提供高效的數據特征管理手段。產品特點介紹產品特點介紹數據資產自動發現可根據預定任務自動進行數據資產掃描、識別整合各類數據資源,并基于行業分類分級標準形成敏感數據特征庫,
101、從而減輕人工識別工作量,降低人工操作的復雜度,實現敏感數據識別自動化,為后續的數據分析、決策支持等提供堅實的數據基礎。數據資產識別知識豐富可識別的特征庫、數據庫類別多,識別知識豐富。系統內部集成了大量的數據資產識別算法和模型,能夠全面、準確地識別各種類型的數據資源,包括結構化數據、非結構化數據、關系型數據、非關系型數據等。數據特征識別智能化采用自然語言處理(NLP)、機器學習、正則語法相結合的人工智能特征匹配技術,實現數據資產特征精準識別,智能化識別數據特征,采用多層次綜合識別技術,從數據資產位置、名稱特征、數據特征、關鍵詞規律等多個維度,綜合化識別數據特征。472024 云安全聯盟大中華區版
102、權所有 產品展示產品展示圖 12 數據安全分類分級系統界面展示圖 13 數據安全分類分級系統界面展示 產品應用情況產品應用情況天融信數據安全分類分級系統(TopDCS)適用于擁有大量數據資產,注重數據資產價值的行業客戶,幫助用戶解決在數據安全管理中所面臨的數據安全合規、業務數據分類分級梳理、數據資產認責及管控、數據結構及流向可視化監控、數據安全威脅檢測、數據安全策略集中管控、數據安全態勢可視化、數據安全運營支撐等一系列問題。通過數據分類分級建設,結合天融信網絡 DLP、終端 DLP、數據脫敏、數據庫網關、數據庫審計等數據安全組件設備,實現數據全生命周期的可信、可管、可控。目前,本產品已成功應用
103、于運營商、海關、能源、政府、交通、醫療、教育等 10 多個行業。482024 云安全聯盟大中華區版權所有A2 觀安觀智敏感數據發現軟件觀安觀智敏感數據發現軟件 產品簡介功能介紹產品簡介功能介紹圖 14 觀安觀智敏數據發現軟件功能介紹觀安觀智敏感數據發現軟件基于隱私保護與合規的數據安全治理技術框架,根據各行業的業務數據特征和分類分級規范,提供行業模板,通過自主創新研發的敏感數據識別技術全面、快速、準確發現和定位敏感數據,構建持續更新的企業敏感數據分類分級目錄。內置 GDPR、網絡安全法、PCI 等合規知識庫,結合敏感數據目錄識別和量化數據安全風險,生成統計報告,驅動數據安全策略的落地,為數據安全
104、工作的推進提供抓手。492024 云安全聯盟大中華區版權所有 產品特點介紹產品特點介紹數據分級分類敏感數據發現系統根據行業相關規范要求及行業通用數據,既提供內置的數據分類分級行業模板,也可以基于企業實際情況新增自定義模板,多個模板間和獨立并存。貼合企業自身業務數據管理需要,滿足企業數據安全分類分級建設要求。支持用戶通過資源或表粒度自定義分類分級任務、導出分類分級結果。根據數據的來源、內容和用途對數據進行分類;按照數據的價值、內容敏感程度、影響和分發范圍不同結合智能向量引擎、智能反饋引擎、多維指標引擎對數據進行敏感級別劃分,不同敏感級別的數據有著不同的管控原則和數據開放要求。在完成任務后可通過多
105、個視角對結果進行核查,形成多個用于安全業務的清單,如分類分級清單、重要數據清單等,分類分級清單和重要數據清單以字段粒度展示全部數據資產/重要數據資產的分類分級標注結果以及數據資產的詳細信息,并且生成對應分類分級報告。同時提供全量導出功能,供用戶數據上報或迎檢。敏感數據發現明確了數據發現的對象和策略后,要對敏感數據進行識別和定位?;谝巹t匹配、語義算法、特征提取等技術手段,根據過濾條件對抽取的數據子集進行自動識別。內置豐富敏感數據發現算法,支持對某列數據按照自定義的數據內容字典進行匹配,對于發現無法歸納出數據特征,可使用枚舉方式發現的敏感信息字段和其他用戶自定義算法。敏感數據梳理任務支持指定數據
106、表或文件,支持定時、周期性進行,支持增量個性化發現,以適應業務上定期更新數據庫等業務行為,提供全方位、高效、貼心化的敏感數據梳理。根據對上位法解讀結合系統自有敏感數據識別技術,系統支持通過對不同數據模型關聯,提供合規檢查項管理功能。而根據合規檢查項進行合規檢查,生成合規風險檢查報告,幫助企業對自身數據安全問題點和現狀提供依據。數據資源管理支持通過自動資源掃描、手動導入已整理好的數據資產表格或手動添加數據源及其連接信息的方式匯總數據資源,支持基于 IP 段創建任務進行自動掃描,全方位發現數據資源,提高資源梳理效率與發現能力,減少人工整理成本??梢暬故靖鲾祿祛愋?、文件類型等數據資源的分布情況,
107、可導出數據資源清單和圖表。支持查看數據源的用戶502024 云安全聯盟大中華區版權所有信息、敏感數據統計信息和主外鍵關聯信息,頁面上展示了數據源下各表或文件的元數據,包括字段的數據類型、是否主鍵、注釋信息等。產品展示產品展示圖 15 觀安觀智敏數據發現軟件產品展示 產品應用情況產品應用情況產品廣泛應用于運營商、金融、政府、能源、制造等行業。512024 云安全聯盟大中華區版權所有A3 山石網科數據安全綜合治理平臺山石網科數據安全綜合治理平臺 產品功能介紹產品功能介紹圖 16 山石網科數據安全綜合治理平臺功能介紹產品采用 B/S 結構和大數據底層技術框架,搭載數據資產自動發現、數據架構智能掃描,
108、敏感資產自動識別等先進技術引擎。能夠幫助企業快速定位其內部網絡中的數據服務,以及各類數據資產的分布等情況,協助用戶清晰地掌握敏感數據分布、流轉和使用情況,對數據資產進行不同類別和密級的劃分,以便實現對敏感數據進行針對性防護。數據源類型支持數據庫、文件系統、大數據組件多種數據源類型。數據庫類型支持國際主流數據庫,如 Oracle、SQL Server、MySQL、DB2、Informix、Sybase、PostgreSQL、Cache 等,同時支持國產數據庫,如達夢、人大金倉、南大通用、高斯 DB 等,文件系統支持 FTP、NFS、Samba 等類型,大數據組件支持 Hive、MongoDB、G
109、reenPlum、Hbase、ES 等。數據源管理通過數據服務掃描引擎,能夠自動掃描、判斷、識別網絡內常見的數據庫和文件系統服務。數據源自動發現模塊無需數據源服務端的授權,即可發現常見的大多數數據庫522024 云安全聯盟大中華區版權所有和文件系統類型。支持快速掃描和精準掃描兩種模式。掃描結果以可視化的方式展示出企業內部已存在的數據庫或文件系統相關信息。數據資源管理模塊可通過自動化方式掃描用戶的數據庫表,建立全局的數據資源目錄,并內置了敏感數據識別規則,可以有效識別敏感數據在系統內的分布情況。同時數據資產管理模塊支持對數據庫、表、字段的備注定義和分類打標,可根據數據價值和特征,梳理出核心數據資
110、產,對其進行分級分類,從而落實對數據更為精細的安全管理措施。數據資產發現平臺提供數據資產發現和識別服務,通過對分布在數據源中的各類業務數據提供自動化梳理服務自動化掃描和采集數據所在的物理位置、邏輯位置、存儲格式、狀態等多維屬性信息,平臺利用數據資產分析模型,進行分析、歸納、統計獲得完整的數據資產分布拓撲、數據資產目錄、敏感數據分布地圖、敏感數據訪問熱點分布、數據資產訪問權限管理實現數據資產安全防護動態管理。支持敏感數據自動識別,能從海量數據中精準定位不同類型敏感信息的數量和分布等信息。內置超過 40 種的敏感特征庫,涵蓋社會特征、個人證件、通訊信息、財產信息、企業信息、車輛信息等常見敏感信息項
111、,如姓名、地址、電話、身份證、統一社會信用代碼、銀行卡號、日期、Email 等敏感信息。用戶也可以通過自定義的方式構建企業所屬行業的敏感信息特征模板。根據敏感數據的定義,使用內容識別手段(關鍵字、正則表達式、內容指紋、字典等),對于數據進行內容識別和檢測。敏感數據的識別,是實現數據的索引、標記及數據發現、審計等工作的前提條件,通過技術手段區分普通數據和敏感數據。數據架構掃描支持數據庫或文件系統的架構信息掃描,數據庫獲取的信息包括模式(庫)、表、列(字段)等元數據信息,以及主鍵、外鍵、索引、約束、函數、存儲過程、觸發器、序列、同義詞等數據庫對象信息,文件系統包括的信息主要有目錄、文件、列(字段)
112、,通過這些架構信息,能夠繪制出完整的數據結構關系圖表,幫助用戶快速發現并理解現有的數據結構。532024 云安全聯盟大中華區版權所有賬號權限掃描能夠快速地對數據庫的賬戶進行掃描,獲取其角色、對象等相關權限信息??梢灾庇^地展示賬戶所擁有的權限,定位賬戶所擁有的高風險權限,便于對數據庫賬戶進行管理。數據分類分級數據分類分級主要用于維護數據類別標簽及數據風險等級。支持自定義數據類別標簽及數據風險等級,支持分類分級標簽的自動標記或手動標記。數據資產分級是指按照數據資產的敏感等級(密級),對數據進行劃分歸類的操作,企業或部門可以使用其所屬行業的數據分類分級標準,也可以根據所管理的數據資產的特點,定制分級
113、標簽。數據資產分類是指用戶可以給數據資產打上分類標簽,讓原本無法直接理解的數據,變得可閱讀、易理解。進一步幫助企業了解資源使用狀況,提供業務調整決策依據與數據支撐,合理利用數據資源。根據規則庫或者數據敏感特征項對數據自動分類分級,并自動標識,形成敏感數據資產可視化和數據分布管理清單,將數據分為不同的業務類別和安全級別實施差別保護,為各項數據安全防護策略的制定提供基礎,通過與數據安全防護設備進行聯動可以實現數據安全防護策略自動部署和應用,避免對所有數據進行一致高強度防護成本增加和效率下降。通過對識別的數據資產進行分類分級,針對不同級別的數據進行策略設置,以實現敏感數據的識別和跟蹤管理。同時,根據
114、差異化分類分級管控需求,可自定義數據分類分級模型。內置分類分級行業模板內置電信行業與金融行業分類分級標準模板,用戶也可根據自己所存儲的關鍵數據的敏感程度與價值程度,將數據分為不同的業務類別和安全級別實施差別保護。分類分級除了可以滿足中華人民共和國數據安全法的合規需求,在有“覺悟”的企業看來,更是提升自身信息化水平和運營能力的良方?;跇I務的分類可以更好地將數據資產化,持續性為企業提供精準的數據服務;同時數據分級可以在安全角度為企業保駕護航,哪些數據可以使用、哪些不可以使用、哪些能對外開放、哪些不能開放、不同等級的數據在不同場景使用哪種安全策略,一目了然。542024 云安全聯盟大中華區版權所有
115、數據資產臺賬支持以直觀的方式展示系統在指定環境中掃描到的數據資產的所有信息,全面掌握數據資產的存儲位置、資產目錄結構、分級標簽、分類標簽,敏感特性項等信息。支持快速檢索查看或者導出關注的資產信息。數據流向管理支持對數據資產的流向進行直觀展示,可以清晰洞察數據在不同資產模塊間的流轉情況,準確定位數據資產的位置,持續跟蹤數據資產動向。(10)數據資產地圖通過地圖的形式展現可視化、全方位、多維度的企業數據資產分布情況。為企業構建知識圖譜、賬務數據資產全貌等,讓數據生動形象起來,連接數據和應用場景,輔助企業的管理決策。產品特點介紹產品特點介紹山石網科數據安全綜合治理平臺具有支持范圍廣、識別速度快、易用
116、性高、通用性強等特點,幫助企業快速發現和梳理數據資產狀況,輔助企業對數據分類分級建設,洞察數據資產流向和用戶權限,同時能夠滿足各種監管檢測等場景,替代了傳統的數據資產管理和梳理工作模式,極大地提高數據梳理的工作質量,進而降低企業管理成本,為企業的數據安全建設保駕護航。產品展示產品展示圖 17 山石網科數據安全綜合治理平臺產品展示552024 云安全聯盟大中華區版權所有 產品應用情況產品應用情況平臺目前數據庫類型支持國際主流數據庫,如 Oracle、SQL Server、MySQL、DB2、Informix、Sybase、PostgreSQL、Cache 等,同時支持國產數據庫,如達夢、人大金倉
117、、南大通用、高斯 DB 等,文件系統支持 FTP、NFS、Samba 等類型,大數據組件支持 Hive、MongoDB、GreenPlum、Hbase、ES 等。通過數據安全治理平臺,以“數據為中心”對政府、電信、金融、醫療、交通、高校、互聯網的核心應用系統的數據開展安全治理工作。首先,以數據分類分級服務的方式對數據資產進行全面的梳理;其次,依據相關標準在數據安全治理平臺中對數據資產進行標簽批注,以便于精準數據安全管控。562024 云安全聯盟大中華區版權所有A4 大道云隱密數萬象數據資產管理系統大道云隱密數萬象數據資產管理系統 產品簡介功能介紹產品簡介功能介紹圖 18 大道云隱密數萬象數據資
118、產管理系統功能介紹 產品特點介紹產品特點介紹非結構化數據分類通過人工智能算法,企業能夠實現對非結構化數據(如文件)的高效分類,這一過程極大地提升了數據處理的速度和準確性。傳統的人工分類方式受限于人力資源的有限性和人為錯誤的可能性,而人工智能算法則能夠自動化地處理大量數據,并通過機器學習和深度學習的技術,不斷優化分類的精準度。持久化保護在文件發送后,可精準設定僅特定 IP 地址或指定機器能夠開啟文件,有效限制文572024 云安全聯盟大中華區版權所有件訪問范圍,防止文件被未授權的設備獲取。并且,文件還能依據預設時間自動刪除,徹底杜絕文件在超出授權時效后仍留存于外部環境而引發的安全隱患,全方位保障
119、文件在傳輸與使用過程中的安全性與保密性。資產管理軟件強大的數據災備和同步功能,確保了企業數據的完整性和安全性。在遭遇突發錯誤、人為錯誤或技術故障等突發情況時,企業能夠迅速恢復數據,避免業務中斷和損失。同時,數據的實時同步功能,確保了不同部門和員工之間信息的及時共享,提高了工作效率和協作能力。模型版權通過區塊鏈等先進技術,為模型賦予獨一無二、不可篡改的數字標識,精準記錄其創作信息、版本演變及歸屬詳情。在模型分發與使用過程中,嚴格監測每一次的訪問、調用與傳播行為,借助加密算法與授權機制,確保只有合法授權的用戶在許可范圍內才能使用模型。一旦發現侵權行為,能夠迅速溯源追蹤,并提供具有法律效力的證據鏈,
120、有力維護模型創作者的合法權益知識遺忘可依設定條件,如知識領域、來源、時間等精準定位要遺忘的知識。能靈活選擇遺忘方式,或漸進或一次性清除。過程中嚴守數據安全,保障模型架構與其他知識穩定,避免誤刪,適配不同場景需求,有效管理模型知識數據。582024 云安全聯盟大中華區版權所有 產品展示產品展示自動分類圖 19 大道云隱密數云資產保護系統自動分類態勢感知-渠道管控圖 20 大道云隱密數云資產保護系統態勢感知-渠道管控592024 云安全聯盟大中華區版權所有態勢感知-模型管控圖 21 大道云隱密數云資產保護系統態勢感知-模型管控 產品應用情況產品應用情況密數云產品以其卓越的安全性能與強大的數據處理能
121、力,廣泛應用于多個領域,特別是在制造業、金融行業以及政府機構中發揮著至關重要的作用。602024 云安全聯盟大中華區版權所有A5 神州數碼數據分類分級系統神州數碼數據分類分級系統 產品功能介紹產品功能介紹圖 22 神州數碼數據分類分級系統功能介紹神州數碼數據分類分級系統是在行業或者企業分類分級標準的基礎之上,給企業提供數據分類分級的管理平臺,便于企業根據分類分級的結果采取恰當的安全防護措施,保證數據安全。系統支持豐富的數據源,包括傳統數據庫、大數據平臺,以及文本文件,全面兼容國產數據庫;支持自動掃描發現、標記敏感數據,如個人身份信息、銀行賬號等。幫助用戶快速識別和梳理企業的數據資產,完成對數據
122、的自動分類分級處理,為用戶的安全管控策略提供基礎和依據。系統支持直接對數據庫或者數據源進行數據采集,同時也支持第三方的數據通過API,或者后臺數據庫的調用去進行數據對接,通過匹配分類分級規則、策略對數據進行自動標記。梳理成數據分類分級清單后可以通過后臺數據庫或者 API 的方式提供給其他的業務應用系統,實現分類分級系統與其他安全系統的聯動。產品特點介紹產品特點介紹數據源自動發現基于流量識別技術,自動發現網絡中所有的數據庫服務器,進而發現數據庫實例,系統支持自動批量添加自動掃描發現的數據源,解決手動添加繁瑣、網絡環境復雜導致的數據資產不清晰等問題。敏感數據自動識別612024 云安全聯盟大中華區
123、版權所有結合關鍵字、正則表達式匹配規則和 NLP 自然語言處理引擎,識別和標記數據源中的敏感信息,如個人身份信息、資產信息等。自動分類分級處理使用規則引擎和算法來應用分類和分級規則,可以根據組織的需求和策略來定義,例如基于關鍵詞、模式匹配、機器學習等,自動將數據分類到合適的級別。數據訪問權限控制系統基于數據分類和分級規則,自動管理數據的訪問權限。為數據設置適當的訪問級別、角色權限和審批流程,確保只有經過授權的用戶可以訪問敏感數據。數據安全策略應用自動匹配數據安全防護策略,如加密、脫敏、添加水印等。這可確保在數據傳輸、處理和共享過程中得到適當的保護和安全控制。分類分級及數據資產可視化將分類分級結
124、果以多個維度進行可視化呈現,以曲線圖、柱狀圖、餅圖等方式進行展示,更加直觀、易懂。產品展示產品展示數據源自動掃描發現圖 23 數據源自動掃描發現分類分級策略樣例展示622024 云安全聯盟大中華區版權所有圖 24 分類分級策略樣例展示稅務數據分類分級清單樣例圖 25 稅務數據分類分級清單樣例 產品應用情況產品應用情況神州數碼數據分類分級系統支持豐富的數據源,包括主流的關系型數據庫、鍵值數據庫、列存儲數據庫、文檔數據庫、分布式數據庫,支持通用大數據平臺包括原生Hadoop、華為 FI、CDH、CirroData、TDH 等,支持各類文件包括非結構化文件、結構化文件、本地文件、遠程文件等數據源。目
125、前,神州數碼分類分級系統在金融、稅務、部級組織等行業有了實際項目落地。632024 云安全聯盟大中華區版權所有A6 昂楷數據安全分類分級系統昂楷數據安全分類分級系統 產品功能介紹產品功能介紹圖 26 昂楷數據安全分類分級系統功能介紹昂楷數據安全分類分級系統是一款數據資產自動發現及數據分類分級管理的安全產品,系統通過自動發現技術智能地發現數據資產信息,進行敏感數據識別,結合數據分類分級標準,快速準確地完成數據資產梳理與數據的分類分級。產品特點介紹產品特點介紹數據資產梳理通過 IP 和端口自動掃描的方式自動識別客戶網絡環境中的所有數據資產,幫助客戶清晰了解數據資產分布和使用情況、數據量級、敏感數據
126、分布等數據信息,最終形成數據資產清單。賬號權限梳理支持對數據庫資產的訪問權限進行自動梳理和風險評估,支持設置和維護數據庫資產的歸屬。敏感數據識別內置并支持自定義敏感數據類型與敏感特征庫,自動識別發現敏感數據類型并支持人工校正,高效快速生成敏感數據清單。內置多套分類分級標準內置通用、醫療、金融、政務、工業等多套行業分類分級標準并支持標準自定義,642024 云安全聯盟大中華區版權所有基于 AI 算法的智能標簽功能與人工輔助相結合方式,幫助企業快速完成數據的分類分級。分類分級結果聯動共享產品提供多種對外接口,可與昂楷科技現有的安全產品以及第三方安全管理平臺進行聯動,達到聯防聯控的效果,形成數據安全
127、的防護閉環。高可靠性產品可靠性高,在政府、金融、醫療等多行業具備成功案例,專業的分類分級服務與實施團隊,幫助用戶快速完成數據分類分級。產品展示產品展示圖 27 昂楷數據安全分類分級系統產品展示 產品應用情況產品應用情況昂楷數據安全分類分級系統主要應用在政府、金融、醫療等行業,產品支持常見的Oracle、MySQL、SQL Server、Sybase 等關系型數據庫;支持南大通用、達夢、人大金倉、神舟等國產化數據庫;支持常用的大數據平臺,如:Hive、Hbase 等。652024 云安全聯盟大中華區版權所有A7 美創暗數據發現和分類分級系統(美創暗數據發現和分類分級系統(DDAC)產品功能介紹產
128、品功能介紹圖 28 美創暗數據發現和分類分級系統(DDAC)功能介紹美創暗數據發現和分類分級系統(DDAC)是一款致力于幫助用戶快速發現并識別國家安全、個人安全和組織安全所必需的重要/個人/機密數據的產品。產品通過采集元數據并識別業務含義,并依據內置的分類分級標準進行智能化標簽處理,最終形成符合行業特色的敏感資產目錄,滿足企業安全合規需求,以及數據流動應用場景下的安全防護需求。工作臺快捷管理數據分類分級任務的工作平臺,確保資產發現及分類分級作業高效開展。分類分級標準從合規角度定義安全數據和判別策略,內置分類分級標準,可支持數據重要數據、個人信息、商業機密的分類分級策略。數據資產目錄通過目錄形式
129、提供全局安全合規分類分級標準,展示重要數據、個人信息、商業機密分類的多層級目錄,為用戶提供了安全合規標準目錄及目錄自定義擴充,在安全合規標準目錄基礎上,支持不同行業分類分級標準目錄內置。元數據管理收集和維護和數據資產相關的元數據,包括數據的來源、格式、結構等信息,圍繞662024 云安全聯盟大中華區版權所有數據源掃描數據庫表、Schema 及字段,從而更好地進行數據治理、合規性管理及數據安全風險防護。資產發現管理通過多維度的數據特征解析數據語義,對用戶數據進行識別作業,開展數據資產盤點工作,形成資產發現清單,確保用戶全面了解其擁有和使用的數據資產,從而更好地進行數據治理、合規性管理和風險管理。
130、分類分級管理基于分類分級標準,利用規則匹配、NLP、智能推薦、AI 大模型等能力的自動識別技術,以提高數據分類分級識別率及準確性為目標,對資產發現清單進行智能分類分級,形成數據分類分級清單。數據分析報告基于數據分類分級結果,提供全局視角、數據庫視角、作業視角等多維視角的數據分析統計,提供豐富的圖表可視化報告,幫助用戶更好地組織管理數據分類分級工作,提升數據安全性及合規性。智能策略配置全局化的安全級別策略配置,支持采用就高原則,就低原則,就多原則等多種安全級別配置策略。開放平臺通過標準化的接口提供數據資產發現和分類分級的能力和結果,實現數據分類分級的賦能百態,同時可有效管理已完成對接的第三方應用
131、。(10)可視化駕駛艙以數字化為手段,從資產分級、安全合規、智能作業等不同的場景和需求維度,對分類分級工作過程和結果進行可視化呈現,形成可視化駕駛艙。672024 云安全聯盟大中華區版權所有 產品特點介紹產品特點介紹分類分級標準美創歷經多年深入行業的研究,在金融、醫療、人社等各行業積累了大量的實踐經驗,通過對多個行業的分類分級標準的解讀、整理,內置為貼合國家法規和行業業務管理需求的數據分類分級發現模板,能夠實現對多個行業的自動分類分級梳理。動態感知能力以實時監測能力為基礎,通過感知數據源、DDL、DML 等業務源的實時變動,靈活應對不同數據特征和變化的環境,更準確地對數據進行分類和分級,并縮短
132、數據流動中的安全風險窗口。智能分類分級在數據字典、業務模型及規則的海量數據積累基礎上,規則匹配、智能推薦、NLP、大模型、機器學習等多種智能能力加持,推動分類分級智能化落地。安全數據可視化構建兩套目錄 N 張屏,達到資產管理可視化、重要目錄上報、數據出境監測等數據合規流動的目標。賦能百態定義和完善現有接口,打造標準對接模式,以接口為窗口,通過接口與其他產品互通信息,減少重復輸入和分散管理,賦能各行業各客戶需求。682024 云安全聯盟大中華區版權所有 產品展示產品展示圖 29 美創暗數據發現和分類分級系統(DDAC)產品展示 產品應用情況產品應用情況應用的行業美創暗數據發現和數據分類分級系統目
133、前已成功覆蓋醫療、金融、人社、高校、電信、證券、燃氣、汽車、煙草、農商、大數據行業,也可在其他各行業推廣應用。支持的數據服務器類型支持當前主流關系型數據庫、國產數據庫、大數據平臺、云數據庫和多類型格式文件。692024 云安全聯盟大中華區版權所有A8 明朝萬達明朝萬達 Chinasec(安元)智能數據治理平臺(安元)智能數據治理平臺 產品功能介紹產品功能介紹圖 30 明朝萬達 Chinasec(安元)智能數據治理平臺功能介紹明朝萬達 Chinasec(安元)智能數據治理平臺以數據分類分級作為數據治理切入點,通過自動嗅探資產可對企業內部數據資產進行敏感數據識別、梳理,以及對數據的有效理解和分析,
134、完成對數據進行不同類別和密級的劃分,形成數據資產清單、形成數據分類分級報告,全局掌握企業數據資產,有效解決了企業對數據資產的摸底以及安全保護管理工作。產品特點介紹產品特點介紹幫助企業梳理數據資產,使企業可以快速、高效的了解企業現有情況。平臺內置企業內部數據安全分類分級的行業標準模版,方便對企業內部數據進行分類分級。通過數據采集和分析以及分類分級的匹配,最終生成數據安全策略,解決企業使用了安全產品策略卻無從下手的尷尬問題,以及策略配置不完整,導致安全漏洞的問題。隨著企業內部業務以及系統的調整,定時更新業務元數據和技術元數據,然后實時生成最新的數據安全策略,推送給企業內部的安全產品,形成自動化實時
135、更新的安全防護體系,保護用戶的數據安全。702024 云安全聯盟大中華區版權所有多維度的安全防護,可以通過采集用戶業務條線,組織架構,人員等多維護結合數據安全基礎元數據,使得數據安全可以落實到每個業務,部門或者個人,真正實現數據安全的無死角。應用場景應用場景目前主要應用于金融、政企、公安等領域,為企業整體的安全部署提供數據安全策略。部署靈活,過程簡單,與各安全系統之間可以很好的整合和接入,從而為企業提供完整的安全防護體系,保護企業的數據安全。產品展示產品展示圖 31 明朝萬達 Chinasec(安元)智能數據治理平臺產品展示 產品應用情況產品應用情況在國家和行業規范標準的基礎上,通過多年的實際
136、分類分級業務沉淀,智能數據治理平臺內置構建了適合金融、醫療行業、能源行業、個人信息、證券行業等不同行業的基礎分類分級模版,并可根據企業實際的業務需要快速動態調整,以構建適合企業的數據分類分級模版。智能數據治理平臺支持多種數據庫與文件的自動發現,主動嗅探網內數據庫、文件,支持指定 IP 段和端口的范圍進行搜索資產,自動探查數據存儲位置。支持的數據服務器類型:關系型數據庫、國產數據庫、大數據庫。712024 云安全聯盟大中華區版權所有非結構化數據獲取支持多種協議:FTP、FTPS、SFTP、HDFS、NFS、SMB、MINIO 等。722024 云安全聯盟大中華區版權所有附錄附錄 B-數據分類分級
137、參考模板數據分類分級參考模板數據分類分級過程中的各類清單模板不限于固定形式,組織應當根據各行業各領域要求,結合自身業務實際,參考以下各類模板設計符合自身的執行結果要求。本文從結構化數據、非結構化數據、數據對象(數據集、數據項)為視角設計了如下參考模板。B1數據資產清單模板數據資產清單模板B1.1 結構化數據清單結構化數據清單表 5 結構化數據清單模板序號序號應用系統名稱應用系統名稱數據庫名稱數據庫名稱數據庫中文名數據庫中文名數據表名稱數據表名稱數據表中文名數據表中文名字段名稱字段名稱字段中文名字段中文名字段說明字段說明數據量級數據量級數據所有方數據所有方數據使用方數據使用方數據管理方數據管理方
138、12B1.2 非結構化數據清單非結構化數據清單表 6 非結構化數據清單模板序號序號應用系統名稱應用系統名稱數據文件存儲路徑數據文件存儲路徑數據文件名稱數據文件名稱數據文件內容描述數據文件內容描述數據文件格式數據文件格式數據文件量級數據文件量級數據文件所有方數據文件所有方數據文件使用方數據文件使用方數據文件管理方數據文件管理方12B1.3 數據對象清單數據對象清單數據對象識別工作,可以在結構化數據識別和非結構化數據識別基礎上開展,通過調研業務活動中具有上下文含義的數據對象(例如:簡歷信息、交易信息等數據集或姓名、身份證、地址等數據項),分析數據集所關聯數據項的集合信息,從而支撐對業務活動中的數據
139、對象集進行定級。732024 云安全聯盟大中華區版權所有表 7 數據對象清單模板序號序號數據對象名稱數據對象名稱所包含數據表所包含數據表所包含數據項所包含數據項數據形態數據形態數據規模數據規模所屬業務所屬業務數據源數據源數據所有方數據所有方數據使用方數據使用方數據管理方數據管理方12B2數據分類分級標記模板數據分類分級標記模板B2.1 結構化數據分類分級清單結構化數據分類分級清單表 8 結構化數據分類分級清單模板序號序號應用系統名稱應用系統名稱數據資源服務器數據資源服務器數據庫名稱數據庫名稱數據庫中文名數據庫中文名數據表名稱數據表名稱數據表中文名數據表中文名字段名稱字段名稱字段中文名字段中文名
140、字段類型字段類型字段長度字段長度數據類別數據類別安全級別安全級別影響對象影響對象影響程度影響程度12B2.2 非結構化數據分類分級清單非結構化數據分類分級清單表 9 非結構化數據分類分級清單模板序號序號應用系統名稱應用系統名稱數據資源服務器數據資源服務器文件數據庫名稱文件數據庫名稱文件路徑文件路徑文件目錄描述文件目錄描述文件名文件名文件中文名稱文件中文名稱文件類型文件類型文件大小文件大小數據類別數據類別安全級別安全級別影響對象影響對象影響程度影響程度12B2.3 數據對象分類分級清單數據對象分類分級清單表 10 數據對象分類分級清單模板序號序號數據對象名稱數據對象名稱所包含數據表所包含數據表所
141、包含數據項所包含數據項數據形態數據形態數據規模數據規模所屬業務所屬業務數據源數據源數據所有方數據所有方數據使用方數據使用方數據管理方數據管理方數據類別數據類別數據級別數據級別12742024 云安全聯盟大中華區版權所有附錄附錄 C-數據分類分級參考資料數據分類分級參考資料本文引用、歸納、總結了如下數據分類分級參考資料,供組織在開展個人信息識別、重要數據識別、數據分級要素識別的過程進行快速參考。C1 個人信息識別參考個人信息識別參考個人信息可參考國家標準 信息安全技術 個人信息安全規范(GB/T 352732020)進行識別。個人信息是指以電子或者其他方式記錄的能夠單獨或者與其他信息結合識別特定
142、自然人身份或者反映特定自然人活動情況的各種信息,如姓名、出生日期、身份證件號碼、個人生物識別信息、住址、通信通訊聯系方式、通信記錄和內容、賬號密碼、財產信息、征信信息、行蹤軌跡、住宿信息、健康生理信息、交易信息等。個人敏感信息是指一旦泄露、非法提供或濫用可能危害人身和財產安全,極易導致個人名譽、身心健康受到損害或歧視性待遇等的個人信息。通常情況下,14 歲以下(含)兒童的個人信息和涉及自然人隱私的信息屬于個人敏感信息。表 11 個人信息示例信息類別信息類別信息內容概述信息內容概述個人基本資料個人姓名、生日、性別、民族、國籍、家庭關系、住址、個人電話號碼、電子郵件地址等。個人身份證信息身份證、軍
143、官證、護照、駕駛證、工作證、出入證、社???、居住證等。個人生物識別信息個人基因、指紋、聲紋、掌紋、虹膜、面部識別特征等。網絡身份標識信息個人信息主體賬號、IP 地址、個人數字證書等。個人健康生理信息個人歷史病歷等產生的相關記錄,如病歷、住院記錄、醫囑單、檢驗報告、手術及麻醉記錄、護理記錄、用藥記錄、藥物食物過敏信息、生育信息、門診病史、診治情況、家族病史、現病史、傳染病等;以及與個人身體健康狀況相關的信息,如體重、身高、肺部音等。個人教育工作信息個人職業、職位、工作單位、學歷、學位、教育經歷、工作經歷、培訓記錄、成績單等。個人財產信息銀行賬戶、鑒別信息(口令)、存款信息(包括金額、支付收款記錄
144、等)、房產信息、信貸記錄、征信信息、交易和消費記錄、流水記錄等,以及虛擬貨幣、虛擬兌換及兌獎碼等虛擬財產信息。752024 云安全聯盟大中華區版權所有個人通信信息通信記錄和內容、短信、彩信、電子郵件,以及描述個人通信的數據(通常稱為元數據)等。聯系人信息通訊錄、好友列表、群列表、電子郵件地址列表等。個人上網記錄通過日志儲存的個人信息主體操作記錄,包括網站瀏覽記錄、軟件使用記錄、點擊記錄、收藏夾記錄等。個人常用設備信息指包括硬件序列號、設備 MAC 地址、軟件列表、唯一設備識別碼(如IMEI/Android ID/IDFA/OpenUDID/GUID/SIM 卡 IMSI 信息等)等在內的描述個
145、人常用設備基本狀況的信息。個人位置信息包括行蹤軌跡、精準定位信息、住宿信息、經緯度等。其他信息婚史、宗教信仰、性取向、未公開的違法犯罪記錄等。表 12 敏感個人信息示例個人財產信息個人財產信息銀行賬戶、鑒別信息(口令)、存款信息(包括資金數量、支付收款記錄等)、房產信息、信貸記錄、征信信息、交易和消費記錄、流水記錄等,以及虛擬貨幣、虛擬交易、游戲類兌換碼等虛擬財產信息個人健康生理信息個人健康生理信息個人因生病醫治等產生的相關記錄,如病癥、住院志、醫囑單、檢驗報告、手術及麻醉記錄、護理記錄、用藥記錄、藥物食物過敏信息、生育信息、以往病史、診治情況、家族病史、現病史、傳染病史等個人生物識別信息個人
146、生物識別信息個人基因、指紋、聲紋、掌紋、耳廓、虹膜、面部識別特征等個人身份信息個人身份信息身份證、軍官證、護照、駕駛證、工作證、社???、居住證等其他信息其他信息性取向、婚史、宗教信仰、未公開的違法犯罪記錄、通信記錄和內容、通訊錄、好友列表、群組列表、行蹤軌跡、網頁瀏覽記錄、住宿信息、精準定位信息等C2 重要數據識別參考重要數據識別參考參考國家標準數據安全技術 數據分類分級規則(GB/T 436972024),重要數據是一旦遭到泄露、篡改、損毀或者非法獲取、非法使用、非法共享,直接對國家安全造成一般及以上危害、對經濟運行造成嚴重及以上危害、對社會秩序造成嚴重及以上危害、對公共利益造成嚴重及以上危
147、害的數據,以及直接或達到一定精度、規模、深度或重要性后關系國家安全、經濟運行、社會穩定、公共健康和安全的特定領域、特定群體或特定區域的數據。同時還需考慮如下因素:(1)直接影響領土安全和國家統一,或反映國家自然資源基礎情況,如未公開的領陸、領水、領空數據;(2)可被其他國家或組織利用發起對我國的軍事打擊,或反映我國戰略儲備、應急762024 云安全聯盟大中華區版權所有動員、作戰等能力,如滿足一定精度指標的地理數據或與戰略物資產能、儲備量有關的數據;(3)直接影響市場經濟秩序,如支撐關鍵信息基礎設施所在行業、領域核心業務運行或重要經濟領域生產的數據;(4)反映我國語言文字、歷史、風俗習慣、民族價
148、值觀念等特質,如記錄歷史文化遺產的數據;(5)反映重點目標、重要場所物理安全保護情況或未公開地理目標的位置,可被恐怖分子、犯罪分子利用實施破壞,如描述重點安保單位、重要生產企業、國家重要資產(如鐵路、輸油管道)的施工圖、內部結構、安防情況的數據;(6)關系我國科技實力、影響我國國際競爭力,或關系出口管制物項,如反映國家科技創新重大成果,或描述我國禁止出口限制出口物項的設計原理、工藝流程、制作方法的數據,以及涉及源代碼、集成電路布圖、技術方案、重要參數、實驗數據、檢測報告的數據;(7)反映關鍵信息基礎設施總體運行、發展和安全保護情況及其核心軟硬件資產信息和供應鏈管理情況,可被利用實施對關鍵信息基
149、礎設施的網絡攻擊,如涉及關鍵信息基礎設施系統配置信息、系統拓撲、應急預案、測評、運行維護、審計日志的數據;(8)涉及未公開的攻擊方法、攻擊工具制作方法或攻擊輔助信息,可被用來對重點目標發起供應鏈攻擊、社會工程學攻擊等網絡攻擊,如政府、軍工單位等敏感客戶清單,以及涉及未公開的產品和服務采購情況、未公開重大漏洞情況的數據;(9)反映自然環境、生產生活環境基礎情況,或可被利用造成環境安全事件,如未公開的與土壤、氣象觀測、環保監測有關的數據;(10)反映水資源、能源資源、土地資源、礦產資源等資源儲備和開發、供給情況,未公開的描述水文觀測結果、耕地面積或質量變化情況的數據;(11)反映核材料、核設施、核
150、活動情況,或可被利用造成核破壞或其他核安全事件,如涉及核電站設計圖、核電站運行情況的數據;(12)關系海外能源資源安全、海上戰略通道安全、海外公民和法人安全,或可被利用實施對我國參與國際經貿、文化交流活動的破壞或對我國實施歧視性禁止、限制或其他類似措施,如描述國際貿易中特殊物項生產交易以及特殊裝備配備、使用和維修情況的數據;772024 云安全聯盟大中華區版權所有(13)關系我國在太空、深海、極地等戰略新疆域的現實或潛在利益,如未公開的涉及對太空、深海、極地進行科學考察、開發利用的數據,以及影響人員在上述領域安全進出的數據;(14)反映生物技術研究、開發和應用情況,反映族群特征、遺傳信息,關系
151、重大突發傳染病、動植物疫情,關系生物實驗室安全,或可能被利用制造生物武器、實施生物恐怖襲擊,關系外來物種入侵和生物多樣性,如重要生物資源數據、微生物耐藥基礎研究數據;(15)反映全局性或重點領域經濟運行、金融活動狀況,關系產業競爭力,可造成公共安全事故或影響公民生命安全,可引發群體性活動或影響群體情感與認知,如未公開的統計數據、重點企業商業秘密;(16)反映國家或地區群體健康生理狀況,關系疾病傳播與防治,關系食品藥品安全,如涉及健康醫療資源、批量人口診療與健康管理、疾控防疫、健康救援保障、特定藥品實驗、食品安全溯源的數據;(17)其他可能影響國土、軍事、經濟、文化、社會、科技、電磁空間、網絡、
152、生態、資源、核、海外利益、太空、極地、深海、生物、人工智能等安全的數據;注:若需更多指導,請參考 數據安全技術 數據分類分級規則(GB/T 43697-2024)原文。782024 云安全聯盟大中華區版權所有C3 數據分級要素參考示例數據分級要素參考示例表 13 部分數據分級要素參考示例要素要素要素說明要素說明要素示例要素示例領域領域數據描述的業務或內容范疇。如行業領域、業務條線、業務類目、生產經營活動、流程環節、內容主題、與國家安全、經濟運行、社會秩序、公共利益相關的領域等。群體群體數據主體或描述對象集合。1.企業員工數據,如員工的姓名、身份證、手機號、職位等;2.個人用戶群體數據,如用戶的
153、年齡、性別、身份、歷史用電量等;3.組織用戶群體數據,如組織的名稱、法人信息、地址、歷史用電量等。區域區域數據涉及的地區范圍。如行政區域、特定區域、軍事禁區、軍事管理區、國防科工單位以及縣級以上黨政機關區域等;規模規模數據描述對象覆蓋的群體、區域的范圍或數量大小。1.群體數量,如去重后的 10 萬人個人信息數據;2.數據存儲量,同類數據存儲量達到一定規模,如 1T 系統監測信息;3.記錄條數,如記錄數量達到一定規模,100 萬條。精度精度數據的精確程度。數據精度越高表示采集數據和真實數據的誤差越小。1.空間精度,如經緯度坐標,精度和比例尺優于開放標準的地圖數據;2.時間精度,如時分秒信息;3.
154、圖像精度,如高分辨率影像;4.定位精度,如 110 米范圍級位置定位數據。深度深度對數據描述對象的隱含信息挖掘的觸達程度,或多維度細節信息的刻畫程度。如通過數據統計、關聯、挖掘或融合等加工處理,對數據描述對象的隱含信息或多維度細節信息的刻畫程度。覆蓋度覆蓋度數據對領域、群體、區域、時段等的覆蓋分布或疏密程度。1.員工數量占行業從業人員的百分比;2.用戶數量占總市人口的百分比。C4 數據影響對象識別參考示例數據影響對象識別參考示例國家安全判斷數據是否可能影響國家安全,常見考慮因素包括但不限于:a)影響國家政權安全、政治制度安全、意識形態安全、民族和宗教政策安全;b)影響領土安全、國家統一、邊疆安
155、全和國家海洋權益;c)影響基本經濟制度安全、供給側結構性改革、糧食安全、能源安全、重要資源安全、系統性金融風險、國際開放合作安全;d)影響國家科技實力、科技自主創新、關鍵核心技術、國際科技競爭力、科技792024 云安全聯盟大中華區版權所有倫理風險、出口管制物項;e)影響社會主義核心價值觀、文化軟實力、中華優秀傳統文化等;f)影響國家社會治理體系、社會治安防控體系、應急管理體系等;g)影響生態環境安全、綠色生態發展、污染防治、生態系統質量和穩定性、生態環境領域國家治理體系等;h)影響國防和軍隊現代化建設等,或者可被其他國家或組織利用發起對我國的軍事打擊;i)影響電磁空間、網絡空間安全、關鍵信息
156、基礎設施安全、人工智能安全,或者可能被利用實施對關鍵信息基礎設施、核心技術設備等的網絡攻擊,可能導致特別重大或重大網絡安全和數據安全事件;j)影響核材料、核設施、核活動情況,或可被利用造成核破壞或其他核安全事件;k)影響國家生物安全治理體系、生物資源和人類遺傳資源安全、生命安全和生物安全領域的重大科技成果、疾病防控和公共衛生應急體系安全,或者可能導致重大傳染病、重大生物安全風險;l)影響在太空、深海、極地等領域的國家利益和國際合作安全;m)影響海外重大項目和人員機構安全、海外能源資源安全、海上戰略通道安全等。公共利益判斷數據是否可能影響公共利益,常見考慮因素包括但不限于:a)影響對重大疾?。ㄓ?/p>
157、其是傳染?。┑念A防、監控和治療,或者可能引發突發公共衛生事件、造成社會公眾健康危害;b)影響社會成員使用公共設施;c)影響社會成員獲取公開數據資源;d)影響社會成員接受公共服務等方面;e)其他影響公共利益、社會秩序的數據。個人權益判斷數據是否可能影響個人權益,常見考慮因素包括但不限于:a)影響個人私人活動、私有領域、私密部位等個人隱私;802024 云安全聯盟大中華區版權所有b)影響自然人的人格尊嚴;c)影響自然人的人身安全;d)影響自然人的財產安全;e)影響個人在個人信息處理活動中的權利,如選擇權、知情權、拒絕權等;f)其他影響個人權益的數據。組織自身判斷數據是否可能影響組織自身,常見考慮因
158、素包括但不限于:a)導致組織遭到監管部門處罰、安全事件或法律訴訟;b)影響組織的重要或關鍵業務生產經營;c)造成組織經濟損失;d)破壞組織聲譽形象、公信力等;e)影響組織的知識產權、商業秘密、技術損失等;f)影響組織的公平競爭利益;g)其他影響法人、非法人組織合法權益的數據。C5 數據分類分級變更參考示例數據分類分級變更參考示例數據分類分級變更情形數據分類分級變更情形數據級別變更建議數據級別變更建議數據體量增加到特定規模導致影響對象發生變化或影響程度變大升級數據精度發生變化達到相關部門規定閾值升級數據匯聚后升級數據涉及的主體增多升級特定事件發生后數據敏感程度增加升級數據被公開或披露后降級數據脫
159、敏后降級數據去標識化、匿名化后降級812024 云安全聯盟大中華區版權所有附錄附錄 D-數據分類分級關鍵技術與方法數據分類分級關鍵技術與方法D1 關鍵字匹配關鍵字匹配基于關鍵字的敏感數據識別通常是通過讀取數據庫的表和字段的描述,匹配固定關鍵字、關鍵字對、關鍵字組以識別敏感數據。通常需要配合關鍵字權重、順序、組合形式等多種參數使用,這種方法和語義識別方法結合可更好地提升識別準確率和效率。常見的語義識別中文分詞技術常見的有兩大類:1.機械分詞技術、基于統計的序列標注技術。機械分詞技術操作簡單、方便,比較省心,但是對于歧義詞以及未登錄詞的效果并不是很好;2.統計模型的序列標注方法,對于識別未登錄詞擁
160、有較好的識別能力,而且分詞精度也比較大,同時這個方法可以不分中文、英語,著重看在語言前后順序。圖 31 中文分詞技術介紹中文分詞技術可應用于數據庫敏感數據的關鍵詞識別判定場景下。首先,判斷數據庫表名稱和字段名稱的描述信息中是否含有中文字符,對于含有中文字符的字段值進行分詞。然后,將其分解為子單詞和單詞屬性(名詞、動詞等)。針對分解后的名詞在敏感數據特征詞詞典中進行匹配。最后判定是否包含有敏感數據。D2 正則表達式檢測正則表達式檢測正則表達式是由普通字符(例如字符 a 到 z)以及特殊字符(稱為元字符)組成的文字模式??梢杂脕頇z查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個
161、條件的子串等。正則表達式檢測法是當前業內最常用的識別方法,通過對數據內容進行特征提取和822024 云安全聯盟大中華區版權所有抽象,形成正則表達式,對數據內容進行正則匹配。例如:身份證號正則表達式為r1-9d5(18|19|20)d2(01-9)|(10-2)(0-21-9)|10|20|30|31)d30-9Xx$;正則表達式還可以對數據標識符進行檢測。例如:身份證是 18 位數字,而 18 位數字不一定是身份證。身份證的后四位數字用來對身份證進行校驗以檢驗給定的 18 位數字是否是正確的身份證。同樣有很多類似的數據,比如銀行卡號,這類帶有驗證信息并通過公開/私密的算法能夠完成數據驗證的數據
162、,為數據標識符。傳統的數據識別方法便是匹配這些數據標識符??词欠駶M足規則要求,大部分數據在數據滿足這些規則的時候認為它是特定標識的數據。D3 指紋匹配指紋匹配指紋匹配技術是基于數據或文件指紋,從樣本數據中提取并生成指紋特征庫,然后以同樣的方法從待檢測文檔或內容中提取指紋,將得到的指紋與指紋庫進行匹配,對比其相似度,進行指紋檢測和識別,從而實現敏感數據匹配。此方法的難點在于數據或文件指紋的提取與學習,首先要提供含有企業想要保護的特定內容的文檔集作為訓練數據。然后對這些文檔生成指紋,形成指紋庫,并配置數據檢測規則用于檢測受保護的文檔。指紋匹配的過程包括指紋提取、指紋生成、指紋存儲、指紋匹配、四個部
163、分,如下圖所示:圖 32 指紋匹配技術832024 云安全聯盟大中華區版權所有D4 自然語言處理(自然語言處理(NLP)自然語言處理(NLP)驅動計算機程序將文本從一種語言翻譯成另一種語言,響應語音命令,以及快速甚至實時總結大量文本。在日常生活中,您有可能與多種形式的自然語言處理(NLP)互動,包括 GPS 語音系統、數字助手、語音文本聽寫軟件、客服聊天機器人以及其他為消費者提供便利的系統。此外,自然語言處理(NLP)在企業解決方案中也發揮著越來越大的作用,有助于精簡業務運營,提高員工生產力以及簡化任務關鍵型業務流程。自然語言處理(NLP)任務通過分解人類文本和語音數據,幫助計算機理解所采集的
164、內容。這些任務包括:語音識別,也稱為語音轉文本:用于將語音數據以可靠的方式轉換為文本數據。任何遵循語音命令或回答口述問題的應用都需要語音識別功能。語音識別的挑戰性在于人們的說話方式語速快,含糊不清,各種重音、語調和口音,以及語法常常不正確。詞性標注,也稱語法標注:這個過程按照用法和上下文確定特定單詞或文本片段 的 詞 性。Icanmakeapaperplane 中 make 的 詞 性 為 動 詞,Whatmakeofcardoyouown?中make為名詞。詞義消歧:用于對多義單詞選擇含義,通過語義分析過程確定單詞在特定上下文中最準確的意思。例如,詞義消歧可幫助區分動詞。make在maket
165、hegrade(達到)和makeabet(做出)中的含義。命名實體識別,簡稱 NEM:用于將單詞或短語識別為有意義的實體。NEM 將Kentucky識別為地點,將Fred識別為男性的名字。指代消解:用于確定兩個單詞是否以及何時指代同一實體。最常見的例子是確定某個代詞所指的人或物體(例如,她指瑪麗),但也可能涉及識別文本中的隱喻或習語(例如,熊有時并不表示動物,而是指體形魁梧、體毛較多的人)。情緒分析:嘗試從文本中提取主觀特質,例如,態度、情緒、諷刺、困惑和懷疑。自然語言生成:有時被視為語音識別或語音轉文本的逆操作;該任務用于將結842024 云安全聯盟大中華區版權所有構化信息轉化為人類語言。D
166、5 機器學習機器學習目前大多數文本分類研究工作都基于深層學習模型,DNN 是數據驅動的方法,具有很高的計算復雜性。少量的文本數據可以通過人工的方式進行分類分級,但是隨著產業數字化進程的不斷深入,各企業和組織逐漸沉淀了大量的數據,同時大量數據并沒有遵循數據分類分級的標準。進行數據治理過程中,這些海量的文本數據都依賴人工分類分級幾乎無法實現。為了解決這一問題,大量科學家以及從業者們開始探索通過機器學習算法進行文檔的自動分類。這些算法主要可以分為兩類,分別是有監督學習算法(又稱分類算法)和無監督學習算法(又稱聚類算法),主要有兩種方式:淺層機器學習和深層機器學習。具體如下所示:D5.1 淺層機器學習
167、淺層機器學習常用的淺層機器學習算法包括樸素貝葉斯(NB)、K 近鄰分類(KNN)、決策樹(DT)、支持向量機(SVM)等,下面簡單介紹各種算法的原理。樸素貝葉斯(NB)樸素貝葉斯(Nave Bayes)是一種最簡單的概率模型。它基于如下假設:文本中的特征是相互獨立的。根據貝葉斯方法,對于給定的文本Dj和類別集合C=C1,C2,Cm,文本 Dj 屬于類別 Ci 的概率可由下列公式給出:對給定的文本 Dj 進行分類,也就是計算出文本 Dj 屬于每個類別的概率,選取概率最大的作為文本 Dj 的最終類別。訓練及判決過程如下:852024 云安全聯盟大中華區版權所有圖 33 樸素貝葉斯(Nave Bay
168、es)概率模型K 近鄰分類(KNN)KNN 算法的核心思想是通過判斷未知數據與已知數據的相似性進行分類。具體而言,首先選擇與未知數據最近的 k 個已知類別的數據點,然后統計這 k 個數據點的類別分布,并以多數類別或平均距離最小的類別作為該未知數據的分類結果。決策樹(DT)決策樹算法的核心是構建一棵二叉樹,其中每個非葉節點代表對一個特征的測試,每個分支對應該特征的一個取值范圍,而每個葉節點則表示一個分類結果。決策樹的關鍵在于選擇最佳特征,以便將數據分為兩部分,每部分的數據“純度”越高越好。常用的純度指標有 Gini 系數和信息熵。支持向量機(SVM)支持向量機(SVM,Support Vecto
169、r Machine)是一種適用于文本分類的二分類方法,其目標是找到一個最大間隔超平面,將不同類別的訓練數據分開??臻g中可能存在多個可以分隔數據的超平面,為提升分類器的泛化能力,SVM 選擇具有最大間隔的超平面作為分類邊界,因此也稱為最大間隔分類器。盡管 SVM 本質上是二分類算法,通過適當的策略也可以擴展到多分類任務。D5.2 深層機器學習深層機器學習862024 云安全聯盟大中華區版權所有深層學習模型(DNN)由人工神經網絡組成,通過模擬人腦的方式從數據中自動學習高級特征。深度學習由多個隱藏層構成,具有較高的復雜性,能夠在非結構化數據上進行訓練。深度學習架構可以直接從輸入中學習特征表示,減少
170、了對人工干預和先驗知識的依賴。實踐表明,深度學習模型在文本分類任務中的準確性優于傳統淺層模型。這類模型通過捕捉詞語之間的上下文關系,以更深層次理解文本含義,典型代表包括TextCNN、TextRNN 和 BERT 語言模型。D6 規則引擎規則引擎在數據量少標注少的冷啟動情況下,由于可用的訓練數據非常有限,基于統計的機器學習或深度學習模型往往難以取得理想的效果。此時,規則引擎成為了一個有效的替代方案。利用正則表達式、先驗知識、全文匹配、模糊匹配和黑白名單等技術,可以基于已知的信息和模式快速構建初步的文本分類系統。即使數據量較大,但標注數據不足的低資源情況下,基于統計的方法也會受到限制。此時,可以
171、結合規則引擎和半監督學習方法,利用少量標注數據引導模型學習,同時利用大量未標注數據進行迭代優化。此外,還可以考慮遷移學習,將在其他相關任務上學到的知識遷移到當前任務中。在完全沒有數據的極端情況下,規則引擎幾乎成為唯一可行的解決方案。此時,需要依靠領域專家的知識和經驗,通過編寫詳細的規則來覆蓋可能的文本類型和分類需求。規則引擎作為一種強大的工具,為企業數字化轉型提供了重要支持。其優點主要體現在以下幾個方面:首先,規則引擎通過將業務邏輯與系統代碼分離,簡化了業務邏輯的修改和維護,降低了開發成本。其次,規則引擎具有高度的靈活性和可擴展性,可以根據業務需求快速定制和調整規則,提高系統的響應速度和準確性
172、。此外,規則引擎還支持可視化管理,使得規則的管理和監控變得更加直觀和便捷。然而,規則引擎也存在一些缺點。一方面,由于規則引擎通常涉及大量的業務規則,因此規則的調試和維護成本較高。另一方面,當規則數量龐大時,規則引擎的性能可能會受到影響,導致系統響應速度變慢。此外,規則引擎的使用還需要一定的技術門檻,需要開發人員具備一定的專業知識和經驗。D7 元數據分析元數據分析872024 云安全聯盟大中華區版權所有元數據分析技術包括元數據挖掘、語義分析和機器學習算法。元數據挖掘涉及從與每個數據集關聯的屬性中提取有價值的模式和趨勢。語義分析深入研究每個屬性代表什么,以及它們之間的關系,其中,可以借助機器學習算
173、法幫助根據大型數據集中發現的模式自動分類和識別元數據屬性。元數據分析功能主要實現針對元數據的基本分析功能,包括血緣分析(血統分析)、影響分析、實體關聯分析、實體影響分析、主機拓撲分析、指標一致性分析等,它能夠幫助組織單位合理分配數據保護資源和成本,是組織單位建立全生命周期數據保護框架的基礎,也是有的放矢地實施數據安全管理的前提條件,統一的數據分類分級管理制度,能夠促進數據在機構間、行業間的安全共享,有利于數據價值的挖掘與實現。882024 云安全聯盟大中華區版權所有附錄附錄 E-典型行業數據分類分級標準解讀典型行業數據分類分級標準解讀E1 政務政務隨著政務數字化進程的持續推進,電子政務領域蓬勃
174、發展,大量涉及政務、民生、國家安全、公共利益的數據沉積在線上,為政務數據的保護帶來巨大挑戰。另一方面,中華人民共和國數據安全法中將數據分類分級保護制度與重要數據目錄直接對應,并要求各地區、各部門按照數據分類分級保護制度,確定本地區、本部門以及相關行業、領域的重要數據具體目錄。截至目前,政務領域涉及數據分類分級的相關標準研究如下:E1.1GB/T394772020 信息安全技術政務信息共享數據安全技術要求信息安全技術政務信息共享數據安全技術要求2020 年 11 月,國家市場監督管理總局和國家標準化管理委員會聯合發布 GB/T394772020信息安全技術政務信息共享數據安全技術要求標準。該標準
175、是“政務數據開放共享標準體系”的重要組成部分,標準在國內首次提出了政務信息資源數據流轉全過程中的身份認證、數據脫敏、數據加密等數據安全技術要求。通過制定并實施政務信息共享數據安全標準,推進各級政務部門電子政務領域數據應用,有效提升政務信息資源采集、共享、使用過程的數據安全防護能力,全面保障政務信息資源共享交換的數據安全。該標準開創性地提出數據全生命周期過程中的多種角色(共享數據提供方、共享數據交換服務方及共享數據使用方)在共享數據準備階段、共享數據交換階段及共享數據使用階段的權利和責任義務。該標準較粗力度地闡述了共享數據提供方對政務數據分類分級的總體要求,具體要求如下:a)應按照政務信息資源分
176、級分類相關要求對共享數據分級分類并進行標記,根據標記可對數據安全等級進行識別,并保留標記記錄;b)應按照數據級別確定并實施所必要的安全管理策略和保障措施;c)應對共享數據分級分類的變更進行記錄,并通知相關數據使用方;d)應按照數據級別明確使用方對共享數據的使用權限。E1.2 地方數據分類分級相關標準規范地方數據分類分級相關標準規范截至目前,全國各地已有 16 個省市區制定有地域特色的政務數據分類分級相關規范要求,具體如下所示(按照發布的先后順序排列):892024 云安全聯盟大中華區版權所有DB52/T11232016 政府數據數據分類分級指南,實施日期 2016 年 9 月28 日上海市公共
177、數據開放分級分類指南(試行),發布日期:2019 年 11 月 1日坪山區政務數據分級分類管理辦法(試行),發布日期:2020 年 10 月20 日DB3301/T0322.32020 數據資源管理第 3 部分:政務數據分類分級,實施日期:2020 年 11 月 30 日煙臺市公共數據開放分級分類指南(試行),發布日期:2021 年 3 月 31日DB33/T23512021 數字化改革公共數據分類分級指南,實施日期:2021年 8 月 5 日重慶市公共數據分類分級指南(試行),發布日期:2021 年 10 月 11 日DB2201/T172022 政務數據安全分類分級指南,實施日期:2022
178、 年 1月 30 日DB14/T24422022 政務數據分類分級要求,實施日期:2022 年 6 月 30日DB3212/T11162022 政務數據安全分類分級指南,實施日期:2022 年12 月 28 日DB3202/T10492023無錫市公共數據分類分級實施指南,實施日期:2023年 5 月 21 日DB3203/T10242023 公共數據分類分級指南,實施日期:2023 年 5 月30 日DB51/T30562023 政務數據數據分類分級指南,實施日期:2023 年 6月 1 日DB4201/T677.22023 公共數據資源開放第 2 部分:分類分級指南,實施日期:2023 年
179、 7 月 9 日DB23/T35102023 政務預公開數據分類分級評估指南,實施日期:2023年 8 月 4 日902024 云安全聯盟大中華區版權所有E2 金融金融自中華人民共和國網絡安全法中華人民共和國數據安全法等數據保護相關法律、行政法規施行以來,我國數據監管框架已初具雛形。由于金融行業業務領域數據規模大、價值和敏感程度高的特點,維護相關金融數據的穩定性和可用性有助于維護個人、企業、金融行業乃至國家利益的穩定。同時,隨著實踐中頻發的銀行業等金融領域的數據安全事件,金融數據的保護需求愈發迫切,金融數據安全保護的首要任務是形成有金融行業屬性的數據分類分級規范。近年來,金融行業陸續出臺數據安
180、全相關制度規范中均有規范數據分類分級的要求,具體如下所示:E2.1 中國人民銀行業務領域數據安全管理辦法(征求意見稿)要求中國人民銀行業務領域數據安全管理辦法(征求意見稿)要求E2.1.1 數據分類分級保護總體規劃數據分類分級保護總體規劃中國人民銀行負責組織制定數據分類分級相關行業標準,指導數據處理者開展數據分類分級各項工作,統籌確定重要數據具體目錄并實施動態管理。E2.1.2 數據分類分級制度規數據分類分級制度規程程數據處理者應當建立健全本單位數據分類分級實施制度,規范分類分級工作操作規程。數據分類分級過程實施和結果審批,應當嚴格遵循操作規程。E2.1.3 數據分類要求數據分類要求數據處理者
181、應當參考行業標準,根據業務開展情況建立業務分類,梳理細化數據資源目錄,標識各數據項是否為個人信息、數據來源(生產經營加工產生、外部收集產生等)、存儲該數據項的信息系統清單和應用的業務類別。E2.1.4 數據分級要求數據分級要求數據按照精度、規模和對國家安全的影響程度,分為一般、重要、核心三級。在中國人民銀行組織下,數據處理者應當準確識別判定本單位信息系統存儲的全量數據是否屬于重要數據、核心數據,并填寫報送重要數據目錄內容,由中國人民銀行匯總后確定重要數據具體目錄。數據處理活動中,數據處理者還應當及時準確識別判定所涉及數據是否屬于重要數據、核心數據。912024 云安全聯盟大中華區版權所有E2.
182、1.5 數據敏感性分層級數據敏感性分層級在數據分級基礎上,數據處理者應當參考行業標準,根據數據遭到泄露或者被非法獲取、非法利用時,可能對個人、組織合法權益或者公共利益等造成的危害程度,將數據項的敏感性從低至高進一步分為一至五共五個層級。結構化數據項應當逐一標識層級;非結構化數據項應當優先按照可拆分的各結構化數據項所對應最高層級,標識其層級。E2.1.6 數據可用性分層級數據可用性分層級數據可用性分層級工作納入信息系統業務連續性分級保障體系統一考慮。數據處理者應當評估信息系統存儲數據遭到篡改、破壞后可能對業務連續性造成的影響程度,明確恢復的目標要求?;謴忘c目標越嚴格,數據的可用性層級越高。在此基
183、礎上,鼓勵數據處理者識別用于支撐最基本業務運轉、無法承受徹底滅失風險、需要進一步進行容災備份的數據。E2.1.7 動態更新要求動態更新要求數據處理者應當根據數據和信息系統變化情況,每年組織更新數據資源目錄,避免信息系統所涉及數據項未在數據資源目錄中記錄、數據項標識信息不完整等情形發生。E2.2 JR/T0197-2020金融數據安全 數據安全分級指南要求金融數據安全 數據安全分級指南要求金融業機構典型數據的定級規則在實際應用過程中,各金融業機構宜根據其所管轄數據的類型、特性、規模以及機構特性等因素,綜合考慮本機構數據安全管理的總體目標和安全策略要求,按照一定的顆粒度對數據資產進行合理的梳理、歸
184、類和細分,最終確定數據的安全級別劃分清單。此外,金融業機構所承載重要數據的安全級別宜不低于本標準確定的 5 級。重要數據的識別、認定及保護工作依據國家及行業主管部門有關規定和要求執行。E2.2.1 定級通用規則定級通用規則金融數據安全級別劃分的通用規則包括但不限于;“重要數據”的安全等級不可低于本標準所述 5 級。個人金融信息相關數據參照 JR/T01712020 進行定級,并在數據安全定級過程中從高考慮。922024 云安全聯盟大中華區版權所有對于數據體量大,涉及的客戶(包含個人客戶和單位客戶)多、涉及客戶(包含個人客戶和單位客戶)資金量大、涉及多行業及多機構客戶的情況,影響程度宜從高確定。
185、E2.2.2 定級規則定級規則本標準根據金融業機構數據安全性遭受破壞后的影響對象和所造成的影響程度,將數據安全級別從高到低劃分為 5 級、4 級、3 級、2 級、1 級,一般具有如下特征:5 級數據特征如下:重要數據,通常主要用于金融業大型或特大型機構、金融交易過程中重要核心節點類機構的關鍵業務使用,一般針對特定人員公開,且僅為必須知悉的對象訪問或使用。數據安全性遭到破壞后,對國家安全造成影響,或對公眾權益造成嚴重影響。注:“必須知悉”是指對數據確定知悉范圍,只有對數據知悉有明確的必要性時,該對象才能對數據知悉。一般情況下遵循工作需要原則和最小化原則,前者指因工作必須才可知悉,后者指知悉的范圍
186、滿足最小夠用即可。4 級數據特征如下:數據通常主要用于金融業大型或特大型機構、金融交易過程中重要核心節點類機構的重要業務使用,一般針對特定人員公開,且僅為必須知悉的對象訪問或使用。個人金融信息中的 C3 類信息。數據安全性遭到破壞后,對公眾權益造成一般影響,或對個人隱私或企業合法權益造成嚴重影響,但不影響國家安全。3 級數據特征如下:數據用于金融業機構關鍵或重要業務使用,一般針對特定人員公開,且僅為必須知悉的對象訪問或使用。個人金融信息中的 C2 類信息。數據的安全性遭到破壞后,對公眾權益造成輕微影響,或對個人隱私或企業合法權益造成一般影響,但不影響國家安全。2 級數據特征如下:932024
187、云安全聯盟大中華區版權所有數據用于金融業機構一般業務使用,一般針對受限對象公開,通常為內部管理且不宜廣泛公開的數據。個人金融信息中的 C1 類信息。數據的安全性遭到破壞后,對個人隱私或企業合法權益造成輕微影響,但不影響國家安全、公眾權益。1 級數據特征如下:數據一般可被公開或可被公眾獲知、使用。個人金融信息主體主動公開的信息。數據的安全性遭到破壞后,可能對個人隱私或企業合法權益不造成影響,或僅造成微弱影響但不影響國家安全、公眾權益。E2.3 GB/T42775-2023證券期貨業數據安全風險防控數據分類分級指引證券期貨業數據安全風險防控數據分類分級指引證券期貨業業務種類繁多,數據呈現出復雜性高
188、、多樣性強的特點。采用規范的數據分類、分級方法,有助于行業機構厘清數據、確定數據重要性或敏感度,并針對性地采取適當、合理的管理措施和安全防護措施,形成一套科學、規范的數據管理與保護機制,從而在保證數據安全的基礎上促進數據開放共享。數據分類是數據保護工作中的一個關鍵部分,是建立統一、準確、完善的數據架構的基礎,是實現集中化、專業化、標準化數據管理的基礎。行業機構按照統一的數據分類方法,依據自身業務特點對產生采集、加工、使用或管理的數據進行分類,有利于清晰地厘清數據資產,對數據實現規范化管理,為數據的維護和擴充提供支持。數據分級是以數據分類為基礎,采用規范、明確的方法區分數據的重要性和敏感度差異,
189、并確定數據級別。數據分級有助于行業機構根據數據不同級別,確定數據在其生命周期的各個環節應采取的數據安全防護策略和管控措施,進而提高行業機構的數據管理和安全防護水平,確保數據的完整性、保密性和可用性。根據數據影響對象及數據影響程度可將證券期貨業數據分為 4 級,分級方式如下:942024 云安全聯盟大中華區版權所有表 14 證券期貨業數據分類影響范圍影響范圍影響對象影響對象影響程度影響程度數據一般特征數據一般特征數據重要程度標識數據重要程度標識數據級別標識數據級別標識多個子行業子行業嚴重數據主要用于大型或特大型行業機構中的重要業務,一般針對特定人員公開,且僅為必要知悉的對象訪問或使用。極高4子行
190、業內多行業機構行業機構嚴重極高4子行業內多行業機構客戶嚴重極高4單一行業機構行業機構嚴重數據用于重要業務,針對特定人員公開,且僅為必要知悉的對象訪問或使用。高3單一行業機構客戶嚴重高3單一行業機構行業機構中等,輕微數據用于一般業務,針對受限對象公開;一般指內部管理、辦公類且不宜廣泛公開的數據。中2單一行業機構客戶中等中2單一行業機構行業機構輕微、無數據可被公開或被公眾獲知、使用。低1單一行業機構客戶輕微、無低1E3 電信電信E3.1 YD/T3813-2020基礎電信企業數據分類分級方法基礎電信企業數據分類分級方法2020 年 12 月,中國通信標準化協會發布了 YD/T3813-2020基礎
191、電信企業數據分類分級方法。該標準規定了基礎電信企業數據分類分級原則、數據分類分級工作流程和數據分類分級方法,并給出基礎電信企業數據分類分級示例。該標準根據基礎電信企業生產經營管理現狀和企業自身管理特點,將數據的類別分為兩大類:用戶相關數據、企業自身相關數據;根據基礎電信企業數據重要程度以及泄露后對國家安全、社會秩序、企業經營管理和公眾利益造成的影響和危害程度,將數據的級別分為四個級別,由高到低分別為:第四級數據、第三級數據、第二級數據、第一級數據。952024 云安全聯盟大中華區版權所有E3.1.1 數據分類數據分類用戶相關數據用戶相關數據表 15 用戶相關數據分類表類別類別大類大類子類子類范
192、圍范圍對應數據對應數據用戶相關數據用戶身份相關數據用戶身份相關數據自然人身份標識(客戶、員工)姓名、證件類型、證件號碼、駕照編號、銀行賬戶、客戶實體編號、集團客戶編號、集團客戶名稱等網絡身份標識聯系電話、手機號、座機號碼、郵箱、網絡客戶編號、即時通信賬號、網絡社交用戶賬號、微信號、QQ 號等用戶基本資料(客戶)職業、工作單位、年齡、性別、籍貫、興趣愛好等;集團客戶所在省市、所在行業等實體身份證明身份證影印件、護照影印件、駕照影印件、營業執照影印件等;指紋、聲紋、虹膜等用戶私密資料個人種族、家屬信息、居住地址、宗教信仰、健康狀況等用戶網絡身份鑒權信息用戶密碼及關聯信息密碼、手機客服密碼,密碼保護
193、答案等用戶服務內容數據服務內容和資料數據服務內容數據短信、彩信、話音等即時通信內容、群內發布內容、數據文件、郵件內容、用戶上網訪問內容等聯系人信息通訊錄、好友列表、群組列表等用戶服務衍生數據用戶服務使用數據業務訂購關系品牌、套餐定制等郵箱、通訊錄等增值業務的注冊、修改、注銷等服務記錄和日志語音詳單、短信詳單、彩信詳單等Cookie、上網日志等消費信息和賬單停開機、入網時間、在網時間、積分、預存款、信用等級等賬單、固定費用、通信費用等位置數據小區代碼、基站號、基站經緯度坐標等地區代碼、城市代碼等違規記錄數據黑名單、灰名單等設備信息終端設備標識唯一設備識別碼、IMEI、MAC 地址、SIM 卡、I
194、MSI信息等終端設備資料終端型號、品牌、廠商等用戶統計分析類數據用戶使用習慣和行為-用戶偏好、消費習慣,通話、短信頻次、上網等數量與頻次等。962024 云安全聯盟大中華區版權所有分析數據用戶上網行為相關統計分析數據-用戶網絡行為、用戶畫像等企業自身相關數據企業自身相關數據表 16 企業自身相關數據分類表類別類別大類大類子類子類范圍范圍對應數據對應數據企業自身相關數據網絡與系統的建設與運行維護類數據網絡與系統資源類數據公共資源類數據DDM(數字診斷監視功能模塊)、DDF(數字配線架)、ODM(光配線架連接模塊)、ODF(光纖配線架)承載網資源板卡、物理端口、邏輯端口、物理鏈路、邏輯鏈路、網段、
195、IP 地址云資源資源池、虛擬機 VM、存儲設備、負載均衡設備監測、告警設備監測、告警運維日志事件、地點、時間、操作、成功與否后臺管理賬號信息后臺管理人員角色 ID、創建修改時間、賬號狀態角色信息人員角色、編輯時間業務運營類數據業務運營服務數據產品信息產品 ID、套餐設置、銷售品 IDE3.1.2 數據分級數據分級各級別數據特征各級別數據特征第四級數據一旦丟失、泄露、被篡改、被損毀會對國家安全、社會公共利益或企業利益或用戶利益造成特別嚴重影響的數據,安全管控要求最高。第三級數據一旦丟失、泄露、被篡改、被損毀會對國家安全、社會公共利益或企業利益或用戶利益造成嚴重影響的數據,應實施較強的安全管控。第
196、二級數據一旦丟失、泄露、被篡改、被損毀會對國家安全、社會公共利益或企業利益或用戶972024 云安全聯盟大中華區版權所有利益造成一定程度影響的數據,執行基本的安全管控。第一級數據一旦丟失、泄露、被篡改、被損毀對國家安全、社會公共利益或企業利益或用戶利益造成影響較小或無影響的數據,對安全管控不作要求。數據分級示例數據分級示例第四級數據實體身份證明、用戶私密資料、用戶密碼及關聯信息、聯系人信息、規劃建設類(發布前)、網絡與系統資源類、網絡與系統運維類、網絡安全管理類。第三級數據自然人身份標識、詳單、位置數據、用戶使用習慣分析數據、用戶上網行為相關統計分析數據、用戶使用行為分析數據、用戶上網日志信息
197、、企業發展戰略、業務發展、技術研發類、統計分析類數據、招投標數據(公開前)。第二級數據網絡身份標識、用戶基本資料、服務內容數據、服務記錄和日志、設備信息、業務訂購關系、消費信息、賬單、規劃建設類(發布后)、渠道信息、客服數據、營銷信息、招投標數據(公開后)、物資數據、業務合作類數據、合作方提供數據。第一級數據違規記錄數據、產品信息、公開業務運營服務數據。E3.2 YD/T4244-2023 電信網和互聯網數據分類分級技術要求與測試方法電信網和互聯網數據分類分級技術要求與測試方法本文件規定了電信網和互聯網數據脫敏的技術要求與測試方法。本文件適用于電信網和互聯網數據的脫敏工作,脫敏技術能力的設計、
198、研發、測試、評估和驗收等,包括數據脫敏的提供商、用戶、測評機構和監管機構等。E4 醫療醫療國家標準化管理委員會于 2020 年 12 月 14 日正式發布了 GB/T39725-2020 信息982024 云安全聯盟大中華區版權所有安全技術健康醫療數據安全指南(以下簡稱“健康醫療數據安全指南”),同時,健康醫療數據安全指南于 2021 年 7 月 1 日正式實施。健康醫療數據安全指南由信安標委負責提出并歸口牽頭編寫,健康醫療數據生命周期內可能涉及的各方主體都參與起草、審核。此指南作為推薦性國家標準,其并不具有強制法律效力,并不需要完全遵從。各健康醫療企事業單位在數據合規過程中,可將健康醫療數據
199、安全指南作為參考,與此同時,仍需結合當前國家發布中華人民共和國網絡安全法個人信息安全規范等法規及標準以保證安全的全面性。E4.1 GB/T39725-2020信息安全技術健康醫療數據安全指南信息安全技術健康醫療數據安全指南E4.1.1 概覽解讀概覽解讀健康醫療數據安全指南該指南全文共 11 個章節,包括健康醫療數據的安全目標、分類體系、使用披露要點、安全措施要點、安全管理指南、安全技術指南、典型場景數據安全等。健康醫療數據安全指南主要適用于健康醫療數據控制者,即“能夠決定健康醫療數據處理的目的、方式及范圍等的組織或個人”。如果存在需要兩方或多方共同決定數據使用處理的目、方式及范圍,則視為共同控
200、制者。同時,常見的處理者包括:健康醫療信息系統供應商、健康醫療數據分析公司、輔助診療解決方案供應商等。健康醫療數據安全指南針對“健康醫療數據”進行了明確定義,即為“個人健康醫療數據以及由個人健康醫療數據加工處理之后得到的健康醫療相關電子數據”。例如:經過對群體健康醫療數據處理后得到的群體總體分析結果、趨勢預測、疾病防治統計數據等。健康醫療數據安全指南針對“個人健康醫療數據”進行了明確定義,即為“單獨或者與其他信息結合后能夠識別特定自然人或者反映特定自然人生理或心理健康的相關電子數據”。示例如:向個人提供醫療服務過程中采集的有關個人的既往病史、社會史、家族史等病歷及數據記載,可穿戴設備采集的與個
201、人健康相關的數據,關于個人的支付或醫保數據等。E4.1.2 健康醫療數據分類和分級健康醫療數據分類和分級健康醫療數據安全指南結合數據本身的性質及其所反映的內容,將健康醫療數992024 云安全聯盟大中華區版權所有據分為 6 個類別,并且在每個類別下給出了具體范圍,對于醫療機構、企事業單位進行數據分類提供了參考。具體如下圖所示:表 17 健康醫療數據分類和分級表數據類別數據類別范圍范圍個人屬性數據人口統計信息,包括姓名、出生日期、性別、民族、國籍、職業、住址、工作單位、家庭成員信息、聯系人信息、收入、婚姻狀態等;個人身份信息,包括姓名、身份證、工作證、居住證、社???、可識別個人的影像圖像、健康卡
202、號、住院號、各類檢查檢驗相關單號等;個人通訊信息,包括個人電話號碼、郵箱、賬號及關聯信息等;個人生物識別信息,包括基因、指紋、聲紋、掌紋、耳廓、虹膜、面部特征等;個人健康監測傳感設備 ID 等健康狀況數據主訴、現病史、既往病史、體格檢查(體征)、家族史、癥狀、檢驗檢查數據、遺傳咨詢數據、可穿戴設備采集的健康相關數據、生活方式、基因測序、轉錄產物測序、蛋白質分析測定、代謝小分子檢測、人體微生物檢測等。醫療應用數據門(急)診病歷、住院醫囑、檢查檢驗報告、用藥信息、病程記錄、手術記錄、麻醉記錄、輸血記錄、護理記錄、入院記錄、出院小結、轉診(院)記錄、知情告知信息等。醫療支付數據醫療交易信息,包括醫保
203、支付信息、交易金額、交易記錄等;保險信息,包括保險狀態、保險金額等。衛生資源數據醫院基本數據、醫院運營數據等。公共衛生數據環境衛生數據、傳染病疫情數據、疾病監測數據、疾病預防數據、出生死亡數據等。健康醫療數據安全指南結合數據重要程度、風險級別以及對個人健康醫療數據主體可能造成的損害和影響的級別進行分級,該指南將健康醫療數據劃分為 5 個級別:第 1 級:可完全公開使用的數據。包括可以通過公開途徑獲取的數據,例如醫院名稱、地址、電話等,這類數據可直接在互聯網上面向公眾公開。第 2 級:可在較大范圍內供訪問使用的數據。例如不能標識個人身份的數據,各科室醫生經過申請審批可以用于研究分析。第 3 級:
204、可在中等范圍內供訪問使用的數據。如果未經授權披露,可能對個人健康醫療數據主體造成中等程度的損害。例如經過部分去標識化處理,但仍可能重標識的數據,僅限于獲得授權的項目組范圍內使用。第 4 級:在較小范圍內供訪問使用的數據。如果未經授權披露,可能會對個人健康醫療數據主體造成較高程度的損害。例如可以直接標識/定位到個人身份的1002024 云安全聯盟大中華區版權所有數據,僅限于參與診療活動的醫護人員訪問使用。第 5 級:僅在極小范圍內且在嚴格限制條件下供訪問使用的數據。如果未經授權披露,可能會對個人健康醫療數據主體造成嚴重程度的損害。例如特殊病種(例如艾滋病、性?。┑脑敿氋Y料,僅限于主治醫護人員訪問
205、且需要進行嚴格管控。E4.1.3 健康醫療數據的使用披露原則健康醫療數據的使用披露原則數據使用授權的要求數據控制者使用或披露個人健康醫療數據時,應獲得個人授權。使用的過程中,如果超出個人授權范圍的,還需要再次征得主體同意。獲取授權時,要明確授權使用的數據內容,數據使用用途,數據的使用期限,以及控制者的保護措施等。獲得使用授權的例外情況在授權同意方面,存在以下幾種不獲得主體授權的例外情形:“向主體提供其本人健康醫療數據”“治療、支付或保健護理時”“涉及公共利益或法律法規要求時”“受限制數據集用于科學研究、醫學/健康教育、公共衛生目的時”。但是,數據控制者仍然需要謹慎地評估適用例外的場景?;厮莶樵?/p>
206、的主體權利主體有權對數據控制者或其處理者使用或披露數據的情況進行歷史回溯查詢,最短回溯期為六年。最短回溯期的時間也不完全等同于數據存儲的時間。根據電子病歷應用管理規范(試行)規定門(急)診電子病歷保存時間自患者最后一次就診之日起不少于 15 年,住院電子病歷保存時間自患者最后一次出院之日起不少去標識化建議健康醫療數據安全指南規定,根據使用目的盡可能地去標識化。因此,除了建議按照已發布的個人信息安全規范,進行相應的去標識化外,對于應用于臨床研究和醫藥醫療研發的數據,同樣要求去標識化,不得識別或定位到個人。E4.2 WST306-2023衛生健康信息數據集分類和編碼規則衛生健康信息數據集分類和編碼
207、規則此標準規定了衛生健康信息數據集分類與編碼需遵循的基本原則、技術方法以及應用規則。E5 教育教育1012024 云安全聯盟大中華區版權所有E5.1 T/GDCSA 000-2022高校數據分類分級指南高校數據分類分級指南本文件規定了高校數據分類的一般要求、維度與流程,數據分級的一般要求、要素、維度、流程與變更。高校數據分類維度可從部門維度、人員維度、資產維度、資產維度、資產維度開展數據分類。同時根據數據影響對象及影響程度可將數據分為核心、重要、一般。E6 工業工業E6.1 工業數據分類分級指南(試行)工業數據分類分級指南(試行)工業數據分類維度包括但不限于研發數據域(研發設計數據、開發測試數
208、據等)、生產數據域(控制信息、工況狀態、工藝參數、系統日志等)、運維數據域(物流數據、產品售后服務數據等)、管理數據域(系統設備資產信息、客戶與產品信息、產品供應鏈數據、業務統計數據等)、外部數據域(與其他主體共享的數據等)。工業數據分級分為一級、二級、三級等 3 個級別。E6.2 GB/T 42128-2022智能制造工業數據分類原則智能制造工業數據分類原則本文件給出了智能制造工業數據的分類要求、分類依據以及分類維度。本文從分類維度可以分為按系統層級分類、按生命周期分類、按智能特征分類。E7 國際標準國際標準E7.1DATA CLASSIFICATION PRACTICES此標準是美國國家網
209、絡安全卓越中心(NCCoE)作為零信任保護的一部分項目,本文側重于通過數據分類和標簽來傳達和維護數據保護要求,以金融、政務、制造業、科技行業、醫療等五個場景來開展數據分類工作,實現數據發現、入庫、分析、分類、標記等內容的整體方案。附錄附錄 F-典型行業數據分類分級詞典示例典型行業數據分類分級詞典示例F1 政務政務1022024 云安全聯盟大中華區版權所有F1.1 政務數據分類示例政務數據分類示例(GB/T 21063.4 政務信息資源目錄體系第 4 部分:政務信息資源分類)表 18 政務數據分類表名稱名稱描述說明描述說明綜合政務關于政治方面的事務和國家的管理工作政務綜合類方針政策政府制訂的、宏
210、觀的、指導各個領域發展的方針政策中共黨務關于中國共產黨的規章制度、組織機構建設和發展,以及工作職責等相關信息政府工作關于政府的規章制度、組織機構建設和發展,以及工作職責等相關信息人大關于人民代表大會的規章制度、組織機構建設和發展,以及工作職責的相關信息政協政治協商會議的規章制度、組織機構建設和發展,以及工作職責等相關信息法院法院系統的規章制度、組織機構建設和發展,以及工作職責等相關信息檢察院檢察院系統的規章制度、組織機構建設和發展,以及工作職責等相關信息機構編制關于機構編制的管理、機構體系的當前概況和遠景規劃領導人關于領導人的簡歷、工作崗位、工作活動、作品等相關信息會議、會務會議產生的報告等相
211、關信息,以及會議組織、管理的相關信息重大事件有深遠影響的事件的相關信息經濟管理關于經濟的管理、規劃、發展概況經濟管理綜合類經濟發展計劃關于經濟的宏觀的發展規劃經濟管理關于經濟的宏觀管理現狀經濟體制改革關于經濟體制改革的管理和規劃、發展情況經貿管理關于經濟貿易的宏觀管理和發展調查報告、統計資料統計關于統計工作的管理和發展情況物價關于物價的管理和調查報告、統計資料,以及物價體系規劃工商關于市場監督管理和維護公平競爭的市場秩序國土資源、能源土地、水、海洋、石油、天然氣、礦藏、電力資源的管理、規劃和發展國土資源與能源綜合類土地關于土地資源的管理、規劃和開發利用情況礦藏關于礦產資源的管理、規劃和開發利用
212、情況水資源關于水資源的管理、規劃和開發利用情況海洋關于海洋資源的管理、規劃和開發利用情況1032024 云安全聯盟大中華區版權所有煤炭關于煤炭資源的管理、規劃和開發利用情況石油關于石油、天然氣行業生產、經營的規章制度、法律法規、規劃和管理燃料、燃氣關于燃料、燃氣行業生產、經營的規章制度、法律法規、規劃和管理電力關于電力生產和市場經營的規章制度、法律法規、管理機構,以及設施建設和技術發展工業、交通工業、企業、交通運輸、郵政及相關領域工交綜合類工業關于工業的規章制度、法律法規、管理機構、體系結構規劃和發展企業關于企業創建、經營的規章制度、法律法規、管理機構和政府對企業提供的相關服務交通運輸關于交通
213、運輸業的規章制度、法律法規、管理機構、功能服務和設施建設的規劃和發展情況信息產業與信息產業內以及相關的行業領域信息產業綜合類通信與通信相關的規章制度、法律法規、設施建設、功能服務以及機構組織等概況計算機與計算機相關的研發、生產、銷售相關的規章制度、法律法規、技術和標準,以及該行業的市場行情等概況軟件與軟件業相關的規章制度、法律法規、技術標準和發展概況網絡關于網絡的規章制度、法律法規、設施建設規劃和發展情況,以及網絡的功能服務信息技術、信息系統關于信息系統建設的規劃和發展情況,信息系統功能服務的開發利用,以及相關的規章制度、法律法規,信息技術的研發郵政關于郵政業的規章制度、法律法規、設施建設的規
214、劃和發展情況、功能服務的開發利用環境污染、監測關于環境監測的統計報告和技術標準農業、水利關于農業、畜牧業、林業、副業、漁業、水利的規章制度、法律法規、發展規劃、統計資料、科學知識、組織機構等農業水利綜合類農業關于農業的規章制度、法律法規、農產品市場、農業組織、農業科技、農業基礎設施建設林業關于林業的規劃、建設情況、規章制度、法律法規、科學技術、組織機構和相關領域經濟情況畜牧業關于畜牧業的規章制度、法律法規、設施建設、科學技術和相關領域經濟發展情況副業關于副業發展的規章制度、法律法規、設施建設、科學技術和相關領域的經濟發展情況漁業關于漁業發展的規章制度、法律法規、科學技術、設施建設和相關領域的經
215、濟發展1042024 云安全聯盟大中華區版權所有水利關于水利建設的規劃和發展、規章制度、法律法規、科學技術和組織機構財政財政、會計、金融、保險、稅務、審計等財政綜合類財政關于財政的規章制度、法律法規、業務管理、統計資料稅務關于稅務的規章制度、法律法規、理論知識、稅務體系建設金融關于金融的規章制度、法律法規、理論知識、組織機構、金融經濟統計資料保險關于保險的規章制度、法律法規、理論知識、組織機構、保險經濟統計資料審計關于審計的規章制度、法律法規、理論知識、組織機構會計關于會計的規章制度、法律法規、組織機構、理論知識和行業發展情況商業、貿易商業指以貨幣為媒介進行交換從而實現商品流通的經濟活動,貿易
216、指買賣的通稱商貿綜合類國內貿易在國內進行的買賣對外貿易在國際間進行的買賣物流、倉儲物資流動、倉庫儲備海關交納關稅和貨船報關結關的地方檢驗、檢疫檢查并驗證或為防止傳染病蔓延,對可能成為傳染源的人員、交通工具、物資等采取隔離觀察、消毒等措施旅游、服務業外出游覽或為他人提供服侍、幫助的行業旅游、服務業綜合類旅游外出游覽、觀光服務業為他人提供服侍這一職業氣象、水文、測繪、地震大氣現象,自然界中水的變化、運動等的各種現象,測量和地圖制圖,地殼的天然振動氣象水文綜合類氣象大氣現象水文自然界中水的變化、運動等的各種現象測繪測量和地圖制圖地震地殼的天然震動對外事務一個國家在國際關系方面的活動的行政事務、總務對
217、外事務綜合類外交一個國家在國際關系方面的活動外事活動外交事務、涉外事務方面的活動國際關系一個國家與其他各國及其公民之間的關系國際組織各國及其公民之間按照一定的目的、任務和形式組成的國際性團體機構國際會議各國之間共同議事,并遵循一定的議程,所舉行的一種集會政法、監察政治和法律,監督和考察1052024 云安全聯盟大中華區版權所有政法綜合類公安社會的公共治安國家安全國家的獨立、主權、統一和領土完整不受侵犯,國家的政權、政治制度、經濟制度和社會秩序不被破壞,國家的榮譽和利益不遭受到損害或不受損害監察監督考察司法行使法律權力科技、教育科技就是科學技術,教育是指培養人才、傳播知識的工作科教綜合類科技管理
218、對科學技術研究工作進行管理科研工作科學研究工作知識產權知識產權是指公民、法人或其他組織對其在科學技術和文學藝術等領域內,主要基于腦力勞動創造完成的智力成果所依法享有的專有權利技術監督對勞動生產方面的經驗、知識和技巧有權進行檢查管理教育培養人才、傳播知識的工作,主要指學校教育院校管理對各類學院、學校進行管理文化、衛生、體育文體綜合類語言文字語言是用以表達情意的聲音,是人類最重要的交際工具,它跟思想有密切關系,是人類區別于其他動物的本質特征;文字是記錄語言的符號,如漢字、拉丁字母文學藝術文物、考古文物是指歷代遺留下來的具有歷史、藝術價值的東西,考古是指根據古代的遺跡、遺物和文獻,研究古代事物新聞出
219、版圖書、期刊、音像制品、電子出版物、網絡出版物、投影片(含縮微制品)等出版業務廣播、電影、電視廣播是指利用無線電或電視信號對大眾傳播;電影是指表達一個完整主題的、具有連貫的、活動感覺的影像;電視是指利用電子設備傳送活動圖像的技術,是重要的廣播和通信方式,即電視接收機,很多時候也指電視節目醫藥衛生管理對藥品生產、流通、醫療器械企業進行管理醫療保健治療人體疾病,保護和增進人體健康計劃生育通過有效地控制生育的方法來執行制訂子女人數和生育間隔時間體育一種娛樂消遣活動或需體力、智慧與技巧的比賽或競技,它要求用或多或少的體力,按照傳統的形式或一組規則進行,有時還作為一種職業在戶外或室內進行軍事、國防軍事是
220、指與軍隊或戰爭有關的事情,國防是指保衛國家的主權,領土、領海和領空的完整和安全,防御外來的武裝侵略和顛覆軍事國防綜合類國防建設指為保衛國家的主權,領土、領海和領空的完整和安全,防御外來的武裝侵略和顛覆而進行的建設活動1062024 云安全聯盟大中華區版權所有軍事工作與軍隊或戰爭有關事宜的工作軍隊政治工作軍隊政治工作就是要保證革命政黨對軍隊的領導,使軍隊成為革命政黨實現革命目的的工具軍事后勤工作與軍隊或戰爭有關的后方對前方的一切供應工作軍事裝備工作與軍隊或戰爭有關的配備工作軍事技術與軍隊或戰爭有關的經驗、知識和技巧武警武裝警察勞動、人事勞動特指勞動就業和社會保障,人事是指關于工作人員的錄用、培養
221、、調配、獎罰等工作勞動人事綜合類人事工作人事是指關于工作人員的錄用、培養、調配、獎罰等工作勞動就業主要指就業的基本政策、措施、方針、標準、勞動關系調整的基本規則社會保障主要指社會保險工資職稱付給勞動者勞動報酬和科學技術人員等級福利待遇生活上的利益和享有的權利及物質報酬民政、社區民政指政府處理的有關人民的行政事務,社區指同一地區人所組成的整體民政綜合類民政政府處理的有關人民的行政事務社區同一地區人所組成的整體文秘、行政文秘指處理文書文件類秘書行政指企事業、各種社會團體等的內部管理文秘行政綜合類文秘工作處理文書、文件類的工作文種能概括地表明每一種公文性質、用途的統一規范稱謂機要、保密重要而機密、保
222、守秘密檔案國家機構、社會組織以及個人從事政治、軍事、經濟、科學、技術、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄信訪工作接受和處理群眾通過信函或面談方式反映問題的工作行政事務政府機關、企事業、各種社會團體等的內部執行管理的雜務綜合黨團宗教、民族、僑民、黨派團體、特別行政區的綜合事務黨團綜合類黨派團體關于各黨派團體的概況民族事務關于少數民族事業的發展概況宗教關于宗教事務的管理和發展情況僑務工作關于僑務工作的管理和發展概況,以及僑民概況港澳臺工作關于香港、澳門、臺灣的政策法規、政治、經濟、科技交流往來等概況F1.2 政務數據分級示例政務數據分級示例1
223、072024 云安全聯盟大中華區版權所有(DB11/T 1918-2021政務數據分級與安全保護規范)表 19 政務數據分級表分類分類數據項數據項影響對象影響對象影響程度影響程度影響規模影響規??煽爻潭瓤煽爻潭葦祿墑e數據級別辦證申請信息申請用戶姓名自然人一般影響較大范圍強可控二級電話自然人一般影響較大范圍強可控二級辦證類型自然人一般影響較大范圍強可控二級小區名自然人嚴重影響較大范圍強可控三級樓號自然人嚴重影響較大范圍強可控三級家庭住址自然人嚴重影響較大范圍強可控三級車牌自然人嚴重影響較大范圍強可控三級舊車牌自然人嚴重影響較大范圍強可控三級車牌顏色自然人一般影響較大范圍強可控二級牌照類型自然人
224、一般影響較大范圍強可控二級車主與戶主關系自然人嚴重影響較大范圍強可控三級費用自然人一般影響較大范圍強可控二級操作員自然人一般影響較大范圍強可控二級身份證件編號自然人嚴重影響較大范圍強可控三級身份證姓名自然人嚴重影響較大范圍強可控三級房屋證明編號自然人嚴重影響較大范圍強可控三級房產證明姓名自然人嚴重影響較大范圍強可控三級戶口本地址自然人嚴重影響較大范圍強可控三級戶口本姓名自然人嚴重影響較大范圍強可控三級駕駛證編號自然人嚴重影響較大范圍強可控三級駕駛證姓名自然人嚴重影響較大范圍強可控三級行駛證編號自然人嚴重影響較大范圍強可控三級行駛證姓名自然人嚴重影響較大范圍強可控三級結婚證姓名自然人嚴重影響較大
225、范圍強可控三級結婚證編號自然人嚴重影響較大范圍強可控三級租賃合同姓名自然人嚴重影響較大范圍強可控三級租賃合同編號自然人嚴重影響較大范圍強可控三級居委會公共服務機構一般影響較大范圍強可控二級辦證申請信息數據項集合自然人特別嚴重影響較大范圍強可控四級辦證規則信息車場名稱公共服務機構一般影響較大范圍強可控二級免費時長自然人一般影響較大范圍強可控二級基礎分鐘數自然人一般影響較大范圍強可控二級基礎分鐘金額自然人一般影響較大范圍強可控二級累計金額自然人一般影響較大范圍強可控二級1082024 云安全聯盟大中華區版權所有每日封頂自然人一般影響較大范圍強可控二級包月金額自然人一般影響較大范圍強可控二級更新時間
226、自然人一般影響較大范圍強可控二級創建時間自然人一般影響較大范圍強可控二級辦證規則信息操作員 id自然人一般影響較大范圍強可控二級證件類型自然人一般影響較大范圍強可控二級辦證規則信息數據項集合自然人一般影響較大范圍強可控二級停車場信息車場編號公共服務機構一般影響較大范圍強可控二級車場名稱公共服務機構一般影響較大范圍強可控二級居委會編號公共服務機構一般影響較大范圍強可控二級更新時間自然人一般影響較大范圍強可控二級創建時間自然人一般影響較大范圍強可控二級停車場信息數據項集合公共服務機構一般影響較大范圍強可控二級站內通知信息標題自然人一般影響較大范圍強可控二級類型自然人一般影響較大范圍強可控二級發布時
227、間自然人一般影響較大范圍強可控二級內容自然人一般影響較大范圍強可控二級創建人自然人一般影響較大范圍強可控二級創建時間自然人一般影響較大范圍強可控二級修改人自然人一般影響較大范圍強可控二級修改時間自然人一般影響較大范圍強可控二級站內通知信息數據項集合自然人一般影響較大范圍強可控二級公示登記信息項目名稱自然人一般影響較大范圍強可控二級公示圖像文件自然人一般影響較大范圍強可控二級操作員編號自然人一般影響較大范圍強可控二級刪除狀態自然人一般影響較大范圍強可控二級更新時間自然人一般影響較大范圍強可控二級創建時間自然人一般影響較大范圍強可控二級公示狀態自然人一般影響較大范圍強可控二級公示登記信息公示登記信
228、息數據項集合自然人一般影響較大范圍強可控二級F2 金融金融F2.1 金融數據分類分級金融數據分類分級1092024 云安全聯盟大中華區版權所有F2.1.1 金融數據分類示例金融數據分類示例表 20 金融數據分類示例表分類分類子分類子分類描述描述客戶數據個人數據指個人的自然屬性信息,包括個人自然信息、個人身份鑒別信息、個人資訊信息等信息。單位數據指單位的自然屬性數據,包含單位基本信息、單位身份鑒別信息、單位標簽信息等單位信息。業務數據賬戶信息指賬戶相關數據,如賬戶的基本信息、計息信息、凍結信息、介質信息和核算信息等。法定數字貨幣錢包信息指法定數字貨幣錢包相關屬性信息。合同協議信息指合同或協議所包
229、含的所有屬性信息,如合同法以及商業銀行法所規定的基本信息。金融監管和服務包括反洗錢業務信息、貸款業務信息、貨幣金銀業務信息、貸款保險業務信息等。交易信息交易通用信息、保險收付費信息等。經營管理營銷服務產品信息、渠道信息、營銷信息。運營管理安防管理信息、業務運維信息、客戶服務信息、單證管理信息等。風險管理信息風險偏好信息、風險管控信息。技術管理項目管理信息、系統管理信息。綜合管理戰略規劃信息、招聘信息、員工信息、機構信息等。監管數據報送監管報送信息。數據收取評級、處罰與違規信息、外部審計信息等。F2.1.2 金融數據分級示例金融數據分級示例表 21 金融數據分類示例表最低安全級別最低安全級別數據
230、定級要素數據定級要素數據一般特征數據一般特征影響對象影響對象影響程度影響程度5國家安全嚴重損害/一般損害/輕微損害(一)重要數據,通常主要用于金融業大型或特大型機構金融交易過程中 重要核心節點類機構的關鍵業務使用,一般針對特定人員公開,且僅為必須 知悉的對象訪問或使用。(二)數據安全性遭到破壞后,對國家安全造成影響,或對公眾權益造成嚴重影響。5公眾權益嚴重損害4公眾權益一般損害(一)數據通常主要用于金融業大型或特大型機構、金融交易過程中重要核 心節點類機構的重要業務使用,一般針對特定人員公開,且僅為1102024 云安全聯盟大中華區版權所有必須知悉的 對象訪問或使用。(二)個人金融信息中的 C
231、3 類信息。(三)數據安全性遭到破壞后,對公眾權益造成一般影響,或對個人隱私或 企業合法權益造成嚴重影響,但不影響國家安全。4個人隱私嚴重損害4企業合法權益嚴重損害3公眾權益輕微損害(一)數據用于金融業機構關鍵或重要業務使用,一般針對特定人員公開,且僅為必須知悉的對象訪問或使用。(二)個人金融信息中的 C2 類信息。(三)數據的安全性遭到破壞后,對公眾權益造成輕微影響,或對個人隱私 或企業合法權益造成一般影響,但不影響國家安全。3個人隱私一般損害3企業合法權益一般損害2個人隱私輕微損害(一)數據用于金融業機構一般業務使用,一般針對受限對象公開,通常為 內部管理且不宜廣泛公開的數據。(二)個人金
232、融信息中的 C1 類信息。(三)數據的安全性遭到破壞后,對個人隱私或企業合法權益造成輕微影 響,但不影響國家安全、公眾權益。2企業合法權益輕微損害1國家安全無損害(一)數據一般可被公開或可被公眾獲知、使用。(二)個人金融信息主體主動公開的信息。(三)數據的安全性遭到破壞后,可能對個人隱私或企業合法權益不造成影 響,或僅造成微弱影響但不影響國家安全、公眾權益。1公眾權益無損害1個人隱私無損害1企業合法權益無損害1112024 云安全聯盟大中華區版權所有FE2.2 證券期貨業數據分類分級證券期貨業數據分類分級F2.2.1 證券期貨業數據分類證券期貨業數據分類表 22 證券期貨業數據分類表業務條線業
233、務條線數據數據一級子類一級子類二級子類二級子類一級子類一級子類二級子類二級子類交易交易管理成交信息委托信息交易業務參數信息交易日志信息訂單日志成交日志監管監察與評價管理監察參考信息監察統計及預警信息監管統計分析結果監管預警信息評價、處罰與違規信息信息披露信息披露管理產品發行信息(公開)產品發行信息(未公開)其他業務管理統計信息其他業務管理技術管理規劃類數據運行管理配置信息數據信息資產管理數據字典類日志類數據1122024 云安全聯盟大中華區版權所有F2.2.2 證券期貨業數據分級證券期貨業數據分級表 23 證券期貨業數據分級表數據級別標識數據級別標識數據重要程度標識數據重要程度標識數據特征數據
234、特征4極高1、數據的安全屬性(完整性、保密性、可用性)遭到破壞后數 據損失后,影響范圍大(跨行業或跨機構)影響程度一般是“嚴重”;2、一般特征:數據主要用于行業內大型或特大型機構中的重要業務使用,一般針對特定人員公開,且僅為必須知悉的對象訪問或使用。3高1、數據的安全屬性(完整性、保密性、可用性)遭到破壞后數 據損失后,影響范圍中等(一般局限在本機構),影響程度一般 是“嚴重”;2、一般特征:數據用于重要業務使用,一般針對特定人員公開,且僅為必須知悉的對象訪問或使用。2中1、數據的安全屬性(完整性、保密性、可用性)遭到破壞后數 據損失后,影響范圍較小(一般局限在本機構),影響程度一般 是“中等
235、”或“輕微”;2、一般特征:數據用于一般業務使用,一般針對受限對象公開;一般指內部管理且不宜廣泛公開的數據。1低1、數據的安全屬性(完整性、保密性、可用性)遭到破壞后數 據損失后,影響范圍較小(一般局限在本機構),影響程度一般 是“輕微”或“無”;2、一般特征:數據可被公開或可被公眾獲知、使用。F3 電信電信參考 YD/T 3813-2020基礎電信企業數據分類分級方法F3.1 電信數據分類示例電信數據分類示例表 24 電信數據分類示例表一級子類一級子類二級子類二級子類三級子類三級子類四級子類四級子類用戶相關數據用戶身份相關數據用戶身份相關數據個人身份標識、網絡身份標識、用戶基本資料、實名認證
236、、用戶風險資料用戶服務內容數據服務內容和資料數據服務內容、個人信息用戶服務行為數據服務使用數據業務打點數據、服務記錄和日志、消費信息和賬單、位置信息、通訊記錄數據設備信息終端設備標識、終端設備數據1132024 云安全聯盟大中華區版權所有用戶統計分析類數據用戶使用習慣和行為分析數據/用戶上網行為相關統計分析數據/企業自身相關數據網絡與系統的建設與運行維護類數據規劃建設類數據(分發前后)網絡規劃類、投資計劃類、項目管理類網絡基礎資源類數據公共資源數據、傳輸資源類數據、承載網資源、核心網資源、接入網資源網絡運營類數據信令、網絡信標、網絡、網絡 ID、VLAN、劃分、設備監測等網絡安全管理類數據安全
237、審計記錄、網絡安全應急預案、連帶者信息、核心區域監測、核心區域護航業務運營類數據業務運營服務數據產品信息、渠道信息、客戶服務信息、營銷信息公共業務運營服務數據/企業管理數據發展戰略與重大決策發展戰略、重大決策、重要會議業務發展類市場策略、營銷管理、資源管理等技術研發類技術管理、技術研究、專利工作運行管理類/生產經營類財務預算、業績監控、考核信息等綜合管理類人力資源、財務信息、辦公信息化、采購其他數據合作方提供數據/F3.2 電信數據分級示例電信數據分級示例按照數據對象的重要敏感程度,可以將基礎電信企業網絡數據資源分為四個安全級別,其對應的安全要求逐級遞減,分別為第四級、第三級、第二級和第一級。
238、第四級數據:一旦丟失、泄露、被篡改、被損毀會對國家安全、社會公共利益或企業利益或用戶利益造成特別嚴重影響的數據,安全管控要求最高;第三級數據:一旦丟失、泄露、被篡改、被損毀會對國家安全、社會公共利益或企業利益或用戶利益造成嚴重影響的數據,應實施較強的安全管控;第二級數據:一旦丟失、泄露、被篡改、被損毀會對國家安全、社會公共利益或企業利益或用戶利益造成一定程度影響的數據,執行基本的安全管控;1142024 云安全聯盟大中華區版權所有第一級數據:一旦丟失、泄露、被篡改、被損毀對國家安全、社會公共利益或企業利益或用戶利益造成影響較小或無影響的數據,對安全管控不作要求。F4 醫療醫療F4.1 醫療健康
239、數據分類示例醫療健康數據分類示例表 25 醫療健康數據分類示例表數據分類數據分類數據大類數據大類子類子類內容內容個人屬性數據人口統計信息姓名、出生日期、性別、民族、國籍、職業、住址、工作單位、家庭成員信息、聯系方式、收入、婚姻狀態等個人身份信息姓名、身份證號、工作證、居住證、社???、可識別個人的影像信息、健康卡號、住院號、各類檢測檢驗相關編號等個人通訊信息個人電話號碼、郵箱、賬號及關聯信息個人生物識別信息基因、指紋、聲紋、掌紋、耳廓、虹膜、面部特征等個人信用記錄信息個人信用檔案、個人信用評分、個人信用報告等個人健康狀況數據主訴、現病史、既往病史、體格檢查(體征)、家族史、癥狀、起始檢測數據、遺
240、傳代碼數據、可導致敏感數據的健康狀態數據、生活方式、基因序列、特殊產物特征、重組序列等醫療應用數據門(急)診病歷、住院病歷、檢查檢驗報告、用藥信息、病程記錄、手術記錄、麻醉記錄、輸血記錄、護理記錄、入院記錄、出院小結、結論(診斷)記錄、知情告知信息等醫療資金和支付數據醫療交易信息支付信息、消費金額、交易記錄等保險信息保險賬號、保險狀態、保險金額等衛生資源數據醫療基本數據醫療機構名稱、醫療機構類別、醫院分類代碼、床位數、醫院地址、電話號碼1152024 云安全聯盟大中華區版權所有醫院運營數據人力資源、財務數據、物資數據、物流數據、基礎運行數據等公共衛生數據傳染病疫情數據病名、發病人數、發病率、死
241、亡人數、死亡率、發病數據排名、死亡數據排名等疾病監測數據傳染病監測信息、非傳染病監測信息等疾病預防數據疫苗、應接種人數、實接種人數等出生死亡數據出生人數、出生率、死亡率、自然增長率等F4.2 醫療健康數據分級示例醫療健康數據分級示例表 26 醫療健康數據分級示例表數據大類數據大類子類子類內容內容數據級別數據級別個人屬性數據人口統計信息姓名、出生日期、性別、民族、國籍、職業、住址、工作單位、家庭成員信息、聯系方式、收入、婚姻狀態等4個人身份信息姓名、身份證號、工作證、居住證、社???、可識別個人的影像信息、健康卡號、住院號、各類檢測檢驗相關編號等4個人通訊信息個人電話號碼、郵箱、賬號及關聯信息4個
242、人生物識別信息基因、指紋、聲紋、掌紋、耳廓、虹膜、面部特征等4個人信用記錄信息個人信用檔案、個人信用評分、個人信用報告等4個人健康狀況數據主訴主訴、癥狀代碼和編碼體系名稱、癥狀代碼、癥狀起始日期時間、癥狀停止日期時間、癥狀描述、癥狀性程度代碼、嚴重度代碼、初診標志等4現病史起病時間、起病符號代碼、起病符號描述、起病緩急描述、起病性質原因/誘因、起病特點、伴隨癥狀、本系統癥狀代碼和病名代碼、起病后觀察情況等4既往病史既往家族病史項目名稱、既往家族病史信息4家族史家族史數據項項目名稱、家族史疾病類代碼等4過敏史過敏史、過敏項目信息、過敏特征信息41162024 云安全聯盟大中華區版權所有醫療應用數
243、據門(急)診病歷醫療機構組織機構代碼、門(急)診號、科室名稱、患者姓名、性別、出生日期、年齡、體格檢查等相關信息、既往史、遺傳信息、疾病診斷等4住院醫囑住院醫囑、科室名稱、醫院名稱、入院記錄等3檢查檢驗報告檢查記錄;門(急)診號、住院號、檢查報告單編號、電子申請單編號、患者姓名、性別、年齡、聯系人電話號碼、科室名稱、病區名稱、病床號、病房號、主訴、癥狀開始日期時間、癥狀停止日期時間、癥狀描述、操作標志、操作代碼等檢驗記錄;門(急)診號、住院號、檢驗報告單編號、電子申請單編號、患者姓名、患者類型、性別年齡、科室名稱、病區名稱、病房號、病床號、檢驗申請機構、檢驗申請科室、檢驗方法名稱、檢驗項目名稱
244、、檢驗類別、檢驗項目代碼、檢驗結果代碼、檢驗定量結果等3用藥信息藥物用法、藥物使用-頻率、藥物使用-劑量單位、藥物使用-次劑量、藥物使用-總劑量、藥物使用-途徑代碼、藥物名稱、藥物劑型代碼、中藥類別代碼、藥物類型、藥物名稱代碼、中藥煎煮法代碼等2病程記錄病程記錄分類,病程記錄、治療類別代碼等2手術記錄門(急)診號、住院號、電子申請單編號、科室名稱、病區名稱、病房號、病床號、手術間編號、患者姓名、性別、年齡、術前診斷、術后診斷、手術開始日期時間、手術結束日期時間、手術/操作代碼、手術名稱、手術級別、手術目標部位名稱、手術日期時間、介入物名稱、手術體位代碼、手術過程描述、手術標志、手術切口描述等2
245、醫療資金和支付數據醫療交易信息支付信息、消費金額、交易記錄等3保險信息保險賬號、保險狀態、保險金額等4衛生資源數據醫院基本數據醫療機構名稱、醫療機構類別、醫院分類代碼、床位數、醫院地址、電話號碼3醫院運營數據人力資源、財務數據、物資數據、物流數據、基礎運營數據等3公共衛生數據傳染病疫情數據病名、發病人數、發病率、死亡人數、死亡率、發病數據排名、死亡數據排名等41172024 云安全聯盟大中華區版權所有疾病監測數據傳染病流行病學監測;(1)人口學資料;(2)傳染病發病和死亡及其分布;(3)病原體型別、毒力、耐藥性變異情況;(4)人群免疫水平的測定;(5)動物宿主和媒介昆蟲種群分布及病原體攜帶狀況
246、;(6)傳播動力學及其影響因素的調查;(7)防治措施效果的評價;(8)疫情預測;(9)專題調查(如暴發調查、漏報調查等)等。4非傳染病流行病學監測;(1)人口學資料;(2)非傳染病發病和死亡及其分布;(3)人群生活方式和行為危險因素監測;(4)地理、環境和社會人文(包括經濟)因素的監測;(5)飲食、營養因素的調查;(6)基因型及遺傳背景因素的監測;(7)高危人群的確定;(8)預防和干預措施效果的評價4疾病預防數據疫苗、應接種人數、實接種人數等1出生死亡數據出生人數、出生率、死亡人數、死亡率、自然增長數、自然增長率等1F5 教育教育F5.1 教育數據分類示例教育數據分類示例表 27 教育數據分類
247、示例表數據一級類別數據一級類別數據二級類別數據二級類別數據示例數據示例教育基礎數據人員基礎數據姓名、性別、民族、籍貫、政治面貌、戶口所在地、身份證件號等個人信息。個人健康生理信息、個人生物識別信息、不滿十四周歲未成年人的個人信息等敏感個人信息。學校(機構)基礎數據學校(機構)名稱、學校(機構)地址、統一社會信息用代碼、學校(機構)郵政編碼、校區基本信息、聯系電話、電子郵箱等。教育業務數據學生管理數據學籍數據、學歷學位數據、資助數據、就業數據、體質健康數據等。教職工管理數據職務職稱數據、培養數據、考核數據、聘用數據、離職數據等1182024 云安全聯盟大中華區版權所有數據一級類別數據一級類別數據
248、二級類別數據二級類別數據示例數據示例教育教學管理數據課程管理數據、教材管理數據、學科專業建設數據、辦學條件數據、心理健康數據、學校教育質量評價數據、教師考核評價數據、學生綜合素質評價數據、考試管理數據等。招生錄取數據招生計劃、考生數據、成績數據、錄取數據等??蒲泄芾頂祿椖抗芾頂祿?、經費管理數據、成果管理數據、考核管理數據等。教育信息化數據統一身份認證數據、數字教育資源數據、教育數字證書信息等。國際交流與合作數據來華留學數據、出國(境)留學工作數據、外籍教師管理數據、國際交流數據等。教育督導數據義務教育督導數據、學校督導數據、督學管理數據、評估監測數據等。教育行政管理數據綜合辦公數據公文數據、
249、檔案管理數據、會議管理數據、教育信訪數據、教育輿情數據、政務公開數據等。政策規劃數據法規、規章、規劃等文件在制定修訂過程中產生的數據。財務與審計數據財務管理數據、項目經費管理數據、審計數據等。資產管理與后勤服務數據資產管理數據、后勤管理數據等。干部人事數據編制管理數據、招錄數據、職稱評審數據、職務任免數據、人事考核數據、人事檔案數據、教育培訓數據、離退休管理數據等。信息系統運行與安全數據網絡拓撲數據、資產清單數據、監測預警數據、威脅情報數據、安全事件數據、日志數據等。F6 工業工業F6.1 工業數據分級示例工業數據分級示例(DB50/T 1453-2023 工業數據分類分級導則)表 28 工業
250、數據分級示例表行業類別行業類別企業名稱企業名稱數據業務類型數據業務類型一級子類一級子類二級子類二級子類數據名稱數據名稱數據產生部門數據產生部門存儲方式存儲方式存儲位置存儲位置更新頻率更新頻率數據用途數據用途數據級別數據級別數據描述數據描述汽車零配件xxx有限公司生產制造類生產制造數據生產監控數據機加數據采集大數據中心本地MES 系統熱數據統計分析L2級機械加工場景的運行數據1192024 云安全聯盟大中華區版權所有汽車零配件xxx有限公司生產制造類生產制造數據工業控制信息SPC分析大數據中心本地MES 系統熱數據統計分析L2級過程控制數據汽車零配件xxx有限公司經營管理類經營管理數據資源管理數
251、據采購訂單大數據中心本地ERP系統熱數據記賬分析L2級采購類數據電氣機械行業xxx有限公司生產制造類生產制造數據工藝參數工藝文件技術研發部數據庫本地服務器溫數據生產制造使用L2級生產工藝參數電氣機械行業xxx有限公司生產制造類生產制造數據X質量數據檢測中心本地SAP系統溫數據生產制造使用L2級過程檢查、質量數據XXXxxx研究院經營管理類經營管理數據資源管理數據生產核算數據財務資產部本地SAP系統熱數據企業內部使用L2級業務統計數據(訂單、倉儲、排產等)汽車零配件xxx有限公司生產制造類生產制造數據生產監控數據機加數據采集大數據中心本地MES 系統熱數據統計分析L2級機械加工場景的運行數據汽車
252、零配件xxx有限公司生產制造類生產制造數據工業控制信息SPC分析大數據中心本地MES 系統熱數據統計分析L2級過程控制數據汽車零配件xxx有限公司經營管理類經營管理數據資源管理數據采購訂單大數據中心本地ERP系統熱數據記賬分析L2級采購類數據電氣機械行業xxx有限公司生產制造類生產制造數據工藝參數工藝文件技術研發部數據庫本地服務器溫數據生產制造使用L2級生產工藝參數電氣機械行業xxx有限公司生產制造類生產制造數據X質量數據檢測中心本地SAP系統溫數據生產制造使用L2級過程檢查、質量數據XXXxxx研究院經營管理類經營管理數據資源管理數據生產核算數據財務資產部本地SAP系統熱數據企業內部使用L2
253、級業務統計數據(訂單、倉儲、排產等)F7 煙草煙草煙草行業數據分類分級詞典示例煙草行業數據分類分級詞典示例一級類別一級類別二級類別二級類別三級類別三級類別包含內容包含內容級別級別用戶相關數據用戶身份相關數據自然人身份標識個人基因、指紋、聲紋、掌紋、耳廓、虹膜、面部特征等。四級1202024 云安全聯盟大中華區版權所有用戶相關數據用戶身份相關數據網絡身份標識系統賬號、IP 地址、郵箱地址及與前述有關的密碼、口令、口令保護答案、用戶個人數字證書等。三級用戶相關數據用戶身份相關數據用戶基本資料個人姓名、生日、性別、民族、國籍、家庭關系、住址、個人電話號碼、電子郵箱等。三級用戶相關數據用戶身份相關數據
254、用戶私密資料銀行賬號、鑒別信息(口令)、存款信息(包括資金數量、支付收款記錄等)、房產信息、信貸記錄、征信信息、交易和消費記錄、流水記錄等。四級用戶相關數據用戶服務內容數據服務內容數據煙草產品交易內容信息。四級用戶相關數據用戶服務內容數據業務訂購管理煙草產品訂購信息、訂單信息、物流訂單信息、渠道與訂單信息等。三級用戶相關數據用戶服務內容數據服務記錄和日志服務器日志的典型例子是網頁服務器的日志,其中包含頁面請求的歷史記錄、客戶端 IP 地址、請求日期/時間、請求的網頁、HTTP代碼、提供的字節數、用戶代理、引用地址等。三級企業經營數據系統運維數據網絡規劃網絡地址、掩碼數據、身份標識、URL 地址
255、數據、分域信息、網絡子網、網絡端口、分區地址數據。二級企業經營數據系統運維數據系統日志各軟硬件系統日志。二級企業經營數據企業管理數據生產經營數據企業銷售收入、銷售回款、利潤水平、經營活動現金流量、期間費用、生產成本、產品質量等。三級企業經營數據企業管理數據標準化數據企業標準庫、法律法規庫、企業標準歷史庫等。二級企業經營數據企業管理數據企業制度數據企業外來制度和來自企業內部制度等。二級企業業務數據產品信息業務產品信息如卷煙基本信息、煙包信息、卷煙質檢等數據。三級企業業務數據產品信息渠道信息煙草品牌分銷渠道、煙草渠道建設、渠道的定義、產品渠道,生產渠道、消費領域途徑。三級企業業務數據銷售信息客戶服
256、務信息客情維護、經營指導、消費推薦、活動和品牌信息推廣、策劃設計、會場租賃、市場發展、客戶管理維護服務等。三級1212024 云安全聯盟大中華區版權所有企業業務數據物流信息煙草物流煙草物流是指煙草及其制品、原輔料從生產、收購、儲存、運輸、加工到銷售服務整個過程中物質實體運動以及流通環節的所有附加增值活動,包含煙草零售戶、訂單品種、倉儲、進貨、出貨、進庫、出庫、入庫等。三級企業業務數據物流信息煙草倉儲如統計報表、排號、掃碼點件、二檢排包、磅碼、成件賦碼、煙葉入庫、煙葉出庫等。三級1222024 云安全聯盟大中華區版權所有附錄附錄 G-非結構化文件識別規則示例非結構化文件識別規則示例在非結構化數據
257、中識別文檔類數據通常涉及多種技術和策略。表 29 非結構化文件識別規則示例表文件類型文件類型規則類型規則類型識別點識別點識別方法示例識別方法示例文檔文檔框架識別規則示例標題和小標題識別使用文本大小、粗體或特定格式(如冒號后跟文本)來識別標題和小標題。段落邊界識別基于文本格式(如縮進、換行)來確定段落的開始和結束。列表和子列表識別通過項目符號、數字或字母序列來識別列表和子列表的結構。多級標題識別通過字體大小、粗細和編號來區分不同級別的標題。頁眉頁腳識別檢測重復出現的文本元素,如頁碼、文檔標題等,來識別頁眉和頁腳。表格和圖表識別利用線條、格子或特定布局來識別文檔中的表格和圖表。關鍵詞和詞組識別規則
258、示例詞頻統計統計文檔中最常出現的詞匯,高頻詞可能是關鍵詞。領域特定術語識別特定行業或領域的專業術語。標題和小標題分析標題和小標題中的詞匯往往是關鍵詞。詞性標注通過詞性標注識別名詞短語或動詞短語。固定搭配識別識別常用的詞匯組合,如“經濟增長”“市場調研”等。同義詞和近義詞識別識別文檔中的同義詞或近義詞短語,以理解上下文意義。上下文分析分析詞匯的上下文使用,以更準確地確定其作為關鍵詞的重要性。多詞表達式識別識別固定詞組或習語,如“舉足輕重”“一石二鳥”等。主題建模使用如 LDA(LatentDirichletAllocation)等算法來識別與文檔主題相關的關鍵詞和短語。語句識別規則示例語法結構分
259、析分析句子的語法結構,如主謂賓結構,以識別完整的語句。標點符號使用利用句號、問號、感嘆號等標點符號來確定句子的界限。連接詞和過渡詞分析識別連接詞和過渡詞,如“因此”“然而”,來理解句子之間的邏輯關系。從句和嵌套結構識別識別復雜句子中的從句和嵌套語句結構。語言風格和語調分析識別文檔中的語言風格和語調,如正式、口語、幽默等。引用和直接引語識別通過引號和報告動詞來識別引用和直接引語。1232024 云安全聯盟大中華區版權所有視頻視頻文字內容識別規則示例文本區域檢測在視頻幀中檢測文本的位置,可能涉及復雜的背景和不同的字體。光學字符識別識別視頻幀中的文字內容,這可能需要處理模糊或動態變化的圖像。上下文關
260、聯分析將文本內容與視頻中的其他視覺元素和情境進行關聯分析。人臉識別和表情分析人臉檢測與追蹤在視頻序列中檢測和追蹤人臉表情識別分析視頻中的面部表情,用于情感分析或身份驗證。人臉識別對視頻中的人臉進行身份識別,可能需要處理不同的角度和光照條件。物體和場景識別物體檢測識別視頻中的物體,如車輛、行人、動物等。場景理解分析視頻中的場景,理解其背景、環境和上下文。動作識別識別視頻中人物的動作和活動,如跑步、跳舞等。視頻行為分析行為識別分析視頻中人物的特定行為,如走路、打電話等。事件檢測識別視頻中的特定事件,如事故、爭論等。軌跡分析追蹤視頻中物體或人物的移動軌跡。音視頻融合分析口型與語音同步檢查視頻中人物的
261、口型是否與音頻中的語音同步。場景與音效關聯分析視頻場景與背景音樂或音效之間的關聯。多通道分析結合視頻的視覺內容和音頻內容進行全面分析。交互式視頻分析用戶反饋學習根據用戶的反饋對視頻分析模型進行調整和優化。標注和元數據分析使用視頻標注和元數據來提高視頻內容的理解和分類。圖片人臉識別規則示例面部特征檢測通過檢測人臉的關鍵特征點,如眼睛、鼻子、嘴巴等,來識別人臉。面部特征向量化將面部特征轉換為數值向量,以便于比較和識別。深度學習模型應用使用卷積神經網絡(CNN)等深度學習模型進行面部特征的學習和識別。生物特征比對比對面部特征數據與數據庫中的已知面部數據,以識別個體。文字內容識別規則示例(光學字符識別
262、,OCR)文本區域定位定位圖片中的文本區域。字符分割將文本區域中的字符進行分割。字符識別識別分割后的字符。上下文校正使用上下文信息校正識別出的文字,提高準確性。物體和場景特征提取提取圖片中的關鍵特征,如顏色、形狀、紋理等。1242024 云安全聯盟大中華區版權所有識別規則示例模式識別使用模式識別技術識別圖片中的特定物體或場景。深度學習分類器應用深度學習分類器,如 CNN,對物體或場景進行分類。運動和行為識別規則示例序列幀分析分析視頻序列中連續的幀,以識別運動或行為。時空特征識別識別影像中隨時間變化的空間特征。動作模式識別使用機器學習算法來識別特定的動作模式。圖像分割和標注規則示例區域分割將圖片
263、分割成多個區域,每個區域包含不同的對象或特征。邊緣檢測通過檢測圖像中的邊緣來分割對象。語義分割將圖像中的每個像素分類到不同的類別,以識別不同的物體。色彩和紋理分析規則示例色彩直方圖分析分析圖像的色彩分布。紋理特征識別識別圖像中的紋理特征,如光滑、粗糙等。色彩空間變換將圖像從一個色彩空間轉換到另一個,如從RGB到HSV,以便更好地分析和處理圖像。音頻語音識別規則示例(自動語音識別,ASR)聲波特征提取提取語音信號的基本特征,如頻率、節奏和音量。聲音分割和歸類將語音信號分割成較小的單位,如音素或字。模型訓練使用深度學習模型(如循環神經網絡,RNN)訓練系統以識別和轉換語音數據為文字。上下文分析分析
264、語言的上下文和語法結構以提高識別準確性。語音情感分析規則示例音調和節奏分析分析語音的音調、強度和節奏來判斷說話者的情感狀態。聲音特性識別識別語音中的特定聲音特性,如顫音、哭腔,以確定情感。機器學習分析利用機器學習算法,如支持向量機(SVM)或神經網絡,來分類和識別不同的情感狀態。音樂和聲音分析規則示例音調和節拍檢測分析音樂中的音調和節拍,識別旋律和節奏模式。聲音分類將聲音文件分類為不同的類別,如語音、音樂、環境聲音等。樂器識別識別音樂中使用的不同樂器。環境聲音識別規則示例聲音事件檢測檢測和識別特定的聲音事件,如玻璃破碎、汽車喇叭等。聲源定位使用麥克風陣列等技術來定位聲音的來源。背景噪聲分析分析
265、和識別背景中的噪聲類型,如交通噪聲、人群聊天等。多通道和多模態數據融合視頻與音頻同步分析結合視頻和音頻數據進行更全面的分析,如在電影或監控場景中的應用??缑襟w內容分析結合音頻、視頻、文本等不同媒體形式的數據進行綜合分析。其他非結構化文件社交媒體數據分析規則情感分析分析社交媒體帖子的文本內容,以識別情感傾向,如積極、消極或中性。1252024 云安全聯盟大中華區版權所有話題檢測和跟蹤通過關鍵詞、標簽和話題聚類來監測和追蹤熱門話題。用戶行為分析分析用戶的互動模式,如點贊、評論和分享,以了解內容的影響力和受歡迎程度。傳感器數據分析規則時間序列分析分析來自傳感器的時間序列數據,識別模式和異常。環境監測
266、使用氣象、溫度、度等傳感器數據來監測和預測環境變化。物體追蹤和定位使用 GPS 和其他傳感器數據來追蹤和定位移動物體。網絡和日志數據分析規則異常檢測分析網絡流量或系統日志以識別異常行為,如網絡攻擊、系統故障等。使用模式識別識別使用模式或趨勢,如網站訪問量的高峰時段、操作系統的常見錯誤等。數據聚合和關聯分析來自不同來源的日志數據進行聚合和關聯分析,以獲得更全面的洞察。醫療和生物信息數據分析規則基因序列分析分析基因序列來識別遺傳變異和相關疾病。醫療影像分析使用計算機視覺技術分析 X 光片、CT 掃描等醫療影像,以輔助診斷?;颊邤祿治龇治龌颊叩碾娮咏】涤涗洠‥HR)來識別健康風險和治療反應。4Io
267、T(物聯網)數據分析規則設備性能監測監測 IoT 設備的性能和狀態,識別維護和升級的需求。智能家居行為模式識別分析智能家居設備的使用數據,識別居住者的行為模式和偏好。能源消耗分析分析來自智能電表的數據,以優化能源使用和成本。1262024 云安全聯盟大中華區版權所有參考文獻參考文獻1 中華人民共和國數據安全法(2021 年 6 月 10 日中華人民共和國第十三屆全國人民代表大會常務委員會第二十九次會議通過).2 關于構建數據基礎制度 更好發揮數據要素作用的意見(數據二十條).3 國家標準化管理委員會.數據安全技術 數據分類分級規則(GB/T 43697-2024).4 金融數據安全 數據安全分
268、級指南(2020 年 9 月 23 日中國人民銀行發布).5 工業數據分類分級指南(試行)(2020 年 2 月 27 日工業和信息化部辦公廳印發).6 云安全聯盟(CSA).CSA 數據安全詞匯表.7 國家標準化管理委員會.數據安全管理能力成熟度模型(GB/T 37988-2019).8 國家標準化管理委員會.信息技術-大數據-數據分類指南(GB/T 38667-2020).9 貴州省地方標準.政府數據 數據分類分級指南(DB52/T 1123-2016).10工業和信息化部.基礎電信企業數據分類分級方法(YD/T3813-2020).11浙江省地方標準.數字化改革 公共數據分類分級指南(D
269、B33/T 23512021).12中華人民共和國個人信息保護法(2021 年 8 月 20 日中華人民共和國第十三屆全國人民代表大會常務委員會第三十次會議通過)13網絡安全審查辦法(2021 年 11 月 16 日國家互聯網信息辦公室 2021 年第 20 次室務會議審議通過).14中華人民共和國網絡安全法(2016 年 11 月 7 日中華人民共和國第十二屆全國人民代表大會常務委員會第二十四次會議通過)15重要數據識別指南(征求意見稿)(2022 年 1 月 13 日全國信息安全標準化技術委員會審議通過).16國家標準化管理委員會.信息安全技術 個人信息安全規范(GB/T 35273-20
270、20).17Gartner.2024 年中國數據、分析和人工智能技術成熟度曲線.18Gartner.Hype Cycle for Data management,2024.19網絡數據安全管理條例(2024 年 8 月 30 日國務院第 40 次常務會議通過).20國家標準化管理委員會.信息安全技術 網絡數據分類分級要求(征求意見稿).21上海市地方標準.上海市公共數據開放分級分類指南(試行).22坪山區.坪山區政務數據分級分類管理辦法(試行).23浙江省地方標準.數據資源管理第 3 部分:政務數據分類分級(DB3301/T0322.32020).24煙臺市地方標準.煙臺市公共數據開放分級分類
271、指南(試行).25重慶市地方標準.重慶市公共數據分類分級指南(試行).26吉林省地方標準.政務數據安全分類分級指南(DB2201/T172022).27河北省地方標準.政務數據分類分級要求(DB14/T24422022).28江蘇省地方標準.政務數據安全分類分級指南(DB3212/T11162022).29無錫市地方標準.無錫市公共數據分類分級實施指南(DB3202/T10492023).30江蘇省地方標準.公共數據分類分級指南(DB3203/T10242023).31四川省地方標準.政務數據 數據分類分級指南(DB51/T30562023).32湖北省地方標準.公共數據資源開放第 2 部分:
272、分類分級指南1272024 云安全聯盟大中華區版權所有(DB4201/T677.22023).33黑龍江省地方標準.政務預公開數據分類分級評估指南(DB23/T35102023).34國家標準化管理委員會.證券期貨業數據安全風險防控數據分類分級指引(GB/T42775-2023).35工業和信息化部.基礎電信企業數據分類分級方法(YD/T3813-2020).36工業和信息化部.電信網和互聯網數據分類分級技術要求與測試方法(YD/T4244-2023).37國家標準化管理委員會.信息安全技術 健康醫療數據安全指南(GB/T39725-2020).38健康醫療數據安全指南.39廣東省地方標準.高
273、校數據安全分類分級指南(T/GDCSA 000-2022).40衛生健康委員會.衛生健康信息數據集分類和編碼規則(WS/T306-2023).41國家標準化管理委員會.智能制造工業數據分類原則(GB/T 42128-2022).42DATA CLASSIFICATION PRACTICES.43國家標準化管理委員會.政務信息資源目錄體系第 4 部分:政務信息資源分類(GB/T 21063.4).44北京市地方標準.政務數據分級與安全保護規范(DB11/T 1918-2021).45重慶市地方標準.工業數據分類分級導則(DB50/T 1453-2023).46觀安觀智敏感數據發現軟件-產品手冊.47天融信數據分類分級系統-產品手冊.48山石網科數據安全綜合治理平臺-產品手冊.49大道云隱密數云資產保護系統-產品手冊.50神州數碼數據分類分級系統-產品手冊.51昂楷數據安全分類分級系統-產品手冊.52美創暗數據發現和分類分級系統(DDAC)-產品手冊.53明朝萬達 Chinasec(安元)智能數據治理平臺-產品手冊.54https:/ 2024云安全聯盟大中華區版權所有35