什么是數據脫敏
數據脫敏,又稱為數據混淆、數據漂白和數據變形,是采用特定的脫敏規則或者算法對原始數據(字符或其他數據)進行修改或隱藏的過程。對數據字段使用數據脫敏的主要目的是為了保護個人可識別隱私信息的數據、敏感個人數據或商業敏感數據。

數據脫敏的技術原則
有效性:經過數據脫敏的操作后,攻擊者失去了獲取敏感信息的渠道,提升了竊取敏感信息的難度,從而保證了敏感數據的安全性。
真實性:盡可能地真實體現數據的特征(數據結構特征和數據統計特征)。也就是說,在數據中保留盡可能多的有意義的信息,并保留數據之間的原始數據格式、類型、依賴關系和特征。
高效性:一般通過自動化手段完成需要多次執行的環節,提高效率。
穩定性:在原始數據不變的條件下,脫敏操作執行的次數對最終結果是沒有影響。
數據脫敏類型
一般的脫敏規則根據脫敏后的數據能否恢復,可以分為可恢復脫敏規則和不可恢復脫敏規則??苫謴蛿祿撁粢巹t是指可以將脫敏數據以某種方式,恢復為原始敏感數據。不可恢復的數據脫敏規則意味著無論使用哪種方法,脫敏數據都無法恢復為原始敏感數據。
數據脫敏根據環境的不同,分為靜態數據脫敏(Static Data Masking,SDM)與動態數據脫敏(Dynamic Data
Masking,DDM)。SDM
主要用于在不公開敏感信息的情況下為應用程序的開發和測試提供高質量(即逼真的)數據,它使開發人員和測試團隊能夠更有效地在開發周期的早期識別缺陷,從而降低成本并提高整體質量。DDM
主要用于為數據庫或者應用程序提供基于角色的(對象級)安全保障。
數據脫敏的常用方法
泛化:泛化是指使用通用值替換生產數據,以便保留生產數據的局部特征,因此泛化后的數據是不可逆的。泛化方法包括數字和日期偏移取整、規整(根據大小將數據規整為多個預定義的檔位)、區間(將數據用區間表示,不顯示真實的數據)等。
抑制:是指隱藏生產數據信息的一部分,以實現數據值的轉換,這是一種隱藏技術,一般通過使用掩碼實現。
擾亂:是指將噪聲添加到生產數據中,對數據進行擾動,從而導致生產數據失真和更改。生產數據經過擾動后,其分布特性保持不變。擾亂方法包括重排、替換、均質化、散列等。
更多互聯網行業數據安全相關知識,敬請關注三個皮匠報告行業知識欄目。
推薦閱讀
《2020BCS-北京網絡安全大會:數據安全法規及標準建設.pdf》
《賽迪智庫:數據安全治理白皮書(35頁).pdf》