【数据脱敏介绍】
数据脱敏是采用专门的脱敏算法对敏感数据进行变形、屏蔽、替换、随机化、加密,将敏感数据转化为虚构数据,隐藏了真正的隐私信息,为数据的安全使用提供了基础保障。同时脱敏后的数据可以保留原有数据的特征和分布,无需改变相应的业务系统逻辑,实现了企业低成本、高效率、安全的使用生产的隐私数据。
【数据脱敏处理方法】
数据脱敏处理方式一:替代
用伪装数据完全替换源数据中的敏感数据,一般替换用的数据都有不可逆性,以保证安全。替代是最常用的数据脱敏方法,具体操作上有常数替代(所有敏感数据都替换为唯一的常数值)、查表替代(从中间表中随机或按照特定算法选择数据进行替代)、参数化替代(以敏感数据作为输入,通过特定函数形成新的替代数据)等。具体选择的替代算法取决于效率、业务需求等因素间的平衡。替代方法能够彻底的脱敏单类数据,但往往也会使相关字段失去业务含义,对于查表替代而言,中间表的设计非常关键。
数据脱敏处理方式二:混洗
主要通过对敏感数据进行跨行随机互换来打破其与本行其他数据的关联关系,从而实现脱敏。混洗可以在相当大范围内保证部分业务数据信息(如有效数据范围、数据统计特征等),使脱敏后数据看起来跟源数据更一致,与此同时也牺牲了一定的安全性。一般混洗方法用于大数据集合、且需要保留待脱敏数据特定特征的场景;对于小数据集,混洗形成的目标数据有可能通过其他信息被还原,在使用的时候需要特别慎重。
数据脱敏处理方式三:数值变换
对数值和日期类型的源数据,通过随机函数进行可控的调整(例如对于数值类型数据随机增减20%;对于日期数据,随机增减200天),以便在保持原始数据相关统计特征的同时,完成对具体数值的伪装。数值变化通过调整变动幅度可以有效控制目标数据的统计特征和真实度,是常用的脱敏方法。
数据脱敏处理方式四:加密
对待脱敏数据进行加密处理,使外部用户只看到无意义的加密后数据,同时在特定场“云计算与大数据”专题192015年第13期景下,可以提供解密能力,使具有密钥的相关方可以获得原数据。加密的方法存在一定的安全风险(密钥泄露或加密强度不够);加密本身需要一定的计算能力,对于大数据集来源会产生很大资源开销;一般加密后数据与原始数据格式差异较大,“真实性”较差。一般情况下,加密的数据脱敏方式应用不多。
数据脱敏处理方式五:遮挡
对敏感数据的部分内容用掩饰符号(如“x、*”)进行统一替换,从而使得敏感数据保持部分内容公开。这种方法可以在很大程度上脱敏的同时,保持原有数据感观,也是一种广泛使用的方法。
数据脱敏处理方式六:空值插入/删除
直接删除敏感数据或将其置为null值。
【数据脱敏处理工具】
数据脱敏处理工具可自动识别敏感数据和管理敏感数据,并提供灵活的策略和脱敏方案配置,高效可并行的脱敏能力,帮助企业快速实施敏感静态数据脱敏处理,同时保证数据的有效性和可用性,使脱敏后的数据能够安全的应用于测试、开发、分析,和第三方使用环境中,数据脱敏工具主要有静态数据脱敏及动态数据脱敏两种:
一、静态数据脱敏处理
1、单服务器部署
静态数据脱敏将连接业务部门的生产数据库,对生产数据进行抽取和静态数据脱敏,脱敏后的数据输出到测试部门的测试数据库中,供测试部门使用数据。
2、成对服务器部署
静态数据脱敏在业务部门数据出口及测试部门数据入口分别部署脱敏服务器,可将业务部门的数据进行有效隔离,通过offline的方式,满足测试部门使用业务部门脱敏后数据的需求。
二、动态数据脱敏处理
网络上并联接入动态数据脱敏系统,客户端逻辑连接动态脱敏设备地址,动态脱敏设备转发流量到数据库服务器。
试用申请