人工智能、大数据、云计算、物联网、移动互联等为代表的新一轮信息技术,创新型应该用不断出现和普及,带动信息技术快速向前发展,各类组织机构都在被信息技术带动着向前发展,驱动组织机构不断提升信息化程度。来自业务端的系统开发需求大量剧增,这对于开发测试所需的数据质量提出更严格的要求,生产数据用于开发测试将加剧敏感数据泄露的安全风险,但另一方面。国家及行业监管机构对于数据安全提出明确要求:用于开发测试的生产数据必须经过脱敏处理。这就带来了一系列的问题:
1、开发测试环境中是否使用生产数据?
2、其中的敏感数据是否有人在使用?谁在用?
3、这些敏感数据脱敏了吗?
4、面对行业监管,如何证明生产数据使用的合规性?
5、敏感数据的管理有效吗?是否可以持续开展?
6、敏感数据管理与开发测试工作是否有冲突?如何解决?
通过静态数据梳理技术自动发现开发测试环境中的敏感数据并实现清单化管理,包括:数据库分布在哪些IP网段、数据库类型、实例信息、表结构信息、源数据信息等。
通过动态梳理技术、是怎样的使用的,从而获知是否有开发测试账户使用了敏感数据,获取数据库访问源、访问对象、访问行为及返回值,对数据库访问流量进行解析,哪些用户或系统在使用哪些敏感数据。
将数据脱敏流程分解为敏感数据发现、敏感数据梳理、脱敏方案制定、脱敏任务执行四大步骤。实现全面的敏感数据管理,结合完善的敏感数据字典管理、数据发现算法管理、脱敏算法管理模块。
脱敏数据的高度仿真和关联关系保留,才能保证开发出的系统与现有系统的兼容性。所以需要保证脱敏后的数据能够准确反应原始数据的业务属性和数据分布特征,例如身份证号在多个表中出现,需保证脱敏后仍然能够保持原有的时间序列,保留原有的数据关系,需要保证脱敏后也是一样的,脱敏后的数据满足业务系统的数据关系特征,时间等序列关系的数据。