更新时间:2024-03-22
配置敏感数据发现任务
在执行敏感数据发现任务前,您需要先配置敏感数据扫描任务信息,设置需要扫描的数据表、数据类型等信息。
• 背景信息
请确认已添加数据资产,并设置好相关敏感数据类型与脱敏算法。详见添加数据源与敏感数据和算法。
• 操作步骤
- 在左侧导航栏,选择敏感数据发现 > 敏感数据扫描。
- 在敏感数据扫描列表页面,找到目标资产,单击配置。
- 在任务配置对话框中,配置敏感数据发现任务。
参数
|
说明
|
抽样扫描
|
是否开启抽样扫描功能,默认开启。
抽样扫描,指从数据集合中抽取一定数量的数据进行识别。
注意: 关闭抽样扫描,会导致扫描效率低下。文件抽样扫描可能导致获取字段长度不准确,从而使文件到库数据插入失败。
|
抽样数量
|
设置抽样数量。
抽样越多,识别越精准;抽样越少,扫描速度越快。
|
最大线程数
|
设置任务使用的最大线程数。最大线程数默认为8,可通过修改配置文件进行设置。配置的线程数不要大于CPU核心数的两倍。
敏感数据发现任务可以使用多线程,线程数越多,扫描效率越高,同时占用的设备资源也越多。
|
扫描模式选择
|
选择按表扫描或按模式扫描
|
选择模式
|
根据选择的扫描模式,选择要扫描的模式或表。
在左侧的可选择的模式选中目标模式,单击>按钮,移动到已选中的模式。
若按表扫描,则继续进行选表操作。
|
行数统计方式
|
设置行数统计方式,有以下三种:
–不统计:不统计行数。
–count:扫描耗时较长,统计数值比较精确。
–估算:扫描速度较快,统计数值为估算值。
|
定时扫描
|
设置特定时间执行扫描任务。
|
自动生成方案
|
若勾选该项,则根据敏感数据选择栏目的设置,自动生成相应脱敏方案,并可在数据脱敏方案页面查看。
否则只执行敏感数据发现任务。
|
是否导出(入)列名
|
–是否导出列名:针对数据库到文件的分发方式。
若勾选该项,则数据库脱敏导出到文件后的数据第一行将显示列名。
–是否导入列名:针对文件到数据库的分发方式。
若勾选该项,文件第一行数据将作为列名显示,不进行脱敏处理。否则,若第一行数据与脱敏数据类型匹配,将进行脱敏处理。
|
最低匹配率
|
设置最低匹配率,敏感数据匹配率低于最低匹配率的列将默认设置为没有敏感数据类型。
|
敏感数据选择
|
在下拉栏中选择静态模板,选中后会扫描模板中设置的数据类型。
如果选择不使用模板,则在需要发现的数据类型中手动设置需要扫描的数据类型及其对应脱敏算法。
|
需要发现的数据类型
|
在敏感数据类型选择为不使用模板时,手动选中需要扫描的数据类型及其对应脱敏算法。
若选择使用模板,也可在此栏对脱敏算法进行修改,且敏感数据选择变为不使用模板。
|
- 单击保存,完成敏感数据任务配置。
• 相关操作
配置完成后,您可以执行敏感数据发现任务,系统自动扫描敏感数据。具体操作,请参见执行敏感数据发现任务。
执行敏感数据发现任务
通过执行敏感数据发现任务,自动发现数据资产中的敏感数据信息。
• 操作步骤
- 在左侧导航栏,选择敏感数据发现 > 敏感数据扫描。
- 在敏感数据扫描列表页面,找到目标数据资产,单击按钮。
执行开始后,系统自动扫描识别敏感数据。扫描时间与需要扫描的数据量有关,您可以在页面查看扫描进度。
• 操作结果
执行完成后,任务状态显示为扫描完成。
•若数据源结构发生变动,资产类型名称旁出现提示。
•若数据源新增或发生更新,资产类型名称旁出现提示。
查看任务执行结果
执行敏感数据发现任务,系统会扫描并识别数据资产中的敏感数据。您可以在执行结果中查看具体的敏感数据信息。
• 操作步骤
- 在左侧导航栏,选择敏感数据发现 > 敏感数据扫描。
- 在敏感数据扫描列表页面,找到目标数据资产,单击查看。
- 在敏感数据扫描详情列表页面,查看扫描全部结果。
参数
|
说明
|
资产名称
|
敏感数据所在的数据资产名称。
|
模式
|
敏感数据所在的模式。
|
表名
|
敏感数据所在的表名。
|
表列数
|
敏感数据所在的表的列数。
|
表行数
|
敏感数据所在的表的行数。
|
发现时间
|
敏感数据发现时间。
|
- 如果您需要修改扫描结果,请单击编辑。
- 在发现结果页面,修改扫描结果的数据类型(如修改为组合数据类型,以便进行组合数据类型脱敏。),或进行数据预览操作。
参数
|
说明
|
列名
|
数据所在的列名。
|
字段类型
|
数据被识别的数据类型。
|
字段长度
|
数据字段长度。
|
命中率
|
敏感数据被发现的命中率。若匹配多个结果,命中率为匹配率总和。
|
匹配结果
|
数据与内置敏感数据类型或自定义数据类型的匹配率。
|
数据类型
|
扫描发现的敏感数据类型,可进行手动修改。包括内置敏感数据类型、自定义数据类型和组合数据类型。
|
- 单击保存。
• 相关操作
敏感数据发现后,您还可以导出结果到数据子集和生成脱敏方案,详情参见导出任务结果到数据子集与导出任务结果到脱敏方案。