更新时间:2024-03-25
通过水印任务在数据中添加水印信息。当数据泄漏时,可以通过溯源水印信息,识别出数据是从哪个渠道泄漏的。
前提条件
水印任务需要使用到水印方案,如何创建和编辑水印方案,请参见导出水印方案和编辑水印方案(可选)。
操作步骤
- 在左侧导航栏,选择水印生成。
- 在水印生成列表页面,单击新建水印任务。
- 在新建水印任务对话框中,配置水印任务参数信息。
参数
|
说明
|
任务名称
|
设置水印任务名称。
|
数据源类型
|
选择需要生成水印的资产类型。
数据源类型支持关系型数据库、FTP、本地下载等。
|
水印方案
|
已经生成的水印方案,需要跟数据源类型对应。
关于水印方案,具体说明请参见导出水印方案和编辑水印方案(可选)。
|
目标源类型
|
添加水印后存储的目标源类型。
本地下载:需要配置文件类型和文件编码。
关系型数据库:需要配置目标源和模式关联。
FTP:需要配置目标源。
如果是关系型数据库或者FTP等,目标源需要在数据源管理页面创建,具体操作请参见添加数据源。
|
水印信息
|
在下拉栏中选择水印信息,如何创建水印信息请参见添加水印信息
|
任务参数
|
配置水印任务的具体任务参数,参数说明请参见表 12: 任务参数。
|
参数
|
说明
|
数据写入失败处理
|
对任务过程中因算法造成的数据异常进行处理。失败时会自动跳过。
|
调度任务
|
勾选并配置定时启动任务时间,定时任务配置后需要初始化任务。
单次调度:选择需要执行任务的日期和时间,仅执行一次。
周期调度:单击任务截止时间配置任务到期时间。单击cron表达式配置周期启动任务日期和时间。
|
每批处理数据量
|
设置后台每批次处理的数据量。
|
读写多线程
|
勾选是否读写多线程。设置任务使用的最大线程数。
默认读写多线程设置为1,线程数需要根据设备的硬件配置以及数据库侧的处理能力来设定。其下也可选择开启线程数智能调优。
当本地下载、FTP、HDFS等为目标源类型时,不需要配置读写多线程。
|
子任务并发
|
选择子任务并发处理的数量。
对于主任务中有多个子任务时,可以调大子任务并发数(子任务并发默认为1)。并发数调为2时,会有2个子任务同时进行。需要根据设备的硬件配置以及数据库侧的处理能力来设定。
|
表分片
|
选择表分片的数量。
对于数据量大的表会有优化处理作用,一般情况下并不用开启。
|
- 单击保存,完成水印任务创建。
- 返回到水印生成列表页面,找到目标任务并移动底部滚动条,在启停列单击 按钮。
操作结果
执行开始后,系统自动扫描数据源,您可以在页面查看扫描进度。
相关操作
后续您可以根据情况,在水印生成列表页面进行以下操作。
•单击目标任务名称,查看水印任务详情。
•单击编辑,修改水印任务配置参数。
•单击删除,删除不再需要执行的水印任务。
•单击任务报告,查看任务概览、执行情况、任务日志。