更新时间:2024-09-04
背景信息
日志记录了模型服务运行过程中的关键信息和报错,是运维排障的主要参考信息。采集模型服务日志到前端可以方便用户或运维人员快速排障。
操作步骤
步骤1 登录AICP平台
步骤2 单击左侧导航栏的“模型服务”,进入模型推理管理页面
步骤3 选择对应的推理任务,单击任务名称,进入推理任务详情
步骤4 在推理任务详情,单击“日志”可查看推理任务的推理服务日志和组件日志
推理服务日志:
推理服务日志记录了模型服务实例运行中的关键信息(如启动参数、推理请求参数)和报错信息,可以看出模型推理的过程。
当模型推理效果不佳或者出错时,可以看这个日志进行排查。
组件日志:
组件日志主要记录了k8s管理模型服务生命周期的信息,主要是k8s的事件。可以详细看到模型服务从创建以来的生命周期变化。
当推理服务实例创建、扩容、删除失败时,可以通过组件日志排查原因