AICP算力平台

AICP面向用户提供一站式大模型开发和推理服务,覆盖大模型开发和部署的全流程,包括从数据接入、模型训练、模型管理、模型压缩、模型加密、模型推理的全流程。
点击可切换产品版本
知道了
不再提醒
1.0.0
{{sendMatomoQuery("AICP算力平台","初始化配置")}}

初始化配置

更新时间:2024-09-04

参数解释

 - check- connect 指定初始化完成之后进行连通性探测,包含业务口、存储口和参数口探测。

-fusion-mgmt-underlay 是否管理和业务口复用

-log 指定log是打印到日志还是打印到控制台,只针对本地log生效

-mode lld文档初始化时,只初始化本地还是整个集群

-output lld转化的中间文件路径,需要和parse-only配合使用

-parse-only 只进行转换不进行初始化配置,需要和excel-path配合使用

-yaml-path yaml配置进行初始化而不是lld文档

-excel-path 指定lld文档路径

-mode 指定配置是集群初始化还是只初始化本机

  1. 初始化集群命令:

init-network -excel-path /sf/configs/ascend.xls

说明:

C86 天数 RoCE场景,

C86容器网络需求:训练场景,要求接在同一个GPU上面的高性能网卡顺序要相同

比如:集群里所有0-7号GPU连接的CX6网卡名称都是eth8,8-15号GPU连接的网卡名称都是eth9.

init-network检查逻辑:

节点0-7号GPU连接的CX6网卡名称都一致,如果不一致,init-network会打印是否马上调整网卡顺序的提示,输入Y加回车自动对网口顺序进行调整。

  1. 仅初始化本地配置

init-network -excel-path /sf/configs/ascend.xls -mode local

  1. 仅解析LLD模板文件生成yaml配置,不进行网络配置。

init-network -excel-path /sf/configs/ascend.xls -parse-only

  1. 仅解析LLD文档,并输出到指定目录

说明:如是管理和业务复用的场景,需要额外添加参数-fusion-mgmt-underlay

举例:

init-network -excel-path /sf/configs/ascend.xls -fusion-mgmt-underlay