更新时间:2024-09-04
参数解释
- check- connect 指定初始化完成之后进行连通性探测,包含业务口、存储口和参数口探测。
-fusion-mgmt-underlay 是否管理和业务口复用
-log 指定log是打印到日志还是打印到控制台,只针对本地log生效
-mode 从lld文档初始化时,只初始化本地还是整个集群
-output lld转化的中间文件路径,需要和parse-only配合使用
-parse-only 只进行转换不进行初始化配置,需要和excel-path配合使用
-yaml-path 从yaml配置进行初始化而不是lld文档
-excel-path 指定lld文档路径
-mode 指定配置是集群初始化还是只初始化本机
- 初始化集群命令:
init-network -excel-path /sf/configs/ascend.xls
说明:
C86 天数 RoCE场景,
C86容器网络需求:训练场景,要求接在同一个GPU上面的高性能网卡顺序要相同
比如:集群里所有0-7号GPU连接的CX6网卡名称都是eth8,8-15号GPU连接的网卡名称都是eth9.
init-network检查逻辑:
节点0-7号GPU连接的CX6网卡名称都一致,如果不一致,init-network会打印是否马上调整网卡顺序的提示,输入Y加回车自动对网口顺序进行调整。
- 仅初始化本地配置
init-network -excel-path /sf/configs/ascend.xls -mode local
- 仅解析LLD模板文件生成yaml配置,不进行网络配置。
init-network -excel-path /sf/configs/ascend.xls -parse-only
- 仅解析LLD文档,并输出到指定目录
说明:如是管理和业务复用的场景,需要额外添加参数-fusion-mgmt-underlay
举例:
init-network -excel-path /sf/configs/ascend.xls -fusion-mgmt-underlay