更新时间:2024-09-04
功能简介
- 填写前要根据场景下载对应的LLD模板,不是训练场景随意下载一种即可,训练场景只能获取对应的LLD配置表
- LLD模板有很多表格,init-network工具只会解析管理、业务、存储、高性能网络、DNS和静态路由几个表格,其他表格不会进行识别解析
填写管理网IP
说明:LLD的网络字段配置需依赖管理IP,所以此处填写的管理IP需已完成配置并各节点连通
必填字段:IP、掩码位数、物理网口名称
可选字段:VLAN ID、聚合模式、默认网关、MTU
字段名 |
格式 |
是否必填 |
默认值 |
IP |
ipv4 |
是 |
NA |
VLAN ID |
2-4095 |
否 |
0 |
掩码位数 |
0-32 |
是 |
NA |
物理网口名称 |
英文逗号隔开的网口名 |
是 |
NA |
聚合模式 |
枚举 轮询(静态聚合) 主备(静态聚合) 二层负载(静态聚合) 三层负载(静态聚合) 四层负载(静态聚合) 二层负载(LACP) 三层负载(LACP) 四层负载(LACP) |
否 |
主备(静态聚合) |
默认网关 |
ipv4 |
否 |
无 |
MTU |
700-9000 |
否 |
1500 |
业务网络规划
如业务和管理复用,此时物理网口名称、IP、掩码、聚合模式、网关、VLAN ID和MTU和管理口填写一样即可,否则按如下介绍进行填写
IP、掩码位数、物理网口名称字段必填,其他字段可选。
物理网口名称:多个网口使用英文逗号连接。
如果不填则会配置默认值:
聚合模式:二层负载(静态)
默认网关:null
字段名 |
格式 |
是否必填 |
默认值 |
IP |
ipv4 |
是 |
NA |
VLAN ID |
2-4095 |
否 |
0 |
掩码位数 |
0-32 |
是 |
NA |
物理网口名称 |
英文逗号隔开的网口名 |
是 |
NA |
聚合模式 |
枚举 轮询(静态聚合) 主备(静态聚合) 二层负载(静态聚合) 三层负载(静态聚合) 四层负载(静态聚合) 二层负载(LACP) 三层负载(LACP) 四层负载(LACP) |
否 |
二层负载(静态聚合) |
默认网关 |
ipv4 |
否 |
无 |
MTU |
700-9000 |
否 |
1500 |
存储网络规划(可选)
填写规则同业务网,但是可选。
不配置的场景,要把所有的行都删除
参数网络规划
注:训练场景必须配置参数面网络,推理场景不需要配置
配置完参数网络之后上层业务才能够部署RDMA插件,才能跑训练任务。
华为RoCE设备
npu0、npu1等都是填写ip的列。
npux表示第x号rdma网卡。
不配置的场景,要把所有的行都删除
字段名 |
格式 |
是否必填 |
默认值 |
NPUx |
ipv4 |
是 |
NA |
NPUx_detectIP |
ipv4 |
是 |
NA |
掩码位数必填。
类型必填ascend,模板已填写无需修改。
参数面网络额外配置:
仅华为RoCE场景需要配置,其他场景不用配置。
DSCP:交换机配置,默认配置,不用修改。
PFC优先级队列:交换机PFC队列,无需修改。
NPU IP子网掩码位数:NPU网络子网掩码 0-32.
MTU:网卡MTU数值:700-9000
英伟达IB设备
①:不划分IB分区的场景
仅填写服务器名称和类型字段,其他空不用填。
类型是ib,服务器名称复制之前表格的名称就ok
②:有划分IB分区的场景
类型是ib,服务器名称复制之前表格的名称就ok。
额外的pkey填写的ibx对应的列是pkey,范围是0x0000-0xffff(不包含0x8000这个特殊值)
不需要配置pkey的场景,内容置为空,但是第一列服务器名称要保留,用于给ib网卡打上参数网标签
天数天垓设备
对应天数天垓设备,要填充物理网口名称和参数面网段
物理网口名:填上对应的高性能网卡名称,如果有多个需要另开一列填写。
参数面网段:参数面网络互相通信的网段,同一个序号的网段都要一致,比如网段1都一致,网段2和网段1不一样。
类型:指明参数面类型,天数天垓场景用ROCE(模板已经填充,无需修改)。
静态路由规划(可选)
目的地址: ipv4网络地址,确定的网络地址不用填写具体的ip地址
掩码位数:0-32
网关地址:具体的ipv4地址
有需要就填没有就置空,不要冲突。
不配置的场景,要把所有的行都删除,包含第一列序号,不要只填序号不填写其他列。
DNS路由规划
按顺序填入序号和目的地址,最多2个。
不配置的场景,要把所有的行都删除