AICP算力平台

AICP面向用户提供一站式大模型开发和推理服务,覆盖大模型开发和部署的全流程,包括从数据接入、模型训练、模型管理、模型压缩、模型加密、模型推理的全流程。
点击可切换产品版本
知道了
不再提醒
1.0.0
{{sendMatomoQuery("AICP算力平台","填写LLD文档")}}

填写LLD文档

更新时间:2024-09-04

功能简介

  1. 填写前要根据场景下载对应的LLD模板,不是训练场景随意下载一种即可,训练场景只能获取对应的LLD配置表
  2. LLD模板有很多表格,init-network工具只会解析管理、业务、存储、高性能网络、DNS和静态路由几个表格,其他表格不会进行识别解析

填写管理网IP

说明:LLD的网络字段配置需依赖管理IP,所以此处填写的管理IP需已完成配置并各节点连通

必填字段:IP、掩码位数、物理网口名称

可选字段:VLAN ID、聚合模式、默认网关、MTU

字段名

格式

是否必填

默认值

IP

ipv4

NA

VLAN ID

2-4095

0

掩码位数

0-32

NA

物理网口名称

英文逗号隔开的网口名

NA

聚合模式

枚举

轮询(静态聚合)
主备(静态聚合)
二层负载(静态聚合)
三层负载(静态聚合)
四层负载(静态聚合)
二层负载(LACP
三层负载(LACP
四层负载(LACP

主备(静态聚合)

默认网关

ipv4

MTU

700-9000

1500

业务网络规划

如业务和管理复用,此时物理网口名称、IP、掩码、聚合模式、网关、VLAN IDMTU和管理口填写一样即可,否则按如下介绍进行填写

IP、掩码位数、物理网口名称字段必填,其他字段可选。

物理网口名称:多个网口使用英文逗号连接。

如果不填则会配置默认值:

聚合模式:二层负载(静态)

默认网关:null

字段名

格式

是否必填

默认值

IP

ipv4

NA

VLAN ID

2-4095

0

掩码位数

0-32

NA

物理网口名称

英文逗号隔开的网口名

NA

聚合模式

枚举

轮询(静态聚合)
主备(静态聚合)
二层负载(静态聚合)
三层负载(静态聚合)
四层负载(静态聚合)
二层负载(LACP
三层负载(LACP
四层负载(LACP

二层负载(静态聚合)

默认网关

ipv4

MTU

700-9000

1500

存储网络规划(可选)

填写规则同业务网,但是可选。

不配置的场景,要把所有的行都删除

参数网络规划

注:训练场景必须配置参数面网络,推理场景不需要配置


配置完参数网络之后上层业务才能够部署RDMA插件,才能跑训练任务。

华为RoCE设备

npu0npu1等都是填写ip的列。

npux表示第xrdma网卡。

不配置的场景,要把所有的行都删除

字段名

格式

是否必填

默认值

NPUx

ipv4

NA

NPUx_detectIP

ipv4

NA

掩码位数必填。

类型必填ascend,模板已填写无需修改。

参数面网络额外配置:

仅华为RoCE场景需要配置,其他场景不用配置。

DSCP:交换机配置,默认配置,不用修改。

PFC优先级队列:交换机PFC队列,无需修改。

NPU IP子网掩码位数:NPU网络子网掩码 0-32.

MTU:网卡MTU数值:700-9000

英伟达IB设备

:不划分IB分区的场景

仅填写服务器名称和类型字段,其他空不用填。

类型ib服务器名称复制之前表格的名称就ok

:有划分IB分区的场景

类型ib服务器名称复制之前表格的名称就ok

额外的pkey填写的ibx对应的列是pkey,范围是0x0000-0xffff(不包含0x8000这个特殊值)

不需要配置pkey的场景,内容置为空,但是第一列服务器名称要保留,用于给ib网卡打上参数网标签

天数天垓设备

对应天数天垓设备,要填充物理网口名称和参数面网段

物理网口名:填上对应的高性能网卡名称,如果有多个需要另开一列填写。

参数面网段:参数面网络互相通信的网段,同一个序号的网段都要一致,比如网段1都一致,网段2和网段1不一样。

类型:指明参数面类型,天数天垓场景用ROCE(模板已经填充,无需修改)。

静态路由规划(可选)

目的地址: ipv4网络地址,确定的网络地址不用填写具体的ip地址

掩码位数:0-32

网关地址:具体的ipv4地址

有需要就填没有就置空,不要冲突。

不配置的场景,要把所有的行都删除,包含第一列序号,不要只填序号不填写其他列。

IMG_270

DNS路由规划

按顺序填入序号和目的地址,最多2个。

不配置的场景,要把所有的行都删除

IMG_271