AICP算力平台

AICP面向用户提供一站式大模型开发和推理服务,覆盖大模型开发和部署的全流程,包括从数据接入、模型训练、模型管理、模型压缩、模型加密、模型推理的全流程。
点击可切换产品版本
知道了
不再提醒
1.0.0
AICP算力平台 文档 部署裸金属 配置存储 创建LVM(本地磁盘)
{{sendMatomoQuery("AICP算力平台","创建LVM(本地磁盘)")}}

创建LVM(本地磁盘)

更新时间:2024-09-04

功能简介

裸金属节点的本地磁盘需要虚拟化成统一卷组才能给AICP使用,本章节将介绍如何把本地磁盘虚拟化成LVM(卷组)

前提条件

1、裸金属预留好空闲可用的磁盘,推荐是SSD

2、SKE容器已完成裸金属集群纳管

操作步骤

  1. 登录SKE容器首页,按如下步骤开启SSH端口

  1. 初始化SKE的运维密码(root)。登录SCP云管平台,访问【计算】【容器服务】【设置】【远程维护】,找到容器服务运维密码,点击配置

IMG_256

  1. 输入当前登录用户密码,做身份验证

IMG_257

  1. 配置容器服务运维密码

IMG_258

  1. 使用xshellMobaxterm工具通过SKE的管理IP使用root账号登录SKE后台(运维密码+sangfornetwork)端口22345
  2. 登录SKE后台先执行命令:/sf/debug/ops-tools storage , 该命令会例出详细的样例,整个流程均依照参考该样例来进行

  1.  获取执行的集群 id kubectl get uicluster -A  第一步有打印命令, 可直接拷贝)

  1. 收集磁盘信息, 命令:/sf/debug/ops-tools storage collect-disk --cluster-id {集群 id}  第一步有打印命令, 可直接拷贝, 然后提充第二步查询的集群 id

  1. 如果用集群改了密码,则命令是这样的: /sf/debug/ops-tools storage collect-disk --cluster-id {集群 id}  --ssh-passwords '{"{节点名称}": "{节点密码}"}'

  1. 修改配置并确认配置, 命令: vi {上一步结果输出的路径} (第三步有提示,可直接拷贝)

修改配置文件,请遵守如下原则:
1. 配置确无误后将 config.confirm 改为 true
2. lvm_status 中的内容是从用户集群中真实采集上来的,用作展示,无需修改
3. lvm_template 中的内容表示要配置的目标,默认生成的配置一般无需修改,有特殊需求情况下才需要修改

在配置文件的头部有详细的字段说明如下:

① Vgs是把所有节点磁盘虚拟化后的卷组,所有磁盘的接口类型需一致,不包含系统盘外的可用磁盘均会统一虚拟化,如需去掉某个磁盘可在如下格式下进行删除

 pv_list:

                - /dev/nvme0n1

                - /dev/nvme1n1

② Lvs是基于vgs划分的目录,当前是固定划分成3个目录:

sf/data/appdata/aicp

/sf/data/appdata/localdata

/sf/data/appdata/logcenter

  1. 创建 lvm

 命令: /sf/debug/ops-tools storage create-user-cluster-lvm  --config {配置文件} (第三步有打印命令:可直接拷贝)

如果用集群改了密码,则命令是这样的:  /sf/debug/ops-tools storage create-user-cluster-lvm  --config {配置文件}  --ssh-passwords '{"{节点名称}": "{节点密码}"}'