更新时间:2025-04-14
1.资源规划
CPU:12C
内存:24G
磁盘:总共600G,总共四块盘
两台4090GPU服务器,每台配有8张4090显卡、CPU核数为128核、内存995G、硬盘为4.5T。
(3)SCP+SKE+AICP,参考AICP 部署方案。
2.部署网络规划
2.1 线上部署
AIPaaS的部署拓扑图如下,AIPaaS平台部署在VPC网络中,通过托管云上的公服网络访问GPU服务上的GPU服务器,外部访问AIPaaS平台,通过路由器中映射出来的业务出口来访问。

2.2 线下部署
线下部署方案,SCP+SKE+AICP+AIPaaS 。
网络部署,仅要求AIPaaS和 裸金属设备的业务网络打通即可,推荐经典网络部署,AIPaaS虚拟机直连物理出口即可,可以直接访问裸金属部署的模型服务即可。
3.部署环境与工具准备
3.1 部署环境准备
AIPaaS平台心部署要求超融合版本在680及以上版本,为了保障平台顺利部署,请提前规划好资源
3.2 部署工具准备
名称 | 用途 | 下载链接 |
AIPaaS用户手册V1.0.3 | 指导平台安装部署、基础功能使用。 | https://support.sangfor.com.cn/productSoftware/list?product_id=218 |
AIPaaS安装镜像 | 用于安装AIPaaS平台的镜像 |
1卡方案部署脚本 | AIPaaS用一张显卡资源的部署脚本 |
2卡方案部署脚本 | AIPaaS用两张显卡资源的部署脚本(推荐) |
小模型pentomino-models文件 | 部署AIPAAS的需要上传的小模型pentomino-models文件 |
小模型pdf2text文件 | 部署AIPAAS的需要上传的小模型pdf2text文件 |
部署pdf2text小模型的yaml文件 | 用于上传pdf2text小模型至AICP算力平台的yaml文件 |
部署pentomino-models小模型yaml文件 | 用于上传pentomino-models小模型至AICP算力平台的yaml文件 |