AIPaaS应用开发平台

关注
AIPaaS应用开发平台是一款深信服的RAG方案,通过白盒化RAG,让用户透明化对应用进行效果评估和调优,并提供更全面的评估指标,辅助定位问题,让用户真正用上AI、用好AI

安装前准备
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏

更新时间:2025-04-14

1.资源规划

  • AIPaaS平台主机资源要求如下:

CPU:12C

内存:24G

磁盘:总共600G,总共四块盘

  • GPU服务器的资源如下:

两台4090GPU服务器,每台配有8张4090显卡、CPU核数为128核、内存995G、硬盘为4.5T。

(3)SCP+SKE+AICP,参考AICP 部署方案。

2.部署网络规划

2.1 线上部署

AIPaaS的部署拓扑图如下,AIPaaS平台部署在VPC网络中,通过托管云上的公服网络访问GPU服务上的GPU服务器,外部访问AIPaaS平台,通过路由器中映射出来的业务出口来访问。

2.2 线下部署

线下部署方案,SCP+SKE+AICP+AIPaaS 。

网络部署,仅要求AIPaaS和 裸金属设备的业务网络打通即可,推荐经典网络部署,AIPaaS虚拟机直连物理出口即可,可以直接访问裸金属部署的模型服务即可。

 

3.部署环境与工具准备

3.1 部署环境准备

AIPaaS平台心部署要求超融合版本在680及以上版本,为了保障平台顺利部署,请提前规划好资源

3.2 部署工具准备

名称

用途

下载链接

AIPaaS用户手册V1.0.3

指导平台安装部署、基础功能使用。

 

 

 

 

https://support.sangfor.com.cn/productSoftware/list?product_id=218

AIPaaS安装镜像

用于安装AIPaaS平台的镜像

1卡方案部署脚本

AIPaaS用一张显卡资源的部署脚本

2卡方案部署脚本

AIPaaS用两张显卡资源的部署脚本(推荐)

小模型pentomino-models文件

部署AIPAAS的需要上传的小模型pentomino-models文件

小模型pdf2text文件

部署AIPAAS的需要上传的小模型pdf2text文件

部署pdf2text小模型的yaml文件

用于上传pdf2text小模型至AICP算力平台的yaml文件

部署pentomino-models小模型yaml文件

用于上传pentomino-models小模型至AICP算力平台的yaml文件

 

 

文档让我的问题处理变得简单了
选择标签:
更多意见:
手机号码:
如果未能解决您的问题,您可以使用 在线客服 寻求帮助
在线客服
文档让我的问题处理变得简单了