AIPAAS1.0.4版本新功能说明

小模型部署方案

1.0.4版本对于N卡不再出单卡部署包，只支持vgpu部署。需配套AICP使用2.1.0版本。通过自定义服务+vGPU方案进行部署；对于天数国产卡，只支持单卡部署包

支持VMWARE

新增VMware整机部署方案

直连数据库：

支持直连数据库。测试原结构化poc测试机准确率80%以上。推荐模型：Qwen2.5-72B-Instruct-GPTQ-INT4

知识增强优化：

在faq场景有5-8%效果提升（和数据集有关），非结构化场景无明显区别，问题中以关键词为中点的情况场景有效，物料、工业场景关键词多为相同的知识库效果不明显。推荐使用模型：Qwen2.5-7B、Qwen2.5-14B

AIPAAS产品效果说明

算法类型	复杂度划分	能力	现状	是否对外发布
非结构化检索（pdf、doc、docx、txt）	简单	（答案来源于）单处纯文本	80%-90%	否
	简单	多处纯文本	80%-90%
	中等	简单表格	50%-70%
	中等	多处文本+图	50%-70%
	困难	多处文本+表	50%-60%
		带合并单元格的表格	50%-60%
		带文字图片	支持	是
	不支持能力	图片理解（地形图、电路图、趋势图）	不支持
		公式	不支持
		页眉页脚	不支持
		多处文本+公式	不支持
		自由阅读顺序（类似报纸不规则板块）	不支持
	注意事项	知识增强（生成问答对、概要）	支持（适合总结场景，不适合细节搜索场景）
结构化检索（xlsx、xls、csv）	简单	单个属性查询（一格）	50%-70%	否
		基本信息获取（一行）
		单一条件筛选（一列）
	中等	多行对比（多行）
		简单统计（求和、平均、中位）
		排序
		多条件筛选（多列）
	支持能力	单表查询	支持	是
	支持能力	列描述（列别名）	支持
	不支持能力	多表组合查询	不支持
		构建图表	不支持
		合并单元格	不支持
		多行标题	不支持
		复杂计算（除简单统计外的其他）	不支持
		数字列带单位	不支持
	注意事项	结构化回复耗时	1、qwen-2.5的测试效果：百行以下10s内回复，千行以下20s内回复，万行3min左右回复。 2、deepseek 有推理能力，耗时会更长 3、excel 表格场景经验证，效果不好，不建议测试。
		调用大模型次数	5次	否
		适用场景	商品相关表格表现更好	是
		依赖项	依赖模型能力，参数量越高效果越好	是
FAQ检索	简单	单个问题	80%-95%	否
	中等	多个问题	受限于召回数量
	注意事项	知识增强（生成相似问、答案的概要）	支持（相似问可以有效提升问题的命中率，概要适用于答案过长，不追究细节的场景）
数据库检索	支持能力	数据库类型	mysql
	不支持能力	多轮对话	不支持
	简单	单表查询	70%-90%
	复杂	多表查询（bird数据集）	支持
评估	支持能力	非结构化（FAQ）RAG评估	80%-90%
		结构化评估RAG评估	50%-70%
		数据库RAG评估	80%~90%
		Agent评估	不支持	是
		简单应用评估（大模型评估）	不支持
	注意事项	依赖项	依赖模型能力，参数量越高效果越好
		评估耗时	一条案例（包含问题、回答和检索内容）评估时间在60s以内	否
		调用大模型次数（不包含工作流）	3-7次	否

深信服自助服务平台

AIPaaS应用开发平台

版本功能说明 更新时间：2025-11-04

版本功能说明
更新时间：2025-11-04