AIPaaS应用开发平台

AIPaaS应用开发平台是一款深信服的RAG方案,通过白盒化RAG,让用户透明化对应用进行效果评估和调优,并提供更全面的评估指标,辅助定位问题,让用户真正用上AI、用好AI
{{sendMatomoQuery("AIPaaS应用开发平台","版本功能说明")}}

版本功能说明

更新时间:2025-11-04

AIPAAS1.0.4版本新功能说明

小模型部署方案
1.0.4版本对于N卡不再出单卡部署包,只支持vgpu部署。需配套AICP使用2.1.0版本。通过自定义服务+vGPU方案进行部署;对于天数国产卡,只支持单卡部署包
 
支持VMWARE
新增VMware整机部署方案
 
直连数据库:
支持直连数据库。测试原结构化poc测试机准确率80%以上。推荐模型:Qwen2.5-72B-Instruct-GPTQ-INT4
 
知识增强优化:
在faq场景有5-8%效果提升(和数据集有关),非结构化场景无明显区别,问题中以关键词为中点的情况场景有效,物料、工业场景关键词多为相同的知识库效果不明显。推荐使用模型:Qwen2.5-7B、Qwen2.5-14B

 

AIPAAS产品效果说明

算法类型

复杂度划分

能力

现状

是否对外发布

非结构化检索

(pdf、doc、docx、txt)

简单

(答案来源于)单处纯文本

80%-90%





多处纯文本

中等

简单表格

50%-70%

多处文本+图

困难

多处文本+表

50%-60%

带合并单元格的表格

带文字图片

支持







不支持能力

图片理解(地形图、电路图、趋势图)

不支持

公式

不支持

页眉页脚

不支持

多处文本+公式

不支持

自由阅读顺序(类似报纸不规则板块)

不支持

注意事项

知识增强(生成问答对、概要)

支持(适合总结场景,不适合细节搜索场景)

结构化检索

(xlsx、xls、csv)

简单

单个属性查询(一格)

50%-70%






基本信息获取(一行)

单一条件筛选(一列)

中等

多行对比(多行)

简单统计(求和、平均、中位)

排序

多条件筛选(多列)

支持能力

单表查询

支持




列描述(列别名)

支持

不支持能力

多表组合查询

不支持

构建图表

不支持

合并单元格

不支持

多行标题

不支持

复杂计算(除简单统计外的其他)

不支持

数字列带单位

不支持

注意事项

结构化回复耗时

1、qwen-2.5的测试效果:百行以下10s内回复,千行以下20s内回复,万行3min左右回复 。

2、deepseek 有推理能力,耗时会更长

3、excel 表格场景经验证,效果不好,不建议测试。

调用大模型次数

5次

适用场景

商品相关表格表现更好

依赖项

依赖模型能力,参数量越高效果越好

FAQ检索

简单

单个问题

80%-95%

中等

多个问题

受限于召回数量

注意事项

知识增强(生成相似问、答案的概要)

支持(相似问可以有效提升问题的命中率,概要适用于答案过长,不追究细节的场景)

数据库检索

支持能力

数据库类型

mysql

不支持能力

多轮对话

不支持

简单

单表查询

70%-90%

复杂

多表查询(bird数据集)

支持

评估

支持能力

非结构化(FAQ)RAG评估

80%-90%

结构化评估RAG评估

50%-70%

数据库RAG评估

80%~90%

Agent评估

不支持

简单应用评估(大模型评估)

不支持

注意事项

依赖项

依赖模型能力,参数量越高效果越好

评估耗时

一条案例(包含问题、回答和检索内容)评估时间在60s以内

调用大模型次数(不包含工作流)

3-7次