更新时间:2025-11-04
AIPAAS1.0.4版本新功能说明
小模型部署方案
1.0.4版本对于N卡不再出单卡部署包,只支持vgpu部署。需配套AICP使用2.1.0版本。通过自定义服务+vGPU方案进行部署;对于天数国产卡,只支持单卡部署包
支持VMWARE
新增VMware整机部署方案
直连数据库:
支持直连数据库。测试原结构化poc测试机准确率80%以上。推荐模型:Qwen2.5-72B-Instruct-GPTQ-INT4
知识增强优化:
在faq场景有5-8%效果提升(和数据集有关),非结构化场景无明显区别,问题中以关键词为中点的情况场景有效,物料、工业场景关键词多为相同的知识库效果不明显。推荐使用模型:Qwen2.5-7B、Qwen2.5-14B
AIPAAS产品效果说明
|
算法类型
|
复杂度划分
|
能力
|
现状
|
是否对外发布
|
|
非结构化检索
(pdf、doc、docx、txt)
|
简单
|
(答案来源于)单处纯文本
|
80%-90%
|
否
|
|
多处纯文本
|
|
中等
|
简单表格
|
50%-70%
|
|
多处文本+图
|
|
困难
|
多处文本+表
|
50%-60%
|
|
带合并单元格的表格
|
|
带文字图片
|
支持
|
是
|
|
不支持能力
|
图片理解(地形图、电路图、趋势图)
|
不支持
|
|
公式
|
不支持
|
|
页眉页脚
|
不支持
|
|
多处文本+公式
|
不支持
|
|
自由阅读顺序(类似报纸不规则板块)
|
不支持
|
|
注意事项
|
知识增强(生成问答对、概要)
|
支持(适合总结场景,不适合细节搜索场景)
|
|
结构化检索
(xlsx、xls、csv)
|
简单
|
单个属性查询(一格)
|
50%-70%
|
否
|
|
基本信息获取(一行)
|
|
单一条件筛选(一列)
|
|
中等
|
多行对比(多行)
|
|
简单统计(求和、平均、中位)
|
|
排序
|
|
多条件筛选(多列)
|
|
支持能力
|
单表查询
|
支持
|
是
|
|
列描述(列别名)
|
支持
|
|
不支持能力
|
多表组合查询
|
不支持
|
|
构建图表
|
不支持
|
|
合并单元格
|
不支持
|
|
多行标题
|
不支持
|
|
复杂计算(除简单统计外的其他)
|
不支持
|
|
数字列带单位
|
不支持
|
|
注意事项
|
结构化回复耗时
|
1、qwen-2.5的测试效果:百行以下10s内回复,千行以下20s内回复,万行3min左右回复 。
2、deepseek 有推理能力,耗时会更长
3、excel 表格场景经验证,效果不好,不建议测试。
|
|
调用大模型次数
|
5次
|
否
|
|
适用场景
|
商品相关表格表现更好
|
是
|
|
依赖项
|
依赖模型能力,参数量越高效果越好
|
|
FAQ检索
|
简单
|
单个问题
|
80%-95%
|
否
|
|
中等
|
多个问题
|
受限于召回数量
|
|
注意事项
|
知识增强(生成相似问、答案的概要)
|
支持(相似问可以有效提升问题的命中率,概要适用于答案过长,不追究细节的场景)
|
|
数据库检索
|
支持能力
|
数据库类型
|
mysql
|
|
不支持能力
|
多轮对话
|
不支持
|
|
简单
|
单表查询
|
70%-90%
|
|
复杂
|
多表查询(bird数据集)
|
支持
|
|
评估
|
支持能力
|
非结构化(FAQ)RAG评估
|
80%-90%
|
|
结构化评估RAG评估
|
50%-70%
|
|
数据库RAG评估
|
80%~90%
|
|
Agent评估
|
不支持
|
是
|
|
简单应用评估(大模型评估)
|
不支持
|
|
注意事项
|
依赖项
|
依赖模型能力,参数量越高效果越好
|
|
评估耗时
|
一条案例(包含问题、回答和检索内容)评估时间在60s以内
|
否
|
|
调用大模型次数(不包含工作流)
|
3-7次
|