纷享销客AI大模型服务计费说明

一、算粒说明

纷享接入了市面上主流的大模型,由于各厂商提供的模型刊例价不同,纷享销客使用算粒作为AI平台的统一计费单位,1算粒 = 0.10元人民币

二、计费规则

在使用过程中(对话、工作流、开发、调试等),会根据实际资源消耗(即背后的 token 资源)自动扣除一定额度。额度消耗取决于以下几项:

三、算粒消耗估算方法

1. Agent执行估算

Agent执行一次(一问一答)的总算粒=意图识别消耗算粒+所有提示词模板消耗算粒+所有AI操作消耗的算粒+最终内容整合输出消耗的算粒
  • 模型相关的估算
原则上要估算输入和输出的token,意图识别和最终内容整合必须进行估算,提示词模板按照agent编排配置的实际情况进行估算。
各阶段算粒数=输入字符数*字符token转换比例(中文按1.2,英文按1.3)
  • 意图识别:输入内容一般为用户在Agent输入框下达的指令,字符数一般不会超200字;输出为Agent所要执行的技能及操作,字符数也不会太大,可按1000token进行估算。
  • 最终内容整合:输入内容一般为Agent执行中所有执行的操作输出的总和,可直接估算其字符数,输出一般为用户指令的内容
  • 提示词模板:输入内容为提示词模板中配置的场景变量预期承接的内容,可根据变量含义估算字符数,输出为模板中定义的输出内容
  • AI操作估算:
先拆解一次用户指令会执行多少AI操作,然后基于复杂度参考消耗区间进行估算,AI操作消耗如下
AI操作消耗估算(算粒/次)
互联网搜索0.5-1
创建对象数据类操作(创建客户、日程等)0.12-0.5
查询对象数据类操作0.3-1
知识库检索类操作0.2-0.4
文本解析成文字根据文件类型与文档分辨率动态使用解析模型,各模型计费如下: facishare-text-parse-economy:0.1算粒/页;facishare-doc-convert-economy 0.1 算粒/页; facishare-doc-parse-economy 0.2 算粒/页; facishare-vl-parse-economy 按Token计费,与文档分辨率正相关,0.01算粒/1k 输入,0.04算粒/1k 输出; facishare-doc-parse-s-balance 0.2 算粒/页; facishare-doc-parse-gigantic 0.6 算粒/页; facishare-asr-balance 0.004算粒/页; facishare-asr-s-balance 0.01算粒/页; facishare-doc-parse-balance 0.4算粒/页baidu-diff-latest 2算粒

2. Flow估算

基于Flow设计,识别Flow中使用的AI操作以及提示词模板,并估算个节点的算粒消耗
其中,Flow中提示词模板及AI操作的计费参考上表,与在agent中使用时的计费逻辑一致

3. RAG知识切片向量化入库

在使用知识库做智能问答或检索知识生成内容时,需要考虑知识切片向量化入库的成本,以及基于用户问题召回相关知识切片的成本。该过程的详细费用参考该文档进行估算https://365.kdocs.cn/l/caZSJg7Xkkrt
切片向量化入库:
文档:pdf文件0.1算粒/页
图片:0.1算粒/张

四、场景案例

以下额度消耗为正常使用的均值,仅作参考,实际使用中额度消耗量可能根据用户要求和任务复杂度而波动
场景估算案例使用模型预估算粒消耗
日常客服对话一问一答,智能客服检索知识库内容后回答问题deepseek-v3.20.3算粒
长文字摘要输入5万字,输出2000字deepseek-v31.4算粒
客户情报收集/洞察搜集工商信息、CRM信息、联网搜索信息对客户/企业做全方位洞察deepseek-v3.21.2算粒
周日报摘要总结一周10条销售记录deepseek-v3.20.1算粒
内容质检对销售填写的销售记录/外勤/商机跟进的内容质量进行质检,每次约输入300字deepseek-v30.06算粒
知识库问答deepseek-v30.4算粒/次
文件解析将文件转成文字并按要求摘要,普通精度要求,文件共10页,2万字,输出200字关键信息deepseek-v3.210*0.02+2*1.2*0.2+1.2*0.3*0.02=0.8算粒/次

五、模型费用

1. 百度文心一言

模型名称胜任场景上下文长度输入单价(元/百万token)输出单价(元/百万token)输入算粒消耗(算粒/百万token)输出算粒(算粒/百万token)
ERNIE 3.5系列内容生成8K0.802.008.0020.00
ERNIE 4.0系列推理&联网搜索8K4.0016.0040.00160.00
ERNIE 4.5系列推理&联网搜索8K4.0016.0040.00160.00

2. 阿里云

模型名称胜任场景上下文长度输入单价(元/百万token)输出单价(元/百万token)输入单价(算粒/百万token)输出单价(算粒/百万token)
qwen-turbo联网搜索输入128K/输出8K0.300.603.006.00
qwen-plus推理&联网搜索输入128K/输出8K0.802.008.0020.00
qwen-max推理&联网搜索输入32K/输出8K2.409.6024.0096.00
qwen3-235b内容生成输入128K/输出16K2.008.0020.0080.00
qwen3-30b内容生成输入126K/输出32K0.753.007.5030.00
qwen3.5-plus内容生成输入991K/输出64K0.804.808.0048.00
qwen3.5-397b-a17b内容生成输入254K/输出64K1.207.2012.0072.00
qwen-vl-plus视觉理解输入6K/输出2K1.504.5015.0045.00
qwen-vl-max视觉理解输入30K/输出2K3.009.0030.0090.00
qwen2.5-vl-32b视觉理解输入126K/输出8K8.0024.0080.00240.00
qwen3-vl-plus视觉理解输入252K/输出32K1.0010.0010.00100.00
deepseek-v3内容生成输入57K/输出8K2.008.0020.0080.00
deepseek-v3.1内容生成输入96K/输出64K4.0012.0040.00120.00
deepseek-v3.2内容生成输入96K/输出64K2.003.0020.0030.00
deepseek-r1推理输入57K/输出8K4.0016.0040.00160.00

3. 腾讯混元

模型名称胜任场景上下文长度输入单价(元/百万token)输出单价(元/百万token)输入单价(算粒/百万token)输出单价(算粒/百万token)
qwen-image图片生成--25.00-250.00
qwen-image-plus图片生成--20.00-200.00
qwen-image-edit图片生成--30.00-300.00
Hunyuan-Standard内容生成&联网搜索输入30K/输出2K0.802.008.0020.00
hunyuan-pro内容生成输入28K/输出4K30.00100.00300.001000.00
hunyuan-large内容生成输入28K/输出4K4.0012.0040.00120.00
hunyuan-turbo内容生成&联网搜索输入28K/输出4K2.409.6024.0096.00
deepseek-v3内容生成64K2.008.0020.0080.00
deepseek-r1推理64K4.0016.0040.00160.00

4. 字节跳动豆包

模型名称胜任场景上下文长度输入单价(元/百万token)输出单价(元/百万token)输入单价(算粒/百万token)输出单价(算粒/百万token)
Doubao-Pro-4k内容生成4K0.802.008.0020.00
Doubao-Pro-32k内容生成32K0.802.008.0020.00
deepseek-v3内容生成输入57K/输出8K2.008.0020.0080.00
deepseek-v3.1内容生成输入96K/输出32K4.0012.0040.00120.00
deepseek-v3.2内容生成输入96K/输出32K2.003.0020.0030.00
Doubao-seed-2.0-pro内容生成256K3.2016.0032.00160.00
Doubao-seed-2.0-lite内容生成256K0.603.606.0036.00
Doubao-seed-2.0-mini内容生成256K0.202.002.0020.00

5. 智谱

模型名称胜任场景上下文长度输入单价(元/百万token)输出单价(元/百万token)输入单价(算粒/百万token)输出单价(算粒/百万token)
GLM-4-Flash内容生成-0.100.101.001.00
GLM-4-Air内容生成-0.500.505.005.00
GLM-4V-Plus视觉理解8K4.004.0040.0040.00

六、常见问题 FAQ

1. 输入和输出价格为什么不同?
输出 token 需要模型进行生成,计算量远大于输入 token 的理解处理,因此输出价格通常高于输入价格(约 2-4 倍)。
2. 多轮对话如何计费?
多轮对话中,历史记录(History)会作为输入参与计费。建议控制上下文长度以降低成本:
3. 如何估算 token 消耗?
文本类型估算方法
中文字数 × 1.2 ≈ token 数
英文单词数 × 1.3 ≈ token 数
4. 算粒和人民币如何换算?
1 算粒 = 0.10 元。例如:消耗 100 算粒 = 10 元

七、用量管理

1.如何查看每轮对话消耗的额度?

系统管理员按以下路径进行查看:管理后台-AI平台管理-调用统计
1. 如何控制成本?
方法说明
选择合适的模型简单任务使用低价模型,复杂任务使用高端模型
控制上下文长度限制历史对话轮数,避免上下文无限增长
优化提示词与指令精简输入内容,减少无效 token
批量处理合并多个小任务,减少调用次数
2. 为什么我的消耗这么快?
消耗快原因详细说明解决方案
使用高端模型Deepseek-r1、doubao seed2.0 pro等高端模型价格较高进行a/b test评估是否必须使用高端模型,评估是否有经济模型达到同样效果
上下文过长历史对话不断累积,每轮输入 token 增加定期重置会话,控制上下文长度
频繁调用高频调用导致累计消耗增加合并任务,减少调用次数
多轮推理循环即使简单任务也会触发多次"思考 → 行动 → 观察"循环,每轮都注入大量提示词与工具定义精简工具挂载,只保留当前任务所需工具;同时根据任务复杂度优化指令,避免AI进行不不要的动作规划和执行
2026-04-15
0 0