豆包DoubaoAPI开发者调用配额和计费方式具体是怎样的,有收费吗?
- 内容介绍
- 文章标签
- 相关推荐
本文共计935个文字,预计阅读时间需要4分钟。
如果尝试调用``标签,内容如下:
一、豆包API是否收费
豆包API采用“后付费+预付费”双轨计费机制,所有模型调用均产生费用,不存在永久免费调用额度
1、新用户首次开通可获赠50万tokens试用额度,该额度仅限首次激活时发放,有效期为30天。
2、赠送额度消耗完毕后,系统自动切换至按量计费,从账户余额实时扣费。
立即进入“豆包AI人工智官网入口”;
立即学习“豆包AI人工智能在线问答入口”;
3、Lite系列模型单价最低,Pro系列、方舟模型及微调模型单价更高,且后三者不支持通用资源包抵扣,必须使用账户余额直接结算。
二、开发者调用配额限制
配额分为RPM(每分钟请求数)与TPM(每分钟Token数)双重限制,任一指标达上限即触发限流,不以总用量为判断依据。
1、豆包通用模型pro-32k的默认配额为10K RPM与800K TPM,以先达到者为准实施限流。
2、国内其他主流模型TPM普遍为100K–300K,RPM为60–120;轻量级模型RPM虽可达300–500,但TPM仍显著低于豆包。
3、通过火山引擎控制台可申请提升配额,企业认证用户可提交工单申请更高RPM/TPM限额,并支持按月订购并发QPS增购服务。
三、后付费计费方式详解
后付费按小时出账,费用基于实际调用量实时累计,适用于用量波动较大的开发测试阶段。
1、费用计算公式为:总费用 = ∑(各模型调用量 × 该模型按量单价) - ∑(资源包抵扣量 × 资源包内单价)
2、账单延迟数小时生成,需确保账户余额充足,否则将导致API调用中断。
3、阶梯计费按天累进:例如单日调用1200千次语音识别,费用按300×3.5 + (1000−300)×3 + (1200−1000)×2.4 = 3630元计算。
四、预付费资源包购买与使用
预付费资源包适用于用量稳定、可预期的生产环境,能显著降低单位token成本。
1、以豆包通用模型pro-32k为例,10K TPM包月价格为2000元,折合0.0046元/千Tokens
2、资源包有效期统一为1年,到期未用完额度自动作废,不支持延期或退款。
3、购买后在控制台“费用中心→资源包管理”中绑定应用,系统优先从资源包抵扣,超出部分转为后付费。
五、成本优化与配额管控策略
开发者可通过多维度手段主动控制调用成本与配额占用,避免非预期超支或限流。
1、启用流式输出(stream=True),减少长响应等待期间的token延迟浪费。
2、缩短prompt长度并显式设置max_tokens参数,防止模型生成冗余内容。
3、对高频低变场景(如固定问答模板)实施本地缓存,降低重复调用频次。
4、在代码中集成usage.total_tokens字段解析逻辑,实时监控单次调用token消耗。
5、配置预算告警阈值,在火山引擎控制台设置余额或用量超限通知,及时干预。
本文共计935个文字,预计阅读时间需要4分钟。
如果尝试调用``标签,内容如下:
一、豆包API是否收费
豆包API采用“后付费+预付费”双轨计费机制,所有模型调用均产生费用,不存在永久免费调用额度
1、新用户首次开通可获赠50万tokens试用额度,该额度仅限首次激活时发放,有效期为30天。
2、赠送额度消耗完毕后,系统自动切换至按量计费,从账户余额实时扣费。
立即进入“豆包AI人工智官网入口”;
立即学习“豆包AI人工智能在线问答入口”;
3、Lite系列模型单价最低,Pro系列、方舟模型及微调模型单价更高,且后三者不支持通用资源包抵扣,必须使用账户余额直接结算。
二、开发者调用配额限制
配额分为RPM(每分钟请求数)与TPM(每分钟Token数)双重限制,任一指标达上限即触发限流,不以总用量为判断依据。
1、豆包通用模型pro-32k的默认配额为10K RPM与800K TPM,以先达到者为准实施限流。
2、国内其他主流模型TPM普遍为100K–300K,RPM为60–120;轻量级模型RPM虽可达300–500,但TPM仍显著低于豆包。
3、通过火山引擎控制台可申请提升配额,企业认证用户可提交工单申请更高RPM/TPM限额,并支持按月订购并发QPS增购服务。
三、后付费计费方式详解
后付费按小时出账,费用基于实际调用量实时累计,适用于用量波动较大的开发测试阶段。
1、费用计算公式为:总费用 = ∑(各模型调用量 × 该模型按量单价) - ∑(资源包抵扣量 × 资源包内单价)
2、账单延迟数小时生成,需确保账户余额充足,否则将导致API调用中断。
3、阶梯计费按天累进:例如单日调用1200千次语音识别,费用按300×3.5 + (1000−300)×3 + (1200−1000)×2.4 = 3630元计算。
四、预付费资源包购买与使用
预付费资源包适用于用量稳定、可预期的生产环境,能显著降低单位token成本。
1、以豆包通用模型pro-32k为例,10K TPM包月价格为2000元,折合0.0046元/千Tokens
2、资源包有效期统一为1年,到期未用完额度自动作废,不支持延期或退款。
3、购买后在控制台“费用中心→资源包管理”中绑定应用,系统优先从资源包抵扣,超出部分转为后付费。
五、成本优化与配额管控策略
开发者可通过多维度手段主动控制调用成本与配额占用,避免非预期超支或限流。
1、启用流式输出(stream=True),减少长响应等待期间的token延迟浪费。
2、缩短prompt长度并显式设置max_tokens参数,防止模型生成冗余内容。
3、对高频低变场景(如固定问答模板)实施本地缓存,降低重复调用频次。
4、在代码中集成usage.total_tokens字段解析逻辑,实时监控单次调用token消耗。
5、配置预算告警阈值,在火山引擎控制台设置余额或用量超限通知,及时干预。

