【已解决】为什么 NewAPI 开关透传请求体的输入 tokens 会相差这么多?
- 内容介绍
- 文章标签
- 相关推荐
答案:Claude code 问一个hi,确实会耗费25000左右tokens,下图是直连openrouter的数据。(只是不大清楚为什么newapi开了透传请求之后tokens计数少了这么多)
image2042×890 47.6 KB
问题:
image1316×334 32.3 KB
渠道是 openrouter,模型是相同的sonnet。
具体操作是,在 Claude Code 里,先 /clear,然后问 hi。
结果:开启透传的输入 tokens 是 758,而关闭后却是 25452。
二者都没有缓存tokens。
还有一点区别是:
1、开启透传的没有转换请求格式,仍然是 Claude 格式
image1416×404 60.9 KB
2、开启透传的会转化为 openai 格式
image1450×416 66.9 KB
--【壹】--:
你可以new-api前面再接入一层 axonhub
这个可以看到请求体明细
应该还是你传的内容的问题
--【贰】--:
按理说如果你没特别设置过,它应该不会改你的请求体里的messages。不是很懂,但是它这个记录的token数是上游返回体里的usage部分。既然是openrouter上游,开启请求日志记录看看new api实际给你转发了什么吧。所有接触你请求的上游都有可能给你的请求插入了额外提示词,看看是不是你能控制的部分插入的吧,token统计我觉得出问题的概率应该不大。
--【叁】--:
感觉是兼容层在作妖,问个hi给你塞了半本上下文。~猜的
答案:Claude code 问一个hi,确实会耗费25000左右tokens,下图是直连openrouter的数据。(只是不大清楚为什么newapi开了透传请求之后tokens计数少了这么多)
image2042×890 47.6 KB
问题:
image1316×334 32.3 KB
渠道是 openrouter,模型是相同的sonnet。
具体操作是,在 Claude Code 里,先 /clear,然后问 hi。
结果:开启透传的输入 tokens 是 758,而关闭后却是 25452。
二者都没有缓存tokens。
还有一点区别是:
1、开启透传的没有转换请求格式,仍然是 Claude 格式
image1416×404 60.9 KB
2、开启透传的会转化为 openai 格式
image1450×416 66.9 KB
--【壹】--:
你可以new-api前面再接入一层 axonhub
这个可以看到请求体明细
应该还是你传的内容的问题
--【贰】--:
按理说如果你没特别设置过,它应该不会改你的请求体里的messages。不是很懂,但是它这个记录的token数是上游返回体里的usage部分。既然是openrouter上游,开启请求日志记录看看new api实际给你转发了什么吧。所有接触你请求的上游都有可能给你的请求插入了额外提示词,看看是不是你能控制的部分插入的吧,token统计我觉得出问题的概率应该不大。
--【叁】--:
感觉是兼容层在作妖,问个hi给你塞了半本上下文。~猜的

