模型压力测试工具调研

2026-04-11 14:120阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

老板让调研一下业界有什么模型压力测试工具,我整理了一些,佬友们有无从事相关方向工作的?

类别 工具名称 核心支持指标 适配后端 / 推理框架 支持模型类型 归属 / 维护方 官方榜单
框架原生 vLLM Benchmark 首字速度、生成速度、总时延、吞吐量、并发能力 vLLM 原生,也能测 OpenAI 兼容接口 主流 LLM,部分 pooling 场景 vLLM 官方
框架原生 GuideLLM 更偏生产视角的压测;看 TTFT、ITL、总时延、吞吐拐点、SLO/SLA 是否达标 OpenAI 兼容服务、vLLM-native 主流 LLM,也支持多模态输入数据 vLLM 项目
框架原生 SGLang Bench 单批/服务压测、延迟、吞吐、Profiling 分析 SGLang 原生 LLM、VLM/多模态 SGLang 官方
框架原生 GenAI-bench 高并发下的 token 级性能测试;看吞吐、延迟、并发表现 OpenAI 兼容接口,常用于 SGLang 等服务 主流 LLM sgl-project 社区
框架原生 TGI Benchmark TGI 服务的吞吐、时延、不同 batch 配置下的性能变化 Hugg
阅读全文
标签:人工智能
问题描述:

老板让调研一下业界有什么模型压力测试工具,我整理了一些,佬友们有无从事相关方向工作的?

类别 工具名称 核心支持指标 适配后端 / 推理框架 支持模型类型 归属 / 维护方 官方榜单
框架原生 vLLM Benchmark 首字速度、生成速度、总时延、吞吐量、并发能力 vLLM 原生,也能测 OpenAI 兼容接口 主流 LLM,部分 pooling 场景 vLLM 官方
框架原生 GuideLLM 更偏生产视角的压测;看 TTFT、ITL、总时延、吞吐拐点、SLO/SLA 是否达标 OpenAI 兼容服务、vLLM-native 主流 LLM,也支持多模态输入数据 vLLM 项目
框架原生 SGLang Bench 单批/服务压测、延迟、吞吐、Profiling 分析 SGLang 原生 LLM、VLM/多模态 SGLang 官方
框架原生 GenAI-bench 高并发下的 token 级性能测试;看吞吐、延迟、并发表现 OpenAI 兼容接口,常用于 SGLang 等服务 主流 LLM sgl-project 社区
框架原生 TGI Benchmark TGI 服务的吞吐、时延、不同 batch 配置下的性能变化 Hugg
阅读全文
标签:人工智能