H公司发布全新 Holo3 系列模型:以极低成本优于 GPT-5.4 和 Opus 4.6

2026-04-11 13:550阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

今日,H公司正式发布其最新一代大规模视觉语言模型(VLM)Holo3。该系列模型专为 GUI(图形用户界面)智能体优化,旨在通过对视觉界面的深度理解与复杂逻辑推理,实现跨 Web、桌面及移动端的全自动化操作。
benchmark_table_light2920×2304 283 KB
osworld_pareto_light1920×1396 147 KB

在衡量计算机使用能力的权威基准测试 OSWorld-Verified 中,Holo3 展现了统治级的表现:

  • Holo3-122B-A10B:以 78.9% 的高分创下行业新纪录。
  • Holo3-35B-A3B:尽管规模较小,仍取得了 77.8% 的惊人成绩。

这意味着 Holo3 在模拟真实人类操作电脑的任务中,已经全面超越了包括 GPT-5.4、Claude Sonnet 4.6 以及 Opus 4.6 在内的诸多顶尖闭源模型。

Holo3 成功的秘密在于其高效的 Sparse Mixture-of-Experts (MoE) 架构:

  • 高效率:虽然 122B 模型总参数量过千亿,但实际运行时的活跃参数仅为 10B。
  • 低成本:得益于精简的活跃参数,Holo3 的推理成本仅为竞争对手的一小部分。以输出令牌计算,Holo3-122B 的价格仅为 $3.00/M,远低于 GPT-5.4 或 Opus 4.6 那动辄 $15-$25/M 的天价。

除了公开榜单,H公司还推出了包含 486 个多步骤任务的 H Corporate 企业级基准测试。结果显示,Holo3 在电商、商业软件、协同办公及多应用流转(Multi-Apps)等实际业务场景中,表现显著优于参数量大得多的竞争对手。

“Holo3 不仅仅是为了跑分,它是为生产环境而生的。” H公司官方博客表示,“通过我们的‘智能体飞轮(Agentic Flywheel)’训练,Holo3 能够自主导航几乎任何数字景观,为‘自动化企业’愿景奠定了基础。

阅读全文
标签:人工智能
问题描述:

今日,H公司正式发布其最新一代大规模视觉语言模型(VLM)Holo3。该系列模型专为 GUI(图形用户界面)智能体优化,旨在通过对视觉界面的深度理解与复杂逻辑推理,实现跨 Web、桌面及移动端的全自动化操作。
benchmark_table_light2920×2304 283 KB
osworld_pareto_light1920×1396 147 KB

在衡量计算机使用能力的权威基准测试 OSWorld-Verified 中,Holo3 展现了统治级的表现:

  • Holo3-122B-A10B:以 78.9% 的高分创下行业新纪录。
  • Holo3-35B-A3B:尽管规模较小,仍取得了 77.8% 的惊人成绩。

这意味着 Holo3 在模拟真实人类操作电脑的任务中,已经全面超越了包括 GPT-5.4、Claude Sonnet 4.6 以及 Opus 4.6 在内的诸多顶尖闭源模型。

Holo3 成功的秘密在于其高效的 Sparse Mixture-of-Experts (MoE) 架构:

  • 高效率:虽然 122B 模型总参数量过千亿,但实际运行时的活跃参数仅为 10B。
  • 低成本:得益于精简的活跃参数,Holo3 的推理成本仅为竞争对手的一小部分。以输出令牌计算,Holo3-122B 的价格仅为 $3.00/M,远低于 GPT-5.4 或 Opus 4.6 那动辄 $15-$25/M 的天价。

除了公开榜单,H公司还推出了包含 486 个多步骤任务的 H Corporate 企业级基准测试。结果显示,Holo3 在电商、商业软件、协同办公及多应用流转(Multi-Apps)等实际业务场景中,表现显著优于参数量大得多的竞争对手。

“Holo3 不仅仅是为了跑分,它是为生产环境而生的。” H公司官方博客表示,“通过我们的‘智能体飞轮(Agentic Flywheel)’训练,Holo3 能够自主导航几乎任何数字景观,为‘自动化企业’愿景奠定了基础。

阅读全文
标签:人工智能