H公司发布全新 Holo3 系列模型：以极低成本优于 GPT-5.4 和 Opus 4.6

2026-04-11 13:550阅读0评论SEO教程

内容介绍
文章标签
相关推荐

问题描述：

今日，H公司正式发布其最新一代大规模视觉语言模型（VLM）Holo3。该系列模型专为 GUI（图形用户界面）智能体优化，旨在通过对视觉界面的深度理解与复杂逻辑推理，实现跨 Web、桌面及移动端的全自动化操作。
benchmark_table_light2920×2304 283 KB
osworld_pareto_light1920×1396 147 KB

在衡量计算机使用能力的权威基准测试 OSWorld-Verified 中，Holo3 展现了统治级的表现：

Holo3-122B-A10B：以 78.9% 的高分创下行业新纪录。
Holo3-35B-A3B：尽管规模较小，仍取得了 77.8% 的惊人成绩。

这意味着 Holo3 在模拟真实人类操作电脑的任务中，已经全面超越了包括 GPT-5.4、Claude Sonnet 4.6 以及 Opus 4.6 在内的诸多顶尖闭源模型。

Holo3 成功的秘密在于其高效的 Sparse Mixture-of-Experts (MoE) 架构：

高效率：虽然 122B 模型总参数量过千亿，但实际运行时的活跃参数仅为 10B。
低成本：得益于精简的活跃参数，Holo3 的推理成本仅为竞争对手的一小部分。以输出令牌计算，Holo3-122B 的价格仅为 $3.00/M，远低于 GPT-5.4 或 Opus 4.6 那动辄 $15-$25/M 的天价。

除了公开榜单，H公司还推出了包含 486 个多步骤任务的 H Corporate 企业级基准测试。结果显示，Holo3 在电商、商业软件、协同办公及多应用流转（Multi-Apps）等实际业务场景中，表现显著优于参数量大得多的竞争对手。

“Holo3 不仅仅是为了跑分，它是为生产环境而生的。” H公司官方博客表示，“通过我们的‘智能体飞轮（Agentic Flywheel）’训练，Holo3 能够自主导航几乎任何数字景观，为‘自动化企业’愿景奠定了基础。

阅读全文

标签：人工智能