距离上次新品发布仅仅两周后,Anthropic 又出手了。
最新消息,Anthropic 发布轻量级模型 Claude Haiku 4.5,主打「更便宜、更快速」。
据 Anthropic 介绍,Claude Haiku 4.5 的编码性能可与中高端模型 Claude Sonnet 4(这是 Anthropic 于 5 个月前发布的模型)相媲美,但成本更低,每百万输入 token 的成本为 1 美元,每百万输出 token 的成本为 5 美元,仅为 Claude Sonnet 4 的三分之一。而推理速度却提升一倍多。

用 Anthropic 发言人的话来说就是,「Haiku 4.5 在性能上有了明显的飞跃,现在基本上和 Sonnet 4 一样智能,但速度却快得多,成本却只有 Sonnet 4 的三分之一。」
不仅如此,从测试数据来看,Claude Haiku 4.5 在某些任务,甚至超越了 Claude Sonnet 4。比如 computer use 「OSWorld」(一个在现实世界计算机任务中测试人工智能模型的基准测试平台)上,前者得分 50.7%,后者得分 42.2%;数学推理(AIME 2025)测试中,前者借助 Python 工具,成绩高达 96.3%,后者为 70.5%。

整体来看,Claude Haiku 4.5 核心面向实时、低延迟的任务场景,比如聊天助手、客服人员、协同编程等。这些场景用户将会体验到 Claude Haiku 4.5 的高智能、极快速度。而 Claude Code 用户则会发现 Claude Haiku 4.5 显著提升了编码体验的响应速度,包括多智能体项目到快速原型开发设计等。
早期客户的一些体验评价也体现了 Claude Haiku 4.5 的能力水平:
比如,Augment Code 的联合创始人 Guy Gur-Ari 表示,「Claude Haiku 4.5 达到了我们意想不到的最佳状态:接近前沿的编码质量、惊人的速度和成本效益。在 Augment 的内部编码评估测试中,Haiku 4.5 的性能达到了 Sonnet 4.5 的 90%,甚至可以与规模更大的模型相媲美。」

Windsurf 的首席执行官 Jeff Wang 也表示,「历史上,模型总是为了质量而牺牲速度和成本,而Haiku 4.5 正在「模糊」这种传统权衡的界限:它是一种快速的前沿模型,既保持了成本高效,又预示了这类模型的发展方向。」

其实,从测试数据上也不难看出,目前,Claude Sonnet 4.5 仍然是 Anthropic 最好的模型,在各项性能表现上都超过 Claude Haiku 4.5,而 Claude Haiku 4.5 的长处在于能以更高的成本效益为用户提供「近乎前沿的性能」。
另外,Anthropic 表示,两者的配合使用还将为企业客户带来极大优势:前者可以构建前沿多步骤计划,而后者则并行完成子任务,「从而支持多智能体系统快速高质量地处理复杂的重构、迁移和大型功能构建。」
比如,在金融服务领域,Claude Sonnet 4.5 和 Haiku 4.5 的结合所带来的多智能体架构,将彻底改变企业监控市场和管理风险的方式。在 Anthropic 的设想中,Haiku 4.5 将同时监控数千个数据流 —— 追踪监管变化、市场信号和投资组合风险,而 Sonnet 4.5 则负责处理复杂的预测模型和战略分析。
而对于研究机构来说,分工可以大幅压缩时间。比如,Claude Sonnet 4.5 可以协调全面的分析,而多个 Haiku 4.5 Agent 则可以并行处理数十个来源的文献综述、数据收集和文档合成,根据 Anthropic 的描述,这可能「将数周的研究压缩到数小时」。
还有一点非常重要的是,Claude Haiku 4.5 不仅速度快、价格低,而且安全。