跳到主要内容

Claude Opus 4.7 发布解读

Anthropic 于 2026 年 4 月 16 日 正式发布 Claude Opus 4.7,并将其定位为当前“最强的通用可用 Opus 模型”。这次更新更像是一次面向生产环境的强化版升级,而不是完全重做的新系列:价格体系基本不变,1M 上下文窗口仍然保留,但在复杂编程、长时代理任务、视觉理解和专业文档生成上都有明显提升。

对开发者和团队来说,重点不只是“模型更强了”,还包括一组真实会影响迁移的 API 和行为变化。

快速结论

  • 发布日期: 2026 年 4 月 16 日
  • 模型 ID: claude-opus-4-7
  • 可用平台: Claude 全系产品、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry
  • 上下文窗口: 1M tokens
  • 最大输出: 128k tokens
  • 价格: 每百万输入 tokens 5 美元,每百万输出 tokens 25 美元
  • 知识截止: 2026 年 1 月

来源:Anthropic 官方发布模型概览

Opus 4.7 主要提升了什么

Anthropic 官方材料里,Opus 4.7 的提升大致可以归纳为四个方向。

1. 更强的复杂工程能力

Anthropic 明确把 Opus 4.7 定位成更强的高级软件工程模型,尤其适合之前还需要频繁盯着看的复杂任务。官方描述里反复强调三个点:

  • 更能处理长链路、多步骤任务
  • 更严格地遵循指令
  • 在给出结果前,更倾向于自我验证

合作方给出的早期评测也支持这一方向:

  • Cursor 表示其内部 CursorBench 从 58% 提升到 70%
  • Rakuten 表示在 Rakuten-SWE-Bench 上,Opus 4.7 解决的生产任务数是 Opus 4.6 的 3 倍
  • CodeRabbit 表示在代码审查场景中,召回率提升 10% 以上

这些数字属于厂商自有评测,不等于完全可横向比较的公共 benchmark,但它们共同说明了一件事:Opus 4.7 的优化重点很明确,就是代码和代理工作流。

2. 更强的长时代理与自主执行能力

这是这次发布最值得关注的主题之一。无论是官方公告还是迁移指南,都在强调 Opus 4.7 对长时间、多阶段 agent 任务的适配能力更强,包括:

  • 更少中途放弃
  • 更少工具调用错误
  • 更稳定地把任务做完
  • 不那么依赖人工频繁重新提示

迁移指南里还提到一个很关键的行为变化:Opus 4.7 默认会更谨慎地调用工具,更多先用推理再决定是否调用外部工具,而且回答长度会根据任务复杂度自动伸缩,而不是固定偏长或偏短。

这意味着旧提示词和旧 harness 未必失效,但值得重新回归测试,而不是直接假设行为完全一致。

3. 视觉能力明显增强

Opus 4.7 是 Anthropic 首个支持高分辨率图像输入的 Claude 模型。图像上限从:

  • 1568px / 1.15MP

提升到:

  • 2576px / 3.75MP

这项升级对以下场景特别重要:

  • 浏览器自动化和 computer use
  • 高密度截图理解
  • 幻灯片与文档编辑
  • 图表、流程图、技术示意图分析
  • UI 生成与视觉质检

Anthropic 还提到,模型对图像坐标的理解现在更接近 1:1 像素映射,这会让需要坐标定位的工具链更容易实现。

4. 生成的专业产物更“像能直接交付的成品”

官方公告里专门点名了 interfaces、slides、docs 三类输出,表示 Opus 4.7 在这些任务上的结果更精致、更有审美、更接近可直接交付或展示的质量。

这反映了 Anthropic 对 Opus 4.7 的产品定位不只是“更准”,还包括“更像成熟同事产出的工作成果”。

与 Opus 4.7 一起上线的新能力

除了模型本身变强,Anthropic 还同步推出了几项和 Opus 4.7 紧密相关的平台能力。

新的 xhigh effort 档位

Opus 4.7 新增了 xhigh effort,位于 highmax 之间。Anthropic 官方建议:

  • 编码和 agent 场景优先从 xhigh 开始
  • 大多数对智能水平敏感的任务至少使用 high

这次 effort 参数比以往更重要,因为 Opus 4.7 对 effort 的依赖更明显。迁移后如果你发现质量、延迟、成本出现变化,effort 往往是最先需要重新校准的参数。

来源:What's new in Claude Opus 4.7Effort 文档

Task budgets(Beta)

Anthropic 还为 Opus 4.7 引入了 task budgets。它的意思不是单次请求的硬上限,而是给模型一个“整个 agent 循环大致能花多少 tokens”的预算感知,这里面包括:

  • thinking
  • tool calls
  • tool results
  • final output

它和 max_tokens 的区别很关键:

  • max_tokens 是单次响应的硬限制
  • task_budget 是模型能感知到的整轮任务预算提示

如果你在做自主代理、代码审查代理、研究代理,这会是很实用的新能力,因为模型会更主动考虑“预算还剩多少”。

来源:Task budgets 文档

升级到 Opus 4.7 时要注意什么

如果你准备从 Opus 4.6 升级到 4.7,这不是一个只改模型名就万事大吉的版本。

1. 旧的 extended thinking budget 写法不能再用

以前常见的:

{"thinking": {"type": "enabled", "budget_tokens": 32000}}

在 Opus 4.7 上已经不被支持。Anthropic 要求改成:

{"thinking": {"type": "adaptive"}}

然后通过 effort 来控制推理深度。

2. 非默认采样参数会直接报错

从 Opus 4.7 开始,如果你设置 temperaturetop_ptop_k 的非默认值,请求会直接返回 400。Anthropic 官方建议是把这些参数从请求里移除,转而用提示词和 effort 控制行为。

3. thinking 默认不再展示

Opus 4.7 默认会省略 thinking 内容,除非你显式开启 summarized display。对那些把 reasoning 流实时展示给用户的产品来说,这会表现为“看起来像卡住了一段时间”,实际上是默认展示策略变了。

4. token 计数可能会变多

Opus 4.7 使用了新的 tokenizer。Anthropic 明确表示,同样的文本在新模型上可能会消耗大约 1.0x 到 1.35x 的 tokens,具体取决于内容类型。

这不一定代表总体成本一定更高,因为任务可能用更少轮数完成,但你仍然应该重新评估:

  • 请求成本
  • 响应延迟
  • max_tokens 预留空间
  • compaction 触发阈值
  • 客户端自己的 token 估算逻辑

来源:迁移指南What's new in Claude Opus 4.7

安全策略与产品定位

Anthropic 还把 Opus 4.7 作为新一代网络安全防护机制的首个广泛上线载体。官方公告提到,Opus 4.7 内置了对高风险或被禁止网络安全请求的自动检测与拦截机制,而能力更强的 Claude Mythos Preview 仍然保持更严格的受限发布状态。

这也让 Anthropic 当前产品线的层级更清晰:

  • Opus 4.7:目前最强的通用可用 Opus
  • Mythos Preview:能力更高,但不属于广泛开放版本

来源:Anthropic 官方发布

总结

Claude Opus 4.7 不是一次“只涨 benchmark 分数”的常规小迭代,而是一次明显偏向生产场景的升级。对于做 coding agent、research agent、文档处理、浏览器自动化、视觉理解流程的团队来说,它最值得关注的价值在于:

  • 更稳定的长时任务执行
  • 更强的高分辨率视觉能力
  • 更清晰的推理与预算控制方式

但它也不是零成本升级。提示词行为更字面化、tokenizer 变化、部分旧 API 参数失效,这些都会直接影响接入效果。最稳妥的做法不是“马上全量替换”,而是拿核心任务集做一次小规模回归,再决定是否切到 4.7。

参考来源