Claude Opus 4.7 发布解读

Anthropic 于 2026 年 4 月 16 日 正式发布 Claude Opus 4.7，并将其定位为当前“最强的通用可用 Opus 模型”。这次更新更像是一次面向生产环境的强化版升级，而不是完全重做的新系列：价格体系基本不变，1M 上下文窗口仍然保留，但在复杂编程、长时代理任务、视觉理解和专业文档生成上都有明显提升。

对开发者和团队来说，重点不只是“模型更强了”，还包括一组真实会影响迁移的 API 和行为变化。

快速结论

发布日期： 2026 年 4 月 16 日
模型 ID： claude-opus-4-7
可用平台： Claude 全系产品、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry
上下文窗口： 1M tokens
最大输出： 128k tokens
价格： 每百万输入 tokens 5 美元，每百万输出 tokens 25 美元
知识截止： 2026 年 1 月

来源：Anthropic 官方发布、模型概览

Opus 4.7 主要提升了什么

Anthropic 官方材料里，Opus 4.7 的提升大致可以归纳为四个方向。

1. 更强的复杂工程能力

Anthropic 明确把 Opus 4.7 定位成更强的高级软件工程模型，尤其适合之前还需要频繁盯着看的复杂任务。官方描述里反复强调三个点：

更能处理长链路、多步骤任务
更严格地遵循指令
在给出结果前，更倾向于自我验证

合作方给出的早期评测也支持这一方向：

Cursor 表示其内部 CursorBench 从 58% 提升到 70%
Rakuten 表示在 Rakuten-SWE-Bench 上，Opus 4.7 解决的生产任务数是 Opus 4.6 的 3 倍
CodeRabbit 表示在代码审查场景中，召回率提升 10% 以上

这些数字属于厂商自有评测，不等于完全可横向比较的公共 benchmark，但它们共同说明了一件事：Opus 4.7 的优化重点很明确，就是代码和代理工作流。

2. 更强的长时代理与自主执行能力

这是这次发布最值得关注的主题之一。无论是官方公告还是迁移指南，都在强调 Opus 4.7 对长时间、多阶段 agent 任务的适配能力更强，包括：

更少中途放弃
更少工具调用错误
更稳定地把任务做完
不那么依赖人工频繁重新提示

迁移指南里还提到一个很关键的行为变化：Opus 4.7 默认会更谨慎地调用工具，更多先用推理再决定是否调用外部工具，而且回答长度会根据任务复杂度自动伸缩，而不是固定偏长或偏短。

这意味着旧提示词和旧 harness 未必失效，但值得重新回归测试，而不是直接假设行为完全一致。

3. 视觉能力明显增强

Opus 4.7 是 Anthropic 首个支持高分辨率图像输入的 Claude 模型。图像上限从：

1568px / 1.15MP

提升到：

2576px / 3.75MP

这项升级对以下场景特别重要：

浏览器自动化和 computer use
高密度截图理解
幻灯片与文档编辑
图表、流程图、技术示意图分析
UI 生成与视觉质检

Anthropic 还提到，模型对图像坐标的理解现在更接近 1:1 像素映射，这会让需要坐标定位的工具链更容易实现。

4. 生成的专业产物更“像能直接交付的成品”

官方公告里专门点名了 interfaces、slides、docs 三类输出，表示 Opus 4.7 在这些任务上的结果更精致、更有审美、更接近可直接交付或展示的质量。

这反映了 Anthropic 对 Opus 4.7 的产品定位不只是“更准”，还包括“更像成熟同事产出的工作成果”。

与 Opus 4.7 一起上线的新能力

除了模型本身变强，Anthropic 还同步推出了几项和 Opus 4.7 紧密相关的平台能力。

新的 `xhigh` effort 档位

Opus 4.7 新增了 xhigh effort，位于 high 和 max 之间。Anthropic 官方建议：

编码和 agent 场景优先从 xhigh 开始
大多数对智能水平敏感的任务至少使用 high

这次 effort 参数比以往更重要，因为 Opus 4.7 对 effort 的依赖更明显。迁移后如果你发现质量、延迟、成本出现变化，effort 往往是最先需要重新校准的参数。

来源：What's new in Claude Opus 4.7、Effort 文档

Task budgets（Beta）

Anthropic 还为 Opus 4.7 引入了 task budgets。它的意思不是单次请求的硬上限，而是给模型一个“整个 agent 循环大致能花多少 tokens”的预算感知，这里面包括：

thinking
tool calls
tool results
final output

它和 max_tokens 的区别很关键：

max_tokens 是单次响应的硬限制
task_budget 是模型能感知到的整轮任务预算提示

如果你在做自主代理、代码审查代理、研究代理，这会是很实用的新能力，因为模型会更主动考虑“预算还剩多少”。

来源：Task budgets 文档

升级到 Opus 4.7 时要注意什么

如果你准备从 Opus 4.6 升级到 4.7，这不是一个只改模型名就万事大吉的版本。

1. 旧的 extended thinking budget 写法不能再用

以前常见的：

{"thinking": {"type": "enabled", "budget_tokens": 32000}}

在 Opus 4.7 上已经不被支持。Anthropic 要求改成：

{"thinking": {"type": "adaptive"}}

然后通过 effort 来控制推理深度。

2. 非默认采样参数会直接报错

从 Opus 4.7 开始，如果你设置 temperature、top_p 或 top_k 的非默认值，请求会直接返回 400。Anthropic 官方建议是把这些参数从请求里移除，转而用提示词和 effort 控制行为。

3. thinking 默认不再展示

Opus 4.7 默认会省略 thinking 内容，除非你显式开启 summarized display。对那些把 reasoning 流实时展示给用户的产品来说，这会表现为“看起来像卡住了一段时间”，实际上是默认展示策略变了。

4. token 计数可能会变多

Opus 4.7 使用了新的 tokenizer。Anthropic 明确表示，同样的文本在新模型上可能会消耗大约 1.0x 到 1.35x 的 tokens，具体取决于内容类型。

这不一定代表总体成本一定更高，因为任务可能用更少轮数完成，但你仍然应该重新评估：

请求成本
响应延迟
max_tokens 预留空间
compaction 触发阈值
客户端自己的 token 估算逻辑

来源：迁移指南、What's new in Claude Opus 4.7

安全策略与产品定位

Anthropic 还把 Opus 4.7 作为新一代网络安全防护机制的首个广泛上线载体。官方公告提到，Opus 4.7 内置了对高风险或被禁止网络安全请求的自动检测与拦截机制，而能力更强的 Claude Mythos Preview 仍然保持更严格的受限发布状态。

这也让 Anthropic 当前产品线的层级更清晰：

Opus 4.7：目前最强的通用可用 Opus
Mythos Preview：能力更高，但不属于广泛开放版本

来源：Anthropic 官方发布

总结

Claude Opus 4.7 不是一次“只涨 benchmark 分数”的常规小迭代，而是一次明显偏向生产场景的升级。对于做 coding agent、research agent、文档处理、浏览器自动化、视觉理解流程的团队来说，它最值得关注的价值在于：

更稳定的长时任务执行
更强的高分辨率视觉能力
更清晰的推理与预算控制方式

但它也不是零成本升级。提示词行为更字面化、tokenizer 变化、部分旧 API 参数失效，这些都会直接影响接入效果。最稳妥的做法不是“马上全量替换”，而是拿核心任务集做一次小规模回归，再决定是否切到 4.7。

快速结论​

Opus 4.7 主要提升了什么​

1. 更强的复杂工程能力​

2. 更强的长时代理与自主执行能力​

3. 视觉能力明显增强​

4. 生成的专业产物更“像能直接交付的成品”​

与 Opus 4.7 一起上线的新能力​

新的 xhigh effort 档位​

Task budgets（Beta）​

升级到 Opus 4.7 时要注意什么​

1. 旧的 extended thinking budget 写法不能再用​

2. 非默认采样参数会直接报错​

3. thinking 默认不再展示​

4. token 计数可能会变多​

安全策略与产品定位​

总结​

参考来源​