Claude Opus 4.7 发布解读
Anthropic 于 2026 年 4 月 16 日 正式发布 Claude Opus 4.7,并将其定位为当前“最强的通用可用 Opus 模型”。这次更新更像是一次面向生产环境的强化版升级,而不是完全重做的新系列:价格体系基本不变,1M 上下文窗口仍然保留,但在复杂编程、长时代理任务、视觉理解和专业文档生成上都有明显提升。
对开发者和团队来说,重点不只是“模型更强了”,还包括一组真实会影响迁移的 API 和行为变化。
快速结论
- 发布日期: 2026 年 4 月 16 日
- 模型 ID:
claude-opus-4-7 - 可用平台: Claude 全系产品、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry
- 上下文窗口: 1M tokens
- 最大输出: 128k tokens
- 价格: 每百万输入 tokens 5 美元,每百万输出 tokens 25 美元
- 知识截止: 2026 年 1 月
Opus 4.7 主要提升了什么
Anthropic 官方材料里,Opus 4.7 的提升大致可以归纳为四个方向。
1. 更强的复杂工程能力
Anthropic 明确把 Opus 4.7 定位成更强的高级软件工程模型,尤其适合之前还需要频繁盯着看的复杂任务。官方描述里反复强调三个点:
- 更能处理长链路、多步骤任务
- 更严格地遵循指令
- 在给出结果前,更倾向于自我验证
合作方给出的早期评测也支持这一方向:
- Cursor 表示其内部 CursorBench 从 58% 提升到 70%
- Rakuten 表示在 Rakuten-SWE-Bench 上,Opus 4.7 解决的生产任务数是 Opus 4.6 的 3 倍
- CodeRabbit 表示在代码审查场景中,召回率提升 10% 以上
这些数字属于厂商自有评测,不等于完全可横向比较的公共 benchmark,但它们共同说明了一件事:Opus 4.7 的优化重点很明确,就是代码和代理工作流。
2. 更强的长时代理与自主执行能力
这是这次发布最值得关注的主题之一。无论是官方公告还是迁移指南,都在强调 Opus 4.7 对长时间、多阶段 agent 任务的适配能力更强,包括:
- 更少中途放弃
- 更少工具调用错误
- 更稳定地把任务做完
- 不那么依赖人工频繁重新提示
迁移指南里还提到一个很关键的行为变化:Opus 4.7 默认会更谨慎地调用工具,更多先用推理再决定是否调用外部工具,而且回答长度会根据任务复杂度自动伸缩,而不是固定偏长或偏短。
这意味着旧提示词和旧 harness 未必失效,但值得重新回归测试,而不是直接假设行为完全一致。
3. 视觉能力明显增强
Opus 4.7 是 Anthropic 首个支持高分辨率图像输入的 Claude 模型。图像上限从:
- 1568px / 1.15MP
提升到:
- 2576px / 3.75MP
这项升级对以下场景特别重要:
- 浏览器自动化和 computer use
- 高密度截图理解
- 幻灯片与文档编辑
- 图表、流程图、技术示意图分析
- UI 生成与视觉质检
Anthropic 还提到,模型对图像坐标的理解现在更接近 1:1 像素映射,这会让需要坐标定位的工具链更容易实现。
4. 生成的专业产物更“像能直接交付的成品”
官方公告里专门点名了 interfaces、slides、docs 三类输出,表示 Opus 4.7 在这些任务上的结果更精致、更有审美、更接近可直接交付或展示的质量。
这反映了 Anthropic 对 Opus 4.7 的产品定位不只是“更准”,还包括“更像成熟同事产出的工作成果”。
与 Opus 4.7 一起上线的新能力
除了模型本身变强,Anthropic 还同步推出了几项和 Opus 4.7 紧密相关的平台能力。
新的 xhigh effort 档位
Opus 4.7 新增了 xhigh effort,位于 high 和 max 之间。Anthropic 官方建议:
- 编码和 agent 场景优先从
xhigh开始 - 大多数对智能水平敏感的任务至少使用
high
这次 effort 参数比以往更重要,因为 Opus 4.7 对 effort 的依赖更明显。迁移后如果你发现质量、延迟、成本出现变化,effort 往往是最先需要重新校准的参数。
来源:What's new in Claude Opus 4.7、Effort 文档
Task budgets(Beta)
Anthropic 还为 Opus 4.7 引入了 task budgets。它的意思不是单次请求的硬上限,而是给模型一个“整个 agent 循环大致能花多少 tokens”的预算感知,这里面包括:
- thinking
- tool calls
- tool results
- final output
它和 max_tokens 的区别很关键:
max_tokens是单次响应的硬限制task_budget是模型能感知到的整轮任务预算提示
如果你在做自主代理、代码审查代理、研究代理,这会是很实用的新能力 ,因为模型会更主动考虑“预算还剩多少”。
升级到 Opus 4.7 时要注意什么
如果你准备从 Opus 4.6 升级到 4.7,这不是一个只改模型名就万事大吉的版本。
1. 旧的 extended thinking budget 写法不能再用
以前常见的:
{"thinking": {"type": "enabled", "budget_tokens": 32000}}
在 Opus 4.7 上已经不被支持。Anthropic 要求改成:
{"thinking": {"type": "adaptive"}}
然后通过 effort 来控制推理深度。
2. 非默认采样参数会直接报错
从 Opus 4.7 开始,如果你设置 temperature、top_p 或 top_k 的非默认值,请求会直接返回 400。Anthropic 官方建议是把这些参数从请求里移除,转而用提示词和 effort 控制行为。
3. thinking 默认不再展示
Opus 4.7 默认会省略 thinking 内容,除非你显式开启 summarized display。对那些把 reasoning 流实时展示给用户的产品来说,这会表现为“看起来像卡住了一段时间”,实际上是默认展示策略变了。
4. token 计数可能会变多
Opus 4.7 使用了新的 tokenizer。Anthropic 明确表示,同样的文本在新模型上可能会消耗大约 1.0x 到 1.35x 的 tokens,具体取决于内容类型。
这不一定代表总体成本一定更高,因为任务可能用更少轮数完成,但你仍然应该重新评估:
- 请求成本
- 响应延迟
max_tokens预留空间- compaction 触发阈值
- 客户端自己的 token 估算逻辑
来源:迁移指南、What's new in Claude Opus 4.7