Claude Fable 5:强大、昂贵,而且被设计为受限
Anthropic 在 2026-06-09 发布了 Claude Fable 5,把带有 safeguards 的 Mythos-class 能力带给付费 Claude 用户和开发者。
重点不只是 Fable 5 更强,而是 Anthropic 正在尝试一种新的发布方式:把它迄今公开可用的最强模型家族交给公众,但当请求触及 cybersecurity、biology、chemistry、distillation,或某些 frontier AI development 路径时,把敏感工作从该模型路由走。
这让 Fable 5 成为一次对开发者格外重要的 Claude 发布。早期反馈分成两面:一面惊叹于模型的长周期能力,另一面则对 access、safety routing、成本和企业数据处理方式感到不满。
对 Claude Code 团队来说,实用问题不是“要不要全部切到 Fable”,而是:哪些任务值得为 Fable 5 付费,哪些任务会被它的 safeguards 破坏或扭曲?
发布了什么
Fable 5 是 Anthropic Mythos-class 模型家族的公开版本。WIRED、Business Insider、Axios、Tom's Hardware 等报道都将其描述为 Anthropic 迄 今广泛开放的最强模型,而 Claude Mythos 5 仍然只通过 Project Glasswing 式访问开放给受信任的 cyberdefenders、infrastructure providers 和部分研究者。
关键发布细节如下:
- 可用性:Pro、Max、Team 和 seat-based Enterprise 计划获得初始访问。据报道,广泛订阅访问是临时的,约从 2026-06-23 起需要 usage credits,除非 Anthropic 有足够 capacity 延长。
- API 价格:Fable 5 报道价格为 输入每百万 token 10 美元,输出每百万 token 50 美元,大约是 Opus 4.8 的两倍。
- 安全路由:敏感请求可能回退到 Claude Opus 4.8,而不是由 Fable 5 回答。
- 公开访问 vs 受信访问:Fable 5 是带 safeguards 的公开模型;Mythos 5 是面向 vetted users、限制更少的版本。
- 核心定位:长周期软件工程、困难研究、重视觉任务,以及复杂 agent workflows。
对开发者来说,最重要的一点是,“使用 Fable 5”并不意味着每一轮都一定由 Fable 5 回答。如果触发 routing,处理部分任务的模型可能是 Opus 4.8。
为什么很多人觉得惊艳
最强的正面反馈集中在需要持续上下文、规划和执行的任务上。
Tom's Hardware 汇总了 Anthropic 和早期用户提到的几个例子:Stripe 据称用该模型把一个 5000 万行 Ruby 迁移压缩到一天;Fable 5 据称仅依靠极简 vision-only harness 通关 Pokemon FireRed;Ethan Mollick 描述了一次 9.5 小时运行,从长 spec 生成了复杂的 survey-analysis 工具。
这些例子比普通 benchmark 更有意义,因为它们正好对应开发者希望 Claude Code 做到的事情:
- 连续数小时保持任务;
- 阅读并改造大型系统;
- 不依赖人类持续 steering,也能协调很多步骤;
- 组合 vision、code、planning 和 tool use;
- 产出可工作的 artifacts,而不只是解释。
这就是 Fable 5 的上行叙事。它看起来不像一个更好的聊天模型,更像一个更强的自主工作引擎。
为什么很多人不满
反弹来得很快,因为 safeguards 不只是普通的 refusal 行为。
发布时,Fable 5 会把一些敏感主题路由到模型之外。Cybersecurity、biology、chemistry、distillation,以及部分高级 AI development 请求可能改由 Opus 4.8 处理。对安全团队和研究者来说,这已经是很重的产品约束。
更深的争议是透明度。WIRED、Business Insider 和 The Wall Street Journal 报道称,Anthropic 最初计划在不向用户可见的情况下,对部分 frontier AI development 工作降级或重路由。受到反弹后,Anthropic 在 2026-06-11 改变做法,表示 flagged requests 将可见地 fallback,或在 API 中返回 refusal reason。
这个回调很重要。隐藏 safeguard 不只是安全控制,它会改变开发者能否信任 eval 结果。如果模型静默改变行为,团队就很难判断失败来自 prompt 质量、模型能力、routing、policy,还是某个实验被阻止了。