跳到主要内容

Claude Fable 5:强大、昂贵,而且被设计为受限

· 阅读需 9 分钟
Claude Dev
Claude Dev

Anthropic 在 2026-06-09 发布了 Claude Fable 5,把带有 safeguards 的 Mythos-class 能力带给付费 Claude 用户和开发者。

重点不只是 Fable 5 更强,而是 Anthropic 正在尝试一种新的发布方式:把它迄今公开可用的最强模型家族交给公众,但当请求触及 cybersecurity、biology、chemistry、distillation,或某些 frontier AI development 路径时,把敏感工作从该模型路由走。

这让 Fable 5 成为一次对开发者格外重要的 Claude 发布。早期反馈分成两面:一面惊叹于模型的长周期能力,另一面则对 access、safety routing、成本和企业数据处理方式感到不满。

对 Claude Code 团队来说,实用问题不是“要不要全部切到 Fable”,而是:哪些任务值得为 Fable 5 付费,哪些任务会被它的 safeguards 破坏或扭曲?

发布了什么

Fable 5 是 Anthropic Mythos-class 模型家族的公开版本。WIRED、Business Insider、Axios、Tom's Hardware 等报道都将其描述为 Anthropic 迄今广泛开放的最强模型,而 Claude Mythos 5 仍然只通过 Project Glasswing 式访问开放给受信任的 cyberdefenders、infrastructure providers 和部分研究者。

关键发布细节如下:

  • 可用性:Pro、Max、Team 和 seat-based Enterprise 计划获得初始访问。据报道,广泛订阅访问是临时的,约从 2026-06-23 起需要 usage credits,除非 Anthropic 有足够 capacity 延长。
  • API 价格:Fable 5 报道价格为 输入每百万 token 10 美元,输出每百万 token 50 美元,大约是 Opus 4.8 的两倍。
  • 安全路由:敏感请求可能回退到 Claude Opus 4.8,而不是由 Fable 5 回答。
  • 公开访问 vs 受信访问:Fable 5 是带 safeguards 的公开模型;Mythos 5 是面向 vetted users、限制更少的版本。
  • 核心定位:长周期软件工程、困难研究、重视觉任务,以及复杂 agent workflows。

对开发者来说,最重要的一点是,“使用 Fable 5”并不意味着每一轮都一定由 Fable 5 回答。如果触发 routing,处理部分任务的模型可能是 Opus 4.8。

为什么很多人觉得惊艳

最强的正面反馈集中在需要持续上下文、规划和执行的任务上。

Tom's Hardware 汇总了 Anthropic 和早期用户提到的几个例子:Stripe 据称用该模型把一个 5000 万行 Ruby 迁移压缩到一天;Fable 5 据称仅依靠极简 vision-only harness 通关 Pokemon FireRed;Ethan Mollick 描述了一次 9.5 小时运行,从长 spec 生成了复杂的 survey-analysis 工具。

这些例子比普通 benchmark 更有意义,因为它们正好对应开发者希望 Claude Code 做到的事情:

  • 连续数小时保持任务;
  • 阅读并改造大型系统;
  • 不依赖人类持续 steering,也能协调很多步骤;
  • 组合 vision、code、planning 和 tool use;
  • 产出可工作的 artifacts,而不只是解释。

这就是 Fable 5 的上行叙事。它看起来不像一个更好的聊天模型,更像一个更强的自主工作引擎。

为什么很多人不满

反弹来得很快,因为 safeguards 不只是普通的 refusal 行为。

发布时,Fable 5 会把一些敏感主题路由到模型之外。Cybersecurity、biology、chemistry、distillation,以及部分高级 AI development 请求可能改由 Opus 4.8 处理。对安全团队和研究者来说,这已经是很重的产品约束。

更深的争议是透明度。WIRED、Business Insider 和 The Wall Street Journal 报道称,Anthropic 最初计划在不向用户可见的情况下,对部分 frontier AI development 工作降级或重路由。受到反弹后,Anthropic 在 2026-06-11 改变做法,表示 flagged requests 将可见地 fallback,或在 API 中返回 refusal reason。

这个回调很重要。隐藏 safeguard 不只是安全控制,它会改变开发者能否信任 eval 结果。如果模型静默改变行为,团队就很难判断失败来自 prompt 质量、模型能力、routing、policy,还是某个实验被阻止了。

Guardrails 本身就是产品的一部分

The Verge 的上手报道展示了保守路由的实际代价:即便问题是良性的,Fable 5 也可能拒绝或移交基础 biology 问题。其他报道也描述了围绕 security 和 AI research prompts 的类似挫败感。

对 Anthropic 来说,这是一次权衡:现在发布 Mythos-class 能力,但禁用或重定向误用风险最高的领域。对用户来说,这带来一种新心智模型:

Fable 5 不只是一个模型。它是模型加路由策略。

这个策略如果能阻止危险误用,就是有价值的。但如果它阻断合法工作、让 benchmark 难以解释,或在可见性不足的情况下把任务交给弱模型,它也会打断正常工作。

这对 Claude Code 尤其相关。许多严肃 coding workflow 都会碰到 security、dependency analysis、infrastructure、authentication、cryptography 或 model-evaluation code。对开发者来说很普通的 coding task,也可能触发 classifier。

早期社区反馈模式

早期用户反馈的模式很清楚:

  • 正面:用户称赞 Fable 5 在长期、混乱、多步骤任务上的原始能力。
  • 实际顾虑:用户反馈 token 消耗很快,尤其是在高阶计划上。
  • 访问顾虑:很多人反感“公众拿到 safeguarded model,受信机构拿到更有用模型”的切分。
  • 研究顾虑:AI 和 biomedical researchers 担心广泛限制让 Fable 5 难以评估或使用。
  • 企业顾虑:报道称 Microsoft 限制员工使用,因为 Fable 5 的数据保留姿态与其他 Claude models 的 zero-data-retention 不同。

模式不是“Fable 5 不好”,而是:Fable 5 可能是最适合长任务的 Claude 模型,但它也有最大的 policy surface area。

这和 Opus 4.8 是不同的采用问题。

Claude Code 团队应该怎么做

1. 只在长周期能力真正重要时使用 Fable 5

Fable 5 应该首先测试在弱模型无法可靠完成的任务上:

  • 大型迁移;
  • 跨 repo refactors;
  • 长时间 bug hunts;
  • 复杂 UI 和 artifact generation;
  • 多阶段 research reports;
  • 重视觉工程任务;
  • planning plus execution workflows。

在证明结果足以覆盖成本前,不要把 Fable 定价花在小改动、简单解释、常规测试或单文件变更上。

2. 记录 routing 和 fallback 行为

对 API 和 Claude Code workflow 来说,把 model identity 当作 runtime state。

日志至少应该记录:

  • requested model;
  • 可用时的 actual responding model;
  • refusal 或 fallback reason;
  • token usage;
  • task category;
  • 任务是否触及 security、biology、chemistry、model training 或 distillation。

否则 eval 可能会误导你。你可能以为测的是 Fable 5,实际测到的是 Fable-to-Opus fallback path。

3. 把安全任务从通用 coding eval 中拆开

不要把 security audit tasks 混进通用 “coding benchmark” 后求平均。Fable 5 的 routing policy 会让这类结果很难解释。

建议拆出独立 eval tracks:

  • normal application coding;
  • infrastructure and auth;
  • defensive security review;
  • dependency and vulnerability analysis;
  • AI tooling 或 model-evaluation work。

这样才能回答真正的问题:Fable 5 在哪里有帮助,哪里被 safeguards 改变了任务本身。

4. 把成本当作产品约束

按报道的 API 价格,Fable 5 已经贵到 workflow 设计会直接影响可用性。

像使用高级专家一样使用它:

  • 把高上下文任务交给它;
  • 提前给完整 spec;
  • 大范围编辑前先要 plan;
  • 要求 checkpoints;
  • 把常规 follow-up 交给更便宜的模型。

错误模式是把 Fable 5 设为每一轮聊天的默认助手。正确模式是有意识地把困难、有价值的任务路由给它。

5. 企业 rollout 前先检查合规

Microsoft 的限制报道是一个有用提醒。如果 Fable 5 与其他 Claude models 的 data-retention posture 不同,企业团队在用它处理 proprietary code 前,需要 legal 和 security review。

Rollout 前至少确认:

  • data retention terms;
  • zero-data-retention 是否可用;
  • 你的 cloud provider 是否启用 Fable 5;
  • fallback models 是否共享同一 policy;
  • usage credits 和 seat-based access 如何交互。

对很多公司来说,这可能比 benchmark 分数更重要。

结论

Claude Fable 5 是 Mythos 公开出现以来最值得关注的 Claude 发布,因为它改变的是 deployment model,而不只是 model quality。

它让公众接触到 Mythos-class 能力,但只能通过一个被 guard 的产品表面使用。这可能让它在长周期工程和研究 workflow 中极强,同时也会让它在 security、biology、AI research 和 enterprise compliance 方面变得不可预测。

更合理的 Claude Code 采用策略是选择性迁移:

  • 在困难长周期任务上 benchmark;
  • 测量 token burn;
  • 记录 fallback behavior;
  • 让 Opus 和 Sonnet 继续留在 routing mix;
  • 不要盲目用于 sensitive-topic workflows;
  • 企业使用前审查 data-retention terms。

Fable 5 可能是一次重大进步。但对开发者来说,模型只是一半故事。路由策略现在也是 runtime 的一部分。

参考来源