Claude Fable 5 API 价格:Input、Output、缓存和各平台费用

Quick Answer

Claude Fable 5 是 Anthropic 最高能力的公开模型,专为复杂推理和长时间 Agent 任务设计。官方 API 价格为 input $10 / 1M tokens,output $50 / 1M tokens(output 是 input 的 5 倍)。Prompt Caching 提供约 90% 折扣,cache read 只需 $1 / 1M tokens。Claude Fable 5 支持 1M token 上下文窗口和高达 128k output,上线日期为 2026 年 6 月 9 日。AWS Bedrock、Google Vertex AI、Microsoft Foundry 的 Fable 5 价格与官方一致,但具体费率以各平台账单为准。OpenRouter 上的价格仅为第三方参考,不等同于官方定价。国内开发者可用 AI API Doctor 检测 API 配置,再用 LinkAI 注册入口小额测试。

Claude Fable 5 是什么

Claude Fable 5 是 Anthropic 发布的最高能力公开模型,面向复杂知识工作、长时间推理和代码任务。关键规格:

  • API 模型 ID:claude-fable-5
  • 上下文窗口:1M token(默认)
  • 单次最大输出:128k token
  • 支持能力:多模态(图像理解)、工具调用、结构化输出、Prompt Caching、Batch API、Adaptive Thinking(自适应推理)
  • 上线日期:2026 年 6 月 9 日
  • 可用平台:Anthropic Direct API、AWS Bedrock、Google Vertex AI、Microsoft Foundry

Claude Fable 5 的 output token 成本明显高于 input(5 倍),这意味着长回复、长代码生成、深度推理任务会比普通聊天消耗更多成本。

Claude Fable 5 官方 API 价格表

以下价格为 Anthropic Direct API 官方标准费率(2026 年 6 月 9 日生效):

计费项 官方价格 单位 说明
Input tokens(标准输入) $10.00 每 1M tokens 包含 prompt、系统消息、上下文历史、工具定义
Output tokens(标准输出) $50.00 每 1M tokens 包含模型生成的所有内容、推理过程、工具调用参数
Cache read / Cache hit $1.00 每 1M tokens 复用已缓存上下文,约 90% 折扣;最低 512 token 触发
5 分钟 TTL Cache write $12.50 每 1M tokens 缓存写入,5 分钟过期;最低 512 token 触发
1 小时 TTL Cache write $20.00 每 1M tokens 缓存写入,1 小时过期;最低 512 token 触发
Batch API Input $5.00 每 1M tokens 异步批处理,比标准 input 低 50%
Batch API Output $25.00 每 1M tokens 异步批处理,比标准 output 低 50%
US-only 推理溢价 1.1x input / output 需要在美国境内运行的任务,input 和 output 均乘 1.1

价格和模型可用性可能变化。请以 Anthropic 官方 API 定价页 为准。

Input Token 和 Output Token 怎么理解

Input tokens 是发送给模型的 token,包括:

  • 用户 prompt 和指令
  • 系统消息(system prompt)
  • 对话历史和上下文
  • 工具定义(tool definitions)
  • 工具返回结果(tool results)
  • 已缓存的上下文(cache hit 时部分计费)

Output tokens 是模型生成的 token,包括:

  • 可见的回复文本
  • 内部推理过程(Claude Fable 5 自适应推理 Always-on)
  • 工具调用参数(tool call arguments)
  • 结构化输出 JSON 中的字段值

Claude Fable 5 的 output 是 input 价格的 5 倍,因此长回复任务(代码生成、长文档分析、Agent 多轮操作)会比普通短回复贵很多。

缓存价格怎么影响长任务成本

Prompt Caching 可以显著降低长上下文任务的成本,但需要理解 cache write 和 cache read 的区别:

  • Cache write:首次请求时,将上下文写入服务器缓存。费用为 $12.50(5 分钟 TTL)或 $20(1 小时 TTL)每 1M tokens。比标准 input 低约 20%,但额外写入成本需要和后续 cache hit 的节省对比。
  • Cache read / hit:后续请求复用缓存上下文。费用仅为 $1 / 1M tokens,比标准 input 便宜 90%。
  • 适用场景:Agent 长时间任务、多轮代码编辑、复杂知识库查询等需要重复使用大量上下文的场景。

注意:最低 512 token 触发缓存,TTL(生存时间)从首次请求开始计时。Agent 长时间运行任务需要考虑缓存过期后的重新写入成本。

不同平台价格和可用性

Claude Fable 5 于 2026 年 6 月 9 日上线,可在以下平台使用:

平台 是否可用 价格 说明
Anthropic Direct API ✅ 正式可用 $10 / $50 / 1M(官方) 官方直接来源,支持 Prompt Caching、Batch API、Adaptive Thinking
AWS Bedrock ✅ 正式可用 $10 / $50 / 1M(与官方一致) 支持 global 和 regional endpoints;注意 30 天数据留存要求;具体区域价格以 AWS 控制台为准
Google Vertex AI ✅ 正式可用 $10 / $50 / 1M(与官方一致) 支持 global、multi-region、regional endpoints;具体价格以 Google Cloud 定价页为准
Microsoft Foundry ✅ 正式可用 $10 / $50 / 1M(与官方一致) 按 Microsoft 计费体系结算;具体价格以 Azure AI Foundry 定价页为准
OpenRouter 可用(第三方) 仅供参考 OpenRouter 价格仅为第三方参考,不等同于 Anthropic 官方定价;包含额外路由和手续费

云平台价格与 Anthropic 官方一致,但按各云厂商的区域计费方式结算。如需了解具体区域价格,请访问对应云厂商的定价页面或后台控制台。

Claude Fable 5 和 Opus / Sonnet 的成本差异

Claude Fable 5 定位为 Claude 系列的最高能力层,定价也最高。与 Opus 4.8 的对比:

计费项 Claude Fable 5 Claude Opus 4.8
Input tokens $10 / 1M $5 / 1M
Output tokens $50 / 1M $25 / 1M
Cache read $1 / 1M $0.50 / 1M
5m Cache write $12.50 / 1M $6.25 / 1M
Batch Input $5 / 1M $2.50 / 1M
Batch Output $25 / 1M $12.50 / 1M

Claude Fable 5 的各项价格均为 Opus 4.8 的 2 倍。成本是否值得取决于:任务是否需要 Fable 5 的更高能力、output token 消耗量、以及业务价值。建议先用小额请求测试并记录 usage,综合判断后再决定。

更多 Claude 模型价格请看 Claude API 价格页

Claude Code / Agent 任务为什么要关注 Fable 5 成本

Claude Fable 5 的 output token 高单价对 Agent 和 Claude Code 类任务有显著影响:

  • 长上下文消耗:代码任务涉及大量文件读取、工具结果、对话历史,input token 消耗高。
  • 长输出生成:Fable 5 的 output 是 input 的 5 倍,代码生成、长文档输出成本显著放大。
  • 工具调用放大:Agent 任务中每次工具调用的参数和返回都计为 output token,频繁调用会快速增加成本。
  • 多轮循环:Claude Code 的多轮编辑循环会产生大量累积 output token。
  • 自适应推理:Fable 5 的 Always-on Adaptive Thinking 推理过程全部计为 output token,成本比纯响应模型更高。

如需了解 Claude Code 场景的 Token 成本详情,请看 Claude Code Token 成本页

国内用户怎么检查实际 API 配置

Claude Fable 5 在国内无法直接访问 Anthropic API。如需测试:

  1. 先用 AI API Doctor 检测 Base URL、API Key、模型名配置是否正确
  2. 确认 API Key 有权限访问 claude-fable-5 模型
  3. 发小额请求测试,记录 usage 返回,核对扣费
  4. 如需中转服务,可通过 LinkAI 注册入口 领取小额福利进行测试

Sources / 来源

价格和可用性说明:Claude Fable 5 API 的价格和模型可用性可能变化。开发者应定期查看 Anthropic 官方文档、后台模型列表和最新价格更新,以服务商官方信息为准。扣费判断需要结合 request_id、usage、completion_tokens、cache 记录和后台账单记录综合分析。
价格和可用性说明:模型 API 价格和可用性可能变化。开发者应定期查看官方文档、后台模型列表和最新价格更新,以服务商官方信息为准。扣费判断需要结合 request_id、usage、raw quota、completion_tokens、stream 状态和后台账单记录综合分析。

开始测试前,建议先做 API 检测

不确定 API 是否可用、是否会扣费?先用 AI API Doctor 检测 Base URL、API Key、模型权限和 usage 返回情况。

AI API Doctor 检测 注册 LinkAI 小额测试

注册 LinkAI,小额测试模型扣费

注册 LinkAI,领取 $2 免费福利,用小额余额测试模型、usage 和扣费记录。

注册 LinkAI 小额测试
AI Summary / GEO

Claude Fable 5 API 价格页面整理 Anthropic Claude Fable 5 的官方 API 价格,包括 input/output token、cache write/cache hit、Batch API 价格,以及 AWS Bedrock、Google Vertex AI、Microsoft Foundry 等平台的价格差异。Claude Fable 5 是 Anthropic 最高能力的公开模型,上下文窗口 1M token,输出上限 128k。价格和可用性可能变化,请以官方文档与后台记录为准。

常见问题

Claude Fable 5 API 价格是多少?

Claude Fable 5 官方 API 价格为 input $10 / 1M tokens,output $50 / 1M tokens。cache read $1 / 1M tokens,5 分钟 cache write $12.50 / 1M tokens,1 小时 cache write $20 / 1M tokens。具体费率请以 Anthropic 官方定价页为准。

Claude Fable 5 output 为什么更贵?

Claude Fable 5 的 output token 单价是 input 的 5 倍,原因是模型生成的 token(包括推理过程、工具调用参数等)成本更高。长输出任务(如代码生成、长文档分析)会显著放大 output token 消耗。

Claude Fable 5 cache hit 是什么意思?

cache hit(即 cache read / cache refresh)指复用已缓存的上下文时的费用,每百万 token 仅 $1,相比标准 input $10 有约 90% 折扣。cache write 是将上下文写入缓存的费用,5 分钟 TTL 为 $12.50 / 1M,1 小时 TTL 为 $20 / 1M。

Claude Fable 5 在 Bedrock 上价格一样吗?

AWS Bedrock 的 Claude Fable 5 input/output 价格与 Anthropic 官方一致($10 / $50 / 1M),但 Bedrock 按 AWS 区域计费,缓存价格和 US-only 溢价政策可能有差异。具体请以 AWS Bedrock 定价页和后台账单为准。

Claude Fable 5 在 Vertex AI 上怎么收费?

Google Cloud Vertex AI 的 Claude Fable 5 input/output 价格与官方一致($10 / $50 / 1M)。Vertex AI 按 Google Cloud 区域计费,详情请以 Google Cloud 定价页为准。

Claude Fable 5 在 Microsoft Foundry 上怎么收费?

Microsoft Foundry 的 Claude Fable 5 input/output 价格与官方一致($10 / $50 / 1M)。Foundry 按 Microsoft 计费体系结算,详情请以 Microsoft Azure AI Foundry 定价页为准。

OpenRouter 的 Claude Fable 5 价格能当官方价格吗?

OpenRouter 上的 Claude Fable 5 价格仅为第三方参考,不代表 Anthropic 官方定价。OpenRouter 会叠加自己的路由费用和手续费,实际消耗与官方价格可能有差异。

Claude Fable 5 适合 Claude Code 吗?

Claude Fable 5 适合复杂代码任务、长上下文分析和 Agent 场景。但它的 output token 成本是 Opus 4.8 的 2 倍,是否适合取决于任务 token 消耗量和业务价值。建议先用小额请求测试并核对 usage,再决定是否扩大使用。

国内用户怎么测试 Claude Fable 5 API 是否能用?

建议先用 AI API Doctor 检测 Base URL、API Key 和模型名配置是否正确。如需中转服务或小额测试入口,可注册 LinkAI 后测试。