SOTA Token Plan 支持 Claude Code 吗？

支持符合当前目录与配置要求的 Claude Code 工作流。

支持符合当前目录与配置要求的 Codex 工作流。

所有模型都有 1M 上下文吗？

不是。上下文上限取决于具体模型和工作负载，请查看当前模型目录。

不会。支持目录会随公开模型可用性和套餐规则调整。

需要。模型选择、上下文压缩和更大的上下文窗口都不能替代测试与人工审查。

架构规划、代码库审查和长时间实现，对上下文、速度和成本的要求并不相同。复杂调试可能需要能力更强的模型，重复修改则可能用更快、更便宜的模型就能完成。

SOTA Token Plan 把支持的模型放在同一个预付余额下。Claude Code 和 Codex 仍然是工作的界面，Token Plan 负责提供支持的模型接入，并记录余额如何消耗。

没有多模型方案时，测试不同厂商通常意味着多套账号、支付方式、余额和 API Key。偶尔试一次还好，一旦模型选择进入日常流程，这些管理工作就会变得烦琐。

共享余额不会让模型变得完全一样。它只是减少选择模型之前的账号准备，让用户把时间花在比较结果，而不是给多个服务分别充值。

先看任务，再选模型。架构、不熟悉的代码和困难调试，可以选能力更强的支持模型；机械性修改可以考虑速度更快或成本更低的模型。重要改动完成后，再用另一家模型做一次独立检查。

大上下文有助于 Agent 读取更多代码或保留更长的对话，但发送这些上下文本身也会消耗 Token。SOTA Token Plan 在符合条件的模型上支持最高 1M 上下文，并为适合的工作负载提供输入上下文压缩。

压缩和缓存不是一回事。压缩减少发送给模型的输入量；缓存则在模型厂商判定命中时复用上下文。Prehendo 会在支持的模型上提供一小时缓存配置，但是否命中仍取决于厂商和请求模式。

Token Plan 不保证所有模型都支持 Agent 的全部功能。模型版本和可用性会变化，套餐规则仍然有效，输出质量也与任务有关。长任务开始前应先查看当前模型目录，再用具有代表性的工作做一次测试。

按任务选择模型