2026 年 2 月 18 日,Anthropic 发布了 Claude Sonnet 4.6。数字本身已经很惊人:在大多数基准测试上达到了 Opus 4.0 水平的 92-95%,而每百万 token 的成本只有 Opus 4.6 的五分之一。
但对于运行常驻 AI agent 的场景来说,真正改变游戏规则的不是绝对性能——而是性价比曲线的拐点。
常驻 Agent 的成本困境
理解 Sonnet 4.6 为什么重要,需要先理解常驻 agent 的成本结构。
NanoClaw 这样的个人 AI 助手不是按需调用的 chatbot。它是一个常驻在你 WhatsApp 上的 agent,随时准备处理消息、执行任务、回答问题。这意味着 agent 的 token 消耗不是偶发性的——它是持续的。
每次有人在群里发消息,agent 都需要读取上下文、判断是否需要响应、如果需要则生成回复。在一个活跃的群组中,这可能意味着每天数百次的 API 调用。即使大部分调用是简短的判断("这条消息不需要我回复"),累积的 token 消耗也相当可观。
用 Opus 4.6 运行常驻 agent,月成本可能在 50-200 美元之间,取决于群组活跃度和任务复杂度。这对企业用户不是问题,但对个人用户来说是一笔不小的开支。
Sonnet 4.6 把这个数字压缩到了 10-40 美元。对于大多数个人用户来说,这是从"需要认真考虑是否值得"到"不假思索就能承受"的跨越。
性价比的质变时刻
成本下降不是线性的改善——它是一个质变。
经济学中有一个概念叫"价格弹性":当价格下降到某个阈值以下时,需求不是等比例增加,而是爆发式增长。对于 AI agent 来说,这个阈值大约在每月 30-50 美元——这是大多数技术爱好者愿意为一个实用工具支付的上限。
Opus 4.6 的定价把很多用途推到了这个阈值之上。你可以运行 agent,但需要小心管理使用量——限制群组数量,避免长对话,对复杂任务三思后行。这种使用体验是受限的,而受限的工具往往会被搁置。
Sonnet 4.6 把成本拉到了阈值之下。你可以让 agent 加入多个群组,处理更多消息,执行更复杂的任务,而不用时刻担心月底的账单。当成本不再是日常决策因素时,agent 才真正变成了一个"常驻"助手,而不是一个需要精打细算的奢侈品。
NanoClaw 的模型灵活性
NanoClaw 通过 Claude Agent SDK 调用模型,模型选择由 SDK 配置控制。用户可以在 Opus 和 Sonnet 之间切换,根据任务需求和预算约束做出选择。
这种灵活性在 Sonnet 4.6 发布后变得特别有价值。用户可以设置一个策略:日常的消息处理和简单问答用 Sonnet 4.6,成本低廉;复杂的分析、代码生成和多步骤任务用 Opus 4.6,质量更高。NanoClaw 的编排层支持这种按任务路由的模型选择,而且实现非常简单——因为选择模型和执行任务之间没有 NanoClaw 自己的抽象层。
对比那些在模型之上构建了复杂抽象的框架。当你有自己的 prompt 模板系统、工具调用封装和输出解析逻辑时,切换模型不是改一个配置的事——你需要验证所有这些抽象层在新模型上的行为是否一致。NanoClaw 没有这些层,所以切换就是切换,没有附带风险。
更广泛的影响
Sonnet 4.6 的定价不仅影响 NanoClaw。它改变了整个 AI agent 生态的经济学假设。
过去一年,"AI agent 太贵了"是最常见的采用障碍。企业会做 ROI 分析,个人用户会做预算计算,结论往往是"再等等,等成本降下来"。Sonnet 4.6 就是那个"降下来"的时刻——至少对于不需要最高推理能力的用途来说是这样。
这意味着常驻 agent 从一个早期采用者的玩具变成了一个实用工具的可能性大大增加。当运行成本低到可以忽略时,用户会开始发现那些在成本敏感时不会尝试的用途:让 agent 监控新闻、管理日程、处理重复性的通信、作为团队的信息中枢。
NanoClaw 的定位——一个通过 WhatsApp 运行的个人 AI 助手——在 Sonnet 4.6 的定价下变得更有吸引力。不是因为 NanoClaw 本身变了,而是因为运行它的经济约束放宽了。好的架构不需要随环境变化而变化——它等待环境向自己有利的方向移动。Sonnet 4.6 就是这样一次移动。