罗福莉：我不想打价格战

2026-04-07 | OpenClaw

四月初，一封来自Anthropic的邮件在AI开发者社区引发了剧烈震荡。

从即日起，Claude Pro与Max订阅用户将无法通过订阅额度访问OpenClaw等第三方Agent框架——想要继续使用，要么购买额外的用量包，要么转向按量付费的API接口。

这并非一次简单的服务条款更新。在行业观察者看来，Anthropic亲手撕开了一个长期存在的"灰色地带"：订阅制的定价逻辑原本基于个人用户的正常使用强度，但以OpenClaw为代表的自动化Agent工具带来的算力消耗远超预期——有重度用户每月仅支付200美元订阅费，却消耗了价值5000美元的算力资源。

就在市场还在争论"这算不算背刺"时，小米MiMo大模型负责人罗福莉在次日凌晨发出了一篇长文。她的关注点没有停留在表面的是非曲直，而是抛出了一个更根本的问题：这不是一次简单的定价矛盾，而是整个AI经济模式面临的结构性挑战。

被忽视的成本黑洞

要理解Anthropic这一刀为何如此果断，需要先看清订阅模式背后的成本账本。

罗福莉在文中直指核心："Claude Code的订阅系统是一套设计精美的算力分配机制，但我猜测它并不赚钱，甚至可能在亏本——除非API利润率能达到10-20倍，但我对此存疑。"

她进一步拆解了问题所在：第三方框架的上下文管理往往"写得很差"。一个用户请求之内，OpenClaw会触发多轮低价值的工具调用，每次都作为独立API请求发出，每次都携带超长的上下文窗口——往往超过10万token。即便存在缓存命中，也因频繁的上下文切换而大幅降低效率；极端情况下，还会拉高其他请求的缓存未命中率。

折算下来，每个用户请求实际触发的API调用次数，是Claude Code自身框架的好几倍。"换算成API定价，真实成本大概是订阅价格的几十倍。这不是差距，而是一个巨大的深坑。"

价格战的陷阱

Anthropic的封禁令第三方框架用户成本直接跳涨数十倍。舆论两极分化：有人痛斥"被背刺"，有人则认为"早该如此"。

但罗福莉没有急于站队。她转而向整个行业喊话："我想奉劝各大模型厂商，在弄清楚如何给coding订阅合理定价而不至于大出血之前，不要盲目地价格战到底。"

这个警告背后有清醒的逻辑：

"把token卖得极便宜，同时对第三方框架大开方便之门，对用户表面上是友好，但这是一个陷阱——Anthropic刚刚从这个陷阱里爬出来。"

价格战看似是让利给用户，但如果没算清楚成本结构，最终只会是厂商自己吞下亏损。更深层的问题在于：如果用户把精力都耗在低质量的Agent框架、不稳定且缓慢的推理服务、为降本而不得不缩水的模型上——最终发现什么都做不成。这对用户体验和留存而言，是一个彻头彻尾的恶性循环。

小米的答案：长期主义

那究竟该怎么做？罗福莉给出了小米的选择——MiMo Token Plan。

这套方案的核心逻辑与Claude新推出的extra usage包类似：支持第三方框架接入，按token配额计费。但关键差异在于定位——"因为我们追求的是长期稳定地交付高质量模型和服务，而不是让你冲动付费后弃船而去。"

这是一种更负责任的定价策略：按量计费让成本透明化，同时也倒逼框架方优化效率、减少浪费。

协同进化才是出路

在文章结尾，罗福莉给出了她对行业未来的判断：

"当前全球算力供给已经跟不上Agent创造的token需求。真正的出路不是更便宜的token，而是共同进化——更省token的Agent框架与更强大、更高效的模型的协同。"

这个判断切中了问题的七寸。Agent浪潮涌来后，token消耗量的增长是惊人的——罗福莉在前不久的中关村论坛上透露，推理需求过去一段时间已增长近10倍，今年全年可能达到100倍。

算力不够用已是行业共识。但问题不仅是"不够用"，还有"用得太糙"——粗糙的框架设计、庞大的上下文窗口、不必要的冗余调用——都在糟蹋算力。

从这个角度看，Anthropic这次无论有意还是无意，都在推动整个生态——开源和闭源——向更高效的方向演进。"这大概是件好事。"

文章发出后，开发者社区反应强烈。有人认同"这不是AI太贵，而是算力被糟蹋"；也有人追问：框架开发者能否足够快地把效率差距补上？

这些讨论指向一个更根本的趋势：AI服务的单位成本，从来就不是由模型单独决定的，而是由"模型×框架×context管理"三者叠加决定。编排层才是产品，而不仅仅是模型本身。

而这场关于定价和效率的讨论，才刚刚开始。