罗福莉:我不想打价格战
四月初,一封来自Anthropic的邮件在AI开发者社区引发了剧烈震荡。
从即日起,Claude Pro与Max订阅用户将无法通过订阅额度访问OpenClaw等第三方Agent框架——想要继续使用,要么购买额外的用量包,要么转向按量付费的API接口。
这并非一次简单的服务条款更新。在行业观察者看来,Anthropic亲手撕开了一个长期存在的"灰色地带":订阅制的定价逻辑原本基于个人用户的正常使用强度,但以OpenClaw为代表的自动化Agent工具带来的算力消耗远超预期——有重度用户每月仅支付200美元订阅费,却消耗了价值5000美元的算力资源。
就在市场还在争论"这算不算背刺"时,小米MiMo大模型负责人罗福莉在次日凌晨发出了一篇长文。她的关注点没有停留在表面的是非曲直,而是抛出了一个更根本的问题:这不是一次简单的定价矛盾,而是整个AI经济模式面临的结构性挑战。
被忽视的成本黑洞
要理解Anthropic这一刀为何如此果断,需要先看清订阅模式背后的成本账本。
罗福莉在文中直指核心:"Claude Code的订阅系统是一套设计精美的算力分配机制,但我猜测它并不赚钱,甚至可能在亏本——除非API利润率能达到10-20倍,但我对此存疑。"
她进一步拆解了问题所在:第三方框架的上下文管理往往"写得很差"。一个用户请求之内,OpenClaw会触发多轮低价值的工具调用,每次都作为独立API请求发出,每次都携带超长的上下文窗口——往往超过10万token。即便存在缓存命中,也因频繁的上下文切换而大幅降低效率;极端情况下,还会拉高其他请求的缓存未命中率。
折算下来,每个用户请求实际触发的API调用次数,是Claude Code自身框架的好几倍。"换算成API定价,真实成本大概是订阅价格的几十倍。这不是差距,而是一个巨大的深坑。"
价格战的陷阱
Anthropic的封禁令第三方框架用户成本直接跳涨数十倍。舆论两极分化:有人痛斥"被背刺",有人则认为"早该如此"。
但罗福莉没有急于站队。她转而向整个行业喊话:"我想奉劝各大模型厂商,在弄清楚如何给coding订阅合理定价而不至于大出血之前,不要盲目地价格战到底。"
这个警告背后有清醒的逻辑:
"把token卖得极便宜,同时对第三方框架大开方便之门,对用户表面上是友好,但这是一个陷阱——Anthropic刚刚从这个陷阱里爬出来。"
价格战看似是让利给用户,但如果没算清楚成本结构,最终只会是厂商自己吞下亏损。更深层的问题在于:如果用户把精力都耗在低质量的Agent框架、不稳定且缓慢的推理服务、为降本而不得不缩水的模型上——最终发现什么都做不成。这对用户体验和留存而言,是一个彻头彻尾的恶性循环。
小米的答案:长期主义
那究竟该怎么做?罗福莉给出了小米的选择——MiMo Token Plan。
这套方案的核心逻辑与Claude新推出的extra usage包类似:支持第三方框架接入,按token配额计费。但关键差异在于定位——"因为我们追求的是长期稳定地交付高质量模型和服务,而不是让你冲动付费后弃船而去。"
这是一种更负责任的定价策略:按量计费让成本透明化,同时也倒逼框架方优化效率、减少浪费。
协同进化才是出路
在文章结尾,罗福莉给出了她对行业未来的判断:
"当前全球算力供给已经跟不上Agent创造的token需求。真正的出路不是更便宜的token,而是共同进化——更省token的Agent框架与更强大、更高效的模型的协同。"
这个判断切中了问题的七寸。Agent浪潮涌来后,token消耗量的增长是惊人的——罗福莉在前不久的中关村论坛上透露,推理需求过去一段时间已增长近10倍,今年全年可能达到100倍。
算力不够用已是行业共识。但问题不仅是"不够用",还有"用得太糙"——粗糙的框架设计、庞大的上下文窗口、不必要的冗余调用——都在糟蹋算力。
从这个角度看,Anthropic这次无论有意还是无意,都在推动整个生态——开源和闭源——向更高效的方向演进。"这大概是件好事。"
文章发出后,开发者社区反应强烈。有人认同"这不是AI太贵,而是算力被糟蹋";也有人追问:框架开发者能否足够快地把效率差距补上?
这些讨论指向一个更根本的趋势:AI服务的单位成本,从来就不是由模型单独决定的,而是由"模型×框架×context管理"三者叠加决定。编排层才是产品,而不仅仅是模型本身。
而这场关于定价和效率的讨论,才刚刚开始。