News Hacker|极客洞察

194 11 小时前 businessinsider.com
🤦Uber COO质疑AI tokenmaxxing回报,HN痛批拿token当KPI
多烧 token 就算绩效,那还要代码质量干嘛?

🎯 讨论背景

这条新闻来自 Uber COO 对外表示:在和 Uber 的 senior engineering leaders(高级工程领导层)交流后,他开始怀疑更高的 AI token 消耗并没有带来成比例的 consumer features(面向用户的功能)。这里的 token 指 LLM(大语言模型)处理和计费时的文本片段单位,tokenmaxxing 则是把“多用 AI”本身当成一种被奖励的行为。评论区迅速把它和 Goodhart's law(指标异化)联系起来,也拿它类比 LoC、AWS spend 或其他容易量化但容易作假的工程指标。与此同时,很多人提醒 Uber 这类平台本身有大量全球化和本地化复杂度:网约车、外卖、机场接送、地方税费、各国法规和市场配置都会持续消耗工程资源,所以“到底算不算值得”并没有表面上那么简单。

📌 讨论焦点

指标异化:token 不能当绩效

很多评论把这件事直接归结为 Goodhart's law:一旦 token 消耗变成目标,大家优化的就不再是业务结果,而是数字本身。有人把它类比成按 lines of code、在椅子上坐多久、meal allowance 超支,甚至 AWS spend 来考核工程师,都是容易画图但很差的代理指标。也有人用 TPS report、Token Per Second report 之类的梗来讽刺这种管理方式。整体结论很一致:把成本型指标当生产力信号,只会鼓励浪费。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

AI 有用,但应讲效率与学习

另一派并不否认 AI 的价值,但反对把“多用”本身神圣化。评论里反复提到,生成式输出常常难读、难审、容易引入 hallucinated features,还会让 junior 工程师少掉很多亲手做事和理解代码的学习机会。也有人强调,真正合理的做法是选对 model、reasoning level 和上下文策略,而不是无脑把 token 往上堆。这个视角把 AI 当工具,而不是让员工去追逐一个昂贵且失真的使用量。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

支持强推使用:先探索再谈效率

也有评论为 tokenmaxxing 提供了一种“探索期”辩护:组织里很多人天然抗拒新工具,所以需要自上而下的压力,才能逼大家试出真正有价值的 AI 工作流。支持者承认会有大量 waste,但认为这能换来少数高价值用例,类似早期互联网或 Web 普及时,不先强行铺开就很难发现机会。还有人说,领导层可以先鼓励 adoption,等大家熟悉后再切回效率和成本控制。反对者则觉得这很容易滑向管理层的 cargo cult。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

Uber 业务本身并不“简单”

一条重要背景线索是,很多人认为 Uber 的软件工作远不只是“打车 app 有几个页面”。评论举了机场接送、酒店出入口、地方税费、国家/城市法规、身份验证、一次性密码、不同市场的定制 UI 等例子,说明这类平台在全球化运营下会产生大量本地化和合规复杂度。有人还提到,真正消耗工程资源的往往是持续维护和市场配置,而不是表面上的核心匹配逻辑。尽管如此,也有人认为这不足以解释全部 headcount 和 AI 开支,怀疑还是存在明显的工程臃肿。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8]

管理层、VC 与羊群效应

不少评论把问题指向管理层和资本压力,认为 C-suite 之所以推 tokenmaxxing,是因为跟风最安全。有人说 board、VC、竞争对手和“别落后于 AI”的叙事共同制造了 herd mentality,让决策者宁愿做看起来正确的事,也不愿承担逆势判断的风险。还有人提到 layoffs、stack ranking、performance review 等机制,担心 token 指标最后会被拿来当新的考核武器。整体气氛是:很多高层未必真的相信这套东西,但会选择顺着潮流走。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10]

成本、补贴与部署方式的现实约束

另一个焦点是 AI 经济学是否能长期成立。有人提到 enterprise API 计费、cached tokens、前沿模型价格、按量付费和订阅补贴之间的落差,认为当前“重度使用”很多时候只是因为厂商在烧 VC 钱。也有人推测,等补贴结束后,企业会更偏向自托管 LLM、私有 GPU 集群,或者改用更便宜的 open weights models(开源权重模型)与本地推理。这个视角认为,tokenmaxxing 只是当下泡沫期的现象,未来会被真实成本和基础设施约束拉回去。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10]

📚 术语解释

tokenmaxxing: 刻意把 AI token 消耗拉高的做法,常被拿来当 adoption 或活跃度信号。

Goodhart's law: 当一个指标变成目标后,这个指标就不再可靠,容易被人为优化失真。

agentic coding: 让 AI agent 通过工具调用、反复迭代来完成编程任务的方式。

token budget: 个人或团队可用的 token 配额/预算,用来控制 AI 调用成本。

cached input tokens: 在多轮 agent 调用中反复复用的上下文 token,仍可能被计费,成本很容易膨胀。