加载失败
这条消息讨论的是小米 MiMo-v2.5 系列 API 的永久降价,标题里的 99% 主要被评论者解释为针对 cached inputs,而不是所有调用都统一大打折扣。评论区把它放进中国 AI 厂商的更大价格战里看,尤其是 DeepSeek(一个中国 AI 模型与 API 提供方)此前也曾大幅降价。有人引用 OpenRouter(一个聚合多个模型 API 的转发平台)上的第三方价格,怀疑低价来自补贴、国产硬件和效率优化,也有人认为这是为了抢市场、换使用量或真实数据。讨论还延伸到实际落地:有人把 DeepSeek 和 MiMo 接进 Claude Code(Anthropic 的代码助手)或 VSCode + Cline(一个编程代理扩展),觉得对轻量开发已经足够好用。
不少评论把这次降价看成明确的市场份额战,而不是普通促销。有人直接把它类比为“先免费、再收费”的模型开放策略:先把用户拉进来,再靠生态和使用量建立优势。也有人认为这会继续压低美国厂商的定价空间,让 Anthropic、OpenAI 这类公司的高估值更难自洽。还有评论把它上升到“中国让 AI 像 EV 一样普及”的产业逻辑。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]
关于为什么能便宜到 99%,评论主要给出几种解释。第一是成本端更低:便宜电力、国产 GPU、Huawei Ascend AI Accelerators、自己做的推理芯片,以及 CXMT 的廉价 RAM。第二是模型和硬件协同优化,DeepSeek 的研究成果被反复提到,推理架构可能就是按国产算力设计的。第三是商业补贴:有人认为厂商在用低价换真实使用数据,或者直接由别的业务和政府补贴做 loss leader;还有人猜测会通过新加坡等境外主体或公共 GPU cloud 来跑推理。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10]
评论区里也有很多实际使用反馈,而且大多偏正面。有人说 DeepSeek V4 Flash 在 high 设置下已经接近 Claude Opus 4.7 的能力,速度快而且几小时对话只花几美分。也有人把 DeepSeek API 接进 Claude Code,甚至在 VSCode + Cline 里用 MiMo v2.5 Pro 跑日常开发,觉得比 Claude 和 Codex 还顺手。另有用户提到自己的月度额度被直接拉到 38 billion tokens,说明这些低价方案对轻量工作几乎是“随便用”。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]
真正的细则里并不只有“永久降价”四个字。有人指出 99% 的折扣只针对 cached inputs,而不是所有请求都一律打到最低价,甚至有评论说它现在大致和 DeepSeek v4-pro 同价。还有人发现 off-peak 时段是北京时间 00:00–08:00,等于北美西海岸白天,这让“低价”更像是按地域和时间切开的定价游戏。围绕 token、unit、cache hit/cache miss 的换算,也暴露出 API 套餐本身非常复杂。
另一个分支讨论是隐私和地缘政治风险。有人担心把日记、社交媒体导出或其他文本喂给中国托管的模型后,里面的政治表述会在未来变成入境风险。反对者则指出,美国同样会基于网上言论拒绝入境,说明把数据交给任何大国平台都不太安全。这个分歧本质上是在问:为了便宜和性能,用户愿意把多少个人信息交给境外基础设施?
cached inputs: 已缓存的输入上下文;命中缓存后通常按更低价格计费。
DeepSeek V4 Flash: DeepSeek 的轻量/高速模型版本,被多次拿来和 Claude 做能力与成本对比。
Claude Code: Anthropic 的代码助手工具,可接入外部模型 API 做编程工作流。
Cline: VSCode 里的 AI 编程代理扩展,常与大模型 API 搭配使用。