News Hacker|极客洞察

292 13 小时前 api-docs.deepseek.com
💸DeepSeek V4 Pro 永久折扣引发编码代理与价格战讨论
永久打折都能扛住,谁还在乎利润率和现金流吗?

🎯 讨论背景

DeepSeek(中国 AI 公司)最近把 V4 Pro 的折扣改为永久有效,继续强化其低价 API 策略。评论里围绕 DeepSeek V4 Pro 和 V4 Flash 在 coding agent 场景里的实用性展开,很多人用 Claude Code(Anthropic 的编码代理/CLI)、OpenCode(开源 coding harness)、Pi(轻量可扩展 coding agent)、Zed(代码编辑器)和 OpenRouter(模型路由服务)去接入它。由于 agent 会反复读取上下文,cache 价格、KV cache 和 prompt caching 对真实账单影响很大,因此大家不仅看单价,还看多轮调用的累计成本。另一个背景是模型能力与隐私、合规的拉扯:DeepSeek 缺少部分 vision/multimodal 能力,而中国托管与 data retention 的争议让一些用户转向 Azure、deepinfra 或 secure enclave 方案。

📌 讨论焦点

接入现成编码代理

评论区大量讨论如何把 DeepSeek 接到现成的 coding agent 里,而不是等它自己的工具链。Claude Code(Anthropic 的编码代理/CLI)、OpenCode(开源 coding harness)、Pi(轻量可扩展 coding agent)、Zed(代码编辑器)以及 Copilot、gptel、OpenRouter、LiteLLM、deepclaude 等都被提到,可通过环境变量、代理层或 /model 切换模型。很多人认为关键不是某个厂商的壳,而是能否避免 vendor lock-in,并在同一工作流里按任务切换不同模型。常见做法是让 DeepSeek 负责编码和常规任务,遇到 vision、截图或更强推理时再切到 Claude、Opus 或其他多模态模型。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13] [来源14] [来源15] [来源16]

永久折扣与缓存经济

这次讨论最强的情绪是便宜,而且便宜得足以改变使用习惯。很多人直接把 V4 Pro 的价格拿去对比 Claude、Opus、GPT-5.5、Grok、GLM 和 Qwen,认为即使只看原始 token 价也已经很夸张。更关键的是 agent 工作流会频繁命中 cache,V4 Pro 的 cache read 和 input cache hit 价格被反复提起,大家算下来发现真实成本可能比同类模型低一个数量级。也有人补充说 V4 Flash 在工具型、多轮任务里更划算,而 V4 Pro 更慢但更适合一次性复杂推理;少数人则提醒它会更烧 token,实际账单不一定像标价那么漂亮。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13]

实战能力与速度取舍

不少人把 DeepSeek 当成日常编码和分析任务的主力,反馈集中在复杂 coding、issue triage、bug auto-fixing、log analytics、总结和信息抽取上,常被描述为够好而且便宜。有人说它在平均代码库和常见框架上几乎看不出和 GPT-5.5、Claude 的差距,甚至比 Sonnet 更顺手,只是速度偏慢、思考时间长。也有人明显不买账,认为它在某些任务上仍然只是平均水平,会失败、会多耗 token,或者连有效 JSON 计划都生成不好。还有人提到它的 chain of thought 很透明,至少比一些闭源竞争对手更适合观察模型怎么思考。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13]

隐私、托管与地缘政治

另一条线是对数据隐私和中国托管的担忧:有人担心聊天记录、env file、敏感项目内容会被扫描,甚至担心政策层面或政府介入。回应里则强调,这类风险并不只存在于中国模型,US 云和 AI 厂商同样会做日志留存、训练和法务响应,真正关键是是否有 zero data retention、secure enclave 或自建/本地部署。有人建议通过 Azure、deepinfra、Cortecs 或 Tinfoil 之类的中转或托管来获得更好的合规和私密性,但代价通常是失去 DeepSeek 最吸引人的低价。评论末尾还出现了关于 CCP、市场准入限制和会不会像 Huawei 一样被禁的强烈地缘政治争论。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13] [来源14] [来源15] [来源16] [来源17] [来源18] [来源19] [来源20] [来源21]

低价是否可持续

很多讨论在追问这种价格是否可持续。有人认为 DeepSeek 依靠小团队、低电价和更高效的 MLA architecture 才可能把推理成本打下来,也有人觉得它是在测试市场并借助缓存策略放大优势。另一派则把它放进更大的 AI 价格战里看:美国厂商靠 VC 补贴维持高价,DeepSeek 的低价会逼迫整个行业重新定价,甚至可能触发监管或限制。还有人引用 Jevons paradox,认为当模型变得足够便宜时,需求只会膨胀而不是消失。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13] [来源14] [来源15] [来源16] [来源17] [来源18] [来源19] [来源20]

📚 术语解释

harness: 把 LLM 包装成带工具、编辑、测试和计划流程的工作流外壳,常用于 coding agent。

KV cache: Transformer 推理中缓存 attention 的 key/value,用来减少重复计算并影响延迟和费用。

MLA architecture: DeepSeek 的 Multi-Head Latent Attention 架构,用更小的 KV cache 换更低推理成本。

prompt caching / cache read: 复用已见过的输入内容并按更低价格计费,在 agent 多轮调用里尤其关键。

zero data retention (ZDR): 服务商不保留用户提示词和输出日志的隐私策略。

OpenRouter: 把多个模型聚合到同一 API 的路由服务,方便切换 DeepSeek、Claude、GPT 等。