加载失败
这篇讨论围绕 Anthropic 公开的 Claude Opus 4.6 与 4.7 system prompt 差异展开,大家把提示词变动当成观察模型行为变化的窗口。system prompt 是在每次请求前注入的最高优先级指令,通常用来规定语气、拒答边界和工具使用方式;而 Claude Code(Anthropic 的编码代理/CLI)又有另一套单独的 harness 和 prompt。评论里还多次提到 prompt cache、context window 和 K/V cache,因为这些变更会直接影响延迟、token 成本和长会话质量。由于一部分安全策略也可能被做进 post-training 或新 foundation model 里,所以仅看 prompt diff 还不足以解释 4.7 的所有行为变化。
围绕 acting_vs_clarifying 的争论最激烈:一部分人欢迎 Claude 更少追问、直接按最合理理解先动手,觉得这比旧版动不动就问三四个澄清问题更顺手。另一部分人则强调,面对含糊需求时先发散实现常常会把意图带偏,所以他们宁愿强制模型先采访自己、输出计划文件,或者先给多选项让人批准。还有人已经在自己的 prompt 里写死“不要假设、先问我”,说明他们把澄清视为质量控制而不是摩擦。这个分歧本质上是“少打扰”与“别擅作主张”之间的权衡。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]
很多评论聚焦系统提示词的体量:有人统计出它已经是数万词、接近 8 万 token,担心这会吃掉 context window、增加延迟和推理成本。关于“每次请求是否都重新加载”的讨论也很热烈,大家提到 prefix cache、K/V cache、prompt cache TTL 等机制,说明虽然有缓存,但长 prompt 仍然会占 RAM、attention 和早期上下文空间。也有人认为这类超长 system prompt 本质上是 Anthropic 用来快速热修的补丁层,而不是应该无限膨胀的长期方案。另一些人则质疑把这么多规则写在 prompt 里是否比直接训练进 weights 更经济、更稳定。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13]
eating disorder 相关新增段落被不少人当成“常识性”安全提醒:如果用户真的有饮食障碍,模型不该轻率建议数卡路里、极端节食或自我监控饮食。反对者却认为,这类条款一旦不断加码,就会把原本少数场景的顾虑扩散成所有用户都要承担的通用护栏,最后还可能转入 post-training 变得更难审计。讨论里还出现了对法律责任的现实主义解读:大公司会因为潜在诉讼而优先规避“给高风险人群错误建议”的场景。相对强硬的批评则把它看成一种价值观控制,担心普通的营养、医学或自我实验问题也会被一并收紧。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11]
关于 malware 的抱怨主要是 4.7 过度把普通开发任务当成潜在攻击面,甚至在 IDE 里反复自我审查、拒绝工具调用,连正常数据分析脚本也会被当成风险。支持更严的安全的人认为,Claude 已经足够强到可以被滥用来写复杂 malware,尤其是能配合本地工具链自我修改、持续存在,因此需要更强的拒绝边界。反对者则认为这种“恶意软件恐慌”已经污染到 web-scraping、security research 和常规代码编辑,严重拖慢合法工作。也有人提醒,看到的行为未必全是 visible prompt 的结果,可能已经有 post-training 或 new base model 的改动。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11]
不少人注意到系统提示词的语气非常像在给一个具体人格写行为准则,而不是对“你”下命令:文中反复用第三人称的“Claude should”,并大量使用 can/should 这类 modal 表达。有人把这和 Anthropic 的 Claude Constitution 联系起来,认为他们是在让模型“扮演”一个稳定的 abstract entity,而不是把它当成纯工具。也有用户反感这种统一风格带来的硬编码偏好,例如默认保持简短、减少免责声明、避免继续追问等,认为这些应该模块化或由用户控制。对他们来说,系统提示词不只是规则,更是在塑造产品人格。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11]
还有人从版本学角度推断 4.7 可能不只是 prompt 改动:新的 knowledge cutoff、tokenizer 变化,以及 Claude Code 这类编码代理单独的 system prompt,都暗示它背后可能已有新的 foundation model 或至少不同的 harness。评论里也提到 Claude Code 的 prompt 没有公开,但可以通过 logging proxy 或第三方 diff 工具拿到,因此聊天版和编码版的行为不能直接互相外推。对比 4.6/4.7 时,prompt 文本、工具链和 model weights 都可能同时变动,导致“到底是谁改了行为”很难一眼看清。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10]
system prompt: 模型每次请求前注入的最高优先级指令,用来设定行为、风格和安全边界。
context window: 模型一次能容纳的上下文长度,prompt 越长越挤占用户输入。
prompt cache / prefix cache: 对固定前缀做缓存,避免重复计算,但仍会消耗一定资源。
K/V cache: attention 中缓存 key/value 的中间结果,用来降低重复前缀的计算成本。
post-training: 基础模型训练后进行的对齐/微调阶段,常用于把规则内化进模型。
Claude Code: Anthropic 的编码代理/CLI 工具,和 Claude.ai 聊天版使用不同的 system prompt/harness。
acting_vs_clarifying: 控制模型在信息不足时是先合理尝试还是先追问澄清的策略区段。