加载失败
这篇讨论围绕 Claude Opus 4.7(Anthropic 的 Claude 系列高端模型)仅凭短文本猜作者的能力展开,原帖拿 Kelsey Piper(常写技术/观点博客的作者)的文章片段做测试,评论里还有人把自己的博客、朋友的 Discord(聊天平台)发言和其他私密文本丢进去复现。争论背景是 stylometry(文体分析)和 deanonymization(去匿名化):模型不仅要判断文本是否像 AI 写的,还要把文本回指到具体人,而且测试者特意关闭 memory、使用 incognito Mode(无痕模式)并通过 API(程序接口)验证。有人担心这会让匿名发帖、记者写作和少数群体发言变得更容易被追踪;也有人认为这更像是对已知作者风格的强匹配,而不是对所有人都可用的万能识别器。部分评论还把话题延伸到 Bitcoin whitepaper(Bitcoin 的白皮书)和 Satoshi Nakamoto(Bitcoin 的匿名创造者)这类经典匿名身份谜题上。
不少人复现实验时都说,Opus 4.7(Anthropic 的 Claude 系列高端模型)只看一段短文就能猜中作者,甚至对一篇 475 词的博客草稿、朋友在 Discord(聊天平台)里的发言也能给出正确答案。有人用无痕模式和 API(程序接口)测试,仍然得到同样结果,说明这不只是账号记忆。更让人震惊的是,模型给出的解释常常很像事后拼出来的理由,但最终名字却屡次命中。
另一派更在意这是不是“真”stylometry(文体分析),还是训练数据污染、记忆或网页搜索带来的假象。评论里有人明确说关闭了 memory、在 incognito Mode(无痕模式)下、甚至换到朋友电脑和 API(程序接口)里测,还是能得到相同结果,但也有人提醒私密文本如果后来进入训练集,模型就可能把它和身份重新关联起来。还有人追问输入文本到底是公开还是私密,因为这两种情况对“模型真的会认人”意味着完全不同的能力门槛。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]
很多人把这个能力直接外推到未来的普遍去匿名化:只要网上留下足够多的文字,AI 就可能把匿名帖、邮件和博客重新连回真实身份。有人提出用本地 LLM(本地大模型)先把自己的文字“去风格化”,或者干脆尽量少上网发言;也有人提到早年 HN(Hacker News 论坛)就有人做过按写作相似度找用户的工具。悲观者担心,等识别变得足够强时,匿名并不是消失,而是会被大幅抬高成本。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]
也有人觉得这没那么神,因为识别一个已知作者的强烈风格,未必比判断一段文字是不是 LLM(大语言模型)生成的更难。大家拿 Wes Anderson(美国导演)或 Bob Dylan(美国歌手)做类比:如果作品风格足够鲜明,人类也常常能一眼认出来。按照这个看法,Kelsey Piper(常写技术/观点博客的作者)只是一个很适合被模型抓住风格特征的样本,不代表系统已经能通吃整个互联网。
有人特别在意模型到底是怎么得出结论的,但 Opus 4.7(Anthropic 的 Claude 系列高端模型)的 CoT(chain-of-thought,思维链)据说被隐藏了,外界只能看到由 Haiku(Claude 系列较轻量模型)整理过的摘要。评论里有人还试了“vibes only”之类的提示词,模型几乎不展开推理,直接吐出名字。于是大家怀疑,那些看起来很聪明的解释可能只是事后包装,而不是它真正做决定的过程。
另一条支线是在讨论例子选得是否合适:原文用 gay / trans 等少数群体来说明匿名的重要性,结果有人抱怨这像是在把隐私说成“少数人的问题”。反驳者则认为正是这些群体更容易因为身份暴露而遭遇现实伤害,所以用具体案例能更直观地说明匿名的必要性,而不是降低讨论质量。这个分歧最后扩展到公众对 gay rights、abortion 和 trans rights 的态度变化,以及匿名在社会冲突中到底是保护还是包庇的问题。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12]
还有人把测试对象扩展到 Bitcoin whitepaper(Bitcoin 的原始白皮书)和 Satoshi Nakamoto(Bitcoin 的匿名创造者),但马上有人提醒,这类案例已经被大量“猜作者”叙事污染,噪声太大。也有人建议只用 2009 年前的 mailing list(邮件列表)档案做训练,或者拿 Adam Back(Bitcoin 早期圈内人物)的文本做对照。这个分支体现出大家既兴奋又谨慎:经典匿名谜题很适合拿来玩,但未必适合当干净 benchmark(基准测试)。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]
stylometry: 通过用词、句式、节奏等写作特征来识别作者或判断文本来源的分析方法。
deanonymization: 把匿名文本、账号或行为重新关联到真实身份的过程。
CoT (chain-of-thought): 模型生成答案时的中间推理链,也就是“思维链”;这里讨论的是它是否可信、是否可被查看。