加载失败
这起讨论围绕 Anthropic 的 Claude Code(一个面向编程的 Claude 工具)的官方 GitHub 仓库疑似源码泄露后,GitHub 按 DMCA 通知批量处理 forks。GitHub 公布的说明提到,当被指控侵权的 repository network 超过 100 个仓库时,会把整组 forks 一起下架,这次甚至波及约 8.1K 个仓库和 parent repository。随后又有人引用 Claude Code 负责人的公开表态,称并不是 Anthropic 主动 DMCA 这些 forks,暗示更可能是平台自动化或沟通失误。评论因此延伸到 AI 公司版权双标、泄露源码的不可逆传播,以及 GitHub/Microsoft 作为中心化基础设施的控制力问题。
不少人把这事解读为 AI 公司版权双标:训练时能大规模抓取互联网内容,轮到自己的源码外泄就立刻动用 DMCA。有人直接把 Anthropic 说成“对自己有利时讲版权、对外界时讲开源精神”的典型,甚至希望这些公司最终倒下,让更便宜、更开放的模型接手市场。也有人试图区分“公开网页数据”和“泄露的商业源码”,但回应者强调 AI 公司早就对论文、书籍、杂志和付费内容做过类似的灰色抓取。这个分歧本质上是在争论:AI 时代的版权主张到底有没有一致标准。
另一派认为大规模下架更像 GitHub 的自动化误伤,而不是 Anthropic 亲自把所有 forks 都告了。有人引用了 Claude Code 负责人的公开表态,称他们并没有 DMCA 这些 forks;还有人贴出 GitHub 的说明,表示当被指控侵权的 network 超过 100 个仓库时,平台会把整组 forks 一起处理,连 parent repository 也可能被卷进去。实际受影响的人说,自己几个月没动过的 fork 也收到了通知,而且其中并不包含泄露源码,随后又表示问题很快被修正。这个视角把重点放在 GitHub 的流程、阈值和沟通失误上。
不少评论认为,这类源码一旦泄露就已经“收不回来了”。有人指出大家早就把代码拉到本地,GitHub 真删掉也只会让它转移到其他 source forge,上演一次“no take backsies”。还有人说该项目已经被 port 到 Python,而新的实现不一定落在同一份 DMCA 里;也有人反问,既然代码并不算多复杂,Anthropic 何不直接 open source。这个观点更像是在说:平台下架只能控制可见性,无法真正阻止传播和再实现。
还有一条更宏观的批评线索:把代码托管和讨论区都押在 GitHub 上,本身就是把基础设施交给了 Microsoft。评论者提到 xz util backdoor 事件后,仓库和讨论串都曾一起消失,给人的感觉不是正常治理,而是平台可以随时删库、删讨论,甚至重写历史。有人把这种做法称为 private conflict resolution,认为它把本该公开的技术争议变成了封闭处理。还有人顺带抱怨,AI 公司不仅影响代码分发,也在推高 RAM 价格,进一步强化了“巨头控制基础设施”的不安。
DMCA: 美国《数字千年版权法》;在 GitHub 上常被用作版权下架通知的法律依据。
fork 网络: GitHub 中由同一仓库派生出的 forks 集合;在批量投诉时可能被整组处理。
takedown notice: 版权方发出的下架请求,平台据此移除被指控侵权内容。
leaked source code: 未经授权流出的源码;一旦被复制到本地或其他平台,通常很难彻底回收。