News Hacker|极客洞察

21 1 天前 github.com
😒Claude Code 源码泄露后,GitHub 误 DMCA 8.1K forks 引双标争议
把 8.1K 个 fork 一锅端,就叫版权正义?

🎯 讨论背景

这起讨论围绕 Anthropic 的 Claude Code(一个面向编程的 Claude 工具)的官方 GitHub 仓库疑似源码泄露后,GitHub 按 DMCA 通知批量处理 forks。GitHub 公布的说明提到,当被指控侵权的 repository network 超过 100 个仓库时,会把整组 forks 一起下架,这次甚至波及约 8.1K 个仓库和 parent repository。随后又有人引用 Claude Code 负责人的公开表态,称并不是 Anthropic 主动 DMCA 这些 forks,暗示更可能是平台自动化或沟通失误。评论因此延伸到 AI 公司版权双标、泄露源码的不可逆传播,以及 GitHub/Microsoft 作为中心化基础设施的控制力问题。

📌 讨论焦点

AI 版权双标争议

不少人把这事解读为 AI 公司版权双标:训练时能大规模抓取互联网内容,轮到自己的源码外泄就立刻动用 DMCA。有人直接把 Anthropic 说成“对自己有利时讲版权、对外界时讲开源精神”的典型,甚至希望这些公司最终倒下,让更便宜、更开放的模型接手市场。也有人试图区分“公开网页数据”和“泄露的商业源码”,但回应者强调 AI 公司早就对论文、书籍、杂志和付费内容做过类似的灰色抓取。这个分歧本质上是在争论:AI 时代的版权主张到底有没有一致标准。

[来源1] [来源2] [来源3] [来源4] [来源5]

GitHub 误伤与自动化下架

另一派认为大规模下架更像 GitHub 的自动化误伤,而不是 Anthropic 亲自把所有 forks 都告了。有人引用了 Claude Code 负责人的公开表态,称他们并没有 DMCA 这些 forks;还有人贴出 GitHub 的说明,表示当被指控侵权的 network 超过 100 个仓库时,平台会把整组 forks 一起处理,连 parent repository 也可能被卷进去。实际受影响的人说,自己几个月没动过的 fork 也收到了通知,而且其中并不包含泄露源码,随后又表示问题很快被修正。这个视角把重点放在 GitHub 的流程、阈值和沟通失误上。

[来源1] [来源2] [来源3]

泄露源码的不可逆传播

不少评论认为,这类源码一旦泄露就已经“收不回来了”。有人指出大家早就把代码拉到本地,GitHub 真删掉也只会让它转移到其他 source forge,上演一次“no take backsies”。还有人说该项目已经被 port 到 Python,而新的实现不一定落在同一份 DMCA 里;也有人反问,既然代码并不算多复杂,Anthropic 何不直接 open source。这个观点更像是在说:平台下架只能控制可见性,无法真正阻止传播和再实现。

[来源1] [来源2] [来源3] [来源4]

GitHub/Microsoft 基础设施集中化

还有一条更宏观的批评线索:把代码托管和讨论区都押在 GitHub 上,本身就是把基础设施交给了 Microsoft。评论者提到 xz util backdoor 事件后,仓库和讨论串都曾一起消失,给人的感觉不是正常治理,而是平台可以随时删库、删讨论,甚至重写历史。有人把这种做法称为 private conflict resolution,认为它把本该公开的技术争议变成了封闭处理。还有人顺带抱怨,AI 公司不仅影响代码分发,也在推高 RAM 价格,进一步强化了“巨头控制基础设施”的不安。

[来源1] [来源2]

📚 术语解释

DMCA: 美国《数字千年版权法》;在 GitHub 上常被用作版权下架通知的法律依据。

fork 网络: GitHub 中由同一仓库派生出的 forks 集合;在批量投诉时可能被整组处理。

takedown notice: 版权方发出的下架请求,平台据此移除被指控侵权内容。

leaked source code: 未经授权流出的源码;一旦被复制到本地或其他平台,通常很难彻底回收。