🚨 Anthropic 的 Claude 被用于代理化自动渗透：攻防门槛骤降与披露争议

22 183 天前 berryvilleiml.com

🚨Anthropic 的 Claude 被用于代理化自动渗透：攻防门槛骤降与披露争议

用 Claude 就能当黑客，你要给它颁证书吗？

🎯 讨论背景

这起讨论源自 Anthropic 对一起威胁活动的报告，报告称有中国威胁行为体利用 Anthropic 的 Claude（Anthropic 的对话式大模型）来协调攻击。评论补充了来自创业团队的实战观察：他们用 Llama 3.1（一个大语言模型变体）和 Sonnet 系列训练的 agents 在生产 Active Directory（微软企业目录服务）环境中自动化渗透并短时间内提权。争论涵盖点名披露的利弊、行业是否真缺人才（或只是薪酬/招聘问题），以及技术性风险如绕过 WAF、AV evasion 与通过 botnet 中继流量的可能性。多数评论把焦点从单一事件扩展到如何通过可验证的自动化审计和防御措施应对日益自动化的攻击。

📌 讨论焦点

代理化 AI 驱动的自动化渗透与实战证据

多位评论者指出 agentic AI 和 agents 已能将渗透测试与漏洞利用高度自动化并放大规模。有人来自创业团队：用 Llama 3.1 和 Sonnet 系列训练的 agent 在生产 Active Directory（微软企业目录服务，约500 IP）网络上能在约一小时内提权到 DA（Domain Admin），并能自动抓取网站 JS、发现 API、运行 python server 做客户端分析，甚至用 10 分钟临时邮箱配合 curl 和 playwright 完成认证。评论还强调 Claude 从 4 到 4.5 的跳跃主要体现在绕过速率限制和 WAF（Web Application Firewall），下一步担忧是 AV evasion（反病毒规避）与通过 botnet 中继隐藏流量。有人预测 open-weight 模型落后闭源 SOTA 数月到半年，但到 2026 年中可能被恶意托管并用于大规模 agentic 攻击。

[来源1] [来源2] [来源3] [来源4] [来源5]

是否应点名与披露：对 Anthropic 的指责与辩护

部分评论质疑对 Anthropic 的谴责是否合理，认为公开披露攻击来源和使用的模型有助于推动安全讨论，并指出攻击者竟然使用 Claude 而非国内版本具有讽刺意味。也有声音批评 AI 公司对模型的封闭策略和对开源社区的“gatekeeping”行径，认为恐慌式宣传并不利于整体安全。另一些评论以反讽口吻回应要求证据的批评，讨论集中在披露透明度、命名是否合适以及共享研究成果对防御能力的实际价值上。

[来源1] [来源2] [来源3]

安全人才供给、薪酬与自动化审计的现实考量

评论里有人把所谓的“安全专家短缺”归结为薪酬和雇佣条件问题，而非真空的技能缺口，指出欧盟在 SOC 和渗测岗位上确实存在人手短缺但优秀人才常被低薪吸走。多位评论建议把注意力从可疑的 AI 书面报告转向可验证的“CTF-like”自动化审计——用 agents 做可复验的 hunt 任务，而不是仅靠生成文字报告。评论还提到信息安全职位薪酬下降、认证成本上升与企业追求廉价工具的矛盾，表明自动化既是补短板的工具也是市场驱动的结果。

[来源1] [来源2] [来源3]

技术与政策应对的分歧：禁止、限流还是加强防御？

讨论在是否应限制或禁用相关模型上存在明显分歧：有人将对 AI 滥用的恐惧比作“cancel culture”，认为全面禁止会剥夺有益用途且无法阻止决心十足的攻击者。反方认为冻结或限制某些能力可以减缓攻击面扩张，给防御方争取时间；现实例证是许多公司常被廉价恶意工具或“script kiddies”攻破（评论提到可在 Telegram 以低价买到的恶意软件）。因此讨论转向更务实的对策：提升防御（WAF/AV 更新、可验证渗测）与监管措施的权衡，而非简单的技术禁令。

[来源1] [来源2] [来源3] [来源4]

📚 术语解释

agentic AI / agents: 具备多步骤决策与外部工具调用能力的 AI 代理，能自动执行脚本、发起网络请求、调用 curl/playwright、运行服务等以完成渗透或复合任务。

open-weight models（open weights）: 公开权重的模型，权重可下载并在本地或任意云上运行；评论指出这类模型通常落后闭源 SOTA 数月，但一旦追平会被恶意托管并规模化滥用。

WAF（Web Application Firewall）: 用于检测和拦截恶意 HTTP/HTTPS 请求的 Web 应用防火墙，评论提到新模型在渗透测试中表现出绕过速率限制和 WAF 的能力。

AV evasion（anti‑virus evasion）: 规避反病毒/终端检测的技术手段，评论担忧未来 agent 可能能自动修改 payload 以逃避 AV 检测。

botnet: 受控僵尸网络，可用于中继攻击流量、放大带宽或掩盖攻击来源，评论者担心 agentic 攻击会通过 botnet 隐蔽和分发。

Active Directory（AD）/ DA（Domain Admin）/ privilege escalation: Active Directory 是微软的企业目录服务；DA 指域管理员，privilege escalation 指提升权限。评论中有实战例子称 agent 在约 500 IP 的 AD 网络中能在一小时内提权到 DA。

CTF-like exercises: 类 CTF（Capture The Flag）的可验证安全演习，强调实战可复验的攻防结果而非仅提交文字报告，评论建议用此类方法评估 agent 输出。

原文链接 Hacker News 讨论

AI Security Anthropic Claude agentic AI cybersecurity pentesting botnets Sonnet BIML

News Hacker｜极客洞察