News Hacker|极客洞察

⚠️OpenClaw 有危险:agentic models、prompt injection 与权限泄露风险
把电脑权限交给会被 prompt injection 的 agent,是要自砸吗?

🎯 讨论背景

OpenClaw 被讨论为一种可让 LLM 调用本地工具、访问系统并执行长序列任务的 agent 类工具,核心争论在于这种能力是否会把模型的安全漏洞直接带到用户机器上。评论基于两个前提:LLM 仍然容易受到 prompt injection 与后门影响;agentic models 的 tool calling 与长期执行能力会把这些漏洞放大。有人提出把模型的“planning”与“execution”分离,或在物理上隔离运行环境(例如独立的 Raspberry Pi、独立网络与账号)以降低风险,但也承认这会牺牲便捷性。讨论同时把技术风险与长期存在的制度性问责不足联系起来,认为监管与责任分配尚未跟上技术普及的速度。

📌 讨论焦点

prompt injection 不可避免的攻击面

多位评论者认为 prompt injection 对 agentic models 并非理论性风险而是必然会发生的安全问题。攻击者可以在输入中植入恶意指令,诱导模型泄露私有数据或执行非预期操作,评论指出这在能调用工具的 agent 中尤其危险。作为直接应对,被提出的可行做法是把模型的“planning”与实际系统“execution”分离,用受信任的代码层进行系统交互以减少被注入的影响。讨论中还提到组合攻击(如评论里所称的“lethal trifecta”)与模型后门会进一步放大这一风险。

[来源1] [来源2] [来源3]

大规模用户与无知带来的账号/数据外泄风险

有人警告 OpenClaw 被成百上千用户使用,而大多数用户不了解把 LLM 授予系统权限会带来的后果。具体威胁包括账号被劫、加密货币或银行资金被盗、私有文件被复制并传输出去等实质性损失。评论还质疑行业对安全的重视程度,认为如果这是传统软件工程上的明显漏洞,责任人早该被追究,但现实中普遍缺乏问责与安全意识。多条回复因此强调,普及到非专业用户会把这类问题从实验室扩大到个人层面并造成真实损失。

[来源1] [来源2] [来源3] [来源4]

agentic models 与 tool calling 放大攻击面

评论强调新一代 agentic models(能自主规划并调用外部工具的 LLM)比传统对话模型危险得多,因为它们具备 tool calling 和 long-horizon execution 能力。模型不仅能生成文本,还能调用 API、运行命令或操控本地工具,使得后门或恶意逻辑能直接影响主机或持久化。有人指出,开放模型或开源中文模型更容易被植入 backdoor,且一旦获得对主机的“自由支配”,攻击者可以做出严重操作。综合来看,agentic 能力在没有严格权限与监督的情况下把理论漏洞变成了实际可被利用的入口。

[来源1] [来源2] [来源3]

缓解策略与权衡:隔离、分层执行与可用性损失

多名评论者提出把 planning 与 execution 分离、用受信任代码负责系统交互是当前较安全的做法。实务上有人选择把 agent 放到物理隔离的设备或独立网络上运行,例如在独立的 Raspberry Pi(单板计算机)上、使用独立聊天账号与隔离网络,从而把 API keys 与主机隔离。评论同时指出这些方法会降低便捷性,且演示性的远程控制或所谓“现场修复”的秀场行为可能误导普通用户低估风险。总体看,缓解手段存在可行性但要求用户具备更高的安全意识和额外运维成本。

[来源1] [来源2] [来源3]

制度性与历史类比的担忧

另一些评论把 OpenClaw 的问题放在更广的制度与历史背景下审视,认为企业、政府或法律体系长期存在的自动化决策无问责问题并非新事。评论用 Wright brothers 的早期飞机或 Titan 潜水器类比,说明新技术既带来进步也有被广泛复制的危险,只是这次的普及速度和激励结构不同。有人强调这类 agentic 技术将制度性缺陷下放并放大到个体层面,使得个人承担更多风险而监管与责任尚未跟上。整体讨论既有技术细节的担忧,也有对监管与问责缺失的系统性批评。

[来源1] [来源2] [来源3] [来源4] [来源5]

📚 术语解释

OpenClaw: OpenClaw(一个让 LLM 调用本地工具并执行多步任务的 agent 工具/项目),被评论指可能获得系统权限、访问私有数据并在无充分监督下执行命令。

prompt injection: prompt injection:向模型输入中嵌入恶意或误导指令,使 LLM 按攻击者意图执行或泄露信息,是可被滥用以控制 agent 的主要攻击手法。

agentic models: agentic models:具备 agent 行为的 LLM 架构,能自主规划、多步决策并调用外部工具(tool calling),其 long-horizon execution 特性显著扩大了攻击面与自治风险。