News Hacker|极客洞察

345 86 天前 ratsplaydoom.com
🐀把老鼠训练成《DOOM》玩家:开源装置、训练细节与伦理争论
让老鼠玩 DOOM 换糖水,这是研究还是虐待?

🎯 讨论背景

这是一个开发者在 Show HN 上分享的开源项目:作者为宠物老鼠搭建了以 trackball 驱动的 VR 装置,用《DOOM》做第一人称场景并用糖水作为奖励进行操作性条件训练。作者最初发布了 STL 网格和软件,但没有立即提供参数化源文件或完整带价 BOM,且在 v2 迭代期间老鼠“aged out”未完成全部行为验证,导致部分视频/结果缺失。讨论围绕可复现性(参数化文件、成本)、动物感知匹配(视场、触须空间)、训练时序(即时奖励与桥接信号)、伦理争议以及把装置扩展到其它动物的可行性展开,并多次引用 Skinner、clicker training 与 Project Pigeon 等行为学与历史参考来解释观点。

📌 讨论焦点

源码与可复现性:参数化模型与BOM费用

多位评论建议作者不要只发布STL网格文件,而应提供参数化源文件(可修改的 CAD/parametric 文件)以便快速缩放到 mice 或 cat 等不同动物并加快迭代速度。大家还希望在 BOM(Bill of Materials)中附上价格估算,这能让读者快速评估成本并找到降本点。作者回应承认匆忙发布是失误,表示会很快上传参数化文件与价格,并指出不同动物需要改动(更小/更大球、不同 ball driver 与弹簧)。社区普遍认为开源完整源文件能促进复制、改良和在行为实验室或爱好者间传播。

[来源1] [来源2] [来源3] [来源4]

训练与奖励时序(操作性条件作用)

评论区就训练机制展开技术讨论,强调奖励时序对学习效果至关重要:即时反馈(约 <300 ms)会产生最可靠的神经更新,半秒级延迟可能引发挫败感并削弱强化效果。有人把该实验与操作性条件作用(operant conditioning/ Skinner 框架)和 clicker training 类比,指出声音/点击可作为延迟奖励的桥接信号以保持行为的时序关联。也有观点认为延迟奖励是高阶智能的一部分(例如赌徒对延迟回报的反应),但总体建议在设计中最小化延迟并关注奖励剂量与频次(作者提及 10 μL 糖水等细节)。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

感知适配与显示设计:视场、触须与反馈

不少技术性建议集中在如何让视觉/触觉输入更贴合鼠类感知:老鼠眼位侧向、水平视场远宽于人类,评论建议渲染超宽 FOV(提出 ~250°)、或用双摄像机拼接并做 barrel projection 以降低视差不匹配。硬件上建议把屏幕环绕到球直径范围内以减小立体不一致并保留触须空间,触发器可设计为 chin-/bite-activated 以实现移动与射击同时操作。作者在回复里也提到使用 air-puffs 对应游戏中撞墙事件,并刻意避免阻塞触须区域以“maximize whisker space”。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

伦理与动物福利争议

评论里对伦理问题分歧明显:反对者认为不应把动物用于这类实验,尤其在不给动物选择权、并可能造成迷失或心理压力的情况下,把宠物固定在装置上令人不安。支持或缓和观点指出项目没有外科干预、仅用少量糖水,并可能比许多动保实验更人道,甚至视为对宠物的环境丰富化。社区关注的具体点包括:能否自由离开装置、长期糖水的健康风险、VR 对小动物认知的潜在迷惑,以及如何通过设计(奖励时序、奖励量、替代饮水方案)降低伤害。讨论还引用了 Skinner/点击训练等行为学背景来评估实验正当性。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

可复现性、录像与项目延续问题

很多人抱怨缺少可观测的 gameplay 视频与文档:帖子中有图像链接 404,且作者只展示了早期版本的录像,v2 在迭代期未能完成训练就停下导致没有完整演示。作者解释开发周期长且宠物老鼠在迭代期间“aged out”未能完成全部验证,并已把硬件与软件开源以便他人复现或接手。社区希望作者补上更多录像、参数化文件和带价格的 BOM,并有评论者表示愿意接走作者闲置的装置继续做行为验证。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

文化联想、幽默与扩展想象

大量评论以幽默和文化联想表达兴奋:DOOM 被视为黑客文化的标志性载体,因此网友用“rodent wars”、2032 末日笑谈和 Project Pigeon(美军用鸽子的历史项目)来调侃潜在后果。有人建议把装置移植给猫、松鼠、猪甚至蟑螂,并开玩笑把老鼠命名为 Neo/Morpheus/Trinity 或举办“rat gaming championships”。这些玩笑既反映了项目的科幻/反乌托邦想象,也体现了对这类极端创意既惊讶又好奇的情绪。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

玩法与硬件改进建议(触发器、多鼠与关卡)

社区提出具体玩法与硬件扩展:在游戏中加入更显著的目标(比如 collecting cheese mods)、为鼠类设计多种武器/任务或多只老鼠的协作/对战模式,以及把游戏关卡 3D 打印成实物做线下交互。硬件改进建议包含下颌或咬触发器以实现同时移动与射击、微调 stepper motors 与 ball driver 的灵敏度,以及利用 Doom 引擎易于修改的特性(无上下瞄准)来简化输入映射。总体建议既有软件层面的渲染/关卡改造,也有物理层面的触发器、传感器与力学调整。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

📚 术语解释

DOOM: 经典第一人称射击游戏(1993),因引擎开源与可移植性常被黑客用于非传统平台或输入输出的改造实验。

VR: VR(虚拟现实),通过视觉、声学与交互设备模拟沉浸式环境;本项目用屏幕/投影和 trackball 将第一人称场景呈现给老鼠。

trackball / roller ball: 球形输入装置(trackball/roller ball),被试在球上奔跑使球旋转并转换为游戏移动指令,是动物导航与交互实验常用的接口。

Habituation(习惯化): 行为学术语,指动物逐渐适应新环境或装置并减少惊恐、开始自发探索,是正式训练前的必要准备阶段。

Operant conditioning(操作性条件作用): 以行为结果(奖励或惩罚)改变行为的学习范式(Skinner 框架),评论中讨论了奖励时序、clicker training 与三项关联的实际应用。

FOV(field of view): 视场,指动物能看到的视角范围;老鼠具有很宽的水平 FOV 和小的双眼重叠区,需用超宽渲染或环绕屏来匹配其感知。