加载失败
这场讨论围绕一篇题为“People Hate AI Art”的帖子展开,原始材料像是一张 AI 生成的恐龙点赞涂鸦,被拿来讨论为什么不少人会对 AI 生成图产生强烈反感。评论把问题拆成几层:一层是低质量 AI slop 与是否应当明确标注,尤其当图片出现在 publication(媒体刊物)里时更敏感;一层是 AI 作为辅助创作工具,例如 Midjourney(流行的 AI 图像生成器)和 Gemini(Google 的多模态模型),还有一层是它对人类艺术劳动和收入的冲击。有人回忆 2017 年前后 text-to-image generation(把文本转成图像的生成式 AI)还处在 LSTM+GAN(早期神经网络生成图像方案)阶段,如今模型已经能很快产出看似“够用”的图像,因此争论从“能不能做出来”转向“该不该这样做”。整个讨论也反复拿 photography(摄影)刚出现时的历史争议作类比,说明新媒介总会先被质疑,再逐渐重新定义“艺术”这个词。
很多评论把矛头对准的是低努力、量产感很强的 AI slop,而不是所有 AI 生成图像。有人觉得只要出现在 publication 里,观感就会比私人玩票更差;但把它拿来给孩子编故事、做照片滤镜或 UI mockup,又被视为正常用途。也有人强调必须明确标注“这是 AI”,不要伪装成手工创作。还有人直接说,大家反感的其实是粗糙成品和误导性包装,而不是技术本身。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]
另一派把 AI 图像生成看成实用工具,重点是它能帮人更快完成具体任务。有人用它和孩子一起编故事、给照片换成绘画风格,或在工程演示里替代大段文字墙,认为这比完全不用强。也有人提到,非艺术背景的人常常缺少描述复杂画面的词汇,prompt 再怎么写,图像和文本之间总会丢掉一些细节。Midjourney(流行的 AI 图像生成器)被提到是基础效果不错的选择,而 --sref 之类的参数则让风格微调更容易。
不少评论把争议归结为“有没有人类在场”。他们认为没有人类输入的作品只剩漂亮颜色或视觉表皮,缺少真正的情绪和表达,因此会显得空。有人提到自己参加 Drink and Draw(线下素描/交流活动)、makerspace(共享创客空间)之类的场景后,更能理解创作者投入时间、练习和交流的价值。这个视角下,AI 图像的问题不只是好不好看,而是它是否还能承载人类经验。
也有一条更元的争论:讨厌 AI art 需不需要理性论证。有人直接说,审美厌恶本来就不需要理由,看到丑就会觉得丑;对方则追问,如果连理由都说不清,是否只是情绪反应。这个分歧把讨论从“图像好不好看”转向“审美判断是不是天然主观”。因此,双方其实未必在谈同一件事:一边在谈感受,一边在谈论证。
另一组评论把焦点放在劳动、报酬和职业地位上。有人直说,真正难受的是创意工作会被挤压成“没有活可做”的经济状态,而不是单张图片本身。也有人指出,模型生成的图像让人厌烦,往往是因为它绕开了“谁为创作付费、谁获得名声”这套规则,单靠 prompt 去驱动模型并不等于真正的人类才华。这个视角也解释了为什么很多 artists 的反应更强烈:他们担心的不只是品味,而是生计。
还有人认为反感被夸大了,真正强烈排斥的只是少数声音。有人拿 19 世纪摄影刚出现时被说成怪异、威胁绘画的历史作类比,认为新媒介总会先遭遇抵触,再慢慢被接纳。也有人说,2022-23 年间 text-to-image 还带着明显的新鲜感,但随着生成速度越来越快、门槛越来越低,这种新鲜感已经消退。顺带一提,AI slop 这个词的流行也被视为一个信号,说明至少有一部分人确实不是完全无感。
AI slop: 低努力、批量化、观感廉价的 AI 生成内容,常带贬义。
text-to-image generation: 把文本提示转换成图像的生成式 AI 技术,是这次争议的核心能力。
prompt engineering: 通过精细设计 prompt 来控制生成结果的技巧,包括风格、构图和细节。