News Hacker|极客洞察

131 66 天前 kapwing.com
⚖️尝试向 AI 生成作品付艺术家版税:伦理、法律与产品失败的教训
付版税就能把爬取来的作品合法化吗?

🎯 讨论背景

这是对 Kapwing/Tess(Tess.design——一项尝试为艺术家风格付费的生成式图像产品)失败的事后总结与社区讨论。团队通过冷发送给 325 位艺术家获得约 21 人签约(≈6.5%),并以微调预训练基模型(如 Stable Diffusion)宣称可按艺术家风格付费,但这在法律、来源透明性与产品竞争力上引发争议。讨论基于几个前提:模型训练所用数据的许可问题尚无定论,美国的 fair use 框架能否适用仍未确定;艺术家对被复制风格的态度分歧,许多人宁愿抵制也不愿参与;同时产品体验与生成质量决定了能否获得市场。社区围绕法律(风格保护、合理使用)、商业可行性(版税分配、集体许可)、技术透明度(基模型与微调)及创业代价(员工倦怠、资源浪费)展开深入辩论。

📌 讨论焦点

“时机不对”是否只是借口

部分评论认为团队把失败归结为“时机不对”是回避问题的说法,指出这种表述在为产品本身可能不被接受找借口,甚至用把订阅或涨价等不受欢迎决策合理化的类比来说明该说法的薄弱性。反对者强调事后复盘应直面不舒服的真相,而不是笼统归因。另有评论指出“时机”确实常是创业成败的关键因素,创业者有时需要坚定信念并承担被误判的风险,风投也以大量押注博弈这种判断。总体争论集中在这是合理的市场判断还是掩饰产品自身问题的借口。

[来源1] [来源2] [来源3] [来源4]

版权与“风格”能否受法律保护的争议

评论围绕“风格是否应受版权保护”展开激烈分歧:有人认为在多数司法区(尤其是美国)艺术风格并非传统版权保护对象,强行扩展 IP 可能导致冷却效应、DRM 和滥诉;也有人指出存在其他知识产权工具(如 design patent)可用并强调法律会随着技术发展调整。关于把艺术品作为训练素材是否合法,评论引用美国合理使用(fair use)四要素来争论,但多数人认为这一领域尚无确定先例,法院对大规模训练数据的裁定仍不明确。因此多数评论认为法律路径不确定,期待司法或立法进一步厘清“训练”“再现”“衍生”之间的界线。

[来源1] [来源2] [来源3] [来源4]

模型来源与透明度问题(预训练基模型与微调)

许多评论质疑文章中“每张图像都可追溯到单一同意艺术家”的说法,指出实际做法是使用预训练的基模型(例如 Stable Diffusion)再对少量同意艺术家进行微调(fine-tune),因此核心训练数据仍来自网络抓取且法律与伦理问题并未被消除。批评者认为这更像是在原有、未经许可的数据上贴伦理标签,无法从根本上解决授权与来源透明性问题。也有观点提醒:若法院最终认定大规模训练属于“transformative/fair use”,按风格付费的商业模式又可能丧失可行性,形成法律与商业的悖论。

[来源1] [来源2] [来源3] [来源4]

产品可用性、质量与低采纳率是主要阻力

大量评论把失败归因于产品体验与生成质量不及竞品:一位评测者回忆用 Tess 做 prompt 调试远不如 OpenAI API,无法在少次尝试内得到满意结果,而需要批量生成图像的场景更无法容忍低首次命中率。文中披露他们给 325 位艺术家发冷邮件只得到 21 人签约(约 6.5%),且签约艺术家中仅约 1/4 实际把模型用于自身创作,说明补偿方案并未弥合“有用性”与“伦理性”的差距。还有评论用 Spotify 的经验类比:Spotify 成功是因为产品在功能上优于盗版,而 Tess 试图以“更伦理”取胜,但在核心能力上落后就难以获得市场。

[来源1] [来源2] [来源3] [来源4] [来源5]

艺术家立场:愿意补偿者有限,多数倾向拒绝或禁止

评论显示艺术家群体并不一致:部分艺术家和评论者认为若公司在未授权情况下用其作品训练模型就理应先购买许可或赔偿,但另有大量艺术家明确表示“坚定拒绝”(hard no),宁愿把 AI 关掉也不愿接受用版税换来被替代的可能性。文章里被 cold email 的高端编辑艺术家采样中签约率低、实际使用率低,进一步说明许多艺术家对参与此类平台持高度怀疑。许多评论也强调多数艺术家经济脆弱,虽然版税对个体意义重大,但这并不能改变他们对 AI 破坏生计的根本担忧。

[来源1] [来源2] [来源3] [来源4]

版税机制与经济可行性的分歧及替代方案讨论

关于是否能向所有被训练作者支付版税、如何核算与分配,评论存在显著分歧:有人断言按训练贡献支付的总规模会极其庞大到不可行,有人用全球 GDP 分摊估算反驳称小比例资金即可覆盖。评论还指出技术上很难精确追溯每次输出对每个训练样本的贡献度,分配机制会带来巨大复杂性。若要妥协,有人建议借鉴音乐行业的集体管理模式(如 ASCAP/BMI/SESAC)或集中许可,但社区对可行性、公平性与行政成本没有达成共识。

[来源1] [来源2] [来源3] [来源4]

创业反思与员工影响:公开复盘的价值与代价

不少评论对公开失败的复盘表示赞赏,认为像科研发表阴性结果一样记录失败对行业有参考价值,但也批评团队在财务(预付与分成)、市场策略(依赖艺术家推广)与法律透明度上的判断失误。文章提到有工程师因 Tess 的短期投资和项目而离职并出现倦怠,评论提醒创业者要正视决策带来的人员与心理成本。总体观点是:失败本可带来学习,但复盘需要更直面尴尬和根本原因才能对后来者真正有用。

[来源1] [来源2] [来源3] [来源4]

📚 术语解释

Stable Diffusion: 一个开源的 text-to-image 潜在扩散模型,常被作为“基模型”使用并在社区广泛传播;其训练数据来源与许可问题在生成式图像讨论中高度相关。

fine-tune(微调): 在预训练基模型基础上用小规模或特定风格的数据继续训练,以便模型更贴合某位艺术家的风格或特定任务。

training data(训练数据/训练集): 用于训练机器学习模型的图像、文字等原始资料;其来源、许可与可追溯性决定了模型的法律与伦理争议焦点。

fair use(合理使用): 美国版权法中的一个法律原则,基于四要素(目的与性质、作品性质、使用量与实质性、对市场的影响)来判断未经许可使用是否可免责;在把大量作品用于模型训练时,是否成立仍有争议。

EULA(End User License Agreement,最终用户许可协议): 软件提供方与用户之间的许可合同,有时被用来限制用户行为或声明权利,但不能凌驾于法律之上,涉及版权时仍受司法解释约束。

royalties(版税): 基于使用、复制或衍生作品产生的持续性支付机制;争论点在于如何计算、向谁支付以及按何种标准分配给被训练与被引用的创作者。