加载失败
原帖基于 arXiv(学术预印本服务器)上 hep-th(High Energy Physics - Theory)分类的投稿统计,指出近期投稿量异常上升并怀疑原因是 LLM 写作与自动化滥用。评论里有人指出统计口径(如使用 last-modified date)会产生伪增,同时讨论了 arXiv 的担保与格式审查机制如何影响数据解读。更广泛的讨论涉及平台上机器人与老账号重用的问题、以 WOS 等计量指标为核心的学术激励(publish-or-perish)以及训练数据的版权伦理。评论分歧明显:部分人警告信噪比与学术生态将被破坏,另一些人认为短期噪声之后可能出现新的筛选与制度调整。
原帖与多条评论观察到 arXiv 上 hep-th(High Energy Physics - Theory)分类近期投稿量异常上升,作者怀疑是 LLM 生成论文导致的突增。反驳者给出具体统计偏差理由:如果用“most recent submission date”统计,会把近期被修改的既有稿件误计为新投稿,从而产生虚假的峰值。评论还指出 arXiv 对无机构邮箱的提交者有担保机制,并且平台主要做格式与政策审查而非传统同行评审,这些因素会影响数量与质量的解读。多位评论者建议按原始投稿日期、分解新旧账号与活动模式并做可视化来验证真实增幅。
大量评论担忧 LLM 与自动化会放大低质量产出,导致学术与工程领域的信噪比下降,优秀成果被淹没。有人将此称为“Software Collapse”或描述为多领域同时出现的噪声爆发,强调筛选成本上升、早期科研人员的信号被稀释。乐观观点认为会先经历生成-筛选的混沌阶段,随后通过新工具和严格筛选把有价值成果挑选出来,但谁来承担筛选成本是核心问题。总体共识是短期内筛选与审查负担会显著增加,学术评价体系可能被迫调整。
多条评论提出制度性对策:在投稿表单加入强制性声明(例如“我亲自撰写本文”)或对违规者施以禁发,以减少自动化滥发。有人主张要超越以 WOS(Web of Science)计数为核心的评价体系,避免以发表数量为主的激励继续促生劣质产出。与此同时,也有担忧过度门槛化会让既有实验室和 PI(Principal Investigator,课题负责人)更牢牢掌控话语权,外部或无隶属者将更难进入学术网络。讨论集中在同时调整投稿规则、审核流程和评价指标以平衡公平与质量。
评论者在 HN 上报告大量疑似机器人或低质量账号:表现为短时间多条评论、非人类节奏、奇怪标点(如异常的 EM-dash 频率),以及多年沉睡账号突然被激活。有人指出存在老账号黑市或用户自建 alt-account,用以规避声誉成本或放大特定话题声音;这使得新增“提交者数”并不一定等同于真实新用户增长。为应对这种滥用,建议采用类似垃圾邮件的贝叶斯过滤、PageRank 型的排行或绘制投稿/评论时间线等可视化手段来甄别异常流量。平台检测难度随生成文本与人类写作边界模糊而上升,直接影响社区信任与内容质量。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]
评论中既有案例显示 LLM 在企业应用中提升可用性、开发速度和节约成本,也有广泛批评认为现阶段模型常产生不准确、片面或遗漏关键文献的输出,难以替代严谨的研究工作。关于真正创新的能力存在分歧:模型擅长重组和翻译现有思想,能快速产出类似既有工具的工程化版本(“another Redis”),但能否催生范式级的新品类(“the next Redis”)受到质疑。模型的限制还包括缺乏社会化采纳能力、责任承担与主动验证的驱动力,因此即便技术上能生成论文或软件,能否被社区接受、被人反复验证并产生长期影响并不确定。对许多评论者而言,短期内更可能看到效率与复制的提升,而真正的范式性创新仍需人类在采纳、推广与验证环节发挥关键作用。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]
部分评论强烈批评 LLM 训练对公开论文、代码和图像的大规模抓取,认为这在实践上将创作者劳动匿名化并被模型再利用或商业化,削弱原作者的署名与经济回报。这一批评强调长期激励问题:若原创内容被模型吸收而无可追溯的回报或署名,创作者对开放贡献的意愿会下降,从而反过来侵蚀整个学术与开源生态。因此有评论呼吁更严格的数据来源合规、训练数据可追溯性与潜在补偿机制,以修复被侵蚀的激励结构。
arXiv(学术预印本服务器): 一个用于在同行评审前公开论文草稿的学术预印本平台,广泛用于物理与数学等领域。对无机构邮箱的提交者通常需要已在站内的研究者担保,平台以格式与政策审查为主,非等同于期刊式同行评审,因此其投稿统计与质量含义与正式期刊不同。
hep-th(High Energy Physics - Theory): arXiv 的“高能物理-理论”子分类,长期投稿基线较为稳定,本次争议即源于该分类近期投稿量的异常波动。
PI(Principal Investigator,课题负责人): 通常指获得科研经费並领导研究小组的教授或研究员,他们在资源分配、团队产出与学术网络中处于关键位置,可能对外来研究与合作产生筛选或接纳作用。
WOS(Web of Science,学术计量数据库): 由 Clarivate 提供的商业学术数据库,用于记录论文与引用次数等计量指标,常被用于评估科研产出与分配经费的量化依据。
LLM(Large Language Model,大型语言模型): 以大规模文本数据训练的生成式深度学习模型,能够撰写文本或生成代码;在连贯性与产出速度上表现突出,但在准确性、原创性与可验证性方面仍存在明显局限。
publish-or-perish(“发表即生存”): 描述以发表数量和引用作为学术晋升与经费分配主要衡量标准的文化,这种激励容易促成大量低质量发表并扭曲研究优先级。