News Hacker|极客洞察

131 1 小时前 dailycal.org
😬伯克利 CS 课 F 率飙升:AI作弊、数学底子差、免标化招生遭质疑
不会做题就怪 AI,还是本来就没学扎实才露馅?

🎯 讨论背景

这场争论来自 UC Berkeley(加州大学伯克利分校)几门入门 CS 课在 spring 2026 出现大量 F 的报道,文中还提到不少学生在 take-home exams 上作弊被抓。更大的背景是,许多 UC faculty(大学教员)联名要求在 STEM admissions(理工科招生)中恢复 SAT/ACT 标准化考试,认为疫情后推行的 test-free admissions(不看标化分数招生)让新生数学准备不足。评论区把问题进一步扩展到 LLM(Large Language Model,大语言模型)在学习中的角色:它既可能是辅学工具,也可能让学生直接交作业、绕过真正的练习。大家还围绕 Berkeleytime(伯克利常用的课程成绩统计网站)上的分数、Teaching Professor(以教学为主的教授)的责任,以及 grade inflation(成绩通胀)和课程标准之间的矛盾展开讨论。

📌 讨论焦点

LLM 依赖与思考退化

不少人把这次成绩下滑解读为对 LLM 依赖的长期副作用:学生和连 PhD 都在用它代替 brainstorming、写作和编程,久而久之连独立思考、深度工作和独自安静思考都变差。有人说自己开始刻意手算、手写代码后,发现不是智力变差,而是自己变得更懒、更不愿碰费力的任务。也有人认为这更像社会对电子设备和新工具的适应期,旧时代重视的技能正在被别的能力替代。

[来源1] [来源2] [来源3] [来源4] [来源5]

LLM 既是导师也是作弊捷径

另一派更强调 LLM 的正面用途:它像放大器,能帮研究者更快试错、拆解日志、补足文档缺口,甚至像一对一导师那样解释概念。评论里有人把它用在数学复习、读课件、处理代码日志和构建配置上,认为关键不在工具本身,而在是否让它替你完成整份作业。大家反复区分了拿它学和拿它交差两种用法,前者能加速学习,后者只会让人过不了考试和面试。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12]

免标化招生与数学准备不足

很多人认为真正的背景是 UC 系统在疫情前后取消 SAT/ACT 要求后,STEM 入学门槛和学生数学准备被削弱了。有人直接引用 UC 教员联名请愿,主张恢复标准化考试,并拿 Yale 的研究说测试分数是预测大学成绩最强的指标。也有人提醒这类变化往往有滞后效应,且现在更多学生会无论兴趣如何都挤进 CS 课,所以短期内看到 F 激增并不一定只由 AI 引起。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13] [来源14]

成绩通胀 vs 公共教育使命

围绕成绩本身,评论分成守住标准和公共教育应更包容两边。前者认为 Berkeley 至少没有像一些学校那样大幅放水,避免把毕业生 GPA 变成通胀数字,也保住早年学生付出的价值。后者则反驳说,公立大学的目的不是搞学术生存游戏,而是让更多人真正受教育,故意把课程设计成筛人并不值得骄傲。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

作弊检测与数据解读

还有一条线在讨论这些 F 到底有多少来自真实学不会,多少来自抓到更多作弊。评论提到 CS10 一次就有近 30 人在 take-home exam 上作弊被查,CS 里则可以靠 MOSS 这类代码相似度工具和日志里刚开题就秒贴长答案的痕迹来识别。与此同时,很多人也指出 AI detector 并不可靠,数学和论文作弊早就存在,只是 CS 因为代码可比对、网上答案多,变得更容易被发现。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]

教学质量与课程内容争议

不少人把矛头指向教学质量和课程内容,而不只盯着 AI。有人吐槽工程课长期是 slides 直读、教授不擅长教学,学生真正有价值的学习反而来自自己啃书、进 OSS 项目,或用 AI 补课。也有人承认底层内容像 binary trees、hash table、embedded systems、tcpdump、wireshark 仍然重要,但在 300 人大课里把这些东西教得既实用又有趣,本身就是个难题。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

📚 术语解释

LLM: Large Language Model,大语言模型,能生成文本、代码并用于问答或辅助编程。

MOSS: Measure Of Software Similarity,一个用于检测代码相似度和抄袭的工具。

SAT/ACT: 美国大学本科入学常用的标准化考试,用来衡量学术准备度。

grade inflation: 成绩通胀,指学校或教师整体抬高分数,导致 GPA 失真。