😬 伯克利 CS 课 F 率飙升：AI作弊、数学底子差、免标化招生遭质疑

131 1 小时前 dailycal.org

😬伯克利 CS 课 F 率飙升：AI作弊、数学底子差、免标化招生遭质疑

不会做题就怪 AI，还是本来就没学扎实才露馅？

🎯 讨论背景

这场争论来自 UC Berkeley（加州大学伯克利分校）几门入门 CS 课在 spring 2026 出现大量 F 的报道，文中还提到不少学生在 take-home exams 上作弊被抓。更大的背景是，许多 UC faculty（大学教员）联名要求在 STEM admissions（理工科招生）中恢复 SAT/ACT 标准化考试，认为疫情后推行的 test-free admissions（不看标化分数招生）让新生数学准备不足。评论区把问题进一步扩展到 LLM（Large Language Model，大语言模型）在学习中的角色：它既可能是辅学工具，也可能让学生直接交作业、绕过真正的练习。大家还围绕 Berkeleytime（伯克利常用的课程成绩统计网站）上的分数、Teaching Professor（以教学为主的教授）的责任，以及 grade inflation（成绩通胀）和课程标准之间的矛盾展开讨论。

📌 讨论焦点

LLM 依赖与思考退化

不少人把这次成绩下滑解读为对 LLM 依赖的长期副作用：学生和连 PhD 都在用它代替 brainstorming、写作和编程，久而久之连独立思考、深度工作和独自安静思考都变差。有人说自己开始刻意手算、手写代码后，发现不是智力变差，而是自己变得更懒、更不愿碰费力的任务。也有人认为这更像社会对电子设备和新工具的适应期，旧时代重视的技能正在被别的能力替代。

[来源1] [来源2] [来源3] [来源4] [来源5]

LLM 既是导师也是作弊捷径

另一派更强调 LLM 的正面用途：它像放大器，能帮研究者更快试错、拆解日志、补足文档缺口，甚至像一对一导师那样解释概念。评论里有人把它用在数学复习、读课件、处理代码日志和构建配置上，认为关键不在工具本身，而在是否让它替你完成整份作业。大家反复区分了拿它学和拿它交差两种用法，前者能加速学习，后者只会让人过不了考试和面试。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12]

免标化招生与数学准备不足

很多人认为真正的背景是 UC 系统在疫情前后取消 SAT/ACT 要求后，STEM 入学门槛和学生数学准备被削弱了。有人直接引用 UC 教员联名请愿，主张恢复标准化考试，并拿 Yale 的研究说测试分数是预测大学成绩最强的指标。也有人提醒这类变化往往有滞后效应，且现在更多学生会无论兴趣如何都挤进 CS 课，所以短期内看到 F 激增并不一定只由 AI 引起。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11] [来源12] [来源13] [来源14]

成绩通胀 vs 公共教育使命

围绕成绩本身，评论分成守住标准和公共教育应更包容两边。前者认为 Berkeley 至少没有像一些学校那样大幅放水，避免把毕业生 GPA 变成通胀数字，也保住早年学生付出的价值。后者则反驳说，公立大学的目的不是搞学术生存游戏，而是让更多人真正受教育，故意把课程设计成筛人并不值得骄傲。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

作弊检测与数据解读

还有一条线在讨论这些 F 到底有多少来自真实学不会，多少来自抓到更多作弊。评论提到 CS10 一次就有近 30 人在 take-home exam 上作弊被查，CS 里则可以靠 MOSS 这类代码相似度工具和日志里刚开题就秒贴长答案的痕迹来识别。与此同时，很多人也指出 AI detector 并不可靠，数学和论文作弊早就存在，只是 CS 因为代码可比对、网上答案多，变得更容易被发现。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]

教学质量与课程内容争议

不少人把矛头指向教学质量和课程内容，而不只盯着 AI。有人吐槽工程课长期是 slides 直读、教授不擅长教学，学生真正有价值的学习反而来自自己啃书、进 OSS 项目，或用 AI 补课。也有人承认底层内容像 binary trees、hash table、embedded systems、tcpdump、wireshark 仍然重要，但在 300 人大课里把这些东西教得既实用又有趣，本身就是个难题。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

📚 术语解释

LLM: Large Language Model，大语言模型，能生成文本、代码并用于问答或辅助编程。

MOSS: Measure Of Software Similarity，一个用于检测代码相似度和抄袭的工具。

SAT/ACT: 美国大学本科入学常用的标准化考试，用来衡量学术准备度。

grade inflation: 成绩通胀，指学校或教师整体抬高分数，导致 GPA 失真。

原文链接 Hacker News 讨论

AI Programming Policy UC Berkeley AI cheating CS 10 CS 61A Garcia The Daily Californian LLM

News Hacker｜极客洞察