News Hacker|极客洞察

20 66 天前 sjer.red
⚠️用AI完成报税与3D CAD,但引发幻觉、隐私与失业担忧
把税务和代码交给 AI,你怕审计还是失业?

🎯 讨论背景

作者在贴文里分享了用多种模型和工具在周末实现的两类工程:一是把所有税表 PDF 合并、命名并用模型抽取字段生成可视化的收入/扣除和退税估算(并为会计准备 FinCEN 报告);二是用 Codex 驱动的浏览器内参数化 3D CAD,整合 Open CASCADE Technology (OCCT,一种 B-rep 建模库) 的 WebAssembly 版本并在 WebGL 中实时渲染、导出 STEP 以便加工。评论从实用性延展到风险与制度层面:有人称赞这些真实可用的流水线,也有人用医疗与基础设施例子警告模型会幻觉并呼吁使用 local models 或程序化校验。讨论还涉及工程化工具选型(如 Dagger 与 Earthly)、开源与维护成本,以及 AI 对职业替代与生产力的双重影响。

📌 讨论焦点

实用案例:税务自动化与桌面3D CAD

原贴作者描述周末用多种模型(Opus 4.6、GPT 5.4、Claude、Gemini 2.5 Flash)完成端到端的工程化任务:把所有税表 PDF 合并到一个文件夹、让 Claude 统一重命名、用 Gemini 2.5 Flash 抽取税务相关字段并生成显示收入/扣除和估算 2025 退税/欠税的 web UI,最后整理供会计上传的材料(包括 FinCEN 报告与文档摘要)。在硬件制作方面,作者用 Codex 设计浏览器内的参数化 3D CAD,集成 Open CASCADE Technology (OCCT) 的 B-rep 建模库(编译为 WebAssembly)并在 WebGL 中实时渲染,能够添加组件、调参并导出 STEP 供加工。这些细节展示出从文档解析到参数化实体建模的跨领域流水线,体现了 AI 在实际任务链路中结合代码与工具的能力,而非仅仅是写几行 prompt 的演示。评论中有人特别称赞税务场景的可用性并把作者的工作视为真实生产力的示例。

[来源1] [来源2] [来源3]

幻觉与数据安全担忧

多位评论者用亲身例子警告大模型会产生 hallucination:ChatGPT 在处理大量医疗或财务历史数据时会捏造数字、混淆日期,甚至在被用户质疑时错误地承认并编造理由;另有人指出模型也会在基础设施问题上给出错误事实(例如关于 emr serverless 容器镜像运行时的错误陈述),这些错误在税务或审计场景可能造成严重后果。隐私顾虑同样明显——部分人明确表示不会将敏感医疗或税务数据上传到云服务并建议使用 local models,而也有评论质疑哪些数据真有被滥用风险(比如社保 vs 收入)。常见的缓解策略包括让模型生成可执行的校验代码(例如“写个 Python 程序来计算 X”)或用程序化验证来减少幻觉带来的错误。

[来源1] [来源2] [来源3] [来源4] [来源5]

对产出价值的怀疑(废弃软件/无用工具)

有人批评大量所谓的“用 AI 做的东西”价值有限,认为许多项目更像重复现有工具或小玩意儿,最终沦为 abandonware 并带来“廉价多巴胺”,而非真正的生产力提升。反方列举了大量个人项目来反驳这种论断,但批评者强调衡量标准应是“解决了什么问题”,而不是仅展示代码数量或花样功能。还有观点指出,目前大量内容的生成主要创造了 token 消耗与短期注意力,这会推动模型训练和投资,但不必然产出长期有用的产品。讨论因此把焦点从“能做什么”拉回到“是不是有实际用户价值”上。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

就业风险与适应

多名评论者担心 AI 会带来职业替代:有人认为频繁使用工具可能让个体更容易被替代,另一派补充说不适应新工具的程序员会丧失竞争力,但对复杂、长期维护的项目(如 Linux kernel)短期内仍难以完全依赖 LLMs。有评论讽刺地指出为训练“替身”付费矛盾,而也有人认为 LLMs 会给非纯写码者带来杠杆效应,且市场竞争可能压低成本影响替代速度。讨论还提到 Jevons Paradox(效率提升可能增加总体需求),显示社群对“被替代”与“被放大工作效率”两种结果并存的不确定感。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6]

工具选择与开源取舍

评论中也讨论了工程化工具与开源的实际权衡:有人询问 Dagger(一个基于容器的 CI/build 工具)与 Earthly(另一个本地化构建工具) 的差别,回复认为 Dagger 更稳健、Earthly 在并行化和某些边缘场景存在问题(例如只能在单个 CI 实例上运行),并建议更合理的模型应有分布式缓存(类似 Bazel 的思路)。因此对复杂项目作者倾向 Dagger,而对简单项目 Earthly 已足够。关于开源,有人做了带 Emacs keybindings 的 Obsidian 克隆但不愿开源,理由是把个人可用的东西做成对外可用需要额外大量时间;也有人表示几乎把个人代码全部免费发布,反映出维护成本与共享动机之间的拉扯。

[来源1] [来源2] [来源3] [来源4]

📚 术语解释

LLM (Large Language Model): 大规模语言模型(LLM)用于生成和理解自然语言(如 GPT、Claude 等),在文本生成、摘要与提示交互上表现强,但在长上下文、精确事实或边缘用例时容易出错。

hallucination(模型幻觉): 模型在缺乏证据或被混淆信息时生成虚假陈述、捏造数字或错误日期的现象,税务与医疗等敏感场景中风险尤为严重。

Dagger: Dagger:一种基于容器的 CI/build 工具,支持在本地运行 CI 流程并利用缓存,适合复杂、多阶段流水线的可重现构建。

Earthly: Earthly:另一种构建/CI 工具,强调在本地重现 CI,但在并行化和分布式缓存方面有局限,通常适用于较简单的项目场景。