News Hacker|极客洞察

128 7 小时前
🤖3月 Ask HN 招聘:agentic/LLM 与模型基础设施岗位激增(远程与高薪并存)
这么多岗位都写 agentic,是要 AI 来面试人吗?

🎯 讨论背景

这是 2026 年 3 月的 Ask HN “Who is hiring?” 招聘汇总,许多公司和招聘负责人直接在评论帖出岗位与申请链接,覆盖从早期创业公司到成熟上市企业。明显两条技术主线:一是大量 agentic / LLM-first 的产品化岗位(Agent 平台、Forward Deployed、AI Architect 等),二是支撑这些产品的模型部署、GPU/serving、RAG 与 vector DB、以及可观测性/infra 工程岗位(Kubernetes、ClickHouse、OpenTelemetry 等)。地域与招聘政策差异显著——既有 US-only 或不提供签证的岗位,也有全球远程或欧洲时区限定的机会;薪酬有时公开(如 DuckDuckGo、BillionToOne),也有不少不披露的职位。帖子里还伴随搜索/聚合工具推荐(如 nthesis.ai)与针对重复或过期招聘列表的社区元讨论,反映了求职信息检索与质量管理的现实问题。

📌 讨论焦点

Agentic / LLM-first 招聘潮

帖中大量公司把产品定位为 agentic 或 LLM-first,直接招募构建代理平台、agent 编排与落地化能力的工程师与研究员。示例包括 CoPlane 把自己称为 Agentic Orchestration 平台、Cognite 招 Autonomous industrial agents 平台相关职位,Quadrillion、Softmax、VLM Run、expand.ai 等强调多代理、多策略的研究与生产化评估。这些岗位既要懂模型与检索(LLM、RAG、vector DB 等),也要会把代理与企业后端(ERP、POS、财务系统)集成、落地并做 evals/observability,常要求客户对接和产品化交付能力。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8]

模型服务、GPU 与可观测性基础设施岗位

大量岗位聚焦模型在生产环境的部署、推理优化与可观测性:职位描述中频繁出现 vLLM、TensorRT、RAG 优化、GPU 推理、autoscaling 与 MLOps 工具(Ray、Dagster 等)。企业级工程岗位同时要求 Kubernetes、分布式数据库与流处理技能(例如 ClickHouse 的云 autoscaling、Adobe 的实时 CDP 使用 Flink/Kafka、Ford 使用 Dynatrace + OpenTelemetry)。招聘强调低延迟、高并发、成本控制和评估/guardrails,反映从实验室模型到可供企业长期运行的推理平台的强烈需求。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

本地 / on-device 与隐私优先的岗位

有显著一批岗位强调 local-first 或 on-device AI,以隐私与延迟为卖点,涉及 macOS 本地推理、嵌入式设备与安全引导/OTA 流程。Osaurus 明确以 native macOS 本地推理与插件/agent 网络为核心,Tether 将重点放在本地 AI SDK 与边缘隐私,另有团队(Chroma)宣称支持单节点/本地部署,及面向摄像头的离线-first 相机 OS 招聘。这类岗位偏向系统级优化、Apple Silicon/嵌入式推理、设备生命周期与离线恢复能力。

[来源1] [来源2] [来源3] [来源4]

行业跨度与传统领域工程需求(金融/医疗/机器人/硬件)

除了 AI 原生岗位,线程覆盖大量行业垂直岗位:金融基础设施(Column 拥有银行牌照、要求 Go 后端)、医疗与健康科技(Blueberry Pediatrics、Layer Health、Neon Health 招后端/ML 岗位)、机器人与建筑自动化(Monumental 的自主建筑机器人)、生物与基因组学企业(BillionToOne 的诊断平台)。这些招聘重视行业合规、可靠性和与现有行业系统(ERP、PMS、医疗记录、硬件接口)的深度集成,技术栈从 Rust/Go 到 Django/React/Elixir 不等。

[来源1] [来源2] [来源3] [来源4] [来源5]

招聘流程、地域/签证限制与社区元讨论

帖子中明显存在地域与签证差异化:部分岗位标注 'US-only' 或明确不提供签证(例:Sitewire、Ford),也有面向 EU/时区或完全远程的岗位。薪酬透明度参差不齐——像 DuckDuckGo、BillionToOne 等披露范围,而许多早期创业帖不写薪酬。社区还关注信息聚合与质量:有人推荐 nthesis.ai 等聚合器并同时有人批评重复或过时的列表,质疑长期重复发布是否真在积极招聘或仅收集简历。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8]

📚 术语解释

agentic: agentic(agentic AI / agents):由 LLM 驱动、能使用工具、执行长时任务并与外部系统交互的自治代理,用于编排业务流程或取代重复性运维/研究工作,岗位常要求将其与企业系统、安全与评估流水线集成。

RAG: RAG(Retrieval-Augmented Generation):通过检索外部文档或向量索引并将检索结果与生成模型结合,以提高生成结果的准确性、可追溯性与事实性,常与 vector DB、embedding pipeline 配合出现。

vector database / dense vector search: vector database(矢量数据库):用于存储和检索 embedding 向量以支持语义搜索和 RAG 工作流(示例产品:Chroma、Pinecone);是向量检索与相似度查询的基础设施组件。

OpenTelemetry / observability: OpenTelemetry(分布式可观测性标准)与 observability:收集 traces、metrics、logs 的开源规范與工具链,用于监控、调试与性能分析,企业级推理与 autoscaling 常依赖该类可观测性体系。

model serving / inference optimization: model serving(模型服务与推理优化):涉及 GPU 调度、量化、低延迟推理、autoscaling 与专用推理栈(如 vLLM、TensorRT),目的是把研究模型高效稳定地投入生产环境。