News Hacker|极客洞察

155 182 天前 help.kagi.com
🤦Kagi:“More results”返回重复链接,且即时答案偶有离谱错误
连 URL 去重都做不好还敢收费?

🎯 讨论背景

Kagi(一个付费、注重隐私的搜索引擎)因为“More results”加载更多时常返回重复结果而被用户集中反馈。官方曾将问题列为要修复,但又以上游来源整合和缓存复杂性解释去重困难,导致用户不满。讨论还扩展到 Kagi 的即时答案/widgets 在处理歧义查询时的失误,以及 Kagi Assistant(内置 LLM 助手)如何把检索与生成结合带来的准确性与引用性权衡。评论既有具体的 bug 与示例,也有对付费价值、功能优先级和道德/供应链担忧的综合评估。

📌 讨论焦点

“More results” 去重/重复问题

Kagi 的“More results”功能在许多情况下并没有提供额外的搜索条目,而是重复初始结果的 URL 列表,用户因此多次提交 bug 报告并追问进度。官方曾表示该问题“计划修复”,但随后解释去重(deduping)因与上游来源整合和缓存机制复杂而难以实现,问题长期未被解决。评论中有人把相似的分页/无限滚动重复问题类比到 Reddit,说明这类去重问题会普遍影响浏览体验并非孤例。抱怨者认为对付费搜索引擎而言,基本的 URL 去重不该成为长期未修复的缺陷。

[来源1] [来源2] [来源3]

即时答案 / widgets 导致误导或歧义结果

Kagi 的非有机输出(widgets / instant answers / 现在常称的“AI overviews”)在解析模糊查询时容易产生错误或奇怪的匹配,而不是返回相关网页列表。具体例子包括搜索“spaceweather”返回美国 East Derry 的地面天气、搜索“Pop os”被匹配到 Cocos Islands 或挪威小镇 Os,以及对“veterans day 2025”给出“= today”这类直接但出人意料的回答。评论指出这些结果通常来自语义解析、小组件或外部数据,而非传统的网页索引(organic results),因此更容易受歧义和不可靠信源影响。讨论提醒用户区分 widget/instant answers 与 SERP(Search Engine Results Page)中的有机结果,以理解何时应信任生成式输出。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

是否值得付费:功能优点与伦理/供应链顾虑

许多用户认为 Kagi 值得付费,因为它提供了 domain-block(域名屏蔽)等能显著减少噪音源的功能,以及面向写作的引用和来源管理,部分用户已把它作为 Google 的替代品。有人提到使用经验改善了搜索噪声(例如屏蔽 Medium 或 userbenchmark),也有用户表示对本地商家点评或某些查询仍会回到 Google。与此同时存在伦理和供应链方面的顾虑——有评论指出一小部分收入可能流向与俄罗斯有关的实体,这让一些人对付费产生犹豫。另有声音认为最近质量优势有所缩小,可能是为了应对 LLM/生成内容带来的“AI slop”而做出的检测调整,导致付费感受分化。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11]

Kagi 与 LLM 的关系:引用、准确性与助手整合

评论讨论 Kagi 在 LLM 时代的定位,支持者强调 Kagi 提供可追溯的来源,有助于避免单纯 LLM(如示例中的 Gemini)在无引用情况下给出自信但错误的断言。Kagi Assistant 被描述为一个与搜索后端整合的对话式 LLM 层——有用户提到以问号结尾的查询会优先触发 Assistant 回答,从而把检索与生成结合起来。但也有人担心把生成式能力嵌入搜索会引入“AI slop”,增加对结果二次核查的负担并可能降低总体可靠性。总体上,用户把 Kagi 看作在检索可引用性与交互式生成之间寻求平衡的产品,态度从审慎乐观到怀疑不等。

[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7]

📚 术语解释

dedupe / deduping(去重): 从搜索结果列表中移除重复 URL 或条目的过程;在多源检索与缓存存在时可能变得复杂,直接关系到“More results”是否返回新的条目。

More results(Kagi 的“More results”功能): 页面或无限滚动中用于加载附加搜索结果的功能;本次讨论的核心 bug 是该功能有时返回与初始页重复的链接而非新结果。

widgets / instant answers / AI overviews(即时答案/小组件): 搜索结果页中直接生成的回答或小部件(非通过网页索引的有机结果),通常基于自然语言解析或结构化数据,易受歧义和不可靠数据源影响。

domain-block(域名屏蔽功能): Kagi 提供的过滤功能,允许用户屏蔽特定域名以减少噪音和垃圾页面在搜索结果中的出现。

Kagi Assistant(内置的对话式 LLM 助手): Kagi 集成的生成式对话助手,能访问 Kagi 的搜索后端并在交互式查询中生成答案和引用,代表搜索与 LLM 功能的融合。