文:YY Liu、蓝立晴共同编写
21 世纪的今天,「Google」成为搜寻一字的代名词,已经是超过十载的共识。过去十年,多数时候 Google 在全球搜寻引擎市场一直稳坐 90% 以上市占。继微软旗下浏览器 IE 於今(2022)年宣布退场,人们大概更难想像有任何搜寻引擎能挑战 Google 霸主的地位。
但最新消息是: Google 可能即将遇上能动摇其地位的挑战者——AI 智能搜寻引擎 Andi 。
Andi 可突破 ChatGPT 的「限制」
在深入介绍 Audi 这款 AI 搜寻引擎之前,我们可以先来聊聊 ChatGPT。这也是最近最受到大众关注,甚至被认为可望挑战 Google、对 Google 市占率蚕食鲸吞的一项 AI 工具。
不过,ChatGPT 是否算是个「有效的」搜寻引擎,却还没有一个定论——这是因为 ChatGPT 的训练模型并不会即时更新,因此有可能提供使用者过时的答案,并且很多时候仍然需要使用者「另外 Google」来验证 ChatGPT 提供的讯息是真是假,这位聊天机器人本身也如此坦承其缺陷:
对於我的服务用户来说,记住这一点很重要:在使用我提供的任何资讯之前,应该根据可靠的外部来源进行验证。
而 Andi 既能过滤掉 Google 等传统搜寻引擎的弊病,又能弥补聊天机器人 ChatGPT 在提供即时、最新资讯方面的不足,但它是怎麽做到的?
♦ TO 延伸阅读:在我们还无法想像有人可取代「Google 搜寻」时,「AI 合成引擎」横空出世了
AI 基底的认知搜寻,可望越过「Google 障碍」
传统上,从零建立一项新的搜寻引擎,就像打造一项新的基础建设,耗时、费力又烧钱,原因是要在浩瀚网路里的数兆个网页中搜索,前提是要建立足够多的索引(Index)页面供引擎爬取(crawling),而在这点上,Google 已有数百亿个索引页面,堪称是任何对手、新进者难超越的障碍。但透过 AI 运作的搜索引擎,有望越过此一阻碍。
据《TechCrunch》报导,一项於今年下半年问世、名为 Andi 的 AI 搜寻引擎冲着传统搜寻引擎而来,旨在颠覆未来人们搜索资讯的方式。这类以 AI 为基底的搜寻引擎与传统搜寻方式不同,并非从网页中的文本、摘要分析相关性来排列搜寻结果, AI 搜寻引擎更接近所谓认知搜寻(cognitive search)。
认知搜寻简单来说是以更有脉络、人性化的搜寻结果来回应使用者想搜寻、发问的问题。
以采用类似技术的资料库搜寻引擎工具 Amazon Kendra 为例,据 AWS 官网指出,过去当我们要搜索某公司的营业时间,可能会打上「公司名称」、以及「营业时间」来搜寻,但使用认知搜寻的工具,允许使用者以完整句子来搜寻,像是句构较复杂、牵扯不同修辞及人性化口吻的长句。
使用者可以直接发问:「我什麽时候可以到该公司办事?」而系统会从资料库散落的资讯中,编排(compose)出适合结果,给出像是:「该公司每日营业时间是……」这样的答覆,而不是给出一行又一行的超连结,等着使用者逐一点开,找到自己要的答案。
同样的, Andi 透过经大量语言模型训练的 AI ,结合即时线上资料,提供使用者一项经过多项知识来源组合的回答。
实际使用 Andi 的过程,使用者首先会进入一个类似 Chat bot 的对话介面,并在讯息框中输入想发问的句子,接着系统会从所问问题,寻找与该问题具有高度相关及品质优良的资讯,并将这些资讯在排序後,从中提取资讯,编排成一项完整答案。
Andi 的使用者介面。
使用者也可选择图片、影片等不同呈现方式的搜寻结果。
据 Andi 研发人员指出,该平台针对不同知识领域,例如历史事实、coding、保健等,量身打造不同 AI 系统,其汲取的资料库来源也包罗万象(有些资料库来源可能像是 Forbes、纽约时报等媒体资料库)。
AI 搜寻引擎能扫除传统搜寻引擎弊端:广告、垃圾网页、侵犯隐私
Andi 创办人、年仅 23 岁的 Angela Hoover 认为,这类像是跟 AI Chatbot 对话的搜寻方式,将改善现行搜寻引擎的问题。
「Z 世代讨厌 Google ,搜寻结果总充斥着广告、精心编纂过 SEO 关键字,但实际上是垃圾的网页,用户得花大量时间才能从一行行杂乱无章的网页超连结找到自己想要的资讯。」Hoover 说道。
更糟的是传统搜寻引擎,透过纪录搜寻关键字来追踪使用者的资讯、位置以及兴趣,来投放广告。 Angela Hoover 声称, Andi 不仅不追踪使用者资讯,也不会记录和储存使用者阅读或点击的搜寻结果,仅会使用粗略的座标数据来提高搜索结果的相关性。
整体来说,根据使用者经验, Angela Hoover 指出 Andi 可以为使用者节省 15 或 20 分钟的搜寻时间,来得到想要的资讯。
不过,编辑实际测试 Andi 与 ChatGPT,发现 Andi 的确仅有「搜寻」的功能——它并不具备 ChatGPT 可以写词、写故事、写信的能力,而当未来 ChatGPT 启用付费选项後,要更新即时资料库或要突破更多限制,似乎就不成问题了。因此,对於 Andi 来说,其未来挑战仍然是艰钜的。
有趣的是,当编辑转头向 ChatGPT 提问「你能取代 Google 吗」之後,发现它并不认为自己是个搜寻引擎:
AI 会碰上的困境,Andi 也避不过
最後,如同 Google 也深受其扰的,即便是 Andi 这样的 AI 搜寻引擎,也可能受到假新闻、不实资讯误导,另外还有所有 AI 模型都会面临的问题:演算法造成的偏见、歧视。
就像《纽约时报》所形容,新一代聊天机器人最终可能会改变我们在线上学习和查找资讯的方式,但它们并不总是说实话。
目前处於 alpha 版本软体测试阶段、在今年冬季刚被创投 Y Combinator 投资的 Andi 正努力排除这些问题。
Angela Hoover 指出,系统将努力透过列入黑名单、加权指标等技术排除不实资讯,至於演算法造成搜寻结果具有刻板印象或偏见等问题,Angela Hoover 认为这需要更多资金、人力与时间的投入,才能开发、培训更多更适合市场所需的 AI 模型。
♦ TO 延伸阅读:低头族即将消失!Google、Amazon 都在押注的「环境运算」是什麽?
参考资料:TechCrunch、Y Combinator、AWS、Econsultancy、纽约时报,首图来源:Shutterstock。