腾讯 AI 助手元宝大升级!除了能搜公众号,跟其他国产 AI 搜索有什么不同?
5 月 30 日,腾讯的 AI 助手应用「腾讯元宝」上线。因为可以引用公众号文章,内容生态质量较高,AI 搜索赛道虽然卷生卷死,姗姗来迟的元宝仍然被看好。
7 月 1 日,元宝迎来大升级:上线「深度搜索」模式,手机 app 更新到最新版本即可使用。
所谓的「深度搜索」,其实就是让 AI 助手更聪明,延伸你的问题,回答得比基础搜索更广泛和深入,还能同步生成内容大纲、思维导图等 J 人狂喜的格式。
这听起来有点耳熟,国内外的 AI 搜索都有类似的功能—— Perplexity 的「Pro」搜索、秘塔的「深入」和「研究」搜索,天工的「增强」和「研究」搜索 ......
总是略慢半步的元宝,能否真的后来居上?
认真答题还是狂水字数,只有一线之隔
首先需要说明,「深度搜索」不是事先可选的模式,元宝先照常回答你的问题,再有几率提供「深度搜索」的一键生成选项。
比如,当我给元宝发个链接,让它总结公众号文章的内容,「深度搜索」就没有出现。
接下来正式开始,先来一个热身题:City 不 City 是什么梗?
这个梗出自外国博主 @保保熊,形容一个地方城市化、现代化、洋气,借着最近外国游客到中国旅游的东风,席卷了互联网。
元宝精准地找到了梗的出处,解释了基本和引申含义,以及它如何被更多短视频化用。参考的资料还很新鲜,其中一篇公众号文章,就比我发出问题早了 2 个小时左右。
不过,这是元宝用基础搜索就可以做到的事情,重头戏是一个金光闪闪的选项——「深度研究该问题」。
点击一下,元宝直接呈上了一份研究报告,不厌其烦地解释了这个梗的流行原因和社会影响,列出了大纲、脑图、相关人物。
但是,元宝的回答太啰嗦了,段落之间不少意思重复的表达,仿佛本科学生论文,挤一挤都是水分。
▲ 4 张截图也截不完!
然后,我拿同样的题目,用秘塔的「深入模式」再搜索了一遍,给出的结果也有大纲、脑图、相关事件和人物等,甚至还能生成 PPT,但看着更言简意赅,重点也没有遗漏。
▲ 图片来自:秘塔
选择秘塔作为对照组,是因为它在国产 AI 搜索里口碑较好,引用信源丰富,也支持脑图和大纲。拿秘塔的「深入模式」和元宝的「深度搜索」对垒,相对公平。
再来一个进阶题:2024 年 6 月,海内外的 AI 生成视频工具有哪些重大的进展?
元宝先拒绝回答,说这是「未来」的事情,叫我自己动手。哪怕训练数据没有那么新,但它可以联网搜索啊!当我提醒了元宝,它终于反应过来,列出了可灵、Luma 等工具。
然后再进行「深度研究」,元宝乱答一通,可能因为对提示词和上下文的理解混乱,同时回答了我两个问题:哪些 AI 可以联网搜索,以及 AI 生成视频工具的发展情况。
理解能力比较松弛,但延伸角度又弥补了这一部分,元宝介绍了其中一些工具的具体使用方法,并且思考了 AI 生成视频可能存在的风险,又实用,又懂升华。
再用秘塔的深入模式搜索,一次输出的答案就很不错,每个工具的发布都标注了时间,旁边的大纲引申到了更多非六月发布的工具,以及对整个行业的展望,详略得当。
其实在体验过程中,元宝的「已读乱回」不只出现了一次。
当我提问全球首款集成 GPT-4o 的智能眼镜,在「深入搜索」模式下,除了眼镜本身,元宝还介绍了 GPT-4o 在其他领域的应用,甚至提到了 GPT-4o 的竞争对手 Gemini。
如果我是阅卷老师,会觉得 AI 是在堆砌材料,有偏题嫌疑。同学,我们的核心是智能眼镜,要么纵向介绍发展历史,要么横向比较竞品,而不是疯狂拓展支线剧情。
接下来试试元宝的舒适区。腾讯说了,在科研、财经等专业场景下,深度搜索的效果更突出。所以,来一道学术型的题目:近期的多起 Manner 咖啡员工与顾客冲突事件,可以用哪些社会学理论解释?
这一次,元宝回答得还不错,提到了异化、情绪劳动、资本监控和劳动者困境等理论,并引导我们思考:Manner 事件是否反映了更广泛的社会问题?
再把问题交给秘塔的深入模式,搜索范围选择学术,回答得比元宝思路更开阔、更能扯淡,看起来学术含金量更高。
根据以上题目的测试结果,再结合使用感受,小结一下深度搜索的特点:
1. 并非每个问题都需要深度搜索,有时反而显得信息冗余、逻辑杂乱、重点不突出。
2. 在有限的题目范围内,元宝的深度搜索表现不如秘塔的深入模式。(欢迎大家提出自己的意见)
3. 元宝的参考资料是第三方网站以及公众号文章的混搭,在有限的题目范围内,公众号生态没有体现出明显优势,高质量的信源固然重要,但模型能力也重要,对上下文的理解出错,直接拉低输出结果。
4. 深度搜索的加载速度慢,字数又多,生成近 3000 字的完整答案需要 1 分多钟,等得让人心急,如果想要边看内容、边等待加载完毕,操作也不太方便。
AI 搜索,让少数的问题被更多地思考
不约而同地,AI 搜索产品都在往更纵深的方向卷,「深度搜索」「研究」「增强」......
这些不明觉厉的前缀,明确了 AI 搜索的定位。它们不完全取代传统搜索,而是有自己的赛道,更深入理解用户的查询意图,提供更精准完整的搜索结果。
数据显示,当前在大模型相关产品的使用中,超过 65% 的用户需求集中于提升工作与学习效率,其中「搜索问答」需求占比高达 45%。
如果只是在手机上找到某个网站、某条新闻,AI 搜索和传统搜索差别不大。
比如,相比通过输入「7 月 4 日生成式 AI 大事件」、在腾讯元宝了解今天的大新闻,我觉得还是爱范儿和 APPSO 的早报更有价值。
人类编辑的信息筛选、总结乃至排版审美,更胜满屏都是字的 AI 一筹。
但找到和某个主题相关的文章、视频、图片、数据,对播客、论文等针对性搜索,生成调查报告、思维导图和 PPT,就是 AI 搜索的强项了。
AI 搜索不仅是搜索,也是研究和总结,有些像我们编辑把选题扩展成提纲再写成文章的过程。
基于这个角度,我向元宝提问:介绍几款类似网易有道 Echo 的海内外 AI 口语教学 app。
提问的是事实本身,我想知道,进行深度搜索后,元宝的延伸角度会是什么,能否抽出一些可用的观点?结果比较常规,还是围绕着某个 app 的特色功能、收费标准。
我决定进一步追问,把这些 app 关联起来:这些 AI 口语教学 app 有哪些共同的特点?反映用户对口语学习的什么需求?
这次,元宝给我的答案好多了,总结了个性化学习、即时反馈、模拟真实对话场景、学习资源丰富等特点。
延伸角度也有意思,变得更加具体可感,关注到了时效性,以及用户群体:2024 年最新的 AI 口语教学 app 有哪些新技术应用?哪些 AI 口语教学 app 适合初学者使用?
AI 搜索查找资料的能力固然强大,但也要我们引导,才能给出有用的「你可能还想知道」「你可能还想问」。在这个过程里,我们也在思考。
AI 搜索头把交椅 Perplexity 的 CEO 在专访中说过,大多数问题只需互联网搜索就能解决,少数问题要额外思考。
这个观点很适合用来破解 2024 年的一道高考作文题:随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?
古希腊哲学家芝诺将人的知识比做圆圈,圆圈里面是已知的,圆圈外面是未知的,我们知道的东西越多,圆圈也就越大,外沿也就越长,我们不知道的也就越多。
因为 AI,得到答案的过程更快了,同时也有更多问题随之而来。也是因为 AI,那些少数的、需要额外思考的问题,我们可以走得更远。