​AI手机,苹果又走在了国产厂商前面?

AI手机,苹果又走在了国产厂商前面?

文 | 解码 Decode

今年的苹果 WWDC 结束之后,尽管媒体的评价都是 " 没有惊喜 ",但作为头号黑粉的罗永浩却异常安静,上一条 " 怼人 " 的微博还是今年一月怒斥荣耀抄袭。

反倒是马斯克连发了 7 条推文 ,狂喷苹果全面接入 OpenAI 的 ChatGPT,他甚至到库克的帖子下贴脸开大,说如果库克不阻止这种令人毛骨悚然的植入型软件,他将禁止苹果设备进入其公司,并贡献了一张被科技圈广为流传的表情包。

虽然外界也好奇马斯克为何如此暴躁,但主要的关注点还是在 " 没有惊喜 " 的 Apple Intelligence(苹果智能)上。著名果链分析师郭明錤一边给苹果敲警钟,一边不忘提醒消费者,称 AI 可能会是苹果区隔高低端机种的新标签。

WWDC 发布会后,苹果股价做了一圈过山车,先是发布当天应声跌了 2%,第二天又神奇般大涨 7%。

从不满到追捧,资本市场的态度在 24 小时内发生了惊天反转,是投资人误会了库克吗?倒是原本乐见其成的国产厂商,仍在不遗余力制造苹果落后的话题。

倒也不是国产厂商蹭热度,主要在 AI 手机这件事上,之所以苹果会被评价 " 没有惊喜 ",是因为有一部分消费者已经用上了国产 AI 手机。换言之,WWDC 上苹果拿出来的那些东西,国产厂商都已经教育一遍市场了。

那么问题来了,这一次苹果还能走在国产厂商前面吗?

AI 手机行至第二阶段

在讨论先后的问题前,先来说说 AI 手机到哪个阶段了。

广泛层面上,AI 手机被分为 App 化、功能化和原生化三个阶段。简单来说,去年年初各种类 chatGPT 的 App 出现就是第一阶段,而随着 OPPO、三星等厂商推出 AI 手机,第二阶段也已到来。

这一阶段的 AI 手机,如今年 1 月发布的 OPPO Find X7 和三星 Galaxy S24,带有典型的 AI 功能化特征:支持通话摘要、AIGC 消除以及 AI 语音助手等。

而且在 AI 手机的整体思路上,各家都趋于一致:将大模型的能力内化到操作系统中,不再以显眼的 AI 应用呈现,而是进一步落地到具体手机使用场景,最终目的是让 AI 功能看似不存在却又无处不在。

具体功能集中在以下几类:

1 输入法。将生成式 AI 集成到键盘软件,提供风格建议和智能重写等功能。如三星 Galaxy AI 允许用户以不同的风格和情绪改写句子,同时还提供拼写和语法改正。

2 实时翻译和转录。如三星 Galaxy S24 和华硕 Zenfone 11 Ultra 可利用设备端 AI 功能,实现通话实时翻译。此外,S24 的实时翻译功能提供电话的实时转录,在屏幕上显示文本以方便参考,Zenfone 的 AI Transcript 可自动将语音转换为书面文本。

3 图像内容生成和编辑。如小米 14 和小米 14Ultra 引入了 "AI 人像 " 功能,允许用户在手机上使用图库里自己的照片来做训练,训练完成后用户只需输入文本提示,即可在几乎任何设置中生成逼真的 AI 自拍。OPPO Find X7 Ultra 可实现 AIGC 橡皮擦功能,允许在离线状态下,从照片中删除不需要的物体或人物。

4 通过 LLM 实现 AI 驱动的个性化功能。三星 Galaxy S24 可根据提示生成类似人类的文本能力,也可协助编写邮件或文档。OPPO Find X7 Ultra 提供了上下文感知的多回合对话,也提供了虚拟助手。

5 生成式 AI 界面工具。荣耀的任意门功能允许用户在应用程序之间拖放文本或图像等元素,AI 预测用户意图并建议相关的应用程序来共享内容。

按照上述功能来看,苹果之所以被评价 " 没有惊喜 ",也是因为它的主要功能点一样落在了文本类、图片类、语音转录、语义搜索和语音助手上。换言之,强如苹果也仍停留在 AI 手机的第二阶段。

不过,苹果似乎故意弄了一套障眼法,没有在发布会上公布自研大模型,加之 " 没有惊喜 " 的 Apple Intelligence,导致股价短暂震荡。但在发布会后,苹果又在一篇低调发表的技术博客中暗搓搓的介绍,端侧模型和云模型都是自己开发的。

其中,端侧模型是一个 30 亿参数(3B)的小模型,云上模型具体参数苹果没有公布。3B 级小模型和主流几个 7B 级模型能力上苹果都能基本胜出,而其云端模型则直接打到了 GPT-4 Turbo 级。

并且,也有分析认为,即便苹果实现的 AI 功能并不突出,但因为它在 AI 功能落地方面能做的更好,所以仍旧具有一定优势。

以文生图功能为例,一般用户使用手机并没有生图需求,但是苹果将此功能落到真正需求上:如颜表情 GenEmoji、聊天 message 中配图、iPad 文档处理草图变精图等,AI 介入将这些功能变得真实有用,带动用户需求。

而这还不是苹果最大的野心。

从功能化到原生化

去年 12 月,腾讯发表了一篇题为《AppAgent: Multimodal Agents as Smartphone Users》的论文,直译过来是 " 作为智能手机用户的多模式代理 "。里面介绍了一种新颖的基于 LLM 的多模态 Agent 框架,旨在操作智能手机应用程序。

简单点说就是腾讯设计了一个框架,能使智能体模仿人类的点击、滑动等交互操作,从而达到控制手机的目的。关键是,这种方法无需访问系统后端,也就是说它在不同 App 中有高度的适用性。

腾讯为 AppAgent 设定了三个核心功能:

1 )  自主探索学习:智能体可以独立地探索应用程序,无需外部指导。

2 )  观察人类演示学习:智能体通过观察用户的操作演示来学习任务执行。

3 )  知识库构建:智能体通过上述学习过程积累经验,构建知识库,用于跨应用执行复杂任务。

理论意义上,AppAgent 是一个帮你操作所有 App 的应用。类似于苹果在发布会上的演示,用户告诉 Siri 想去接机,Siri 可调取邮件里的航班信息、查找最新航班资讯、调用地图 App 形成路线,最终生成一份完整的建议。

将多模态能力用户 UI 界面,通过理解 UI 来执行智能体指令,或是 AI 手机从功能化迈向原生化的一个重要转折标志。苹果发布的 Ferret UI 大模型,就意图在操作系统层学习用户使用习惯、并有望替代用户执行操作。

基于对 UI 的理解,配合端侧智能体的任务规划和分配能力,AI 手机具备了可实现如下重大跨越的潜力:用户使用自然语言下达指令,AI 手机理解意图并将其拆分为具体工作流,然后从 UI 层面模拟用户操作以执行指令。最终实现跨 App 的操作与复杂任务执行。如此一个 AI 原生的手机操作系统的主要架构就完成了。

举例来说,当用户以自然语言向 AI 手机输入指令 " 帮我买一张明天下午 2 点去北京的靠窗的火车票 ",手机智能体先接受语音、做语义分析和意图理解,然后进行任务拆分,拆分为:打开 12306 App、选择搜索车票、选择地址 " 北京 "、选择 " 明天下午 2 点 "、选择 " 靠窗 "、选择 " 乘客姓名 "、点击 " 购买 ";并通过 UI 类模型,解读 App 上不同的 UI 界面,并模拟用户点击操作,实现整个流程。

这一系列操作是不是与苹果在发布会上的演示很像,只不过苹果现阶段没有使用智能体的称呼,而是称之为理解用户情境,实现跨 App 操作。

类似的产品在今年 MWC 展上也出现了。Brain.ai 的展示的基于 App-less 交互模式的概念手机 T-Phone,用户只需在对话框中输入需求,即可得到快速响应。T-Phone 的核心概念是抛弃传统的围绕 App 设计的手机,转而通过 AI 使用上下文预测来生成界面,帮助用户完成任务。

国内厂商中,荣耀在魔法 OS 上推出的任意门功能也是 AI 手机原生化的雏形。它允许用户在应用程序之间拖放文本或图像等元素,虽然被罗永浩怒怼抄袭,但其核心能力是 "AI 预测用户意图并建议相关的 App 来共享内容 "。荣耀当时宣称,在推出时预计支持全球约 100 个最常用的应用程序。

无论苹果、腾讯、荣耀或者 Brain.ai,这些公司希望最终达成的目标是:

用户只需要输入想要获得的服务(通过语音、文字等形式),手机会直接跳转到服务页面,或是由 AI 智能体直接完成用户所需要的服务。

但基于 AI 智能体的多元、自然交互体验,必须要有足够的甚至所有的功能和服务支撑。在此基础上,AI 智能体的交互才能从传统 GUI(Graphical User Interface)发展成 VUI(Voice User Interface),最终升级为全新 Agent(App-less)UI,意味着用户与手机的交互将发生在 AI 智能体和用户之间,弱化 APP 的存在感。

所以这一演进预计不会一蹴而就,未来很长一段时间内,AI 智能体与 App 会同时活跃在 AI 手机里。而且不仅手机厂商,头部 App 也可能围绕自己的业务生态打造专用 AI 智能体,例证就是腾讯发表的那篇论文。

尾声

再回到文初我们提出的问题,在 AI 手机这件事上,苹果是否还能领先。从表面看,苹果似乎没有突破已有 AI 手机特征,但有三点是非常值得关注的。

第一,苹果利用 Siri 实现的跨 App 操作,已经非常接近 AI 手机原生化阶段的智能体了,目前国产品牌在这方面仍然落后;

第二,在第二阶段的演进上,苹果仍保留着技术优势。比如在解决大模型手机内存瓶颈的问题上,苹果和国产品牌就选择了不同的技术路线。

苹果的思路是通过内存优化来解决小内存运营大模型的问题,其构建了一个以闪存为基础的推理成本模型,并使用窗口化(Windowing)以及行列捆绑(Row-Column Bundling)两项关键技术,来最小化数据传输并最大化闪存吞吐量。

简单来说,苹果做到了让 8G 内存的 iPhone 15 Pro 跑通 3B 参数模型,而同样是 8G 内存的 Pixel 8 和 8a,今年 5 月才跑通 1.8B 的 Gemnini Nano。

相较之下,国产厂商之所能在 12G 内存机型上跑通 7B 参数大模型,是因为选择了压缩路线。

如 vivo 和 OPPO 都已在端侧跑通 7B 参数大模型,不过核心能力来自联发科,借助后者的混合精度 INT4 量化技术和 NeuroPilot Compression 技术,能将 130 亿参数 LLM 所需的内存空间,从 13GB 减少到 5GB。

荣耀在今年 4 月也宣布,基于自家平台级 AI 压缩技术,7B 模型能在 12GB 内存设备上快速启动。

总之,在 AI 手机这件事上的竞争,已经不再是有没有大模型了,而是如何以更低成本提供更好服务。

第三,就是苹果宣布开放 AI SDK,这可能是被很多人忽略的一个重磅信息。

未来开发者可调用苹果手机的 AI SDK,基于用户情境理解,完善第三方 App 的 AI 功能。作为目前用户手机的主要使用场景,未来第三方应用搭载 AI 能力后,AI 手机的使用体验将得到增强。

但对于国产厂商来说,这可能是一件比较难的工作。所以,国产厂商的问题就变成了,虽然在想法和布局上领先了苹果,但在技术和生态层面依旧要追赶,而这恰恰是苹果难以被超越的护城河。

参考资料:

[ 1 ]  AppAgent:Multimodal Agents as Smartphone Users,腾讯团队

[ 2 ]  为什么有华为麒麟 9000s,还需要联发科 9300S?极客视界

[ 3 ]  苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V,雷峰网 leiphone

[ 4 ]  马斯克全面禁用苹果设备,隐私泄露贼喊捉贼?太平洋科技

[ 5 ]  股价暴涨 7%!我们深挖了两份低调公布的资料后,发现了苹果 AI 的秘密,腾讯科技

[ 6 ]  AI 端侧深度报告之 AI 手机,中银国际

[ 7 ]  苹果 2024 WWDC 点评,中银国际

相关推荐

​小果蔷薇如何盆栽

​小果蔷薇如何盆栽

180

小果蔷薇如何盆栽 选择容器 这种植物可能会长得非常高,能够达到二到五米。所以,为了避免之后换盆太过麻烦,我们可以一开始就选择一个比较大的容器。另外,还有关于排水性的...

​丽格海棠的繁殖方法

​丽格海棠的繁殖方法

204

丽格海棠的繁殖方法 播种繁殖法 播种繁殖是植物繁殖的常用手法,丽格海棠也可以播种。但是由于丽格海棠的种子比较小,在播种的时候需要采取特殊的方法——小粒种子播种法来进...

​蓝花丹的养殖方法和注意事项

​蓝花丹的养殖方法和注意事项

178

蓝花丹的养殖方法和注意事项 蓝花丹的养殖方法 温度和光照 蓝花丹喜欢温暖和光照充足的环境,不耐寒。生长的适宜温度在17℃到25℃,之间,夏季不超过35℃,冬季越冬温度应在7℃以...

​酒瓶兰种子怎么种

​酒瓶兰种子怎么种

124

酒瓶兰种子怎么种 1、种子选择 如果我们想看到酒瓶兰从种子到植株的一生的话,就得挑好它的种子,因为这是它生长的关键,如果我们选的是一颗坏了的种子,那它连发芽都是问题,...

​红色彼岸花有没有毒,红色彼岸花珍贵吗

​红色彼岸花有没有毒,红色彼岸花珍贵吗

165

红色彼岸花有没有毒,红色彼岸花珍贵吗 一、有没有毒 红色彼岸花是有毒的。这种植物从上到下都要毒,包括叶子、花朵、果实和种子。它含有秋水仙碱,这种物质一旦误食,2-5个小...

​桂花树市场价,桂花树图片

​桂花树市场价,桂花树图片

126

桂花树市场价,桂花树图片 一、市场价 1、幼苗:市场上售卖的小苗价格并不是很贵,通常都是在1-20元之间。价格的跨度比较大,具体的是受品种,规格以及购买数量的影响。从它的品...

​凤眼蓝的繁殖方法

​凤眼蓝的繁殖方法

56

凤眼蓝的繁殖方法 凤眼蓝的繁殖方式 凤眼蓝的无性繁殖能力很强,由腋芽长出的匍匐枝既形成新株,母株与新株的匍匐枝很脆嫩,断离后又可以成为新株。 母株仲春发芽后长到6—8片...

​矾根的养殖方法和注意事项

​矾根的养殖方法和注意事项

119

矾根的养殖方法和注意事项 养殖方法 光照和温度 矾比较耐寒,喜欢阳光并且耐阴,非常适合在阴凉的半阴处养护。在夏季,要避免阳光直射,适当遮阴,并要记得保持通风。冬季可以...

​大雪素的四季养护

​大雪素的四季养护

139

大雪素的四季养护 大雪素的春夏养护 大雪素的春季养护 养花并不是别人怎么养,自己就可以怎么养的。但是介于每一种花的生长习性,养花方法其实大同小异,只是要根据养花人自己...

​白车轴草的花语及传说

​白车轴草的花语及传说

66

白车轴草的花语及传说 白车轴草的花语 我们常常赋予一些花卉特殊的含义,但是一般是一种花一个花语。而白车轴草。也就是三叶草,却是每一片叶子都有一个花语。 三叶草,一片叶...

​荔枝草的功效与作用,荔枝草图片

​荔枝草的功效与作用,荔枝草图片

133

荔枝草的功效与作用,荔枝草图片 一、功效与作用 荔枝草是一种中草药,全草都可以入药,有着清热解毒的作用,具有较高的药用价值。一般生长于山坡、路边、田野潮湿的土壤上,...

​金枝玉叶怎么换盆

​金枝玉叶怎么换盆

110

金枝玉叶怎么换盆 1、时间 换盆的时间要注意,在生长期内不可进行,因为这个时候温度比较高,细菌会比较活跃,植株可能会出现有水和病亡。水分蒸发比较快,而换盆之后的根不可...

​绯牡丹的价值

​绯牡丹的价值

59

绯牡丹的价值 绯牡丹的观赏价值 想到植物,人们的第一反应不外乎是美丽的、绿色的、多姿多彩的。一棵植物有多么的美丽,人们就有多喜欢它。 绯牡丹是一种多肉植物,属于仙人掌...

​不同颜色的曼陀罗花语

​不同颜色的曼陀罗花语

146

不同颜色的曼陀罗花语 紫色曼陀罗 恐怖 蓝色曼陀罗 诈情,骗爱 粉色曼陀罗 适意 绿色曼陀罗 生生不息的希望 黑色曼陀罗 不可预知的黑暗、死亡和颠沛流离的爱。无间的爱和复仇,凡...

​矮牵牛怎么爆盆

​矮牵牛怎么爆盆

156

矮牵牛怎么爆盆 1、这种植物的习性 只有了解了它的特点,才能知道怎么做对它有利。首先,它喜欢温暖环境。它非常不耐寒冷,温度高倒是没什么。要想它爆盆,温度是一定要保证的...

​30种耐阴植物室内盆栽,耐阴的室内植物

​30种耐阴植物室内盆栽,耐阴的室内植物

128

30种耐阴植物室内盆栽,耐阴的室内植物 一、万年青 万年青是非常耐阴的室内植物,适合在柔和的光线下生长,耐不住强光,夏季高温时遭受直射光,可能会使叶子被灼伤灼黄。万年青...

​紫竹怎么繁殖

​紫竹怎么繁殖

168

紫竹怎么繁殖 繁殖方法 它的方式跟其他植物相比有些不同,它是通过直接移植母竹或者通过埋鞭根来进行的。 具体操作 首先,我们应该选择好苗床,要求是土壤肥沃、疏松并且排水性...

​石斛和铁皮石斛的区别,石斛图片

​石斛和铁皮石斛的区别,石斛图片

148

石斛和铁皮石斛的区别,石斛图片 一、二者的区别 1、外表不同:普通的石斛茎比较直立,而且也很肥厚,形状为圆柱形,长度在10-60厘米之间,通常不分枝。叶子为革质,形状长圆形...

​若绿怎么施肥

​若绿怎么施肥

133

若绿怎么施肥 植物喜肥吗 总体来说,这种植物在各个时期对肥料的需求都不大,频率也都不高。当然,如果你希望它成长得再茁壮一些,或者你对土壤的肥沃程度有些不满意的话,那...