AI手机，苹果又走在了国产厂商前面？

AI手机，苹果又走在了国产厂商前面？

文 | 解码 Decode

今年的苹果 WWDC 结束之后，尽管媒体的评价都是 " 没有惊喜 "，但作为头号黑粉的罗永浩却异常安静，上一条 " 怼人 " 的微博还是今年一月怒斥荣耀抄袭。

反倒是马斯克连发了 7 条推文，狂喷苹果全面接入 OpenAI 的 ChatGPT，他甚至到库克的帖子下贴脸开大，说如果库克不阻止这种令人毛骨悚然的植入型软件，他将禁止苹果设备进入其公司，并贡献了一张被科技圈广为流传的表情包。

虽然外界也好奇马斯克为何如此暴躁，但主要的关注点还是在 " 没有惊喜 " 的 Apple Intelligence（苹果智能）上。著名果链分析师郭明錤一边给苹果敲警钟，一边不忘提醒消费者，称 AI 可能会是苹果区隔高低端机种的新标签。

WWDC 发布会后，苹果股价做了一圈过山车，先是发布当天应声跌了 2%，第二天又神奇般大涨 7%。

从不满到追捧，资本市场的态度在 24 小时内发生了惊天反转，是投资人误会了库克吗？倒是原本乐见其成的国产厂商，仍在不遗余力制造苹果落后的话题。

倒也不是国产厂商蹭热度，主要在 AI 手机这件事上，之所以苹果会被评价 " 没有惊喜 "，是因为有一部分消费者已经用上了国产 AI 手机。换言之，WWDC 上苹果拿出来的那些东西，国产厂商都已经教育一遍市场了。

那么问题来了，这一次苹果还能走在国产厂商前面吗？

AI 手机行至第二阶段

在讨论先后的问题前，先来说说 AI 手机到哪个阶段了。

广泛层面上，AI 手机被分为 App 化、功能化和原生化三个阶段。简单来说，去年年初各种类 chatGPT 的 App 出现就是第一阶段，而随着 OPPO、三星等厂商推出 AI 手机，第二阶段也已到来。

这一阶段的 AI 手机，如今年 1 月发布的 OPPO Find X7 和三星 Galaxy S24，带有典型的 AI 功能化特征：支持通话摘要、AIGC 消除以及 AI 语音助手等。

而且在 AI 手机的整体思路上，各家都趋于一致：将大模型的能力内化到操作系统中，不再以显眼的 AI 应用呈现，而是进一步落地到具体手机使用场景，最终目的是让 AI 功能看似不存在却又无处不在。

具体功能集中在以下几类：

1 输入法。将生成式 AI 集成到键盘软件，提供风格建议和智能重写等功能。如三星 Galaxy AI 允许用户以不同的风格和情绪改写句子，同时还提供拼写和语法改正。

2 实时翻译和转录。如三星 Galaxy S24 和华硕 Zenfone 11 Ultra 可利用设备端 AI 功能，实现通话实时翻译。此外，S24 的实时翻译功能提供电话的实时转录，在屏幕上显示文本以方便参考，Zenfone 的 AI Transcript 可自动将语音转换为书面文本。

3 图像内容生成和编辑。如小米 14 和小米 14Ultra 引入了 "AI 人像 " 功能，允许用户在手机上使用图库里自己的照片来做训练，训练完成后用户只需输入文本提示，即可在几乎任何设置中生成逼真的 AI 自拍。OPPO Find X7 Ultra 可实现 AIGC 橡皮擦功能，允许在离线状态下，从照片中删除不需要的物体或人物。

4 通过 LLM 实现 AI 驱动的个性化功能。三星 Galaxy S24 可根据提示生成类似人类的文本能力，也可协助编写邮件或文档。OPPO Find X7 Ultra 提供了上下文感知的多回合对话，也提供了虚拟助手。

5 生成式 AI 界面工具。荣耀的任意门功能允许用户在应用程序之间拖放文本或图像等元素，AI 预测用户意图并建议相关的应用程序来共享内容。

按照上述功能来看，苹果之所以被评价 " 没有惊喜 "，也是因为它的主要功能点一样落在了文本类、图片类、语音转录、语义搜索和语音助手上。换言之，强如苹果也仍停留在 AI 手机的第二阶段。

不过，苹果似乎故意弄了一套障眼法，没有在发布会上公布自研大模型，加之 " 没有惊喜 " 的 Apple Intelligence，导致股价短暂震荡。但在发布会后，苹果又在一篇低调发表的技术博客中暗搓搓的介绍，端侧模型和云模型都是自己开发的。

其中，端侧模型是一个 30 亿参数（3B）的小模型，云上模型具体参数苹果没有公布。3B 级小模型和主流几个 7B 级模型能力上苹果都能基本胜出，而其云端模型则直接打到了 GPT-4 Turbo 级。

并且，也有分析认为，即便苹果实现的 AI 功能并不突出，但因为它在 AI 功能落地方面能做的更好，所以仍旧具有一定优势。

以文生图功能为例，一般用户使用手机并没有生图需求，但是苹果将此功能落到真正需求上：如颜表情 GenEmoji、聊天 message 中配图、iPad 文档处理草图变精图等，AI 介入将这些功能变得真实有用，带动用户需求。

而这还不是苹果最大的野心。

从功能化到原生化

去年 12 月，腾讯发表了一篇题为《AppAgent: Multimodal Agents as Smartphone Users》的论文，直译过来是 " 作为智能手机用户的多模式代理 "。里面介绍了一种新颖的基于 LLM 的多模态 Agent 框架，旨在操作智能手机应用程序。

简单点说就是腾讯设计了一个框架，能使智能体模仿人类的点击、滑动等交互操作，从而达到控制手机的目的。关键是，这种方法无需访问系统后端，也就是说它在不同 App 中有高度的适用性。

腾讯为 AppAgent 设定了三个核心功能：

1 ) 自主探索学习：智能体可以独立地探索应用程序，无需外部指导。

2 ) 观察人类演示学习：智能体通过观察用户的操作演示来学习任务执行。

3 ) 知识库构建：智能体通过上述学习过程积累经验，构建知识库，用于跨应用执行复杂任务。

理论意义上，AppAgent 是一个帮你操作所有 App 的应用。类似于苹果在发布会上的演示，用户告诉 Siri 想去接机，Siri 可调取邮件里的航班信息、查找最新航班资讯、调用地图 App 形成路线，最终生成一份完整的建议。

将多模态能力用户 UI 界面，通过理解 UI 来执行智能体指令，或是 AI 手机从功能化迈向原生化的一个重要转折标志。苹果发布的 Ferret UI 大模型，就意图在操作系统层学习用户使用习惯、并有望替代用户执行操作。

基于对 UI 的理解，配合端侧智能体的任务规划和分配能力，AI 手机具备了可实现如下重大跨越的潜力：用户使用自然语言下达指令，AI 手机理解意图并将其拆分为具体工作流，然后从 UI 层面模拟用户操作以执行指令。最终实现跨 App 的操作与复杂任务执行。如此一个 AI 原生的手机操作系统的主要架构就完成了。

举例来说，当用户以自然语言向 AI 手机输入指令 " 帮我买一张明天下午 2 点去北京的靠窗的火车票 "，手机智能体先接受语音、做语义分析和意图理解，然后进行任务拆分，拆分为：打开 12306 App、选择搜索车票、选择地址 " 北京 "、选择 " 明天下午 2 点 "、选择 " 靠窗 "、选择 " 乘客姓名 "、点击 " 购买 "；并通过 UI 类模型，解读 App 上不同的 UI 界面，并模拟用户点击操作，实现整个流程。

这一系列操作是不是与苹果在发布会上的演示很像，只不过苹果现阶段没有使用智能体的称呼，而是称之为理解用户情境，实现跨 App 操作。

类似的产品在今年 MWC 展上也出现了。Brain.ai 的展示的基于 App-less 交互模式的概念手机 T-Phone，用户只需在对话框中输入需求，即可得到快速响应。T-Phone 的核心概念是抛弃传统的围绕 App 设计的手机，转而通过 AI 使用上下文预测来生成界面，帮助用户完成任务。

国内厂商中，荣耀在魔法 OS 上推出的任意门功能也是 AI 手机原生化的雏形。它允许用户在应用程序之间拖放文本或图像等元素，虽然被罗永浩怒怼抄袭，但其核心能力是 "AI 预测用户意图并建议相关的 App 来共享内容 "。荣耀当时宣称，在推出时预计支持全球约 100 个最常用的应用程序。

无论苹果、腾讯、荣耀或者 Brain.ai，这些公司希望最终达成的目标是：

用户只需要输入想要获得的服务（通过语音、文字等形式），手机会直接跳转到服务页面，或是由 AI 智能体直接完成用户所需要的服务。

但基于 AI 智能体的多元、自然交互体验，必须要有足够的甚至所有的功能和服务支撑。在此基础上，AI 智能体的交互才能从传统 GUI（Graphical User Interface）发展成 VUI（Voice User Interface），最终升级为全新 Agent（App-less）UI，意味着用户与手机的交互将发生在 AI 智能体和用户之间，弱化 APP 的存在感。

所以这一演进预计不会一蹴而就，未来很长一段时间内，AI 智能体与 App 会同时活跃在 AI 手机里。而且不仅手机厂商，头部 App 也可能围绕自己的业务生态打造专用 AI 智能体，例证就是腾讯发表的那篇论文。

尾声

再回到文初我们提出的问题，在 AI 手机这件事上，苹果是否还能领先。从表面看，苹果似乎没有突破已有 AI 手机特征，但有三点是非常值得关注的。

第一，苹果利用 Siri 实现的跨 App 操作，已经非常接近 AI 手机原生化阶段的智能体了，目前国产品牌在这方面仍然落后；

第二，在第二阶段的演进上，苹果仍保留着技术优势。比如在解决大模型手机内存瓶颈的问题上，苹果和国产品牌就选择了不同的技术路线。

苹果的思路是通过内存优化来解决小内存运营大模型的问题，其构建了一个以闪存为基础的推理成本模型，并使用窗口化（Windowing）以及行列捆绑（Row-Column Bundling）两项关键技术，来最小化数据传输并最大化闪存吞吐量。

简单来说，苹果做到了让 8G 内存的 iPhone 15 Pro 跑通 3B 参数模型，而同样是 8G 内存的 Pixel 8 和 8a，今年 5 月才跑通 1.8B 的 Gemnini Nano。

相较之下，国产厂商之所能在 12G 内存机型上跑通 7B 参数大模型，是因为选择了压缩路线。

如 vivo 和 OPPO 都已在端侧跑通 7B 参数大模型，不过核心能力来自联发科，借助后者的混合精度 INT4 量化技术和 NeuroPilot Compression 技术，能将 130 亿参数 LLM 所需的内存空间，从 13GB 减少到 5GB。

荣耀在今年 4 月也宣布，基于自家平台级 AI 压缩技术，7B 模型能在 12GB 内存设备上快速启动。

总之，在 AI 手机这件事上的竞争，已经不再是有没有大模型了，而是如何以更低成本提供更好服务。

第三，就是苹果宣布开放 AI SDK，这可能是被很多人忽略的一个重磅信息。

未来开发者可调用苹果手机的 AI SDK，基于用户情境理解，完善第三方 App 的 AI 功能。作为目前用户手机的主要使用场景，未来第三方应用搭载 AI 能力后，AI 手机的使用体验将得到增强。

但对于国产厂商来说，这可能是一件比较难的工作。所以，国产厂商的问题就变成了，虽然在想法和布局上领先了苹果，但在技术和生态层面依旧要追赶，而这恰恰是苹果难以被超越的护城河。

参考资料：

[ 1 ] AppAgent：Multimodal Agents as Smartphone Users，腾讯团队

[ 2 ] 为什么有华为麒麟 9000s，还需要联发科 9300S？极客视界

[ 3 ] 苹果发布多模态模型 Ferret-UI，部分手机 UI 任务超越 GPT-4V，雷峰网 leiphone

[ 4 ] 马斯克全面禁用苹果设备，隐私泄露贼喊捉贼？太平洋科技

[ 5 ] 股价暴涨 7%！我们深挖了两份低调公布的资料后，发现了苹果 AI 的秘密，腾讯科技

[ 6 ] AI 端侧深度报告之 AI 手机，中银国际

[ 7 ] 苹果 2024 WWDC 点评，中银国际

AI手机，苹果又走在了国产厂商前面？

相关推荐

小果蔷薇如何盆栽

丽格海棠的繁殖方法

蓝花丹的养殖方法和注意事项

酒瓶兰种子怎么种

红色彼岸花有没有毒，红色彼岸花珍贵吗

桂花树市场价，桂花树图片

凤眼蓝的繁殖方法

矾根的养殖方法和注意事项

大雪素的四季养护

白车轴草的花语及传说

荔枝草的功效与作用，荔枝草图片

金枝玉叶怎么换盆

绯牡丹的价值

不同颜色的曼陀罗花语

矮牵牛怎么爆盆

30种耐阴植物室内盆栽，耐阴的室内植物

“三角梅”生长时，这“3种”肥不能少，15天喂一次，花朵爬满墙！

紫竹怎么繁殖

石斛和铁皮石斛的区别，石斛图片

若绿怎么施肥