每经记者|王晶 每经编辑|廖丹
日前,字节跳动与努比亚联合推出的“豆包AI手机”引发广泛关注。用户只需一句语音指令,它便能通过“读屏”“模拟点击”等GUI(图形用户界面)技术,像人一样操作各类App,自动完成跨平台比价、下单、点餐、回复消息等一系列跨App任务。这种“跃进式”的交互方式瞬间拉升了公众对 AI 手机助手能力的期待。
然而,在这种技术路径下,AI 助手可以直接绕过银行、淘宝等App的沙箱隔离机制(原本用于防止应用越权、保护系统安全的设计)直接读取聊天记录、验证码、账户信息等敏感数据。这条看似高效的技术捷径,迅速引发了关于数据授权、隐私保护与系统安全的讨论。
12月22日,快手平台遭到“自动化”黑灰产攻击,一些安全专家认为黑灰产利用了AI技术,加剧了人们对此的担忧。
当前围绕AI手机也出现两条截然不同的技术路线之争:一条是以“豆包手机”为代表的GUI Agent范式,主张让系统级AI直接读取手机屏幕的信息并拟人操作;另一条则是谷歌、苹果等厂商倡导的 Agent to Agent(A2A)范式,强调多个智能体之间直接通信或协作。也就是说,系统级AI只负责理解用户意图,将任务拆解后分发给各应用自己的Agent,不需要读屏和虚拟点击,由应用侧智能体,在自身权限边界内完成执行。
“GUI Agent 更像是一个中间(过渡)形态,最终我们还是要跟服务厂商共建生态,为用户提供服务,大概率会通过A2A的形式,但长尾需求仍需要通过GUI方案实现。”12 月 22 日,OPPO ColorOS 智慧产品研发总监姜昱辰在接受包括每经记者在内的媒体采访时对未来AI手机的发展方向进行了系统性阐述。
谈及 OPPO 是否与豆包展开合作时,姜昱辰回应称,OPPO 在合作层面持开放态度。“我们以用户需求为导向,在整体方案上并不排斥与任何一家厂商合作,关键看有没有好的合作契机。”她同时透露,目前 OPPO正与支付宝进行深度合作,并计划于明年1月官宣另一个合作伙伴。
“AI 手机”并非新概念。过去两三年间,几乎所有手机厂商都推出了各自的AI手机产品,但从效果来看,这些应用大多仍停留在较为初级的阶段,主要集中在智能消除、实时翻译、会议记录等单点能力上。
相比之下,豆包 AI 手机之所以显得“更进一步”,在于其并未局限于单一功能,而是通过屏幕模拟点击、无障碍服务接口等方式,实现复杂的跨App连续操作。这种方案在技术上需要应用开发者的深度授权,也因此被视为当前实现 AI 自动化最便捷的一条路径。但与此同时,这种做法也被部分业内人士认为具有侵入性,隐私与安全边界问题随之凸显;另一方面,由于操作链路更长,执行效率和稳定性难以保障,体验上容易出现延迟。
在姜昱辰看来,豆包AI手机的探索具有积极意义。“豆包是从交互体验革新的角度做事,也让整个行业和普通大众看到AI手机的一个形态,对生态的促进有推动作用。”
姜昱辰透露,在豆包 AI 手机发布之前,OPPO 内部也有类似的方案。“OPPO⼀直有在做GUI Agent,我们技术方案实际的效果也不差。”但她强调,OPPO 不会为了展示能力而激进上线。“执行这件事情你要失败一次,用户就再也不用你了;第二是用户的隐私问题,我们是尽可能希望能在端侧做这件事。豆包作为⼀个工程机,它可以更激进。但我们Color OS全球有超过7.5亿的月活跃用户,AI助手的月活超过1.7亿,如果⼀个服务推出第二天,大部分服务都不能用了,这在OPPO算是质量事故,是没法接受的。”
在OPPO的技术规划中,不同场景将采用不同技术路径。“对于高频场景和用户高频使用的互联网服务,一定是通过 A2A 的方式来做。”这并不意味着 GUI 会被彻底放弃。从策略角度看,在与应用厂商的合作尚未完全落地之前,可以先通过GUI的方式覆盖用户的部分需求,随后再替换到A2A方案。“一些长尾需求,比如个人开发的App,这类需求需要依赖 GUI 来兜底。”
不过,在探索A2A落地的过程中,最大的挑战在于标准化。
姜昱辰介绍称,目前OPPO 正与支付宝推进相关合作,尝试构建标准化框架和原子化服务能力。“我们和支付宝的合作,本质上是在共同建立一种协同标准。”至于这一标准未来是否会推广至更多互联网厂商,她认为不太可能由某一家厂商单独定义。“可能是行业共同推进,甚至会有国家标准参与,最终一定会形成一套统一规范。现在A2A仍处于比较早期的阶段,OPPO的策略是更加积极与合作伙伴推进落地。”
OPPO对推进协议合作比较乐观。姜昱辰认为,从体量的角度,在谈判或者构建方面,OPPO和服务商或供应商都是比较对等的关系。“OPPO的生态位是用户最贴近的设备,需要做的是入口体验,生态则是和应用企业一起共建。”
在姜昱辰看来,未来AI手机将成为无处不在的个人助理。“不仅是说在手机上长出一个助理,是整个手机会变成用户无处不在的个人助理。用户使用手机或者刷视频过程当中,总有一个伙伴陪着你,然后给你提供你要的服务,我们认为这个过程中记忆是最重要的,有记忆,能执行,这个是我们整体对AI手机的判断。”
与国内厂商在GUI Agent上的密集探索相比,海外市场整体显得更加克制。
截至目前,苹果、谷歌、三星尚未在手机端推出可直接替代用户操作App的 AI 自动化体验。其中,苹果早在2022年便推出Apps Intent框架,鼓励开发者向系统声明功能供Siri调用,但不开放读屏绕开应用的能力;即便未落地的“屏幕感知”功能,也选择通过API向Siri提供屏幕内容,而非直接操控界面。
在海外市场,厂商们对GUI的探索主要集中在两类方向:一种是Browser Use(使用浏览器),只允许 AI 在浏览器内代理用户行为;另一种是Computer Use(使用计算机),让AI操作整台电脑,但几乎都通过沙盒或虚拟机与真实设备隔离。
即便是谷歌 Gemini 和微软 Copilot在手机上推出了屏幕共享与实时问答能力,但AI助手仍然无法代替用户操作。
也就是说,海外科技巨头尚未推出“惊艳”的AI手机,并非技术能力不足,而是源于其对AI Agent权限边界、责任归属与系统安全更为审慎的态度。
不过姜昱辰认为:“每个厂商都有不⼀样的选择和不⼀样的实现路径和节奏,苹果是相对保守的,国内外的AI手机生态也多少会不一样。在隐私方面,不仅仅是海外的用户重视安全隐私,国内的用户也重视安全隐私,我们作为厂商,我们希望给海内外的用户提供的是一致的隐私体验,我们所做的记忆共生引擎,都是要把用户的隐私数据留在端侧完成处理和存储,数据完全不上云。”
此外,AI入口或许将重新改变硬件和软件生态的商业模式。姜昱辰在谈到和应用企业探索AI合作的未来商业模式变化时表示,从功能机到智能机时代,手机企业的生态位是变好了,互联网收入或者渠道收入增多,到了AI 时代,渠道收入预计仍会存在。“在和智能体探索合作,比如和支付宝的合作探索还在早期,甚至整个行业都还早期,我们还在技术合作的阶段。”
封面图片来源:图片来源:视觉中国-VCG211478193393
上一篇:演员闫妮,传来喜讯!
下一篇:严禁引入第三方管住幼儿园乱收费