![]()
“激活一台手机,第一步竟然是登录豆包。”
这并非想象的场景,而是体验的豆包手机助手时的真实一幕。作为技术预览版的首批体验用户,直面AI深度体验了其在启用权限、交互方式以及端侧集成上的初步形态。
豆包,这个中国用户并不陌生的名字,这一次在字节与中兴合作的工作样机Nubia M153上,以“手机原生AI助手”的身份登台亮相。
![]()
手持这台技术验证机,你可以通过语音、侧边AI键或者Ola Friend耳机唤醒豆包,在任何界面就当前屏幕内容发问。或者直接让它代替你,在其他App里完成比价下单、整理日程、生成纪要等复杂任务。
中兴官方页面显示,这款工程机仅向行业体验者开放预约。在二手市场上,它已出现溢价销售的情况。
打造手机助手,是字节跳动AI业务边界的又一次外扩。过去几年,豆包已经在“云端”证明了自己:据火山引擎方面公开披露,豆包大模型日均Token调用量从2024年5月的1200亿涨到2025年9月的30万亿。
此外,豆包在原生AI App中长期位居用户规模第一。现在,它跨过App的边界正式“搬进手机”。
近年来,“原生AI手机助手”成为行业内的共同迭代方向,但真正能跑通复杂链路的产品并不多。苹果宣布为Siri引入生成式AI能力,却接连推迟关键升级节点;其他厂商的AI助手受限于权限与模型能力,对于跨App交互等复杂场景仍未能普遍落地。
![]()
在这样的背景下,字节与中兴的合作的意义不言自明:把豆包AI强大的模型能力,从App生态中推向真正的手机随身入口。
对手机产业而言,这像是打开了手机原生AI的“魔盒”:当第一台设备跑通了整套能力,接下来的比拼,就不再是有没有AI,而是谁的AI真正“能用”。
01
除了侧键能直接呼出豆包,在这台技术验证机的背面,摄像头模组旁刻着一行小字:Powered By Doubao(由豆包驱动)。一个小彩蛋,道出了这台手机“机魂”的与众不同。
![]()
真“原生”,是上手使用豆包手机助手的第一感觉:激活新机时,在系统设置环节首先要登录用户的豆包账户。随后系统提示,你可以通过手机侧边键一键触发豆包AI,提醒你这里的“豆包”,相比单独使用豆包App,有着完全不同的操作逻辑。
这样的原生感,是字节和中兴本次深度合作的结果——在操作系统层面为豆包App做了一轮“底层改造”。在这台Nubia M153上,豆包AI能力落地场景也更贴近日常生活。比如,豆包可以帮你在社交软件等App里回复消息,如果你告诉它对方的身份,豆包还能帮助你编辑更合适的对话风格和语气。
要实现这样的能力,一边是大模型对复杂语言与上下文的理解,另一边则是手机厂商在底层生态上向AI进一步开发。理解指令后,豆包可以模拟/替代用户完成点击、输入等操作。在国内厂商的原生AI助手方案里,这无疑是一种新鲜的尝试。
![]()
从用户视角来看,这种交互逻辑也难免会触发一个新问题——让一个第三方大模型“代替你点击屏幕”这件事,到底安不安全?
为了解释这种“原生AI助手”背后的安全逻辑,豆包在官网发布了《隐私安全白皮书》,明确记忆数据优先本地处理并加密存储,不用于模型训练;所有敏感调用需用户授权并保持可见。唤起记忆时,状态栏有常驻提示,用户可随时关闭或清除记忆功能。
针对网友关心的权限、隐私问题,豆包手机助手3日晚发布声明做了进一步的回应。声明中提到,豆包手机助手使用的 INJECT_EVENTS(模拟点击)系统权限为安卓官方能力,所有跨应用执行任务的 AI 助手均需依赖类似权限。
豆包手机助手在使用该权限时,建立了透明的管理体系,调用必须经用户主动授权;执行长任务时有明确提示且随时可以中断;涉及支付、身份验证等敏感环节时任务会暂停,由用户手动确认,豆包手机助手不会代替用户进行相关授权和敏感操作。
从实际体验看,“真原生”的差异首先体现在唤醒方式和系统权限上。用户可以通过侧边AI键、语音,或者Ola Friend耳机直接唤醒豆包,在任何界面直接就屏幕内容追问——不管是聊天界面、商品详情页还是票务页面,都可以一键截屏给AI理解,而不是复制链接、截屏上传。
此外,豆包手机助手打通了相册和一部分系统能力,例如在原生相册里对图片下达“删掉路人”“清理杂物”这样的修图指令,可以直接触发豆包的多模态能力。
直面AI还测试了订票、打车等多个日常场景:在明确需求后,豆包手机助手可以自行完成所有前置流程,直到支付这样的敏感环节,才会提醒用户需要手动介入。
这种“半自动”的交互模式带着一点折中意味,但也是大模型在端侧落地、面向普通用户时不得不考虑的安全边界:既要让AI真正“替你做事”,但要把最终的所有权留给用户。
不过,站在即将跨入2026年的时间节点回看,用户对手机AI的期待,正在从“能聊天”迅速走向“能办事”。QuestMobile的报告显示,自2024年9月以来,六大手机厂商的AI助手在过去一年合计新增用户约6500万,总规模达到5.29亿。
目前,NubiaM153上的豆包手机助手只是一个技术预览版,主要面向行业用户开放,并未正式进入大众消费市场。但从这台工程机上,已经可以窥探到手机“真原生AI”路径的样貌。
02
在体验过程中,一个最直观的感受是:相比独立App里的豆包,Nubia M153上的豆包已经不再是一个“会回答问题”的AI,而是一个可以跨界到物理世界、真正替用户完成动作的“执行者”。在理解用户指令的基础上,它在手机上一层一层地接管了,那些过去属于人类手指的繁琐操作。
以跨App多轮任务链路为例,针对相册中的某张血压仪照片,让豆包在淘宝中“挑便宜同款”,然后“把这件链接发给张三”,豆包不仅能维持上下文记忆,识别出“张三”是QQ中的好友昵称,还能跟随链路推进完成全部步骤。从相册到淘宝,再到QQ好友“张三”的对话框,这一流程全程由豆包自行跑通,无需用户中途干预。
![]()
与之相比,我们用同样路径测试另一家旗舰手机的AI助手,它停在了“打开淘宝—完成搜索”的环节,只能等待用户的进一步操作。
![]()
这种差距在屏幕理解场景中被进一步放大。在实际测试里,豆包可以在任何界面通过“就屏提问”,自动截取当前页面、分析内容并执行命令——从总结一篇6000字的长文,到提取要点、排序逻辑,再到将某一段落总结发送给飞书群同事。尽管这个过程需要在后台等待一段时间,但它已经做到了真正意义上的“脱手可用”。
当用户真正把豆包当作“代办者”时,它不仅能在助手层面完成流程交互,还能把AI的多模态能力渗透进日常操作。比如,豆包可以在相册中对指定图片直接进行“AI P图”,这一过程以往需要手动打开对应App。而原生豆包AI可以直接调用Seedream能力,完成“把这张雪碧图片P成可乐”的操作。
![]()
在社交场景里,这种“可介入性”表现得更明显。例如,你想给某位飞书好友发送信息“明天我想请个假”,当你告知豆包对方身份是“老板”时,豆包能识别这一语境中隐藏的意图,提示你措辞可以更礼貌、更正式一点,并提供调整后的版本。这种“介入对话”的能力,把助手的角色从“工具”变得更像“副驾驶”,能够在用户需求表达尚不完整时,及时响应并自动推断下一步动作。
陌生来电识别也是类似的逻辑。询问豆包“刚才给我打电话的是谁”,豆包可以结合归属地、历史举报记录及模型推断给出风险提示,告诉用户是否存在诈骗可能。
在多语言表达方面,豆包手机助手可以承担翻译、对话转写、跨语言(包括方言)任务等工作。实机测试中,和豆包App此前展现出的能力类似,当用户突然使用广东话给出指令时,豆包手机助手可以平滑切换到对应方言场景,把一个普通话“知心姐姐”,变成会讲粤语的“靓女”。
正因如此,豆包手机助手填补了当下行业最稀缺的一块能力空白:全局跨应用任务执行。苹果Siri仍在修修补补,未能实现产品迭代;大多数手机AI助手要么擅长回答,要么擅长展示,却无法替用户完成一整条链路。
豆包手机助手的出现,让这条路径第一次有了清晰的样子:用户说一句话,从理解、决策到执行,原本需要用户手动在App间来回切换完成的机械劳动,如今开始一点点交给豆包来跑。
而要撑起一场手机AI的“新世代”,不仅需要系统足够开放,也需要基座模型的强大能力赋能,技术的底座和生态的兼容,二者缺一不可。
03
在豆包上手机之前,字节已经用了三年时间不断打磨这个“AI小助手”,让它从一个LLM产品,进化成一个原生AI超级App。
QuestMobile、IDC等机构的数据显示:豆包是中国C端用户规模最大的原生AI应用,2024年中月活突破1.5亿。2025年初,DeepSeek的横空出世曾短暂刷新流量峰值,但从今年8月开始,豆包重新完成反超,依靠强大的生态优势稳居榜首。
不过,对于大众用户来说,“好用的AI应用”和“真正的手机助手”之间始终隔着一道物理层面的鸿沟。
再强的模型能力,如果被限制在App框架内,就无法接管用户的真实数字生活。你可以在豆包App里写文案、改图片、做视频,但只要涉及外卖、改地址、查物流、订火车票,这些操作都必须跳回到对应的App中完成,AI在其中所能扮演的角色依然有限。
![]()
与此同时,2025年,各大手机厂商纷纷将端侧AI推上战略高度。华为小艺推出“全局语音调度”,支持部分跨应用任务链;小米澎湃OS宣布开放系统级AI接口,可在多个场景中调用大模型执行代理任务;Vivo、OPPO、荣耀也分别展示了原生AI智能体路径。
一个不容忽视的趋势是:所有厂商都意识到,只有把模型能力前置,让用户在任何界面、任何动作链路中随时调用AI,手机助手这件事才算真正开始。这一年,AI在手机上的竞争,比的不再是“谁的模型更大”,而是“谁能真正跑在用户需求的最前端”。
在NubiaM153上,豆包手机助手的姿态显得十分“前卫”。在原生AI助手的加持下,手机里的各个App被重新组织成一个由AI统筹的“任务空间”。
在这个空间里,用户只负责提目标,豆包负责“跑腿”。过去需要手动跳转多个App才能完成的链路,如今只需要用户给出一句指令;如果再配上已经适配的AI可穿戴硬件,比如OlaFriend,很多场景甚至不需要掏出手机——耳机里那声“豆包豆包”,另一边的手机后台已经开始忙碌起来。
这种AI时代的“脱手感”,正在改写用户与手机的关系:从App时代的“我有需求时点开你”,到AI助手时代的“你随时站在我旁边”。对豆包而言,这是一次从云端走向端侧的关键跃迁;对手机而言,则是一次从“应用集合”走向“AI中枢”的角色变化。
![]()
根据Counterpoint的预测,到2028年,Gen-AI智能手机的出货量将占全球智能手机销量的54%以上,届时相关设备存量可能超过10亿部,成为市场的主流配置。
与此同时,QuestMobile的数据表明,截至2025年9月,移动端AI应用(包括原生App、In-AppAI、手机厂商AI助手在内)的月活用户总规模已达7.29亿,仅手机厂商/系统级AI助手这一类,就覆盖约5.35亿用户,表明越来越多用户开始将AI助手视为“手机的基本功能”。
硬件侧也在同步加码。Counterpoint此前发布的产业白皮书显示,面向生成式AI的手机SoC正在加速演进,旗舰平台的峰值AI算力在2025年将普遍跨过60TOPS这一性能台阶。
公开信息显示,Nubia M153工程机所采用的高通骁龙8至尊版平台,NPU峰值AI算力已达到约80TOPS。算力与能效的双向抬升,为“原生AI助手”释放更复杂的能力提供了充分硬件冗余。
把视角再拉远一点,会看到一条更长的时间线:2011年,Siri作为“第一代手机语音助手”,曾经给整个行业演示过“对着手机说话”的想象。但十多年后,苹果内部对GenAI路线的不一致,导致Siri重构历程充满了混乱与不稳定,即使披上AppleIntelligence的外衣,在短期内仍难支撑起“跨应用、多模态、代办任务”的理想。
苹果软件工程高级副总裁费德里奇此前公开承认,Siri重构的V2架构只在大约三分之二的场景下能正确执行,新的Siri版本从2024年底一路推迟到2026年才有望正式上线。
从这个意义上说,豆包手机助手在Nubia M153上完成的,不只是一次产品形态的探索,而是试图接力那条被Siri开启、却没有跑完的赛道。
尽管还在技术验证阶段,但一个构想已经悄然成型:豆包用一次原生AI入口的试验,正在一点点实现那件Siri没做成的事。





京公网安备 11011402013531号