当前位置: 首页 » 资讯 » 新科技 » 正文

智能体爆火中频引争议,政协委员建言:明确底线、安全发展

IP属地 中国·北京 南方都市报 时间:2026-03-06 20:15:39

AI手机助手引发的智能体技术路线争议,在今年两会上进入多位全国政协委员的关注视野。

他们的建议直指GUI(图形界面识别)技术路径。基于该路线的AI智能体,依靠读取手机屏幕内容和模拟人类的操作来完成任务,其能力实现过程无需第三方App授权开放接口及主动适配。

全国政协委员、恒银金融科技股份有限公司党委书记、董事长江浩然向南都记者表示,当前AI智能体尚处于早期发展阶段,监管无需过早规定、统一技术路线,但需要明确底线、规范边界,确保其在安全合规的路径上发展。

手机智能体两条路,各有各的难

江浩然担心,部分AI手机以截屏等方式批量获取用户屏幕数据时,与当前操作任务无关的通知栏、弹窗等内容也可能被一并捕获,超出用户授权的限度。对于读屏获取的用户敏感数据,一些AI手机高度依赖云端模型,将数据传递至云端处理。若缺乏透明清晰、安全可信的保障措施,将放大数据失控风险。

关注到智能体的安全风险后,全国政协委员、中国科学院计算技术研究所研究员张云泉提醒,由于海外主流市场普遍对隐私、安全高度审慎,依托于未授权截屏形态的智能体应用极有可能困于国内、难以出海。由此搭建的技术标准、商业模式亦无法向海外复制。


全国政协委员、中国科学院计算技术研究所研究员张云泉。受访者供图

赞同GUI方案的声音并不否认数据安全的重要性,但更倾向于在推进GUI技术创新的同时,精准防控风险。比如,对涉及的用户数据在传输、存储等处理过程中进行加密,对用户个人信息采取脱敏或匿名化处理等。

江浩然建议,有必要尽快完善技术架构与行业标准,明确AI手机获取数据与调用功能的调用规则。同时在数据层面,规范数据采集和使用边界,确保特定功能仅能采集特定数据。

与GUI方案相对的另一条智能体路线是API(应用程序编程接口)方案。第三方App向AI手机智能体开放接口,实践中常通过MCP(模型上下文协议)和A2A(智能体间通信协议)这类标准化通信协议,实现智能体与外部工具、以及多个智能体之间的互联互通。1月中旬,阿里旗下AI应用千问App上线生活助理功能,实现点外卖、订机票、订酒店、找餐厅等任务,其能力正是基于MCP和A2A等协议实现。

API路线的优势是更安全、可控,但障碍在于需要海量App厂商完成工程化适配,且厂商愿意开放的能力相对有限,不可避免地拖累落地速度,影响AI助手可应用的范围和可实现的功能。此前一位赞同GUI方案的业内人士向记者指出,API方案难以满足用户非常泛化和长尾的需求,“只有像人一样去操作手机,(智能体)才能够满足人的所有需求。”

在江浩然看来,API方案的智能体生态建设是一条难而正确的路,无法一蹴而就。国内部分企业已起到API方案的示范作用——它们先从内部出发,打通业务接口、梳理数据调用逻辑、完善用户体验。江浩然认为,先把公司内部的AI服务做扎实、形成正面案例与示范效应,未来才有机会以商业合作、利益互换的方式拓展版图,吸引外部智能体加入生态共建。

他推测,基于API接口的交互形态有望成为未来主流,而GUI可能作为辅助方案。所以,不能片面押注GUI方案,否则可能错过智能体的生态建设期。


全国政协委员、恒银金融科技股份有限公司党委书记、董事长江浩然。受访者供图

张云泉也注意到,美国领先的人工智能企业正通过多种方式,积极联合第三方应用,共同构建开放的生态系统。比如,推广智能体间的标准通信协议(MCP、A2A等)、完善终端系统级“意图框架”服务等。美国企业的发展重心均为联合第三方应用,共同做大生态。

针对这些海外布局,张云泉提出,生态竞争力核心在于协同规则与基础设施的共建。我国若不尽早凝聚共识、构建基于规则与协议的可信协同体系,不仅会延缓生态整体发展进程,更可能在未来的全球智能体产业竞争与规则制定中陷入被动局面。

AI助手要抢流量入口,还能和App厂商愉快玩耍吗?

除了用户担心的隐私安全之外,GUI方案目前面临的另一重关键争议在于:调用App执行任务之前,AI手机助手除了获取用户授权,还需不需要第三方App的授权?不同企业在此问题上观点相左,甚至中国软件行业协会在2025年前后公布的两份团体标准,也未能就此达成一致。

支持“仅需获取用户授权”的一方认为,AI智能体访问三方App,是在用户知情同意的情况下由用户主动发起的行为,是用户意志的延伸。其操作边界仅限于用户自主授权的界面交互,并未获取第三方App的内部功能权限,也未越过第三方App的用户协议执行操作。

而江浩然和张云泉均赞同“双重授权”原则,即AI智能体助手先获得第三方App授权,再经用户授权后执行任务。江浩然给出两方面的理由:在数据安全角度,“双重授权”基于AI手机、App与用户的共识,圈定相对安全、可控的操作边界,保证数据传输与任务执行过程的清晰、透明、可追溯。此外,“双重授权”也可厘清各方在隐私保护、数据安全、服务质量等方面的责任,如果发生执行失误、数据泄露等问题,可快速实现责任划分,避免推诿扯皮,保障用户权益。

而从生态建设的角度看,江浩然认为,AI时代智能生态的繁荣,需要App、手机厂商、大模型厂商等多方的协同合作、实现行业上下游的互惠共赢。如果AI手机成为流量入口,App只作为单点的服务提供方,其既不能获取用户流量与心智,又失去了商业回报,还要承担开发、运维的成本和责任,长此以往将没有App提供高质量服务,最终导致手机、App、用户的“三输”格局。

GUI和API两种方案争论不休之际,谷歌近期上线的手机智能体形态,为业界提供了新的参考。

2月底,谷歌与三星联合推出基于Gemini模型的手机AI助手,在订餐、打车等场景中也采用了GUI智能体技术方案。不过,谷歌并非完全依赖GUI方案,而是同时开发了一套类似于MCP的技术框架——AppFunctions。借助AppFunctions,安卓应用程序可以将特定功能和数据开放出来,供各种AI智能体发现和调用。

江浩然表示,谷歌Gemini助手采用的API和GUI方案并行的双轨架构,不一定是完美方案,但对国内智能体发展具有参考价值。值得一提的是,Gemini在采用GUI方案调用App时,会打开一个安全的虚拟窗口并启动相关App,相当于把自己访问授权App页面的活动关在一个独立房间,无法访问其他App或本地文件,这在安全层面上是一种更周到的做法。

采写:南都N视频记者 杨柳 发自北京

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新