当大模型从技术奇点跃迁为产业基座,当智能体从实验室走进产线诊室,人工智能的第三次浪潮正以前所未有的锐度重构全球经济肌理。
中国在这场变革中展现出双重禀赋:既是拥有超大规模应用场景的试炼场,又在芯片突围、算法开源等深水区发起攻坚。从单点技术破壁到生态级创新,从效率工具到新质生产力引擎,一条具有东方特色的AI发展路径正加速浮现。
7月26日,世界人工智能大会(WAIC 2025)以“智能时代 同球共济”为主题,汇聚了来自AI领域的科技巨头、学术先锋与政策制定者,而这场覆盖技术、伦理、艺术的超级盛宴,昭示着AI已从“产业变量”进化为“文明常量”。
在这场关于人工智能产业的盛会上,36氪不仅作为产业观察者,更以产业连接者的角色深度参与,在展馆中搭建了“氪星直播间”,以对话的形式,揭秘人工智能产业进阶的底层逻辑。
在对谈中,阿里巴巴智能终端业务负责人宋刚表示:未来,决定 AI眼镜市场格局的关键指标体是用户粘性,即用户活跃度与用户时长。阿里眼镜的目标打造一副好戴好用的超级眼镜,并最终成为用户在AI时代的个人移动入口。
以下为对谈实录,经36氪编辑:
36kr:先请您简单介绍一下自己和贵公司的基本情况,来此次waic的感受如何,有什么样的收获?
A:我是来自阿里巴巴智能信息事业群智能终端业务的宋刚,我们的团队一直专注于智能终端硬件的设计、研发和生产销售,比如哇哦闺蜜机、智能音箱,以及此次在 WAIC 上亮相的夸克 AI 眼镜。非常高兴能够参加本次大会,和来自海内外的国际专家、行业伙伴共同探讨如何用 AI 赋能生活,为消费者带去更多具有科技感的人工智能产品。
36kr:当前AI眼镜产品存在场景鸡肋、续航短板、佩戴不适三大痛点,阿里眼镜如何实现性能、功耗、舒适性的三角平衡?有哪些独家的工程学创新?
A:在场景方面,我们将夸克 AI 眼镜打造成一个“真正意义上的AI 随身入口”,通过“阿里巴巴自有生态构建+行业拓展合作”满足用户的更多场景需求。
我们还联合集团内部的生态,构建起了覆盖搜索、导航、支付、个人出行和商旅出行等垂直场景的AI能力矩阵,让 AI 更好地服务用户的生活。
在解决现阶段 AI 眼镜续航能力不足的方面,夸克 AI 眼镜采用双芯双系统设计,通过高性能芯片与低功耗蓝牙芯片双芯片智能调度来优化电池使用;在工程方面我们也进行了创新,采用双电池+换电设计,通过热插拔镜腿让用户快速更换主电池;搭配一个可随身携带的-耳机盒大小的换电仓,可以实现24小时续航,全天候使用。
为了提升用户的佩戴舒适感,我们眼镜鼻托和耳弯接触面采用了仿生曲面设计,实现压力均匀分布;同时将设备重心精准控制在眼镜几何中心位置,实现了佩戴时的最佳平衡感;而且我们还采用钛合金一体注塑成型镜腿,结合弹性棘轮转轴设计,在保证轻量化的同时,实现运动场景下的结构包裹稳定。
综上,夸克 AI 眼镜通过系统深度定制裁剪优化,通过深度自研与产业器件定制能力,达成了三角平衡。
在整机架构方面,通过定制研发双音圈大振膜小型化的扬声器、设计超窄一体化FPC,运用高折射率镜片加镀膜工艺,进一步缩小波导区域光栅面积,使得我们的哇哦眼镜镜腿更细、镜框更窄更薄、镜片看起来更通透;
在穿戴方面,通过鼻托和耳弯接触面采用了仿生曲面设计,实现压力均匀分布;同时将设备重心精准控制在眼镜几何中心位置,实现了佩戴时的最佳平衡感;而且我们还采用钛合金一体注塑成型镜腿,结合弹性棘轮转轴设计,在保证轻量化的同时,实现运动场景下的结构包裹稳定;
在电子架构方面:采用了双电池与换电设计,通过热插拔镜腿让用户快速更换主电池;搭配一个可随身携带的 耳机盒大小的换电仓,可以实现24小时续航,全天候使用。
在系统OS方面,搭配安卓加RTOS双系统实现动态资源调度,既大幅提升了重载场景下的能效,又有效降低了待机场景下的功耗。
在影像系统方面,我们自主研发了Super Raw暗光处理算法,通过RAW域多帧融合与自适应降噪,有效地抑制了暗光下的噪声,显著提升了图像信噪比。
36kr:眼镜整合了阿里的服务生态,在您看来,哪一类场景能成为用户每日刚需?这类场景需要突破哪些技术壁垒?
A:我们认为通过AI技术能力与服务,渗透到用户的衣食住行相关生活需求场景都可能成为用户刚需。阿里生态场景可以很好地赋能这些消费者刚需场景,比如各种信息提醒(日程、信息提醒)是高频生活场景,我们通过和飞猪的合作,可以实现航班信息提醒。
通过AI眼镜实现免掏手机就能安全又快捷地支付,特别是在各种解放双手的场景,AI 眼镜能给用户带来便利,如行进当中的扫码支付、户外徒步拍摄等,在跨语言沟通的场景,翻译、同声传译等功能也很重要。
针对工作学习需要提效的场景,AI 眼镜的如会议记录、百科问答等功能也能帮助用户提升效率。
需要突破的技术壁垒一是AI的感知与理解能力,包括语音、图像识别,语义理解、意图判断等多个方面,这中间需要强大的 AI 中控能力加持,合理拆解任务并调用不同生态服务,之后才能真正实现“听得清、看得懂、理解准、答得好”,才会形成更好的用户粘性。
二是端云协同能力,眼镜端需在低功耗下完成响应,云端需对接不同生态伙伴的云端 AI 服务完成信息处理,两端要在不同网络条件下协作响应,实现既快又准的体验闭环。
阿里的优势就在于,我们既有多模态AI能力,又掌握服务生态与系统能力,可以把这些技术打穿到真实场景中,让AI眼镜真正“用得上、用得顺、离不开”。
36kr:在面对行业竞争时,阿里眼镜的核心壁垒是什么?您认为AI眼镜行业未来3年将因哪项技术突破将会彻底爆发?
A:基于阿里自研大模型创新的 AI 应用,联合内外部生态整合能力,以及基于自研的软硬件能力构建的技术创新,构成了阿里做夸克 AI 眼镜的核心壁垒。
技术突破点包含三个,分别是硬件、AI 能力以及生态。硬件方面,在近眼显示、拍照、感知能力等多个方面提升,同时,实现外观小型化也是关键因素。
人因穿戴:高集成柔性电路板,高容量高密度电池,下一代创新复合材料构建小型化极致穿戴。
近眼显示:技术突破小型化双光机双目显示,推进显示功耗、轻薄化等行业痛点的改善落地
声学音频:开放式声学系统结合用户环境的自适应与个性化服务提升。
拍摄感知:摄像头传感器、计算能力与影像|感知算法融合提升,革新影像与视觉感知能力
AI 能力:AI眼镜要实现真正的“智能化”,除了强大的语音识别能力,更在于理解和决策能力的全面进化。
先进语音识别与理解: 在嘈杂环境下的高精度语音识别(降噪、分离)、支持口语化和轻声交互、支持多语种实时翻译、低延迟响应。
多模态对话理解能力:基于语音、文本、视觉的多模态对话理解能力,能更准确地理解用户的交互意图,让用户从“操作指令”转向“一句话直接表达需求”;第一视角的视觉多模态理解,能听也能看,体验更自然;
超级智能体: AI眼镜可能成为用户最贴身的数字助理,不仅能回答问题、执行命令,还能处理复杂事务(超级智能体),理解用户的长期目标和价值观。
端云协同推理能力:AI模型要在轻量化、低功耗的端侧快速运行,同时结合云端大模型能力实现高精度复杂任务推理。二者需在不同网络和算力条件下自适应切换,确保体验稳定、反应即时。
连续学习与个性化:模型需具备持续学习用户习惯和语境的能力,从而构建更加贴合个人的服务体系,实现从“通用AI”到“专属AI”的演进,真正成为个人的随身智能助理。
AI内容生态:AI眼镜的使用频次和黏性,最终依赖于围绕它建立起的内容与服务生态。我们综合了全行业的主要内容生态,从各种维度提供融合内容服务。
从被动获取到主动推荐:在内容和信息服务的供给方式上,基于用户当前所处场景和历史行为偏好,主动推送有价值的信息、服务与行动路径,真正实现“想用户所想”。
与生态深度打通:在生态内容的广度上,从现在的搜索、导航、支付、个人出行和商旅出行等核心场景服务不断拓展到日常出行、购物、学习、工作等更多场景,让用户戴上眼镜就能打通从“感知”到“行动”的完整闭环。
垂类知识与服务的深度融合:在生态内容的深度上,通过与垂直行业内容体系结合(如旅游、教育、商业等),构建高质量、结构化、可理解的AI内容源,让AI眼镜具备长期留存和复购的内容价值。
第三方内容服务生态:支持第三方内容与能力接入,推动内容与服务开发者共建 AI 眼镜的新生态,使AI眼镜成为一个可生长的智能平台。
36kr:在AI眼镜彻底爆发后。您认为决定市场格局的终极指标是什么?阿里眼镜的目标是什么?
A:我们认为, 决定 AI眼镜市场格局的关键指标体是用户粘性,即用户活跃度与用户时长。而决定用户粘性主要有:
1、 持续为用户解决问题提供价值:有优秀的整机软硬基础体验,快速、准确地响应用户的需求,甚至预测需求;设备能够全天候多场景使用;有丰富实用的应用和内容生态:多样化的 AI 原生服务,能覆盖用户日常衣食住行等各个方面;强大的多模态理解与调度能力,能更好理解用户意图,快速准确地提供各类 AI 服务。
2、 持续产品市场渗透与增长力:丰富多元产品矩阵,通过“高端显示+主流拍摄”产品组合入局AI眼镜赛道,以高端树立品牌心智,以主流覆盖大众市场,形成“高端标杆+规模增长”的协同效应;完善销售服务体验:为用户提供眼镜行业专业,全面的验光配镜、加工制造与视力数据服务。
阿里眼镜的目标打造一副好戴好用的超级眼镜,并最终成为用户在AI时代的个人移动入口。
36kr:展望未来3-5年,在AI驱动下,您认为您所在的行业将发生哪些最具变革性的重构?这种重构对产业竞争的关键影响会体现在哪里?贵司如何提前布局?
A:AI眼镜拥有眼镜消费品、AI创新科技品和数码电子品的三重属性,所以核心变革预期主要有:
1、在眼镜方面:与眼镜品牌在技术、渠道、服务以及C2M定制能力的整合,推动眼镜产业价值链变革;
2、在消费电子方面:构建深度自研软硬件开发能力,联合上游核心供应链(如光学、芯片、传感器等),打造一套融合AI多模态感知能力的全新自然交互方式,推动人机交互方式的变革。
3、 在AI 生态方面:从有限的 AI 服务场景,到多元化服务场景;从用户选择 AI 服务,到 AI 主动感知理解用户意图、主动推荐 AI 服务。推动 AI 应用内容生态的变革。
我们将联合全球领先的眼镜品牌,融合通义千问大模型与夸克 AI 应用能力,构建能听会看的智能交互体验。通过“阿里巴巴自有生态构建+行业拓展合作”双轮驱动,构建覆盖搜索、导航、支付、商旅等高频场景的 AI 服务矩阵,并不断拓展更多可落地的生态服务,重构人与信息的连接方式,加速整个生态的发展。