
![]()
“硬件终归是苦生意,但好在AI时代的技术路线确定了。”
作者丨齐铖湧
编辑丨代聪飞
今天,meta 数十亿美元收购 Manus的消息,鼓舞了无数国内AI创业者。这家来自中国的 Agent 创业公司,不到一年时间,将ARR 做到 1 亿美元并被 meta 收购,不仅让大众看到了 Agent 的潜力之大,也引起了一个探讨, Agent 和 AI 硬件该如何共存?
关于这个问题,雷峰网找到了一家正在以 Agent OS 切入AI 硬件赛道的明星公司光帆科技创始人董红光。
从手机到AI硬件的跨越中,董红光第一次发现,自己熟悉的规则全都要推倒重来。
作为小米第89号员工、MIUI诞生的亲历者,董红光在过去14年里深度参与了移动互联网交互规则的构建。但在AI时代来临之际,当面对“什么才是AI硬件最合适的载体”这一问题时,他却给出了截然相反的答案:"首先排除手机。"
2025年12月底,他站在台上,这次他的身份,是一家估值超10亿元的AI硬件科技公司创始人,他所在的公司光帆科技,发布了全球首款具备视觉感知能力的AI耳机。
发布会当天,是北京一个寒冷的冬日,现场聚集了不少科技媒体和AI硬件上下游从业者,大家都在关心这家抢先于OpenAI、meta的中国公司,发布的摄像头AI耳机,会如何落地。董红光现场展示了这款AI耳机,耳机配合专用手表和充电盒使用,构成了一个完整系统:充电盒内置4G联网能力和大电池,手表作为第二屏和交互补充,而耳机本体则集成了双目视觉模组。
在发布会现场,董贡献了不少金句,比如“行业不怕大厂加入”,比如“硬件是苦生意,但苦生意的硬件壁垒是软件”。
为什么要推倒自己熟悉的一切,迈入一个新的领域?AI时代最合适的交互方式,真的会是AI耳机赛道么?
带着问题,雷峰网在发布会结束后的第三天,见到了董红光。和他聊了聊AI时代的交互与硬件趋势。
01
为什么偏偏是耳机
雷峰网:发布会结束后,收到的反馈如何?
董红光:整体还是不错的,大家的普遍反馈是产品有意思、逻辑通顺,对我们展示的那些场景,比如AI耳机帮你超市比价、订机票、提醒日程,也感兴趣。
雷峰网:你做了这么多年手机,为什么创业首先排除手机?
董红光:手机肯定不行。AI最重要的能力是主动感知和服务,但手机放兜里怎么感知?用户不掏出来,它连呼唤你都做不到。手机是为触控交互而生,而AI交互需要的是语音和视觉,能随时看、随时听、随时跟用户说话,另外说句实话,如果手机是最适合AI的载体,我根本不需要出来创业。
雷峰网:眼镜呢,您2015年就开始研究眼镜,为什么最终放弃?
董红光:眼镜理论上可以,但还有两个坎过不了:重量和接受度。中国几亿人不戴眼镜,你让他们为AI平白多架一副,教育成本太高了。其次太重了,一副普通眼镜十几克,而AI眼镜很难做到40克以下。
耳机几乎是唯一的答案,本身它已经是几亿人的"器官"——通勤、运动、开会,人们本来就戴它一整天。另外,做产品更合理的路径是在用户已习惯的设备上做创新。举个例子:iPhone之前的iPod Touch——它和iPhone几乎一模一样,但不能打电话,结果销量惨淡。手机用户买iPhone的核心动机是通话,然后才发现了它的智能。而大家对耳机本身就存在核心需求(听音乐、通话),在这个基础上增加AI功能,这才是最合理的路径。
雷峰网:似乎大厂有个特点,它每次入场的时间,往往是一个产业或者机会很确定的时候,比如小米做汽车,不是十年前,而是最近几年,你在小米做了很多核心项目,这次选择AI硬件市场,是看到了很明确的产业机会?
董红光:我把确定分三个阶段:技术确定、产品确定、市场确定。很多人说要等市场验证才动手,那已经晚了。我在小米经历过PC到手机的变革,知道技术拐点一过,后面是指数级增长。GPT-4o发布后,我测试了三个月,发现agent能力基本可用,成本也在下降,那就是技术确定了。剩下的是工程化和产品化问题,这正是我们团队擅长的。
雷峰网:但AI硬件的"市场确定"似乎还没到来?
董红光:对的,所以现在是窗口期。等到市场完全确定,就是巨头收割的时候。创业公司的价值就是在模糊地带把路跑通。我们发布会后,很多用户反馈"原来耳机还能这么用",这就是教育市场。等大家都知道AI耳机该怎么用时,我们的生态已经长出来了。
02
“做产品一定是平衡,不是堆料”
雷峰网:但耳机那么小,怎么塞下AI需要的感知能力?
董红光:这就是问题有意思的地方。开放式耳机的便携性依赖充电盒,而过去十几年,那个盒子除了充电什么也没干。我们反过来看:它能不能成为AI的"物理外挂"?
所以我们的充电盒里放了4G eSIM卡、一块2020mAh的电池,还有算力芯片。耳机本身只保留最必要的传感器和摄像头,重度计算在云端,实时响应靠盒子,续航和联网问题就解了。手表目前只是通过盒子联网,如果未来手表能自带eSIM,那整个系统会更简洁。
雷峰网:200万像素的摄像头,会不会太保守?现在手机都上亿像素了。
董红光:做产品一定是平衡,不是堆料。500万甚至1200万像素我们都看过,代价是模组尺寸大一倍,功耗高30%,电池不得不跟着扩容,最后耳机体积很大,侵略感很强。用户得到的收益只是在极少数场景下能看清小字,没有必要。
200万是我们在几十个场景中测试出的结果,识别够用,AI不需要4K高清,它需要的是"看得懂"。为了日常佩戴的"无感",我们宁愿牺牲边际场景的性能。这个弧面造型的弧面摄像头,光是为了隐藏攻击性、降低视觉存在感,光学调试就花了好几个月。做成平面很简单,但用户会觉得自己被监视。
雷峰网:充电盒为什么加这么多功能,体积和发热怎么控制?
董红光:既然用户总会携带耳机盒,我们就想为什么不赋予它更多功能?我们在盒子里塞进了4G联网模块和2020mAh电池,让整套设备能独立于手机工作24小时。AI助理必须全天候待命,如果总需要充电,场景中断记忆就会中断,体验就不完整。
体积和发热控制是个系统工程。2020mAh电池容量已远超TWS耳机,但我们把芯片集成度做到了极限。目前蓝牙、ISP、4G模块还是三颗独立芯片,如果未来能集成到一颗,体积还能缩一些。
03
安卓不适合AI时代的交互习惯
雷峰网:硬件创业已经够卷,为什么还要自研操作系统?
董红光:我对安卓太了解了——它一半以上的代码都是为图形交互服务的。今天AI的本质是语音和多模态交互,那些UI绘制、触控响应的代码全是冗余。你删改还不如重做。
更关键的是架构。AI OS必须是端侧一个轻量级系统,云侧一个能调度多模型、管理多用户并发的复杂系统。云端要决定什么时候调用千问,什么时候用DeepSeek,什么时候自己训的小模型更合适。端侧要管理耳机、手表、盒子三端的硬件协同。这两套系统实时通信,技术栈跟安卓完全两个时代。
我们团队一半是软件工程师,甚至比硬件还多。操作系统、云侧调度、AI原生应用,三条线并行,这个难度在于没任何参考,连看别人怎么做的机会都没有。
雷峰网:听起来像从零搭安卓+iOS的混合体,没有参考怎么做?
董红光:可以这么理解。我们做这件事有一个思路,就是从真实用户端入手,我们最早做了个叫"AI闪令"的安卓APP,让用户用自然语言定制自动化流程。有个用户是个大学生,他用它操控饮水机APP,直接跟手机说出指令,水就流出来了——把十几步点击变成一句话。
这给了我们信心:用户需要的不是功能列表,而是AI帮他们把复杂交互"熨平"的能力。这些早期用户的反馈直接变成了硬件的功能。比如超市比价、差旅订票,都是从他们的创造里筛选出来的。小米做MIUI时我们在论坛里跟用户一起写代码,今天我们又把这套方法论搬回来了。
雷峰网:能具体说说端云协同是怎么工作的吗?
董红光:我们设计了一套"意图路由"机制。比如你说"帮我订下周去上海的最便宜机票",耳机先本地唤醒,音频传到盒子,盒子里的轻量模型判断这是出行意图,然后唤醒云端的旅行agent。云端同时调用航班查询模型、价格预测模型、用户偏好模型,最后合成答案返回。
雷峰网:多模型调度听起来很复杂,怎么保证体验一致性?
董红光:我们做了模型抽象层。对开发者来说,他不需要知道背后调用的是千问还是DeepSeek,只需要定义输入输出格式。我们的调度器会根据任务类型、当前延迟、成本自动选择视觉理解,语义理解,复杂推理的最优模型。用户感知不到差异,只发现"它好像什么都懂"。
04
专用硬件是过渡,通用硬件是终局
雷峰网:怎么看AI硬件市场的现状?大家都在赌不同的形态。
董红光:现在分两派。一派做专用硬件——翻译机、录音笔、运动相机。一派做通用硬件,以眼镜为代表。专用硬件容易起量,因为用户为单一痛点买单,决策简单。但历史经验很清楚:PC时代有MP3、数码相机、GPS导航仪,智能手机一出,全部被整合到一个设备里。
通用硬件的穿越周期能力更强。用户懒,不想带一堆设备。AI耳机今天能听歌、打电话、比价、记账,明天就能做更多。我们不是在抢TWS耳机的存量市场,是在创造"AI可穿戴设备"的增量市场。
雷峰网:但专用硬件已经有成功案例了,比如Plaud录音笔年入几亿。
董红光:我非常敬佩他们,抓到了核心痛点,用优雅的方式解决了。但Plaud的方案是把专用硬件做到极致,我们的逻辑是上来就做通用化。没有对错,只是路径选择。市场需要阶段性地被满足,专用硬件是当下的答案;但拉长时间看,通用硬件的想象力更大。
更关键的是生态。专用硬件无法形成网络效应,但通用硬件可以。开发者愿意在上面建应用,用户数据越多AI越懂用户,迁移成本就越高。今天耳机撬动的难度小于手表,因为耳机品牌忠诚度低。但如果我们的手表能提供苹果表没有的长记忆AI服务——比如跑步时自动放音乐、压力大时主动聊天——那软硬一体的壁垒就起来了。
雷峰网:所以你们是在复刻智能手机替代功能机的历史?
董红光:历史不会简单重复,但逻辑相通。当年手机干掉MP3和卡片机,不是因为音质和画质更好,而是"够好"+"一个就够"。AI耳机现在拍照不如运动相机清晰,翻译不如专业设备准确,但它24小时贴在你身上,随时待命。这种"在场感"最终会战胜"专业性"。当然,我们也在持续打磨核心场景,200万像素够用,但要配上最好的算法补偿。
05
硬件是苦生意,希望更多大厂进来卷
雷峰网:不怕巨头抄作业吗?耳机年出货量超过两亿,体量这么大,最担心的就是生意被巨头碾压,大厂进场怎么办?
董红光:我反而希望更多大厂进来。硬件赛道从来不是垄断的,手机这么标准化的产品都有9家主流厂商。耳机品类更多样,个性化需求更强,用户不会只选巨头。
更重要的是,抄硬件容易,抄操作系统难。我们的护城河不是耳机形态,而是端云协同的调度能力、多模型融合经验、和用户共建的生态。拿产业投资人的钱就是为了这个——链条太长,需要上下游一起打磨。比如喜马拉雅愿意跟我们做无界面的语音原生应用,是因为他们相信这套OS的长期价值。
雷峰网:但硬件终归是苦生意。
董红光:确实苦。我们融资时找产业资本为主,就是因为知道这事需要长周期投入。早期不是所有投资人都理解,有人说"不就是耳机加个摄像头吗",但其实不是的。
现在我们估值之所以上去,不是因为硬件毛利高,是因为大家看懂了一件事:AI时代的操作系统,第一次有可能在中国落地。过去PC、手机的操作系统都是美国人的游戏,这次产业变革+人才储备+硬件供应链,三个要素齐了。
雷峰网:您提到找产业资本,这和财务投资者有什么区别?
董红光:我们第一轮就想清楚了,这事链条太长,从硬件定义、OS架构到云端调度,需要懂行的钱。财务投资人看DAU、看GMV,产业方看技术路径对不对,比如芯片厂商看的是专用AI芯片的未来形态,云厂商看的是算力消耗的规模,这时候大家是共生关系。现在看对我们的支持力度很大,很划算,他们既给钱又给资源,但早期确实难,很多基金对"操作系统重构"没有对应的感知。
雷峰网:现在投资人问得最多的问题是什么?
董红光:"如果谁谁做了怎么办?"我的回答是:第一,说明路走对了;第二,硬件不是软件,不会有赢者通吃。比如TWS耳机5年了,苹果占30%市场,其他品牌活得很好。第三,我们的先发优势是用户数据和行为习惯的沉淀。AI越用越懂用户,这个迁移成本比微信换QQ还难。
雷峰网:所以你很笃定AI时代"个人计算中心"会变化么?
董红光:对,个人计算中心的载体一直在变。PC时代它固定在桌面,手机时代它跟着你移动,AI时代它需要成为你身体的一部分。耳机是第一个身体,未来可能有眼镜、项链、腕表。
我们团队的基因决定了打法:不追求短期爆款,而是做时间的朋友。小米教会我怎么做第一款产品、怎么跟用户沟通、怎么做生态。这些经验在今天全部复用。14年OS生涯让我明白,技术真正的价值不在于多先进,而在于多贴近用户对"合适"的定义。
雷峰网:您怎么看meta的Ray-Ban智能眼镜?
董红光:方向很好,但还是有几个坎。第一,它主打拍照,我们主打AI视觉,这是两个逻辑。拍照要清晰、要防抖、要分享,AI视觉要的是理解、是实时反馈。第二,它是墨镜形态,使用场景受限。第三,它没有屏幕,纯语音交互,但很多场景还是需要视觉反馈。我们的手表就是一块永远在线的"副屏",显示验证码、导航箭头这些轻量信息。
06
生态的厚度需要时间
雷峰网:现在软件层面担心什么?
董红光:生态建设的速度。硬件可以一年迭代,OS可以半年升级,但应用生态需要养。我们现在自己做了20多个原生应用,也跟喜马拉雅合作无界面版本。但用户会不会持续开发新玩法?开发者能不能赚到钱?这决定了我们是工具还是平台。
好在AI的粘性比互联网产品强,它掌握你的日程、健康、偏好,迁移成本极高。
雷峰网:你们怎么定义成功?
董红光:短期看,能不能让百万用户把耳机从"偶尔用"变成"一直戴"。中期看,开发者生态能不能自发长出我们想不到的应用。长期看,当AI硬件年出货量过亿时,我们是不是那10个核心玩家之一。我们不追求做老大,但要在牌桌上。
雷峰网:回头看,离开大厂创业最难的是什么?
董红光:从"有资源"到"没资源"的心态转变。在大公司,你可以调动几百人、几千万预算,创业资源很紧张,但好处是决策快,今天觉得摄像头要做弧面,明天就改设计。这种速度优势在大公司是奢侈。
雷峰网:你们发布会的场景要不是办公,要不是切菜看菜谱,这听起来不够"黑科技"。
董红光:但这就是真实需求。我们调研了很多用户,"手被占住"是最高频的痛点。做饭、抱孩子、拎购物袋,以及开车、走路等这些场景手机没法用。AI的价值不是替代手机,是填补"手机不方便"的空白。
做产品很怕自嗨。200万像素、弧面设计、自研os,每个决策都是"用户体验"和"佩戴成本"的权衡。
雷峰网:接下来有什么计划?
董红光:三个方向:一是在明年Q1正式发布前,把现有场景再打磨一遍,比如视觉识别的准确率;二是继续丰富开放生态;三是在开始忙销售端的事宜,准备接受消费者的检验。
本文作者关注AI领域创业公司和一级市场,探讨行业趋势和公司动向,欢迎添加微信zxc316920327交流。





京公网安备 11011402013531号