![]()
本文来自微信公众号:X研究媛,作者:JeffHill,编辑:研究媛,题图来自:AI生成
从悲观到乐观
最近AI+AR眼镜越来越热闹了,前有“掌握核心科技”的JBD获得天量融资,再有未披露具体金额却是行业今年最大单笔融资的华南某企业,春江水终于暖了,也真心为一众AR创业公司庆幸。
作为曾在行业里两家标杆性公司工作的野生评论家,深知消费级AR极不成熟又身体力行的不易。
两年前,核心微显示屏和光机占了BOM成本一半,但是色彩、亮度始终不能匹配需求;近眼显示光学方案复杂艰深且远未达成共识,量产一致性和良品率又十分感人,这些必须买单的高昂成本,成型终端只有羸弱的场景和极为有限的扩屏和信息提示功能。
消费级AR不是真AR。要同时满足“消费级”“AR”,那只能是假的。
一个代表,Video-See Through方案强大如苹果也难,无论光学模组、sensor、算法、算力再怎么推进,本质上人类要适应“透过摄像头以望远镜方式”去观察世界,这似乎要等待智人完成进化,Apple Vision Pro在消费市场前景难测。
一群野蛮人,Optic-See Through方案乃至部分透光的BirdBath方案真正能被消费者接受,但做完整的AR只有做成头盔,只能2B不能2C。中国AR四小龙没有虚实交互的消费级AR算是啥AR?而且APP几乎等同于没有,买来就吃灰,没有复购和稳定换机那就只有不断去“打新”。BirdBath方案和光波导方案为代表的消费级AR是一个极为早期的边缘市场,使劲表演和卖吆喝企业才能拿融资续命。
2022年底ChatGPT-3.5在全球出圈,在看似毫不相关的消费级AR上煽起了一场完美风暴。LLM技术演进不仅是消费级AR这一品类最大的关键变量,能够尝试的产品组合、场景、功能一下子丰富了太多,而且在国内外许多巨头眼里,高透光、日常佩戴可以出街的AR眼镜才是LLM落地最佳的硬件范式。
理论上,接入云端的大模型API,实时进行语音、文字、图片和视频流的接收识别和生成,你的眼镜能在多模态层面理解世界,了解你的喜好,就像海外著名科技博客The Verge的编辑所说的:我感觉自己就像托尼·斯塔克(钢铁侠),而 Gemini(谷歌推出的大模型) 就是我的J.A.R.V.I.S.。
大语言模型、生成扩散模型的改进是一场全球竞速。端到端训练并行调用工具的高阶智能体,能识别屏幕“元素”、依靠长程规划执行多步骤任务的GUI Agent,在应用端极富潜力。今年强化学习后训练导入了思维链扩展全新的Scaling范式,更进一步,能理解物理现实、预测并且生成3D内容的世界模型,想象空间非常大。单绿色很窄FoV的光波导“无用”眼镜,都能变成AI+AR的下一代消费电子。
调用随心的第二大脑,超越原来的“头戴计算机”范畴,对现实世界进行实时的视觉增强,理论上科幻片的场景会随着大模型的进步触手可及。实现长程推理、统一的多模态信息流处理架构的GUI Agent,可能会诞生新的技术路径,大大简化原来实现AR功能必须的定位、建图、渲染过程,推理算力在云端,sensor和基础的人机交互在终端,创新的空间和产品自由度一下子打开。
技术进步驱动了功能和场景扩张,让原来实现某个功能的复杂度和成本降低。这是典型的技术革新创造新品类、新需求的过程。
“危”与“机”交织的四小龙
不似东邪西毒南帝北丐,但东西南北正好分布着中国消费级AR的四小龙。原来北方的那家拿了上海的钱,搬去了东方,还有一家在南边深圳的搬去了西边成都。
面对AI+AR下一代消费电子的诱惑,国外meta、谷歌、微软、苹果都有不懈怠的多年研发,并购关键技术公司,专利池储备深厚,都准备在市场起飞的节点亮出大招。
meta的Ray-Ban堪称神来之笔,仅仅是音频和AI优化到一定程度市场就爆了。meta还继续发挥钞能力,Orion用碳化硅做波导基底,FoV撑大到70°,在一个轻量级光波导眼镜这属于前所未有,Orion波导Layout扩瞳方案让人着迷,三片合色的Micro LED全彩光引擎亮度尚可,重点是镜片前向漏光大大减少,在阵列光波导上实现这一点非同寻常,日常佩戴看不出是一副AR眼镜。
![]()
meta先以Orion做出了完美的高端示范,Ray-Ban Display再精准在配置上下刀、接力,当meta一手拿着Orion,一手推进LLaMa(未来可能转向闭源),软硬整合AI和AR上同时发力不可小觑,如果以下一个Apple的预期来看,少有人察觉meta的股价目前正在低位运行。
后知后觉的媒体和用户可曾发现,消费级AR的iPhone时刻也许已经降临。
国内,字节阿里腾讯百度甚至华为都开始认真看待AI眼镜,除此之外,还有一个擅长深入企业沟通交流再用数倍薪资挖人的网红公司,它匿在阴影中窥视,特别擅长利用高一个指数级的品牌声量快速起量,再利用这股能量在供应链议价去做极致性价比。
当众神降临,再有清道夫下场洗地,对于曾经的AR四小龙,严肃的市场拷问并不远。AR四小龙的愚蠢在于,他们扮演的角色,可能正在给大厂做产品上的MVP验证。
南边深圳的那家是两条腿走路,X系列与meta Orion同源的三片Micro LED合色的全彩光引擎,但比meta更早更激进,搭配单片全彩的光波导显示,这是风险极高、少有人敢于尝试的方案,经过了2年多迭代,行业真正量产开卖的独此一家,售价逼近万元。虽然光引擎核心组件来自供应链,这中间在量产过程中付出的努力,包括设备定制,与应用材料公司推进刻蚀工艺落地,SRG光波导显示Layout的改进,值得钦佩。
但是另一条产品线BB方案(BirdBath)的Air系列的产品动作值得商榷,在那么小的镜腿上迭代那个小Mic,真的明智吗?空间限制Mic鼓膜面积导致的音效天花板在那里,强调私密观影的话用户更愿意戴个蓝牙耳机。新加入的画质芯片的增益没有实际体验不好评价,但感觉噱头大于实际,去在镜片模组上做光学显示深度调校和人机工学平衡对用户来说更有价值效果更直观,而多一度少一度FoV,多大多大的虚拟屏尺寸只能骗用户。
杭州的那家,虽然有一些真假难辨的流言,Misa是我见过最有Geek范的企业家。最新的光波导眼镜光引擎还是单绿色,光舟一拖二的光引擎能很好降本,让双目方案光线耦入准直的难度降低,波导Layout好像后期做了一些改进,减少了一些前向漏光,可以直接贴合近视镜片,努力把眼镜做成一副正常的形态。
另一条产品线BirdBath中规中矩,产品的质感确实不错,在一些细节地方注重用户体验,挑不出什么毛病。只是那个来自供应链的近视调节功能我感觉有些想当然,近视用户绝大多数同时有散光症状,散光矫正不了,还是免不了夹个近视镜片。
在有限的接触中,Misa给我的感觉是行事光明磊落,小动作很少,一直重视来自用户的反馈,在产品改进、量产和成本中走钢丝,也很早就看到了硬件的局限而尝试布局系统和软件开发生态,这点非常有前瞻性。
但是产品还是不够“硬”,不够激进和终局,供应链方案的拿来主义深度改进有限,重视产品质感、工业设计、细节迭代、系统和软件生态,但起码你要做一个“硬件概念机”让外界惊艳讨论一阵,拓展企业的想象空间。在一个未来高度不确定、高风险的行业中,做一个老实人是最大的风险。
上海的那家,老板比较孤傲,但是BB方案上(BirdBath)确实它们做得最好,一直在关键细节上改进,技术储备最深,谷歌选择和它家联姻做OEM示范不单纯是营销套路。最新产品印象比较深的还是Xprism,似乎借鉴了Apple Vision Pro定制多层Pancake透镜的灵感——超薄光学模组极短折反射光路,上海这家新品多了一片折返镜片(不确定)设计多了一层折射光路,既减少了模组厚度又放大了FoV,以及继续改进抑制镜片底部的杂散光。
但是上海这家只有一条产品线,整个行业看BB方案明显是一个过渡方案,边缘市场的定位很难突破,强调主机和显示分离的分体式,自研芯片,做到了3DoF还是6DoF稳定可靠可用,但BirdBath+AR明显是剑走偏锋,不去做平整镜片高透光的光波导方案,在市场上意味着不进则退。
成都的那家,比较莽,老板江湖气和执行力似乎都很强,曾经的INMO Air 2敢为天下先,最近的产品没啥深刻印象。
四小龙在尝试不同的硬件方案,测试不同的产品路线,这个过程中跑通供应链,获得量产沉淀,以用户反馈迭代产品。风险全部自己趟一遍。
但茫茫机海中四小龙仅仅暂时是名声够大,后来者难道不可以像素级复制,有什么别人想抄又真正抄不了的东西?
这个行业的定海神针还是JBD的Micro LED或视涯多层Micro OLED微显示屏,以及一系列做光引擎、光学模组、波导镜片的公司,还有更底层的晶圆、刻蚀、光学设计和材料公司。定制算法DSA或者SoC芯片,端侧或者云侧的大模型门槛太高,小体量的创业公司根本够不着,真正产品的护城河你是挖不动的。
![]()
如果对硬件艰深有足够认知,积累了足够的设计制造、工程化、大规模量产know-how后,更能领悟算法、软件、系统、软硬一体的模式有多么高维。
英伟达是靠极致的GPU架构设计和工程化积淀来成为AI时代的世界第一吗?不,是来源于十几年在科研一线去观察算法,开发算子,以CUDA驱动GPGPU,架构足够通用的同时底层的数据流计算足够高效,把复杂的逻辑控制和流水线调度和对应映射的硬件微架构留给自己,把更高效更低门槛自由度更高的算法开发留给Coder和模型开发者。
苹果是靠极致的产品体验和硬件性能统治了智能手机时代吗?它是靠iOS生态和不断扩张的应用与自己的硬件产品深度耦合、无法分离,又在出货量上来的过程中逐渐自研SoC,尝试啃下来Micro LED屏、统一内存、自研基带。
个人浅见:无论消费级AR还是AI眼镜,未来可能逐渐会变成一个软件生意、生态比拼。砸大钱做产品不如做系统,深耕供应链和关键组件不如做软硬一体,有策略、有节奏、逐渐把触角伸进芯片、传感和显示的核心技术上。
创业的本质是找寻未被挖掘的PMF,在茫茫多的组合和精心设计的结构中找到让用户舒适、上瘾的机制。
在找到PMF之后,还得阻挡后来者和跨界而来的巨头,它们堆积资金、人才、供应链资源都无法复制的某种独一无二的产品体验,用Killer App滚起雪球,用户越多网络效应越强,让剩下的人被迫进入一个封闭的体系。品牌的心智锚定是自由的,市场竞争是残酷的,而垄断才是最好的生意。
黄铮有一句话特别值得细品:那些随着时间流逝、对加深生意的护城河有利的往往是“资产”,那些时间越久对自己越不利的可以看成是费用。
软件大于硬件,算法胜于商法,无法复刻的软硬件封闭体系打造出来的品牌溢价,高于没有尽头的性价比。
后话
消费级AR是一个技术基本够到门槛,供应链逐渐成熟,市场渐渐打开,风险投资开始管够的赛道。
最最关键的,它是AI最佳的硬件落地范式,万亿级的大模型投资和算力市场,只要稍微洒点水,蝴蝶轻轻扇动一下翅膀,AI眼镜掀起的飓风能横扫全球。
作为一个科技媒体出身的硬件发烧友,在互联网大厂和各类硬科技知名创业公司漂泊了10多年的野生作者,看消费级AR特别像2006—2010年智能手机的启蒙期。
千里之行始于足下,热爱确实能破万难。但是战术上的勤奋掩盖不了战略上的懒惰。
本文来自微信公众号:X研究媛,作者:JeffHill,编辑:研究媛
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4805303.html?f=wyxwapp





京公网安备 11011402013531号