IT之家 7 月 16 日消息,@小米技术 官微今日发文详细介绍了“快捷找车”功能,该功能已经率先上线 YU7。
据介绍,该功能支持锁车自动拍照,用户在小米汽车 App 的相应设置中开启功能后,锁车时车辆会从俯视、前、后、左、右五个角度自动拍摄周围环境照片,并上传至 App 的页面,为找车提供线索。
针对 App 中驻车拍照图片显示小、信息隐蔽、环视图方位难辨等问题,小米上线自研图像理解大模型。该模型基于大量停车场场景数据训练,能对多视角图像进行处理,准确识别车位号、楼层、区域、周边设施等信息并结构化输出,用户无需反复比对、放大图片即可获取相关信息。
此外,小米手机用户可呼出超级小爱,询问“我的车停哪里了”,超级小爱会调用 App 中的车位信息,通过语音播报和弹窗展示告知车主车辆位置,方便用户在手持物品时快速了解车位信息。
IT之家附全文内容如下:
一句话找车:大模型上车,重构找车体验
你是否有过这样的经历:在商场地下停车场绕了十几分钟,还是想不起车停在哪个柱子旁?或是从写字楼出来,手里拎着电脑包,却在成排的车辆中找不到自己的车?
地下车库信号弱、结构复杂,环境像“复制粘贴”一样相似,每次停车,如果没有记住车位号或者明显的标志,回过头来找车,就仿佛都在玩一场“记忆力游戏”。
作为“移动智能空间”的探索者,小米汽车始终关注用户在出行过程中的每一个细节体验,针对这一高频痛点,小米汽车上线了全新功能 —— 快捷找车,锁车后即会自动总结车位信息,车主再也不用费劲记车位!
01、锁车一瞬,五视角自动拍照
离开车的瞬间,就是找车体验的开始。你只需在小米汽车 App- 车辆设置 - 安全与服务中开启功能,锁车后,车辆将自动从俯视、前、后、左、右五个角度拍摄周围环境照片,并上传至小米汽车 App 的页面。每张照片,都是你“找车的线索”。
但小米大模型团队并未止步于“拍照存图”这一步,团队进一步洞察用户需求,力争为用户提供更加直观、快捷的找车体验。
02、AI 识别,不仅能看、更能理解
驻车拍照的图片在小米汽车 App 界面中显示较小,楼层、区域信息往往隐藏在墙面的小角落,用户需要点击放大后查看,而前后左右的环视图还需要用户自己去“脑补”方位关系,辨识困难。
为了解决这些痛点,小米自研图像理解大模型正式上线!
小米自研图像理解大模型基于大量停车场场景数据训练,模型能基于多视角图像,进行图像预处理、关键特征区域裁切、编码、推理,准确识别停车位特征,最终结构化地输出车位号、楼层、区域、周边设施等信息。
通过这一功能,用户无需反复比对图片、放大查看,就可以直接获取车位号及车位环境的描述。
这样简单自然的体验,背后是小米长期以来在图像理解领域的技术积累。
小米很早就开始布局视觉大模型的研发,构建起了一整套自研的图像理解大模型体系,考虑到不同场景的算力条件不同,小米自研图像理解大模型通过不同大小的视觉模块结合不同尺寸的大语言模型,推出了不同大小的模型:
1)大尺寸模型参数量大,具备更强的上下文理解和特征识别能力,适用于复杂的、精度要求高的场景;
2)小尺寸模型在保证基础识别能力的同时,具备更高的运行效率,服务器成本较低;
为了兼顾快捷找车的速度和性能需求,技术上采用“大模型跑通 + 小模型部署”的策略 —— 首先采用大尺寸模型快速构建起完整的车位识别与环境分析框架,然后通过知识蒸馏的方式训练将能力“压缩”传递给轻量级模型,大大节约了大模型部署的成本。这一方案,不仅让智能识别更准确,也兼顾了速度与成本,是小米多模态大模型技术在垂直场景落地中的一次重要实践。
通过评测,室内车位号识别准确率达 93%,室外车位号识别准确率达 98%,周围环境特征准确率在 90% 以上。
* 说明:该功能已率先上线 YU7,需要您在车辆上登录个人账号后才能进行使用,泊车时若未开启透明底盘,车辆将无法获取底盘照片。
03、一问小爱即知车位,找车更轻松
除了小米汽车 App 上显示的车位总结的信息,小米手机用户还可以直接呼出超级小爱,问一句 ——“我的车停哪里了”,超级小爱将自动调用小米汽车 App 中的车位号信息,并通过语音播报 + 弹窗展示,告知车主车停的位置。
当你从商场购物出来,手里拿着大包小包,此时只需手机唤醒超级小爱,一句提问,车辆信息一目了然,找车的难度瞬间降低。
随着大模型与多模态技术的深度融合,过去那些让人烦恼的小细节 —— 看不懂的图片、找不到的车位、模糊的环境线索,如今都能交给大模型自动识别与理解,它不仅“看得见”、“看得懂”,还“听得懂”、“答得出”。
科技的进化,不只是更强的算力和模型参数,更是让每一个用户少一点麻烦,多一点从容。小米将继续拓展 AI 视觉在生活服务场景的落地应用,让每个用户通过大模型“看”得更清楚、生活得更轻松。