在2025年全球数字经济盛会上,北京市携手超过40座国际友好城市,共同创立了全球数字经济城市联盟。这一联盟聚焦于数字基础设施建设、跨境数据流动治理等核心议题,旨在搭建跨国合作平台,推动全球城市的数字化转型与发展。作为本次大会的主办城市,北京在智慧城市建设方面持续探索,人工智能技术在各行各业的应用创新层出不穷。
尤其多模态大模型技术在北京市经济技术开发区的城市治理中首次亮相,并取得了显著成效。百度智能云的“视频大模型全域智能训练赋能城市治理”项目,因其技术创新与实际应用的高度融合,被评为“北京市人工智能赋能行业发展典型示范”。这一案例不仅展示了技术前沿,也彰显了智慧城市建设的新方向。
早在今年4月,一场别开生面的全球首个人形机器人半程马拉松在北京经开区成功举办。在这场大型活动中,多模态大模型技术发挥了至关重要的作用。工作人员仅通过少量图片样本,迅速开发出针对“铁马倒伏”等特定场景的算法,并灵活部署于沿线700多个摄像头,实现了对关键区域的智能监控。这一创新举措极大地提升了活动保障效率,确保了赛事的顺利进行。
进入6月,北京迎来汛期。在防汛应急响应工作中,多模态大模型技术再次展现其强大实力。面对上千个视频防汛监测点,该技术能够在极短时间内检索并识别出积水区域,同时根据积水程度进行分级预警。预警信息通过京办系统迅速传达至城管部门,为应急处置工作提供了精准指导,有效提升了防汛效率,为城市安全提供了坚实的科技保障。
为了响应辖区内各委办局对城市智能化治理的迫切需求,北京经开区营商环境建设局作为首批场景开放单位,发布了城市治理场景创新需求清单。该清单旨在推动基于大模型技术的城市影像视频智能分析场景建设,特别是在大体量视频综合分析技术突破及工程化应用方面寻求突破,并率先在城市治理事件领域开展试点验证。
百度智能云作为这一场景的重要参与者,率先将视觉多模态大模型技术应用于城市治理实践。通过构建基于多模态大模型的视频解析中台,实现了视频感知体系与算法仓的“软硬解耦”,为城市治理智能应用技术的创新提供了有力支撑。
依托百度智能云的泛政多模态大模型,北京经开区成功打造了全流程智能化治理平台。该平台通过精准算法分析,提取了超过4000种城市治理要素的结构化数据,将视频转化为动态事件流与数据流,实现了城市治理问题的智能发现、预警、立案追踪及审核结案。这一创新模式不仅提高了城市治理问题的处置效率,也为城市治理从人工主导向智能辅助研判的转变提供了坚实的技术基础。
目前,百度智能云的泛政多模态大模型已在包括北京、内蒙古鄂尔多斯在内的数十个城市落地应用。其多模态感知与智能执法辅助能力正在深刻改变城市治理的逻辑与方式。这种非现场执法模式的推广,有效解决了传统城市治理中人力不足、取证困难等难题。随着大模型对复杂场景理解能力的不断提升,未来城市治理将更加高效、精准。