当前位置: 首页 » 资讯 » 新科技 » 正文

科技前沿|未来“视界”

IP属地 中国·北京 上观新闻 时间:2025-12-26 20:21:17



在人类认知与文明进程中,图像始终扮演着重要角色。从史前洞穴壁画到现代数字影像,图像表达与生成方式的演进,深刻反映了人类认识世界与改造世界的深度与广度。在这场演进的长河中,人类在19世纪发明了摄影术,在100年前发明了电视(Television),二者都深刻影响着文明的传播。而今天,AI正重新定义图像——图像不仅是对现实的投射,也是对世界的思想衍射。图像即世界。这个世界里,像素颗粒是如何存在、如何流淌、如何构建成可见的图景的?让我们拉开“视界”的科技帷幕。

话题主持:新民晚报记者 易蓉


图像未来

图像的数字化,是这场演进长河中的“大事件”。

从最微观的视角来解构数字化图像,科学家发明了“像素”。在学术领域,与“摄取”像素相关的技术称之为“图像处理”,与“创制”像素相关的技术归为“计算机图形学”。也有两者交叉而成新的方向,比如“计算摄像学”。总结来说,计算摄像学是“主动调控硬件去拍,让后续处理更简单”;图像处理是“对已拍的图做加工,让图像更好看/更有用”;计算机图形学是“从无到有造图像,模拟真实或虚拟世界”。

人工智能技术作为通用型的基座技术,无论对“图像处理”还是“计算机图形学”以及“计算摄像学”,都产生了深刻的影响和技术革新甚至是颠覆。特别是2025年,图像AI生成技术(包括文生图、图生图、图生视频等)取得飞速进步,Nano Banana、GPT-Image、Sora、Kling、Wan等AI生图工具的陆续推出并迭代版本。AI进行图像创作,已经涌现非常多的爆火作品,甚至进入平台生产力工具池,帮助普通公众进行创意和创作。

AI生图的第一波热潮起始于2014年的生成式对抗网络(GAN),但存在训练不稳定,输出质量差等问题,并未转化为产品级可实际应用的工具。到2020年首次系统化提出的去噪扩散概率模型(DDPM,简称扩散模型),具有理论基础扎实、训练稳定性好、高质量数据生成等优点,成为当前热潮的底层关键技术驱动力。随着算法和工程持续优化,以及大语言模型(LLM)的加持,该技术已经日趋成熟,正全面走向商业落地应用。

而在规模法则(Scaling law)的驱动下,AI生图技术还在持续进步,正在从单帧图片到连续视频,再到可交互的三维空间,并保持风格、逻辑和物理规律的统一。图像模型正从纯文本的自由创意生成转向对象级甚至像素级的特定任务,即从“多样性”到“可控性”;生图工具不只看懂文字,更能通过多种模态输入、人机多轮对话等方式理解创作者的意图,即从“下命令”到“共创作”;多模态大模型正将“文字—图像—视频—3D”无缝串联,并致力于用统一架构同时处理多种模态的“理解—生成—剪辑—推理”任务,即从“单点强”到“全域优”。

目前AI领域的热词,如空间智能、物理智能、世界模型等都直接或间接地包含了图像(视频)生成这一关键“步骤”。因此,AI生图也是通往AGI(通用人工智能)的关键垫脚石。目前,上海交通大学图像通信与网络工程所正在开展生成式媒体通信、多模态大模型压缩、全真数智人及具身智联体等前沿技术攻关与创新,通过将AI与图像技术、通信技术的深度联姻,探索出具备“真像摄取+仿真计算”“真实场景+虚拟生成”“高效重建+实时驱动”特征的世界模型。

围绕“看见”,显示终端也在图像数字化浪潮中不断更新迭代,如今VR头盔、AR眼镜、MR等新型显示终端也日趋常见,将图像直接投影视网膜,甚至更进一步通过脑机接口在视觉皮层上“投射”图像的技术也已问世。完全可以期待在不远的未来,更多奇妙设备将来到大家眼前。

作为重要未来方向之一,扩展现实(XR)更将带来无限想象力和新鲜体验。它以任意形式混合叠加现实环境和虚拟环境,使来自物理世界“摄取”的具象表达与来自思想世界“创制”的想象表达,经由像素颗粒自然汇集,融合一体。XR内涵丰富,是不断拓展图像技术边界的“理想国”。自由视角观看体育比赛、博物馆和演艺场景中的真3D体验(包括点云、体视以及全息等多种形态)已经进入应用。而神经辐射场(NeRF)、高斯泼溅(GS)等新型XR表征技术,支持通过手机、消费类的AI眼镜等设备进行实时图像的采集以及日常训练素材的积累;在AI的加持下,3D转换技术正在快速落地,已经涌现出Polycam、Remy等手机App,能将日常照片转换为高质量的3D模型,特别适合捕捉精细物体和场景。

未来3—5年,随着内容的丰富和终端的普及,XR将带动空间智能相关的各种生活应用(如室内导航,景区导览,数字化身等)走进寻常百姓家。

作者:上海交通大学图像通信与网络工程所 副所长 宋利

原标题:《科技前沿|未来“视界”》

栏目编辑:陆梓华

本文作者:宋利 易蓉

SUMG AI

声明:包含AI生成内容

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新