苹果 AI 研究团队近日推出了名为 LiTo(表面光场标记化)的3D 生成大模型。该技术攻克了3D 重建领域的长期难题,实现了仅凭一张平面图像即可生成具有高保真光影效果的完整3D 对象。
LiTo 的核心在于创新性地应用了潜在空间(Latent Space)及首创的统一3D 潜在表示法:
高效编码:将复杂的表面光场数据压缩为紧凑的向量集,通过数学描述掌握物体几何形状与光线交互的物理规律。
双向机制:采用编码器-解码器架构。编码器负责提取几何结构与外观特征;解码器则负责逆向还原,能够精准复现镜面高光和菲涅尔反射等高级视觉效果。
性能表现:多视角光影的一致性为了训练 LiTo,研究团队使用了包含数千个对象的3D 数据集。实验结果显示:
解决方向偏差:LiTo 严格遵循摄像机坐标系,解决了同类模型常见的物体朝向错误问题。
指标领先:在多视角光影一致性指标上,LiTo 较目前顶尖的 TRELLIS 模型提升了约 37%。
这一成果标志着3D 内容创作门槛的进一步降低,未来有望为增强现实(AR)以及空间计算设备(如 Vision Pro)提供更高质量的素材生成支持。





京公网安备 11011402013531号