当前位置：首页 » 资讯 » 新科技 » 正文

OmniPart框架，3D内容创作像拼搭积木一样简单

IP属地中国·北京 机器之心Pro 时间：2025-10-20 18:09:50

本文的主要作者来自香港大学、VAST、哈尔滨工业大学及浙江大学。本文的第一作者为香港大学博士生杨运涵。本文的通讯作者为香港大学刘希慧教授与VAST 公司首席科学家曹炎培博士。
在3D内容创作领域，如何像玩乐高一样，自由生成、编辑和组合对象的各个部件，一直是一个核心挑战。香港大学、VAST、哈尔滨工业大学及浙江大学的研究者们联手，推出了一个名为 OmniPart 的全新框架，巧妙地解决了这一难题。该研究已被计算机图形学顶会 SIGGRAPH Asia 2025 接收。
如今，从游戏、VR到数字孪生，高质量的3D世界构建变得至关重要。尽管现有的AI模型能够生成令人惊叹的3D整体形状，但它们大多是“一体式”的模型，缺乏内在的部件结构。这种结构上的不透明性，极大地限制了模型在部件编辑、动画制作、材质分配等关键应用中的价值。
为了破解这一难题，研究者们提出了OmniPart，一个创新的“部件级别”3D生成框架。它的核心思想是将复杂的生成任务解耦为两个协同工作的阶段：“先规划，后生成”，在保证部件之间高度独立（语义解耦）的同时，也确保它们能完美地组合成一个整体。

论文题目：OmniPart: Part-Aware 3D Generation with Semantic Decoupling and Structural Cohesion项目主页：https://omnipart.github.io/代码下载：https://github.com/HKU-MMLab/OmniPartHuggingface demo:https://huggingface.co/spaces/omnipart/OmniPart
效果展示
OmniPart 以简单的2D图像（如图中画框所示）和掩码为输入，首先通过自回归模型规划出三维部件结构，然后同步生成所有高质量、带纹理的独立部件（如透明展柜中所示）。这些部件能够无缝地融合成一个结构协调的完整对象，并提供了显式的部件控制能力，从而极大地增强了后续的编辑、定制化和动画制作效果。
方法介绍：两阶段“规划-生成”策略
OmniPart 的流程优雅而高效，它将复杂的部件生成任务分解为两个核心模块：可控的结构规划（Controllable Structure Planning）和空间感知的部件生成（Spatially-Conditioned Part Synthesis)。

第一阶段：基于2D掩码的结构规划
首先，模型需要规划出3D对象的部件布局。OmniPart 采用了一个自回归Transformer模型，它会根据输入的2D图像，预测出一系列3D包围盒（Bounding Boxes），每一个包围盒都代表一个部件的空间位置和大小。
这里最巧妙的创新在于，用户可以通过提供简单、灵活的2D部件掩码（Part Masks）来直观地控制部件的分解粒度。这些掩码无需与3D部件一一对应，也无需语义标签，大大降低了控制的难度。例如，用户可以决定机器人的手臂和手掌是一个部件还是两个独立的部件。
为了确保生成的包围盒能完整地覆盖对应部件，团队还引入了一种新颖的“部件覆盖损失”（Part Coverage Loss），鼓励模型生成稍大一些的包围盒，避免部件信息在后续阶段丢失。
第二阶段：空间感知的部件生成

有了部件的“空间蓝图”（包围盒）后，第二阶段的任务就是生成所有高质量的3D部件，并确保它们能无缝拼接。
该模块基于一个强大的预训练3D整体生成器（TRELLIS）进行高效微调。它将所有部件的潜在编码（latent codes）进行并行联合优化，而不是孤立地生成每个部件。这种全局与局部信息结合的去噪过程，确保了最终部件之间的高度一致性。
此外，为了解决部件边界处体素重叠和噪声问题，OmniPart 提出了一种新颖的“体素丢弃机制”。该机制能精确判断每个体素是否真正属于其分配的部件，从而生成清晰的部件接口，让组合后的整体更加完美。
实验效果：质量与效率全面领先
生成质量对比
如下图所示，与 Part123、PartGen 等现有方法相比，OmniPart 生成的3D部件在几何细节、语义准确性和结构一致性上都表现出明显优势。其他方法或只能生成表面分割，或几何质量较差，而 OmniPart 则能生成结构完整、细节丰富且能完美组合的独立部件。

2.生成效率

值得一提的是，OmniPart 的生成效率也实现了大幅提升。相较于需要复杂多视图重建流程的 Part123（约15分钟）和 PartGen（约5分钟）
3.Huggingface demo 展示
丰富的下游应用
得益于其出色的部件可控性，OmniPart 自然地支持一系列激动人心的下游应用：

掩码控制生成 (Mask-Controlled Generation)：用户可通过编辑2D掩码，精确指导3D部件的结构生成。多粒度生成 (Multi-Granularity Generation)：通过调整掩码的精细程度，可以生成不同细节层次的部件组合。材质编辑 (Material Editing)：可以对特定部件（如企鹅的帽子、衣服）进行独立的材质或纹理修改。几何处理 (Geometry Processing)：生成的高质量部件有利于后续的网格重构（remeshing）等几何处理，不会在部件连接处产生伪影。
总结
OmniPart 框架通过其创新的“规划-生成”两阶段流程，并引入灵活的2D掩码作为引导，成功地实现了高质量、可控的部件级3D内容生成。它不仅在生成质量和效率上树立了新的标杆，其强大的可编辑性和应用潜力也为游戏开发、动画制作和虚拟现实等领域铺平了道路，推动了可解释、可编辑3D内容的创作边界。
值得一提的是，该团队近期在3D部件领域已经积累了多篇高质量的研究成果，形成了系统性的探索。其中包括专注3D部件分割的工作SAMPart3D(https://yhyang-myron.github.io/SAMPart3D-website/)，该研究旨在实现对任意3D物体进行精细化的部件分割。另一项相关研究HoloPart(https://vast-ai-research.github.io/HoloPart/) 则致力于解决从不完整的表面部件信息（Amodal Segmentation）中生成完整的3D部件几何。从部件的分割 (SAMPart3D)、补全 (HoloPart)到如今的生成 (OmniPart)，这些工作共同构建了一个围绕“部件级3D物体”的AIGC技术矩阵。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

原子重塑｜用科技创新打破创作围墙

AWE 千问AI眼镜等多款智能眼镜发布 AI融入用户日常生活

火到OpenClaw创始人跟前了！百度“养虾全家桶”到底有多猛？

阿里千问吴建军：让AI融入用户日常生活，让眼镜成为随身的智能超级助理

阿里千问吴建军：让AI融入用户日常生活，让眼镜成为随身的智能超级助理

eVTOL真机首秀、AI+飞行机器人“盲飞”挑战、40亿资本加持：RortiX全球首秀“翼展新章”，定义未来低空

全站最新

原子重塑｜用科技创新打破创作围墙

AWE 千问AI眼镜等多款智能眼镜发布 AI融入用户日常生活

火到OpenClaw创始人跟前了！百度“养虾全家桶”到底有多猛？

阿里千问吴建军：让AI融入用户日常生活，让眼镜成为随身的智能超级助理

热门推荐

原子重塑｜用科技创新打破创作围墙

AWE 千问AI眼镜等多款智能眼镜发布 AI融入用户日常生活

火到OpenClaw创始人跟前了！百度“养虾全家桶”到底有多猛？

阿里千问吴建军：让AI融入用户日常生活，让眼镜成为随身的智能超级助理

阿里千问吴建军：让AI融入用户日常生活，让眼镜成为随身的智能超级助理

eVTOL真机首秀、AI+飞行机器人“盲飞”挑战、40亿资本加持：RortiX全球首秀“翼展新章”，定义未来低空

B站成AWE2026官方独家测评平台，家电测评内容播放量提升145%

砺算科技“渲推一体GPU”产品公开发售

“龙虾”大热，Agent时代，人类更应极度清醒

Gemini重塑谷歌地图！一句话搞定出行攻略，网友：垂直应用全完蛋

阿里吴建军：千问AI眼镜月底上线「AI办事」功能

“伪智能”翻车：买的到底是家电，还是祖宗？

AI真人短剧风口爆发：AI降低门槛，审美决定上限

冲咖啡、造汽车、街头巡逻大湾区具身机器人产业驶入商业化快车道

3·15网络消费安全指南请查收！