位置: 首页 > 实时讯息 >

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

0次浏览     发布时间:2025-03-31 15:01:00    

来源:机器之心Pro

论文有三位共同一作。赵若雯,清华大学一年级硕士生,主要研究生成模型、强化学习和具身智能,已在ICRA等会议发表论文。叶俊良,清华大学二年级硕士生,专注于3D生成和基于人类偏好的多模态强化学习研究,曾以第一作者身份在ECCV发表DreamReward,该成果能生成更符合人类偏好的3D资产。王征翊,清华大学四年级博士生,主要研究3D多模态生成模型,已在NeurIPS、ECCV、ICML、CVPR等顶级学术会议发表多篇论文。

在三维数字内容生产领域,三角形网格作为核心的几何表示形式,其质量直接影响虚拟资产在影视、游戏和工业设计等应用场景中的表现与效率。

传统的三维网格生成方式,如人工建模或 Marching Cubes 等算法,存在成本高、拓扑结构质量差等问题。

针对这一瓶颈,清华大学朱军团队近日提出了 DeepMesh 方法,通过引入创新的自回归生成框架,显著提升了高面片人造网格的生成能力。该方法支持生成高达 3 万个面片的三维网格,相比现有技术提升了一个数量级。

  • 论文标题:DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning
  • 论文主页:https://zhaorw02.github.io/DeepMesh/
  • 论文地址:https://arxiv.org/abs/2503.15265
  • 代码:https://github.com/zhaorw02/DeepMesh

DeepMesh 基于输入点云,采用自回归的 Transformer 架构逐步预测面片序列,从而生成拓扑结构合理且视觉美观的高质量三维网格。

DeepMesh 架构如图所示,系统首先利用编码器对输入点云进行特征提取;提取到的特征随后被输入至自回归 Transformer 模块,该模块通过融合自注意力与交叉注意力机制,逐步预测网格的顶点或面片序列,最终生成结构完整的高质量三维网格。

在预训练阶段,DeepMesh 引入了三级块结构网格标记化方法:根据面片之间的连通性对网格进行分解,并将其划分为粗、中、细多个空间层级。在此基础上,将面片中各顶点的坐标映射为相对于所属层级块的偏移索引,并对重复索引进行合并处理。

该方法在确保几何精度的同时,显著压缩了序列长度,从而大幅提升了训练效率。图中展示了采用 DeepMesh 网格标记化方法与其他方法,在训练不同面片数量的网格数据时的耗时对比情况。

通过对训练数据进行封装处理,并引入融合几何质量与结构规整度的双重筛选机制,DeepMesh 有效解决了异常样本引发的训练不稳定问题,同时实现了训练过程中的动态负载均衡。为突破长序列带来的内存瓶颈,模型还采用了滑动窗口截断训练技术,支持单个网格生成高达 3 万个面片,显著提升了建模能力。

此外,DeepMesh 创新性地引入了「直接偏好优化(DPO)」强化学习框架,并构建了一个结合客观几何指标与主观人类评价的分阶段数据标注系统。

该系统首先利用几何质量指标筛除存在明显缺陷的 3D 样本,随后由人工对剩余数据进行标注,评估其拓扑结构的合理性与视觉观赏性。基于这套高质量的标注数据,团队对模型进行了强化训练,从而显著提升了生成结果在几何完整性与拓扑美观性方面的表现。

DeepMesh 在细节保真与结构多样性方面表现出色,并具备对传统生成方法所生成网格进行拓扑优化的能力。与现有方法相比,DeepMesh 在几何精度与拓扑质量两个维度均实现最优性能,生成的三维网格不仅在结构合理性上表现卓越,也在视觉美观性上更具吸引力。

在多样性生成方面,DeepMesh 能在保持输入点云几何一致性的前提下,对同一输入生成多种具有高保真度且外观风格各异的三维网格方案,展现出强大的创意生成与精度控制的能力。这一特性对于影视制作、游戏设计等需进行多版本快速迭代的应用场景具有显著价值。

针对传统方法(如 TRELLIS)生成的拓扑结构混乱问题,DeepMesh 可对其输出结果进行有效的拓扑优化,显著提升网格结构的有序性与合理性。

凭借在高保真、多样性与拓扑优化方面的突出表现,DeepMesh 展现出在 3D 内容创作领域的颠覆性潜力,特别适用于数字游戏、虚拟现实、影视制作等对创意表达与建模效率要求极高的行业。

该研究成果发布后迅速引发广泛关注,知名推特博主 AK 第一时间转发支持,相关内容获得上千点赞,引发业内与社群的热烈讨论与积极反馈。

以下展示更多由 DeepMesh 生成的三维网格示例,进一步体现模型在细节还原、拓扑合理性及多样性方面的强大能力。

相关文章

iPhone17系列机模上手图曝光:Air新机薄到极致

据媒体报道,4月29日,YouTube频道Apple Track发布视频,展示了一组iPhone 17系列机模,并详细对比了iPhone 16系列。根据视频展示的机模细节,iPhone 17 Air采用“横向飞机跑道”设计,厚度仅为5.5mm/5.6mm,远薄于iPhone 16 Pro的8.25m

2025-04-30 09:05:00

80后手艺人王金川: 自制微缩模型,指尖还原老建筑

在黑河一间普通的工作室里,易拉罐、纸壳、泡沫板、铁丝等“废品”正被一双巧手赋予新的生命,80后手艺人王金川用这些不起眼的材料,复原出一座座消失的老建筑:“老三百”“魁星阁”“海兰照相馆”……每一件作品都承载着城市的记忆,也记录着他从童年至今对手工的热爱与执着。走进王金川的工作室,仿佛穿越了时光隧道:

2025-04-20 22:26:00

如何Dll修复组件

安装游戏或软件时,常遇dll报错,这会干扰其正常运行。1、 遇到dll报错,主要有两种解决办法:一是安装对应的dll组件,二是安装dll修复工具。建议优先尝试第一种方法。2、 遇到dll报错时,可在网上查找相关问题,从浏览器下载所需的dll组件来解决。3、 还可以通过软件修复,例如使用等辅助工具即可

2025-04-19 14:49:00

出台装备制造相关行业新一轮稳增长方案、电信业进一步扩大开放!工信部谈下阶段工作重点

4月18日,国新办举行新闻发布会,工业和信息化部有关负责人介绍2025年一季度工业和信息化发展情况。一季度规模以上工业增加值同比增长6.5%,增速比去年四季度加快0.8个百分点。一季度,工业对宏观经济增长的贡献率达到了36.3%。工业民间投资保持两位数增长,企业预期提振、效益改善,规模以上工业企业数

2025-04-19 02:01:00

腾讯混元宣布开源定制化图像生成插件InstantCharacter

IT之家 4 月 18 日消息,腾讯混元今日宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。腾讯官方介绍称,通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方。输入原始图片+ prompt :a ra

2025-04-18 19:26:00

工信部:国产大模型发展创造“中国速度”

【通信产业网讯】4月18日,国务院新闻办公室举行2025年一季度工业和信息化发展情况发布会,工信部总工程师谢少锋,新闻发言人、运行监测协调局局长陶青,信息通信发展司司长谢存出席并答记者问。在回答记者提出的我国人工智能产业的发展形势以及工信部在推动人工智能赋能新型工业化方面取得了哪些进展时,谢少锋表示

2025-04-18 11:20:00

首届酒仙桥论坛在北京数字经济算力中心正式启幕

4月15日,为期6天的2025酒仙桥论坛在北京数字经济算力中心正式启幕。论坛汇聚产学研各界领袖及头部企业代表,聚焦人工智能产业“未来前景、创新应用、生态发展”三大核心领域,探索加快培育新质生产力的实践路径。AI已进入黄金发展期,如何推动AI从技术转化为生产力,是行业内备受重视的议题。在这场以“开启A

2025-04-17 21:53:00

聚焦第五届消博会 | 安永大中华区消博会上发布业界首个AI智能问答

4月13日下午,在第五届中国国际消费品博览会现场,安永大中华区发布业界首个融合认知智能与专业知识的创新产品“安永智能问答”。本次产品包含两大智能机器人——EYA.ai 与 ESG.ai。在全球绿色转型与数字经济深度交织的大背景下,人工智能(AI)与可持续发展正引领时代浪潮。2025年全国两会将“AI

2025-04-13 21:12:00