 位置：首页 > 实时讯息 >

清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈

0次浏览发布时间：2025-03-31 15:01:00

来源：机器之心Pro

论文有三位共同一作。赵若雯，清华大学一年级硕士生，主要研究生成模型、强化学习和具身智能，已在ICRA等会议发表论文。叶俊良，清华大学二年级硕士生，专注于3D生成和基于人类偏好的多模态强化学习研究，曾以第一作者身份在ECCV发表DreamReward，该成果能生成更符合人类偏好的3D资产。王征翊，清华大学四年级博士生，主要研究3D多模态生成模型，已在NeurIPS、ECCV、ICML、CVPR等顶级学术会议发表多篇论文。

在三维数字内容生产领域，三角形网格作为核心的几何表示形式，其质量直接影响虚拟资产在影视、游戏和工业设计等应用场景中的表现与效率。

传统的三维网格生成方式，如人工建模或 Marching Cubes 等算法，存在成本高、拓扑结构质量差等问题。

针对这一瓶颈，清华大学朱军团队近日提出了 DeepMesh 方法，通过引入创新的自回归生成框架，显著提升了高面片人造网格的生成能力。该方法支持生成高达 3 万个面片的三维网格，相比现有技术提升了一个数量级。

论文标题：DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning
论文主页：https://zhaorw02.github.io/DeepMesh/
论文地址：https://arxiv.org/abs/2503.15265
代码：https://github.com/zhaorw02/DeepMesh

DeepMesh 基于输入点云，采用自回归的 Transformer 架构逐步预测面片序列，从而生成拓扑结构合理且视觉美观的高质量三维网格。

DeepMesh 架构如图所示，系统首先利用编码器对输入点云进行特征提取；提取到的特征随后被输入至自回归 Transformer 模块，该模块通过融合自注意力与交叉注意力机制，逐步预测网格的顶点或面片序列，最终生成结构完整的高质量三维网格。

在预训练阶段，DeepMesh 引入了三级块结构网格标记化方法：根据面片之间的连通性对网格进行分解，并将其划分为粗、中、细多个空间层级。在此基础上，将面片中各顶点的坐标映射为相对于所属层级块的偏移索引，并对重复索引进行合并处理。

该方法在确保几何精度的同时，显著压缩了序列长度，从而大幅提升了训练效率。图中展示了采用 DeepMesh 网格标记化方法与其他方法，在训练不同面片数量的网格数据时的耗时对比情况。

通过对训练数据进行封装处理，并引入融合几何质量与结构规整度的双重筛选机制，DeepMesh 有效解决了异常样本引发的训练不稳定问题，同时实现了训练过程中的动态负载均衡。为突破长序列带来的内存瓶颈，模型还采用了滑动窗口截断训练技术，支持单个网格生成高达 3 万个面片，显著提升了建模能力。

此外，DeepMesh 创新性地引入了「直接偏好优化（DPO）」强化学习框架，并构建了一个结合客观几何指标与主观人类评价的分阶段数据标注系统。

该系统首先利用几何质量指标筛除存在明显缺陷的 3D 样本，随后由人工对剩余数据进行标注，评估其拓扑结构的合理性与视觉观赏性。基于这套高质量的标注数据，团队对模型进行了强化训练，从而显著提升了生成结果在几何完整性与拓扑美观性方面的表现。

DeepMesh 在细节保真与结构多样性方面表现出色，并具备对传统生成方法所生成网格进行拓扑优化的能力。与现有方法相比，DeepMesh 在几何精度与拓扑质量两个维度均实现最优性能，生成的三维网格不仅在结构合理性上表现卓越，也在视觉美观性上更具吸引力。

在多样性生成方面，DeepMesh 能在保持输入点云几何一致性的前提下，对同一输入生成多种具有高保真度且外观风格各异的三维网格方案，展现出强大的创意生成与精度控制的能力。这一特性对于影视制作、游戏设计等需进行多版本快速迭代的应用场景具有显著价值。

针对传统方法（如 TRELLIS）生成的拓扑结构混乱问题，DeepMesh 可对其输出结果进行有效的拓扑优化，显著提升网格结构的有序性与合理性。

凭借在高保真、多样性与拓扑优化方面的突出表现，DeepMesh 展现出在 3D 内容创作领域的颠覆性潜力，特别适用于数字游戏、虚拟现实、影视制作等对创意表达与建模效率要求极高的行业。

该研究成果发布后迅速引发广泛关注，知名推特博主 AK 第一时间转发支持，相关内容获得上千点赞，引发业内与社群的热烈讨论与积极反馈。

以下展示更多由 DeepMesh 生成的三维网格示例，进一步体现模型在细节还原、拓扑合理性及多样性方面的强大能力。

本文分类：实时讯息
本文标签：网格拓扑几何结构方法清华大学多样性模型
浏览次数：0 次浏览
发布日期：2025-03-31 15:01:00
本文链接：https://www.gnwz.net/news/ZVvPJOpBbR.html

相关文章

事关中小学生午休，新“国标”出台

近日，市场监管总局（国家标准委）批准发布《中小学生午休课桌椅通用技术要求》（GB/T 46016—2025）国家标准，将于2026年2月1日正式实施。该标准根据学生身体发育特点，从设计、生产、检验、使用全流程作出规定，让午休课桌椅更舒适、安全、耐用。标准要求午休课桌椅形态尺寸兼顾学习与午休的舒适。上

 2025-09-04 10:59:00

报告丨2025“人工智能+”行业标杆案例荟萃

来源：AI芯天下前言：2025年，“人工智能 +”领域智能体应用呈现从工具赋能向系统重构的深刻转型。报告显示，智能体已深度融入制造、能源、医疗等核心场景，不仅实现了从数据感知到决策执行的闭环升级，更展现出虚实融合的创新模式、行业知识的深度融合以及生态级协同能力。作者 | 方文三图片来源 |网络这

 2025-08-18 00:12:00

第二十四届中国计算语言学大会（CCL 2025）成功召开

2025年8月11日-14日，第二十四届中国计算语言学大会（CCL 2025）在济南市成功召开。本次大会由中国中文信息学会计算语言学专业委员会主办，齐鲁工业大学（山东省科学院）承办。会议聚焦计算语言学前沿技术与发展趋势，为700余位与会学者搭建了高水平的学术交流平台，获得与会专家学者的高度认可。本次

 2025-08-17 11:14:00

阎良公安：科技赋能，打造立体化防控新格局

阳光讯（记者赵生杰通讯员田鹏飞）近期，西安市公安局阎良分局巡特警大队聚焦分局加强政治工作强化队伍建设“12345”机制，从被动的传统巡防向主动新型巡防转变，以科技赋能提升队伍整体战斗力，以精准布控挤压犯罪空间，在巡逻防控工作中打造出“空中鹰眼、地上铁网、全域联动”的立体化新格局，有效提升了群众

 2025-08-14 20:03:00

新野县法院邀基层工作者“沉浸式”体验司法共筑解纷防线

大象新闻记者魏广宝通讯员王硕/文图6月26日，新野县人民法院举办2025 年第十五次公众开放日活动，邀请汉城街道社区的民调主任、网格专干及网格员代表走进法院，通过实地参观法治文化展馆、立案大厅、旁听庭审现场等环节，深化基层联动，助力提升基层调解能力。在法治文化展馆，参观人员通过丰富的历史图片、

 2025-06-27 11:30:00

辽宁印发《实施方案》促进人工智能创新发展

中新网沈阳6月25日电 (李晛韩宏)记者25日从辽宁省政府新闻办召开的发布会上获悉，辽宁省政府办公厅印发了《辽宁省促进人工智能创新发展实施方案》(以下简称《实施方案》)。到2027年底，辽宁省算力基础设施建设体系基本形成。人工智能是引领未来的战略性技术，是新一轮科技革命和产业变革的重要驱动力量，将

 2025-06-25 19:08:00

超930亿元！在福州闭幕！

第二十三届中国·海峡创新项目成果交易会在福州闭幕本届海创会签约总金额达930多亿元推动一批创新项目成果展示、交易和落地转化包华摄本届海创会汇聚清华大学、哈尔滨工业大学、武汉理工大学等主宾高校，集聚马军、段路明、梅宏等院士专家，集中展示一批前沿科技成果，包括清华大学“海上能源岛并网/孤网运行系统”、

 2025-06-21 17:15:00

在大模型应用中拓展师生思维

图①上海市虹口区曲阳第四小学学生使用学科学习智能体完善思维导图梳理。学校供图图②北京第十中学课堂教学中，学生使用生物学科AI学伴智能体开展自主学习。学校供图当前，人工智能技术已经开启了一个新的时代，社会转型必然会对教育发展提出新的要求。特别是具有开放性特征的通用大模型，借助区域教育教学资源对其进行训

 2025-06-17 07:11:00