位置: 首页 > 实时讯息 >

腾讯混元宣布开源定制化图像生成插件InstantCharacter

0次浏览     发布时间:2025-04-18 19:26:00    

IT之家 4 月 18 日消息,腾讯混元今日宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。

腾讯官方介绍称,通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方

输入原始图片

+ prompt :a rabbit is in the kitchen holding a spoon and drinking soup

就能得到下面的图:

+prompt:a rabbit in the city,cyberpunk

就可以得到:

角色一致性是多轮文生图场景中的一大难题。InstantCharacter 的优势在于可以确保角色在不同场景中的一致性和真实性、画质和精度高,同时具有灵活的文本编辑性,用户可以根据需要灵活切换任意场景,让人物生成任意动作。

其在角色一致性和图像生成的精确度上号称超过了此前业界的相关技术,能够处理多种风格和复杂度的图像。

通过这个插件,内容创作者可以让生成的角色保持高度一致,能够更高效地创作出符合其需求的视觉作品,可以用于连环画、影片创作等场景

实际的测评中,开源的 InstantCharacter 实现的效果媲美 GPT 4o 等模型。

从技术上看,现有基于学习的方法主要依赖于 U-Net 架构,但在泛化能力和图像质量上存在局限性,而基于优化的方法则需要针对特定主体进行微调,这不可避免地降低了文本可控性。

为了解决这些挑战,InstantCharacter 利用 DiT 模型构建了一个创新的框架。框架引入了一个可扩展的适配器(adapter),采用多个 transformer encoder,能够有效处理开放域的角色特征,并与现代扩散变换器的潜在空间无缝交互。这种设计使得系统能够灵活适应不同的角色特征。

同时,为了有效训练框架,腾讯混元团队还构建了一个包含千万级样本的大规模角色数据集。数据集被系统地组织为成对(多视角角色)和非成对(文本-图像组合)子集。这种双数据结构使得身份一致性和文本可编辑性能够通过不同的学习路径同时优化。

IT之家附项目相关链接:

  • 项目官网:https://instantcharacter.github.io/

  • 代码:https://github.com/Tencent/InstantCharacter

  • Hugging Face Demo:https://huggingface.co/spaces/InstantX/InstantCharacter

  • 论文:https://arxiv.org/abs/2504.12395

相关文章

苹果示警iPhone用户:新间谍攻击肆虐全球

IT之家 5 月 1 日消息,科技媒体 TechCrunch 昨日(4 月 30 日)发布博文,报道称苹果公司本周通知多位用户,警告其可能成为间谍软件(spyware)的攻击目标。IT之家援引博文介绍,包括意大利记者 Ciro Pellegrino 和荷兰右翼活动家 Eva Vlaardingerb

2025-05-01 06:52:00

iPhone17系列机模上手图曝光:Air新机薄到极致

据媒体报道,4月29日,YouTube频道Apple Track发布视频,展示了一组iPhone 17系列机模,并详细对比了iPhone 16系列。根据视频展示的机模细节,iPhone 17 Air采用“横向飞机跑道”设计,厚度仅为5.5mm/5.6mm,远薄于iPhone 16 Pro的8.25m

2025-04-30 09:05:00

RTX 5070首发 荣耀MagicBook Pro16预热:4月30日发布

4月27日消息,在本月(4月23日)举行的荣耀GT Pro暨全场景新品发布会的最后,荣耀中国区副总裁、智慧生活业务部部长林林宣布,荣耀MagicBook Pro16笔记本 HUNTER版将于4月30日发布。荣耀手机官方现开启新品笔记本预热:荣耀MagicBook Pro16采用超轻薄便携机身设计,将

2025-04-27 22:15:00

梁溪区黄巷街道:广石家园文化融合活动赋能残障人士精神共富

【来源:无锡市残疾人联合会_基层动态】春意盎然之际,梁溪区黄巷街道广石家园社区残疾人之家以"蕙质兰心"为主题,精心策划了一场传统文化与自然美学交融的文化融合活动,通过四大沉浸式体验环节,让30余名残障居民在诗书雅韵与兰花清芬中感受文化魅力、提升生活技能,更搭建起温暖互助的交流平台。书卷寻古:兰亭雅集

2025-04-25 23:08:00

直击上海车展:江波龙发布车规存储新品,PTM定制“驾控随芯”

4月23日,2025上海国际车展盛大启幕,全球汽车产业的目光聚焦于这场科技与创新的盛宴。在众多展示亮点中,汽车AI+应用无疑是最大的热点之一,“驾控超级大脑”技术概念、车机交互AI智能体、AI大模型实现多模态交互与情感图谱引擎等,各大汽车品牌纷纷推出了其最新研发成果,引发业内关注。作为半导体存储品牌

2025-04-24 11:45:00

搭载7200mAh超大电池,电竞性能旗舰荣耀GT Pro正式发布

2025年4月23日,在荣耀GT Pro暨全场景新品发布会上,备受瞩目的电竞性能旗舰荣耀GT Pro正式发布,国补后售价仅3199元起。作为荣耀“更懂年轻人的全新性能科技系列”新品,荣耀GT Pro携手“荣耀GT系列性能调校官”、职业电竞选手一诺(徐必成),带来了性能、操控、续航、护眼等全面领先的电

2025-04-23 16:12:00

刘涛一到福建,咖位自动上升!两杠三星护航,身边数十位商界大佬

当一位女演员踏上福建的土地,瞬间仿佛被赋予了特殊的 “神力”,咖位直线上升,所到之处皆受尊崇。没错,这位传奇般的人物,就是凭借 “妈祖” 一角在福建 “封神” 的刘涛!一句 “刘涛一到福建领域,咖位自动上升,没人敢动她”,背后究竟藏着怎样令人惊叹的故事?4 月 19 日,在妈祖诞辰 1065 年 “

2025-04-23 08:50:00

西宁率先建设!

西宁率先在西北地区开展零碳场景建设为积极响应国家“双碳”战略,市发改委积极探索,研究论证《西宁市零碳场景示范建设实施方案》(以下简称《方案》),通过园区、工厂、公共机构、景区、建筑五大零碳场景示范建设,总结形成可复制、可推广、可借鉴的零碳场景建设经验,有效推动全社会各领域降碳理念、机制、技术等提升和

2025-04-22 13:17:00