字节跳动推出新一代单图视频驱动技术——X-Portrait 2,该技术仅需一张静态图片和一段驱动视频,便能生成高品质、“电影级”的视频内容。
X-Portrait 2技术的亮点在于,它不仅完美保留了原图的身份特征(ID),同时能够精准捕捉并迁移各种细致入微乃至夸张的表情和情绪。这一创新极大地简化了动作捕捉、角色动画以及内容创作的流程。
与以往依赖人脸关键点检测的技术不同,X-Portrait 2通过构建一个先进的表情编码器模型,并采用端到端的自监督训练框架,从海量的人像视频中自我学习,提取出与身份无关的运动隐式表征。
该技术进一步融合了强大的生成式扩散模型,从而能够生成出流畅且极具表现力的视频。在经过大规模高质量表情视频的训练后,X-Portrait 2在运动表现力和身份保持性上均显著超越了之前的技术。
业界专家表示,X-Portrait 2的推出将极大地推动视频创作领域的进步,为创作者们提供更为便捷高效的工具,同时也将为用户带来更加丰富多样的视觉体验。
感兴趣的用户和开发者可以通过访问项目地址:https://byteaigc.github.io/X-Portrait2/,了解更多关于X-Portrait 2的详细信息,并体验其强大的功能。