DragGan是什么?
DragGAN是由Max Planck研究所开发的一种新的人工智能工具,它允许用户通过几个点击和拖动来真实地修改照片。
DragGAN允许用户交互地将图片中的点拖动到他们选择的目标位置。这种基于特征的运动监督使用户能够精确地移动处理点,完全控制图片修改过程。此外,点追踪技术确保在整个编辑过程中精确监测处理点。
深度生成模型,如生成对抗网络(GANs),在合成随机逼真图像方面取得了前所未有的成功。在现实世界的应用中,这类基于学习的图像合成方法对合成视觉内容的可控性有着重要的功能要求。例如,社交媒体用户可能希望调整随意拍摄照片中人物或动物的位置、形状、表情和身体姿势;专业电影预可视化和媒体编辑可能需要高效地创建具有特定布局的场景草图;汽车设计师可能希望交互式地修改他们的设计形状。为了满足这些多样化的用户需求,理想的可控图像合成方法应具备以下特性:
- 灵活性:能够控制生成对象或动物的位置、姿势、形状、表情和布局等不同空间属性;
- 精确性:能够以高精度控制空间属性;
- 普适性:适用于不同的对象类别,而不仅限于特定类别。尽管先前的方法只满足这些特性中的一两个,但我们在本研究中旨在同时实现它们。
DragGan有多强大?
有了这个AI批图不再是一件烦事,只要告诉AI你的想法,AI就可以马上帮你修好图片。
我光说你们还不能体会到他的强大,接下来让我们欣赏这个颠覆性的AI吧!
© 版权声明
1.本站部分内容收集于互联网公开页面!若内容侵犯到您的权益,请发送邮件至:ai@ouluai.com,我们将第一时间处理!
2.资源所需价格并非资源售卖价格,是收集、整理、编辑详情以及本站运营的适当补贴,并且本站不提供任何免费技术支持。
3.所有资源仅限于参考和学习,版权归原作者所有,更多请阅读网站声明。
THE END
暂无评论内容