基于生成对抗网络的文本生成图像研究综述

李乐阳; 佟国香; 赵迎志; 罗琦

doi:10.16180/j.cnki.issn1007-7820.2023.10.006

摘要

文本生成图像是指将语句形式的文本描述翻译成与文本具有相似语义的图像。在早期研究中，图像生成任务主要基于关键字或语句的检索来实现与文本匹配的视觉内容的对齐。随着生成对抗网络的出现，文本生成图像的方法在视觉真实感、多样性和语义相似性方面取得了重大进展。生成对抗网络通过生成器和鉴别器之间的对抗来生成合理且真实的图像，并在图像修复和超分辨率生成等领域显示出良好的能力。在回顾并总结文本生成图像领域最新研究成果的基础上，文中提出了一种新的分类方法，即注意力增强、多阶段增强、场景布局增强和普适性增强，并讨论了文本生成图像面临的挑战和未来的发展方向。

出版日期2023
单位上海理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 16:25

基于生成对抗网络的文本生成图像研究综述

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友