| 专利号 | 2025101601136 | 申请日 | 2025-02-13 | 专利名称 | 一种基于注意力调制和文本重述的文本生成图像方法 |
| 授权日 | 2025-11-18 | 专利权人 | 中国石油大学(华东) | 发明人 | 刘畅;邵明文;吕响;孟令壮;宫正义 |
| 主分类号 | G06T11/00 | 关键词 | 应用领域 | ||
| 摘要 | 本发明提出一种基于注意力调制和文本重述的可控文本生成图像方法。该方法能够根据文本描述生成特定布局的语义一致性的高清图像。具体来说,第一阶段,通过大语言模型的视觉概念理解和布局安排能力,根据输入的文本内容生成图像布局信息。第二阶段,利用基于布局的注意力调制机制自适应地调整扩散过程中的注意力图,确保物体生成在给定布局内。第三阶段,利用图像翻译模型再生文本,并设计语义再生监督策略来约束再生文本与输入文本语义对齐,间接更正错误生成区域。大量的实验数据和定性结果表明,本发明在文本生成图像任务上表现出色,同时无需训练的方式显著降低运算复杂度,无需用户给定具体布局信息,便于用户使用。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 数字创意产业  数字文化创意活动 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||