| 专利号 | 2025101601761 | 申请日 | 2025-02-13 | 专利名称 | 一种基于解耦和多域引导策略的多条件引导的文本生成图像方法 |
| 授权日 | 2026-03-13 | 专利权人 | 中国石油大学(华东) | 发明人 | 刘畅;邵明文;吕响;孟令壮;宫正义 |
| 主分类号 | G06T11/60 | 关键词 | 应用领域 | ||
| 摘要 | 本发明提出一种基于解耦和多域引导策略的多条件引导的文本生成图像方法。该方法能够根据文本和任意的空间条件生成一张同时满足文本描述和空间对齐的图像。具体来说,该发明解耦了图像生成过程中结构表示和外观表示,并设计了两个独立的引导分支:外观引导分支和结构引导分支。这两个分支通过分类器引导策略,引导生成过程朝着精准的表达文本中的外观内容的同时,与引导分支的输入结构高度对齐。另外,为了实现更好的结构一致性,本方法提出了一种多域引导策略,联合了空间域和频域实现更加全面的结构监督。本方法不仅能够实现任意空间条件引导的文本生成图像,还能够即插即用到各种生成式模型中,能够完成常见的下游任务,如:图像去模糊、图像上色、图像修复和图像编辑等。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 数字创意产业  数字文化创意活动 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||