| 专利号 | 2022111194289 | 申请日 | 2022-09-14 | 专利名称 | 一种基于自注意力机制的短语级文本图像生成方法及系统 |
| 授权日 | 2023-05-12 | 专利权人 | 山东财经大学 | 发明人 | 孙和玉;郭强;丛高翔 |
| 主分类号 | G06F16/33 | 关键词 | 应用领域 | ||
| 摘要 | 本发明属于文本图像生成领域,提供了一种基于自注意力机制的短语级文本图像生成方法及系统,包括利用自注意力机制对获取的文本指令描述进行编码,得到短语级文本表示;将短语级文本表示进行解码成像素图像特征表示,并根据像素图像特征表示生成目标视觉图像;对目标视觉图像和短语级文本表示进行跨模态一致性推理,判断目标视觉图像和短语级文本表示在语义空间的相似程度;根据目标视觉图像和短语级文本表示的相似程度得到跨模态一致性得分,根据跨模态一致性得分。本发明通过自注意力机制从多个角度聚合相关性强的单词,获得文本描述中的短语级指令表示,利用短语级指令表示能够更加清晰地理解用户的创作意图,确保生成图像的逻辑性和质量。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||