| 专利号 | 2020105125028 | 申请日 | 2020-06-08 | 专利名称 | 一种风格可控的图像文本实时翻译与转换方法 |
| 授权日 | 2023-11-28 | 专利权人 | 中国石油大学(华东) | 发明人 | 李昕;刘航源;王志宽;吕涵 |
| 主分类号 | G06F40/58 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了一种风格可控的图像文本实时翻译与转换方法,该方法包含:将场景图像作为输入;利用多层CNN网络进行特征提取,检测出图像文本的位置与形态信息。然后基于文本定位框擦除文本像素得到背景图像和掩膜,利用粗细两层基于编解码器结构的修复网络进行背景图像修复。同时将图像文本进行形态纠正与去风格化,得到普通字体图像文本;使用CRNN模型将图像文本进行识别,结合文本语义进行修正,按照需求进行翻译或转换。通过学习原文本的艺术风格对翻译文本进行风格化处理;输出文本转换风格可控的场景图像。本发明的方法能够从场景图像中解析出更多有价值的信息,显著增强了图像文本翻译转换时的信息保存程度。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  人工智能 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||