淄博市知识产权公共服务平台

导航
专利号 2020105125028 申请日 2020-06-08 专利名称 一种风格可控的图像文本实时翻译与转换方法
授权日 2023-11-28 专利权人 中国石油大学(华东) 发明人 李昕;刘航源;王志宽;吕涵
主分类号 G06F40/58 关键词 应用领域
摘要 本发明公开了一种风格可控的图像文本实时翻译与转换方法,该方法包含:将场景图像作为输入;利用多层CNN网络进行特征提取,检测出图像文本的位置与形态信息。然后基于文本定位框擦除文本像素得到背景图像和掩膜,利用粗细两层基于编解码器结构的修复网络进行背景图像修复。同时将图像文本进行形态纠正与去风格化,得到普通字体图像文本;使用CRNN模型将图像文本进行识别,结合文本语义进行修正,按照需求进行翻译或转换。通过学习原文本的艺术风格对翻译文本进行风格化处理;输出文本转换风格可控的场景图像。本发明的方法能够从场景图像中解析出更多有价值的信息,显著增强了图像文本翻译转换时的信息保存程度。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】