| 专利号 | 2025118705113 | 申请日 | 2025-12-12 | 专利名称 | 多粒度多视角多任务的增量多语言文本识别方法及系统 |
| 授权日 | 2026-03-10 | 专利权人 | 山东大学 | 发明人 | 刘晓倩;许信顺;罗昕;陈振铎 |
| 主分类号 | G06F40/279 | 关键词 | 应用领域 | ||
| 摘要 | 本发明属于文本识别技术领域,提供了一种多粒度多视角多任务的增量多语言文本识别方法及系统,对于目标图像,利用预训练的特色识别器提取视觉特征和语义特征;进行字符和单词两个粒度的共享知识发现,确定共享实例,并定义相应的所属语言标签;利用语言适配器通过建模视觉特征和语义特征,分别预测字符和单词的所属语言得分,利用门控机制对视觉依赖和语义依赖进行动态加权,得到融合视觉和语义信息的全局所属语言得分,进而指导各个特色识别的协同协作,完成字符级别和单词级别的序列解码,实现多语言文本识别。本发明可以减轻增量学习过程中对旧语言知识的遗忘,从而提高文本识别器的持续学习能力。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  人工智能 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||