多粒度多视角多任务的增量多语言文本识别方法及系统

专利号	2025118705113	申请日	2025-12-12	专利名称	多粒度多视角多任务的增量多语言文本识别方法及系统
授权日	2026-03-10	专利权人	山东大学	发明人	刘晓倩;许信顺;罗昕;陈振铎
主分类号	G06F40/279	关键词		应用领域
摘要	本发明属于文本识别技术领域，提供了一种多粒度多视角多任务的增量多语言文本识别方法及系统，对于目标图像，利用预训练的特色识别器提取视觉特征和语义特征；进行字符和单词两个粒度的共享知识发现，确定共享实例，并定义相应的所属语言标签；利用语言适配器通过建模视觉特征和语义特征，分别预测字符和单词的所属语言得分，利用门控机制对视觉依赖和语义依赖进行动态加权，得到融合视觉和语义信息的全局所属语言得分，进而指导各个特色识别的协同协作，完成字符级别和单词级别的序列解码，实现多语言文本识别。本发明可以减轻增量学习过程中对旧语言知识的遗忘，从而提高文本识别器的持续学习能力。
创新点
技术分类		标签		战兴产业	新一代信息技术人工智能
运营方式				合作方式
联系人		联系电话		电子邮箱
详细说明