淄博市知识产权公共服务平台

导航
专利号 2025118705113 申请日 2025-12-12 专利名称 多粒度多视角多任务的增量多语言文本识别方法及系统
授权日 2026-03-10 专利权人 山东大学 发明人 刘晓倩;许信顺;罗昕;陈振铎
主分类号 G06F40/279 关键词 应用领域
摘要 本发明属于文本识别技术领域,提供了一种多粒度多视角多任务的增量多语言文本识别方法及系统,对于目标图像,利用预训练的特色识别器提取视觉特征和语义特征;进行字符和单词两个粒度的共享知识发现,确定共享实例,并定义相应的所属语言标签;利用语言适配器通过建模视觉特征和语义特征,分别预测字符和单词的所属语言得分,利用门控机制对视觉依赖和语义依赖进行动态加权,得到融合视觉和语义信息的全局所属语言得分,进而指导各个特色识别的协同协作,完成字符级别和单词级别的序列解码,实现多语言文本识别。本发明可以减轻增量学习过程中对旧语言知识的遗忘,从而提高文本识别器的持续学习能力。
创新点
技术分类 标 签 战兴产业 新一代信息技术    人工智能
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】