| 专利号 | 2024112851094 | 申请日 | 2024-09-13 | 专利名称 | 一种英语口语识别方法、系统、设备、介质及程序产品 |
| 授权日 | 2026-01-02 | 专利权人 | 山东大学 | 发明人 | 许信顺;郑文瑞;罗昕;陈振铎 |
| 主分类号 | G10L15/00 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开一种英语口语识别方法、系统、设备、介质及程序产品,涉及语音识别技术领域,包括:对音频特征提取时间特征和频率特征;对时间特征和频率特征通过维度变换并行计算时间维度和频率维度的依赖性,对时间依赖性特征和频率依赖性特征通过交叉注意力模块进行融合,采用三阶段编码器进行渐进式下采样处理,且第一阶段采用分组多头自注意力机制沿时间维度进行分组计算,最后经解码得到语音识别结果,关注语音特征的时频特性,提高模型计算效率。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||