| 专利号 | 2025109272442 | 申请日 | 2025-07-07 | 专利名称 | 一种基于深度学习的语音驱动3D数字人生成方法 |
| 授权日 | 2025-09-26 | 专利权人 | 山东女子学院 | 发明人 | 郭延辉;田睿;王勤芬;于谦 |
| 主分类号 | G06T13/20 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了一种基于深度学习的语音驱动3D数字人生成方法,涉及深度学习音频处理技术领域,包括以下步骤:步骤1:采集音频数据和对应的面部数据,并进行预处理;步骤2:利用预处理后的音频数据和面部数据对Meta Former模型进行训练,获得面部预测模型;步骤3:采集待转换音频并输入至面部预测模型,获得预测面部数据;步骤4:将预测面部数据通过客户端传输至UE5引擎,生成数字人。本发明能够实现语音驱动3D数字人嘴型数据预测,提高预测数据的通用性,以及数字人渲染效率。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 数字创意产业  数字文化创意活动 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||