一种基于深度学习的语音驱动3D数字人生成方法

专利号	2025109272442	申请日	2025-07-07	专利名称	一种基于深度学习的语音驱动3D数字人生成方法
授权日	2025-09-26	专利权人	山东女子学院	发明人	郭延辉;田睿;王勤芬;于谦
主分类号	G06T13/20	关键词		应用领域
摘要	本发明公开了一种基于深度学习的语音驱动3D数字人生成方法，涉及深度学习音频处理技术领域，包括以下步骤：步骤1：采集音频数据和对应的面部数据，并进行预处理；步骤2：利用预处理后的音频数据和面部数据对Meta Former模型进行训练，获得面部预测模型；步骤3：采集待转换音频并输入至面部预测模型，获得预测面部数据；步骤4：将预测面部数据通过客户端传输至UE5引擎，生成数字人。本发明能够实现语音驱动3D数字人嘴型数据预测，提高预测数据的通用性，以及数字人渲染效率。
创新点
技术分类		标签		战兴产业	数字创意产业数字文化创意活动
运营方式				合作方式
联系人		联系电话		电子邮箱
详细说明