淄博市知识产权公共服务平台

导航
专利号 2025109272442 申请日 2025-07-07 专利名称 一种基于深度学习的语音驱动3D数字人生成方法
授权日 2025-09-26 专利权人 山东女子学院 发明人 郭延辉;田睿;王勤芬;于谦
主分类号 G06T13/20 关键词 应用领域
摘要 本发明公开了一种基于深度学习的语音驱动3D数字人生成方法,涉及深度学习音频处理技术领域,包括以下步骤:步骤1:采集音频数据和对应的面部数据,并进行预处理;步骤2:利用预处理后的音频数据和面部数据对Meta Former模型进行训练,获得面部预测模型;步骤3:采集待转换音频并输入至面部预测模型,获得预测面部数据;步骤4:将预测面部数据通过客户端传输至UE5引擎,生成数字人。本发明能够实现语音驱动3D数字人嘴型数据预测,提高预测数据的通用性,以及数字人渲染效率。
创新点
技术分类 标 签 战兴产业 数字创意产业    数字文化创意活动
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】