| 专利号 | 2018106002456 | 申请日 | 2018-06-12 | 专利名称 | 基于跨模态的视频时刻定位方法、系统及存储介质 |
| 授权日 | 2019-06-18 | 专利权人 | 山东大学 | 发明人 | 刘萌;聂礼强;王翔;宋雪萌;甘甜;陈宝权 |
| 主分类号 | G06F16/783 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了基于跨模态的视频时刻定位方法、系统及存储介质,将其应用到视频中某一时刻片段的定位问题中,包括以下步骤:构建语言时序模型对有利于时刻定位的文本信息提取出来并进行特征提取;多模态融合模型融合文本‑视觉特征,生成强化的时刻表示特征;多层感知机模型用来预测时刻与文本描述的匹配程度以及时刻片段的起始时间;使用训练数据端到端的训练模型。本发明在基于文本查询的时刻定位问题上,准确率高于现有模型。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||