| 专利号 | 2023105235816 | 申请日 | 2023-05-11 | 专利名称 | 基于大规模视频语料库的弱监督视频片段定位方法及系统 |
| 授权日 | 2023-07-21 | 专利权人 | 山东建筑大学 | 发明人 | 聂秀山;谭智方;刘新锋;张立伟 |
| 主分类号 | G06F16/732 | 关键词 | 应用领域 | ||
| 摘要 | 本发明涉及视频数据识别技术领域,提出了一种基于大规模视频语料库的弱监督视频片段定位方法及系统,方法包括如下步骤:针对获取的训练数据集,采用自监督学习提取文本与视频间共同的语义信息,基于语义信息得到融合语义视频特征;针对融合语义视频特征以及对应的文本特征,采用弱监督方法的进行多尺度对比学习,确定视频特征与文本特征的空间映射关系并映射至度量空间中,得到训练后的度量空间;获取查询语句,在训练后的度量空间中搜索与查询语句相似的文本特征,将相似度最高的文本特征所对应的视频片段作为视频定位结果。本发明的定位方法能够实现从大规模视频数据库中直接准确快速的定位视频片段。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||