| 专利号 | 2019102780941 | 申请日 | 2019-04-09 | 专利名称 | 一种从视频字幕中提取概念词的方法 |
| 授权日 | 2021-04-13 | 专利权人 | 山东科技大学 | 发明人 | 赵中英;杨永浩;周慧;李超 |
| 主分类号 | G06F16/483 | 关键词 | 应用领域 | ||
| 摘要 | 本发明公开了一种从视频字幕中提取概念词的方法,其包括如下步骤:对字幕文本进行分词处理,并删除标点符号;对分词后的字幕文本进行停止词和词性标注;计算目标单词和相邻词的共现特征;计算目标单词和相邻词的语义相似度;对分词后的少量字幕文本进行概念词标记,作为训练集;根据所述训练集对预先建立的基于条件随机场的半监督学习框架进行训练,得到概念词预测模型,并获取所述概念词预测模型输出的字幕文本对应的概念词预测结果。基于本发明提供的提取概念词的方法,减轻了人工标注语料的工作量,提升了在MOOC视频字幕场景中提取概念词的准确性,并满足了实际需求。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||