| 专利号 | 2019103236536 | 申请日 | 2019-04-22 | 专利名称 | 一种建筑工程多模态双语平行语料库的构建方法 |
| 授权日 | 2022-01-21 | 专利权人 | 山东建筑大学 | 发明人 | 高金岭;张聪颖;王海峰;丁玫;鲍玉平;高吉云;张晓红;王薇 |
| 主分类号 | G06F16/36 | 关键词 | 应用领域 | ||
| 摘要 | 本发明属于数据处理技术领域,具体涉及一种建筑工程多模态双语平行语料库的构建方法;语料筛选、语料提取、校对、语料切分、对齐、去噪、得到平行语料库、语料库更新和扩容六个步骤;为建筑词汇提供了丰富的对比样本,检索出的词汇或句法的含义都是与建筑相关的,排除了一些无用的含义;为使用者提供数量巨大的双语对译样本,切分精细,精准度高,检索出的词汇或句法含义都是建筑相关的,排除了一些无用的含义,为使用者提供了数量巨大的建筑类双语对译样本。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 新一代信息技术  下一代信息网络产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||