| 专利号 | 2020101954949 | 申请日 | 2020-03-19 | 专利名称 | 一种三代测序数据重叠检测方法及系统 |
| 授权日 | 2023-08-18 | 专利权人 | 山东大学 | 发明人 | 刘卫国;槐敏涵;产院东 |
| 主分类号 | G16B30/10 | 关键词 | 应用领域 | ||
| 摘要 | 本发明提供了一种三代测序数据重叠检测方法及系统。其中,三代测序数据重叠检测方法,包括接收第三代测序数据的所有DNA序列,并根据长度对DNA序列进行排序;按照每个线程所处理的总DNA数据大小相等的策略,将所有DNA序列分配给预设数量的并行线程;对于每个线程,求取所有DNA序列各个窗口的哈希值最小的子序列并作为minimizer;将所有minimizer按照哈希值建立索引,构建出基于双数组结构的参考基因哈希索引表;所述参考基因哈希索引表分为两个数组,索引数组存放不同哈希值对应的minimizer在结构数组中存放的位置,结构数组存放minimizer的位置信息;根据基于双数组结构的参考基因哈希索引表进行DNA序列重叠检测。其能够提高测序数据重叠检测效率。 | ||||
| 创新点 | |||||
| 技术分类 | 标 签 | 战兴产业 | 生物产业  生物医学工程产业 | ||
| 运营方式 | 合作方式 | ||||
| 联系人 | 联系电话 | 电子邮箱 | |||
| 详细说明 | |||||