淄博市知识产权公共服务平台

导航
专利号 2020101954949 申请日 2020-03-19 专利名称 一种三代测序数据重叠检测方法及系统
授权日 2023-08-18 专利权人 山东大学 发明人 刘卫国;槐敏涵;产院东
主分类号 G16B30/10 关键词 应用领域
摘要 本发明提供了一种三代测序数据重叠检测方法及系统。其中,三代测序数据重叠检测方法,包括接收第三代测序数据的所有DNA序列,并根据长度对DNA序列进行排序;按照每个线程所处理的总DNA数据大小相等的策略,将所有DNA序列分配给预设数量的并行线程;对于每个线程,求取所有DNA序列各个窗口的哈希值最小的子序列并作为minimizer;将所有minimizer按照哈希值建立索引,构建出基于双数组结构的参考基因哈希索引表;所述参考基因哈希索引表分为两个数组,索引数组存放不同哈希值对应的minimizer在结构数组中存放的位置,结构数组存放minimizer的位置信息;根据基于双数组结构的参考基因哈希索引表进行DNA序列重叠检测。其能够提高测序数据重叠检测效率。
创新点
技术分类 标 签 战兴产业 生物产业    生物医学工程产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】