淄博市知识产权公共服务平台

导航
专利号 2024107325192 申请日 2024-06-07 专利名称 一种基于泛癌多组学数据的无监督特征选择方法
授权日 2024-10-01 专利权人 齐鲁工业大学(山东省科学院) 发明人 赵龙;司呈坤;刘娇;谌兆晖
主分类号 G16B40/30 关键词 应用领域
摘要 本发明涉及一种基于泛癌多组学数据的无监督特征选择方法,属于生物信息学领域,包括选择数据集及数据预处理;通过改进的谱聚类算法对S1得到的数据进行聚类,得到特征子集A;构建深度自动编码器,将S1得到的数据输入深度自动编码器得到特征子集B;对于特征子集B中的每一个特征,与特征子集A中所有特征计算Pearson相关系数,Pearson相关系数最高的特征Am作为结果,并在特征子集A中删除;评估最终得到的特征子集。本发明利用深度自动编码器指导的改进谱聚类无监督特征选择算法对未标记具体亚型的癌症样本做无监督特征选择,从中选择出对后续聚类分型有作用的重要基因特征,简化系统并提高亚型分类的准确性和可靠性。
创新点
技术分类 标 签 战兴产业 生物产业    生物医学工程产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】