淄博市知识产权公共服务平台

导航
专利号 2021101446293 申请日 2021-02-02 专利名称 基于回归模型的数据清洗方法
授权日 2022-07-01 专利权人 中国人民解放军海军航空大学青岛校区 发明人 李洪烈;夏栋;王倩
主分类号 G06F16/215 关键词 应用领域
摘要 本发明公开的一种基于回归模型的数据清洗方法,所述数据清洗方法包括以下步骤:S1.首先,根据所采集参数性质确定宽规则的阀值范围,对采集的数据中明显错误、异常的野值进行粗识别清洗;S2.然后,根据任一时刻采样值动态阀值,对步骤S1处理后的数据进行基于回归模型的精细识别清洗;S3.最后,利用回归平滑模型对步骤S1、S2识别出的野值对应采集时刻的真实值进行估算并替换。本发明实现了大数据处理中的错误数据清洗,对于明显的野值采用阈值粗识别提高识别效率,对于不易发现的野值采用精细识别提高野值的识别精确度,同时采用回归平滑模型提高了野值估计值的准确性。
创新点
技术分类 标 签 战兴产业 新一代信息技术    下一代信息网络产业
运营方式 合作方式
联系人 联系电话 电子邮箱
详细说明
【关 闭】