面向多维特性数据的缺失值检测及填补方法对比
作者:
作者单位:

同济大学 电子与信息工程学院,上海 201804

作者简介:

乔 非(1967—),女,教授,博士生导师,工学博士,主要研究方向为智能生产系统。 E-mail: fqiao@tongji.edu.cn

通讯作者:

翟晓东(1993—),男,博士生,主要研究方向为大数据处理与分析。E-mail: xdzhai@tongji.edu.cn

中图分类号:

TP311.1

基金项目:

科技创新 2030“新一代人工智能”重大项目(2018AAA0101704);国家自然科学基金(62133011,61973237,61873191)


Comparison of Imputation Methods Based on Missing Value Detection for Multidimensional Feature Data
Author:
Affiliation:

College of Electronics and Information Engineering, Tongji University, Shanghai 201804, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对传统缺失值检测方法缺少对多维特性数据全面立体的分析及难以从众多缺失值填补算法中选择合适方法的问题,通过设计缺失值检测方法,在目前常见的数据点缺失度基础上,首次提出数据总体缺失度和加权数据总体缺失度的概念,实现对数据集缺失程度的全面检测,进而通过实验对比分析不同缺失值填补方法性能。实验结果表明,在不同缺失度的情况下,不同缺失值填补算法的性能不同,所提出的方法可为缺失值填补算法的选择提供有效依据。

    Abstract:

    Aiming at the problems that traditional missing value detection methods are not comprehensive enough to analyze the multidimensional feature data and it is difficult to select the most appropriate missing value algorithm among numerous methods, this paper first designs a missing value detection method and then proposes three different concepts of missing degree to achieve the comprehensive detection of the data with multidimensional features. On this basis, it compares and analyzes the performance of different missing value imputation methods. The results show that the proposed detection method can evaluate the data with multidimensional features effectively and provide basis for the selection of missing value imputation methods.

    参考文献
    相似文献
    引证文献
引用本文

乔非,翟晓东,王巧玲.面向多维特性数据的缺失值检测及填补方法对比[J].同济大学学报(自然科学版),2023,51(12):1972~1982

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-04-11
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2023-12-29
  • 出版日期:
文章二维码