首页 | 本学科首页   官方微博 | 高级检索  
     检索      

超高维缺失响应数据的特征筛选
引用本文:邹丽英,刘祎.超高维缺失响应数据的特征筛选[J].中国海洋大学学报(自然科学版),2023(1):147-156.
作者姓名:邹丽英  刘祎
作者单位:中国海洋大学数学科学学院
基金项目:国家自然科学基金项目(11801567)资助~~;
摘    要:本文提出了一种解决超高维缺失响应数据的特征筛选的新方法。首先,通过插补技术,补全缺失响应变量值,构造插补响应变量与协变量分布函数之间的距离相关系数,以此作为筛选指标进行特征筛选。所提出的筛选方法具有以下优势:第一,它是一个非参数无模型假设的方法,可以处理变量间的非线性关系;第二,对协变量异常值稳健;第三,可以直接处理多维响应变量情形。然后,通过数值模拟展示了所提方法的性能与表现,并与现有的筛选方法进行了比较。最后,将所提方法应用于弥漫性大B细胞淋巴瘤的数据分析,分析结果表明基于该方法拟合后的模型具有更好的风险分离效果。

关 键 词:超高维数据  随机缺失  特征筛选  稳健距离相关  无模型假设
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号