欢迎来到天天文库
浏览记录
ID:48302812
大小:39.51 KB
页数:1页
时间:2019-11-23
《实验一数据预处理实验指导书.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、实验一数据预处理实验【实验目的】掌握数据集缺失值、含噪数据的平滑处理、数据变换等预处理方法。【实验任务】读取UCI机器学习数据库中的CreditApproval数据集,利用Matlab软件编程对其中的缺失值、噪声进行处理,并对数据集进行变换等。【实验步骤】1、将原始数据集(文本文件格式)导入excel,将缺失值(?)用NaN替换,目标属性的“+”用1替换,“-”用2替换,并将其它非数值输入属性值用从你学号最后两位数字开始的相应数字替换,最后保存成文件“你的学号最后两位数字+姓名拼音file.xls”,为导入到Matlab软件
2、做准备。2、在Matlab中用xlsread函数读取“你的学号最后两位数字+姓名拼音file.xls”,得到数据矩阵data;3、利用Matlab软件对data中的缺失值进行处理,原来为连续性数值属性的缺失值用该属性值的均值填充(也可采用其他方法),原来为离散的分类属性的缺失值用该属性值的众数填充(也可采用其他方法);提取所有连续属性的属性值构成的子矩阵data1;4、选取一个连续的数值属性(对应data1的列号为你学号最后两位数字除以6所得的余数+1)叠加均值为0,标准差为你的学号最后两位数字除以6所得的余数+1的随机高斯
3、噪声,利用Matlab的smooth函数或smoothts函数进行含噪数据的平滑处理;5、对矩阵data1利用Matlab的zscore函数进行标准化变换和自己编程进行极差归一化变换;6、对实验进行总结,并按实验报告模板格式完成实验报告。
此文档下载收益归作者所有