uci数据库使用说明

uci数据库使用说明

ID:22685179

大小:45.50 KB

页数:6页

时间:2018-10-30

uci数据库使用说明_第1页
uci数据库使用说明_第2页
uci数据库使用说明_第3页
uci数据库使用说明_第4页
uci数据库使用说明_第5页
资源描述:

《uci数据库使用说明》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、UCI机器学习数据库使用说明(转)2011-04-2514:40UCI机器学习数据库的网址:http://archive.ics.uci.edu/ml/数据库不断更新至2010年,是所有学习人工智能都需要用到的数据库,是看文章、写论文、测试算法的必备工具。数据库种类涉及生活、工程、科学各个领域,记录数也是从少到多,最多达几十万条。UCI数据可以使用matlab的dlmread或textread读取,不过,需要先将不是数字的类别用数字,比如1/2/3等替换,否则读入不了数值,当字符了。UCI数据库使用说明转自:h

2、ttp://www.aiseminar.cn/bbs/thread-37-1-1.html此目录包含数据集和相关领域知识(后面以简短的列表形式进行的注释),这些数据已经或能用于评价学习算法。每个数据文件(*.data)包含以“属性-值”对形式描述的很多个体样本的记录。对应的*.info文件包含的大量的文档资料。(有些文件_generate_databases;他们不包含*.data文件。)作为数据集和领域知识的补充,在utilities目录里包含了一些在使用这一数据集时的有用资料。地址http://www.ic

3、s.uci.edu/~mlearn/MLRepository.html,这里的UCI数据集可以看作是通过web的远程拷贝。作为选择,这些数据同样可以通过ftp获得,ftp://ftp.ics.uci.edu.可是使用匿名登陆ftp。可以在pub/machine-learning-databases目录中找到。注意:UCI一直都在寻找可加入的新数据,这些数据将被写入incoming子目录中。希望您能贡献您的数据,并提供相应的文档。谢谢——贡献过程可以参考DOC-REQUIREMENTS文件。目前,多数数据使用下面

4、的格式:一个实例一行,没有空格,属性值之间使用逗号“,”隔开,并且缺少的值使用问号“?”表示。并请在做出您的贡献后提醒一下站点管理员:ml-repository@ics.uci.edu下面以UCI中IRIS为例介绍一下数据集:ucidatairis中有三个文件:Indexiris.datairis.namesindex为文件夹目录,列出了本文件夹里的所有文件,如iris中index的内容如下:Indexofiris18Mar1996105Index08Mar19934551iris.data30May1989

5、2604iris.namesiris.data为iris数据文件,内容如下:5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa……7.0,3.2,4.7,1.4,Iris-versicolor6.4,3.2,4.5,1.5,Iris-versicolor6.9,3.1,4.9,1.5,Iris-versicolor……6.3,3.3,6.0,2.5,Iris-virginica5.8,2.7,5.1,

6、1.9,Iris-virginica7.1,3.0,5.9,2.1,Iris-virginica……如上,属性直接以逗号隔开,中间没有空格(5.1,3.5,1.4,0.2,),最后一列为本行属性对应的值,即决策属性Iris-setosa。iris.names介绍了irir数据的一些相关信息,如数据标题、数据来源、以前使用情况、最近信息、实例数目、实例的属性等,如下所示部分:……7.AttributeInformation:1.sepallengthincm2.sepalwidthincm3.petallengt

7、hincm4.petalwidthincm5.class:--IrisSetosa--IrisVersicolour--IrisVirginica……9.ClassDistribution:33.3%foreachof3classes.本数据的使用实例请参考其他论文,或本站后面的内容。对应的英文有:ThisistheUCIRepositoryOfMachineLearningDatabasesandDomainTheories===========================================

8、=================================ThisistheUCIRepositoryOfMachineLearningDatabasesandDomainTheories4December1995ftp.ics.uci.edu:pub/machine-learning-databaseshttp://www.ics.uci.edu/~mlearn/MLRepo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。