资源描述:
《R数据分析——方法与案例详解(双色)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Яࠔእ̮వ˺௧ʷవPឦᝓѬᄊК᫃ஔెὊ॰ऀຒᤉnjງКูѣὊඈ˔ᅼគགࡊ᧚̰ࠄᬅᄊऄၹವΓѣԧὊ̿᫈ᮥ˞ՔὊښᝍх᫈ᮥ˗ߦ˸ፒᝠவขnjPឦᝓᄊ۳వΎၹ̿ԣᎄሮࢼǍవ˺ЯࠔᄦPፇnjѦ״͖ӑnjચನവલnjፒᝠѬnjϜೝᰎnjڀॆѬnjፒᝠፋڏPӊͻЯࠔǍవ˺ᄊࠀͯ௧˞ˊႍѬ̡րnjፃเኮေዝnjӞߦᄊߦၷଢΙவขሮऀʽᄊԠᏦὊښиͻሮ˗ࡊ᧚ѻԝඋᣗေᄊߦԔေὊᤈನᑟܵࣟҰ឴Ꮸᣐʽߦ˸ǍళፃԻἻˀ४̿͊͵வरܭੋᜃవ˺˨ᦊѬੋЛᦊЯࠔǍྠిਫ਼దἻΦిॹቃǍښ˺ڏྠᎄᄬἷAGNἸPѬவข״ವΓហᝍ-வӗӯὊస
2、थࣱὊކՁᮻᎄᗃ,şӒ̛ႃߕࢺˊѣྠᇫὊ0./3,0GQ@L756+5+/0/+0307.+5Ĉ,ŀP¯Ę,ŀவ¯Łస¯łކ¯ę,ŀሮऀឦᝓὋሮऀᝠὋஔెċ,ŀRN1/0˗ڎྠవڏ˺ᯞAGNߚ0./2ኄ1.3252Ղ᠊͊ᎄᣤसథᖱӿNjNjʼෲ࣊ԥӿᜉᝡదᬍНՃᜉNjNjᝡʼෲ࣊ԥӿᜉᝡదᬍНՃѣྠԧᛡႃߕࢺˊѣྠᇫӒ̛࣊๒ӝʺ/51ηኸNjᥫᎄ/...14नNjNjవ565Ñ76./-/4NjNjӿस02,3ߚ361ӢߚྠNjNj0./3ࣲ0థኄ/ྠӿNjNj
3、0./3ࣲ0థኄ/ӿࠀNjNj͉47,..Ћјਫ਼᠔˼ႃߕࢺˊѣྠᇫڏ˺దᎥ૯᫈ᮥὊឰՔ᠔˼˺इូ૱Ǎᔪ˺इᎥὊឰ״వᇫԧᛡᦊᐏጇὊᐏጇԣᥫ᠔ႃភ./.66032666Ǎ᠏᧚આងឰԧᥫ͈ᒰxjrq>nfcg,amk,alὊᄧྠΦిˡઑឰԧᥫ͈ᒰb`oo>nfcg,amk,alǍҬབྷጳ./.66036666Ǎ第4章随机数与抽样模拟我们在做数据分析时,往往需要用到随机数与抽样模拟,这些在R语言环境下都能够轻松实现,因为R内部自带了大量的相关工具和方法。4.1 一元随机数的产生4.1.1 均匀分布随机数均匀分布随机数是最简单的随机数,也是其
4、他分布随机数的基础。R语言生成均匀分布随机数的函数是runif(),其句法是:runif(n,min=0,max=1)n表示生成的随机数数量,min表示均匀分布的下限,max表示均匀分布的上限,若省略参数min、max,则默认生成[0,1]上的均匀分布随机数。例如:>runif(3,1,3)#生成3个[1,3]的均匀分布的随机数[1]1.2041.3592.653>runif(5)#默认生成5个[0,1]上的均匀分布的随机数[1]0.27840.77550.41070.83920.7455书籍2.indb542015/1/2814:32:42第4章
5、 随机数与抽样模拟 55R提供了多种随机数生成器(randomnumbergenerators,RNG),默认采用Mersennetwister方法产生随机数,该方法是由MakotoMatsumoto和TakujiNishimura于1997年提出的一种随机数19937生成器,其循环周期是21−。R里面还提供了Wichmann-Hill、Marsaglia-Multicarry、Su-per-Duper、Knuth-TAOCP-2002、Knuth-TAOCP和L'Ecuyer-CMRG等几种随机数生成方法,用RNGkind()函数更改。例如要改
6、为Wichmann-Hill方法:RNGkind(kind="Wich")runif()默认每次生成的随机数是不一样的,有时我们在做模拟时,为了比较不同的方法,就要求生成的随机数都一样,即重复生成同样的随机数,这时候可以使用set.seed()设定随机数种子,其参数为整数。>set.seed(1)#种子取一样,生成的随机数相同>runif(5)[1]0.26550870.37212390.57285340.90820780.2016819接下来,检验一下runif()生成的随机数的性质。通过直方图和散点图以及自相关系数图来检验独立同分布。从图4-1
7、可以看出,基本上满足独立同分布性质。>Nsim=10^3>x=runif(Nsim)>x1=x[-Nsim]#因为要求自相关系数,去掉最后一个数>x2=x[-1]#去掉第一个数>par(mfrow=c(1,3))>hist(x,prob=T,col=gray(0.3),main="uniformon[0,1]")#直方图>curve(dunif(x,0,1),add=T,col="red")#添加均匀分布密度函数线>plot(x1,x2,col="red")>acf(x)#画自相关系数图图4-1 模拟均匀分布曲线图书籍2.indb552015/1/
8、2814:32:4256 R数据分析——方法与案例详解4.1.2 正态分布随机数正态分布是古典统计学的核心,它涉及两个参