资源描述:
《Python统计学包scipy.stats手册.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Statistics(scipy.stats)Statistics(scipy.stats)1介绍1随机变量2获得帮助2通用方法4位移与缩放6形态参数8冻结分布9广播10离散分布的特殊之处11分布拟合13性能问题与注意事项13遗留问题13构造具体的分布14创建一个连续分布,继承rv_continuous类14继承rv_discrete类16样本分析21描述统计21T检验和KS检验23分布尾部25正态分布的特殊检验28比较两个样本29均值30对于两个不同的样本进行的KS检验30核密度估计31单元估计31
2、多元估计40介绍在这个教程我们讨论一部分scipy.stats模块的特性。这里我们的意图是提供给使用者一个关于这个包的实用性知识。我们推荐referencemanual来介绍更多的细节。注意:这个文档还在发展中。随机变量有一些通用的概率分布类被封装在continuousrandomvariables以及discreterandomvariables中。有80多个连续性随机变量(RVs)以及10余个离散随机变量已经用这些类建立。同样,新的程序和分布可以被用户新建(如果你构造了一个,请提供它给我们帮助发展
3、这个包)。所有统计函数被放在子包scipy.stats中,且有这些函数的一个几乎完整的列表可以使用info(stats)获得。这个列表里的随机变量也可以从stats子包的docstring中获得介绍。在接下来的讨论中,我们着重于连续性随机变量(RVs)。几乎所有离散变量也符合下面的讨论,但是我们也要指出一些区别在“离散分布的特殊之处”中。获得帮助所有分布可以使用help函数得到解释。为获得这些信息只需要使用像这样的简单调用:>>>>>>fromscipyimportstats>>>fromscipy.
4、statsimportnorm>>>printnorm.__doc__作为例子,我们用这种方式找分布的上下界>>>>>>print'boundsofdistributionlower:%s,upper:%s'%(norm.a,norm.b)boundsofdistributionlower:-inf,upper:inf我们可以通过调用dir(norm)来获得关于这个(正态)分布的所有方法和属性。应该看到,一些方法是私有方法尽管其并没有以名称表示出来(比如它们前面没有以下划线开头),比如veccdf就只
5、用于内部计算(试图使用那些方法将引发警告,因为它们可能会在后续开发中被移除)为了获得真正的主要方法,我们列举冻结分布的方法(我们将在下文解释何谓“冻结分布”)>>>>>>rv=norm()>>>dir(rv)#reformatted['__class__','__delattr__','__dict__','__doc__','__getattribute__','__hash__','__init__','__module__','__new__','__reduce__','__reduce_ex
6、__','__repr__','__setattr__','__str__','__weakref__','args','cdf','dist','entropy','isf','kwds','moment','pdf','pmf','ppf','rvs','sf','stats']最后,我们能通过内省获得所有的可用分布的信息。>>>>>>importwarnings>>>warnings.simplefilter('ignore',DeprecationWarning)>>>dist_continu
7、=[dfordindir(stats)if...isinstance(getattr(stats,d),stats.rv_continuous)]>>>dist_discrete=[dfordindir(stats)if...isinstance(getattr(stats,d),stats.rv_discrete)]>>>print'numberofcontinuousdistributions:',len(dist_continu)numberofcontinuousdistributions:8
8、4>>>print'numberofdiscretedistributions:',len(dist_discrete)numberofdiscretedistributions:12通用方法连续随机变量的主要公共方法如下:·rvs:随机变量(就是从这个分布中抽一些样本)·pdf:概率密度函数。·cdf:累计分布函数·sf:残存函数(1-CDF)·ppf:分位点函数(CDF的逆)·isf:逆残存函数(sf的逆)·stats:返回均值,方差,(费舍尔)偏态