错误发现率的非参数估计及其应用

错误发现率的非参数估计及其应用

ID:26845883

大小:1.58 MB

页数:79页

时间:2018-11-29

错误发现率的非参数估计及其应用_第1页
错误发现率的非参数估计及其应用_第2页
错误发现率的非参数估计及其应用_第3页
错误发现率的非参数估计及其应用_第4页
错误发现率的非参数估计及其应用_第5页
资源描述:

《错误发现率的非参数估计及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文错误发现率的非参数估计及其应用THENON-PARAMETRICESTMATIONOF FALSEDISCOVERYRATEANDITS APPLICATION李兵哈尔滨工业大学2014年6月万方数据国内图书分类号:O212.1学校代码:10213国际图书分类号:519.246密级:公开理学硕士学位论文错误发现率的非参数估计及其应用硕士研究生:李兵导师:田波平教授申请学位:理学硕士学科:概率论与数理统计所在单位:数学系答辩日期:2014年6月授予学位单位:哈尔滨工业大学万方数据ClassifiedIndex:O212.1U.D.C:519.246Disse

2、rtationfortheMasterDegreeinScienceTHENON-PARAMETRICESTMATIONOF FALSEDISCOVERYRATEANDITS APPLICATIONCandidate:LiBingSupervisor:Prof.TianBopingAcademicDegreeAppliedfor:MasterofScienceSpeciality:ProbabilityTheoryandMathematicalStatisticsAffiliation:DepartmentofMathematicsDateofDefence:June

3、,2014Degree-Conferring-Institution:HarbinInstituteofTechnology万方数据哈尔滨工业大学理学硕士学位论文摘要复杂数据主要表现在相依、非线性、维数高与不完全观测等,在股市、基因序列和经济等领域中经常出现。为解决巨型数据集合问题,数据挖掘的理论、方法和技术已应运而生。而针对诸如怎样同时检验成千上万个基因中哪些基因的表达水平有显著性差异之类的高维统计推断问题,以错误发现率为主要特征的估计方法无疑为其提供了一个有效的解决途径。本文主要研究错误发现率在各种参数模型和非参数模型下的控制检验方法,全文共分为四章。文章首先在多

4、重假设检验的背景下引入了错误发现率的定义,提出利用P值进行假设检验,并在检验统计量独立和相依的情形下对错误发现率的控制方法进行了探讨。在研究错误发现率的控制方法时,发现在处理多重假设检验问题时,核心的问题是估计真实零假设的个数,本文采用经验贝叶斯估计来估计它的值。在参数混合模型和非参数混合模型中研究真实零假设的估计问题是本文的核心内容。针对正态混合分布模型和Beta混合分布模型两种参数混合模型,文章采用矩估计方法和基于P值的最小二乘估计方法进行研究;在研究非参数混合模型时,分别介绍了最小二乘估计方法、Beta分布拟合模型和Bernstein多项式拟合模型的方法。文章的

5、最后以Hedenfalk报告的一组乳腺癌患者的基因数据为例进行仿真研究,发现错误发现率为微阵列数据的多重假设检验提供了合适的错误控制指标。关键词:错误发现率;多重假设检验;P值;微阵列数据;非参数估计-I-万方数据哈尔滨工业大学理学硕士学位论文AbstractComplexdataalwaysappearinthestockmarket,genesequences,economicandotherfields,whichmainlyshowthecharacteristicofdependent,nonlinear,highdimensionandincomplete

6、observations.Inordertosolvetheproblemofhugedatacollection,thetheories,methodsandtechniquesofdataminingareproposed.Whilehowtoexaminethehigh-dimensionalstatisticalinferenceproblem,suchasthesignificantdifferenceofexpressionlevelsinthousandsofgenes,theestimationoffalsediscoveryrateprovidean

7、effectivesolution.Thispapermainlyinvestigatethetestmethodbasedonthefalsediscoveryrateofvariousparametricmodelandnon-parametricmodel,whichisdividedintofourchapters.Firstly,thispaperdescribethedefinitionofthefalsediscoveryrateunderthebackgroundofmultiplehypothesestesting,proposeu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。