数学建模中的统计分析问题(样本比较

数学建模中的统计分析问题(样本比较

ID:41707854

大小:150.68 KB

页数:20页

时间:2019-08-30

数学建模中的统计分析问题(样本比较_第1页
数学建模中的统计分析问题(样本比较_第2页
数学建模中的统计分析问题(样本比较_第3页
数学建模中的统计分析问题(样本比较_第4页
数学建模中的统计分析问题(样本比较_第5页
资源描述:

《数学建模中的统计分析问题(样本比较》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):白血病临床治疗的统计分析问题摘要问题重述为研究某药物6-MP是否有治疗以缓解病痛的作用,研究者在持续1年的急性口血病治疗的临床试验屮,将42位急性口血病患者(进入项FI的时间有先后)随机地分成两组(各21人)。对一组病人用药物6-MP治疗以缓解病痛,而另一组病人用安慰剂。安慰剂的外形和颜色与药物完全相同,但不含任何药物,病人自己并不知道实际服用的是药物

2、还是安慰剂。研究者记录下每个病人病痛缓解的持续吋间(以周为单位),持续吋间越长则疗效越好。数据见表1。表一:处理组和控制组各21人的病痛缓解的持续时间(周)处理组(使用6-MP)21人6,6,6,7,10,13,16,22,23,6+,9+,10+,11+,17+19+,20+,25+,32+,32+,34+,35+,控制组(使用安慰剂)21人I,1,2,2,3,4,4,5,5,8,8,8,8,11,II,12,12,15,17,22,23表1数据后面有+者表示,当项目结束时缓解仍在持续。例如,处理组中的20+表示:该病人在项目结束前20小

3、时进入临床治疗,使用6-MP后,缓解持续到项目结束。因此,该病人的实际缓解持续吋间至少为20周,很可能人于20周。这种数据在统计学屮称为删失数据。我们需要回答的问题是:问题1.6TIP能否显著延长缓解的持续时间?问题2.如果问题一不能得到肯定的回答,则对该药物没有必要进一步研究;反之,如果结论是肯定的,预测以后的病人在使用6-MP后的缓解持续时间的有关参数,对6-MP的效果给出有足够置信度的量化评估。二、模型假设1.假设在项目期间的食物,生存环境,其他药物等外界因素对6-MP药效及病人病痫无影响;2.假设在项目期间各个阶段病人的6-MP药物

4、服用量充足,治疗方式恰当;3.假设在项目期间无其他病痛误判,粗心等原因引起数据记录失误;4.假设对同一个病人使用药物的效果始终一样;5.假设每个病人的身体、精神素质都是相当的,不会因此而使药物的效果变化;6.假设病人自己并不知道实际服用的是药物还是安慰剂;7.假设病人的年龄、性别对试验无影响;8.假设两组病人是随机分配的。三、符号说明及其概念解释3.1符号说明3.2概念解释生存时间:疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短。所经历的时间称为生存时间。完全与不完全数据:一部分研究对象可观察到死亡,从而得

5、到准确的生存时间,所提供的信息是完全的,称为完全数据;另一部分病人由于失访、意外事故、或到观察结束时仍存活等原因,无法知道确切的牛存时间,它提供了不完全的信息,称为不完全数据(截尾数据、删失数据)。生存分析:生存时间一般是通过随访收集。不完全数据提供了部分信息。须要用专门的方法进行统计处理,这类统计方法起源于对寿命资料的统计分析,故称为生存分析。死亡概率:指已活满t时刻的个体,在此后一段时期内(t至r+h)死亡的可能性。生存概率:表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小。Ul问题分析本文研究者在持续1年的急性白血病治

6、疗的临床试验中,对42位急性白血病患者随机均等地分成两组,一组病人用药物6-MP治疗以缓解病痛,而另一组病人用安慰剂。通过对两组病人病痛缓解的持续时间进行对照比较分析,从而研究某药物6-MP是否有治疗以缓解病痛的作用。此问题可以转化为生存分析问题,即每个病人的缓解时间可以看每个成个体的寿命,从而可以采用生存分析的相关知识对问题进行分析求解。由已知可知,每个病人进入项目试验的先后顺序不同,缓解病痛的时效也不同(如图一所示)。始占歿占图一:病人的缓解持续时间通过对表1数据的分析,我们发现有些数据后面有+者表示,当项FI结束时缓解仍在持续,这种数

7、据在统计学中称为删失数据,又称截尾数据和不完全数据。对于这类数据的处理,如果我们丢弄删失数据只考虑确切数据,则会损失大量的信息;若将删失数据当作确切数据处理,则会低估了牛存时间的平均水平。用统讣学的术语,白血病缓解效果的分析是一个“两样本比较”问题,--般用两正态样本均值比较的t检验。但现在由于样本分布未知,而且在时间数据的分析中,由于数据分布有很大的偏度,正态分布是一个“坏”的模型。又因为数据是不完全的(有删失数据),常规的、用于完全数据的分析方法不能简单套用。所以我们引入生存分析这一概念对木文进行分析求解。生存时间经常服从的基线分布有指

8、数分布、Weibull分布、对数正态分布、对数logistic分布和Gmnma分布。由于缓解持续时间不长,因此年龄、体质等可能影响缓解持续时间的因素作用不大,可以认为在任何时刻缓

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。