校赛论文打印版

校赛论文打印版

ID:44437950

大小:810.46 KB

页数:37页

时间:2019-10-22

校赛论文打印版_第1页
校赛论文打印版_第2页
校赛论文打印版_第3页
校赛论文打印版_第4页
校赛论文打印版_第5页
资源描述:

《校赛论文打印版》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、参赛编号(由组委会填写)第八届数学建模竞赛论文论文题目:基于Bmyes和组合赋权法的乳腺癌病的判别分析(Q参赛队员:姓名学院学号专业组长张鹏飞数学与统计学院20111314021信息与计算科学队员土智伟数学与统计学院20111314006涪息与计算科学队员谢钊数学与统计学院20111314036涪息与计算科学二O—四年五月第八届数学建模竞赛论文题目:基于Bayes和组合赋权法的乳腺癌病的判别分析(B)摘要:本文主要基于Bayes判别分析和组合赋权赋权法,迺过对影响患乳腺癌病的指标进行分析研究来评估

2、一个人患乳腺癌风险高低。问题一:首先,对数据进行预先分析,找出单个指标与患乳腺癌病Z间的影响关系;然后基于事先的分析,我们通过组合赋权法,确定各个指标对于患乳腺癌病影响的大小即是权重大小,分析出重要指标;最后通过Bayes判别分析,把患病与不患病的人分为两类,综合考虑各个指标的综合影响,建立评佔模型。问题二:基于问题一的数学模型,我们首先计算出患乳腺癌的概率与不患乳腺癌的概率,再用回代法求出模型的误判率,给出患病风险的评估。问题三:分别计算加上变量11前后变量10的权重与变量10,11患乳腺癌风险

3、权重之和是否有变化,再求出变量之间的的相关系数,分析各变量之间的影响关系;最后通过聚类分析优化指标。问题四:基于我们所建立的评估模型,重点分析一些有关饮食的指标对于患乳腺癌病的影响,从而给出我们的预防建议。关键词:Bayes判别变异系数赋权Critic赋权回代法、相关系数参赛编号(由组委会填写)1、问题的重述乳腺是由皮肤、纤维组织、乳腺腺体和脂肪组成的,乳腺癌是发生在乳腺腺上皮组织的恶性肿瘤。乳腺癌中99%发生在女性,男性仅占1%。目前乳腺癌已成为威胁女性身心健康的常见肿瘤。全球乳腺癌发病率口20

4、世纪70年代末开始一直呈上升趋势。美国8名妇女一生屮就会冇1人患乳腺癌。屮国不是乳腺癌的高发国家,但不宜乐观,近年我国乳腺癌发病率的增长速度高出高发国家1〜2个百分点。据国家癌症屮心和卫生部疾病预防控制局2012年公布的2009年乳腺癌发病数据显示:全国肿瘤登记地区乳腺癌发病率位居女性恶性肿瘤的第1位,女性乳腺癌发病率(粗率)全国合计为42.55/10万,城市为51.91/10万,农村为23.12/10万。附件给出了美国关于乳腺癌的一项调查数据,调查样本为年龄在25-50岁之间的3145名女性,调

5、查信息包括年龄、贫怵I指标、家族史、饮食习惯等可能与乳腺癌相关的各项指标,共11列,具体如下:列变量备注1Breastcancerl=yes,0=no2Age/25年龄/253Povertyindexratio当年家庭总收入/贫困线基准收入4Bodymassindex/100身高体重指数为体重与身高的平方之比5Alcohol是否饮酒:1=yes,0=no6Familyhistory乳腺癌家族史:l=yes,()=no7Ageatmenarche初潮年龄:不超过12者为1,其余为08Menopaus

6、alstatus绝经状态:l=pre・,2=peri-,3=post-menopausal9Race种族:1=6人,2=其他10Saturatedfat/100摄入饱和脂肪量/10()11Calories/5000摄入卡路里>/5()()()其屮,第10和11列变量是饮食习惯变量,是被调查者冋忆出调查吋刻前24小时的进食情况,再推算而得。请回答以下问题:1、请结合附件数据(见文件dataset.xls),分析变量2至10与乳腺癌的关系,给出数学模聲2、念'于询*沧数学模型,对女性患乳腺癌风险进行评

7、估。3、冇文献指出,加入变量11时,会使得变量10对患乳腺癌风险彩响的显著性发生变化。请围绕这一现象展开探讨,分析各变量之间的影响关系。4、结合你的研究结果,给出一篇关于饮食健康与乳腺癌预防的建议报告。2、问题的分析从题目要求可以得知,目的就是建立评价模型,不进可以对所给出的数据进行判别是否患有乳腺癌,还能反映出指标的影响力的大小。由于给定的数据可分为2类,一类为患病人的数据,另一类为,没有患病的人的数据。对于问题一:首先,对数据进行预先分析,找岀各个指标与患乳腺癌病之间的影响关系,然后基于实现分

8、析,我们通过组合赋权法,确定各个指标对于患乳腺癌病影响的大小即是权重大小,分析出重要指标。最后通过Bayes理论国,综合考虑各个指标的综合影响,给岀整体影响的数学模型。对于问题二基于问题一的数学模型,我们计算出患乳腺癌的概率与不患乳腺癌的概率,若患病概率大于不患病概率则患乳腺癌风险较大,反Z,亦然。最后用回代法求出模型的误判率。再分析出一些重要指标。问题三:分别计算加上变量11前后变量10的权重与变量10,11患乳腺癌风险权重之和是否有变化,再求击变量之间的的相关系数,分析各变量之

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。