欢迎来到天天文库
浏览记录
ID:6604339
大小:414.00 KB
页数:35页
时间:2018-01-20
《偏原子电荷的快速预测数学建模论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、2014河南大学第一届大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平
2、性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话)AS0209所属学校(请填写完整的全名):河南大学参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。)
3、日期:2014年6月2日赛区评阅编号(由赛区组委会评阅前进行编号):2014河南大学第一届大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):偏原子电荷的快速预测摘要本文讲述的就是寻找了一种方法,根据原子的拓扑指数使得能在最短的时间内较为准确的预测该原子的偏原子电荷的值。其中的创新点就是类比了模糊聚类分析里面定义相关系数的方法处理了如何从多个拓扑指数里面找到与单个拓扑指数最相似的那个。问题一,将用训练集中所给的数据进行
4、分组,然后根据每组数据建立一个函数模型,其次用平均数的方法求出能够代表本组拓扑指数的一个特征拓扑指数,最后用欧式距离法找到与待预测原子的拓扑指数最相似的那个特征拓扑指数,并找出该特征拓扑指数所对应的函数模型,将待预测的拓扑指数带入其中便得到它的偏原子电荷的值。问题二,将第一问中得出的偏原子电荷,与实际的偏原子电荷进行比对,利用定义的夹角余弦法计算出两者之间的相似度,发现该模型对于训练集中的数据误差大于测试集中的数据的误差。对此我们也做了两幅图直观将结果展示出来。问题三,计算预测速度,预测速度也是一个模型的的重要衡量标尺,由此计算建立出来的模型在处理一组数据时需要3秒左右,具
5、有很快的计算速度。关键词:拓扑指数、函数模型、特征拓扑指数、模糊聚类分析、欧式距离、夹角余弦、评价、快速-32-一、问题重述偏原子电荷与原子的很多性质密切相关,例如化学位移,因而是科学研究中一个很重要的基础数据。该数值不能够直接由实验测定,而是由量化方法计算,其中一种重要的方法是NBO(NaturalBondOrbital)。但是,量化计算方法耗时太长,不能作为化学信息学软件(例如chemoffice)的插件,难以为广大用户使用。基于此,生成一个有商业竞争力的插件是十分必要的,建立数学模型是其中重要的一步。请完成下面三个问题:(1)根据训练集中的数据,建立偏原子电荷的数学模
6、型,以此预测未知原子的偏原子电荷;(2)建立的模型需要采用训练集和测试集的数据进行评价,给出具体的评价方法(例如:相关系数(R2)、均方根差(RMSE))与结果;(3)预测速度也是评价模型的重要标准。因而请给出:用所建立的模型预测测试集中全部原子的偏原子电荷所需的时间。提供的数据(H.rar文件):train.txt是训练数据集,test.txt是测试数据集。每行代表一个原子的拓扑指数(第1~136列元素)和该原子的偏原子电荷(第137列)。二、问题分析该问题的核心就是基于原有的数据,如何用数学模型建立起偏原电子与该原子的拓扑指数的关系,并且能达到任给一组拓扑指数,用所建的
7、模型快速预测出其偏原子电荷的效果。对此分了几个步骤做。(1)首先,对全部数据按照偏原电子数进行从大到小的排列,并根据偏原电子数进行适当的划分,共分得52组,每组数据建立一个线性方程组,解得解后用每组解建立一个函数共得到52个函数。(2)然后,再建立一个简单模型整合出每组中所有拓扑指数的一个代表(就是能够代表这组拓扑指数的特征数,在这里我们称它为特征拓扑指数)。(3)求出所要预测的原子的拓扑指数与每组特征拓扑指数的相似度(这里我们人为定义了一个近似度的计算方法),求出最大相似度所对应的那个特征拓扑指数。(4)最后将所
此文档下载收益归作者所有