基于反向传播(bp)算法的核保风险分析模型探讨

基于反向传播(bp)算法的核保风险分析模型探讨

ID:31431414

大小:103.50 KB

页数:4页

时间:2019-01-09

基于反向传播(bp)算法的核保风险分析模型探讨_第1页
基于反向传播(bp)算法的核保风险分析模型探讨_第2页
基于反向传播(bp)算法的核保风险分析模型探讨_第3页
基于反向传播(bp)算法的核保风险分析模型探讨_第4页
资源描述:

《基于反向传播(bp)算法的核保风险分析模型探讨》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于反向传播(BP)算法的核保风险分析模型探讨  摘要:以高血压疾病建立风险判别的模型为例,对投保人和其风险类别加以判断。在这一过程中我们选取一些相关性相对较强的因素,之后将项目数据库当做是风险判别模型建立的一个数据基础,此外还要使用反向传播的算法建立一个有效的模型。最后还要不断的对训练集的样本数进行适当的改变和调整,这样也就可以更好的对模型的精度进行有效的检验。模型和投保人患病判别的吻合程度达到了80%以上,所以在操作性上也存在着比较强的优势。本文主要探讨了基于反向传播(BP)算法的核保风险分析模型,以供参考和借鉴。  

2、关键词:高血压;反向传播方法;风险分析;判别模型  当前商业医疗保险当中对投保人的病情风险进行科学合理的判断成为了人们一直都非常关心和关注的问题。商业医疗保险本身赔付率比较高,同时在风险管理过程中也有很多的障碍和不足,所以我国的商业医疗保险一直都得不到很好的发展本文的研究中对某社区的一项富裕性疾病调查建立了数据库。首先是利用了Kendall的方法来挑出了和高血压患病相关性不是很强的因素。之后将这一项目数据库当中的所有记录当做是风险判别模型的数据集,采用反向传播算法完成模型的创建。最后采取有效的措施对训练的样本数进行一定的改

3、变和调整,这样就可以对模型的精确程度进行有效的检查。如果样本数达到了其总量要求的时候,模型对投保人患病判别的吻合率达到了80%以上。4  1数学模型  1.1Kendall相关性检验  在研究中,顺序变量(X,Y)完全按照离散分布进行处理,其样本观测数值会产生非常明显的数据重复现象,因此我们在研究的过程中通常采用的是Kendall完成统计工作。  1.2BP算法  BP算法通常就是应用在前馈多层网络的学习算法,前馈多层的网络结构也有其自身的特征。  其具有输入层、输出层和处于输入输出层的中间层。中间层有单层或者是多层。因为

4、它们和外界之间并不存在这非常密切的联系,所以也被人们叫做是隐层,在隐层中的神经元通常也被人们叫做隐单元。隐层和外界之间虽然并不存在这非常密切的联系,但是它运行的状态会对输入输出层之间的关系产生非常重大的影响。从某种角度上来说,它能够对多层的神经网络性能加以调整和改善。  反向传播算法通常分成两部进行,也就是正向传播和反向传播,其工作的流程如下:  首先是正向传播。输入样本从输入层会经过隐形单元对其进行逐层的处理。在经过了所有的隐形层之后就传给了输出层。在对其进行逐层处理的过程中,每一层的神经元状态只能对下一层神经元的状态产

5、生一定的影响。在输出层将现行输出和期望输出进行了全面的对比之后,如果现行的输出和期望的输出不相等,这个时候就要开展反向传播的过程。4  其次是反向传播。在反向传播的时候,将误差信号按照原有的正向传播路径进行反向的传播,同时还要对每一个隐层的每个神经元的权系数进行适当的调整,这样就可以使得误差信号降到最低的水平。  2研究项目  2.1相关性分析  采用专业的软件分别对十六个因子变量的Kendall统计值进行计算,同时在这一过程中还要按照相关的专业医学知识将0.1作为统计值的分界,选择出和高血压患病程度相关度比较高的前六个变

6、量,它们是高血压家族史、冠心病程度、年龄、BMI指标、高血脂程度和糖尿病的程度。  2.2BP算法判别方法  按照对风险因素的分析,从数据库中的32个字段当中选择出6个字段,同时还要在这一过程中和上文的留个变量相对应来建立本网络模型所需要的数据记录。  在软年当中用以下的命令来对网络结构进行构建:  也就是说这一神经网络输入层当中有6个结点。一层隐含层当中有13个结点,输出层当中有一个节点,它是高血压患病的实际情况。如果高血压严重的程度为1,2,3的时候,输出值为1的话就证明这个人患有高血压,如果高血压严重程度为0的时候,

7、输出值就是0,证明此人没有高血压病症。其中,PR是6列数据的基本数据值,在分析当中,我们需要将其当做是重要的基础进行判别和分析。  选取数据库中的17000条记录当做训练集,将上文提到的6个指标当作输入神经元,预期对应的高血压患者的病情当做是输出值对网络进行一定的处理,在软件当中主要通过以下的命令来实现这一功能。4  net=train(net,TX,TY)  其中,TX为17000条以高血压家族史、冠心病程度、年龄、BMI指数、高血脂程度以及糖尿病程度为字段的数据记录,TY为与TX对应的高血压患病情况。  最后是要选取数

8、据当中的另外1000条记录当成是测试集,使用训练之后的网络对其进行有效的判断,这样就可以对BP算法基础上的神经网络模型对疾病预测的效果进行检验。在对检验结果进行分析之后发现,这一模型对训练集的判别吻合率达到了80%以上,其精度也会随着训练集样本数的不断增加而有所提高。  结束语  在本文中主要采用了多元

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。