欢迎来到天天文库
浏览记录
ID:53572103
大小:282.42 KB
页数:6页
时间:2020-04-19
《数据挖掘辅助定向合成(Ⅰ)具有特定孔道结构的微孔磷酸铝.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Vol.24高等学校化学学报No.62OO3年6月CHEMICALJOURNALOFCHINESEUNIVERSITIES949952数据挖掘辅助定向合成(1D具有特定孔道结构的微孔磷酸铝刘晓东1~徐翊华1~于吉红1~李乙1~曾伟1~陈超1~李激扬1~庞文琴1~徐如人1~XUYing2(1.吉林大学无机合成与制备化学国家重点实验室~长春13OO23;2.ProteinInformaticsGroupLifeScienceDivision~OakRidgeNationalLaboratory~TN3783
2、1-648O~USAD摘要采用决策树方法对微孔磷酸铝的合成反应数据库进行了数据挖掘研究~结果表明~有机胺模板剂的属性对特定孔道的生成起着至关重要的作用.进一步分析得到合成十二元环AlPO微孔磷酸铝的约束条4-5件~并从理论上预测出用于合成十二元环AlPO微孔磷酸铝的一系列新的有机胺模板剂.部分理论分析4-5结果得到了分子力学计算的有力支持~并被合成实验所验证.关键词数据挖掘;决策树;微孔磷酸铝;定向合成;模板剂中图分类号O613.62文献标识码A文章编号O251-O79O(2OO3DO6-O949-O4
3、微孔晶体化合物的定向设计与合成引起了人们极大的关注~微孔无机化合物的分子工程学研究已成为无机合成领域重要的前沿课题之一.Lewis等[1~2]描述了一个从头设计(cenoooD模板剂分子的方法~该模板分子可在想要的无机骨架中生长.Catlow等[3]通过在大范围内考察已知无机分子筛骨架中无机骨架和有机模板剂间的相互作用~研究了有机物种的相对模板效率~利用计算机模拟研究了在水热合成中的成核~生长和模板效应[4][5~6]自199O年开始~创建了无机微孔晶体合成反应.徐如人等数据库.迄今该数据库已收录了2O
4、O余种结构类型的有关合成反应文献数千篇~其中包括31OO套合成反应条件数据.但这些数据表面上看是杂乱无章的~例如AFI(由国际分子筛协会推荐的已知无机微孔物质骨架拓扑结构代码D是一个十二元环孔道的磷酸铝分子筛~它可以通过采用多种有机模板剂进行合成.另一方面~可以通过采用同一种模板剂合成出多种结构的磷酸铝分子筛.此外~有些文献中介绍的合成条件不很严格~如溶剂~温度等有时给出的范围过大~合成条件漏写等.因此~从数据库中很难直接得到有用的信息.类似这方面的工作~目前还没有国内外文献可供参考.本文尝试采用数据挖
5、掘中的决策树技术从数据库中抽取合成十二元环磷酸铝分子筛的指导信息~即在发现有机胺模板剂的属性对特定孔道的生成起着至关重要的作用后~根据约束条件在有机模板剂数据库中查找符合条件的模板剂~进一步采用分子力学计算模板剂与分子筛骨架的作用能~再根据能量分析~找到最有可能合成分子筛的模板剂~并通过合成实验进行验证.这一方法将为无机微孔晶体材料的定向合成研究开辟一条新的途径.1数据挖掘数据挖掘(DataminingD是从数据集中抽取和精化新的模式[7].尽管很早就出现了简单的数据统计技术~但先进的智能数据分析工具尚
6、未成熟.因此~在数据的生成和理解之间存在很大的差距.数据挖掘就是为解决这一矛盾而出现的一种新型数据分析技术.从1996年到2OO2年~美国专利和商标委员会数据库(USPATENTgTRADEMARKOFFICEDATABASED中通过数据挖掘专利1O1项~并收稿日期:2OO2-O9-18.基金项目:国家自然科学基金(批准号:2OOO1OO3D和国家重点基础研究发展规划基金(批准号:G2OOOO775O7D资助.联系人简介:徐如人(1932年出生D~男~教授~博士生导师~中国科学院院士~从事无机合成与制备
7、化学研究.E-mail:rrxumail.jlu.edu.cn950高等学校化学学报Vol.4出现了相当数量获得一定成功的数据挖掘产品和应用系统[8].数据挖掘目前的热点技术有查询工具~统计技术~可视化~K个最近邻法~决策树~关联规则~神经元网络和遗传算法等[9].自从1966年Hunr等开发出最早的决策树算法至今决策树算法在许多现实环境中得到了成功的应用它能从数据中自动创建决策树以一定的次序排列属性并给出取值范围从而用于分类~预测和总结规律.我们使用的C5.0决策树程序是在Guinlan的ID3(19
8、86)基础上改进和发展的.ID3算法引起人们兴趣的原因之一是它的数学基础.在ID3算法中属性排序以信息论中的熵概念作为理论基础熵原本是物理学的一个概念用以描述一个物理系统的无序性熵越大系统的无序程度越高.著名信息学家[10]将熵概念引进到信息论中用以描述一个随机实验的不确定性其定义是以X=PShannon1(1)P()Pn(n)表示一个随机实验其中Pz是试验结果值为z的概率.nH(P1PPn)=-PzlgPzz=1Shannon把H(P1P
此文档下载收益归作者所有