欢迎来到天天文库
浏览记录
ID:26243266
大小:50.50 KB
页数:4页
时间:2018-11-25
《基于web的cml化学结构搜索方法初探 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于Web的CML化学结构搜索方法初探【摘要】化学标记语言CML已得到广泛应用,目前L表示的化学结构信息,google、百度等L特点的基础上,介绍了提取与验证L表示的化学结构信息的方法。利用Daylight公司的THOR-Merlin化学信息数据库系统,提出一种化学结构搜索引擎的设计方案。 【关键词】化学标记语言化学结构检索化学结构数据库系统 1引言 化学标记语言CML(ChemicalMarkupLanguage)最初于1995年由PeterMurray-Rust等人基于HTML2.0开发,尝试解决在Inter上进行化学信息交换的问题。1998年2
2、月L:可扩展标记语言推荐标准1.0版。化学标记语言CML也根据XML的规范进行了更改和修订,成为根据XML的规范重新定义的一种标记语言,是XML的一个应用。 CML目前的应用已相当广泛,如MaterialsGrid、SPECTRA等项目都采用了CML,L表示的化学结构信息。由于化学学科的专业性和内容的相对独立性,目前化学信息的检索都是基于特定的数据库,如SciFinder、Chembank、ZINC、Pubchem、ChemDB、ChemMine等化学数据库。本文提出一种设计方案,将CML转换为SMILES,利用DayLight公司的THOR-MerLin系统,
3、建立针对L表示的化学结构的a对CML内容进行验证(CML1.x采用DTD)。第三步采用基于XSLT的验证方法,对CML的内容进行分析。比如可以通过XSLT来判断CML中的原子化合价是否合法,化合物中两个原子之间的距离是法合法等。2.3CML至SMILES的转换与SMILES的存储 SMILES是一种线性的用ASCII码来表示原子和化学键的化学语言。和其它化学结构表示方法相比,SMILES简短易读。同一种化学结构用SMILES来表示要比用连接表(ConnectionTable)节省50%至%70的存储空间。典范SMILES能够保证每个化学结构的SMILES具有唯一
4、性,因而常被作为化学数据库中的索引关键字。 CML到SMILES的转换,本设计采用开源软件OpenBabel提供的API函数。OBConversion为转换类,转换伪码如下: OBConversionconv(cin,cout); if(conv.SetInAndOutFormats(“SMI”,“MOL”)) {OBMolmol;if(conv.Read(mol))...manipulatemoleculeconv->L转换后的SMILES及CML所在的文档URL、当前访问时间等存入THOR数据库,并以SMILES作为记录的主关键字。本系统根据Da
5、ylight提供的THOR-MerlinToolkit来编写Client。Client通过server来对THOR数据库进行操作。 2.4用户界面设计初探 用户可以直接输入要检索的化学结构的SMILES码,或者根据提供的JME(JME是由PeterErtl开发的javaapplet,用于在网页上直接描绘化学结构)画出要检索的2D化学结构图,并指定结构检索的类型,JME会自动把用户画出的化学结构转化为SMILES码进行检索。 3总结 本文提出了一种化学结构搜索引擎的设计方案,针对L表示的化学结构进行检索。但是由于CML出现的时间相对比较晚,urray
6、-Rust,HSRzepa.ChemicalMarkup,XMLandtheurray-Rust,HSRzepa.ChemicalMarkup,XMLandtheLSchema.J.Chem.Inf.put.Sci,2003,43(3):757-772. 〔3〕GkoutosGV,RzepaHSandP.Murray-Rust.OnlinevalidationandparisonofmolfileandCMLmolecularatom-connectiondescriptors.InterJChem,2003,(1). 〔4〕J.Klekota,F.P.Rot
7、h,andS.L.Schreiber.QueryChem:aGoogle-poicalstructures.Bioinformatics,2006,22(13).
此文档下载收益归作者所有