基于web的cml化学结构搜索方法初探

基于web的cml化学结构搜索方法初探

ID:26243266

大小:50.50 KB

页数:4页

时间:2018-11-25

基于web的cml化学结构搜索方法初探  _第1页
基于web的cml化学结构搜索方法初探  _第2页
基于web的cml化学结构搜索方法初探  _第3页
基于web的cml化学结构搜索方法初探  _第4页
资源描述:

《基于web的cml化学结构搜索方法初探 》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于Web的CML化学结构搜索方法初探【摘要】化学标记语言CML已得到广泛应用,目前L表示的化学结构信息,google、百度等L特点的基础上,介绍了提取与验证L表示的化学结构信息的方法。利用Daylight公司的THOR-Merlin化学信息数据库系统,提出一种化学结构搜索引擎的设计方案。  【关键词】化学标记语言化学结构检索化学结构数据库系统    1引言    化学标记语言CML(ChemicalMarkupLanguage)最初于1995年由PeterMurray-Rust等人基于HTML2.0开发,尝试解决在Inter上进行化学信息交换的问题。1998年2

2、月L:可扩展标记语言推荐标准1.0版。化学标记语言CML也根据XML的规范进行了更改和修订,成为根据XML的规范重新定义的一种标记语言,是XML的一个应用。  CML目前的应用已相当广泛,如MaterialsGrid、SPECTRA等项目都采用了CML,L表示的化学结构信息。由于化学学科的专业性和内容的相对独立性,目前化学信息的检索都是基于特定的数据库,如SciFinder、Chembank、ZINC、Pubchem、ChemDB、ChemMine等化学数据库。本文提出一种设计方案,将CML转换为SMILES,利用DayLight公司的THOR-MerLin系统,

3、建立针对L表示的化学结构的a对CML内容进行验证(CML1.x采用DTD)。第三步采用基于XSLT的验证方法,对CML的内容进行分析。比如可以通过XSLT来判断CML中的原子化合价是否合法,化合物中两个原子之间的距离是法合法等。2.3CML至SMILES的转换与SMILES的存储  SMILES是一种线性的用ASCII码来表示原子和化学键的化学语言。和其它化学结构表示方法相比,SMILES简短易读。同一种化学结构用SMILES来表示要比用连接表(ConnectionTable)节省50%至%70的存储空间。典范SMILES能够保证每个化学结构的SMILES具有唯一

4、性,因而常被作为化学数据库中的索引关键字。  CML到SMILES的转换,本设计采用开源软件OpenBabel提供的API函数。OBConversion为转换类,转换伪码如下:  OBConversionconv(cin,cout);  if(conv.SetInAndOutFormats(“SMI”,“MOL”))  {OBMolmol;if(conv.Read(mol))...manipulatemoleculeconv->L转换后的SMILES及CML所在的文档URL、当前访问时间等存入THOR数据库,并以SMILES作为记录的主关键字。本系统根据Da

5、ylight提供的THOR-MerlinToolkit来编写Client。Client通过server来对THOR数据库进行操作。  2.4用户界面设计初探  用户可以直接输入要检索的化学结构的SMILES码,或者根据提供的JME(JME是由PeterErtl开发的javaapplet,用于在网页上直接描绘化学结构)画出要检索的2D化学结构图,并指定结构检索的类型,JME会自动把用户画出的化学结构转化为SMILES码进行检索。    3总结    本文提出了一种化学结构搜索引擎的设计方案,针对L表示的化学结构进行检索。但是由于CML出现的时间相对比较晚,urray

6、-Rust,HSRzepa.ChemicalMarkup,XMLandtheurray-Rust,HSRzepa.ChemicalMarkup,XMLandtheLSchema.J.Chem.Inf.put.Sci,2003,43(3):757-772.  〔3〕GkoutosGV,RzepaHSandP.Murray-Rust.OnlinevalidationandparisonofmolfileandCMLmolecularatom-connectiondescriptors.InterJChem,2003,(1).  〔4〕J.Klekota,F.P.Rot

7、h,andS.L.Schreiber.QueryChem:aGoogle-poicalstructures.Bioinformatics,2006,22(13).

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。