资源描述:
《基于word xml的多维自动抽取组件设计的开发与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、JDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJHUNANUNIVERSITY毕业设计(论文)设计(论文)题目:基于WordXML的多维论文自动抽取组件设计学生姓名张举学生学号20031610526专业班级软件工程2004级开发2班指导老师陈浩系主任(院长)林亚平2008年5月26日DFSGSJDFKGHERUHJKDHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFH
2、KLDSJ基于WordXML的多维论文自动抽取组件设计摘要多维科技论文是一种新式的科技论文,可以在科技论文创作平台帮助下,进行方便高效地编辑。较之传统论文,它拥有更丰富地表达方式,如音频、视频、动画、图片等。突破传统科技论文发表周期长、表达方式单一等诸多限制,实现作者、读者、编审人员的跨时空沟通和零距离管理。当前的科技论文发表主要是以传统的word格式的文档为主,格式要求严格细致。科技论文工作者往往要花费大量的时间和精力对论文的内容和格式进行修改。这个过程繁琐而低效。本论文研究如何将word文档导入到多维论文中,通过wordxml方法对word文档中的元素结构进行自动分析,
3、结合OfficeWord编程对象实现了对word文档中的标题、作者、email、关键字、正文、图片、音频、视频、动画等元素的自动抽取的相关方法,使用数据结构在多维论文平台中建立起树型结构,有序地表示元素,从而完成了word文档中各元素的识别,帮助论文工作者免除了大量的繁琐过程。设计程序时,还考虑到用户界面的友好性,将识别出的内容立即显示到界面。该组件使用officeword编程接口,可以作为独立的文件格式转换器使用,也可集成于多维论文创作平台,移植性强。下一步研究更多文档的xml结构,可以将多种格式的文档兼容,实现多种格式论文的导入多维论文。关键字:officeword二次
4、开发,xml,多维论文DFSGSJDFKGHERUHJKDHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJDesignofmulti-dimensionthesisabstractioncomponentbasedonWordXMLAuthor:JuZhangTutor:HaoChenAbstractMulti-dimensionscientificpaperisanewstylethesis,whichcanbeedi
5、tedeffectivelywiththehelpofscientificpapercompositionplatform.Comparedtotraditionalpaper,multi-dimensionscientificpaperownsricherpresentationmethods:audio,video,animation,picturesetc.breakthroughtherestrictionsoflongdeliverycircle,singlepresentationmethodsandimplementthezero-distantcommuni
6、cationandmanagementofauthor,reader,editor.Currentdeliveredscientificpapercanbecategorizedtotraditionalworddocumentandisformattedstrictly.Thepapercomposermustpayplentyoftimeandenergytomodifythecontentandformat.Thewholeprocessistediousandlowefficient.Thispaperfocusonhowtoimportworddocumentto
7、multi-dimensionplatform,andanalysiselementsofworddocumentbywordxmlautomaticallyandimplementtheautoelementsextractionoftitle,author,email,keywords,context,pictures,audio,video,animationetc.,buildthetree-typestructureofextractedelementswithrelativedatastructurea