基于中文自然语言查询的多媒体数据库检索系统

基于中文自然语言查询的多媒体数据库检索系统

ID:33232012

大小:1.90 MB

页数:67页

时间:2019-02-22

基于中文自然语言查询的多媒体数据库检索系统_第1页
基于中文自然语言查询的多媒体数据库检索系统_第2页
基于中文自然语言查询的多媒体数据库检索系统_第3页
基于中文自然语言查询的多媒体数据库检索系统_第4页
基于中文自然语言查询的多媒体数据库检索系统_第5页
资源描述:

《基于中文自然语言查询的多媒体数据库检索系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山东师范大学硕士学位论文基于中文自然语言查询的多媒体数据库检索系统姓名:刘浩一申请学位级别:硕士专业:教育技术学指导教师:孟祥增20060410基于中文自然语言查询的多媒体数据库检索系统摘要教育信息化对教师提出了新的要求,教师作为学习资源的管理者,要在教学过程中确定所需的媒体资源,并提供查询线索。虽然因特网蕴含了大量的多媒体信息,但现有的搜索引擎多数采用基于关键词的方法,检索多媒体的准确度比较低。对于中小学教师而言,日常教学工作繁忙,对计算机网络技术应用的熟练程度参差不齐,在多媒体资源的查找方面更需要方便快捷的系统来加以辅助。自然语言查询是指用户用自然语言在检索系统中对查询目

2、标进行描述,系统从查询文本中自动提取查询条件、查询目标的关键特征,按一定的规则和算法在数据库中查找满足条件的记录作为查询结果反馈给用户。基于中文自然语言查询的多媒体数据库检索主要包括三个过程:从中文查询文本中提取查询目标媒体的关键特征;从数据库中查找满足查询条件并且与查询目标媒体具有较大相似度的记录;将查找到的记录数据作为检索结果按照相似度大小排序提供给用户。论文研究了中文自然语言理解的特点和分词的一般方法,建立自用的分词系统,对查询文本进行分词和词性标注。从查询文本中去除虚词、设定的缺省词汇,即可得到对目标媒体的描述,称为主题内容。根据颜色词典从主题内容中提取颜色词,与用户

3、输入的颜色词合并后作为主色调颜色词;根据主体词词典和主体属性词典,从主题内容中进一步提取主体词和主体属性词;如果主题内容中有“背景是”或“背景为”两种旬式,可以提取背景词。计算相似度之前,主题内容要依据同义词词典进行扩展。论文中采用相似度来衡量查询目标媒体和数据库媒体之间的差距。媒体的特征包括文件属性和内容特征,相似度计算主要是针对媒体的内容特征。论文中为图像、视频、动画、音频四种类型的媒体建立了内容特征表示模型,对于不同的内容特征使用不同的相似度计算方法。通过比较扩展后的主题内容与数据库中内容描述字段相同词的个数来计算主题内容相似度:主色调颜色词转换为HSI模式,与数据库中

4、以数值方式标注的主色调字段进行色调相似度的计算;图像的主体与主体属性针对数据库中的主体字段计算相似度。所有的内容特征按照其所在层次确定重要性后,计算总相似度。按照总相似度的大小,将最相似的20个结果反馈给用户。论文在I:述1:作的基础上设计了基于中文自然语言‘查询的多媒体数据库检索系统。用户注册登录后在界面上输入中文自然语言查询文本,进行文件格式、文件大小、媒体类型的选择。系统自动提取主题内容、内容特征、计算相似度,将符合条件的记录数据按照相似度的大小反馈给用户,反馈的内容还包括文件大小、相似度大小、媒体所在网址等相关信息。初步实验结果表明,该系统对结构比较简单的、嵌套较少的

5、查询文本能比较准确的进行分词,提取主题内容、主题词和主体属性词。对数据库中内容特征标注准确、详实的记录,检索结果准确度较高,证明依据内容特征检索的方法是可行的。论文最后总结了本文的工作,并提出了下一步的研究方向。II【关键字】自然语言查询,多媒体数据库,检索,内容特征,相似度【分类号】G434ResearchOilMulti—mediaDatabaseRetrievaIBasingontheChineseNaturalLanguageABSTRACTTheinformationizationofeducationhasbroughtforwardnewreqnirements

6、forteachers.AsthesupervisorofthelearningTC$ODECCS,teachersaretofixthemediaresourcesthatareneeded,andprovidethequerycluesforstudents.Althoughthereareabundantmulti—mediaresourcesintheInteract,theexistentsearchingretrievalsaremainlybasedonthekeywords,whichsearchingaccuracyisnotsohigh.Teacherso

7、fmiddleandprimaryschoolsarcbusydoingtheirroutinejobs,andtheyarcvariousinapplyingthetechnologyofcomputernetwork.Therefore,theyneedaconvenientandfastsystemtosearchthemultimediaresources.Naturallanguagequerymeansthattheusersdescribethequeryobjectintheretrie

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。