非结构化数据本体及相关算法研究

非结构化数据本体及相关算法研究

ID:33324086

大小:3.09 MB

页数:59页

时间:2019-02-24

非结构化数据本体及相关算法研究_第1页
非结构化数据本体及相关算法研究_第2页
非结构化数据本体及相关算法研究_第3页
非结构化数据本体及相关算法研究_第4页
非结构化数据本体及相关算法研究_第5页
资源描述:

《非结构化数据本体及相关算法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据分类号卫兰窆!:!UDC硕士学位论文非结构化数据本体及相关算法研究刘仙伟学科专业让篡扭廑旦撞苤指导教师霍挞教攮论文答辩日期2Q15生5月2坌旦学位授予日期2Q15生鱼旦3Q旦答辩委员会主席陵友垫塾援级矗级工猩』!巫万方数据广西大学学位论文原创性和使用授权声明“煳螋掣本人声明所呈交的论文,是本人在导师的指导下独立进行研究所取得的研究成果。除已特别加以标注和致谢的地方外,论文不包含任何其他个人或集体已经发表或撰写的研究成果,也不包含本人或他人为获得广西大学或其它单位的学位而使用过的材料。与我

2、一同工作的同事对本论文的研究工作所做的贡献均已在论文中作了明确说明。本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属广西大学。本人授权广西大学拥有学位论文的部分使用权,即:学校有权保存并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文属于:口保密,在年解密后适用授权。囱不保密。(请在以上相应方框内打“√")论文作者签名:刮以韦。指导教师签

3、名:钆作者联系电话:,i.})6.)∞国V日期:刀步J.g日期:砧.∥8电子邮箱:,.k枷“0rv蜘砂红.帆万方数据非结构化数据本体及相关算法研究摘要伴随着社交网络、云计算、大数据等概念及技术的出现,无时无刻都有大量的数据产生,其中以文本、图片、音频、视频等类型为代表的非结构化数据占总数据量的75%,且比值还在逐渐加大。同时,大数据背景下,数据的实时共享及分析将带来不可估量的经济价值,同时也极大地推动了社会的进步,而这一切的前提基础在于对数据的有效管理,其中对于非结构化数据进行合理的管理更加显得

4、尤为重要。对于非结构化数据的管理一直以来是一大难题,主要体现在非结构化数据类型多样化,没有预定义规则对其进行描述;针对于不同的非结构化类型数据,具有不同的管理技术,难以统一表示。本文针对以上问题,主要围绕非结构化数据本体研究这一中心,从图像语义自动标注,到建立相关的非结构化数据本体模型,针对模型,提出了相关算法,最终实现对非结构化数据的有效存储及检索这一目的。为实现非结构化数据的语义特征自动获取及自动标注,提出了一种针对图像语义的自动标注方法,通过利用图像底层特征与其场景语义之间的映射关系,将底

5、层特征转换为可实现比较的二进制字符串形式,从而以图像检索方式实现了图像语义的自动标注,实验结果表明,该方法是有效的。为实现非结构化数据的存储及检索,在建立非结构化数据本体模型中,从数据自身特征出发,将非结构化数据以其自身的基本属性、语义属性以T万方数据及特征属性等信息进行描述,从而将对非结构化数据管理问题转化为针对于相对结构化的数据属性管理问题,进而引入合适的动态后继树索引模型,使得对于非结构化数据的管理方法,具有支持海量数据、动态更新实时性以及满足复杂检索条件的优势。最后通过几个复杂检索示例,

6、验证了该方法在管理非结构化数据上的可用性。关键词:大数据非结构化数据本体数据模型图像语义自动标注H万方数据RESEARCHoNTHEUNSTRUCTUREDDATAoNToLoGYANDRELEVANTALGoIUTHMSABSTRACTWiththeemergencyofthesocialnetworks,cloudcomputingandbigdataconceptsandtechnology,therearelargeamountsofdataaregeneratedallthetime,

7、andinwhichtheratiooftext,images,audio,videoandothertypesofunstructureddatabythetotalamountofdataisgraduallyincreasing.Meanwhile,underthebackgroundofbigdata,thereal-timesharingandanalysisofdatawillnotonlybringimmeasurableeconomicvalue,butalsogreatlypr

8、omotetheprogressofsociety,andallthisbasedonthepremisethateffectivemanagementofthedata,whichaccountsforalargereasonableproportionofunstructureddatamanagementisparticularlyimportant.Themanagementforunstructureddataisalwaysabigproblem,mainlywithdifferen

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。