欢迎来到天天文库
浏览记录
ID:46858212
大小:87.00 KB
页数:13页
时间:2019-11-28
《数据库中的大数据分析与运用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、数据库中的大数据分析与运用计算机科学系计算机科学与技术专业122512010068吕凤娇指导教师:沈渊【摘要】本次毕业设计的题目是数据库中的大数据分析与运用,此次设计开展的意义是随着大数据的不断发展,大数据概念已经渐渐深入人心,大数据正高调地走进人们的生活、走进人们的视野,任何人都无法回避。大数据带给我们的麻烦可想而知是数据越多麻烦就越大。本次毕业设计就是为了把海量数据带来的麻烦处理好。该次毕业设计使用0racle数据库进行实现,主要实现存储数据、使用索引能在大数据中快速查询到所需数据、可以申请账号、修改资料、添加和
2、删除好友、模拟发送对话信息。【关键词】大数据;数据库;Oracle第一章数据库中的大数据分析与运用概述1.1引言数据库的课题设计是指在一个给定的应用坏境中构造设计出优化的数据库物理结构和逻辑模式,并根据物理结构和逻辑模式建立数据库及应用系统,使它具有对数据进行存储和管理的功能,以满足使用者的需求。信息管理要求指:在数据库屮应该存储和管理哪一些数据对象;数据操作要求是指对数据对象需要进行哪一些操作,比如:查询操作、删除操作、添加操作、修改操作、统计操作等等。数据库的课题设计是为了给使用者和各种应用系统提供一个信息基础设
3、施与一个高效率的运行环境。其中高效率的运行环境包括:数据库的存取效率、数据库存储空间的利用率、数据库系统运行管理。众所周知,理论应联系实际。所以此次毕业论文的课题设计冃的是为了把平日在校所学的数据库理论知识应用到实践屮去。此次的毕业设计课题数据库中的大数据的分析与运用主要是运用Oracle数据库知识将其初步实现。1.2课题背景随着科技的不断进步,网络信息化时代越来越普遍,像移动互联、社交网络、电子商务等,这些都大大拓展了互联网的疆界和应用领域,我们现在正处于一个数据猛增的“大数据”时代,大数据在经济、政治、文化、日常
4、生活等方面给我们带来了很深的影响,大数据时代在人类看來是一个对数据驾驭能力的新机遇、新挑战,也为人类获得更为深刻、更为全面的洞察能力,为人类提供了前所未有的空间与潜力。就像是在2012年2月的《纽约时报》里的一篇专栏中所称,“大数据”时代已经光临,不管是在商业、经济还是其他领域中,决策将日益基于数据和分析,而并非基于经验和直觉。哈佛大学社会学教授加里•金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”1.3课题入门知识介绍1.3.1什么是大数据大数据
5、是什么呢?从它的字面上看大数据是很多数据的集合。从专业术语的角度来说,大数据是规模庞大且复杂的数据集。对于大数据的定义还有另一个说法是指:那些超过传统数据库系统处理能力的数据。它在对数据规模和传输速率这两个方面要求很高,或者其结构不适合以往的数据库系统。大数据最显著的特点就是它的特性与特征。大数据的四大特性包括:海量性、多样性、高速性、易变性;大数据的三大特征包括:数据的类型多种多样、数据价值密度相对较低、处理的速度快,时效性要求高。对于大数据的四个特性和三个特征详见1.3.2。大数据中隐藏着有价值的模式和信息。在企
6、业组织看来,大数据的价值体现在两个方面。一方面是分析使用,另一方面是二次开发。正因为大数据的数据多,所以它的价值往往是隐藏其中,只有对大数据进行分析才能揭示隐藏其中的信息。比如:零售业中为了提升对客户的理解可以对门店销售、地理和社会信息进行分析。对于大数据的二次开发可是那些成功的网络公司所擅长的。比如:Facebook通过结合大量使用者的信息,制定出高度个性化的用户体验,并创造出一种新的广告模式。这种通过大数据创造出新产品和服务的商业行为并非巧合,雅虎、谷歌和Facebook它们都是大数据时代的创新者。1.3.2大数
7、据的四个特性及三个特征(一)大数据的卩q个特性海量性:从大数据的字面上就明显的知道它所包含的数据量很多,因此,海量性是大数据显而易见的一个特性。多样性:多样性就体现出大数据展现出来的形式是多种多样的。比如:大数据可以以文本、图像、视频、聊天记录等方式展现出来。高速性:高速说的是数据被创立和移动的速度。价值密度:大量的不相关信息,对未来趋势与模式是可预测分析和深度复杂分析的。例如:机器学习、报告等等。(二)大数据的三个待征大数据不仅仅呈现四个特性,而且它还呈现出其他的三个数据特征。特征一:数据的类型是各式各样的。例如:
8、图像、文本、网络日志、视频、音频、地理位置信息等等,这对于处理这种各式各样类型的数据能力有了更高的要求。特征二:数据价值密度相对来说较低。例如:随着互联网的广泛使用,信息感知可谓是无处不在,信息海量,但是其数据价值密度相对來说较低,怎么通过强大的机器算法把数据的价值迅速“提纯”,这是大数据时代需要解决的一大难题。特征三:不但处理的速度快,而且时
此文档下载收益归作者所有