欢迎来到天天文库
浏览记录
ID:40005161
大小:148.00 KB
页数:47页
时间:2019-07-17
《[计算机软件及应用]数据库与数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据库与数据挖掘8/4/20211计算机专业研究生的专业成长培养目标(1)具有扎实的基础理论和专业知识课程学习、领域知识、知识面(2)开发能力(熟悉开发工具)(3)科研能力(创新能力)科研成果、论文8/4/202122.科研方法与步骤(1)确定研究方向(2)收集阅读资料了解发展过程、现状、现有方法(3)确定课题(4)提出解决方案(5)方案实现(6)实验结果分析、性能测试(7)论文写作(8)学术交流8/4/20213本课程的任务数据库基础知识的回顾与整理数据库系统原理的深化与巩固数据仓库数据挖掘技术上机实验:某种数据挖掘算法的实现课程考核:笔试70%+上机实验30%
2、(答辩)8/4/20214第1章基础知识一、数据库技术的发展历程1964年,第1个DBMS问世,IDS,网状数据库1960’末,推出IMS,层次数据库;1970’,推出SystemR,关系数据库;E.F.Codd:关系数据库之父;1980’,关系数据库典盛时期;1990’,面向对象数据库,特种数据库8/4/20215特种数据库:多媒体数据库,工程数据库,时态数据库,空间数据库,知识库2000年后,Web数据库,XML数据库数据组织的种类:无结构、结构化、半结构化8/4/20216二、DBMS的功能7个功能1.提供用户接口2.查询处理与优化3.数据目录管理4.并发控
3、制5.数据恢复6.完整性约束7.访问控制8/4/20217三、数据模型与数据模式1.数据模型的含义数据结构、操作、完整性约束关系模型、层次模型、网状模型2.数据模式描述具体数据的方式例如:关系模型中二维表外模式、模式、内模式8/4/20218四、数据模型的种类与分析1.概念数据模型面向用户、面向现实世界、与DBMS无关E-R模型2.逻辑数据模型描述数据的逻辑关系关系、层次、网状、面向对象3.物理数据模型面向物理实现8/4/20219关系模型数据结构:二维表完整性约束:域完整性、实体完整性、引用完整性操作:бπ×÷∪∩–连接例:÷运算8/4/202110五、数据库生
4、命周期规划、设计、建立、运行管理和维护、扩充与重构六、数据库语言SQL组成:DDL、QL、DML、DCLcreatetable…createindex…droptable…dropindex…createview…as…8/4/202111select…from…where…groupby…orderby…insertinto…deletefrom…update…set…where…嵌入式SQL——SQL嵌入到程序设计语言中动态SQL——支持动态查询,执行的SQL语句不是事先确定。8/4/202112SQL的存储过程:将常用的访问数据库的程序,定义一个过程,经编译
5、后,存储在数据库中,供用户调用。格式:定义过程:execsqlcreateprocedure<过程名>(in输入参数,out输出参数)beginatomic//atomic表示执行保持原子性………end;execsql调用过程:call<过程名>(……);NoSQL数据库8/4/202113七、数据库系统结构4种1.单机数据库系统2.C/S、B/S数据库系统3.逻辑上集中、物理上分布的数据库系统4.逻辑上分布、物理上分布的数据库系统8/4/202114八、DBMS中的事务DBMS的一个执行单位ACID准则:A----原子性C----一致性I----隔离性(多个事务
6、并发执行,应像各个事务独立执行一样D----持久性8/4/202115九、数据目录是一组关于数据的数据,也叫元数据。数据目录中的数据分为两类:1.来自基表、视图和索引的定义,相对稳定;2.来自数据库状态的统计,例如:元组个数,不同属性值的个数。8/4/202116十、数据库文件的组织1.顺序文件(堆文件)2.直接文件(Hash文件)3.索引文件静态索引---表组织,不插入/删除动态索引---B+树,插入、删除主索引、次索引倒排文件---所有属性都建立索引簇集索引---关键字相同的记录放在连续物理块稠密索引---每个键有一个索引项非稠密索引8/4/202117十一、
7、存储系统的发展1.三级存储体系Cache----内存----外存2.RAID磁盘阵列3.存储器网络通过网络共享磁盘数据8/4/202118第2章查询处理与优化一、基本概念1.查询是数据库中最基本、最常用、最复杂的操作2.查询一般以查询语言表示3.查询优化是查询处理中的重要环节。二、查询优化的方法1.规则优化2.代价估算优化8/4/2021191.规则优化(1)代数优化——对查询语句进行等效变换(2)物理优化——选择合理的存取策略2.代价估算优化先预估代价,再从中选优。三、代数优化(1)先做选择、投影,后做连接(2)先做小关系连接,再做大关系连接(3)提取查询中的公
8、共表达式8
此文档下载收益归作者所有