利用数据挖掘技术做好档案编研选题

利用数据挖掘技术做好档案编研选题

ID:33469626

大小:117.50 KB

页数:9页

时间:2019-02-26

利用数据挖掘技术做好档案编研选题_第1页
利用数据挖掘技术做好档案编研选题_第2页
利用数据挖掘技术做好档案编研选题_第3页
利用数据挖掘技术做好档案编研选题_第4页
利用数据挖掘技术做好档案编研选题_第5页
资源描述:

《利用数据挖掘技术做好档案编研选题》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、中国社会科学院  English  Français   窗体顶端窗体底端 ·新闻摘播   重要言论   重要文章   本网首发    学术动态   社科论坛   报刊文摘   网络文摘   六大建设·热点解读  政策法规解读  国情调研   反腐倡廉  法治社会  科技动态   读与评    咨询台    网友之声  社科大讲堂·专家访谈   学部委员  名家风采   学林新秀  学术经典库  专家库   数据库  港澳台 ·马克思主义 哲学 文学 历史学  考古学  理论经济学  应用经济学  政治学  法学  新闻与传播学  教育学  管理学 ·社

2、会学 民族学 宗教学 语言学  统计学 艺术学 情报与文献学 军事学 国际问题研究 国外社会科学 综合研究当前位置:首页 > 情报与文献学 > 档案学返回首页      正文字号:【小】【中】【大】利用数据挖掘技术做好档案编研选题王立萍·2012-12-2321:16:01   来源:《北京档案》(京)2008年11期    【英文标题】ProperSubjectSelectionofArchivesEditingandResearchbyDataMining  【作者简介中国社会科学院  English  Français   窗体顶端窗体底端 ·新闻

3、摘播   重要言论   重要文章   本网首发    学术动态   社科论坛   报刊文摘   网络文摘   六大建设·热点解读  政策法规解读  国情调研   反腐倡廉  法治社会  科技动态   读与评    咨询台    网友之声  社科大讲堂·专家访谈   学部委员  名家风采   学林新秀  学术经典库  专家库   数据库  港澳台 ·马克思主义 哲学 文学 历史学  考古学  理论经济学  应用经济学  政治学  法学  新闻与传播学  教育学  管理学 ·社会学 民族学 宗教学 语言学  统计学 艺术学 情报与文献学 军事学 国际问题研究

4、 国外社会科学 综合研究当前位置:首页 > 情报与文献学 > 档案学返回首页      正文字号:【小】【中】【大】利用数据挖掘技术做好档案编研选题王立萍·2012-12-2321:16:01   来源:《北京档案》(京)2008年11期    【英文标题】ProperSubjectSelectionofArchivesEditingandResearchbyDataMining  【作者简介】王立萍,南昌大学人文学院历史系    随着计算机技术和信息技术的发展,信息产生的渠道越来越多,信息更新的频率日益加快,在“数据过剩”和“信息爆炸”的同时,人们正被

5、信息淹没,却饥渴于有用信息的提取。面对浩渺无际的数据海洋,人们迫切需要一种能够从海量的数据中提取有价值知识和信息的技术,基于人工智能的数据挖掘技术便应运而生,并被广泛应用。  一、数据挖掘技术  1、数据挖掘  所谓数据挖掘(DataMining,简称DM),是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。数据挖掘是数据库知识发现(KnowledgeDiscoveryinDatabases,简称KDD)中的重要技术,它通过对查询内容进行模式的总结和内在规律的搜索,帮助决策者分析历史数据及当前

6、数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为,从而为决策行为提供有利的支持,很多人又将其称为数据淘金①。  数据挖掘是面向数值数据的挖掘,其功能主要有:(1)自动预测趋势和行为。数据挖掘自动在大型数据中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。(2)关联分析。数据关联是数据库中存在的一类重要的可被发现的知识,若两个或多个变量的取值之间存在某种规律性,就称为关联。关联分析的目的是找出数据库中隐藏的关联网。(3)聚类。数据库中的记录可被划分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是

7、概念描述和偏差分析的先决条件。(4)概念描述。概念描述就是对某对象的内涵进行描述,并概括这类对象的有关特征,分为特征性描述和区别性描述。(5)偏差检测。数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。  2、Web挖掘  Web挖掘是一项综合技术,涉及Web、数据挖掘、计算机语言学、信息学等多个领域。Web挖掘就是从Web文档、Web活动中抽取感兴趣的、潜在的有用模式和隐藏信息。它反复使用多种数据挖掘算法,从观测数据中确定模式或合理模型,也是将数据挖掘技术和

8、理论应用于对Web资源进行挖掘的一个新兴的研究领域。Web挖掘的处理流程为查找资

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。