信息检索及数据挖掘

信息检索及数据挖掘

ID:36536370

大小:1.86 MB

页数:102页

时间:2019-05-11

信息检索及数据挖掘_第1页
信息检索及数据挖掘_第2页
信息检索及数据挖掘_第3页
信息检索及数据挖掘_第4页
信息检索及数据挖掘_第5页
资源描述:

《信息检索及数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、信息检索与数据挖掘1信息检索与数据挖掘第1章绪论信息检索与数据挖掘2提纲1.1信息检索的由来和这门课的意义1.2信息检索的历史和发展1.3信息检索与数据挖掘等其他学科的关系1.4信息检索的基本概念1.5课程要求和说明信息检索与数据挖掘3提纲1.1信息检索的由来和这门课的意义1.1.1信息过载1.1.2信息检索的定义1.1.3数据挖掘的定义1.1.4本课程的意义1.2信息检索的历史和发展1.3信息检索与数据挖掘等其他学科的关系1.4信息检索的基本概念1.5课程要求和说明信息检索与数据挖掘4信息检索的由来为什么需要

2、信息检索?什么是信息检索?什么是数据挖掘?数据挖掘与信息检索有什么关系?信息检索与数据挖掘51.1.1信息过载•数据爆炸性的增长,而人的处理能力有限•网站6.34亿(2012年5.55亿(2011年2.55亿(2010年Internet上网站底)底)底)总数5100万2012年新增网站数量8780万Tumblr博客的数量5940万全球WordPress网站的数量35%2012年网页平均变大35%4%2012年网页平均加载速度减慢4%信息检索与数据挖掘61.1.1信息过载•数据爆炸性的增长,而人的处理能力有限•W

3、eb服务器6.7%2012年使用Apache服务网站的数量下降了6.7%32.4%2012年使用IIS服务网站的数量增长了32.4%36.4%2012年使用NGINX服务网站的数量增长了36.4%15.9%2012年使用Google服务网站的数量增长了15.9%2012年12月Web服务器所占的市场份额比例图信息检索与数据挖掘71.1.1信息过载•数据爆炸性的增长,而人的处理能力有限•视频48YouTube上每分钟上传视频的小时数250万被上传到YouTube新闻相关视频的小时数883亿Googlesites(

4、incl.YouTube)每月观看的视频数2000万Facebook上每月上传的视频数15648303谷歌视频网站的独立访客访问数量,视频领域排名第一10亿短短五个月时间,鸟叔GangnamStyle成为全球最火热的在线视频,访问量达到10亿(目前超过11亿)27亿在2012年美国选举期间,YouTube上关于Obama或者Romney的视频浏览量达到27亿信息检索与数据挖掘80.1.1信息过载•数据爆炸性的增长,而人的处理能力有限•图片60亿Flickr上的照片数量58Flickr每秒上传图片的数量3亿Fac

5、ebook每天增加新图片的数量7PB每月Facebook增加7PB的图片内容(1PB=2^10TB)•搜索1.2万亿2012年谷歌的搜索数量1Ask.com最热门的一个问题:Rob和Kristen(暮光之城男女主角)会一起回来吗?信息检索与数据挖掘91.1.1信息过载互联网用户数量增长:全球互联网用户数量已达到24亿11亿亚洲互联网用户的数量5.19亿欧洲互联网用户的数量2.74亿北美互联网用户的数量2.55亿拉丁美洲/加勒比海的互联网用户的数量1.67亿非洲互联网用户的数量9000万中东互联网用户的数量243

6、0万大洋洲/澳大利亚互联网用户的数量5.65亿中国互联网用户的数量,超过了全球任何一个国家2012年6月各地区互联网用户市场份额比例图信息检索与数据挖掘101.1.1信息过载智能移动终端互联网用户增长:全球智能移动终端互联网用户数量已达到13亿(2012年底)67亿手机订阅的数量31%美国互联网用户中,有31%都在使用平板电脑或电子阅读器1.3EB2012年每月的全球移动数据流量约为1.3EB(1EB=2^10PB)59%全球移动数据流量59%的份额来自于视频500MB智能手机平均每月消耗的数据流量为500MB

7、504kbps全球所有手机平均移动网络的连接速度为504kbps1820kbps全球智能手机平均移动网络的连接速度为1820kbps信息检索与数据挖掘111.1.1信息过载Internet主机数量的增长信息检索与数据挖掘121.1.1信息过载Internet网站数量的增长信息检索与数据挖掘131.1.1信息过载社会网络规模的增长:facebook账户数量的增长信息检索与数据挖掘141.1.1信息过载全球数字化加快进程•1998年,美国前副总统戈尔提出数字化地球的概念。•1998年,江泽民总书记提出数字中国战略构

8、想。•全世界各种数字化应用:数字图书馆、数字博物馆、数字电影、交互电视、会议电视、远程教育、遥感、GPS等产生大量文本和多媒体数据。•2005年11月17日,突尼斯,WSIS信息社会世界峰会,“无所不在的‘物联网’通信时代即将来临,世界上所有的物体从轮胎到牙刷、从房屋到纸巾都可以通过因特网主动进行交换。”信息检索与数据挖掘151.1.1信息过载全球数字化加快进程•2009年8月温家宝总

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。