欢迎来到天天文库
浏览记录
ID:12943973
大小:6.71 MB
页数:60页
时间:2018-07-19
《互联网应用技术概论课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第七章互联网应用技术概述2010年11月1北京大学软件与微电子学院2009度课程自我介绍主讲老师:王斌,中科院计算所博士毕业,副研究员,博士生导师。现为中科院计算所前瞻研究实验室信息检索课题组负责人。北大软件学院兼职教师。先后从事和承担信息检索、自然语言处理相关的国家级研发项目10余项,发表相关论文100余篇。培养研究生20余名。计算机学会高级会员,ACM、IEEE、中文信息学会会员,中文信息学会信息检索专委会委员,《中文信息学报》编委。http://ir.ict.ac.cn/~wangbin/wangbin@ict.ac.cn办公电话:626013
2、502北京大学软件与微电子学院2009度课程提纲互联网应用的例子基于内容的互联网应用的基本技术搜索技术信息分类和聚类技术信息过滤和推荐技术考核方法3北京大学软件与微电子学院2009度课程提纲互联网应用的例子基于内容的互联网应用的基本技术搜索技术信息分类和聚类技术信息过滤和推荐技术考核方法4北京大学软件与微电子学院2009度课程搜索引擎搜索推荐推荐5北京大学软件与微电子学院2009度课程更多的搜索引擎6北京大学软件与微电子学院2009度课程GoogleKiller?2009-05-18推出2008-07-28推出7北京大学软件与微电子学院2009度课程
3、Email搜索分类8北京大学软件与微电子学院2009度课程Email分类搜索推荐9北京大学软件与微电子学院2009度课程分类目录搜索分类10北京大学软件与微电子学院2009度课程电子商务推荐11北京大学软件与微电子学院2009度课程BBS推荐搜索12北京大学软件与微电子学院2009度课程社区网站-豆瓣网推荐推荐搜索13北京大学软件与微电子学院2009度课程社区网站--校内网14北京大学软件与微电子学院2009度课程博客推荐15北京大学软件与微电子学院2009度课程以上应用的共同特征基于内容的应用内容是互联网应用的生命线包括几个主要共同的技术搜索分类/
4、聚类过滤/推荐16北京大学软件与微电子学院2009度课程提纲互联网应用的例子基于内容的互联网应用的基本技术搜索技术信息分类和聚类技术信息过滤和推荐技术考核方法17北京大学软件与微电子学院2009度课程搜索(Search)搜索:从大量文档(Document)集合(Collection)中根据用户的需求(UserInformationNeed)返回相关(Relevant)文档集合并排序(Ranking)的应用。主要特点:用户的需求动态变化,文档集合相对静态事先下载,事先组织,在线搜索应用例子:搜索引擎站内搜索18北京大学软件与微电子学院2009度课程搜索
5、技术信息的获取技术信息的组织和整理技术相关度计算和排序技术结果呈现技术相关反馈、查询扩展技术搜索的评估19北京大学软件与微电子学院2009度课程搜索系统的组成框架文档集合管理器索引文档表示查询处理查找排序排序文档用户反馈文本处理用户界面结果文档查询文本查询表示爬虫Internet20北京大学软件与微电子学院2009度课程信息分类(Classification)信息分类:根据已有的类别体系(如:体育、经济、军事…)和训练文档(每个类别对应若干文档),对一篇新的文档判断其所属类别。属于有监督的机器学习主要特点:类别体系静态,但是需要分类的文档动态变化事先
6、训练,在线分类需要大量训练文档集合应用例子:垃圾邮件/网页分类21北京大学软件与微电子学院2009度课程22北京大学软件与微电子学院2009度课程信息聚类(Clustering)聚类:从大量文档集合中自动聚团的过程,属于无监督的机器学习主要特点:事先无类别体系需要事后进行解释应用例子:检索结果聚类话题发现23北京大学软件与微电子学院2009度课程24北京大学软件与微电子学院2009度课程文本分类系统的组成框架文本表示训练过程分类过程训练文本统计统计量特征表示学习分类器新文本特征表示类别25北京大学软件与微电子学院2009度课程信息过滤信息过滤:从动态
7、的信息流中将满足用户兴趣的信息挑选出来,用户的兴趣一般在较长一段时间内比较稳定不会改变(静态)。主要特点:用户兴趣静态,数据动态对用户兴趣建模应用例子:广告推荐/商品推荐26北京大学软件与微电子学院2009度课程信息过滤系统的组成框架(d)学习器用户信息提供者(b)过滤器(a)数据分析器(c)用户建模更新反馈相关数据项数据表示项数据项个人信息用户模型27北京大学软件与微电子学院2009度课程提纲互联网应用的例子基于内容的互联网应用的基本技术搜索技术信息分类和聚类技术信息过滤和推荐技术考核方法28北京大学软件与微电子学院2009度课程考核方法技术专题讨
8、论(20%)学生分小组,选定一技术专题,共同读资料学习技术,并在课上交流。阅读(30%)阅读1篇论文SIGI
此文档下载收益归作者所有