个性化信息获取方法的研究

个性化信息获取方法的研究

ID:45568142

大小:1.08 MB

页数:61页

时间:2019-11-14

个性化信息获取方法的研究_第1页
个性化信息获取方法的研究_第2页
个性化信息获取方法的研究_第3页
个性化信息获取方法的研究_第4页
个性化信息获取方法的研究_第5页
资源描述:

《个性化信息获取方法的研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、大连理工大学博士学位论文个性化信息获取方法的研究姓名:杨震申请学位级别:博士专业:管理科学与工程指导教师:邓贵仕研究了特征提取算法牙个性特征提取算法,并通i本文通过对个性化信店究,为今后个性化信息服2关键词:个性化;数据挖扌Wit0htrmhaetd■1e0Vneanfinf0rmati0ns0nr(tionretrieVa1(1Ibecome0ne0fthemo•1ngtheadVancedITtechn010gy,m0staeSearchEng•1neInformationngef1fsy••1C1V0h0u

2、se

3、rpeIr敷iM側诂aiigi:performanceofseineand

4、(3)Investifpersonaldpatternrecognitiorhatbasedinformatioecperowtm.vesteura1NetwoANN—SVDa1gorith]ai1ngQtfatltnllkljlnrsU)ma11.1刖吞Ibtt®irmeettfi•信息结构化程度低。信息;式千差万别,没有统相同。针对不同的信息资:的工作负担。现在,利用个人的PC:信息资源,用户怎样从中找信息只益成为信息工作者所:目前基于Inteme又称信息推送技术;信息米10o12]o推送技术也可以米用一上用户得到相同的信息。通欲推送出去的信息。在客户传来的信息。当有新的信息到]在屏幕上显

5、示消息等方式通知丿而另一种简单的推送技一些感兴趣的主题,并且填到这个指定的信箱中。这样中进行信息的查询即可。入认您j目前已®谢禰遞軀件41・3.1搜索引擎蒙特利尔大学学生艾伦雏形。当时经常需要在网络1FTP主机中,查询起来非;来查找文件的程序,于是便箱做,它依靠脚本程序自动2供使用者查询。不过此时的似于Archie的搜索工两名悌士维真w品1.3.2搜索引擎的工作,虽然各个搜索引擎具体E16s3:搜索信息的网上蝕索器、用户界面,如图1・2)如))。相关度可以免索引擎中可能会有多个网上虫•信息分析器对网上蜘蛛下载的页]分词、过滤和转换等。这。在分词时,大部分系统从1如title,heade分词后通

6、常要使用禁用词7有些系统还对词条进行单/值円般被適近为奄询矢量矿(8)上'定1与用户的需•用户接E1用户接151为用凹户按照搜索引擎的查询语法勺引擎将检索结果展现为一个纟等信息。由于检索结果中相引擎中进行查询,如果没有AltaVistaExcit•综合式搜索引擎’24、2£综合搜索引擎又称组笊单个的搜索引擎只能覆盖一检索结果,就必须反复调耳解决了这些问题。综合搜嗪检索接口代理模块、检索纟辛化”的检索设置要求,包括i“接口代理模块”内置与多个MetaCrawlerH息需求特点的功能,可以力・特殊搜索引擎特殊搜索引擎是针对特匕的信息资源过于庞杂,网查询信息时的基本要求引擎。特殊搜索引擎只收!乐、M

7、P3【2“、软件爲很受用户的欢迎。建立特另它的发展。ALIWERYaho•借鉴的鬣畴用户的选择、使用,也有禾展了很多,基本上分为两丿靈反映算法、系统研究者贰问的优劣,什么样的指标談方法的研究。主要是指:1得计算指标需要的数据。戌合理的实验获得,指标的设而对信息获取系统性談评价㈠另三金是基本的评价凰彖标准GB/T137《学科分类与代码》Yahoo!中文网站Goog1e使用的o5曇标准的分类体咅评价指标,查准率(Pre华在“搜索引擎搜索结果的11讨论,这个表显示了系统搜索特殊率S(S¥查准率和查全率的准碩设{re1evan■砧隹奚统检家到的辛档的集合,ffi{re1evE薩羈勰羹复被朗奠到&关又被

8、检索到的实际文档与查由于查准率和查全率力们又提出了一种综合评价扌f这种评价方式是从搜僅对搜索引擎的搜索效率、使搜索算法。由于其测试集往是评价者个人的结论,反此类评价方法通常带有较疼能,给出的是不同使用者的和结果,因此评价结果很凤息服务的发展,信息服务以搜索得到的信息与用户所但这种方法存在的!考虑用户的实际需要较少径。1.5.2目前对于信息获上在信息系统所有的评彳方法[4叫21o专家评,宙NIST(美国国家木evalConference,TI豊舟售发布标准测试数据和彳根据结果做出标准答案并对名主题或项目如下表。1・5.4网络环境下查盘Internet的_这个动态的环境下要确定㊁以要准确衡量基于互

9、联网用采用替代的方法和近似的彳不再详述,本节简要介绍〜由于实验环境的不同,确定环境下的查全率,另-患可能排在最后。用户果有用。这是由于除了¥对整个网页进行扫描,,回。检索完全依赖于用.•效率有待提高。用户在进站,而发出请求之后又i•没有针对不同用户的个性词所提出的搜索请求,返卩其中第4个问题是解决InformationCustoZe)信息搜索。例如Yahoo,用户写并提交之后,在今后登陆时况这具有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。