高级搜索方法 毕业论文外文翻译

高级搜索方法 毕业论文外文翻译

ID:240551

大小:34.00 KB

页数:4页

时间:2017-07-12

高级搜索方法  毕业论文外文翻译_第1页
高级搜索方法  毕业论文外文翻译_第2页
高级搜索方法  毕业论文外文翻译_第3页
高级搜索方法  毕业论文外文翻译_第4页
资源描述:

《高级搜索方法 毕业论文外文翻译》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、4苏州科技学院本科生毕业论文A译文高级搜索方法搜索关键字方式:如输入“线性”和“代数”可以很容易出现成百上千篇的文献,其中有一些甚至可能与线性代数方面毫无关系的文章。如果我们增加搜索词的数量,而且要求所有的搜索词都匹配,然后我们就可以减少一些至关重要的文献文档被排除掉的风险。我们进行数据库的搜索时应该优先考虑那些含有频率相对较高的最为匹配的关键词的文档,而不是扩大搜索列表中的所有匹配的词。为了搜索到与向量X相关的文献,为达到这一目标,我们需要找到数据库的列矩阵A。将两个向量紧紧地联系起来的最好的方法就是定义向量之间的夹角。这个知识点我们将在第五章的第一节里学习到。在我们已经对奇异值分解的相

2、关知识有所了解之后,我们也将重新审视信息检索应用程序(第六章,第五节)。这种分解可以更加简便的找到近似的数据库矩阵,这样将大大加快搜索。通常它有过滤掉噪音的好处,也就是说,使用近似版本的数据库矩阵可能会产生自动消除掉一些使用关键词在不必要的无关重要的文献文档上的作用。例如,一个牙科学生和一个数学的学生可能都会使用微积分作为他们的一个搜索词。因为数学的列表搜索使用近似数据库矩阵可能会消除掉所有关于牙科的文档。同样道理,数学文件将被过滤掉在牙科学生的搜索文件里。网络搜索和页面的排名现代网络搜索可以轻易涉及到含有成千上万的关键词的数十亿文档。事实上,截止2004年03月,就有超过四十亿个网页出现

3、在互联网上,而且仅仅在单一的一天中对于通过搜索引擎获取或更新多大100个亿的网页这样的事是不常见的。虽然数据库矩阵对页面在网页上的作用是非常之大,但由于矩阵和搜索矢量备件搜索可以被大大的简化;也就是说,任何列中大部分的条目是0。4苏州科技学院本科生毕业论文互联网搜索引擎,更好的搜索引擎会做简单的匹配搜索来找到所有关键词的页面,但是他们不会在对关键词的相对频率的基础上有所要求。由于互联网的商业本质,人们要卖的产品可能会故意重复使用关键词来确保他们的网站排名较高的任何相对频率搜索。事实上,很容易地列出关键词的几百倍。如果单词的字体颜色配上页面的背景色,然后观众会不知道这个词是重复。用于网络搜索

4、的更复杂的算法是必要的页面排名包含所有的矩阵模型概率分配在特定的随机过程。这种类型的模型称为马尔可夫过程或一个马尔可夫链。在第三节,我们将会看到第6章如何使用马尔可夫链模型的网页浏览和获取的网页排名。相对频率搜索搜索的商业数据库通常找出所有包含搜索词的关键文件然后以基于相对频率的文件。在这种情况下,数据库条目矩阵应该代表的第六个字数是代数的所有数据库关键词和应用第八字的相对频率,在那里所有的单词按字母顺序排列。如果说,在数据库中,9号文件包含从词典共发生200次,如果关键词字代数发生10次在文档和Word中的应用发生了6次,然后对这些词的相对频率是10/200和6/200,数据库和相应的矩

5、阵条目。4苏州科技学院本科生毕业论文附录B外文原文AdvancedsearchmethodsAsearchforthekeywordssuchaslinearandalgebracouldeasilyturnuphundredsofdocuments,someofwhichmaynotevenbeaboutlinearalgebra.Ifweweretoincreasethenumberofsearchwordsandrequirethatallsearchwordsbematched,thenwecouldrunariskofexcludingsomecruciallinearalgeb

6、radocuments.Ratherthanmatchallwordsoftheexpandedsearchlist,ourdatabasesearchshouldgiveprioritytothosedocumentsthatmatchmostofthekeywordswithhighrelativefrequencies.Toaccomplishthis,weneedtofindthecolumnsofthedatabasematrixAthatare“closest”tothesearchvectorx.Onewaytomeasurehowclosetwovectorsareisto

7、definetheanglebetweenthevectors.WewilldothisinSection1ofChapter5.Wewillalsorevisittheinformationretrievalapplicationagainafterwehavelearnedaboutthesingularvaluedecomposition(Chapter6,Section5).Thisdecompositionca

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。