兴业天津分行消息搜索引擎策划和实现

兴业天津分行消息搜索引擎策划和实现

ID:22220916

大小:55.00 KB

页数:6页

时间:2018-10-27

兴业天津分行消息搜索引擎策划和实现_第1页
兴业天津分行消息搜索引擎策划和实现_第2页
兴业天津分行消息搜索引擎策划和实现_第3页
兴业天津分行消息搜索引擎策划和实现_第4页
兴业天津分行消息搜索引擎策划和实现_第5页
资源描述:

《兴业天津分行消息搜索引擎策划和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、兴业天津分行消息搜索引擎策划和实现-->第一章绪论1.1研究背景与动机搜索引擎技术堪称是互联网发展的“助推器”,在过去几年里,取得了长足的发展。搜索引擎技术的发展史大致有如下二个阶段:“第一代搜索引擎”无论是纯技术型的搜索引擎还是分类目录,都可以认为是互联网上的第一代搜索引擎,出现于1994年前后,以AltaVista,YAHOO和InfoSec为代表,搜索结果的好坏往往用反馈结果的数量来衡量;“第二代搜索引擎”1998年,以GoogleIIDirectHit为代表的第二代搜索引擎出现在互联网上,这些引擎的主要特点是提高了查询的命中率,可以用“求精”来描述;“第二代

2、搜索引擎”互动式搜索是在用户查询和搜索引擎返回结果的人机交互过程中,引擎根据用户的查询内容,智能展开多组相关的主题,帮助用户快速找到相关搜索结果。各类专业的搜索网站如Google,其数据库中存放的网页已达30亿之巨。中国共有1.2亿以上的互联网用户,使用搜索引擎的用户数比例达70%以上。用户想要访问感兴趣的网站,相对快捷的方式就是搜索,搜索服务正成为口常互联网生活的重要组成部分。随着因特网搜索的快速发展,目前垂直搜索引擎呈现出一支独秀的态势。垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人

3、群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。垂直搜索引擎提供的主要内容不应该局限于普通的网页索引,而包括商业信息的加工,结构化的信息。在信息技术飞速发展的今天,以信息为基础的组织或知识型商业银行焕发勃勃生机,但商业银行往往迷失在海量的信息面前束手无策,一方面是海量的商业银行内数据白白占据存储空间得不到应用,一方面是为了寻找决策用数据,又投入大量资源,造成两方面的浪费。在此状况下运用商业银行搜索引擎,找到商业银行需要的东西,是种解脱,也是种趋势。在

4、对搜索引擎发展的总体过程分析基础上,可以把新经济形势下搜索引擎发展的技术特征与趋势概括为四点:(1)出现自动分类技术。文档自动分类就是用计算机程序来确定指定文档和预先定义类别之间的隶属关系。目前,主要的文档自动分类算法可以分为、统计学习法、词匹配法、基十知识工程的方法。其中统计学习法是目前较为通用的分类方法,其工作原理是以专家的人工分类做筛选条件,搜索与待分类文档主题接近的文档作搜索集,进行分析,利用挖掘后学习到的知识对文档集分类,该方法优于传统的按词进行机械匹配的此匹配法,实现也较为简单。(2)查询有效性与检索精确度持续改善。通过使用多次迭代、正文分类、聚类等技术

5、对查询结果加以分类挖掘,将分类结果可视化,用户便可以得到自己最关心的那一类结果。避免了传统搜索引擎对系统资源消耗过大的弊端,减少查询网上站点信息的总量。(3)通过智能代理实现信息过滤与定制服务智能化信息代理使用自动获取的专业技术知识模型、客户关系描述等知识进行信息检索、筛选、甄别,并自动反馈结果给用户。智能化信息代理具有自适应能力,能根据用户需求定制个性化的服务。(4)重视交叉语言搜索的研究和开发经济全球化与因特网将世界各国紧密联系在一起,各国的信息检索因各国语言的差异而出现了“查询鸿沟”。克服该鸿沟的有效手段就是交叉语言信息检索。用户以母语提交查询,搜索引擎在多神

6、语言的数据库中进行信息搜索,配合机器翻译,返回母语显示的结果。3.3.1商业银行内容...........323.3.2文档库管理...........32-343.3.3个性化门户模块...........343.3.4工作流模块...........34-353.3.5银行在线培训...........35-363.4商业银行级搜索引擎工作...........36-39第四章天津分行信息搜索引擎的系统技术...........39-604.1关键技术方案...........39-414.2系统的技术实现...........41-434.3系统技术实现方案.

7、..........43-604.3.1创建门户站点...........43-474.3.2使用ObjectModel实现工作...........47-524.3.3建立文档库...........52-564.3.4实现在线培训...........56-60第五章系统测试与验证...........60-655.1数据库测试.........-->..60-625.1.1RAID硬盘冗余性...........60-615.1.2RAC负载均衡...........61-625.2数据库优化...........62-65小结本文首先对搜索引擎系统进行了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。