幾種常用的Internet個性化信息檢索技術的探討

幾種常用的Internet個性化信息檢索技術的探討

ID:46697191

大小:70.00 KB

页数:7页

时间:2019-11-26

幾種常用的Internet個性化信息檢索技術的探討_第1页
幾種常用的Internet個性化信息檢索技術的探討_第2页
幾種常用的Internet個性化信息檢索技術的探討_第3页
幾種常用的Internet個性化信息檢索技術的探討_第4页
幾種常用的Internet個性化信息檢索技術的探討_第5页
资源描述:

《幾種常用的Internet個性化信息檢索技術的探討》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、幾種常用的Internet個性化信息檢索技術的探討網上信息極度膨脹導致查找信息猶如大海撈針,雖然Google等優秀搜索引擎提供瞭大量的信息資源,但仍需根據檢索到的地址信息,按照頁面屏幕的提示向下追蹤。特別是對於那些對專業信息有迫切需求的專業人士來說,難以迅速、準確地獲得有價值的網上信息資源因此用戶迫切希望找到一種能夠在信息海洋中自動獲取實用、準確、精煉的信息的工具一、智能代理Agent檢索技術智能代理又稱智能體,它是在用戶沒有明確具體要求的情況下,根據用戶需要,代替用戶進行各種復雜的工作,如信息查詢、篩選及管理,並能推測用戶的意自主制定、調整和執行工作計劃。它

2、使用自動獲得的領域模型(如web知識、信息處理、與用戶興趣相關的信息資源、領域組織結構)、用戶模型(如用戶背景、興趣、行為、風格)知識進行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾),並自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能代理具有瞭不斷學習、適應信息和用戶興趣動態變化的能力,從而提供個性化的服務1、智能代理Agent意義從用戶的角度來看,采用智能代理技術的應用服務系統在不間斷地為他們工作,用戶隻在必要時才需要參與從應用的角度來看,智能代理就是能自動執行用戶委托的任務的計算實體,它有著極其廣泛的應用從技術的角度來看,智能代理是以各種技術為

3、基礎,集合瞭許多實用的應用特性,從而能自動執行用戶委托的任務2、智能代理有兩個主要技術特征:智能性(Intelligence)和代理能力(Agency).智能性指應用系統使用推理、學習和其他技術來分析解釋它已接觸過的或剛提交給它的各種信息和知識的能力。代理能力指一個代理感知其環境並相應動作的能力3.智能代理包括四方面的關鍵技術:機器技術(Machinery)、內容技術(Content)、訪問技術(Access)>安全技術(Security)機器技術:機器是指各種在人工智能領域中開發的、支持各種程度智能的引擎。這些引擎包括有:各種形式的推理引擎、學習引擎、用戶創

4、建修改規則和知識的工具、驗證規則集的工具和用於開發代理之間、代理和用戶之間進行協商和協作所需策略的工具。機器技術中的核心是推理機和學習機,它們提供瞭智能代理所需的推理能力和學習能力內容技術:指機器用於推理和學習的數據,但它不一定就是知識,它主要包括屬於結構化知識的規則、語法,大量非結構化的通用知識和結構化的數據。內容作為代理系統能夠內核訪問的系統數據也存在於核心中,它提供代理系統工作所需要的各種知識和數據,同時機器也可以直接對其進行更新訪問技術:訪問是指代理與周圍環境進行交互。代理與周圍環境的交互可以分為代理應用之間的交互與代理和用戶的交互。代理應用之間的交互

5、又可分為對本地環境與遠程環境的訪問安全機制是為瞭實現於外界的安全訪問而設置。外界是代理的交互對象,應包括所需要的原始信息源、用戶、代理所屬的應用系統、其他代理系統等二、智能Agent主要功能用於信息服務的智能Agent主要完成以下功能:導航,即告訴用戶所需要的資源在哪裡;解惑,即根據網上資源回答用戶關於特定主題的問題;過濾,即按照用戶指定的條件,從流向用戶的大量信息中篩選符合條件的信息,並以不同級別(全文、詳細摘要、簡單摘要、標題)呈現給用戶;整理,即為用戶把已經下載的資源進行分門別類的組織;發現,即從大量的公共原始數據中篩選和提煉有價值的信息,向有關用戶發佈

6、。這些都是使信息服務走向個性化主動服務不可缺少的功能。目前在此方面己經有瞭一些能夠使用的系統,但智能化的程度還遠遠不夠,且主動有餘的過濾不足己經造成瞭一些負面的影響,有待盡快發展更先進的人工智能技術予以解決三、網絡信息挖掘(WebMining)技術網絡信息挖掘源於數據挖掘。數據挖掘就是指從大量數據(如數據庫)中提取抽象的、潛在的有用信息的過程,它是數據庫中知識發現KDD的核心,為大量數據的利用提供瞭有效的工具。數據挖掘的成功使研究人員將數據挖掘技術用於因特網,但是由於WWW上的數據不同於傳統數據,故產生瞭一個新的研究方向一網絡信息挖掘網絡信息挖掘,又稱為基於W

7、eb的數據挖掘,是從大量數據中抽取處先前未知的、完整的、可信的、新穎的、有效的信息的高級處理過程。它是在已知數據樣本的基礎上,通過歸納學習、機器學習、統計分析等方法得到數據對象間的內在特性,據此采用信息過濾技術在網絡中提取用戶感興趣的信息或者更高層次的知識和規律來做關鍵的決策。網絡信息挖掘其實就是對文檔的內容、要利用資源的使用以及資源之間的關系進行分析網絡信息挖掘分為Web日志挖掘、Web內容挖掘、Web結構挖掘。具體而言,Web日志挖掘是通過分析Web服務器的日志文件,對用戶訪問Web是服務器方留下的訪問記錄進行挖掘,從中可以得出用戶的訪問模式和訪問興趣,丈

8、站點管理員提供各種利於Web站點改進或

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。