基于googlewebapi的单机版维文元搜索引擎技术研究

基于googlewebapi的单机版维文元搜索引擎技术研究

ID:34161698

大小:537.00 KB

页数:4页

时间:2019-03-03

基于googlewebapi的单机版维文元搜索引擎技术研究_第1页
基于googlewebapi的单机版维文元搜索引擎技术研究_第2页
基于googlewebapi的单机版维文元搜索引擎技术研究_第3页
基于googlewebapi的单机版维文元搜索引擎技术研究_第4页
资源描述:

《基于googlewebapi的单机版维文元搜索引擎技术研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2011年第05期技术研究doi:10.3969/j.issn.1671-1122.2011.05.027基于GoogleWebAPI的单机版维文元搜索引擎技术研究亚森艾则孜,迪里夏提买买提,如先故力阿布都热西提(新疆警官高等专科学校公安科技教育部,新疆乌鲁木齐830011)摘 要:随着Internet的发展,基于多种文字信息的维文信息也越来越多。为了获取有用的维文Web信息,必须要创建符合维文信息检索需求的搜索引擎。文章从分析维文文字的多种性、编码的多样性以及维文Web表示的特殊性等问题的基础上,探讨如何利用Goo

2、gleWebAPI来实现基于维文信息的单机版元搜索引擎。关键词:搜索引擎;维文;代码转换;GoogleWebAPI中图分类号:TP393.08文献标识码:A文章编号:1671-1122(2011)05-0077-04OnTechniquesofPersonalMetaSearchEngineofUyghurWebsitesBasedonGoogleWebAPIYasenAizezi,DilixiatiMaimaiti,RuxianguliAbudurexiti(DepartmentofScienceandTechno

3、logy,XinjiangPoliceOfficers’Academy,Urumqi,Xinjiang830013,China)Abstract:WiththedevelopmentofInternet,Uyghurinformationbasedonmulti-scriptisalsoincreasing.ForgettingusefulUyghurWebinformation,asearchenginemeetingtheneedofUyghurinformationsearchingshouldbeestabli

4、shed.Inthispaper,ByanalyzingthevarietyofUyghurcharacters,thediversityofitscoding,andtheparticularityofthedenotationofUyghurWeb,thethesisdiscusseshowtorealizethepersonalmetasearchengineofUyghurwebsitesbasedonGoogleWebAPI.Keywords:searchengine;Uyghur;codingconver

5、sion;GoogleWebAPI0引言随着因特网的迅猛发展、Web信息的增加,用户要在信息海洋里查找信息,就像大海捞针一样,而搜索引攀技术恰好解决了这一难题。搜索引擎是为解决用户查询问题而出现的网络服务之一。它是Internet上的某些网站提供的一项服务,它将Internet上的网站和网页信息进行收集、整理和组织,以帮助用户找到所需信息。根据组织信息方式搜索引擎可分为目录式搜索引擎、网络机器人搜索引擎和元搜索引擎等。用户通过人一种搜索引擎能搜到自己需要的中西文网页。随着我国少数民族文化水平的提高,我国很多少数民族人

6、民也建立了基于本民族语言文字的网站,传播本民族信息,促进本民族经济发展,目前有维吾尔族、藏族、蒙古族和朝鲜族等民族建立了自己语言文字的网站。根据最新统计,目前已有5000多家基于多种文字的维吾尔文的网站,提供着各种不同程度的服务和信息。如何在这么多的维文网站中获取所需的维文网页是个值得研究的课题。开发一个网络机器人收集需要的维文网页,固然是个很好的主意。但是,开发一个具有独立版权并性能良好的网络机器人所要花费的巨大精力和巨额资金是大多是人不能接受的。因此如何充分利用已有搜索引擎来实现维文网页搜索问题是很好的选择。1搜

7、索引擎与维文目前,互联网上已经有了很多很好的搜索引擎,它们正在给广大用户提供着各种文字类型的信息检索服务。但是,目前为止还没有一个完整的专用维文搜索引擎。主要原因是很多著名搜索引擎不支持维文(如百度、搜狐等),虽然有些用户使用能支持收稿时间:2011-04-15基金项目:新疆维吾尔自治区重点实验室开放课题(049807),国家自然科学基金科研项目(61063043);作者简介:亚森艾则孜(1975-),男,新疆,副教授,硕士,新疆警官高等专科学校公安科技教育部公安科技教研室主任,主要研究方向:信息安全、多种文信息处理

8、;迪里夏提买买提(1968-),男,新疆,讲师,学士,主要研究方向:安全与防范、多媒体信息处理;如先故力阿布都热西提(1976-),女,新疆,讲师,在读硕士,主要研究方向:数据库、网络安全。77技术研究2011年第05期Unicode编码的Google阿拉伯文搜索引擎来进行网络维文信息维文信息处理技术有了空前的发展机会,很多高等院校、公司、的检

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。