欢迎来到天天文库
浏览记录
ID:28331859
大小:9.14 MB
页数:50页
时间:2018-12-09
《垂直搜索引擎数据分析技术的分析与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、华北电力大学硕士学位论文摘要针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,本文采用垂直搜索引擎技术和电子商务服务相结合的新的服务模式,设计了一个电子商务垂直搜索引擎系统。论文重点研究了系统的数据分析模块中对页面数据信息抽取方式和数据索引的关键技术和实现算法;设计实现了数据展示模块的用户查询接口,同时对检索结果做了相关性分析。在对各类信息抽取技术进行分析和比较后,设计了本系统的信息抽取方案;针对该方案本文设计了独有的索引结构,在数据索引过程中应用了基于词库的最大匹配分词算法,采用顺排和倒排索引相结合的文件索引方式建立索引。经过试验证明,本文设计和实现的电子商务搜索引擎能
2、够满足用户结构化查询需求,该系统具有较好的实用价值和应用前景。关键词:垂直搜索引擎,信息抽取,中文分词,倒排索引,相关性排序ABSTRACTAimedtothesolvingtheproblemsoftoo—massivedata,lowsearchaccuracyandprofundityincommonSEandbasedonthenewservicemodelofverticalsearchenginecombinedwithE-commerce,thispaperdesignsaE-commerceVSEsystem,withfocusonthekeytechnique
3、sandarithmeticofwebpages’informationextractionanddataindexofthedataanalysismodule,andimplementationofuserqueryinterfaceandresultsanalysisofthedatapresentmodule.BasedontheanalysisandcomparisonofIEtechnology,thispaperproposesanapplicableIEsolution;applytheMMarithmeticofChinesesegmentationbased
4、—onwordsdatabaseandcooperationofsequenceindexandinvertedindexandthespecialindexstructure.Aftersystemtesting,theE-commercesearchenginefulfillstheusers’queryneedofstructuredinformation.Itprovestobewithpracticalityvalueandapplicationforeground.JiangJuan(ComputerApplicationTechnology)Directedbyv
5、iceprof.ZhengLingKEYWORDS:verticalsearchengine,informationextraction,Chinesesegmentation,invertedindex,relevanceranking华北电力大学硕士学位论文摘要针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,本文采用垂直搜索引擎技术和电子商务服务相结合的新的服务模式,设计了一个电子商务垂直搜索引擎系统。论文重点研究了系统的数据分析模块中对页面数据信息抽取方式和数据索引的关键技术和实现算法;设计实现了数据展示模块的用户查询接口,同时对检索结果做了相关性分析。在对各类信
6、息抽取技术进行分析和比较后,设计了本系统的信息抽取方案;针对该方案本文设计了独有的索引结构,在数据索引过程中应用了基于词库的最大匹配分词算法,采用顺排和倒排索引相结合的文件索引方式建立索引。经过试验证明,本文设计和实现的电子商务搜索引擎能够满足用户结构化查询需求,该系统具有较好的实用价值和应用前景。关键词:垂直搜索引擎,信息抽取,中文分词,倒排索引,相关性排序ABSTRACTAimedtothesolvingtheproblemsoftoo—massivedata,lowsearchaccuracyandprofundityincommonSEandbasedonthenews
7、ervicemodelofverticalsearchenginecombinedwithE-commerce,thispaperdesignsaE-commerceVSEsystem,withfocusonthekeytechniquesandarithmeticofwebpages’informationextractionanddataindexofthedataanalysismodule,andimplementationofuserqueryinterfaceandresults
此文档下载收益归作者所有