欢迎来到天天文库
浏览记录
ID:10828016
大小:162.50 KB
页数:43页
时间:2018-07-08
《一种新型的社交网络用户搜索方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一种新型的社交网络用户搜索方法-1-一种新型的社交网络用户搜索方法赵国锋,荣芳芳*(重庆邮电大学通信与信息工程学院,重庆400065)5摘要:目前,人们越来越喜欢借助社交网络平台寻找感兴趣的用户,进而时刻关注其动态消息或浏览其发表过的信息。但在数以亿计的社交网络信息中较准确地搜索出所需用户目前还是一大难题。本文,提出一种新型的在社交网络中搜索所需用户的方法。先构建适用于用户搜索的索引结构;随后建立用户评分排序模块,排序因子为用户的相关性和用户的影响力。查询用户输入查询关键词到索引器中利用本文提出的索引结构可以快速得到候选用户集。在10用户评分模块中对候选用户集中的每个用户进行
2、评分,根据用户评分的高低对候选用户进行排序并返回最终结果。实验证明,本文提出的方法有效的提高了搜索系统的查全率和查准率,并且返回的前k个结果的相关性值相对较高。关键词:社交网络用户搜索倒排索引BM25中图分类号:TP39315AnovelmethodofsearchingforpeopleinsocialnetworkZHAOGuofeng,RONGFangfang(TheSchoolofCommunicationandInformationEngineering,ChongqingUniversityofPostsandTelecomunication,Chongqing4
3、00065)20Abstract:Now,itisverypopulerinsocialnetworkthatsearchingforpeopletofollow.Butfindingaranklistofaccuatepeoplefrombillionsofbitsofinformationinsocialnetworkisadifficultthing.Inthispaper,weproposedanewmethodthatcansolvehowtosearchforpeopleinsocialnetwork.Firstwebuildedasuitableindexstr
4、uctureforthisproblem.Thenwemadeauser'sscoreorderingmodule,andthetwofactorsareuserrelativityandinfluece.Enteringaquery25totheindexer,wecanquicklygetacandidatesetviatheproposedindexstructure.Everyoneinthecandidatesetcanbecalculatedinthescoreorderingmoduleandthenwecanobtainaranklistofpeop
5、le.Experimentsprovedthatrecallandprecisionareeffectivelyimprovedandtherelativityofresultsaregood.Keywords:socialnetwork;searchforpeople;invertedindex;BM25300引言现今活跃在社交网络中的人数以亿计,并且一直呈上升趋势。社交网络是真实世界的一个映射,真实生活中的人们在虚拟的社交网络中注册信息,发表信息,联系老朋友,结交新朋友,随时关注朋友的动态等等。因此,在社交网络中,每一个用户不仅有自己的基本信息(如名字,年龄,位置信息,教
6、育信息等),还拥有其发表的信息,用户关系网等其他的信35息。现在在社交网络中搜索用户的应用越来越得到人们的关注。找到目的用户以后,可以与其联系交流,可以浏览其已发表的文章,还可以时刻的关注其动态消息。但目前研究成果来看在社交网络中搜索用户都是根据已知的用户名,用户标签或者用户的其它个人基本信息(如学校,地点,年龄等)。使用这种方法,在某些情况下是不能全面、精准地搜索到所需用户的。例如,我想搜索出一些对JAVA语言有独到见解的用户,但是我40不知道具体的用户名称,使用用户的其它信息也不能解决,怎么办?如果利用标签信息,目前标签系统还不够完善,那些没贴JAVA标签,但是发表很多有
7、关JAVA博文的用户搜索不出来。假如我们知道一些JAVA领域的专家,也不代表这个专家会把JAVA方面的信-2-息发表到社交网站上供大家分享交流。这就需要一种全新的方法来解决这个问题。因此,在不知用户具体名称的情况下,怎样使用查询关键字搜索所需用户,提高搜索结果的准确性是45一个亟待解决的问题。本文从信息检索的角度提出一种新型的社交网络的用户搜索方法,来解决上述提到的问题。首先,构建适用于用户搜索的索引结构;然后利用用户发表的信息提出计算用户与查询关键字之间相关性的算法,利用用户的其他个人信息提出计算用户
此文档下载收益归作者所有