资源描述:
《基于二部图多权重投影的大数据推荐算法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第37卷第3期计算机应用研究Vol.37No.3录用定稿ApplicationResearchofComputersAcceptedPaper基于二部图多权重投影的大数据推荐算法*12高薇,何可期(1.闽南理工学院,信息管理学院,福建石狮362700;2.中山大学,大数据与计算机学院,广州510275)摘要:基于网络结构的推荐算法存在多样性不足的问题,为此提出了一种二部图多权重投影的大数据推荐算法。首先,提取出数据集的基础信息,将所有的项目—用户数据输入莱文斯坦距离程序,计算各个属性之间的相似性;然后,计算二部图网络中节点之间相同
2、邻居的数量、节点之间的共同邻居度以及每个节点的度,计算二部图网络中每条边的三重权重;最后,采用增强的二部图投影技术提取二部图网络的潜在链接,实现基于相似性的链接预测。采用大数据集与小数据集分别完成了实验,结果显示该算法的准确率与覆盖率均优于其他几种类型的推荐算法,并且优于同类型的推荐算法。关键词:推荐系统;大数据技术;二部图网络;链接预测;网络投影;单模网络中图分类号:TP391doi:10.3969/j.issn.1001-3695.2018.07.0612Recommendationsystemofbigdatabasedon
3、multi-weightprojectionofbipartitenetworkGaoWei1,HeKeqi2(1.SchoolofInformationManagement,MinnanInstituteofTechnology,ShishiFujian362700,China;2.InstituteofBigData&Computer,SunYat-senUniversity,Guangzhou510275,China)Abstract:Mostrecommendationsystemsbasedonthenetworkstr
4、ucturesufferfromlackofdiversity,sothatarecommendationsystemofbigdatabasedonmulti-weightprojectionofbipartitenetworkisproposed.Firstly,thebasicinformationofdatasetsisabstracted,items-userslistsareappliedasaninputtoLevenshteinDistancealgorithmtocomputesimilarityofeachpr
5、operty;then,thenumberofcommonneighborsofthenodesinthebipartitenetwork,thedegreeofcommonneighborsofthenodesinthebipartitenetworkanddegreeofeachnodeinbipartitenetworkareallcomputed,tripleweightsofeachsideofthebipartitenetworkarecomputed;lastly,theenhancedbipartiteprojec
6、tiontechniqueisadoptedtoabstractthepotentiallinksofthebipartitenetworktorealizethelinkpredictionbasedonsimilarity.Theexperimentsbasedonbothofbigdatasetandsmalldatasetarerealized,theresultsshowthattheproposedalgorithmoutperformsdifferentkindsofrecommendationsystemsinte
7、rmsofaccuracyandcoverageofrecommendation,atthesametime,itoutperformstheotherrecommendationsystembasedonnetworkstructure.Keywords:recommendationsystem;bigdatatechnique;bipartitenetwork;linkageprediction;networkprojection;one-modenetwork统的推荐准确率与推荐覆盖率两个重要指标,但组合推荐算0引言法的计算
8、效率较低,对于大数据的推送实时性不足[9]。基于互联网的普及使得网络中的数据量急剧增长,许多大型网络结构的推荐算法是近期受到关注的一类方案,该方案不网站日均访问量巨大,并且包含大量的项目信息,如京东商仅获得了较好的推荐准确率,而且也实现了较高的计算