新闻个性化推荐系统

新闻个性化推荐系统

ID:28021927

大小:136.90 KB

页数:7页

时间:2018-12-07

新闻个性化推荐系统_第1页
新闻个性化推荐系统_第2页
新闻个性化推荐系统_第3页
新闻个性化推荐系统_第4页
新闻个性化推荐系统_第5页
资源描述:

《新闻个性化推荐系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、新闻个性化推荐系统(python)关zhu并回复微信公众号:数据挖掘DW(ID:datadw)可获取源代码和数据集。最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。1•数据集521879152187915218791521879152187918936831893683189368318936831893683189368318936831893683

2、189368318936831169896216989621698962169896274558710065286674558710065340374558710065335174558710065340310064880210064883010064891510064898410064904010065636910065655110065661610065663710065681510065714610065717610065718810065726110065121210065518110065832510065146910064608713952287441395

3、228682139522866113952286351394463205139446319613944631811394463158139446312013959151171395915108139591510313959150901395915079139591505113959150221395915013139591498613947756091396022914139602278213947813081393906484马航代表与乘客家属见靣9马航0开新闻发布会通报失联航班最新情况9马航失联班捜救画靣9马来西亞民航局举行新闻发布会破"舷窗"谣言10NASA发布疑

4、似马航航班失事堆点离消地图10江苏一银行被传倒闭引挤兑潮25马交通部称飞机己经跌入海底25米歇尔成都与学生一起上英语课26採访国际海事卫星组织英匡总部26青岛公交司机®武防身26法匡卫星发现122个疑似碎片27广西警方榷毁特大販希网络27釤丽媛沄匡石望忠病儿鱼27兰州火车站前被扔砖块27汉龙前离转肖辉申话否港庇护13餐昕:600多所本科院校转做职立教有22中央巡校组要求广东复查茂名窝案28长沙街头发生砍人事件致6人死亡142014两会委员吃什么3人民币贬值场剌破房地产泡沫18南京一男子酒后失手打死13岁女儿19湖南冷水江一煤矿发生瓦斯爆炸事故19南京一男子酒后失手打死1

5、3岁女儿19—共五个字段,以tab隔开。分别是user编号,news编号,时间编号,新闻标题,对应当前月份的日(3就是3号)2.代码部分先来看下演示n/python).py!r.py^num.pypeat.pyata.py*sult.pyws.py>rds.py•raw.pyram.pydicpyi.pyimportGet.day.doto»Y/•py(1)算法说明举个例子简单说明下算法,其实也比较简单,不妥的地方希望大家指正。我们有如下一条数据[plain]viewplaincopy1.57389361006498791394550848MH370航班假护照乘客身份查

6、明(更新)115738936这名用户在11号看了"MH370航班假护照乘客..."这条新闻。我们通过jieba找出11号的热点词如下。[plain]viewplaincopy1.失联311三周年马方偷渡客隐形护照吉隆坡航班护照者我们发现"航班〃、"护照"这两个keywords出现在新闻里。于是我们就推荐5738936这名用户,11号出现"航班"、"护照"的其它新闻。同时我们对推荐集做了处理,比如说5738936浏览过的新闻不会出现,热度非常低的新闻不会出现等。(2)使用方法整个系统采用一键式启动,使用起来非常方便。首先建立一个test文件夹,然后在test里新建三个文件

7、夹,注意命名要和图中的统-为新闻是有时效的,每一天要去分开来计算,要存储每一天的内容做成文档。test文档如下图,就可以自动生成,名称key一wordstrain^date^setltrainjastday一set圓first^upload議result_resultjio.repeatresult一no_repeat一hot鐘test一train_date—setl_trainjastdat^constant-setltrain」astdat一set1使用的时候,要先在GlobaLparam.py中设置好test文件夹的路径参数。一切设

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。