欢迎来到天天文库
浏览记录
ID:61781165
大小:29.00 KB
页数:4页
时间:2021-03-20
《数据挖掘短视频个性化推荐研究.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、数据挖掘短视频个性化推荐研究【摘要】在当今大数据的大背景下,每个行业都清楚地意识到数据挖掘技术带来的便利与潜在的商业价值,并开始将数据挖掘用于快速精准决策和与管理,这不仅促进了经济的快速发展与社会的蓬勃进步,这也引起了世界新一轮的竞争浪潮。本文主要以抖音短视频为例,分析了大数据背景下的短视频个性化推荐机制和数据挖掘在短视频平台中的具体应用。【关键词】数据挖掘;短视频;市场随着我国互联网通信技术与多媒体技术的快速发展,我国新媒体短视频的数量与日俱增。截至2019年底,爱奇艺、腾讯视频与抖音短视频等用户观看
2、视频总数达到1亿,用户月活跃数接近3亿,每天播放视频量可达15亿个。利用数据挖掘能够进行研究决策,能够帮助理清数据交互的复杂性、认识数据缺失造成的不确定性,还能够深挖复杂数据背后蕴含的巨大商业价值。在广阔的短视频市场中,数据挖掘贯穿其中,如市场分析、细分、目标选取,到最后的制定计划,都将离不开数据挖掘,可以说数据挖掘为短视频的发展开辟了新的路径。1短视频呈现井喷式增长的原因4学海无涯1.1外部技术的成熟优化用户体验。短视频的繁荣发展主要依赖于我国通信基础建设发展与应用的不断优化,网络环境的不断提升、信息
3、传输速度和稳定性的提高也为短视频的发展提供了强有力的技术保障。智能手机的普及为短视频用户的积累提供了宝贵的土壤,且短视频APP中的视频制作简单易学、使用门槛低、实现了生产与制作的融合,降低了用户的操作成本。在视觉成像领域,AR技术的应用增强了用户的多维体验,基于数据挖掘的精确推送,形成用户独有的个性化标签,牢牢将用户锁住。1.2UGC生产模式满足个性化需求。UGC是用户原创内容的简写。短视频平台的定位就是内容分享,所有的用户可以上传分享自己的生活短视频,几乎没有内容的限制,满足了用户个性化的需求。通过U
4、GC内容模式,降低了用户生产内容的门槛,扩大了平台的用户数量,以达到占领市场的目的。1.3从用户的三个维度实现传播效果。短视频具有简短、内容丰富与参与互动性强等特点。在认知层面,用户通过大量的短视频来识别外部丰富世界。在心理层面,短视频占据了用户大部分零散时间,并且短视频通过文本、声音与图像感官的三维形式给用户以沉浸式体验。在行动层面,用户的评论与转发已成为短视频体验的一部分,也进一步增强了用户的参与感。2数据挖掘的概念与特征信息爆炸时代产生了海量信息,但往往难以提炼有效的信息,从而造成了无用的信息过多
5、和有效信息的丢失,这就是约翰•内斯伯特(JohnNalsbert)所说的“信息丰富而知识贫乏”窘境。因此,人们迫切希望能对海量数据进行深入分析、发现、提取并利用隐藏在其中的信息。数据挖掘,就是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘有以下几个特点:2.1规模化。目前对于数据的计量而言,已由TB发展到PB与EB,往后很有可能会用ZB与YB来进行计算,今后的数据规模还将会以指数的形式扩增。2.2特性化。挖掘出来的数据应该是以前未知的,而不是验证已有的经验。只有全新的知识,才可以帮助企业获得
6、进一步的洞察力。2.3动态化。海量信息时代的数据迭代速度十分快速,因此数据挖掘也要具备动态性与时效性,数据库的数据要及时更新。2.4价值性另外,数据挖掘一个明显特点就是潜在价值,对数据进行及时清理、数据集成与数据规约化以后,就能够挖掘数据的潜在价值,给企业带来直接或间接的效益,这也是数据挖掘的真正意义所在。3数据挖掘下的短视频个性化推荐机制———以抖音为例4学海无涯抖音是一个去中心化的音乐创意短视频社交平台,任何一个账号都有机会拥有百万粉丝甚至千万粉丝。即便是新号,只要视频内容受欢迎,就会被越来越多的人
7、关注。3.1叠加推荐。视频上传抖音平台之后抖音官方会检测视频是否违规,如果违规,抖音官方会把视频打回或者对用户限流;如果不违规,抖音官方会进行一个随机推荐,平台会根据账号的权重给予一定的初始推荐流量,初始推荐优先分发给附近的用户、关注账号的粉丝以及自身所关注的用户,并根据用户标签与内容标签进行智能分发。抖音采用逐层推荐的方式:第一次推荐,会根据账号的权重推荐200~500流量,这200~500用户的播放量、点赞量、评通信设计与应用论量、转发量、关注量和完播率等数据指标达到官方的初步标准后,平台通过数据比
8、对自动判定视频内容较受欢迎,从而进行第二次推荐;第二次推荐的播放量在3000左右;第三次推荐在1.2万~1.5万之间;第四次推荐在10万~12万之间;第五次推荐在40万~60万之间;第六次推荐量在200万~300万之间;第七次推荐量在700万~1100万之间;第八次推荐会进行标签人群推荐,这时候的量级在3000多万。其中,从第四个层级开始会介入人工审核。人工审核决定是否可以加大视频曝光量,到了第8个层级,会定期将作品推送给符合作品标签的人群
此文档下载收益归作者所有