基于社交商业网站信息分析消费者购买行为

基于社交商业网站信息分析消费者购买行为

ID:24802439

大小:68.50 KB

页数:4页

时间:2018-11-16

基于社交商业网站信息分析消费者购买行为_第1页
基于社交商业网站信息分析消费者购买行为_第2页
基于社交商业网站信息分析消费者购买行为_第3页
基于社交商业网站信息分析消费者购买行为_第4页
资源描述:

《基于社交商业网站信息分析消费者购买行为》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于社交商业网站信息分析消费者购买行为殷曼曼江苏省财政厅信息管理中心作者简介:殷曼曼,女,汉族,1982年生,江苏南京人,工程师,硕士研究生。近年来,随着WEB2.0、11TML5等互联网技术概念的兴起,社交网络作为新兴的、实用的在线互动方式受到了用户的青睐。社交商业网站上广泛存在的在线交互信息(如产品评级和产品购买),成为影响用户购买决策的重耍因素。也就是说,每一个用户都可以是商品评价信息的发布者,每一个用户也都能获取到其他用户对某种商品的评价和直接观感。例如,国内知名的购物网站“美丽说”、“蘑菇街”等,均采用此模

2、式进行在线购物。因此,用户与用户之间的关系在某种程度上可以影响其对商品的购买决策。研宂社交网络上的用户在线信息发布对商品的销售决策行为具有现实意义,也可以对商品的销售人员提供可操作的指导。本文试图通过抓取社交商业网站中用户对某种商品的评价数据,并进行初步分析,得出影响用户购买决策的因素。1获取商品信息评价的方法我们通过自制数据抓取工具的方式对某商业网站上的产品评价信息以及用户信息进行抓取。1.1设计思路我们的数据抓取工具是一种按照规则自动地抓取商业网站上用户评价信息的程序。它从互联网上下载网页并根据一定的规则和条件对

3、网页内容进行过滤,获取到需要的信息;同时根据一定的搜索策略获取下一个需要抓取网页的URL,并重复此步骤,一直到系统满足某一个条件时停止。所有获取的信息将会被系统存贮,以便后续的数据查询、检索和分析挖掘。1.2设计模型具体设计模型如下阁1所示。图1数据抓取工具模型下载原图(1)DNS解析模块根据给定的URL从WEB服务器获取网页。(2)页面下载模块根据http协议获取网页文本内容。(3)页面解析模块根据通过-定的规则算法(通常由人工预先对网页htrnl文本内容进行分析得出,不同的社交网络服务提供商网页html文本规则通

4、常也各不相同),从网页html文本中获取出符合要求的文本信息数据,并组合为标准json数据队列。(4)数据过滤及持久化模块将标准json数据队列按照一定格式存储到木地文木文件或数据库文件中;以便后续分析。(5)页面前向模块分析出当前网页的下一个跳转URL,并自动跳转至目标地址,重复上述步骤,直到系统满足条件停止。该工具的实现主要有以下3个难点:(1)不规则网页数据的分析。由于不同商业网站的开发语言和商业策略各不相同,导致网页文本结构不呈现统-规则。对分析文本结构并提取信息带来较大难度。需要人工对文本规则进行分析后对工

5、具的分析策略进行动态调整。(2)网站采用动态加载策略。目前大多数商业网站均采用了ajax等动态加载策略,网页信息不是静态文本。需要工具模拟执行网站js脚本再次提交访问请求的动作后才能获取文本结果。(3)高并发及大数据量的数据需求。该模型仅针对取商业网站部分用户评论实现,在面对大数据量要求的场景时,需要对架构进行分布式或者并行多任务方面的调整。1.3代码实现我们借助python语言实现该工具。作为解释型开发语言,python语言开发效率快,语言简洁。具备成熟的协议解析接口,提供完备的第三方库实现相关功能,能用极短的代码

6、完成大部分文档的处理。(1)首先通过正常的网页浏览器访问该社会商业网站,并访问该网站中某商品的用户评价页。从浏览器中获取该页面的url。(2)使用python的requests库和urllib库模拟浏览器的http访问请求该url操作,并获取该url操作的返冋值。(3)使用python的Panda库进行返回值的处理,通过正则表达式的匹配获取url返回网页文本中我们需要的评价数据,并以json格式存储。(4)将json数据列存储为csv或者txt文本,以供后续分析。2对获取的商品评价信息的分析2.1数据准备我们对某商业

7、网站屮用户对商品的评论数据页面进行丫抓取,共获取丫13066个用户(其中男性和女性用户各半)的评价信息和用户信息。该商业网站的用户可以发布他们使用任何产品的经验并对产品进行评级(从1到5)。用户可以将他们已经购买的产品分享至“购买清单”,还可以选择“关注”其他用户。这种关注关系不需要双方冋意,所以用户之间的关系并不是对等的。用户的关注人数表明他使用社交商业网络的程度。一个用户被其他用户关注的数目表明他的人气。此外,该网站可以让用户看到他关注的人的行为(即购买行为和评级行为)。下图2显示该商业网站中用户的社交网络结构,

8、图中的箭头表示了“关注”的关系。例如,“用户”到A有箭头连接表示该用户关注了A。图2社会商业网站用户关系下载原图通过在社会商业网站上抓取每个用户对商品的评论数据,我们探讨用户的购买决策如何被其他用户的产品评论和产品购买行为所影响的。我们同时收集用广关注的其他用户列表(即领袖型消费者),为每个用户建立了一个以自我为中心的社交网络。然后区别分析该用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。