资源描述:
《基于用户评论的手机特征挖掘应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、ComputerScienceandApplication计算机科学与应用,2017,7(8),738-746PublishedOnlineAugust2017inHans.http://www.hanspub.org/journal/csahttps://doi.org/10.12677/csa.2017.78085ResearchandMineonMobilePhoneFeatureBasedonUserReviewsWeiGao,XianglingFuBeijingUniversityofPostsandTelecommunicati
2、ons,BeijingthththReceived:Jul.19,2017;accepted:Aug.4,2017;published:Aug.7,2017AbstractUseronlinecommentisbecomingtheimportantdataresourceforenterprisetogetuser'sre-quirementinInternetenvironment.However,howtoaccuratelyandeffectivelyextractthecha-racteristicsoftheproductand
3、itsdescriptionofthecharacteristicsinthevastseaofcommentsisadifficultproblemofthetheoryandpractice.Basedonthedatapreprocessingandfeatureextrac-tion,theLinLogenergymodelisintroducedtoclusterandanalyzethefeaturesofproductsandtheirdescriptiveinformation,soastoobtaintheaccurate
4、evaluationofthefeature.Thispaperappliestheenergymodeltotheevaluationof4mobilephonescollectedfromJingdongMall,andthenanalyzestheclusteringresults,finallyobtainstheadvantagesanddisadvantagesofthefourmobilephones.Theresultsshowthatthismethodcanextractthefeaturesoftheproductin
5、tui-tivelyandeffectivelyfromthecontentgeneratedbyuser.KeywordsDataMining,FeatureExtraction,PhraseMatch,EnergyModel基于用户评论的手机特征挖掘应用研究高威,傅湘玲北京邮电大学,北京收稿日期:2017年7月19日;录用日期:2017年8月4日;发布日期:2017年8月7日摘要用户在线评论逐渐成为互联网环境下企业获取用户需求的重要数据资源。然而如何能够准确有效的在浩文章引用:高威,傅湘玲.基于用户评论的手机特征挖掘应用研究[J].计算
6、机科学与应用,2017,7(8):738-746.DOI:10.12677/csa.2017.78085高威,傅湘玲如烟海的评论中提炼出产品的特征及其对特征的描述,是一个理论和实践界的难题。本文对手机评论数据的预处理和特征提取的基础上,引入了LinLog能量模型,对产品特征及其描述信息进行聚类分析,从而获得该特征的准确评价。本文对采集自京东商城的4款手机评论应用能量模型,通过分析聚类结果,最终获得了这四款手机特征的优劣,结果经过验证,表明该方法能够直观有效的从用户产生内容中提炼出产品特征的优劣。关键词数据挖掘,特征提取,短语匹配,能量模型C
7、opyright©2017byauthorsandHansPublishersInc.ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY).http://creativecommons.org/licenses/by/4.0/OpenAccess1.引言从大量文献中可知[1],在线评论已成为消费者的重要信息来源,以消费者的角度来看,评论可以影响消费者的选择,以制造商的角度来看,选择有效的评论可以帮助新产品的开发。根据国内外研究结果,每10
8、0个新产品方案中,平均只有6.5个能产品化,不到15%的新产品能成功地商品化,37%进入市场的新产品在商业上是失败的[2],究其原因,是缺少对现有商品的准确分析,从而无法把握用户