基于文本聚类的客户细分方法研究

基于文本聚类的客户细分方法研究

ID:34130538

大小:2.40 MB

页数:64页

时间:2019-03-03

基于文本聚类的客户细分方法研究_第1页
基于文本聚类的客户细分方法研究_第2页
基于文本聚类的客户细分方法研究_第3页
基于文本聚类的客户细分方法研究_第4页
基于文本聚类的客户细分方法研究_第5页
资源描述:

《基于文本聚类的客户细分方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、江苏科技大学硕士学位论文大摘要论文题目基于文本聚类的客户细分方法研究研究方向智能信息处理学科、专业计算机应用技术研究生姓名胡雨晴导师姓名生佳根填表时间2014年3月16日万方数据摘要摘要随着企业市场的稳健发展,客户资源正成为企业最具有价值的资产。将客户细分技术用于客户偏好分析,能够为企业调整和制定合适的营销策略提供有益的帮助。近年来由于电子商务的快速发展,网络购物越加普遍。在线购物场景下,客户往往依据商家对货物的描述以及相关客户评论来判断货物的质量和特征。客户评论是广大客户对购买商品信息的反馈,更为真实的反映了客户对商品及服务的偏好。由于客户评论大

2、多为在线式短文本数据,且易于获取,因此本文以短文本数据为研究对象,着重研究文本数据的维数约减方法和基于文本聚类的客户细分问题。本文的研究工作主要包括以下两点:(1)研究了一种改进的基于信息增益的文本降维方法,以用于客户评论数据集的筛选。针对传统信息增益方法仅考虑信息增益中评判特征词的全局重要性,本文将TFIDF(TermFrequency–InverseDocumentFrequency)的思想引入信息增益,改进了传统信息增益方法没有考虑特征词的局部重要性方面的不足;进而基于这种改进的信息增益方法,通过文本聚类,以用于评估原始客户评论数据集中文本数

3、据的可用性,实现原始客户评论数据集的有效筛选。(2)研究了基于语义的PCA(PrincipalComponentAnalysis)文本降维方法,以通过文本聚类实现客户细分。由于传统的PCA降维方法没有明确使用文本数据集中特征词语之间存在的潜在语义关联,本文借助于《同义词词林》,在合并同义词语及满足包容关系的特定词语的基础上运行PCA方法,从而使得降维后得到的新特征空间在较好表示原始空间的同时,更好的描述原始空间中特征词语之间的语义关联。进而,通过聚类分析技术实现了对客户关注属性的分析,以发现关注人群的分布情况以及不同的客户的行为偏好。关键词客户细分

4、;文本聚类;特征降维;信息增益;主成分分析I万方数据江苏科技大学工学硕士学位论文II万方数据AbstractAbstractWiththesteadydevelopmentofthebusinessmarkets,customerresourceisbecomingthemostvaluableenterpriseassets.ItishelpfulforenterprisestoadjustanddevelopappropriatemarketingstrategiesthatUsingcustomersegmentationtechniques

5、toanalyzecustomerpreferences.Recentlytherapiddevelopmentofe-commerce,onlineshoppinghasbecomeincreasinglypopular.Whenonlineshopping,customersareoftenbasedonthedescriptionofthebusinessandrelevantcustomercommentstojudgethequalityandcharacteristicsofthegoods.Customercommentsarefee

6、dbackwhichcomesfromplentyofbuyersandmorerealisticreflectionofcustomerpreferencesforgoodsandservices.Customerreviewsaremostlyshorttextandeasytoaccess.Inthispaper,ashorttextdataistakenasresearchobject,textdatadimensionalityreductionmethodsandcustomersegmentationproblemsbasedonte

7、xtclusteringareemphaticallyfocusedon.Inthispaper,theresearchmainlyconsistsofthefollowingtwopoints:(1)Animprovedmethodoftextdimensionalityreductionbasedoninformationgainisproposedforcustomerreviewsdatasetscreening.Thetraditionalmethodofinformationgainisconsideredtheglobalimport

8、anceoffeaturewords.Inthispaper,theideaofTFIDFisintroduced.The

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。