基于ccr模型的用户投诉智能识别系统

基于ccr模型的用户投诉智能识别系统

ID:15497962

大小:2.04 MB

页数:16页

时间:2018-08-03

基于ccr模型的用户投诉智能识别系统_第1页
基于ccr模型的用户投诉智能识别系统_第2页
基于ccr模型的用户投诉智能识别系统_第3页
基于ccr模型的用户投诉智能识别系统_第4页
基于ccr模型的用户投诉智能识别系统_第5页
资源描述:

《基于ccr模型的用户投诉智能识别系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于CCR模型的用户投诉智能识别系统目录===================================第1章项目背景和意义2第2章项目特点和功能描述4第3章项目主要内容5第4章主要创新点13第5章成果效益15第6章项目推广前景16上海移动商业机密第16页共16页第1章项目背景和意义竞争战略之父迈克尔·波特说过:企业之间的竞争归根到底是对客户资源的竞争。在全业务竞争时代,客户忠诚将成为中国移动的核心竞争力之一。在各运营商层出不穷的、同质化的业务和服务下,客户的选择增多;需求从同质化走向个性化,客户对服务的期望提高,对运营商而言,客户满意

2、度的提升变得更加挑战。中国移动要在全业务竞争中领先,需要将客户规模优势转化为客户关系优势,需不断提升客户满意度。移动公司在投诉处理过程中,积累的投诉量大。客户与公司的接触与交互,蕴含着丰富的客户提升客户满意度的机会,他们的每一通来电,无论是投诉还是查询或咨询,不管是为业务办理还是提交故障,都能促使我们提升业务管理水平。因此,深入分析客户投诉内容,发现用户不满原因,是提升客户满意度最重要的手段。传统的投诉处理分析方式(登陆WMS系统查看,统计报表,个案分析报告)进行现状诊断与分析,发现了公司在投诉分析方面存在的问题,最终归结为下面几个方面:外部

3、因素:1)热点捕捉难:热点发现不及时,热点不明确,难以聚焦;2)内容分析难:数据量大文字多,需要对内容逐个采用人工分析,很繁琐。对热点分析不透,难以发现引发投诉的根本问题。上海移动商业机密第16页共16页1)工作发力难:投诉热点、难点识别的及时性和精确度不高,关键投诉较难把控,分析结果较难应用。内部因素:1)系统支撑力度不够:WMS系统主要支撑业务运营,系统分析能力有限,难以支撑对投入内容的深入分析。2)流程不完善:投诉热点发现、原因分析和问题处理环节相对孤立,没有形成闭环,问题解决效率不高。基于以上背景,上海公司今年在集团公司指导下,以“基

4、于投诉文本内容智能识别客户投诉原因的研究与应用”项目为切入点,开展客户满意度深入分析工作,进一步提升企业竞争力和持续发展能力,为打造卓越的经营分析体系,加速实现成为世界一流移动信息运营商的目标奠定基础。上海移动商业机密第16页共16页第1章项目特点和功能描述本项目主要包括三大内容:(一)通过对传统的投诉处理分析方式(登陆WMS系统查看,统计报表,个案分析报告)进行现状诊断与分析,发现了公司在投诉分析方面存在的问题,最终归结为下述问题:Ø数据量大、文字多、内容难分析,察看需要逐个进行,很繁琐Ø用户真实投诉原因难发现,对背后隐性问题分析很少,不易

5、发现用户隐性或潜在需求Ø分类固定,新问题易忽略导致发现时间不及时;(二)针对这三大改进领域,借鉴业内成熟技术经验,将文本分析引入到投诉内容中,提出了基于投诉文本内容智能识别客户投诉原因的投诉分析模型;(三)基于模型的识别结果,选取投诉热点进行专题分析,识别出用户投诉的原因,从中发现产品设计和服务策略中存在的问题,并采取相应的对策进行改善。上海移动商业机密第16页共16页第1章项目主要内容1.模型介绍投诉内容识别模型,后文简称为CCR(ComplainContentRecognizer)。CCR借鉴业内成功技术经验,探索基于客户投诉信息以获得服

6、务和产品改进和创意思路的方法。下图是CCR模型的实现框架:1)对投诉内容进行分词采用完全基于Lucene的中文分词系统,针对移动投诉专题建立专属的投诉词库,在此技术上使用分词系统的analyzer对文本进行切分。Apache上海移动商业机密第16页共16页Lucene是一个高性能的全能的全文检索的搜索引擎框架库,完全使用Java开发。它是一种适合于几乎任何一种需要全文检索的应用的技术,特别是跨平台的应用。Lucene基础排序算法:score_d=sum_t(tf_q*idf_t/norm_q*tf_d*idf_t/norm_dt_t)scor

7、e_d:Document(d)的得分sum_t:Term(t)的总和tf_q:查询中t的频度的平方根tf_q:d中t的频度的平方根idf_t:log(numDocs/docFreq_t+1)+1.0numDocs:索引中Document的数量docFreq_t:包含t的Document的数量norm_q:sqrt(sum_t((tf_q*idf_t)^2))norm_d_t:在与t相同域的d中tokens数量的平方根分词的算法:按照词长对投诉词汇进行分词,对要分词的文本进行匹配,如果找到了匹配词汇,则在该词汇处分词,如果没有匹配,那么缩短词汇

8、继续进行匹配,直到匹配为止。如果一直到最后单字都没有匹配,则认为该词为新词,在新词后进行分词。1)过滤无用词汇,构建投诉词典采用基于感知语义的信息过滤法,通过对投诉

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。