百米wifi数据文本分类系统的设计与实现

百米wifi数据文本分类系统的设计与实现

ID:35092634

大小:4.97 MB

页数:72页

时间:2019-03-17

百米wifi数据文本分类系统的设计与实现_第1页
百米wifi数据文本分类系统的设计与实现_第2页
百米wifi数据文本分类系统的设计与实现_第3页
百米wifi数据文本分类系统的设计与实现_第4页
百米wifi数据文本分类系统的设计与实现_第5页
资源描述:

《百米wifi数据文本分类系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Sou化ChinaUniversitofTechnoloygy工程硕±学位论文■百米WIFI数据文本分类系统的设计与实现1-作者姓名涂就超工程领域计算机技术校内指导教师张星明教授校外指导教师张宇高级工程师所在学院计算机科学与工程论文提交日期2016年4月,'-、DesignandImplementationofTextCategorizationSystemBasedonDataofBaimi-wifiADissertatio

2、nSubmittedfortheDegreeofMasterCandidate:GanHongchaoSupervisor:Prof.ZhangXingmingSouthChinaUniversityofTechnologyGuangzhou,China分类号:TP391学校代号:10561学号:20。2103。65华南理工大学硕±学位论文百米WEFI数据文本分类系统的设计与实现作者姓名:證辄超指导教师姓名、职称:张星明教授、申请学位级别:工程硕±工程领域名称:计算机技

3、术论文形式:口产品研发口工程设计^^;&用研究□工程/项目管理□调研报告研究方向:计算机技术论文提交曰期;年午月曰论文答辩日期:店年^月日^学位授予单位:华南理工^学学位授予日期:年月曰答辩委员会成员:主席;畜辈委员:、藻畫啊, ̄■7悚中满勺完属I诗节E华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研巧成果。除了文中特别加标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对

4、本文的研究做出重要贡献的个人和集体,均己在文中明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:篡曰期:1^6年6月曰T学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属华南理工大学。学校有权保存并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅(除在保密期内的保密论)文外;学校公可布学位论文的全或部分、部内容,可W允许、采用影印印或其它复制手段保汇

5、缩存编学位论一文。论本人电子文的和纸。档内容质文的内容相致本学位论:文属于□保密,在年解密后通用本巧巧书。团不保密同意在,校园网上发布,供校内师生和与学共享校有协议的单位浏览;同意本人学论将位文提国学交中术期刊(光盘版)电子杂志社全文出版和编入C術I《中国知识资源总库》,传播学论全部分位文的或内部。容""(请在W上相应V方框内打)*-:作者签名>4^^:日期7連/导教签名:指师袁节3曰期<.^自6摘要百米WIFI是部署在全国许多城市的商场或店铺等公共区

6、域的免费WIFI,用户通过一个登陆页面认证后即可免费上网,可以解决智能手机用户在公共区域内无法免费使用稳定WIFI的痛点。百米WIFI通过搜集脱敏的用户手机浏览数据,构建用户兴趣喜好模型并以此为依据进行手机广告精准投放。要构建用户兴趣模型,这里采用的方法是根据用户浏览记录,获取用户最近浏览的网页文本集并按照预先确定的类别进行文本分类,分析用户最近最常浏览的网页类别,匹配后台相应类别下的广告,并精准投放。文本分类系统是通过对用户手机浏览行为数据分析并建立用户兴趣模型,为手机广告的精准投放提供依据。本系

7、统主要包括三个部分:源数据预处理模块,文本的特征向量表示模块和文本分类及性能评价模块。数据预处理模块对采集到的原始数据进行无效数据过滤和数据字段转化等预处理工作,将原始数据转变为能被后续模块处理的文本初始向量的形式。文本的特征向量表示模块是对文本初始向量进行特征词选择和特征词权重计算,将文本的初始向量转化为能被分类器直接处理的文本特征向量的形式,这里采用的特征选择算法是卡方检验(Chi-square),特征向量权重计算方法是基于改进TF-IDF算法的New-TF-IDF算法。文本分类及性能评价模块对

8、待分类文本进行分类,分类算法采用的是RBF神经网络,根据预先定义的类别文本训练出分类模型,并对待分类文本的类别进行预测。对分类后的结果进行统计,统计出某用户最常访问的网页类别,完成用户兴趣模型的构建。性能评价部分可以并对文本分类系统的有效性进行实验验证。本论文首先对本课题研究背景意义及国内外研究现状做了介绍,对文本分类使用到的关键技术和算法进行详细的描述。紧接着从系统的总体设计出发,描述了系统的功能模块,网络结构,处理流程等。接着又对各个子模块的实现做了详细的说明。最

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。