欢迎来到天天文库
浏览记录
ID:9293832
大小:32.50 KB
页数:8页
时间:2018-04-26
《基于移动互联网的质检信息采集与聚类分析技术浅析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于移动互联网的质检信息采集与聚类分析技术浅析id=“artibody”> 【摘要】在移动互联网环境下,利用文本挖掘和搜索引擎技术,通过前端内容的自动采集处理、对敏感词进行过滤,并且进行智能聚类分类、主题检测、专题聚焦、统计分析,实现质检执法各部门对各自相关网络舆情关注的需要,支持形成质检信息分析报告,从而为决策层全面掌握信息动态、做出正确舆论引导提供分析依据。 【关键词】移动互联网质检执法舆情信息聚类分析 1引言 随着当今信息化技术的不断发展,移动互联网已经成为人们日常生活的必不可少的组成部分。依托十多年数字化进程中积蓄的能量,大量网络化信息从PC互联网向移动互联
2、网快速迁移,与移动智能终端同步渗透到国民经济各个领域和日常生活之中。在庞大的互联网体系之中,网络舆情是人们关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和,特别是关系到城市安全、供热锅炉和压力管线等特种设备的质检信息采集和聚类分析技术。如何正确采集供热锅炉和压力管线等特种设备的运行数据和情景现实,及时通知质检等相关部门,早发现、早治理,对维护城市安全具有重大意义。因此,亟待利用移动互联网技术,构建基于移动互联网的质检信息采集与聚类分析技术平台,为我国城市安全管理、质检领域热力锅炉和其它特种设备管理提供智能高效的信息化支撑服务。 2智能计算技术的质检信息监
3、控 2.1基于移动互联网的质检信息采集与聚类分析技术浅析id=“artibody”> 【摘要】在移动互联网环境下,利用文本挖掘和搜索引擎技术,通过前端内容的自动采集处理、对敏感词进行过滤,并且进行智能聚类分类、主题检测、专题聚焦、统计分析,实现质检执法各部门对各自相关网络舆情关注的需要,支持形成质检信息分析报告,从而为决策层全面掌握信息动态、做出正确舆论引导提供分析依据。 【关键词】移动互联网质检执法舆情信息聚类分析 1引言 随着当今信息化技术的不断发展,移动互联网已经成为人们日常生活的必不可少的组成部分。依托十多年数字化进程中积蓄的能量,大量网络化信息从PC互联
4、网向移动互联网快速迁移,与移动智能终端同步渗透到国民经济各个领域和日常生活之中。在庞大的互联网体系之中,网络舆情是人们关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和,特别是关系到城市安全、供热锅炉和压力管线等特种设备的质检信息采集和聚类分析技术。如何正确采集供热锅炉和压力管线等特种设备的运行数据和情景现实,及时通知质检等相关部门,早发现、早治理,对维护城市安全具有重大意义。因此,亟待利用移动互联网技术,构建基于移动互联网的质检信息采集与聚类分析技术平台,为我国城市安全管理、质检领域热力锅炉和其它特种设备管理提供智能高效的信息化支撑服务。 2智能计算技术
5、的质检信息监控 2.1移动互联网的质检信息来源 移动互联网的质检信息来源的选择对于以后的质检信息挖掘研究至关重要,只有准确地把握质检信息的最初来源,才可能获得更为全面的质检信息。目前,质检信息主要的来源有政府网站,如新华网、人民网等;新闻及网络媒体站点,如光明日报、新浪等;微博、微信、论坛、博客、百度贴吧,如强国论坛、天涯、新浪博客、中国博客网、高校贴吧等。 2.2移动互联网的质检信息采集 移动互联网的质检信息采集主要是运营方搜索引擎Web信息采集,通过Web页面之间的链接关系,利用网络爬虫从Web页面上自动获取质检信息相关信息,并且随着链接不断向整个Web页面扩展
6、的过程。 2.3移动互联网的质检信息预处理 移动互联网的质检信息预处理主要是对采集到的质检信息网页进行初步的加工和处理,为后继的质检信息分析奠定基础。主要涉及信息过滤、关键信息抽取、自动摘要等核心技术。 2.4移动互联网的质检信息分析 移动互联网的质检信息分析是指对从移动互联网中所采集到的反映质检信息的新闻、评论等信息素材进行分类、聚类、倾向性分析等,根据质检信息分析评价指标的结果,确认其可信度和有效性,然后对质检信息主题重新组织信息,经过分类和处理后生成有针对性的质检信息。 2.5移动互联网的质检信息处理 移动互联网的质检信息处理包括质检信息预警、质检信息报告
7、和质检信息引导。首先根据分析统计得到的相关质检信息,根据相关质检信息预警指标,实施报警和预测,然后向质检部门汇报总结后的质检信息,从而为质检信息工作者的决策提供服务。 3网络质检信息获取与处理id=“artibody”> 3.1爬虫技术 利用现有的网络爬虫(crawl)技术来完成网络质检信息的获取是个不错的选择,网络爬虫技术大部分是基于表单填写,按表单填写方法可分为基于领域知识的表单填写和基于网页结构分析的表单填写的爬虫技术。 (1)广度优先搜索。在互联网中,网页之间的关系错综复杂,可以借助图的结构来表示出
此文档下载收益归作者所有