互联网舆情监控系统需求分析.doc

互联网舆情监控系统需求分析.doc

ID:55686383

大小:20.50 KB

页数:5页

时间:2020-05-24

互联网舆情监控系统需求分析.doc_第1页
互联网舆情监控系统需求分析.doc_第2页
互联网舆情监控系统需求分析.doc_第3页
互联网舆情监控系统需求分析.doc_第4页
互联网舆情监控系统需求分析.doc_第5页
资源描述:

《互联网舆情监控系统需求分析.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、互联网舆情监控系统需求分析一、建设目标为了实现高效的互联网舆情监测和控制管理,项目建设应完成如下目标:1)对指定主流门户网站(WEB网站)的网页、论坛、数字报、电子杂志、博客、微博、播客、音视频多媒体等实时信息的采集和处理。2)对指定的主流的网页、微博、音视频流等实时信息的采集和处理。3)对指定的主流网页、图片等实时信息采集和处理。4)全网(元搜索引擎)实时信息采集和处理。5)对指定到境外网站实时信息采集和处理。6)对收集到的海量信息进行检索。7)对收集到的海量信息进行自动分析。8)对基本舆情数据进行各种加工处理。9)建立网评管理系统,为舆论引导服务。

2、10)建立查处管理系统,为官方行为提供服务。11)为方便资源共享,系统网络可以弹性扩展、应用平台可以二次开发。二、系统实现功能互联网舆情监控系统应实现以下几个功能:n动态的全面的收集社会民生信息内容n过滤、消重网民曝光的违法违规信息、敏感信息n获取互联网信息热点焦点和趋势分析n分析网络舆情的爆发点和峰值n发现民意话题传播关系和演化规律n实时向上级领导通报最新情报信息、辅助领导决策n更充分了解网络社情民意n网络新闻自动获取通过网络技术,自动获取网络新闻,并且提取新闻的作者、时间、标题、正文等数据。n网络论坛自动获取通过论坛获取模块,自动抓取论坛的发贴。并

3、且提取帖子的发贴人名称,发贴时间,主贴,回贴人名称,回贴时间,回贴内容,论坛贴子的人气和热度。n智能语言理解和分析处理互联网信息资讯的分析工作分为对单一信息文档的分析和对文档集合的分析处理。对于单文档的加工,本系统中应用知识管理技术,实现信息的自动消重过滤、自动分类、自动摘要提取与自动关键词提取。n互联网信息搜索系统支持全文信息检索,检索结果按照相关度排序。系统支持模糊检索,例如:同音词检索、同意词检索。系统支持“以文找文”的方式,通过输入单篇情报信息,检索内容相似的互联网新闻或论坛帖子。三、主要功能简介1、舆情采集和处理1)根据指定的互联网信息源或检

4、索条件,用定向采集和全网覆盖监控两种方式,连续不间断和自动的对WEB资源进行采集。并进行预处理(分词、标注、语法分析、语义分析等)和优化处理(自动消重等),建立供进一步分析使用的基本索引库。2)采集对象一般为中央重点新闻网站、有影响力的商业网站、地方重点新闻网站、地方有影响力的社会网站、重点境外网站等。3)信息源内容包括:WEB网站网页、论坛、贴吧、数字报、博客、播客、微博等。4)全网覆盖监控采用元搜索引擎方式。通过集成不同的通用搜索引擎(百度、谷歌、雅虎等),全面和高效的获取信息。2、舆情检索1)对各种来源、多种格式、结构化和非结构化的社会公开信息源

5、进行检索。2)提供全文检索、关键词(热点词)检索、组合词(布尔逻辑组合方式)检索、短语检索、拼音检索、主题检索、相似检索、分类检索(针对新闻、论坛、博客、播博、微博、视频、各地市、国内、国外)、高级检索(针对标题、作者、时间、正文)等。3)提供复杂检索条件检索(针对目标网站、时间区间、检索类型、匹配度、排序方式)。4)提供智能化检索(按字索引、词索引、字词混合索引)。5)提供二次检索(在一次检索的基础上)。6)提供整段内容做为检索条件的检索。7)根据信息源周边内容的文本信息,对图片和音视频等多媒体信息源进行检索。8)提供检索结果的相关推荐。9)提供各种

6、检索结果统计。10)检索结果的查全率和查准率达到较高水准。3、舆情分析1)自动关键字提取。2)对某一完整的文本信息源进行自动内容(静态摘要)摘要提取。3)根据预先给定的检索条件进行自动多文档(动态摘要)摘要提取。4)自动主题检索和跟踪。5)自动关联分析和趋势分析。6)根据预先给定的规则进行自动分类。7)在没有给定规则的前提下,自动聚类(自动识别)出新的模式归档到数据库,以供用户分析使用。4、舆情加工和处理1)所有采集及经过处理入库的信息保留半年。2)通过设置关键词、有害词、敏感词,或通过设置某一舆情的潜在专题信息做出舆情预警。3)将人工检索以及自动生成

7、热点的相关联多种特征数据(时间分布、传播路径、话题演化、地域分布等)整合处理,并以多种形式输出,包括Word、Excel、网页、XML、多种统计图表(饼图、柱状图、趋势图、报表、曲线图)等。4)对所有来源的基本数据(采集数据量、舆情数据、发帖数据等)进行统计分析,并以多种形式输出,并以E-mail、RTX、手机短信等方式报警提示。同时在报警提示中辅以警示颜色(超过设定监控阀值的采集信息)等特征信息加强直观警示效果。5)按照预定格式,自动生成舆情报告。简报分为日报、周报、月报、专报。6)对舆情数据信息进行痕迹处理(标注、推介、上报、批示等),使舆情数据信

8、息进入办公操作流程。7)建立领导批示、各地舆情、境外舆情、网站备案信息、网站年检信息、网站违规

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。