附件州信用门户网站信息发布规范-湖南发改委

附件州信用门户网站信息发布规范-湖南发改委

ID:12428420

大小:66.50 KB

页数:21页

时间:2018-07-17

附件州信用门户网站信息发布规范-湖南发改委_第1页
附件州信用门户网站信息发布规范-湖南发改委_第2页
附件州信用门户网站信息发布规范-湖南发改委_第3页
附件州信用门户网站信息发布规范-湖南发改委_第4页
附件州信用门户网站信息发布规范-湖南发改委_第5页
资源描述:

《附件州信用门户网站信息发布规范-湖南发改委》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、附件4:市州信用门户网站信息发布规范一、制定背景信用湖南门户网站的地市动态主要来源于各市州信用平台子网站。省级信用门户网站整合湖南省各市州信用子网站内容的手段主要有网上抓取、信息报送和网站链接等方式。其中网上抓取是“信用湖南”门户网站从各级子网站获取内容的主要方式之一。网上抓取所面临的问题是,市州信用子网站缺乏统一的内容格式规范,网站内容的变动缺少统一格式的索引,不利于采集工具自动抓取和分析信息,部分属性缺少或不易准确提取。为了更准确地采集和分析下属子网站的信息,需要规范网站的页面内容格式,并为网站内容的变更添加统一的索引。市州子网站按照统一要求经过

2、规范化设计后,信用湖南门户网站可以通过内容整合系统准确地实现网上信息自动抓取。二、名词解释网站内容整合:本规范所指的网站内容整合,仅限于对湖南省各市州信用子网站发布的底层静态网页内容的抓取,不包含对信用信息发布、信用信息查询等应用服务系统中数据内容的整合。—19—RSS标准:RSS(“RichSiteSummary”或“ReallySimpleSyndication”的首字母缩写)中文称作“简易信息聚合”,是信息聚合的国际标准。内容变更索引文件:记录网站每个小时内容变更情况的XML文件,标准格式为HNCREDIT_RSSYYYYMMDDhh.xml。

3、当网站内容发生增、删、改等变化时,该时段的内容变更索引文件将同步更改。三、制定目标本规范围绕信息采集和网页分析功能,在保持现有网站建设模式、不增加信息通道的前提下,使符合规范的网站发布的网页内容可被“信用湖南”门户网站内容整合系统自动识别、采集,并实现网页属性信息和内容字段信息的自动引用,最大限度减少人工介入。本规范结合“信用湖南”门户网站内容整合系统,实现以下目标:1、及时发现并收集网站的信息变更情况;2、准确分析网页属性信息;3、准确定位内容信息;4、实现门户网站与子网站之间内容的自动同步;为了实现上述目标,本标准制定了四方面条款,具体含义和作用

4、说明如下:—19—1、内容字段信息规范:要实现内容整合,首先应明确每一类信息内容必须包含的字段,以及各字段所定义的各项内容的书写规范,确保内容的完整和格式的统一;2、内容字段标注规范:对信息内容按规定的字段进行标注,使内容整合系统在抓取信息后,能将各字段下的信息准确定位到市州信用子网站对应网页的对应区域;3、页面属性标注规范:一个内容网页中包含着标题、正文、作者、发表日期、正文、来源、唯一标识等基本属性,如果没有格式规范,内容整合系统很难确分析这些信息。通过制定统一的格式规范,可以实现网页属性信息的准确提取,并为分类检索打下基础;4、索引文件发布规范

5、:用于标记网站单位时间内信息变更情况,通过对索引文件的分析,可以使内容整合系统程序判断哪些内容需要抓取,并获得这些内容的链接地址。四、适用对象本规范适用于湖南省各市州信用子网站,信用湖南门户网站内容整合系统将全面支持本标准,实现对符合标准的信用子网站的准确数据采集。具体类别及内容界定如下:机构设置:市州信用机构名称、联系方式、工作职能等;法规文件:市州有关信用的法律、政府规章、规范性文件;讲话文论:市州信用机构领导发表的重要讲话与文章;规划公报:市州出台的或关于本市州信用的发展规划、政府公报—19—动态信息:市州发生的关于信用的重要动态信息;公告公示

6、:市州信用机构公开发布的公告或公示信息;五、制定原理本规范结合了RSS标准的基本规则与信用湖南门户网站信息内容的特性。实现规范的基本方法是,在网页HTML中,嵌入特定意义的标识信息,用于标注各项有意义的内容,这些嵌入的标识信息采用HTML的meta和特殊注释语句置标,在实现属性标注功能的同时,不影响网页的显示效果。构成网页的HTML文件逻辑上可以分为内容(Content)和页面展示(Style)两部分,内容部分包括网页的标题、日期、正文、作者等数据元素,它决定了网页所包含的信息;页面展示部分包括每个元素的位置、字体、大小、颜色等,它决定了网页在浏览器

7、中的显示效果。HTML文件能够将内容和页面展示有机地结合为一体。本规范的制定主要从网页内容标注入手,从内容层面对网页进行标注,而忽略页面展示层面。具体方法是,利用HTML文件的特性,在不影响网页展示效果的前提下,加入各类属性置标,规定网站发布内容必须包含的信息。例如,在网页中标注网站信息、栏目信息、标题、日期、作者、来源等元数据内容,从根本上保证其它应用对该网页属性的准确识别和提取。六、规范条款6.1内容字段信息规范—19—说明:为第4部分“适用对象”中规定的信用信息定义基本的内容字段和信息填写格式,各子网站发布的相应内容,必须包含该类别的基本字段,

8、并按规范格式填写。用途:保证子网站与“信用湖南”门户网站内容的一致性,保证被整合的各类内容包含了门户网站所需

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。