文档功能点常用程度研究和统计系统设计

文档功能点常用程度研究和统计系统设计

ID:6089698

大小:27.00 KB

页数:5页

时间:2018-01-02

文档功能点常用程度研究和统计系统设计_第1页
文档功能点常用程度研究和统计系统设计_第2页
文档功能点常用程度研究和统计系统设计_第3页
文档功能点常用程度研究和统计系统设计_第4页
文档功能点常用程度研究和统计系统设计_第5页
资源描述:

《文档功能点常用程度研究和统计系统设计》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、文档功能点常用程度研究和统计系统设计  摘要:文档功能点是文档处理中的常用概念。在文档处理中需要分析功能点的重要程度或使用频度。这项工作目前都是依靠人工,工作量大且带有主观性。该文设计的系统可完成对办公文档中所用功能点的统计,并提供分析数据,以达到自动化地获取客观数据来评价功能点重要程度的目的。关键词:文档格式;可扩展置标语言;文档处理;功能点中图分类号:TP311文献标识码:A文章编号:1009-3044(2014)03-0547-045为了改善文档的互操作性和兼容性,基于可扩展置标语言XML的文档格式标准孕育而生,比如在2006年成为国际标准的ODF[1],在2007年成为中国文档标准的U

2、OF[2],在2008年成为国际标准的OOXML[3]。虽然不同的标准已经存在,但是完全实现无障碍的文档互操作仍然具有一定难度。为了改善文档的互操作性,需要对大量的文档进行分析,其中一项重要工作是需要评价文档中功能点的重要程度。当前的评价工作主要依靠人工完成,工作量大且主观因素较强。实现自动化的、客观地评价功能点常用程度成为了一项新的需求。该文提出了一个文档功能点常用程度分析与统计系统,能取代传统的人工分析,通过对大量文档实例的统计分析,自动化地完成评价工作,进而为文档互操作性分析提供帮助。1文档模型当用户编辑文档时,时常需要编辑段落格式或者内容,像这种被编辑的文档属性就称为功能点。比如,“C

3、reator”代表了创造此文档的作者,“EditTimes”代表了作者编辑此文档的次数。文献[4]给出了模型,其中基于多个XML文档格式给出了一个树型的功能点体系,并描述了每个功能点与具体文档格式的映射关系,即给出了一个功能点在一个特定文档格式中对应的XPath。这种映射信息可用于自动提取一个具体文档所包含的功能点集合。如图1所示。2系统设计2.1文档分析5系统的输入是待分析的文档和存储着功能点描述信息的模型文件、系统的输出是所有待分析文档功能点使用情况的数学统计概率,最终将会以Excel表格形式呈现统计数据的结果。系统处理流程如图2所示,用户选择一系列要分析的文档以及模型文件,系统记录用户选

4、择的所有文件目录,依此取出文档解压成一系列XML文档。XML处理器需要使用功能点的模型文件,模型文件中有每个功能点的描述和属性信息。处理文档时,从模型文件中依此取出功能点的位置信息从而在单个文档中进行查询,如果查询到这个功能点存在,它的使用信息就被加入功能点分析数据的表中,直到模型文件中的所有功能点在这个文档中都被查询完毕时单个文档分析处理完成。接着进行下一个文档的分析处理,同样从模型中取出第一个至最后一个功能点的信息在文档中进行查询,直到完成所有文档的处理。最终对所有待分析文档功能点的分析数据进行数学统计处理最终得出统计数据。2.2功能点的统计分析系统需要对之前输出的分析情况进行统计分析,分

5、析使用三个设计好的公式,使用这三个公式可以得出文档互操作性的客观评价依据。使用的公式如图3所示。3系统实现及实验数据3.1系统实现系统使用JAVA语言编写,采用DOM4J技术对XML文档解析和处理。DOM4J它是一个开源XML解析包,应用于Java平台,采用了Java集合框架并完全支持DOM,SAX,JAXP。下面给出主要类的设计。如图4所示的FormulaThreeTran_final类具有选取模型文件、文档、功能点分析的功能。如图5所示的RateAnalysisThird类利用公式三的方法,统计分析所有已分析文档的功能点数据,其输出结果存入数据库。其他两个公式处理类与公式三设计近似。3.2

6、实验5随机给定10个后缀为docx的文档,即符合OOXML格式字处理文档,利用本系统对这10个文档进行分析得出功能点的一些统计值。图6所示为使用公式(2)对这10个文档进行统计分析得出的部分结果展示,在图表中可以看到Text_Bold功能点和Underline_DashDotDot等功能点,及各功能点的使用概率。概率高的即常用程度较高的功能点。当文档的样本量较大时,这些结果即可作为评价功能点常用程度的客观依据。4总结本文提出一种文档功能点常用程度分析与统计系统。该系统可自动地提取文档中使用的功能点集合,通过对大量具体文档的统计,分析各功能的使用频度,以此作为客观评价功能点重用程度的依据。该系统

7、的自动化分析与统计相比人工分析大大减少了用时,可以作为一种高效率的分析工具。本系统目前只实现了OOXML格式字处理文档的功能点统计分析,仍有很大的扩充空间以分析不同格式标准的文档。参考文献:[1]ISOJTC1/SC34.ISO/IEC26300:2006Informationtechnology—OpenDocumentFormatforOfficeApplications(OpenDocume

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。