PDF文件结构调研.doc

PDF文件结构调研.doc

ID:51893130

大小:306.90 KB

页数:6页

时间:2020-03-18

PDF文件结构调研.doc_第1页
PDF文件结构调研.doc_第2页
PDF文件结构调研.doc_第3页
PDF文件结构调研.doc_第4页
PDF文件结构调研.doc_第5页
资源描述:

《PDF文件结构调研.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、PDF文件结构调研目录1、PDF文件结构31.2文件头31.3文件体31.4交叉引用表(引用对象的信息)41.5文件尾51、PDF文件结构header:只包括1行行,说明PDF的版本body:内含实际的文件内容xreftable(交叉引用表),包含的是文件中引用对象的信息尾部信息:可给出文件实体包含的一些特殊对象,以及交叉引用表的位置1.2文件头声明PDF文件的版本号,且固定以“%PDF-”开头,后面紧跟PDF版本号例例如:%PDF-1.7注意点:1、从PDF-1.4版本开始,文档目录中的Version属性存在(可通

2、过文件trailer的root属性定位),可用于替换header的版本号。2、当PDF文件包含二进制数据,必须在后面跟一个注释行行,其中至少需要包含4位二进制数,通常会包含一些“高位”(0x80-0xFF)的ASCII字符,这些数值可以表示128个编码或者更更多的编码,在文件起始处进行行数据检查,以便便确定是文本型还是二进制型。1.3文件体一个PDF文件的文件体包括表示文档内容的对象。对象是文档的基本类型,表示文档的各个组成部分,如字体,页面,和实例例图形。从PDF1.5开始,主干部分也可以包含对象流,每个对象流都包

3、含一系列列间接对象。流中的对象指的是压缩对象。因此可以知道对象流的用途是压缩更更多数目的PDF对象。第一个数字3表示的是对象号,第二个数字0表示的是产生号,是用来表明它在被创建后的第几次修改,所有新创建的PDF文件的对象号应该都是0,即第一次被创建以后没有被修改过。<<>>表示的是对象内容,对象的类型为页码,页码数是1,第一页的对象数是4.1.4交叉引用表(引用对象的信息)交叉引用表包含的信息允许对文件中的间接对象进行行随意访问,以便便不不需要阅读整个文件即可定位任何特殊对象了了。每个参照表项目固定是20位。看的xr

4、ef这个关键词就代表交叉引用表的开始。交叉引用表的格式是固定的:举个例例子1.5文件尾使得应用程序在阅读文件时能够快速的搜索到参照表和某个特殊对象的位置。应用程序应从尾段开始阅读PDF文件。文件尾的格式读取文件尾和交叉引用表的过程trailer中各属性的意义举个例例子(R指的是引用任何一个对象,不不只是存在的还可以是不不存在的)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。