基于xml用户定义需求的web信息提取研究

基于xml用户定义需求的web信息提取研究

ID:33551732

大小:4.07 MB

页数:74页

时间:2019-02-27

基于xml用户定义需求的web信息提取研究_第1页
基于xml用户定义需求的web信息提取研究_第2页
基于xml用户定义需求的web信息提取研究_第3页
基于xml用户定义需求的web信息提取研究_第4页
基于xml用户定义需求的web信息提取研究_第5页
资源描述:

《基于xml用户定义需求的web信息提取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、独创性声明学位论文题目:基于xML用户自定义需求的wEB僭息提取研究本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成果。论文中引用他人已经发表或出版过的研究成果,文中已加了特别标注。对本研究及学位论文撰写曾做出贡献的老师、朋友、同仁在文中作了明确说明并表示衷心感谢。学位论文作者:签字日期:函膨年彳月,日学位论文版权使用授权书本学位论文作者完全了解西南大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权西南大学研究生院(筹)可以将学位论文的全部或部分内容编入有关数据库进行检索,可以

2、采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书,本论文:诉保密,口保密期限至年月止)。彳过勿签字日期:渤侉年,月,日签字日期:2口f咩年厂月刁日目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.IABST嗍...⋯⋯...⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯.⋯⋯⋯⋯III第1章绪论⋯⋯..⋯..⋯.⋯⋯.⋯....⋯.⋯⋯⋯.....⋯⋯.11.1研究背景及意义⋯..⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..11.2国内外研究现状⋯⋯⋯⋯⋯⋯⋯.⋯...⋯⋯⋯⋯⋯⋯..21.2.1国外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21.2.

3、2国内研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯.⋯⋯..21.2.3目前研究成果的不足⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.31.3研究主要内容和研究目标⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.31.4文章的组织结构⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯.⋯.⋯4第2章wEB信息提取相关技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯.52.1XML及相关标准⋯⋯⋯⋯.....⋯⋯⋯⋯⋯...⋯⋯⋯⋯.52.1.1XML........⋯⋯⋯.⋯...⋯⋯⋯⋯⋯...⋯⋯⋯.⋯52.1.2DOM⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯62.1.3XSL⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯72.2wEB信息提取

4、技术概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.2.1wEB信息提取与信息检索的区别⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.2.2wEB信息提取的分类⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.102.2.3WEB信息提取评价标准⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..142.3本章小结⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯15第3章系统设计思路和获取待提取页面⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.17.3.1研究概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯.173.1.1基本设计思想⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯173.1.2wEB信息提取数据源⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.203.2页面预处理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5、⋯⋯⋯⋯⋯213.2.1页面清洗⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.213.2.2XHTML转换为)(ML⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.223.3解析生成DOM树⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯233.3.1标记节点类型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯233.3.2获取节点路径表达式⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯243.4本章小结....⋯⋯..⋯⋯⋯..⋯⋯⋯⋯.⋯..⋯⋯⋯⋯26第4章获取用户需求和构造提取规则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯274.1定义目标结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。⋯⋯⋯⋯⋯274.1.1概念描述⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯274.1.2构造

6、目标结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯274.2标记样本⋯⋯一⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯..294.2.1内容映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯294.2.2结构映射.⋯⋯..⋯⋯..⋯.⋯⋯⋯⋯⋯⋯..⋯..⋯304.2.3样本数据映射规则⋯⋯⋯.⋯⋯⋯⋯⋯.⋯⋯.⋯⋯..3l4.3构造提取规则⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯..⋯⋯.314.3.1根节点存在结构映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯334.3.2根节点不存在结构映射⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.364.4本章小结⋯⋯⋯..⋯⋯⋯⋯⋯.⋯....⋯⋯.⋯.⋯⋯..38第5章实验与分析.⋯⋯⋯⋯⋯

7、..⋯⋯⋯⋯⋯⋯.....⋯.....415.1实验设计⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.415.1.1实验环境⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯4l5.1.2实验数据源⋯⋯⋯⋯..⋯..⋯.⋯..⋯.⋯⋯⋯⋯...415.1.3实验内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.415.2实验评估⋯⋯⋯⋯.⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯425.2.1简单规则提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯425.2.2复杂规则提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯445.3原型系统演示⋯.⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯.......455.4本章小结.⋯⋯.⋯⋯⋯⋯⋯⋯..⋯.⋯⋯

8、..⋯⋯⋯....48第6章总结.⋯...⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。