基于全文检索的文书上网系统设计与实现

基于全文检索的文书上网系统设计与实现

ID:36689706

大小:11.12 MB

页数:62页

时间:2019-05-13

基于全文检索的文书上网系统设计与实现_第1页
基于全文检索的文书上网系统设计与实现_第2页
基于全文检索的文书上网系统设计与实现_第3页
基于全文检索的文书上网系统设计与实现_第4页
基于全文检索的文书上网系统设计与实现_第5页
资源描述:

《基于全文检索的文书上网系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于全文检索的文书上网系统设计与实现作王友柱指导教师:王金庆高级工程师伏晓讲师南京大学研究生毕业论文(申请工程硕士学位)南京大学软件学院2011年5月TheDesignandImplementationofon-linejudgmentwritBasedonfulwritItextretrievalWang,YouzhuSubmittedinpartialfulfillmentoftherequirementsforthedegreeofMasterofEngineeringSupervisedbySeniorEngineerWang,JinqingAssistant

2、ProfessorFu,XiaoSoftwareInstituteNANJINGUNIVERSITYNanjing,ChinaMay,2011摘要裁判文书上网是司法信息公开的主要方式之一。它既可以方便当事人了解案件详情,又能够帮助建立公平、公正、公开的审判流程及司法制度。因此,很多省市(例如:北京、上海)的法院都建立了自己的文书上网系统。该系统的主要功能是将符合公开标准的结案文书,按照规定流程发布到互联网上去,并提供一定的检索机制方便当事人查阅。然而现有的这些文书上网系统的检索方式单一,检索效率低下,并且只能检索单一数据来源。为了提高检索效率并提供更加丰富的检索选择,

3、我们应江苏省高级人民法院的要求为他们设计实现了一个基于全文检索技术的文书上网系统。该系统具有检索效率更高、检索结果更加准确、支持多数据源检索等优点。本文首先对全文检索技术进行了介绍。在全文检索中主要用到倒排索引,中文分词和结果文档相关性计算等关键技术。为此本文分别介绍了倒排索引的建立,中文分词的正向最大匹配法和逆向最大匹配法,以及在相关性计算中用到的空间向量计算方法。然后,重点介绍了基于Lucene框架的全文检索技术。本文设计并实现了一个基于全文检索的文书上网系统。此系统在Lucene框架基础上实现了对裁判文书的全文检索。此外,该系统还提供了文书申请、审核、发布功能。

4、因此,该文书上网系统从功能上被分成了文书申请、文书审核、文书发布和文书检索四个模块。本文对这四个模块的设计及实现分别进行了阐述,并简要展示了系统的运行效果。因为全文检索是该系统的特色及关键所在,所以本文重点阐述了其中的文书检索模块。在文书检索模块中,我们首先建立了ODBC数据源,然后用JDBC-ODBC桥读取文书对应案件的主要信息。然后,再从以HTML格式存储的各文书文件中解析出文书正文,这里主要用到HTML解析技术。接下来,又把上面从数据库中得到的文书信息及文书文件中抽取的文书正文通过分词器分词建立索引库。最后,利用建立的索引库实现对文书的全文检索。基于全文检索的文

5、书上网系统能够完成裁判文书从申请到审核、发布的全过程。该系统已经全面通过了测试,现正试运行在江苏省各级法院的信息平台上。关键词:裁判文书,Lucene,ole,全文检索,分词Abstract0n—linejudgmentwritisonewayofjudicialinformationdisclosure·ItcanfacilitatetheDartylitigantstounderstandthedetailsofthecases,anditcanhelpestablishafair,Justandopentrialprocessandjudicialsystem.

6、Therefore,inmanyprovincesorcit。es(suchas:Beijing,Shanghai)thecourtshaveestablishedtheirownonlinesystem·lhesYstemmakestherelateddocumentswhichmeettheopenstandardsreleasedintheInternetInacCOrdancewiththeprocess.However,retrievalefficiencyintheseexistingsystemsIslow.InOrdertoimprovesearche

7、fficiencyandproviderichersearchoptions,wedesIgnandimplementonlinesystembasedonfull—textsearchforJiangsuProvincialHigherPeopIe。sCourt.Thesystemismoreefficient,thesearchresultsaremoreaCcurate·Inthepaper,wefirstlyintroducethefull-textsearchmechanism.ThemaintechenlqueusedbVitinclud

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。