(摘要随着’()*+(*)应用的逐"> (摘要随着’()*+(*)应用的逐" />
基于内容的中文网络信息自动过滤及发布系统

基于内容的中文网络信息自动过滤及发布系统

ID:36791428

大小:273.17 KB

页数:7页

时间:2019-05-15

基于内容的中文网络信息自动过滤及发布系统_第1页
基于内容的中文网络信息自动过滤及发布系统_第2页
基于内容的中文网络信息自动过滤及发布系统_第3页
基于内容的中文网络信息自动过滤及发布系统_第4页
基于内容的中文网络信息自动过滤及发布系统_第5页
资源描述:

《基于内容的中文网络信息自动过滤及发布系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于内容的中文网络信息自动过滤及发布系统周序生%周咏梅%阳爱民!(%株洲工学院计算机系,湖南株洲2%!""&)(!复旦大学计算机系数据库中心,上海!""2##)345-67:89:;8/<86)$*=<$>(摘要随着’()*+(*)应用的逐渐普及,,,,己经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。快速、准确地发现定题领域中的信息,并自动发布在指定的网站栏目中,是广大网站管理员和用户所需的。论文介绍了一种可定题的网络信息自动过滤及发布系统,并说明系统的设计思想,关键技术和实现。关键词信息过滤信息发布?@A文章编号%""!4&##%4(!""#)%&4"%B!4"

2、#文献标识码C中图分类号DE#F#!"#$%&’()*$’&+$,-+.."/,.$0+$,12+134##*,1256,1%#%7%$8’0941(’0&+$,’1:+#%3’15’1$%1$;6’*<*#6%12=;6’*>’12&%,=>+12),&,1?(%G*H-+)5*()IJKI5H<)*+?>6*(>*,L/<8/I<’(:)6)<)*IJD*>/(I7IMN,L/<8/I<,O<(-(2%!""&)(!KI5H<)*+D*>/(I7IMN-(=’(JI+5-)6I(G*H-+)5*(),P<=-(Q(6R*+:6)N,?/-(M/-6!""2##))@#$0+-$:,6

3、)/)/*=*R*7IH5*()IJ’()*+(*),,I+7=,6=*,*1/-:1*>I5*-/*,0/6>/H+IR6=*:<:*+:-5-::6R*-(=R-7<-17*6(JI+5-)6I(+*:I<+>*:$’)6:(*>*::-+NJI+(*)0I+S-=56(6:)+-)I+:-(=<:*+:)IT<6>S7N-(=)+<7N=6:>IR*+’(JI+5-)6I(06)/-:H*>6J6>)IH6>,-(=6::<*)/*-HHI6()*=>I7<5(IJ0*1$D/6:H-H*+6()+IU=<>*:-:N:)*

4、50/6>/>-(-<)I5-)6>-77NJ67)+-)*-(=6::<*K/6(*:*(*)0I+S6(JI+5-)6I(JI+-:H*>6J6>)IH6>$’)-7:I6()+IU=<>*:=*:6M(6=*-,S*N)*>/(I7IMN-(=5*)/I=IJ65H7*5*()-)6I($A%"8’03#:’(JI+5-)6I(J67)+-)*=,’(JI+5-)6I(6::<*=,?)I+A->/6(*%引言间相对独立,相互协作,可以位于在不同地域的不同主机中,传随着网络技术的发展和普及,基于’()*+(*)数据的大量涌递和交流都是借助于,,,服务器来进行;各子

5、系统的主要现,,,,己经发展成为个巨大的分布式信息空间,为用户提功能如下:供了一个极具价值的信息源。但因’()*+(*)所固有的开放性、.-)/*+*+子系统:该子系统是一个智能体,它能依据用户动态性与异构性,又使得用户很难准确快捷地从,,,上获的意图到’()*+(*)网上去获取信息,并将结果传送给信息过滤取所需信息;为此许多网站,特别是’()+-(*)网,根据自己网络子系统。的专业特色,对某一领域的信息进行收集和整理,并发布在自己的网站上,但这些工作均是由人工来完成,它存在如下的缺陷:(%)需要大量的人力资源,且随着网页信息的快速增长,特别是’()*+(*)上在线信息的增加,单靠人工的

6、方式来处理是不切实际的;(!)目前网上信息是杂乱,半结构化的,要准确、全面地获取和发布某一领域的信息与工作人员的专业素质关系较大。为了解决上述问题,论文以中文信息为例,提出了一种基于内容的网络信息自动过滤及自动发布系统的设计方案和实现的关键技术。图%系统结构图!系统设计思想系统由如图%所示的子系统组成。信息过滤子系统:按照用户定义好的主题,利用分类算法,系统由.-)/*+*+子系统、信息过滤子系统、信息存储子系将.-)/*+*+子系统传来的信息资源进行过滤处理,将符合用户统、0*1服务器及界面子系统和信息发布子系统组成。它们之的信息取出,并将信息的有关情况传送给信息存储子系统。基金项目:

7、国家自然科学基金(编号:B"%V#"!V)作者简介:周序生(%FV"4),男,讲师,研究方向为网络信息处理、0*1数据库。周咏梅(%FV%4),女,讲师,研究方向是文本分类,0*1数据库。阳爱民(%FV"4),副教授,博士研究生,研究方向是0*1数据库,网络信息发现。%B!!""#$%&计算机工程与应用信息发布子系统:将前面两子系统获得的信息,以一定的但网页数据是一种半结构化的数据,在网页表示中,对任表现形式自动地发布到708服务器

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。