欢迎来到天天文库
浏览记录
ID:33962770
大小:379.00 KB
页数:12页
时间:2019-03-02
《论文(设计)-一种基于svd 和rough 集的信息过滤方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、拟建中的阜阳市中国XXXX国际服装城依托中国XX国际服装城,拟建成为皖西北地区规格最高、规模最大、商务及功能最优的现代化、国际化服装专业市场,建设规模占地约128亩,建筑面积约25万平方米,项目总投资约5亿元人民币。经过1--2年的开发建设,能达到正常运营期的中国XX.XX国际服装城将吸纳全国和世界各地的经销商、代理商企业物流总部等500—1000家,预计年交易额实现68亿元人民币,每年实现税收8000—10000万元人民币,每年实现利润1.68亿元人民币,实现就业和创业人员约2万以上。专业好文档一种基于SVD和Rough集的信息过滤方法*本研究工作得到了教育部、科技部以
2、及国家自然科学基金和国家973项目(项目编号G)的资助。陈彩云李治国南开大学组合数学研究中心,天津摘要本文提出了一种信息过滤方法,即在奇异值分解(SVD)的基础上,运用粗糙集(RoughSets)理论进行信息过滤。通过对词语×文档矩阵进行奇异值分解得出近似矩阵,改变了一些词语在相应文档中的重要性,从而使得词语更好的体现文档内容。然后运用粗糙集理论中决策表上的规则推理方法,生成我们感兴趣信息的规则库,将未知文档的条件属性与规则库里规则进行相似匹配,进行信息过滤。实验表明,该方法在准确度方面比传统的VSM和LSI要好。关键字:奇异值分解粗糙集信息过滤规则提取1、引言随着因特网
3、上信息量的迅速增加,人们往往为了找到自己需要的信息花费大量的时间和精力,如何能够更有效的,更准确的找到自己感兴趣的信息,滤除与自己的需求无关的信息已经成为基于Internet网络信息处理的当务之急。随之产生的信息过滤技术正得到越来越广泛的关注,信息过滤系统根据用户的信息需求对动态信息流进行过滤,仅把用户感兴趣的文档传送给用户,可以提高获取信息的效率,对信息过滤主要的需求是对文档与用户信息需求相关性的判断要准确,同时查全率也需要提高。本文提出了一种信息过滤方法,在奇异值分解的基础上,运用粗糙集理论中规则推理方法,建立信息过滤的规则库,对于任意一个未知文档,我们只要将其条件属
4、性与规则库中的规则进行相似匹配,进行过滤。实验证明该方法较传统的向量法和LSI方法都要好。2、粗糙集相关理论粗糙集是波兰Z.Pawlak教授提出的一种数据推理方法[1]。该理论为发现重要数据结构和复杂对象的分类提供了强有力的基础。我们首先描述与本文相关的粗糙集理论中的一些概念。(下面提到的概念和符号源自文献[2])2.1信息系统(InformationSystem)信息系统由4元集组成,记为,其中::由个研究对象组成的非空集合,称为闭域(ClosedUniverse);Q:由n个属性组成的有限非空集合;经济增长:在优化结构、提高效益和降低消耗的基础上,“十一五”期市GDP
5、年均增长12%以上(现14%以上),2010年达到650亿元以上,人均GDP力争1000美元;财政收入达到80亿元;规模以上工业销售达到550亿以上;全社会固定资产投资年均长20%,五年累计1000亿元;社会消费品销售额260亿元,年均增长20%,外贸进口总额2.5亿美元,年均增长15%;五年累计招商引资突破500亿元,力争达到600亿元拟建中的阜阳市中国XXXX国际服装城依托中国XX国际服装城,拟建成为皖西北地区规格最高、规模最大、商务及功能最优的现代化、国际化服装专业市场,建设规模占地约128亩,建筑面积约25万平方米,项目总投资约5亿元人民币。经过1--2年的开发建
6、设,能达到正常运营期的中国XX.XX国际服装城将吸纳全国和世界各地的经销商、代理商企业物流总部等500—1000家,预计年交易额实现68亿元人民币,每年实现税收8000—10000万元人民币,每年实现利润1.68亿元人民币,实现就业和创业人员约2万以上。专业好文档:表示Q中所有属性的值域,其中是属性的值域。:全决策函数(TotalDecisionFunction),使得对于任一,,有。通过作用,信息系统S能用一个有限的数据表表示,表的第i行研究对象和第j列属性有对应的值。2.2决策表(DecisionTables)如果信息系统的属性集Q可以分成互不相交的条件属性集C和决策
7、属性集D,即满足且,满足这样条件的信息系统称为决策表,记。一般情况下,集合D包含多个决策属性,但是在本文中根据研究的需要,我们只包含一个决策属性d,即D={d}。通过决策表,我们就可以对数据集进行规则推理。下面的过滤方法就是在决策表的基础上进行规则推理的。1、奇异值分解(SVD)给定m×n的矩阵M,可以分解成三个矩阵的乘积,其中U和V分别为和的正交矩阵,S为对角矩阵,S的非零对角元叫做矩阵M的奇异值,r为非零对角元的个数。定义m×n矩阵,其中由U的前k()列列向量组成的m×k的矩阵,由S的前k个最大的奇异值组成的k×k的对角矩
此文档下载收益归作者所有