博客数据的属性拓扑分析.pdf

博客数据的属性拓扑分析.pdf

ID:55098002

大小:3.97 MB

页数:9页

时间:2020-05-09

博客数据的属性拓扑分析.pdf_第1页
博客数据的属性拓扑分析.pdf_第2页
博客数据的属性拓扑分析.pdf_第3页
博客数据的属性拓扑分析.pdf_第4页
博客数据的属性拓扑分析.pdf_第5页
资源描述:

《博客数据的属性拓扑分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第39卷第1期燕山大学学报Vol?39No?12015年1月JournalofYanshanUniversityJan.2015文章编号:1007⁃791X(2015)01⁃0042⁃09博客数据的属性拓扑分析1,∗12张涛,李慧,任宏雷(1.燕山大学信息科学与工程学院,河北秦皇岛066004;2.唐山启奥科技股份有限公司系统测试部,河北唐山063000)摘要:近些年博客逐渐呈现蓬勃发展趋势,但由于零门槛和缺少监管,博客信息斑驳繁杂,信息垃圾层出不穷。形式概念分析是数据分析与知识处理的有力工具,而属性拓扑作为

2、形式背景的新型的表示方法,在背景表示可视化和概念计算可视化方面尤其有效。本文在子拓扑并行计算形式概念的理论基础上,加入一些条件约束,通过对博客数据的形式概念计算,对博主及其博客主题内容的相关信息进行合理的整合和深层次的挖掘,有利于摒弃无用信息,为博客使用者迅速发现对自己有利和感兴趣的博客内容以及了解博客作者的相关信息提供了理论依据。关键词:形式概念分析;属性拓扑;全路径搜索;博客中图分类号:TP182文献标识码:ADOI:10.3969/j.issn.1007⁃791X.2015.01.007大的潜在应用价值

3、。0引言[10⁃12]属性拓扑作为一种新型的形式背景表示方法,可以有效地生成形式概念,本文在子拓扑计博客是以自由、开放和共享为文化特征,通过[12]算形式概念的基础上,加入一些条件约束,通过图文音象等表现形式,围绕个人网络存在的五大对博客数据的形式概念计算,对博客信息资源进功能,提供存取读写、组织沟通、评价交换等服务行了科学的整合和发掘,对斑驳繁杂的博客信息的一种社会化个人服务模式。它并不是纯粹的技进行了“过滤”,为博客使用者迅速发现对自己有术创新,而是一种逐渐演变的网络应用,一种形式利和感兴趣的博客内容以及

4、了解博客作者的相关的变化。博客的全民性,让它的传播方式成为所信息提供了理论依据,有利于摒弃无用信息,可以有人对所有人的传播。然而,博客并不如表面般促进博客文化的科学管理和博客健康、有序的繁荣,当博客毫不掩饰地在大众面前喧闹的时候,发展。接踵而来的问题使得博客乱了方寸。博客参与者的盲目性导致了博客行为过程中的迷茫与厌倦;1属性拓扑及形式概念计算由于进入的零门槛和缺少监管,彻底颠覆互联网既有模式的博客,变成了新的信息垃圾场。博客1.1属性拓扑的表示正遭受低俗肤浅成风、网络侵权等因素的困扰。在形式背景K=(G,M,

5、I)中,定义T=(V,E)作为数据分析与知识处理的有力工具,形式[10⁃12]为属性拓扑的邻接矩阵表示。其中,V=M为[1]概念分析以数学化的概念和概念层次为基础,拓扑的顶点集合,E为拓扑中边的集合。则可以[2⁃3]已经应用在众多领域,如数据挖掘、网络搜得到属性拓扑的表达式:[4⁃5][6⁃7][8⁃9]索、软件工程、本体分析等,并仍然具有很收稿日期:2014⁃06⁃25基金项目:国家自然科学基金资助项目(61273019,61201111,81273740,81373767);河北省自然科学基金资助项目(F

6、2013203368,F2015203013)作者简介:∗张涛(1979⁃),男,河北唐山人,博士,副教授,主要研究方向为信息融合、可视化模式识别、图像处理,Email:zhtao@ysu.edu.cn。第1期张涛等博客数据的属性拓扑分析43g(m)∩g(m)其他ijE(v,v)=ij{(1)Øg(m)-g(m)=Ø或g(m)-g(m)=g(m)°ijiji定义T=(V,E′)为属性拓扑的关联矩阵表1.2属性拓扑的分解与子拓扑的构造[12]示。同样,V=M为拓扑中的顶点集合,E′为拓依文献[12]可知,根据属

7、性拓扑中各属性类别扑中边的集合。由此得到属性拓扑的另一个表达及其之间的关系情况,可判断拓扑是否可分解为式为若干子拓扑。将拓扑判定为可分解后,便可以进ì1其他ïï行下一步,即拓扑的分解与子拓扑的构造。E′(vi,vj)=í0g(mi)-g(mj)=g(mi)。(2)ïï假设形式背景K=(G,M,I)可分解,其属性拓î-1g(mi)-g(mj)=Ø扑中的顶层属性的个数为n,则子拓扑数也为n。由形式背景所对应的邻接矩阵和关联矩阵,拓扑的分解与子拓扑的构造流程图如图1。即可得到以所有属性为顶点的形式背景的属性[12]

8、拓扑。图1子拓扑的分解流程图Fig.1Flowchartofdecompositionofsub⁃topologies设得到子拓扑分别为subT(V,E),subT(V,E),1.3基于子拓扑的形式概念计算算法1122…,subT(V,E)。nn利用上述得到的子拓扑进行概念的计算,假44燕山大学学报2015文献[12]通过对分解后的属性子拓扑分别进依照图2所示算法流程图,分别对子拓扑行全路径搜索实现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。