资源描述:
《面向信息可视化的多媒体信息特征的向量表示研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、面向信息可视化的多媒体信息特征的向量表示研究第29卷第4期2010年4月情报杂志JOURNAlOFINTELLIGENCEVoI.29No.4A0r.2010面向信息可视化的多媒体信息特征的向量表示研究ResearchonMulti~mediaInformationFeaturesforInformationVisualization杨峰(广东商学院广东省电子商务市场应用技术重点实验室广州510320)摘要特征表示是信息可视化中一个关键环节.多媒体信息的特征表示决定了对其可视化的质量.从可视化的通用目的出发,总结多媒体常用的特征表示方法,从中选出适合可视
2、化通用框架的特征表示方法.关键词信息可视化多媒体特征特征表示中图分类号TP391G354文献标识码A文章编号1002—1965(2010)04—0159—040引言1特征表示信息可视化是一种对信息进行处理的技术,是情报学较新的研究热点.它利用视觉形式表示信息和信息之间的复杂关系,有效的可视化界面使得我们能够迅速高效地与大型数据集进行交互,从而发现隐藏在信息内部的关系,特征和规律.这些信息包括各种媒体,BruceW.H.对互联网电影库中的428440部电影进行处理,得到可视化的结果帮助观众选择影片,导演选择演员_lj;D.Kutz通过可视化25年的专利信息
3、,预测市场需求的趋势2j.按照信息的媒体类型将信息特征表示分为文本的特征表示,图像的特征表示,图形的特征表示,音频类信息的特征表示和面向信息可视化的通用的信息特征表示技术.对于不同种类的信息,他们的特征描述方法是不一样的.结构化数据和部分半结构化数据的特征已经有很好的描述方法,可视化分析可以直接使用.对于大量的多媒体信息来说,他们是非结构化信息.对他们特征表示的质量决定了对其的结构,规律可视化的质量,多媒体信息特征的表示是对其可视化的一个关键.本文首先总结多媒体常用的特征表示方法,然后从可视化的通用目的出发,分析他们的内在一致性.多媒体信息可视化的核心工
4、作可以用图1来表示_3』.该框架分为三层:第一层是原始数据层,用来收集不同种类的信息源;第二层是关系特征层,主要处理可视化所需要的信息属性,概念,结构和各种模式等可视化对象;第三层是视图对象层,用来完成将各种可视化对象映射成视图对象,从而完成可视化结果的显示.框架中的主要部件可以分为两类:一类是各级数图1信息可视化的框架简图收稿日期:2o【)9—12—01修回日期:2010…0215作青简介:杨峰(1968一).男,博士,副教授.研究方向为信息可视化,网络信息组织,信息管理与电子商务.视图对象层特征关系层原始数据层?16O?情报杂志第29卷据库,主要有:
5、a.数据源,分成其他数据源和系统内原始数据库.原始数据库的数据是从系统外获得的,分为三种不同类型,文本数据库,用来存储如科技期刊之类的大文本信息;图像数据库存储各类图片信息及他们的文字说明;音频数据库存储各类音频信息及文字说明.b.特征库,存储从原始数据库中提出不同媒体的特征.C.结构式库,存储可视化对象.d.图符库,存储标准图符,用于最终视图对象的形成,完成可视化对象的显示.另一类是一些关键处理模块,包括:a.导人模块,将系统外的信息源就导入;b.特征提取,从原始数据库中分析出表示信息本质的过程是特征提取;c.可视化算法,计算多媒体信息集合的特征,得出
6、对应的结构关系或模式;d.映射,映射的功能是将可视化对象中的属性,概念,模式,结构等与图符库中选中的图符进行组合形成适合屏幕显示的视图对象.信息可视化首先需要进行合适的特征表示,在具体采用的表示方法上进行特征抽取,进而进行可视化分析.由于不同的媒体种类的信息有不同的特征表示方法,同时不同学科领域也各自有着一些成熟经验,因此,需要按照信息可视化技术的特点,将合适的特征表示方法用于信息可视化中.2多媒体信息特征的向量表示上述框架的一个优势是便于用相同的可视化算法处理不同类型的信息.完成该工作的关键步骤是多媒体的特征表示,我们选用向量形式是基于以下一些原因.首
7、先,文本,图像和音频信息各有很多独自的特征表示形式,向量形式是都有的.如文本可以用词向量,图像的颜色,纹理,形状等特征最后也可以用向量表示,音频的特征也可以在不同层级上形成特征向量;其次,可视化算法可以针对多种特征进行分析,从目前的研究状况来看,基于向量的处理最为成熟.也就是说,如果用向量表示信息特征,最后的可视化结果最让用户满意;同时,上述框架的思路是力图用较少的模块完成可视化任务,因此,对于不同媒体的信息,如果多媒体的特征在表示格式上一致的,则文本型,图像和音频三个特征库可以合并的一起,同时可视化算法也可以得到简化;另外,这样处理也便于系统的分步实施
8、,如可以先实现文本信息的处理.当需要增加音频信息处理时,只需要补充音频库和音频特