基于张量分解的缺失数据插补算法的研究

基于张量分解的缺失数据插补算法的研究

ID:32973687

大小:1.46 MB

页数:64页

时间:2019-02-18

基于张量分解的缺失数据插补算法的研究_第1页
基于张量分解的缺失数据插补算法的研究_第2页
基于张量分解的缺失数据插补算法的研究_第3页
基于张量分解的缺失数据插补算法的研究_第4页
基于张量分解的缺失数据插补算法的研究_第5页
资源描述:

《基于张量分解的缺失数据插补算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文题目:基于张量分解的缺失数据插补算法的研究研究生朱彦君专业计算机软件与理论指导教师吴向阳副教授完成日期2013年12月杭州电子科技大学硕士学位论文基于张量分解的缺失数据插补算法的研究研究生:朱彦君指导教师:吴向阳副教授2013年12月DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterResearchonmissingdataimputationbasedontensordecompositionCandidate:ZhuYanjunSupervisor:ViceProf.WuXia

2、ngyangDecember,2013杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:日期:年月日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论

3、文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日杭州电子科技大学硕士学位论文摘要随着计算机技术在各个领域的广泛应用,需要处理的数据维数越来越高。在网络交通分析,化学数据分析等领域,采样数据通常是部分缺失的高维形式。要想对这些部分缺失的高维数据进行分析和处理,通常需要对缺失的部分进行插补。传统的处理数据缺失的方法大部分是针对向量或者矩阵形式的低维数据,对于高维数据

4、,往往将其展开成向量或者矩阵形式进行处理,但是这无疑破坏了数据本身的结构特性,插补准确度较低。近几年的研究将张量分解及高维数据的插补结合了起来,提出了一系列的算法。本文对这些算法进行了研究,提出了3种新的算法,并通过仿真实验与这些算法进行了比较。针对基于张量分解的缺失数据插补问题,本文所做的具体工作如下:1、针对小规模稠密张量的插补问题,提出了Tucker-ALS算法。经典的PARAFAC-ALS算法采用得是张量分解中的CP分解模型,采用最大期望值法解决最小二乘问题,但是速度慢,插补准确度不够高。本文提出的Tucker-ALS算法思想与其类似,但是采用的是Tucker分解模型

5、,插补速度更快。2、针对中小规模稠密张量的插补问题,提出了Tucker-WOPT算法。目前较好的PARAFAC-LM算法通过求二阶偏导数解决最小二乘问题,而CP-WOPT算法通过求梯度值来解决最小二乘问题,这两种算法都是基于张量分解中的CP分解模型的。而本文提出的Tucker-WOPT算法采用Tucker分解模型,通过求因子矩阵的一阶偏导数解决最小二乘问题,并推导出了快速计算公式。Tucker-WOPT算法比这两种算法能够获得更高的插补准确度,并且随着数据缺失比例的增加,这种优势越来越明显。3、针对大规模稀疏张量的插补问题,提出了Tucker-SOPT算法。该算法和稀疏张量的

6、CP-WOPT算法的思想类似,只不过本文采用的是Tucker分解模型。本文推导出了稀疏张量与矩阵的n-模积的计算方法,并推导出了稀疏张量的Tucker分解模型的因子矩阵的一阶偏导数计算方法。Tucker-SOPT算法与稀疏张量的CP-WOPT算法运算速度基本相同,但是插补准确度更高。关键词:张量分解,缺失数据,最大期望值法,梯度优化,高维数据插补I杭州电子科技大学硕士学位论文ABSTRACTWiththeextensiveapplicationofcomputertechnologyinvariousfields,thedimensionofdatatobeprocessed

7、isbecominghigherandhigher.Inthefieldofnetworktrafficanalysisandchemicaldataanalysis,thesamplingdataisoftenpartiallymissinginhighdimensitionpattern.Toanalysisandprocessthehighdimensiondatawithmissingvalues,weusuallyhavetoimputethemissingpart.Traditionalme

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。