欢迎来到天天文库
浏览记录
ID:37068878
大小:2.61 MB
页数:64页
时间:2019-05-16
《基于唐诗智能生成的信息隐藏》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要摘要随着计算机科学和网络技术的快速发展,大数据和信息时代已经到来。网络安全和信息安全是当今科技信息时代的重要研究领域,已经上升到国家战略安全高度。同时,信息安全领域的重要分支——信息隐藏是研究热点之一。文本具有轻量级、高度凝练性和广泛适用性的特点,以文本为载体的信息隐藏技术是学者喜爱挑战的难点。唐诗是中华民族的文化瑰宝,是一种语言变化大、高度凝练并且情感丰富的特殊体裁的文本。本文基于唐诗生成的文本信息隐藏,利用深度学习的理论和技术生成唐诗,并结合唐诗意象词汇设计信息隐藏算法。具体工作如下:收集从唐代至清代等的大量古诗词作品集共304240首古诗
2、,用来构成最初的唐诗语料库。以《诗学含英》为基础,运用统计学的语义相似度Sim方法和词义相关度方法,得到1024种意象相关二字词的修饰词典。对修饰词典进行注音和平仄标注工作,得到平仄词典。进一步筛选得到512种的意象词汇秘密词典。以循环神经网络语言模型为理论基础,在CentOS操作系统中,使用Google开放的Tensorflow1.0和Python2.7搭建5层并且每层含有128个神经元的循环神经网络语言模型的智能生成唐诗的系统,系统主要有Word2Vec模块、Train模块和生成秘密唐诗模块组成,训练之后的系统能够生成较好的唐诗。设计基于唐诗智
3、能生成的文本信息隐藏算法。在使用唐诗语料库训练之后的网络模型的基础上,根据秘密的比特串信息,以9比特转换成十进制的序号,索引得到秘密词典中的意象。为完成信息隐藏,意象作为生成每一句诗的关键字,在诗句的生成过程中,从秘密词典中选择符合平仄要求的词汇替换相应位置的字词,最后生成秘密唐诗。每一句诗能够隐藏9比特的信息,对于五言的唐诗的隐藏容量为11.25%,对于七言的唐诗的隐藏容量为8.04%,该算法具有较高的隐藏量和隐蔽性。关键字:文本信息隐藏;深度学习;循环神经网络;自然语言处理;唐诗I广州大学硕士学位论文AbstractWiththerapidde
4、velopmentofcomputerscienceandnetworktechnology,theeraofbigdataandinformationhascome.Networksecurityandinformationsecurityaretheimportantresearchfieldsininformationeraofscienceandtechnology,whichhaverisentotheheightofnationalstrategicsecurity.Atthesametime,asanimportantbranchin
5、theinformationsecurityfield,informationhidingisalsooneoftheresearchhotspots.Duetothewideapplicabilityofthelightweightandhighlycondensedtext,text-basedinformationhidingtechnologyisadifficultpointwhichthescholarslovetochallenge.TangPoetryisanculturaltreasuresoftheChinesenationan
6、daspecialgenrewithgreatlanguagechange,highcondensedandrichemotion.TextinformationhidingbasedongeneratingtheTangPoetryintelligently,thispaperusesthetheoryandtechnologyofdeeplearningtogeneratetheTangPoetry,anddesignstheinformationhidingalgorithmunderthecombinationoftheimagevocab
7、ularyoftheTangPoetry.Thespecificworksareasfollows:Theresearcherhascollectedatotalnumberof303440ancientpoetryworksfromtheTangDynastytotheQingDynasty,whichwasusedtoformtheinitialcorpusofTangPoetry.OnthebasisofShiXueHanYing,amodifieddictionaryof1024image-relatedtwo-characterwords
8、wasobtainedbyusingthestatisticalthesemanticsimilaritySimmetho
此文档下载收益归作者所有