基于电子取证数据的内容分析技术和应用

基于电子取证数据的内容分析技术和应用

ID:12285702

大小:23.52 KB

页数:12页

时间:2018-07-16

基于电子取证数据的内容分析技术和应用_第1页
基于电子取证数据的内容分析技术和应用_第2页
基于电子取证数据的内容分析技术和应用_第3页
基于电子取证数据的内容分析技术和应用_第4页
基于电子取证数据的内容分析技术和应用_第5页
资源描述:

《基于电子取证数据的内容分析技术和应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于电子取证数据的内容分析技术和应用第43卷第12A期2016年12月计算机科学ComputerScienceV01.43No.12ADec2016曾超1(厦门市美亚柏科信息股份有限公司刘晓宇2林艺滨1温若辉1北京100006)2厦门361008)1(公安部网络安全保卫局摘要电子取证数据中聊天内容的数据量最大,针对内容的研判分析是重点和难点。通过采用模板、语义分析、HMM-Viterbi模型对内容提取重要信息,并采用计算文本特征值和深度学习计算语义距离挖掘涉案关键词,并通过TextRank算法提取内容关键词和自动摘要,从而能够

2、快速掌握大量的聊天内容中的主要内容关键信息,提高工—————————————————————————————————————————————————————作效率。关键词取证分析,语义分析,HMM-Viterbi,TextRank,词云图中图法分类号TP391.4文献标识码AContentAnalysisTechniqueandApplicationZENGCha01onDigitalForensicsRuo-huilI.IUXiao-yu2LINYi—binlWEN(XiamenMeiyaPicoInformationCo.

3、,Ltd.,Xiamen361008,China)1(CyberSecurityDepartment,Beijing100006,China)2AbstractrityistoInthefieldofdigitalforensics,filesofchathistoryhavethelargestdatascale,wherethedifficul—————————————————————————————————————————————————————tyandprio-analyzethecontentofthosemess

4、ages.Differenttemplates,semanticanalysisandHMNI.ViterbimodelweretOemployedextractthekeyideasoftexts.Meanwhile,utilizationtoofeigenvaluesoftextscombinedwithdeeplearningincalculatingsemanticsimilaritieswasusedindrawingthekeywordsandprocessautodigoutthekeywordsofcases.

5、Additionally,TextRankalgorithmaids—————————————————————————————————————————————————————abstractofindividualmessagefiles.A1lthreestrategiestogetheracceleratetheofunderstandingmainideasandkeymessagesdeliveredbylargescaleofdata,SOhighlyimprovingthewor-kingefficiency.Ke

6、ywordsDigitalforensics,Semanticanalysis,H~m仁Viterbi,TextRank,Wordcloud随着互联网的快速发展和移动终端的广泛普及,网络数据呈爆炸式增长,社会已经进入大数据时代。据报告显示,截止到2016年3月,国内移动互表1通知类短信的基本信息窖娑纛短信内容车船票、机票银行通知短信交通违章信息物业信息水电、煤气缴费信息快递信息可以提取的关键信息。………““”“‘姓名、行程信息姓名、性别、银行卡信息(卡号后四位、银行卡类型)、金额、余额等————————————————————

7、—————————————————————————————————姓名、车牌号、轨迹信患(时间点和地点)姓名、房产地址姓名、居住地址姓名、居住地址、快递单号联网月度活跃用户数突破9.27亿,微信月度活跃用户数达到了5.49亿。其快速发展的同时也给电子数据取证领域带来了更大的机遇和挑战,如何将大数据技术应用到取证分析领域成为了一个热门话题。在电子数据取证中,聊天内容的数据量最大,平均占总数据量的70%,每个移动终端的聊天信息通常也在几十万条,多的可达几百万条。聊天内容信息对研判分析价值很大,可以从中找到很多蛛丝马迹。大数据在取证

8、分析上应用的维度很多,本文主要说明基于自然语言处理(NI。P)的内容分析。先对聊天信息做一个归类,根据对方账号属于个人还是机构可以分为两大类:个人类和通知类。通知类包括银行、移动运营商、天然气提供商等。通知类的内容经常会包含用户的基本信息,比如银行——————————————

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。