欢迎来到天天文库
浏览记录
ID:33401121
大小:2.83 MB
页数:57页
时间:2019-02-25
《基于孤立点检测的rfid数据流清洗技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、江西财经大学硕士学位论文基于孤立点检测的RFID数据流清洗技术研究姓名:李晶申请学位级别:硕士专业:计算机应用技术指导教师:廖国琼20091201基于孤立点检测的RFlD数据流清洗技术研究摘要近年来,RFID技术已广泛应用于生产、物流、交通、运输、医疗、防伪、图书管理、设备跟踪和资产管理等领域。但由于外部环境干扰和射频信号的不稳定性,I疆ID阅读器所产生的数据有时是不可靠且有噪声的,因此需对I强ID数据流进行清洗,将其转换成千净且准确的数据供上层企业应用使用。因此,如何消除海量RFID数据流中的噪声数据已成为
2、RFID中间件亟待研究的重要课题。该文首先对RFID数据流特征及其相关研究进行详细分析。然后,根据功能需求设计了RFID实时中间件的体系结构。以此为基础,重点研究了采用孤立点检测技术进行集中式单RFID数据流清洗和分布式多RFID数据流清洗。针对集中式单数据流,结合孤立点检测技术设计了一种基于核密度的数据清洗机制。该机制将交错读视为孤立点,采用核密度估计方法计算标签对象的空间密度分布,并据此判断标记对象的真实位置,即位于具有最高密度值的阅读器探测范围。该机制的优点是不需事先了解任何先验知识,是完全数据驱动技术
3、。为减少核密度计算量,该机制根据阅读器在前后两个滑动窗口中实际观测到标签的观测次数,运用二次规划模型和“动态”马尔科夫链方法计算标记对象位置发生移动的概率。在前后两个滑动窗口中,若标签对象被前一窗口所在阅读器观察到的观测次数未发生显著变化时,则认为对象位置未发生变,可省略后一窗口的核密度计算。为了进一步优化数据流处理速度,还设计了滑动窗口自适应调整策略,它根据对象位置发生变化频率的高低,动态调整滑动窗口的大小,在对象位置变化不频繁情况下,可跳过一个窗口计算概率或核密度,进一步减少计算量。针对分布式多数据流,设
4、计了一个基于距离的数据清洗机制。该机制由局部流孤立点检测算法LSOD和全局流孤立点检测算法GSOD两部分组成。J_,SOD算法充分利用安全内点的特性,以增量处理的方式在各个局部节点上检测孤立点,即交错读数据。另外,由于全局孤立点集合是所有局部孤立点集合的子集,因此GSOD算法采用抽样方法进行全局孤立点的近似估计,以减少中心节点的通信量及计算负荷。总之,该文对RFID数据流清洗技术进行了有益的探讨。通过理论分析和实验验证,表明本文所设计的策略和算法能够有效地解决交错读问题,并具有运行时间短、占用内存小、准确率高
5、等特点。关键词:RFID:数据流;数据流清洗;孤立点检测;核密度ABSTRACTRecently,RFIDtecbalologieshavebeenwidelyusedinmanyfields,suchasproduction,logistics.trafficandtransportation,medicalcare,anti·counterfeiting,librarymanagement,equipmenttrackingandassetmanagement.However,duetotheinterf
6、erenceofvariousenviromentalfactorsandinstabilityofradiofrequencysignal,thedatacollectedbytheRFIDreadersareoftennoisyandunreliable.Thus,itisurgentlytOdevelopeffectivefilterandcleaningmethodsoverRFIDdatastreamtOconvertitintoacleanandaccuratedatastre锄forenterp
7、riseapplications.Therefore,howtoremovenoisydatafromhugeRFIDdatastreamareconsideredasallimportantissueinRFIDmiddleware.Atfirst,weanalyzethecharacteristicsofRFIDdatastreamandtherelatedworkindetails.Then,afteranalyzingthefunctionalrequirementsofRFIDreal-timemi
8、ddleware,wedesignasystemarchitecturefortheRFIDmiddleware.Basedonthese,wefocusonthecleaningissuesforsingledatastreamincentralizedenvironmentandmultipledata妣锄sindistributionenvironmentrespectively,usingo
此文档下载收益归作者所有