RFID中间件关键技术研究(2)
3.1 RFID数据清洗技术
RFID利用无线射频技术传输数据,由于读写器异常或者标签之间的相互干扰,有时采集的数据不完整或是错误,即脏读,还会出现多读和漏读等现象,因此需要进行预处理,将脏读、多读和漏读等降到最低,尽可能接近真实数据,提高数据的准确度。
(1)最早在EPCGlobal的Reader Protocol协议中涉及了Smooth算法,当初的目的是为了用含有逻辑意义的事件代替大量的标签事件流,但实际上起到了平滑事件流、清洗漏读数据错误的功能。它的窗口大小固定不变。
(2)一种基于SQL查询模型的ESP(Extensible receptor Stream Processing)机制,它清洗来自不同接收器的原始物理数据,利用接受数据的时态性和空间性产生一种更准确地反映物理世界的改进流。 ESP机制设计成管道结构,利用描述性连续查询处理工具。该算法分为5个步骤,分别是Point-Smooth-Merge-Arbitrate –Virtualize,通过描述性连续查询可以对这些步骤进行编程。每个步骤有不同的清洗任务,采取不同的清洗技术。针对不同的应用,该机制十分灵活,可以根据需要采用不同的步骤。这5个步骤清洗层次逐渐升高,由对单个接收器数据的清洗,扩展到对多个接收器的处理;由对来自同种类型接收器数据的清洗,扩展到来自不同种类接收器的处理。ESP采用定长滑动窗口机制,根据RFID数据具有时间和空间相关性对数据进行清洗,但没有涉及如何设置。主要解决了漏读和多读(即噪声数据)。
(3)美国加州大学Berkeley分校提出了一种统计平滑处理算法SMURF,它将RFID数据流当作统计学中的随机事件,通过概论统计方法对漏读的数据进行填补。通过采用二项式分布模型和 -estimator模型,SMURF不断适应平滑窗口的大小。但该模型只解决了单个阅读器的数据处理问题,并且在标签快速移动时,不能很好的决定窗口大小。有一种新的改进算法,该算法在动态决定滑动窗口大小时考虑诸如读写器读写范围,读写频率,标签移动速率等因素,解决了标签快速移动时窗口大小问题。
(4)基于机器学习的数据清洗算法。提出一个RFID数据流成本意识清洗框架,包含RFID数据集和一系列带有清洗开销的清洗方法,提出一个适应性调整时间开销和准确性的总体优化算法,它能在高准确性、低消耗条件下清洗大规模数据集。文中提出了决策树和贝叶斯方法,根据不同数据特征进行最优化清洗策略选择,以达到总体开销最小化。只解决了漏读问题。
(5)综合性清洗策略,研究了两种过滤类型:去噪和去除重复数据,与基线实现相比,这两种算法更有效,同时存储历史数据需要更少的缓存空间。此外,通过预先设定一个最大延迟时间,并将接收到的数据进行缓存排序,解决了时间戮乱序问题。该算法针对性地解决了漏读、多读和重复数据清洗问题,但处理数据延迟大,效率不高,同时只考虑了单个阅读器的情况。
上述清洗算法本质上都是根据自身历史数据的特点进行平滑, 主要关注于单个读写器,忽视在现实应用中数以千计的读写器和数百万标签的巨大开销,没有考虑到监控对象之间的关系和时空的闭合性。
(6)基于虚拟空间粒度的算法。将拥有相同运动轨迹的标签作为一个虚拟单元,在一个虚拟空间粒度中的不同标签信息相似。有文献中提出空间相关性,利用在RFID实际应用中普遍的邻近读写器,以加强对大量RFID数据集的自适应清洗,为了减小开销,扩展了SMURF的多标签清洗结构。该算法针对邻近读写器数目为2到3个的情况。
(7)一种基于阅读处理状态的清洗方法,该算法利用了相关检测节点提供的有用信息帮助数据清洗,当检测到一个新的标签,将根据每个标签的阅读状态实施数据清洗。算法解决了漏读和多读,准确性高、开销小。
(8)一种全面的基于监控对象动态聚簇的高效清洗模型。它充分利用了监控对象之间的关系和时空的闭合性。通过定义关联度和动态聚簇对各个RFID监控物体所在的小组进行动态的分析,并在此基础上定义了一套关联度维护和数据清洗的模型和算法,该数据清洗模型可以获得较好的效率和准确性。但该算法主要解决漏读和多读问题,没有涉及冗余数据处理,同时对于时间戮乱序问题也没有涉及。
3.2 RFID事件检测技术
RFID数据处理的主要目的是按照给定的规则和模式,检测出指定的事件。目前主要有以数据为中心和以事件为中心的方法。
以数据为中心的系统采用传统的数据库技术,对RFID数据进行建模,保存在数据库中,在数据库基础上,利用数据库特性,如触发器和存储过程等,实现事件处理[18]。它是最早使用的方法,代表性的系统是Simens公司的RFID中间件系统。Simens的RFID中间件系统提出了面向时态的实体关系(ER)模型(DRER),不仅能描述RFID数据的特征,还能表达业务逻辑,并支持基于分片的存储,具有可伸缩性。基于规则框架提供自动的RFID数据过滤、转换和检测,生成高层次的语义数据,在数据库基础上,利用规则进行检测,获得应用系统关心的具有高层次语义的数据。但由于性能限制,其只适合于进行历史数据的查询,或者在线监控低速事件,不适合高速、海量和实时的数据查询处理。
以事件为中心的系统是基于数据源而不是数据库对事件建模,对事件直接进行检测和处理,以获得高的效率和实时性。以事件为中心的方法核心是复杂事件处理,复杂事件处理(Complex Event Processing, CEP)是一种可以从任何分布式的基于消息的系统中提取和分析信息的技术,适合于RFID应用的高层业务信息处理。常用的复杂事件检测方法:基于Petri网、基于树、基于图和基于自动机的检测方法。
RFID复杂事件处理已有不少研究,典型的系统有美国加州大学伯克利分校的原形系统SASE[21][22]、Cornell大学开发的Cayuga系统、Texas大学Arlington分校开发的EStream系统, Dartmouth学校开发的PQS系统,RCEDA, EsperTech公司的Esper以及TPN。
SASE系统提供扩展的事件查询语言、事件查询处理器和操作优化策略等,实现了 RFID 设备的数据采集和清洗、基本事件生成、复合事件处理、事件归档以及对事件的查询。SASE定义的事件操作符包括时序关系、数值限制、时序限制、Negation和滑动窗口等操作。查询处理由6种算符的子集组成,分别是序列扫描、序列构造、选择、窗口、非操作和转换,它们由下至上构成了一个查询计划。同时考虑了大量的优化,提出了对操作符下推、基于属性分组等相关的查询优化策略。
Cayuga 系统提出了扩展的查询语言,通过了自定义的自动模型和内部命名方法来高效的检测复合事件,并讨论了相关的系统实现的技术节。
EStream 系统在数据流查询器的基础上,继承了连续事件查询器,利用规则检数据流上的复合事件,考虑了高效的增量维护算法。
(责任编辑:admin)- “扫一扫”关注融合网微信号
免责声明:我方仅为合法的第三方企业注册用户所发布的内容提供存储空间,融合网不对其发布的内容提供任何形式的保证:不保证内容满足您的要求,不保证融合网的服务不会中断。因网络状况、通讯线路、第三方网站或管理部门的要求等任何原因而导致您不能正常使用融合网,融合网不承担任何法律责任。
第三方企业注册用户在融合网发布的内容(包含但不限于融合网目前各产品功能里的内容)仅表明其第三方企业注册用户的立场和观点,并不代表融合网的立场或观点。相关各方及作者发布此信息的目的在于传播、分享更多信息,并不代表本网站的观点和立场,更与本站立场无关。相关各方及作者在我方平台上发表、发布的所有资料、言论等仅代表其作者个人观点,与本网站立场无关,不对您构成任何投资、交易等方面的建议。用户应基于自己的独立判断,自行决定并承担相应风险。
根据相关协议内容,第三方企业注册用户已知悉自身作为内容的发布者,需自行对所发表内容(如,字体、图片、文章内容等)负责,因所发表内容(如,字体、图片、文章内容等)等所引发的一切纠纷均由该内容的发布者(即,第三方企业注册用户)承担全部法律及连带责任。融合网不承担任何法律及连带责任。
第三方企业注册用户在融合网相关栏目上所发布的涉嫌侵犯他人知识产权或其他合法权益的内容(如,字体、图片、文章内容等),经相关版权方、权利方等提供初步证据,融合网有权先行予以删除,并保留移交司法机关查处的权利。参照相应司法机关的查处结果,融合网对于第三方企业用户所发布内容的处置具有最终决定权。
个人或单位如认为第三方企业注册用户在融合网上发布的内容(如,字体、图片、文章内容等)存在侵犯自身合法权益的,应准备好具有法律效应的证明材料,及时与融合网取得联系,以便融合网及时协调第三方企业注册用户并迅速做出相应处理工作。
融合网联系方式:(一)、电话:(010)57722280;(二)、电子邮箱:2029555353@qq.com dwrh@dwrh.net
对免责声明的解释、修改及更新权均属于融合网所有。