您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报(工学版) ›› 2009, Vol. 39 ›› Issue (3): 11-15.

• 机器学习与数据挖掘 • 上一篇    下一篇

基于多粒度周期模式的时序离群点检测算法

罗玉盘 商琳   

  1. 南京大学计算机软件新技术国家重点实验室, 江苏 南京 210093
  • 收稿日期:2009-05-20 出版日期:2009-06-16 发布日期:2009-06-16
  • 通讯作者: 商琳(1973-),女,河北曲阳人,副教授,博士,主要从事数据挖掘、粒计算、粗糙集等研究. E-mail: shanglin@nju.edu.cn
  • 作者简介:罗玉盘(1987-),女,江西吉安人,硕士研究生,主要从事数据挖掘研究.E-mail: luoyupan@ai.nju.edu.cn
  • 基金资助:

    国家自然科学基金资助项目(60775046)

Detect outliers in time series data with multi-granule periodic patterns

  1. National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210093, China
  • Received:2009-05-20 Online:2009-06-16 Published:2009-06-16

摘要:

目前研究时间序列离群点检测方法大都没有考虑到数据本身的周期性,有的只能处理名词性属性. 针对实值性属性的时序数据,提出了多粒度周期模式的发现算法,该算法基于不同的时间间隔粒度来探测不同的周期模式, 并利用得到的周期模式来发现那些偏离周期模式的离群点. 该方法可有效避免将正常数据误报为异常值. 通过实验验证了该算法既可正确找出数据在不同粒度下的周期模式,又可有效探测时序数据中的异常值,并与不用周期模式发现的离群点检测算法比较,减少了对特殊事件的离群点误报.

关键词: 周期性分析;时间序列;粒度;离群点检测

Abstract:

Contributions on outlier detection in time series data have seldom taken into account the data cyclical nature and numerical attributes values. An algorithm to find periodic patterns under different granul arities was proposed, which could be  used to detect outliers in time series data with numerical attributes. This method could avoid a false alarm, and experimental results showed that it could not only correctly identify multi-ranule periodic patterns but also effectively detect outliers in data. Compared to outlier detection methods without periodic patterns, the results showed  that it could  reduce falsealarms.

Key words: periodicity analysis; time series ; granularity; outlier detection

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 曲延鹏,陈颂英,李春峰,王小鹏,滕书格 . 低压大流量自激脉冲清洗喷嘴内部气液两相流数值模拟[J]. 山东大学学报(工学版), 2006, 36(4): 16 -20 .
[2] 潘多涛,刘桂萍,刘长风 . 生物絮凝剂产生菌的筛选及培养条件优化[J]. 山东大学学报(工学版), 2008, 38(3): 99 -103 .
[3] 贾超,赵建宇,徐帮树,岳长城,李树忱 . 清水隧道围岩软土振动液化研究[J]. 山东大学学报(工学版), 2008, 38(1): 83 -87 .
[4] 徐奴文 唐春安 周济芳 唐烈先 梁正召. 锦屏二级水电站施工排水洞岩爆数值模拟[J]. 山东大学学报(工学版), 2009, 39(4): 134 -139 .
[5] 茹淼焱,王明刚, , 鲁成学, 张洪林 . 淀粉酶催化反应的最适温度的微量量热法[J]. 山东大学学报(工学版), 2008, 38(1): 113 -115 .
[6] 赵然杭,刘晓丽 . 模糊可变评价模型在山东省农村水利现代化水平评价中的应用[J]. 山东大学学报(工学版), 2008, 38(2): 86 -91 .
[7] 姚占勇,李运恒,商庆森,李世华,张宏博 . 平原水网区等级公路若干问题的研究[J]. 山东大学学报(工学版), 2008, 38(1): 70 -73 .
[8] 李景龙,李术才,李树忱,王刚,孙克国 . 泰安抽水蓄能水电站地下厂房围岩稳定性数值模拟及监测分析[J]. 山东大学学报(工学版), 2008, 38(2): 77 -82 .
[9] 姚延立,马国利. 洋葱状富勒烯的硬脂酸修饰[J]. 山东大学学报(工学版), 2010, 40(3): 91 -94 .
[10] 杨奇彪 杨志宏 刘长安 付涛. 基于面接触特性的装配方向的自动识别和提取[J]. 山东大学学报(工学版), 2010, 40(1): 73 -77 .