您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报 (工学版) ›› 2022, Vol. 52 ›› Issue (1): 19-27.doi: 10.6040/j.issn.1672-3961.0.2021.301

• • 上一篇    

函数型数据的分裂转移式层次聚类算法

孟银凤1,杨佳宇1,曹付元2   

  1. 1. 山西大学数学科学学院, 山西 太原 030006;2. 山西大学计算机与信息技术学院, 山西 太原 030006
  • 发布日期:2022-02-21
  • 作者简介:孟银凤(1979— ),女,山西大同人,副教授,博士,主要研究方向为机器学习、数据挖掘、函数型数据分析. E-mail:mengyf@sxu.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(61807022,61976184);山西省重点研发计划资助项目(201903D121162)

Split transfer hierarchical clustering algorithm for functional data

MENG Yinfeng1, YANG Jiayu1, CAO Fuyuan2   

  1. 1. School of Mathematical Sciences, Shanxi University, Taiyuan 030006, Shanxi, China;
    2. School of Computer and Information Technology, Shanxi University, Taiyuan 030006, Shanxi, China
  • Published:2022-02-21

摘要: 针对函数型数据无穷维、低信噪比和动态时变等导致传统聚类方法性能降低、运行速度变慢和结果可解释性变差等问题,提出一种分裂转移式层次聚类(split transfer hierarchical clustering, STHC)算法,与传统层次聚类算法相比,具有能够发现内部层次关系和无需设定聚类个数的特点,选择适当的函数主成分个数重构样本,达到降低曲线噪声的作用。对重构样本进行分裂转移式层次聚类,根据内部准则选出最优聚类个数,并在仿真数据和真实数据上与其他几种函数型数据聚类方法进行试验比较。结果表明,本研究提出的STHC算法具有良好的性能表现和较低的运行时间,同时能够识别出函数型数据的多层次结构,提高聚类结果的可解释性。

关键词: 函数型数据, 函数主成分分析, 聚类分析, 层次聚类, 分裂, 多层次结构

中图分类号: 

  • TP181
[1] WARD J H. Hierarchical groupings to optimize an objective function[J]. Journal of the American Statistical Association, 1963, 58: 236-244.
[2] BALL G H, HALL D J. A clustering technique for summarizing multivariate data[J]. Behavioral Science, 1967, 12: 153-155.
[3] ABRAHAM C, CORNILLON P A, MATZNER-LØBER E, et al. Unsupervised curve clustering using B-splines[J]. Scandinavian Journal of Statistics, 2003, 30: 581-595.
[4] ANTONIADIS A, BROSSAT X, CUGLIARI J, et al. Clustering functional data using wavelets[J]. International Journal of Wavelets, Multiresolution and Information Processing, 2013, 11(1): 1350003-1350030.
[5] JAMES G, SUGAR C. Clustering for sparsely sampled functional data[J]. Journal of the American Statistical Association, 2003, 98: 397-408.
[6] GIACOFCI M, LAMBERT L S, MAROT G, et al. Wavelet-based clustering for mixed-effects functional models in high dimension[J]. Biometrics, 2013, 69: 31-40.
[7] FRANCESCA I, ANNA M P, DAVIDE P, et al. Multivariate functional clustering for the morphological analysis of electrocardiograph curves[J]. Journal of the Royal Statistical Society: Series C(Applied Statistics), 2013, 62(3): 401-418.
[8] CHIOU J M, LI P L. Functional clustering and identifying substructures of longitudinal data[J]. Journal of the Royal Statistical Society Series B, 2007, 69: 679-699.
[9] LIM Y, OH H S, CHEUNG Y K. Multiscale clustering for functional data[J]. Journal of Classification, 2019, 36: 368-391.
[10] BENSMAIL H, ARUNA B, SEMMES O J, et al. Functional clustering algorithm for high-dimensional proteomics data[J]. Journal of Biomedicine and Biotechnology, 2005, 2: 80-86.
[11] MORRIS J S, BROWN P J, COOMBES K R. Statistical contributions to proteomic research[J]. Methods in Molecular Biology, 2010, 641: 143-166.
[12] 孟银凤,梁吉业.线性正则化函数Logistic模型[J].计算机研究与发展,2020, 57(8): 1617-1626. MENG Yinfeng, LIANG Jiye. Linear regularized functional logistic model[J]. Journal of Computer Research and Development, 2020, 57(8): 1617-1626.
[13] MENG Yinfeng, LIANG Jiye, QIAN Yuhua. Comparison study of orthonormal representations of functional data in classification[J]. Knowledge-Based Systems, 2016, 97: 224-236.
[14] RAMSAY J O, SILVERMAN B W. Functional data analysis [M]. Berlin, Germany: Springer, 2005.
[15] HUBERT L, ARABIE P. Comparing partitions[J]. Journal of Classification, 1985, 2: 193-218.
[16] RAY S, MALLICK B. Functional clustering by Bayesian wavelet methods[J]. Journal of the Royal Statistical Society(Series B), 2006, 68: 305-332.
[17] CATTELL R B. The scree test for the number of factors[J]. Multivariate Behavioral Research, 1966, 1(2): 245-276.
[18] HASTIE T, BUJA A, TIBSHIRANI R. Penalized discriminant analysis[J]. The Annals of Statistics, 1995, 23(1): 73-102.
[1] 翟彬,张思祥,刘凯铭,田利,张来仪. 输电线路多分裂导线脱冰动力响应分析[J]. 山东大学学报 (工学版), 2021, 51(4): 111-117.
[2] 李蓓,赵松,谢志佳,牛萌. 电动汽车虚拟储能可用容量建模[J]. 山东大学学报 (工学版), 2020, 50(6): 101-111.
[3] 王雪琴,李树荣,于妤,王家岩. 带几何约束的彩色图像选择性分割[J]. 山东大学学报(工学版), 2018, 48(2): 22-29.
[4] 马相明,孙霞,张强. 轮式装载机典型作业工况构建与分析[J]. 山东大学学报 (工学版), 2015, 45(5): 82-87.
[5] 董凤娟,邹华彬*,陆玮洁,杜爱琴. 双指标等级序列模式识别法分析十全大补丸氯仿提取物红外指纹图谱[J]. 山东大学学报(工学版), 2010, 40(6): 113-119.
[6] 胡晓庆1,马儒宁1*,钟宝江2. 层次聚类算法的有效性研究[J]. 山东大学学报(工学版), 2010, 40(5): 146-149.
[7] 雷小锋1,庄伟1,程宇1,丁世飞1,谢昆青2. OPHCLUS:基于序关系保持的层次聚类算法[J]. 山东大学学报(工学版), 2010, 40(5): 48-55.
[8] 吴东洋,业宁. 基于BIRCH的木材缺陷识别[J]. 山东大学学报(工学版), 2010, 40(5): 137-140.
[9] 王好芳 吴美 陈文艳. 模糊聚类分析在区域水资源承载能力评价中的应用[J]. 山东大学学报(工学版), 2009, 39(3): 139-143.
[10] 王耘,穆勇,刘庆红 . 基于灰关联分析的模糊聚类最优划分判定模型[J]. 山东大学学报(工学版), 2006, 36(2): 86-89 .
[11] 王耘,穆勇,刘庆红 . 基于灰关联分析的模糊聚类最优划分判定模型[J]. 山东大学学报(工学版), 2006, 36(2): 86-89 .
[12] 管延勇,胡海清,王洪凯 . α-粗糙集模型中的不可分辨关系[J]. 山东大学学报(工学版), 2006, 36(1): 75-80 .
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!