您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报 (工学版) ›› 2019, Vol. 49 ›› Issue (4): 29-35.doi: 10.6040/j.issn.1672-3961.0.2017.400

• 机器学习与数据挖掘 • 上一篇    下一篇

基于时间序列数据的交互式主题河流可视化

陈馨菂(),李天瑞*(),杨欢欢   

  1. 西南交通大学信息科学与技术学院, 四川 成都 611756
  • 收稿日期:2017-08-23 出版日期:2019-08-20 发布日期:2019-08-06
  • 通讯作者: 李天瑞 E-mail:260226050@qq.com;trli@swjtu.edu.cn
  • 作者简介:陈馨菂(1992—),女,浙江温州人,硕士研究生,主要研究方向为数据可视化.E-mail:260226050@qq.com
  • 基金资助:
    国家自然科学基金面上资助项目(61573292)

Visualization of interactive ThemeRiver based on time-series data

Xindi CHEN(),Tianrui LI*(),Huanhuan YANG   

  1. School of Information Science and Technology, Southwest Jiaotong University, Chengdu 611756, Sichuan, China
  • Received:2017-08-23 Online:2019-08-20 Published:2019-08-06
  • Contact: Tianrui LI E-mail:260226050@qq.com;trli@swjtu.edu.cn
  • Supported by:
    国家自然科学基金面上资助项目(61573292)

摘要:

主题河流是一种常用的展示时间序列数据的可视化形式,能够有效展示多个主题的整体趋势,但由于下层河流的波动会干扰上层河流,因此用户在观察单个河流时容易产生歧义。而现有的可视化技术无法有效解决这个问题。针对上述传统主题河流存在的问题,提出如下改进方法:采用离散系数评价河流波动程度,将波动小的河流布局在下层,减少对上层河流的影响;提出歧义点概念,为用户提供波动强度和贡献度作为筛选参数,用户根据需求在交互接口中设置筛选参数,系统筛选出可能造成歧义的点在图中动态地进行标识;设计歧义点标识,标识内容包括:使用正三角或倒三角表示该点的峰谷信息;三角的颜色表示贡献度最高的主题信息;交互式主题河流重排序(用户根据歧义点信息,可通过拖拽对河流进行重新排序)。试验数据采用知乎网站的20个主题在2015年全年的活跃度信息,试验结果表明交互式主题河流能有效消除传统主题河流在展示河流趋势时产生的歧义,为用户提供更灵活、个性化的可视化展示。

关键词: 可视化, 主题河流, 时间序列, 离散系数, 交互

Abstract:

ThemeRiver was a widely used technique when visualizing time-series data, which showed the whole trend efficiently. But the user often encountered ambiguity when observing a single river due to the influence of the lower river. However, the current visualization technique couldn't solve the issue. The following improvements of ThemeRiver were proposed upon the above issue: The river fluctuation was evaluated by the coefficient of variance instead of standard deviation, and the rivers with smaller fluctuation were arranged in lower position in order to reduce the impact on the upper rivers; The concept of ambiguity point was proposed, and the user could set fluctuation and max contribution as filtering parameters in the user interface so that the ambiguity points would be dynamically displayed by the system; The ambiguity point was visualized as bellow(The peak and valley of a river were represented by triangle and inverted triangle, respectively; The triangles would be filled with the color of the river with max contribution; A reorderable interactive ThemeRiver was proposed, in which the user was able to reorder the rivers by dragging them according to the information given by the ambiguity points). The proposed method was applied on the data containing 20 themes of 2015 from Zhihu and the results showed that the system could efficiently eliminate the ambiguity of ThemeRiver when presenting the trend of a single river and provided a flexible and personalized visualization.

Key words: visualization, ThemeRiver, time-series, coefficient of variance, interaction

中图分类号: 

  • TP391.1

图1

歧义点展示图"

图2

局部波动强度示意图"

图3

歧义点可视化设计展示图"

图4

详情弹框设计"

图5

歧义点筛选交互设计"

图6

河流重排序效果展示图"

表1

主题列表"

主题名称 主题id
教育 19553176
音乐 19550453
电影 19550429
美食 19551137
旅行 19551556
时尚 19551052
健身 19552192
游戏 19550994
动漫 19591985
商业 19555457

表2

主题离散系数"

主题id 离散系数CV
19555457 4.575 840 95
19591985 4.441 672 33
19550994 3.925 709 49
19552192 3.375 679 73
19551052 3.188 013 32
19551137 2.710 706 00
19550429 2.419 658 42
19551556 2.845 386 74
19550453 2.152 558 57
19553176 1.974 204 42

表3

主题河流排列顺序"

河流层数 主题id(优化前) 主题id(优化后)
1 19555457 19553176
2 19591985 19550453
3 19550994 19550429
4 19552192 19551137
5 19551052 19551556
6 19551137 19551052
7 19550429 19552192
8 19551556 19550994
9 19550453 19591985
10 19553176 19555457

表4

主题河流优化排序效果"

河流层数 离散系数(优化前) 离散系数(优化后)
1 4.575 841 02 1.97 420 440
2 3.229 129 29 1.685 311 05
3 3.144 264 85 1.460 933 59
4 2.539 484 20 1.369 912 87
5 2.011 793 01 1.293 206 15
6 1.720 135 10 1.216 612 53
7 1.668 863 66 1.164 085 16
8 1.536 073 65 1.169 589 10
9 1.454 528 34 1.220 944 50
10 1.195 745 47 1.195 745 47
均值 2.307 585 86 1.375 054 48

图7

系统整体效果图"

图8

歧义点展示"

图9

重排序效果展示"

1 JAMES J T . Illuminating the path: the research and development agenda for visual analytics[M]. IEEE Computer Society, Washington DC, USA: IEEE, 2005.
2 DEFANTI T A , BROWN M D . Visualization in scientific computing[J]. Advances in Computers, 1991, 33, 247- 307.
doi: 10.1016/S0065-2458(08)60168-0
3 任磊, 杜一, 马帅, 等. 大数据可视分析综述[J]. 软件学报, 2014, 25 (9): 1909- 1936.
REN Lei , DU Yi , MA Shuai , et al. Visual analytics towards big data[J]. Journal of Software, 2014, 25 (9): 1909- 1936.
4 HAVRE S, HETZLER B, NOWELL L. ThemeRiver: visualizing theme changes over time[C]//Proceedings of the IEEE Symposium on Information Visualization (InfoVis). Salt Lake City, USA: IEEE, 2000: 115-123.
5 BYRON L , WATTENBERG M . Stacked graphs—geometry & aesthetics[J]. IEEE Transactions on Visualization and Computer Graphics, 2008, 14 (6): 1245- 1252.
doi: 10.1109/TVCG.2008.166
6 GROPP M, NÖTH E, RIEDHAMMER K. A novel lecture browsing system using ranked key phrases and streamgraphs[C]//GROPP M, NÖTH E, RIEDHAMMER K. eds. Text, Speech and Dialogue. Berlin, Heidelberg: Springer Berlin Heidelberg, 2011: 17-24.
7 HASHIMOTO Y, MATSUSHITA R. Heat map scope technique for stacked time-series data visualization[C]//Proceedings of the 2012 16th International Conference on Information Visualisation. Montpellier, France: IEEE, 2012: 270-273.
8 KRAKER P, WAGNER C, JEANQUARTIER F, et al. On the way to a science intelligence: visualizing TEL tweets for trend detection[C]// Towards Ubiquitous Learning. Berlin, Heidelberg: Springer Berlin Heidelberg, 2011: 220-232.
9 XU P P , WU Y C , WEI E X , et al. EvoRiver: visual analysis of topic competition on social media[J]. IEEE Transactions on Visualization and Computer Graphics, 2014, 20 (12): 1753- 1762.
doi: 10.1109/TVCG.2014.2346919
10 DOU Wenwen , YU Li , WANG Xiaoyu , et al. Hierarchicaltopics: visually exploring large text collections using topic hierarchies[J]. IEEE Transactions on Visualization and Computer Graphics, 2013, 19 (12): 2002- 2011.
doi: 10.1109/TVCG.2013.162
11 LIU Shixia , ZHOU Michelle X , PAN Shimei , et al. Tiara: interactive, topic-based visual text summarization and analysis[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2012, 3 (2): 1- 28.
12 甄远刚, 陈谊, 刘莹, 等. 一种基于ThemeRiver模型的非连续层次数据可视化方法[J]. 系统仿真学报, 2015, 27 (10): 2460- 2466.
ZHEN Yuangang , CHEN Yi , LIU Ying , et al. Discontinuous hierarchical data visualization method based on ThemeRiver model[J]. Journal of System Simulation, 2015, 27 (10): 2460- 2466.
13 HERVE A . Coefficient of variation[J]. Encyclopedia of Research Design, 2010, 1, 169- 171.
[1] 王旭峰, 周迪,张风雷,宋雪萌,刘萌. 基于多粒度对齐网络的图像-文本匹配方法[J]. 山东大学学报 (工学版), 2025, 55(4): 29-39.
[2] 李旭,杨斌,刘昌斌,牛军川. 全柔性隔振系统的有限元功率流可视化研究[J]. 山东大学学报 (工学版), 2024, 54(6): 176-181.
[3] 刘新,刘冬兰,付婷,王勇,常英贤,姚洪磊,罗昕,王睿,张昊. 基于联邦学习的时间序列预测算法[J]. 山东大学学报 (工学版), 2024, 54(3): 55-63.
[4] 于艺旋,杨耕,耿华. 连续复合运动的多模态层次化关键帧提取方法[J]. 山东大学学报 (工学版), 2023, 53(2): 42-50.
[5] 田轶群,林荣恒. 基于知识图谱的查询显示系统的设计与实现[J]. 山东大学学报 (工学版), 2022, 52(2): 67-73.
[6] 贺辉,黄君浩. 基于眼动跟踪的人机交互应用[J]. 山东大学学报 (工学版), 2021, 51(2): 1-8.
[7] 麻常辉,王亮,谭邵卿,卢奕,马欢,赵康. 考虑同步调相机无功特性的多馈入直流同时换相失败风险评估方法[J]. 山东大学学报 (工学版), 2020, 50(3): 98-103.
[8] 邹启杰,李昊宇,张汝波,裴腾达,刘艳. 自主驾驶的人机交互控制[J]. 山东大学学报 (工学版), 2019, 49(2): 23-33.
[9] 赵鹏程, 张福全, 杨绪兵, 吴寅. 基于可视化的森林火灾监测节点优化部署策略[J]. 山东大学学报 (工学版), 2019, 49(1): 30-35.
[10] 张冕,黄颖,梅海艺,郭毓. 基于Kinect的配电作业机器人智能人机交互方法[J]. 山东大学学报 (工学版), 2018, 48(5): 103-108.
[11] 程鑫,刘晗,王博,梁典,陈强. 基于双核处理器的主动磁悬浮轴承容错控制架构[J]. 山东大学学报(工学版), 2018, 48(2): 72-80.
[12] 翟继友,周静波,任永峰,王志坚. 基于背景和前景交互传播的图像显著性检测[J]. 山东大学学报(工学版), 2017, 47(2): 80-85.
[13] 何正义,曾宪华,曲省卫,吴治龙. 基于集成深度学习的时间序列预测模型[J]. 山东大学学报(工学版), 2016, 46(6): 40-47.
[14] 吴树芳,徐建民. 基于HITS算法的微博用户可信度评估[J]. 山东大学学报(工学版), 2016, 46(5): 7-12.
[15] 陶志伟,张莉. 基于马氏距离的分段矢量量化时间序列分类[J]. 山东大学学报(工学版), 2016, 46(3): 51-57.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 王素玉,艾兴,赵军,李作丽,刘增文 . 高速立铣3Cr2Mo模具钢切削力建模及预测[J]. 山东大学学报(工学版), 2006, 36(1): 1 -5 .
[2] 李 侃 . 嵌入式相贯线焊接控制系统开发与实现[J]. 山东大学学报(工学版), 2008, 38(4): 37 -41 .
[3] 施来顺,万忠义 . 新型甜菜碱型沥青乳化剂的合成与性能测试[J]. 山东大学学报(工学版), 2008, 38(4): 112 -115 .
[4] 孔祥臻,刘延俊,王勇,赵秀华 . 气动比例阀的死区补偿与仿真[J]. 山东大学学报(工学版), 2006, 36(1): 99 -102 .
[5] 陈瑞,李红伟,田靖. 磁极数对径向磁轴承承载力的影响[J]. 山东大学学报(工学版), 2018, 48(2): 81 -85 .
[6] 李可,刘常春,李同磊 . 一种改进的最大互信息医学图像配准算法[J]. 山东大学学报(工学版), 2006, 36(2): 107 -110 .
[7] 季涛,高旭,孙同景,薛永端,徐丙垠 . 铁路10 kV自闭/贯通线路故障行波特征分析[J]. 山东大学学报(工学版), 2006, 36(2): 111 -116 .
[8] 浦剑1 ,张军平1 ,黄华2 . 超分辨率算法研究综述[J]. 山东大学学报(工学版), 2009, 39(1): 27 -32 .
[9] 王丽君,黄奇成,王兆旭 . 敏感性问题中的均方误差与模型比较[J]. 山东大学学报(工学版), 2006, 36(6): 51 -56 .
[10] 孙殿柱,朱昌志,李延瑞 . 散乱点云边界特征快速提取算法[J]. 山东大学学报(工学版), 2009, 39(1): 84 -86 .