您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(工学版)》

山东大学学报 (工学版) ›› 2019, Vol. 49 ›› Issue (4): 29-35.doi: 10.6040/j.issn.1672-3961.0.2017.400

• 机器学习与数据挖掘 • 上一篇    下一篇

基于时间序列数据的交互式主题河流可视化

陈馨菂(),李天瑞*(),杨欢欢   

  1. 西南交通大学信息科学与技术学院, 四川 成都 611756
  • 收稿日期:2017-08-23 出版日期:2019-08-20 发布日期:2019-08-06
  • 通讯作者: 李天瑞 E-mail:260226050@qq.com;trli@swjtu.edu.cn
  • 作者简介:陈馨菂(1992—),女,浙江温州人,硕士研究生,主要研究方向为数据可视化.E-mail:260226050@qq.com
  • 基金资助:
    国家自然科学基金面上资助项目(61573292)

Visualization of interactive ThemeRiver based on time-series data

Xindi CHEN(),Tianrui LI*(),Huanhuan YANG   

  1. School of Information Science and Technology, Southwest Jiaotong University, Chengdu 611756, Sichuan, China
  • Received:2017-08-23 Online:2019-08-20 Published:2019-08-06
  • Contact: Tianrui LI E-mail:260226050@qq.com;trli@swjtu.edu.cn
  • Supported by:
    国家自然科学基金面上资助项目(61573292)

摘要:

主题河流是一种常用的展示时间序列数据的可视化形式,能够有效展示多个主题的整体趋势,但由于下层河流的波动会干扰上层河流,因此用户在观察单个河流时容易产生歧义。而现有的可视化技术无法有效解决这个问题。针对上述传统主题河流存在的问题,提出如下改进方法:采用离散系数评价河流波动程度,将波动小的河流布局在下层,减少对上层河流的影响;提出歧义点概念,为用户提供波动强度和贡献度作为筛选参数,用户根据需求在交互接口中设置筛选参数,系统筛选出可能造成歧义的点在图中动态地进行标识;设计歧义点标识,标识内容包括:使用正三角或倒三角表示该点的峰谷信息;三角的颜色表示贡献度最高的主题信息;交互式主题河流重排序(用户根据歧义点信息,可通过拖拽对河流进行重新排序)。试验数据采用知乎网站的20个主题在2015年全年的活跃度信息,试验结果表明交互式主题河流能有效消除传统主题河流在展示河流趋势时产生的歧义,为用户提供更灵活、个性化的可视化展示。

关键词: 可视化, 主题河流, 时间序列, 离散系数, 交互

Abstract:

ThemeRiver was a widely used technique when visualizing time-series data, which showed the whole trend efficiently. But the user often encountered ambiguity when observing a single river due to the influence of the lower river. However, the current visualization technique couldn't solve the issue. The following improvements of ThemeRiver were proposed upon the above issue: The river fluctuation was evaluated by the coefficient of variance instead of standard deviation, and the rivers with smaller fluctuation were arranged in lower position in order to reduce the impact on the upper rivers; The concept of ambiguity point was proposed, and the user could set fluctuation and max contribution as filtering parameters in the user interface so that the ambiguity points would be dynamically displayed by the system; The ambiguity point was visualized as bellow(The peak and valley of a river were represented by triangle and inverted triangle, respectively; The triangles would be filled with the color of the river with max contribution; A reorderable interactive ThemeRiver was proposed, in which the user was able to reorder the rivers by dragging them according to the information given by the ambiguity points). The proposed method was applied on the data containing 20 themes of 2015 from Zhihu and the results showed that the system could efficiently eliminate the ambiguity of ThemeRiver when presenting the trend of a single river and provided a flexible and personalized visualization.

Key words: visualization, ThemeRiver, time-series, coefficient of variance, interaction

中图分类号: 

  • TP391.1

图1

歧义点展示图"

图2

局部波动强度示意图"

图3

歧义点可视化设计展示图"

图4

详情弹框设计"

图5

歧义点筛选交互设计"

图6

河流重排序效果展示图"

表1

主题列表"

主题名称 主题id
教育 19553176
音乐 19550453
电影 19550429
美食 19551137
旅行 19551556
时尚 19551052
健身 19552192
游戏 19550994
动漫 19591985
商业 19555457

表2

主题离散系数"

主题id 离散系数CV
19555457 4.575 840 95
19591985 4.441 672 33
19550994 3.925 709 49
19552192 3.375 679 73
19551052 3.188 013 32
19551137 2.710 706 00
19550429 2.419 658 42
19551556 2.845 386 74
19550453 2.152 558 57
19553176 1.974 204 42

表3

主题河流排列顺序"

河流层数 主题id(优化前) 主题id(优化后)
1 19555457 19553176
2 19591985 19550453
3 19550994 19550429
4 19552192 19551137
5 19551052 19551556
6 19551137 19551052
7 19550429 19552192
8 19551556 19550994
9 19550453 19591985
10 19553176 19555457

表4

主题河流优化排序效果"

河流层数 离散系数(优化前) 离散系数(优化后)
1 4.575 841 02 1.97 420 440
2 3.229 129 29 1.685 311 05
3 3.144 264 85 1.460 933 59
4 2.539 484 20 1.369 912 87
5 2.011 793 01 1.293 206 15
6 1.720 135 10 1.216 612 53
7 1.668 863 66 1.164 085 16
8 1.536 073 65 1.169 589 10
9 1.454 528 34 1.220 944 50
10 1.195 745 47 1.195 745 47
均值 2.307 585 86 1.375 054 48

图7

系统整体效果图"

图8

歧义点展示"

图9

重排序效果展示"

1 JAMES J T . Illuminating the path: the research and development agenda for visual analytics[M]. IEEE Computer Society, Washington DC, USA: IEEE, 2005.
2 DEFANTI T A , BROWN M D . Visualization in scientific computing[J]. Advances in Computers, 1991, 33, 247- 307.
doi: 10.1016/S0065-2458(08)60168-0
3 任磊, 杜一, 马帅, 等. 大数据可视分析综述[J]. 软件学报, 2014, 25 (9): 1909- 1936.
REN Lei , DU Yi , MA Shuai , et al. Visual analytics towards big data[J]. Journal of Software, 2014, 25 (9): 1909- 1936.
4 HAVRE S, HETZLER B, NOWELL L. ThemeRiver: visualizing theme changes over time[C]//Proceedings of the IEEE Symposium on Information Visualization (InfoVis). Salt Lake City, USA: IEEE, 2000: 115-123.
5 BYRON L , WATTENBERG M . Stacked graphs—geometry & aesthetics[J]. IEEE Transactions on Visualization and Computer Graphics, 2008, 14 (6): 1245- 1252.
doi: 10.1109/TVCG.2008.166
6 GROPP M, NÖTH E, RIEDHAMMER K. A novel lecture browsing system using ranked key phrases and streamgraphs[C]//GROPP M, NÖTH E, RIEDHAMMER K. eds. Text, Speech and Dialogue. Berlin, Heidelberg: Springer Berlin Heidelberg, 2011: 17-24.
7 HASHIMOTO Y, MATSUSHITA R. Heat map scope technique for stacked time-series data visualization[C]//Proceedings of the 2012 16th International Conference on Information Visualisation. Montpellier, France: IEEE, 2012: 270-273.
8 KRAKER P, WAGNER C, JEANQUARTIER F, et al. On the way to a science intelligence: visualizing TEL tweets for trend detection[C]// Towards Ubiquitous Learning. Berlin, Heidelberg: Springer Berlin Heidelberg, 2011: 220-232.
9 XU P P , WU Y C , WEI E X , et al. EvoRiver: visual analysis of topic competition on social media[J]. IEEE Transactions on Visualization and Computer Graphics, 2014, 20 (12): 1753- 1762.
doi: 10.1109/TVCG.2014.2346919
10 DOU Wenwen , YU Li , WANG Xiaoyu , et al. Hierarchicaltopics: visually exploring large text collections using topic hierarchies[J]. IEEE Transactions on Visualization and Computer Graphics, 2013, 19 (12): 2002- 2011.
doi: 10.1109/TVCG.2013.162
11 LIU Shixia , ZHOU Michelle X , PAN Shimei , et al. Tiara: interactive, topic-based visual text summarization and analysis[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2012, 3 (2): 1- 28.
12 甄远刚, 陈谊, 刘莹, 等. 一种基于ThemeRiver模型的非连续层次数据可视化方法[J]. 系统仿真学报, 2015, 27 (10): 2460- 2466.
ZHEN Yuangang , CHEN Yi , LIU Ying , et al. Discontinuous hierarchical data visualization method based on ThemeRiver model[J]. Journal of System Simulation, 2015, 27 (10): 2460- 2466.
13 HERVE A . Coefficient of variation[J]. Encyclopedia of Research Design, 2010, 1, 169- 171.
[1] 于艺旋,杨耕,耿华. 连续复合运动的多模态层次化关键帧提取方法[J]. 山东大学学报 (工学版), 2023, 53(2): 42-50.
[2] 田轶群,林荣恒. 基于知识图谱的查询显示系统的设计与实现[J]. 山东大学学报 (工学版), 2022, 52(2): 67-73.
[3] 贺辉,黄君浩. 基于眼动跟踪的人机交互应用[J]. 山东大学学报 (工学版), 2021, 51(2): 1-8.
[4] 麻常辉,王亮,谭邵卿,卢奕,马欢,赵康. 考虑同步调相机无功特性的多馈入直流同时换相失败风险评估方法[J]. 山东大学学报 (工学版), 2020, 50(3): 98-103.
[5] 邹启杰,李昊宇,张汝波,裴腾达,刘艳. 自主驾驶的人机交互控制[J]. 山东大学学报 (工学版), 2019, 49(2): 23-33.
[6] 赵鹏程,张福全,杨绪兵,吴寅. 基于可视化的森林火灾监测节点优化部署策略[J]. 山东大学学报 (工学版), 2019, 49(1): 30-35, 40.
[7] 张冕,黄颖,梅海艺,郭毓. 基于Kinect的配电作业机器人智能人机交互方法[J]. 山东大学学报 (工学版), 2018, 48(5): 103-108.
[8] 程鑫,刘晗,王博,梁典,陈强. 基于双核处理器的主动磁悬浮轴承容错控制架构[J]. 山东大学学报(工学版), 2018, 48(2): 72-80.
[9] 翟继友,周静波,任永峰,王志坚. 基于背景和前景交互传播的图像显著性检测[J]. 山东大学学报(工学版), 2017, 47(2): 80-85.
[10] 何正义,曾宪华,曲省卫,吴治龙. 基于集成深度学习的时间序列预测模型[J]. 山东大学学报(工学版), 2016, 46(6): 40-47.
[11] 吴树芳,徐建民. 基于HITS算法的微博用户可信度评估[J]. 山东大学学报(工学版), 2016, 46(5): 7-12.
[12] 陶志伟,张莉. 基于马氏距离的分段矢量量化时间序列分类[J]. 山东大学学报(工学版), 2016, 46(3): 51-57.
[13] 王会青,孙宏伟,张建辉. 基于Map/Reduce的时间序列相似性搜索算法[J]. 山东大学学报(工学版), 2016, 46(1): 15-21.
[14] 麻常辉1,冯江霞2,蒋哲1,武乃虎1,吕晓禄3. 基于时间序列和神经网络法的风电功率预测[J]. 山东大学学报(工学版), 2014, 44(1): 85-89.
[15] 朱跃龙,李士进,范青松,万定生. 基于小波神经网络的水文时间序列预测[J]. 山东大学学报(工学版), 2011, 41(4): 119-124.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 李梁,罗奇鸣,陈恩红. 对象级搜索中基于图的对象排序模型(英文)[J]. 山东大学学报(工学版), 2009, 39(1): 15 -21 .
[2] Yue Khing Toh1 , XIAO Wendong2 , XIE Lihua1 . 基于无线传感器网络的分散目标跟踪:实际测试平台的开发应用(英文)[J]. 山东大学学报(工学版), 2009, 39(1): 50 -56 .
[3] 王杉,李田泽 . 一种绕线转子感应电机控制的新方法[J]. 山东大学学报(工学版), 2008, 38(3): 86 -89 .
[4] 梁京芸,王明刚,柴家前,刘永庆 . 1.6-二-(N5-取代苯基-N1-二胍)己烷盐酸盐的合成和体外抗菌活性[J]. 山东大学学报(工学版), 2008, 38(3): 104 -107 .
[5] 孙媛媛 徐衍亮 姚之宁. 旁磁制动单相感应电动机制动力的分析与计算[J]. 山东大学学报(工学版), 2009, 39(5): 120 -123 .
[6] 孟健, 李贻斌, 李彬. 四足机器人跳跃步态控制方法[J]. 山东大学学报(工学版), 2015, 45(3): 28 -34 .
[7] 何东之, 张吉沣, 赵鹏飞. 不确定性传播算法的MapReduce并行化实现[J]. 山东大学学报(工学版), 0, (): 22 -28 .
[8] 刘云,邱晓国 . 内插TOC系数法测定水体中COD研究[J]. 山东大学学报(工学版), 2007, 37(4): 108 -117 .
[9] 胡钢,冯向前,陈欣,曹力 . 带时频区间精度小波神经网络的信号仿真研究[J]. 山东大学学报(工学版), 2008, 38(1): 96 -100 .
[10] 崔新壮,商庆森,姚占勇 . 强夯在威乳高速公路改建工程中的应用研究及一般性推广[J]. 山东大学学报(工学版), 2008, 38(4): 53 -56 .