iSphere-交互式探索大规模图的焦点+上下文球体可视化技术

iSphere: 交互式探索大规模图的焦点+上下文球体可视化技术

  • 论文原文:iSphere: Focus+Context Sphere Visualization for Interactive Large Graph Exploration
  • 作者:Fan Du , Nan Cao , Yu-Ru Lin
  • 发表刊物/会议:CHI ‘17 Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems。

文章主要对大图探索技术进行了一些综述,提出了一个新的焦点+上下文技术iSphere,并进行了实验:在不同窗口条件下,不同图探索任务下,比较多种图的焦点+上下文技术。结果显示,iSphere在边探索和路径探索下跟其他对照组相比有最佳的探索效率。

组会报告PDF链接

一、介绍

交互式探索是在大图数据中进行导航的一个主要方法。

有很多可视化和交互技术用来支持大图探索(也即在一块相对较小的屏幕上探索大规模图),大概能分以下几类:

  • 交互技术:包括三种:(1)基于查询的方法;(2)在层次聚类图中进行语义缩放;(3)缩放和平移;

    • 基于查询的方法:查询是探索大图最简单的方法,可以查询节点或者链接的标签,并展示一部分用户感兴趣的图。但这类探索方法只在用户任务明确,查询可以明确定义的时候才能有效。

    • 在层次聚类图中进行语义缩放**:经常被用在层次聚类图的可视化中,当用户缩放到下一个层次中,则需要可视化当前层次的图。和一般的缩放相比,语义缩放不仅改变了图的表示,也同时更新了需要展示的数据。

      层次聚类图可视化提供了附加的上下文信息用来进行数据导航。然而在不同分支下,叶节点之间的拓扑信息被隐藏,用户要进行缩放。并且,当层次比较深的时候,或者说有很大的扇出(缩放的代价)时,语义缩放就会很低效。

    • 缩放和平移:为了消除无效的语义缩放,则需要将层次扁平化或者索性去掉层次结构。但是当展示大数据集的时候就会缺少空间。缩放和平移经常一起使用,用来解决这个问题。

  • 可视化技术:两种通用的可视化设计原则:(1)概览+细节;(2)焦点+上下文。

    • 概览+细节:概览视图用来描绘整个图,然后细节图则表述不同的视角下的图的细节。

      概览视图一般在一个小的视窗下,一般悬浮在另一个大的窗口(一般用来展示部分选择的图的细节)前面,或者相反。两者通过交互一起联动。

      这种技术很容易实现并使用广泛 ,但这种在两个分离的视图中展示概览和细节的形式,打破了空间连续性。

    • 焦点+上下文:另一种通用的探索大数据的可视化设计原则。使得观察者能主要看感兴趣的部分(全细节)同时将上下文结构用概览的形式展示。焦点+上下文技术有两种分类:平面的和双曲空间的。平面探索展示的上下文太少,后者则引入了过多的畸变。

作者提出了一个新颖的焦点+上下文的展示方式,iSphere。将节点链接图映射到黎曼空间中,然后再正交投影到二维平面上。产生的焦点上下文视图,有一个聚焦区域并被周围的上下文所包围。文章的主要贡献有:

  1. 提出了一种新的用于探索大规模图的焦点上下文展示方法。
  2. 进行了第一次用于比较两种不同的焦点+上下文技术的用户调研(在不同的探索任务、屏幕大小以及图大小下进行)。
  3. 提供了针对实验结果的拓展性的分析和讨论,主要围绕不同的焦点+上下文技术在何时、为什么以及怎么发挥作用或者说它们拥有的限制。以及iSphere用在小屏幕上的优点。

二、焦点+上下文技术

焦点+上下文技术,最简单的方法就是在一个可以缩放和平移的窗口进行展示(不带有任何畸变),但这只能展示一部分的数据。

畸变导向技术

畸变导向的技术则提升了这种设计,在展示更多包围的上下文的同时,将聚焦区域放大,并且不用增加展示区域或者损失空间连续性。技术有:

  • polyfocal projection 多焦点投影[^1],下图左,图像的每个像素点上的畸变率,跟该像素离焦点中心的距离的N次方成反比。

  • graphical fisheye views 图鱼眼,下图右,将图像的鱼眼转换到拓扑结构上

  • topological fisheye views 拓扑鱼眼。在图鱼眼的基础上,增加了层次聚类图,展开焦点附近的层次聚类图,而将远离焦点的聚合起来。

但,在给定的畸变率限制下,这些技术都无法将整个可视化平面放进焦点+上下文展示中。而且,过去的用户调研显示,引入了畸变,就会降低用户的表现,因为他们需要留意畸变的形状和位置以便在脑中进行回忆。

非欧式几何技术

非欧氏几何会用来构造更高的畸变率的焦点+上下文展示。在三维空间中有两种非欧氏几何,椭圆几何双曲几何

  • 椭圆几何能够被可视化为一个三维球体的表面,当通过正交投影将这个球体投影到屏幕上时,就会自动生成一个焦点+上下文的展示(上图左)。然而这些技术会被『表达问题』所限制,因为球体表面区域有限。
  • 双曲几何,能够用Poincare disk模型(庞加莱圆盘模型)在二维空间进行描述。就如上图右展示的那样,这种模型利用透视投影将无限的双叶双曲面投影到一个圆盘上。会有较高的畸变率,但可以投影到任意大小的窗口中。庞加莱圆盘模型是保角的,这对保持结构和形状很重要。但庞加莱圆盘模型虽然能保持角度但是却会让直线、曲线产生畸变。

iSphere解决了上述的限制,该种方法相对温和的畸变率,能比平面展现更多的上下文,相对于双曲几何而言则能降低边的扭曲。

三、ISPHERE的设计

1 设计思想

iSphere适用于任何类型的图(有向无向,无部/二部/多部,平坦图/非平坦图),可以是任何大小的节点链接图,并且可以是任意的节点链接布局。

首先,将图布局在一个虚拟平面$\Bbb P$上,将$\Bbb P$映射到单位球体$\Bbb S$上(基于球面投影Stereographic Projection的逆过程,Stereographic Projection球面投影,也就是如何将地球仪上的地图投影成平面的过程)。在这之后,$\Bbb S$会通过正交投影投影到一个二维平面上,形成一个焦点+上下文视图,如下方的示意图。

布局方法

可以用任意的布局方法,布局是离线进行的。

将虚拟平面映射到黎曼球体上

将虚拟平面映射到黎曼球体上。基于球面投影的逆过程。

球面投影的正向过程:

北极点$N: (0,0,1)$

球面上的某个点$P: (x, y, z), x^2+y^2+z^2=1$

虚拟平面上的投影结果:$$P’: (X, Y) = (\frac{x}{1-z}, \frac{y}{1-z})$$

逆向投影:

$P:(x, y, z) = (\frac{2X}{X^2+Y^2+1}), \frac{2Y}{X^2+Y^2+1}, \frac{X^2+Y^2-1}{X^2+Y^2+1})$

以上的过程是保角的,感兴趣的区域(赤道内)会被投影到南半球,其他区域则投影到北半球,无限远的点会被投影到北极点。

渲染

通常只会渲染$\Bbb S$的南半球(正交投影),因为它展示了聚焦区域。用GPU在像素级别上进行并行渲染。

当边是任意的曲线的时候,则需要将边的每个像素点都映射到球体上,然后用样条曲线进行差值来进行模拟。

当边是直线的时候,就可以简单用投影的性质进行映射。一条直线就可能是一个大的弧。

本文假设所有边都是直的。

交互

缩放和平移都在iSphere上进行了实现。缩放是通过调整$\Bbb S$的半径。平移则是基于莫比乌斯变换Möbius transformation。一个等价的实现则是保持$\Bbb S$不变,而简单平移和缩放虚拟平面。这种平移的效应可能像是旋转球体。

和双曲投影的比较

两者有很多共同的性质:

  1. 两者都将原始的欧式平面转换成了一个焦点+上下文的展示,中间区域被放大,周围区域则被压缩成为上下文。
  2. 他们都提供了保角变换,图结构能够被保留。
  3. 能够将无限的信息空间映射到单位空间中,就可以用任意大小的窗口进行可视化。

不同的性质:

  1. 双曲显示会有更高的畸变率,因为它将所有的空间都展示给用户,那么高层次的拓扑任务,比如检测聚类,就会变得更简单。但高度的畸变会让小的移动产生大的视觉变化。相对而言,iSphere将信息空间映射到三维黎曼球体上,然后正交投影到二维平面上,于是只要展示半球即可,将远离聚焦区域的节点隐藏。
  2. 一条双曲线,在庞加莱圆盘上会被映射成一个欧几里得圆的一个弧,该弧垂直于原盘边界。
  3. 在双曲几何的环境里,平面的曲率是负数,而黎曼球体上则恒定为正数。这些性质则会影响结构的表示。

四、实验设计

对照实验

比较了三种技术,平面($D_p$),双曲($D_h$),iSphere($D_s$)。

JAVA实现。

三者用了同样的布局方法。

任务

  1. 节点探索:给定一个节点,找到最高度数的邻节点。
  2. 边探索:给定两个节点,找到拥有最高度数的公共邻节点。
  3. 路径探索:给定路径,找到路径上最高度数的节点。

所有的任务都是一个广跨度的探索。只要求用户选择一个单一的目标,这样可以减少他们的操作。

变量

文章用了Exploring community structure in biological networks with random graphs[^4]中提到的图数据模型来生成能够精确控制规模和社团结构的图数据。并且用了四种不同的窗口大小。

让四名用户进行了一次试点研究来决定是否有其他的条件影响用户的表现。

并没有引入畸变透镜的技术,因为这些技术往往无法完全涵盖一个相对较大的虚拟平面,并且可能会引入其他的因素。

  • 展示技术:平面($D_p$),双曲($D_h$),iSphere($D_s$)

  • 图规模:参数为节点个数和边数。

    在试点研究中进行了选择,选出了对用户表现区分的最好的参数。

    最多2048个节点,保证所有任务都可以在大约30秒时间左右完成。(2048个节点已经是作者认知中,对照比较实验中用的规模最大的图了)

    然后为了验证不同的展示形式的scalability:当图规模指数增长的时候,用户表现的趋势。

    故而选择了$2^7, 2^8, 2^{11}$节点数量。然后8作为平均度数,边数则是1024/4096/16384。

  • 图结构:用了模块度(modularity)来测量图的聚类能力。

    高模块度的图显示了清晰的模块结构,低模块度则没有清晰结构。

    固定了聚类数量为3,使得实验难度较为中等。

  • 窗口大小:$361 \times 203mm, 148 \times 197 mm, 58 \times 104 mm, 36 \times 42 mm$,笔记本电脑、平板、⼿机、⼿表

除了以上三个原因,节点的数量和分布也很重要(参数都由试点研究进行确定,控制一个中等难度):

  • 任务一中,给定节点为一个15度的节点,邻节点分布在不同的聚类中。
  • 任务二中,两个节点从属于不同的聚类,拥有三个公共邻节点。
  • 任务三种,路径长度为5,节点散布在3个不同的聚类中。

实验条件

每个参与者要经历648条测试(3种技术,3个任务,4种窗口大小,3种图规模,2种模块度,3次重复),一共预计要花5小时完成。这太耗时了,不大可能。为了降低这个疲劳问题却保证结果的质量,作者设计了两个对照实验,来覆盖所有的测试条件。

实验I 实验II
技术 双曲($D_h$),平面($D_p$),iSphere($D_s$) 平面($D_p$),iSphere($D_s$)
任务 T1,T2,T3 T1,T2,T3
窗口大小 笔记本电脑 平板、手机、手表
图规模 小、中、大
图模块度 低、高 低、高
重复次数 3 3
参与者数量 18 18
总测试条数 2916(18*162) 1944(18*108)

假设

假设图规模较小,视窗较大的时候,三种不同技术效果差异不大;

但当图的规模增大时或者窗口的大小降低时,保留图的上下文则能够指导用户进行导航,并且更高效的找到目标。

  • $D_h$(双曲)拥有最高的畸变率,全图都会被展示出来,但只把聚焦区域留在中间,其他图压缩为上下文环绕着聚焦区域。
  • $D_s$(iSphere)有着较低的畸变率,只将相关的部分展示为上下文围绕着聚焦区域。
  • $D_p$(平面)没有畸变,展示了最少的上下文。

也就是说更高的畸变率能增加上下文的数量,从而引导数据探索,但也带来更弯曲的边以及更畸形的图结构,交互的时候容易引起更大的视觉变化。因此更高效的图探索要在两个因素之间进行平衡。

在三种技术中,$D_h$和$D_s$提供了更多的上下文信息,那么就能更好的进行节点探索任务,故而假设:

  • H1(a):在实验1中,当图规模上升的时候$D_h$比$D_s$$D_p$更高效
  • H1(b):在实验1中,当窗口大小降低时,$D_s$比$D_p$更高效。

$D_s$比$D_p$展示了更多的细节,并且它的边比$D_h$畸变更少,故而假设:

  • H2(a):在实验1的任务2中,图规模上升,$D_s$比$D_h$和$D_p$效率更高
  • H2(b):在实验2的任务2中,窗口大小下降时,$D_s$比$D_p$效率更高
  • H3(a):在实验1的任务3中,图规模上升,$D_s$比$D_h$和$D_p$效率更高
  • H3(b):在实验2的任务3中,窗口大小下降时,$D_s$比$D_p$效率更高

在任务3中,用户表现还会受到图的拓扑结构图结构的影响,当模块的结构比较清晰时,$D_p$会表现最佳,因为它保留了原始结构,没有畸变。当模块结构不清晰时,用户则会受益于焦点+上下文的展示,相信$D_s$会因为它较为温和的畸变率表现的更好:

  • H4:当模块度高时,在任务3中,$D_p$会比其他两者表现的更高效
  • H5:当模块度低时,在任务3中,$D_s$会比其他两者表现的更高效

五、用户调研

参与者和实验设备

实验1:18人,12男6女,23-34岁,均值26.55岁,标准差3.03

实验2:18人,11男7女,19-25岁,均值20.44岁,标准差1.54

都是计算机科学的学生或研究人员,有正常或者纠正到正常的视觉。

白背景,黑节点,节点大小反映了它的度数($radius=2 \times log_2(degree+1)$),边也是黑色的,1像素。

当鼠标悬浮在节点上时,该节点和邻接边会变成蓝色。当点击节点,高亮会保持,直到下次点击。

过程

  • 介绍:开始实验前,先向参与者介绍图探索技术,向他们展示同个图是如何用不同技术进行展示的,如下图,展现了不同技术不同缩放率下的结果。

    然后解释三种探索任务,然后用调研系统展示如何进行任务。

  • 练习:正式开始前都会给用户练习的时间,以保证正确理解所有的任务。练习任务包含了三种任务以及需要测试的图探索技术,使用了小规模图(128节点,1024边,0.3模块度)。

  • 正式实验:分别在实验1和实验2使用了$3 \times 3$或$2 \times 2$拉丁方阵来平衡三种技术的顺序。三种技术的不同实验用例会被随机打乱。在三组技术下用了同样的图,但是每次重用的时候都会进行旋转或镜像变化。每个实验用例有40秒的时间限制,每次正式的实验会大概持续1小时。每次完成一种技术,参与者都会休息一会。两个实验会分别多次进行,实验1先进行。

数据收集和分析

记录了完成时间和准确度(假如找到了目标节点则为1,否则为0)来度量用户表现。

对完成时间进行了一个对数变化来归一化,然后用了对多种技术分析用ANOVA,然后成对的技术比较则用了t检验。因为准确度的结果没有遵循正态分布,则用Friedman测试和成对Wilcoxon测试来分析,所有测试用了0.5的显著水平。

多因素检验(>2) 成对检验(=2)
完成时间(正态分布) ANOVA t检验
准确率(0-1分布) Friedman Wilcoxon

实验I的结果

将所有结果用图模块度和图规模分离。

T1: 节点探索任务

误差线表示了一个95%的置信区间,左边两个为准确率,右边两个为平均完成时间;上面两个为低模块度,下面两个为高模块度

准确度:在所有情况下都没有明显区别。(a, c)

完成时间:在所有情形下也没有找到明显区别。(b, d)

总之,拒绝假设H1(a)。三种展示技术在任务1下有着相似的表现。

T2: 边探索任务

误差线表示了一个95%的置信区间。有显著性结果的行被绘制成白色背景

准确度:在低模块度、图规模较大的情况下(a),检测到了显著区别($\chi ^2(2)=6.62, p=.03$)。$D_s$和$D_p$比$D_h$有显著更高的准确度。

完成时间:没有发现任何显著差别。

总之,$D_s$在任务2中,低模块度和大图规模的情况下,会比$D_h$有更高的准确度,能够部分支持假设H2(a)。而$D_p$和$D_s$之间没有发现明显的区别。

T3: 边探索任务

误差线表示了一个95%的置信区间。有显著性结果的行被绘制成白色背景

准确度:在(a, c)中,当图规模较大时,在低模块度和高模块度的情况下都会有明显的区别。而在中等规模的图中,仅在低模块度下有差异。而在小图中则未发现显著区别。

完成时间:(b, d),低模块度情况下,当图规模中等或较大时会有显著区别,而高模块度情况下也同样。在中等规模图中,$D_s$和$D_p$会比$D_h$更快完成,而只在大图中,$D_s$会比$D_h$更快完成。

总之,在任务3中,$D_s$和$D_p$会有更好的表现,特别是当图规模扩大的时候。这些结果支持了假设H3(a)和假设H4-5

问卷调查

实验I的参与者会进行问卷调研,根据对以下情况的支持有效程度对三种方法进行排序。(Q1)节点探索;(Q2)边探索;(Q3)路径探索;(Q4)大图探索;(Q5)易用程度;(Q6)总体偏爱程度。最终结果如下图:

Results Of Study II

结果根据模块度和视窗大小进行了分离,然后所有的图规模都是大的。

T1: Node Exploration Task

误差线表示了一个95%的置信区间

准确度:$D_p$和$D_s$在所有情况下都没有明显区别。(a, c)

完成时间:$D_p$和$D_s$在所有情形下也没有找到明显区别。(b, d)

总之,拒绝假设H1(b)。$D_p$和$D_s$在不同的窗口大小下,任务1下有着相似的表现。

误差线表示了一个95%的置信区间。有显著性结果的行被绘制成白色背景

准确度:$D_p$和$D_s$在所有情况下都没有明显区别。(a, c)

完成时间:低模块度时(b),$D_s$在手机大小视窗和平板大小视窗中的平均时间都明显快于$D_p$的平均时间。在高模块度(d),$D_s$比$D_p$有明显更好的表现。

总之,$D_s$在任务2中,能够比$D_p$完成更快。特别是在小窗口下,支持假设H2(b)

T3: Path Exploration Task

误差线表示了一个95%的置信区间。有显著性结果的行被绘制成白色背景

准确度:$D_p$和$D_s$在所有情况下都没有明显区别。(a, c)

完成时间:(b, d),低模块度情况下,在所有的视窗尺寸下,$D_s$都会比$D_p$花费显著更少的时间。当在高模块度的情况下,$D_s$会比$D_p$在手机大小的窗口和平板大小的窗口中快的更明显。

总之,在任务3中,两种模块度情况下,$D_s$会比$D_p$更快完成,这些结果部分支持了假设H3(b)和假设H5,但和假设H4矛盾。

Post-Study Questionnaire

实验II的参与者会进行问卷调研,在不同窗口条件下选择他们认为更高效的技术。手表大小:10/18选择了$D_s$,手机大小:11/18选择了$D_s$,平板大小:12/18选择$D_p$。

六、讨论

为什么在实验I中,$D_h$会被认为最差的技术?

问卷中,$D_h$被用户挑选为支持大图探索最低效的技术。一个用户提到『在双曲的布局下,很难遍历所有的节点,因为节点之间的相对距离一直在变化』。另一个提到『图的形状一直在发生变化即便只是一点点的平移交互』。这些抱怨都来源于一个问题:畸变。一些用户建议:『静止的图可能才适合双曲空间的布局,它一点都不适合交互』

为什么在实验I中,$D_s$只是某些条件下强于$D_p$?

$D_s$和$D_p$相比并没有表现出显著的优势,这个发现很神奇。采访了那些在问题1-3中选择了$D_p$的人。他们都感到『比起追踪曲线,追踪直线更直观、有效』。根据结果,在追踪一个较长的路径的时候,$D_p$不够能扩展scalable。当图规模上升的时候,用户表现一个明显的下降趋势,『在$D_p$中,会花更多的时间在大图中追踪长路径,当路径太长,会记不得前面的候选节点,展示更多的上下文会帮助我记住』。因此我们认为$D_s$会比$D_p$在真实情况的大图中表现的更好。

为什么在实验I中,$D_s$最受用户欢迎?

在实验I中,在实验I中,虽然$D_s$只比$D_p$好一点,但是能够提供更好的用户体验,被最多的用户喜欢(16/18)。『球体的放大作用能够帮助我看到当前聚焦区域的细节,在平面展示中,需要放大才能达到同样级别的细节,在大数据集下,球体展示相对于其他另外两种技术会看上去更稀疏一些,所以能使得探索更简单』。一些其他用户提到『球体在有限区域内展示了更多的东西』,『当使用iSphere时,交互会更少,特别是找公共邻节点和追踪路径的时候』很多用户特别喜欢iSphere的平移操作,就类似于旋转一个球体。『在iSphere中,中心视图会被自然放大,所以只要旋转球体而并不需要放大』

为什么在实验II中,$D_s$比$D_p$在小视窗下表现的更好?

『球体展示会更少需要拖动和缩放操作,假如屏幕太小,无法同时展示太多节点,就会需要大量的平移和缩放。而球体展示能够在屏幕上展示更多的节点,就只需要更少的交互』

『球体会比平面显得更稀疏一些』

『在球体展示中,注意力能更集中,因为它使得窗口看上去更大了,跟踪路径会更有效,因为能有效的避免路径周围的拥挤』

『如果节点能够被更清晰的展示,那么在平面上跟踪直线边会更简单』

为什么要使用iSphere

我们认为在使用焦点+上下文技术时,选择一个合适的畸变率很重要。高畸变率能捕捉更多上下文信息,但也使得信息空间扭曲了,这会影响用户的感知。当屏幕较小或者图规模较大的时候,我们认为iSphere会比较合适。

[^1]: Naftali Kadmon and Eli Shlomi. 1978. A polyfocal projection for statistical surfaces. The Cartographic Journal 15, 1 (1978), 36–41.
[^2]: G W Furnas. 1986. Generalized fisheye views. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. 16–23.
[^3]: James Abello, Stephen G Kobourov, and Roman Yusufov. 2004. Visualizing large graphs with compound-fisheye views and treemaps. In International Symposium on Graph Drawing. 431–441.
[^4]: Pratha Sah, Lisa Singh, Aaron Clauset, and Shweta Bansal. 2014. Exploring community structure in biological networks with random graphs. BMC Bioinformatics 15, 1 (2014), 220.