图分析与可视化(pdf+epub+mobi+txt+azw3)
第Ⅲ部分 图的可视化分析
本部分的5章将讨论不同类型的图及其适用的分析。表概述了这几章的内容。
概述
第9章 关系
连接定义了图。没有连接,节点就只是一个数据表。虽然本书大部分地方只讨论节点间的一两个连接,但是很多时候节点间会有多个连接。对于许多目的,可以把多个连接聚合成一个连接。但是,对于某些类型的分析和应用,需要保留多个连接,然后基于这些连接,使用某些方法来查看、过滤和分离图的不同子集。例如,在有些应用中,找出和识别数据中的一些反常数据(例如欺诈检测或网络安全)非常重要,这时候保留单独的连接就很重要。
9.1 连接和关系
无向连接是非常简单的连接。在这个级别上,可以执行许多图分析,而且本书到目前为止的大多数示例都使用了无向连接。另外也提供了一些使用有向连接的例子。
但是在现实世界中,关系要比简单的有向和无向连接复杂得多。例如,假设你是一名LinkedIn用户。你可以查询某人,如果你们之间存在直接关联,就会立即显示这种关系。LinkedIn还会显示你和那个人之间的所有类型的关联(例如,研究领域、技能和专业知识、位置、学校、群组等)。图9-1显示了本书两位作者之间的许多连接。
图9-1 在LinkedIn社交网络上,多种类型的连接将两位作者关联起来
使用LinkedIn时,大多数时候只会看到人们之间的一个连接,例如作者之间的直接连接。但是,看到多个连接的话,能够收获额外的见解,这是汇总的连接所不能提供的。在这里这个LinkedIn示例中,连接指出了基于工作、学校、技能和群组的公共关联,可以把这些关联作为基础,开始进行一次讨论,或者搜索与其他方面的共性。