使用Gephi介绍图论
信贷:马丁Grandjean、社会网络分析
作者:阿里。扎伊迪
你可曾想过谷歌地图是如何运作的吗?如何应用程序计算你的最快的路线,和它如何做得如此之快?答案也许会吓你一跳——在这些导航的应用程序和软件的支柱图论。
图论包含如何使用数学不同连接的研究,首次研究了著名的数学家,欧拉。
欧拉引入了图论的概念后,他遇到了哥尼斯堡桥问题。你可以看到下面的桥的形象从欧拉纸解决problematis广告geometriam部位pertinentis,出版于1741年。
城哥尼斯堡七桥,连接四个尸体的土地。牵涉的问题是找到一个方法来遍历这些桥梁以这样一种方式,一个人可以过每个桥只有一次,回到原点。走的道路,欧拉顶点,或节点,因为它是指在当前图理论,无论身体的土地。他标志着每个桥连接的两具尸体土地作为一个边缘,也称为顶点之间的联系。(与谷歌地图——这类似于将一个顶点在你当前的位置,一个在你的目的地,用这些点之间的路径。)通过将顶点和边在桥上,欧拉就能明白,桥的问题是无法解决的,是不可能完成这项任务的方式设计。
然而,欧拉能够提出一个综合的解决方案。他说,如果有两个以上的陆地和奇数相关的桥梁,没有办法通过每个桥只有一次,回到起点。如果有奇数个两个陆地之间的桥梁,如果你开始在一个这些这些陆地可以完成旅程。这构成了的开始欧拉图。从这里开始,威廉爵士罗文汉密尔顿开发了哈密顿图。后来,图论的发展导致了树木的发展,在现代计算机科学无处不在。
从欧拉的解决方案,当前图论的开发和扩展。我们可以用欧拉首先描述的节点和边模型复杂的关系和开发解决方案就像谷歌地图的用途。在谷歌地图,我们放置一个节点有一个十字路口,每次停车标志,交通信号灯或其他感兴趣的点,我们想模型。从这里开始,通过连接这些节点一起使用边缘,我们可以用图论找到最短的边数需要遍历两个节点。其他有趣的图论的应用包括建模和理解尼日利亚的骗子、社交媒体、投资等等。
今天,我们要看我们如何使用Gephi一个开源的网络分析可视化软件工具,著名的法国小说模式《悲惨世界》维克多。雨果。Gephi允许我们形象化、过滤和分析网络与各种内置的统计技术。我们可以用图论模型中的每个字符的小说之间的关系。每次我们看到两个角色之间的互动,我们会注意到交互作为一个边缘和人物的顶点或节点。我们可以用网络图的结果来更好地理解人物相互作用和识别最重要的人物。甚至没有读这本书,我可以用网络理论找出哪些人物最有可能基于角色的多样性的主要人物互动。
先下载Gephi——你可以使用这链接。一旦下载Gephi,启动应用程序。你会得到一个从屏幕类似这样:
今天,我们将使用《悲惨世界》。gexf文件已经加载在Gephi使它容易使用今天的教程。在样品上面的截图,你可以看到,我们有三个选择。点击“悲惨世界。gexf”文件。
我们将得到一个屏幕,看起来像这样。
这里我们将能够改变,如果我们想Gephi读入数据。现在我们将保持默认选项,然后点击“OK”。让我们理解上面写的——两个重要的信息涉及到的#节点的价值和“边缘#”价值。《悲惨世界》中的人物节点和边缘是它们之间的交互。一旦我们加载的数据,单击概述选项卡顶部一个交互式的网络视图。
这看起来不错,只是我们不知道我们的节点上的标签是什么。让我们改变,通过点击灰色的T在图形窗口的底部。调整字体大小和大胆通过单击右边的选项T。
之后我们去概述选项卡并使这些变化,我们看到最大的节点是主要人物,冉阿让。这是有道理的,因为我们认为小说的主人公最交互与其他字符相同的小说。我们也可以使用这种方法识别其他重要人物没有读过那本书。
看我们的数据,单击实验室的数据在屏幕顶部选项卡,您将能够访问一个屏幕看起来像上图。这向我们展示了不同的节点代表每个字符的小说。不同厚度的边缘,标志着多少字符连接的边缘进行交互。更厚的边缘,这两个人物互动。我们也会看到许多人物从来没有相互作用。
如果我们点击边缘在顶部菜单选项卡,我们会得到一个视图显示我们的边缘数据。我们可以添加、删除或搜索特定的节点或边缘使用这个实验室的数据视图。
我们如何分析数据?先过滤节点,这样我们只看到字符与5其他字符。回到概述选项卡。现在在过滤器窗格中单击,单击拓扑。应该有一个让你拖掉下来度范围渗透到下面的查询部分。
拖后度范围过滤器进查询部分,点击过滤按钮,你会得到一个这样的滑块。这个滑块允许你调整你想要哪些节点;目前我们所看到的每一个节点从我们的数据。如果我提高滑块从1到10,然后,我将看到所有节点,每个节点与其他节点有至少5边。
图我们可以看到,我们已经比原来的小得多。很有可能节点接触很多其他节点将字符更重要。
最后,我们怎样才能获得统计洞察力从我们的图吗?在侧栏,单击统计数据选项卡。我可以计算平均路径长度,或边缘的长度使用统计数据选项卡。如果我们映射数据集的地理点,而不是一部小说,我们可以计算节点之间的平均距离,创造一个非常基本的版本的谷歌地图。
使用网络分析和图论模型可以帮助我们周围的关系,不管我们使用的数据类型或问题。应用程序是无限的,一直延伸到文学,金融、地理数据等等。在这个例子中,我们看到了如何使用图论模型在小说的关系《悲惨世界》维克多。雨果。不读这部小说,我们能够分析和识别的主要角色,过滤字符根据他们的交互与其他字符,并计算平均路径距离字符。
你想要什么图?世界是你的Gephi和类似的工具Cytoscape,Graphviz,Visjs,美人鱼,NetworkX。
©2021斜方manbetx客户端首页公司。保留所有权利。批准的公开发布。无限的分布。箱号21 - 1107
阿里。扎伊迪是一个数据科学家斜方公司。manbetx客户端首页他的专长是机器学习和帮助启动横切的代人工智能联系项目。他有一个女士在数据从弗吉尼亚大学的科学。
横切为导向的团队致力于解决问题的一个更安全的世界。通过公私伙伴关系和联邦政府资助研发中心,我们在政府工作,与行业合作应对挑战的安全、稳定和幸福。了解更多主教法冠。
参见:
