Skip to main content
  1. 论文/

人类如何学习和表示网络

·5817 words·12 mins
图学习 认知科学 网络科学 统计学习 知识网络
Table of Contents

✏️ Christopher W. Lynn
✏️ Danielle S. Bassett

要点总结
#

人类从周围环境中接收的信息通常以离散序列的形式呈现,如语言中的单词或音乐中的音符。为了理解这些序列背后的复杂关系,人类需要学习和表示这些序列的网络结构。本文探讨了人类如何从这些序列中推断出大规模的网络结构,并提出了图学习这一跨学科领域,研究人类如何学习和表示网络。研究表明,人类不仅能够检测到细粒度的网络结构,如项目之间的转移概率,还能够感知网络的中观和宏观结构。

本文通过一系列实验展示了网络结构对人类行为的影响,并提出了计算模型来解释这些影响。实验表明,人类的行为不仅依赖于局部的转移概率,还受到网络中观和宏观结构的影响。 此外,本文还介绍了图学习的未来研究方向,包括如何扩展现有的图学习范式以及如何利用图学习来理解现实世界中的网络结构和功能。

关键要点
#

论文重要性
#

这项研究揭示了人类如何从离散序列中学习和表示复杂的网络结构,为理解人类认知提供了新的视角。 图学习不仅有助于解释人类如何从语言、音乐等序列中提取信息,还为理解现实世界中的网络结构和功能提供了工具。未来研究可以进一步探索图学习在认知科学、神经科学和网络科学中的交叉应用,推动这些领域的发展。


图表分析
#

人类行为受网络拓扑结构影响
#

🔼 图2展示了人类行为如何受到网络拓扑结构的影响。该图由四个子图构成,分别从实验设置、局部网络影响、以及不同网络结构对人类反应的影响进行了阐释。

(A)子图描述了一个序列反应时间实验。实验中,受试者会看到一系列刺激,并被要求做出相应的反应。刺激以五个方块呈现,其中一个或两个方块会以红色高亮显示。刺激出现的顺序由一个潜在的转移网络上的随机游走决定。受试者需要按下键盘上与高亮方块对应的键。

(B)子图展示了在具有15个节点和30条边的Erdős-Rényi随机转移网络中,受试者对一个转移i→j的平均反应时间,随着前一个节点i的度ki增加而增加。换句话说,受试者的反应时间随着转移概率Pij = 1/ki的减小而增加。这表明受试者对概率较低的转移反应较慢,对概率较高的转移反应较快。

(C)子图引入了两个具有恒定度k=4的网络,用于控制转移概率的变化。第一个网络是模块化网络,由三个各有五个节点的社区组成。第二个网络是晶格网络,表示具有周期性边界条件的3×5网格。这两个网络在局部连接性上相似,但在全局结构上不同。

(D)子图总结了实验的两个一致性发现。首先,在模块化网络中,集群间转移的反应时间比集群内转移的反应时间长。这表明受试者能够感知网络中的模块化结构,并且对跨模块的转移更为惊讶。其次,平均而言,晶格网络的反应时间比模块化网络的反应时间长。这表明网络的全局拓扑结构对人类学习有影响。总的来说,图2强调了人类不仅仅学习节点之间的简单连接,而是能够感知网络中的更高阶结构,如模块和整体拓扑,这些结构会影响他们的行为和反应时间。本图的数据表明,即使在控制了局部连接性的情况下,全局网络属性仍然对人类行为有显著影响。

更多图表分析

Saffran et al. 实验中的序列和网络
#

🔼 图 1 展示了 Saffran 等人在 1996 年进行的经典统计学习实验,该实验揭示了人类(包括婴儿)如何从连续的刺激流中识别出模式。图 1A 展示了由四个三音节伪词组成的序列示例。在这些伪词内部,音节的顺序保持不变,即内部转换概率为 1。然而,伪词的顺序是随机的,因此词间的转换概率为 1/3。婴儿可以可靠地检测到这种音节转换概率的差异,这是在语言习得过程中识别单词的关键机制。图 1B 将这种转换结构可视化为一个网络。在这个网络中,每个音节都表示为一个节点,而音节之间的转换则用有向边表示。图中清晰地显示了四个由不同颜色标记的集群,每个集群对应于人工语言中的一个不同词。集群内的边以粗黑线表示,代表概率为1的转换;集群间的边以细灰线表示,代表概率为1/3的转换。这种网络表示法突出了如何通过统计学习检测并区分单词的组成部分。通过将序列转换为网络,可以直观地看到,音节自然地分成了四个不同的群集,每个群集对应于人工语言中的一个词,从而证明人类不仅对单个连接敏感,还能发现网络的大规模特征。

网络拓扑对人类行为的影响
#

🔼 该图展示了网络拓扑结构对人类行为的影响,主要通过一个序列反应时间任务来研究。图A展示了实验流程:参与者观看一系列刺激,这些刺激按照底层网络的随机游走顺序呈现,并需要根据屏幕上高亮的方块做出相应的手指按键反应。图B展示了一个随机网络,并显示了随着前一个节点度的增加,参与者的平均反应时间也随之增加,即更频繁的转变更容易预测,因此反应时间更快。图C展示了两个特殊的网络:模块化网络和晶格网络,它们都具有恒定的节点度,确保了所有转变的概率相同。模块化网络由三个紧密连接的社区组成,而晶格网络则呈网格状结构。图D展示了实验结果:在模块化网络中,社区内的转变比社区间的转变反应时间更短。此外,与模块化网络相比,晶格网络的平均反应时间更长。这些结果表明,即使在控制了局部结构差异(如转变概率)的情况下,人类对中尺度和全局网络拓扑结构也具有敏感性。更具体地说,人类能够识别网络中的模块化结构,并且更容易预测模块内部的转变,而结构更分散的网络(如晶格网络)则更难预测。这项研究揭示了人类学习复杂网络结构的能力,并且表明,人类的学习过程不仅仅是简单的统计学习,还受到网络拓扑结构的深刻影响。这些发现对于理解人类如何从经验中构建内部模型,以及如何有效地适应和利用周围世界的网络结构具有重要意义。

长距离过渡如何影响网络结构的内部表征
#

🔼 本图展示了不同时间尺度下,人类如何通过结合不同距离的过渡来学习和表征网络结构。图中从上到下分别对应三种不同的学习方式,以及它们对网络内部表征的影响。图A展示了一种只关注长度为1的过渡的学习方式,这是一种最大似然估计的方法,它只关注相邻节点间的直接连接,这导致对网络结构的一种无偏估计。图B展示了一种结合不同距离过渡的学习方式,其中较短距离的过渡权重较高,较长距离的过渡权重逐渐衰减。这种方式倾向于过高估计社群内部的连接,而低估社群之间的连接,从而突显了网络的模块化结构。图C展示了一种对所有距离的过渡赋予相同权重的学习方式,这导致对真实过渡结构P的表征模糊不清。

具体而言,图中的纵轴表示“增加过渡距离”,从只考虑短距离过渡(A)到考虑所有距离的过渡(C)。在A中,函数f(t)是一个在t=1时达到峰值的狄拉克δ函数,表示只考虑长度为1的转移。这种情况下,学习者执行最大似然估计,得出真实的过渡结构P的无偏估计。在B中,f(t)呈指数衰减,表示学习者赋予短距离转移较大权重,长距离转移权重较小。这种中间尺度结合不同距离转移的方式突显了网络的社群结构,使得学习者更容易察觉到社群内部的关联性,而较少关注社群间的联系。在C中,f(t)在所有时间尺度上都是均匀分布的,表示学习者对所有距离的转移赋予相同的权重。在这种情况下,估计值Pˆ完全丢失了与真实转移结构P的相似性。

图中的网络图形则展示了这些不同学习方式下,网络结构的内部表征。颜色编码表示估计的过渡概率Pˆij,颜色越深,概率越高。在A中,网络结构清晰,模块边界分明,反映了学习者对模块结构的精确感知;在B中,社群内部的连接更加突出,表明长距离联系增强了对模块结构的认知;在C中,连接较为分散,模块化结构模糊,表明均匀加权导致对网络结构信息的丢失。这张图有力地说明了人类在学习网络结构时,并非简单地计数短距离的转移,而是通过不同距离的转移组合来构建内部表征,这种机制能够更好地揭示网络的中尺度和全局特征。

图4:图学习范式的扩展
#

🔼 本图展示了图学习范式的三种扩展方式。图A展示了动态网络,其中网络的连接随着时间的推移而发生变化,红色线条表示被重新连接的边。这种动态变化模拟了现实世界中网络结构的演变,例如社交网络中人际关系的变迁或知识网络中概念的更新。图B展示了长距离依赖关系,图中蓝色圆点代表当前状态,空心蓝色圆圈代表可能的下一个状态,箭头表示状态之间的转换。该图阐述了在序列中,当前状态不仅依赖于前一个状态,还可能受到更早状态的影响,从而揭示了序列中存在的长程相关性。图C展示了主动信息搜索,图中绿色箭头代表个体在网络中选择的路径,通过这些选择构建出一个新的网络。这模拟了人们在实际环境中探索网络结构的过程,比如在互联网上浏览网页或在知识体系中学习新概念。通过主动选择探索路径,个体可以更有效地学习网络结构,并根据需要调整学习策略。这三种扩展方式挑战了传统图学习范式的局限性,提供了更丰富的视角来研究人类如何学习和理解复杂网络。

这三个子图分别从不同角度展示了对传统图学习范式的扩展,挑战了静态、马尔可夫和被动接收信息的假设。通过引入动态变化、长距离依赖以及主动探索,使得研究更贴近现实世界中人们学习复杂网络的场景,并为未来研究提供了方向。这些扩展对于理解人类如何处理真实世界中动态、非马尔可夫和需要主动探索的网络结构具有重要意义,有助于开发更准确的人类学习模型。

网络结构示例
#

🔼 该图展示了现实世界中两种类型的网络结构:语言网络和知识网络。图A展示了莎士比亚作品中词语之间的连接网络。每个节点代表一个词,而连接两个节点的边则表示这两个词在文本中共同出现的频率。节点的颜色和大小可能表示其重要性和出现频率。例如,更大的节点可能表示更频繁出现的词汇。图B展示了维基百科中概念之间的连接网络。节点代表概念,而边则代表概念之间的关系。网络呈现出复杂的结构,一些节点之间紧密连接,形成集群,而另一些节点则相对孤立。这种结构表明信息并非均匀分布,而是以层次化和模块化的方式组织。这些可视化说明了人类语言和知识是如何通过复杂的网络结构相互关联的,揭示了这些网络中的信息流动和模式。这些网络结构在一定程度上反映了人类认知和信息处理的特点。它们不仅说明了人类如何组织知识和信息,也可能影响着我们如何学习和理解世界,并为研究人类认知和网络科学的交叉领域提供了重要启示。理解这些网络结构有助于我们理解人类学习、记忆和信息处理的过程,并可能在未来指导教育、人工智能和信息检索等领域。

网络结构异质性与模块性
#

🔼 该图表展示了两种不同的网络结构类型:异质性结构和模块化结构,并对它们的特点进行了可视化呈现。左侧(C部分)描绘了异质性结构,这种结构中存在一些连接度(即节点连接数)异常高的枢纽节点,这些枢纽节点在网络中起着中心作用,而大多数节点的连接度则相对较低。右侧(D部分)则展示了模块化结构,其特点是网络被划分为多个高度互联的社群或模块,模块内部的连接密度远高于模块之间的连接密度。在异质性结构图中,节点的尺寸大小与连接度成正比,清晰地突出了枢纽节点的存在,同时,其伴随的图表展示了连接度分布的幂律形式。在模块化结构图中,不同的模块用不同的颜色表示,并显示了其相应的社群结构,并且模块内连接密集,模块间连接稀疏,图中还展示了连接度的正态分布,说明模块内部节点的连接数相对均匀。该图表对比突出了网络结构中两种重要的组织方式,以及它们对理解和分析现实世界复杂系统的影响。这种结构特征的差异对信息传播、学习过程以及系统韧性有重要影响。例如,异质性结构中的枢纽节点可能在信息快速传播中起到关键作用,而模块化结构则可能影响到知识的组织和分类。整体而言,该图表为理解网络结构的复杂性提供了直观的解释和对比,有助于研究人员深入理解复杂网络的不同组织原则。

深度解读
#

网络学习机制
#

论文探讨了人类如何从离散的序列中学习并构建网络结构,揭示了网络学习在认知科学中的重要性。研究表明,人类不仅能够识别单个项目之间的过渡概率,还能感知网络中更大尺度的结构特征。例如,婴儿在语言学习过程中能够通过音节之间的过渡概率识别单词边界,这表明人类天生具备从序列中提取网络结构的能力。网络学习的核心在于人类如何从局部的过渡概率推断出全局的网络结构,这种能力在语言、音乐、社交网络等多个领域都有广泛应用。论文还指出,人类对网络结构的感知不仅依赖于局部的连接,还受到中观和宏观网络拓扑的影响,这为理解人类认知提供了新的视角。

过渡概率学习
#

论文详细讨论了人类如何通过过渡概率学习网络结构。研究表明,人类能够从连续的序列中提取出项目之间的统计规律,例如在语言学习中,婴儿通过音节之间的过渡概率识别单词边界。这种能力不仅限于语言,还扩展到视觉、动作等多个领域。过渡概率学习的核心在于人类能够从局部的统计规律推断出全局的网络结构。论文还指出,尽管过渡概率提供了重要的信息,但它们并不能完全解释人类如何感知复杂的网络结构。因此,未来的研究需要进一步探讨人类如何从局部的过渡概率推断出更大尺度的网络特征。

网络结构影响
#

论文强调了网络结构对人类行为和认知的深远影响。研究表明,人类不仅能够感知局部的网络连接,还能识别中观和宏观的网络特征,例如模块化和小世界结构。这些结构特征在语言、社交网络和互联网等多个领域都有体现。模块化结构使得人类能够更好地预测未来的事件,而小世界结构则帮助人类在复杂的环境中高效地传递信息。论文还指出,个体差异(如年龄和学习障碍)会影响人类对网络结构的感知,这为理解认知障碍提供了新的视角。未来的研究可以进一步探讨网络结构如何影响人类的决策、学习和记忆等认知过程。

计算模型
#

论文提出了多种计算模型来解释人类如何学习和表示网络结构。这些模型不仅考虑了局部的过渡概率,还引入了中观和宏观的网络特征。研究表明,人类在构建网络表示时,会结合不同距离的过渡,从而更好地捕捉网络的全局结构。计算模型的核心在于如何从局部的过渡概率推断出更大尺度的网络特征。论文还指出,这些模型能够解释人类在语言学习、社交网络和互联网等多个领域的行为。未来的研究可以进一步优化这些模型,以更好地解释人类如何从复杂的网络结构中提取有价值的信息。

未来研究方向
#

论文提出了未来研究的几个重要方向,包括如何扩展现有的网络学习范式以及如何将网络学习应用于现实世界的网络结构。研究表明,现有的网络学习实验主要基于静态的过渡网络,而现实世界中的网络往往是动态的。因此,未来的研究可以探讨人类如何感知动态网络的变化。此外,论文还指出,人类在信息搜索过程中往往会主动选择路径,这为研究人类如何学习和表示网络结构提供了新的视角。未来研究还可以探讨网络结构如何影响人类的决策、学习和记忆等认知过程,从而为理解人类认知提供新的理论支持。

完整论文
#