更改

伊辛模型 Ising Model (查看源代码)

2020年7月11日 (六) 14:19的版本

添加63字节、 2020年7月11日 (六) 14:19

无编辑摘要

第24行：第24行：

假设第i个节点是一个小磁针（或者一个村民），每个小磁针有上下两种状态（村民有上,下两种意见），我们用<math>s_i</math>来表示这个状态，并且

+

<math>

第29行：第30行：

-1 & \end{array}\right.

</math>

+

表示磁针朝上或者朝下。网格上相邻的两个小磁针可以发生相互作用。

第35行：第37行：

===总能量===

我们可以通过总能量的概念来刻画这种相互作用：即如果两个相邻方格的小磁针状态一致（例如都是朝上），则系统的总能量减1单位，否则如果不同就加1单位。外界还可能存在磁场，如果小磁针方向与外场方向一致，则能量也会降低。我们定义总能量：

+

<math>

E_{\{s_i\}}=-J\sum_{<i,j>}{s_is_j}-H\sum_{i}^N{s_i}

</math>

+

其中J为一个能量耦合常数，<math>E_{\{s_i\}}</math>表示系统处于状态组合<math>\{s_i\}</math>下的总能量。求和下标<math><i,j></math>表示对所有相邻的两个小磁针进行求和。我们看到，如果<math>s_i=s_j</math>，则总能量就会减少J。H表示外界磁场的强度,它是一个参数，如果外界磁场向上H为正，否则为负。如果某个小磁针的方向与外场一致，则总能量减少一个单位。

第71行：第75行：

系统中小磁针的相互之间以及与外场方向一致的话，则系统的能量就低。所以+1+1+1为能量最小的状态。

沿用村民的比喻来说，系统的能量相当于村民观点存在的冲突的数量。如果两个相邻的村民意见不一致，总冲突数就+1，否则就减1。而外场建模了观点的媒体宣传效应,如果村民的观点与舆论宣传一致，则能量越低，因此也越和谐。

+

===温度===

但是，系统的演化并不完全由总能量决定。由于小磁针处于噪声环境中，热涨落又会引起小磁针的状态随机反转。我们可以用温度<math>T</math>来衡量这种环境影响的随机性。T越高，则小磁针发生反转的概率就会越大。

+

这样，有两种力作用在小磁针上，一种力来源于小磁针邻居以及外场对它的影响，这种影响倾向于使得相邻的邻居彼此状态一致以及与外场尽量一致，即尽量使得系统的总能量达到最小。另外一种力则来源于环境噪声的扰动，它迫使小磁针无视邻居的作用而发生随机的状态反转。于是，每个小磁针就挣扎于这两种不同的力量之间。不难想象，假如温度T趋于0，则每个小磁针都会与外场相一致，那么，最终系统将处于全是+1或者全是-1的状态（取决于外场H是正还是负）。假如T特别高，而相互作用强度J特别小，则邻居间的作用可以忽略，每个小磁针都完全随机地取值。

+

这样，整个ISING模型就有两个外生给定的参数<math>T,H</math>来表示环境的温度和磁场强度。在村民的比喻中,温度相当于村民进行观点选择的自由程度，温度越高，村民选择观点越随机，而不受自己周围邻居的影响；否则村民的选择严重依赖于邻居和媒体宣传。

第92行：第99行：

<math>s_i(t+1)=\left\{\begin{array}{ll} s_i' & \mbox {with probability } \mu, \\

s_i(t) & \mbox {with probability }1-\mu.\end{array}\right.</math>

−

+

其中概率<math>\mu</math>按照如下公式计算：

第101行：第109行：

也就是说，系统会按照概率<math>\mu</math>接受新的状态组合<math>s_i'</math>。其中<math>\mu</math>与新状态组合能量与当前能量的差值以及温度有关。如果状态组合<math>s_i'</math>的能量值大于原状态组合<math>s_i(t)</math>的能量值，则<math>\mu<1</math>但不为0，所以系统有可能接受这个状态组合。如果<math>E(s_i')<E(s_i(t))</math>，则<math>\mu=1</math>，则系统肯定会接受状态组合<math>s_i'</math>。这样，系统会更加倾向于往能量减少的状态组合方向演化，但是也会以一定的概率演化到能量大的状态组合，这种演化到能量较大的状态组合的概率由参数T确定。如果T越大，则系统接受一个能量较高状态组合的概率也会越大，也就是说系统越随机。否则系统会比较规矩地沿着能量下降的方式演化，系统相对秩序。

+

按照这个接受概率规则，每一时刻，系统生成一个新的候选状态组合，然后再根据能量的大小决定是否接受它。于是，就进行了一步系统演化。

第108行：第117行：

为什么要按照这样的方式来模拟Ising模型的运行呢？这是因为按照上述算法，系统可以最终达到如下的概率分布状态：

+

<math>

p(\{s_i\})=\frac{1}{Z}\exp(-\frac{E_{\{s_i\}}}{kT})

</math>

+

这个分布就是著名的[[玻尔兹曼分布]]，其中k为玻尔兹曼常数，等于<math>1.3806488\times 10^{23}</math>，<math>Z</math>为归一化因子：

+

<math>

Z=\sum_{\{s_i\}}\exp(-\frac{E_{\{s_i\}}}{kT})

</math>

+

其中，求和符号是针对所有可能的状态组合的。这样可以保证概率归一：

+

<math>

\sum_{\{s_i\}}p(\{s_i\})=1

</math>

+

在统计物理中，Z又称为系统的[[配分函数]]，它是温度T和外场H的函数，即：<math>Z(T,H)</math>。这个函数非常重要，因为它决定了系统的各种热力学性质。

第128行：第144行：

在玻尔兹曼分布中，每个状态组合出现的概率将会与该状态组合下的总能量的负值呈现指数关系。也就是说，能量越小，该状态组合的出现概率也就越大。反之，出现概率会随着能量增加而快速衰减。并且温度T会对衰减速度起到调节作用。这里出现概率的具体含义是指：如果针对同样参数和初始条件的Ising模型进行多次重复试验。运行很长时间后，我们观察这些Ising模型处于什么样的状态组合，则某一状态组合在若干实验中的出现频率会接近波尔兹曼分布。用统计物理的术语来说，这些试验就称为一个[[系综]]。

+

因为已知在现实的铁磁物质中，系统与环境的热交换构成了一个[[统计物理]]中的[[正则系统]]，系统最终会达到玻尔兹曼分布的状态，所以为了模拟真实的铁磁物质，Ising模型也应该达到这个稳态分布。我们可以从数学上证明，上述随机过程的稳态分布就是根据统计力学计算出来的分布结果。这种模拟方法就是Ising模型的[[马尔科夫链-蒙特卡罗模拟]]方法（Markov Chain Monte Carlo, MCMC），也叫做[[Metropolis-Hastings算法]]。

第135行：第152行：

====细致平衡条件====

和另一种常用的MCMC技巧[[吉布斯采样]]（Gibbs Sampling）类似，它的状态转移矩阵也满足细致平衡条件（Detailed Balance Equations）：

+

若<math>p_x</math>与<math>p_y</math>分别为状态<math>x</math>，<math>y</math>在平稳分布中的概率，<math>p(x,y)</math>与<math>p(y,x)</math>分别为前述设定的状态转移概率（转移概率矩阵中的元素），则有

+

+

值得注意的是，如果我们只定义马尔科夫链的转移概率矩阵满足对于任意的状态链<math>\{x_0,x_1,....x_n\}</math>，存在

+

则该马尔科夫链形成的唯一平稳分布自然满足细致平衡条件的要求。

+

==模拟结果==

第153行：第175行：

在图中，不同的行对应了不同的温度值。第一行的温度<math>T>T_C</math>，第二行<math>T\approx T_C</math>，第三行<math>T<T_C</math>。其中，<math>T_C</math>为临界温度，我们将在后面介绍如何计算该数值。当温度小于临界值的时候，Ising模型中大多数磁针都取相同的颜色，系统处于较为秩序的状态。当温度大于临界值的时候，每个小磁针的颜色会比较混乱无序，系统处于随机的状态。而当温度接近临界的时候，系统的运行介于随机与秩序之间，也就是进入了[[混沌的边缘]]地带。我们将这种状态称为[[临界状态]]。

+

需要明确的是，上述截图仅仅是在成千上万种可能状态组合中的一种，但是却是最可能的一种（即概率较大的一种）。因为根据玻尔兹曼分布表达式，原则上讲，无论T和H为多少，任何一种状态组合<math>\{s_i\}</math>都有可能，但是可能性会随着状态组合的能量增加而迅速衰减。因此我们会以较大的概率看到那些能量小的状态。

第159行：第182行：

===热力学量===

除了从图形定性地看出Ising模型的运行以外，我们还可以研究模型的热力学性质，从而考察这些宏观量在稳态条件下如何依赖于参数，并与实验结果进行比较。以下结果都是对2维Ising模型的模拟或计算结果。

+

====平均磁矩====

首先，可以定义平均磁矩这个量。如果将所有小磁针+1或-1的状态进行代数和，可以得到：

+

<math>

M_{\{s_i\}}=\sum_{i=1}^N{s_i}

</math>

+

其中N为系统中所有小磁针的个数。<math>M_{\{s_i\}}</math>就是系统中在给定状态<math>s_i</math>条件下，总的磁矩（每个小磁针向上或者向下都是矢量）。在稳态条件下，系统满足平衡分布，那么，对所有可能的状态按照它们出现的概率进行加权平均就得到了整个系综的平均磁矩（即对所有可能的实验结果求平均）：

+

<math>

\langle M\rangle =\sum_{\{s_i\}}{M_{\{s_i\}}p_{\{s_i\}}}=\frac{1}{Z} \sum_{\{s_i\}}{M_{\{s_i\}}\exp (-E_{\{s_i\}}/(kT))}

</math>

+

对应的每个小磁针的平均磁矩为：

+

<math>

m=\frac{\langle M\rangle}{N}

</math>

+

通过计算机模拟实验，也可以通过平均场近似方法解析地给出平均磁矩随参数H和T的变化情况：

第197行：第228行：

我们看到m随归一化温度呈现出幂律规律的变化，可以用如下公式表示：

+

+

其中这个关系的幂指数<math>\beta</math>模拟数值接近于8。

第206行：第239行：

除了磁矩的平均值，我们还可以计算出磁矩的[[涨落]]，我们将这个平均涨落称为磁导率，定义如下：

+

<math>

\chi{(T,H)}=\frac{\langle M^2\rangle -\langle M\rangle^2}{NkT}

</math>

+

类似地，我们将磁导率与归一化温度曲线画在双对数坐标下得到一条直线(当H=0)：

第216行：第251行：

图中的黑色曲线表示<math>T>T_C</math>的结果，开放圆圈表示<math>T<T_C</math>的结果。这个幂律行为可以用公式：

+

<math>\chi\sim (|T-T_C|/T_C)^{-\gamma}</math>

+

表示,其中指数<math>\gamma</math>约等于7/4。

第224行：第261行：

====比热====

按照类似的方法，我们还可以定义系综的平均能量：

+

<math>

\langle E\rangle =\frac{1}{Z} \sum_{\{s_i\}}{E_{\{s_i\}}\exp (-E_{\{s_i\}}/(kT))}

</math>

+

能量的平均涨落就是比热：

+

<math>

c=\frac{\langle E^2\rangle-\langle E\rangle^2}{NkT^2}

</math>

+

在0外场情况下，比热在临界点附近也呈现出与归一化温度的幂律关系：

第243行：第284行：

每个小磁针都是一个随机变量，我们可以计算任意两个小磁针i,j的统计关联性，从而考察相隔任意距离的两个小磁针是否具有联系。

具体地，我们定义关联强度为：

+

<math>

g(i,j)=\langle (s_i-\langle s_i\rangle)(s_j-\langle s_j\rangle)\rangle=\langle s_is_j\rangle-\langle s_i\rangle \langle s_j\rangle

</math>

+

通过模拟我们发现，相关函数仅仅与两个小磁针之间的距离r有关，并且当温度远离临界温度的时候，相关函数与距离的函数呈现指数衰减：

+

<math>

第254行：第298行：

</math>

−

其中，<math>r_0</math>为一常数，称为特征尺度。也就是说，任意两个磁针的统计相关性会随着它们彼此之间的距离增长而快速衰减，只要距离稍大于特征关联尺度，则关联性就会接近于0。

−

~~但是，在临界温度附近，两磁针之间的统计相关性却呈现出幂律的形式，即：~~

+

其中，<math>r_0</math>为一常数，称为特征尺度。也就是说，任意两个磁针的统计相关性会随着它们彼此之间的距离增长而快速衰减，只要距离稍大于特征关联尺度，则关联性就会接近于0。但是，在临界温度附近，两磁针之间的统计相关性却呈现出幂律的形式，即：

+

<math>

g(r_{ij})\sim r^{-(d-2+\eta)}

</math>

+

其中d为Ising模型所在空间的维度，<math>\eta</math>为幂律指数。幂律衰减会比指数衰减慢很多，这也就意味着两磁针之间的关联长度会很长。假如我们仍然用指数函数来拟合相关性的衰减，即假设<math>g(r_{ij})\sim \exp(-r/r_0)</math>在临界温度的时候仍然成立,那么<math>r_0</math>就可以写为：

+

<math>

r_0\sim |\frac{T_C-T}{T_C}|^{-\nu}

</math>

+

所以，当<math>T\rightarrow T_C</math>的时候，特征尺度<math>r_0\rightarrow \infty</math>。也就是说，小磁针彼此发生了长程相关：局部的空间涨落会通过某种合作机制传递并影响了相隔很远的小磁针。

第273行：第320行：

===临界相变===

通过上述的讨论，我们已经对Ising模型的提出、模拟办法以及得到的一系列模拟、计算结果进行了粗略的介绍。我们看到，Ising模型的美妙之处就在于从一个相对简单而干净的模型出发，仅通过两个自由参数H和T，就可以复制出真实铁磁物质的相变行为。尤其是当系统处于临界参数的时候，即温度<math>T=T_C</math>，外界磁场强度H为0，系统展现出来的是[[二级相变]]（[[连续相变]]）。系统一切宏观热力学量都展现出标度行为，我们将这种特殊的相变称为[[临界相变]]，而将系统所体现出来的标度（幂律）行为、长程相关等现象统称为[[临界现象]]。

+

[[临界现象]]不仅仅是ISING模型、铁磁物质所独有的，它具有相当的普遍性。它会在很多复杂系统中体现出来，例如气-液相变过程、湍流，甚至股票市场、经济系统等。临界系统体现出的一个重要特征就是：自相似性和长关联性。让我们再来考察临界状态下的模拟图：

−

[[File:Isingresult2.png||临界状态下的ISING模型]]

+

[[File:Isingresult2.png|thumb|center|临界状态下的ISING模型]]

这是在外场H=0，温度刚好等于临界温度的时候各个小磁针构成的一个构型。从该图中，我们看到同一种颜色（即状态一致）的小磁针形成了彼此连通的团簇。这些团簇的尺寸有大有小。单独一个团簇具有一定的自相似性，它构成了一个[[分形]]。并且团簇的形态会在多个尺度重现类似的模式。假如我们将系统放大或者缩小，我们将无法分辨出不同之处，这就是[[无标度]]性这个名词的来源。

+

更有意思的是，当系统处于临界状态的时候，它的行为会呈现出一定的普适性。也就是说，无论系统的微观作用规则如何，系统的临界参数、各种热力学量的临界指数（如<math>\alpha,\beta,\gamma</math>等）都相同。因此，人们将具有相同临界指数的模型类划分为普适类。拿Ising模型来说，无论Ising模型位于什么样的空间中（例如四方晶格、六角格、三角格等），它们的微观规则也可能略有不同，但是，所有这些Ising模型都属于同一个普适类，也就是说它们具有相同的临界温度和临界指数。

第287行：第336行：

===ISING模型的重整化===

我们不仅要模拟Ising模型，还要求出它的临界温度，以及各个热力学量的临界指数。目前，人们已经发展了多种求解Ising模型的方法，包括：模型的解析求解、[[平均场近似]]的方法、Landau的近似方法、以及[[重正化群]]的方法等。

+

在这些方法中，[[重正化群]]方法与众不同，它是直接从模型达到临界后所展现出来的自相似性出发，写出重正化方程以及重正化算符。那么临界温度和各种临界指数就可以从该算符的线性化中求出。更有趣的是，由重正化群技术出发，我们自然可以得出所谓的“普适类”的概念：即存在一类Ising模型，虽然他们的微观规则很不相同，但是却具有相似的临界指数。实际上，这些模型都处于同一个普适类曲面上，即它们经过无穷多次重正化操作后都会收敛到相同的不动点。具体参见：[[ISING模型的重正化]]

+

==更多应用==

第295行：第346行：

在社会科学应用方面，我们主要介绍一个叫做投票（Voter）的模型。假设有一个村落，每家每户都规则地排列在一个网格上。每个人都有自己的政治观点，假设第i个村民的政治观点是<math>s_i</math>，其中<math>s_i</math>可以在有限状态集合V中取值。我们用不同的颜色来表示不同人的政治观点，如下图所示：

−

[[File:Votermodel.jpg||Voter Model]]

+

[[File:Votermodel.jpg|center|thumb|Voter Model]]

这张图展示了模型的一个瞬间的状态，其中每个村民都有6种不同的政治观点，它们被表达为6种不同的颜色。

第301行：第352行：

Voter模型的演化规则如下：每一个时刻，有n个村民会改变自己的政治观点，他们会随机地从自己周围的八个邻居中选择一个邻居，拷贝他的政治观点（被他的邻居说服了）。n越大，就会有越多的村民改变自己的观点，系统变化会很快，而n越小，则系统演化就会越慢。

+

随着模型的演化，相同观点的人们开始形成团簇，如图所示：

第307行：第359行：

如果模型继续演化，则6种观点中的5个将会消失，只剩下一种观点，但具体是哪一个我们无法预测。但我们可以确定系统必然收敛到一种确定的政治观点，这是因为该模型等价于一个带吸收壁的[[随机游走]]，系统将最终收敛。

+

然而，如果我们稍作变化，只要每个村民在每个周期都会有一个小概率v发生政治观点的随机变化（并不拷贝邻居的颜色）。那么这个系统就将持续演化下去，不会停留在固定的状态上。不难看出，在这种改进的模型中，Voter模型与Ising模型很相似。其中，村民拷贝邻居的观点相当于Ising模型中，小磁针朝能量减小的方向演化。而每个村民按小概率v发生观点随机变化就相当于环境噪声的影响。如果适当地选择v参数的大小，Voter模型将会达到和ISING模型类似的效果，即存在着临界的概率<math>v_C</math>，使得系统处于临界状态。与ISING模型不同的是每个村民的状态取值可以更多。

第312行：第365行：

对比Voter模型和Ising模型不难发现，Voter模型中并不存在能量，但是给出了每个微观个体状态转变的具体规则，而在Ising模型中，单个小磁针的状态改变没有具体的规则，但是系统整体定义了总能量，于是只有那些可以使得总能量变小的微观个体转变才更容易被接受。当运行起来以后，Voter模型与Ising具有相似的行为，这意味着这两种状态更新方式存在着一定的等价性。我们看到，Voter模型中每个村民拷贝某个邻居的观点相当于使得这两个格点的状态乘积尽量等于1（当有+1,-1两个状态的时候），也相当于降低系统整体的能量。反过来，要想降低Ising模型中的总能量，一种明智的方法就是使得两个相邻格点的小磁针状态一致。由此可见，这两种模型存在着天然的对应。也意味着，我们可以定义Voter模型的能量函数，也可以为Ising模型指定微观演化的规则。

+

与此类似的社会学模型还有很多，例如著名经济学诺贝尔奖得主Thomas C. Schelling的[[种族隔离模型]]也是一个类似的温度T=0的Ising模型。种族隔离模型假设一个街区中随机分布着两种肤色的人，例如黑人和白人。假如一个黑人周围的白人过多，则黑人会搬家（移动到周边的方格），否则如果白人周围是黑人，他也会搬家。这样经过足够长时间的演化，系统将形成不同的肤色的区块。这个模型与ISING模型有很多异趣同工的地方。

第327行：第381行：

假设每个神经元有两种状态：激活、未激活，分别用<math>s_i=+1,-1</math>来表示。神经元i到j的连接权重用<math>w_{ij}</math>来表示。

+

在初始时刻，我们把输入向量映射为每个神经元的激活、未激活状态。然后，Hopfield网络的运行规则如下，在每一个仿真周期，每个神经元根据下述规则更新状态：

第363行：第418行：

总结来看，Hopfield网络的运行分为两个阶段，它们的输入数粗示意图如下所示：

−

[[File:Hopfield.png|~~|Hopfield网络训练与运行~~]]

+

[[File:Hopfield.png|center]]

例如，下图就是Hopfield网络运行的结果。

−

[[File:Face_recognition_with_hopfield_network.jpg]]

+

[[File:Face_recognition_with_hopfield_network.jpg|center]]

其中右侧人脸就是训练的数据，左侧的人连为初始向量输入给网络，经过一段时间的演化最终收敛到训练数据。

+

==参考文献==

薄荷

7,129

个编辑

更改

伊辛模型 Ising Model (查看源代码)

2020年7月11日 (六) 14:19的版本

导航菜单

搜索