平均场理论

此词条暂由彩云小译翻译，翻译字数共1572，AvecSally审校。

在物理学和概率论学中，平均场理论(又称 MFT 或自洽场理论)通过研究一个简单的模型来表示高维随机模型的行为，通过对原始模型的自由度取平均来近似得到。这些模型考虑到了许多相互交互的单个组件。在平均场论中，所有个体对任一给定个体的影响都近似于所有个体的平均效应，从而使多体问题降低为一体问题。

平均场论的主要思想是将作用于一个物体的所有交互行为简化为所有行为的平均作用，有时也称为分子场。^[1] 这就把任何多体问题转化为有效的单体问题。使用平均场论解决问题意味着可以以较低的计算成本获得对系统行为的一些了解。

此后，平均场论被广泛应用于物理学及其以外的领域，包括推论统计学、图形模型、神经科学^[2]、人工智能、传染病模型^[3]、排队论^[4]、计算机网络性能和博弈论^[5]，量子反应均衡等。

Origins 起源

这个想法最早出现在物理学的统计力学中，由 Pierre Curie^[6] 和 Pierre Weiss 描述相变^[7]的著作中。平均场论在 Bragg-Williams 近似、 Bethe 晶格模型、 Landau 理论、 Pierre-Weiss 近似、 Flory-Huggins 解理论和 Scheutjens-Fleer 理论中都有应用。

对于一个具有许多(有时是无数个)自由度的系统，除了一些简单的情况(例如:高斯随机场理论，一维伊辛模型)，通常难以精确地求解或以封闭的解析形式计算。一个复杂的组合问题的出现使得计算一个系统的配分函数变得困难。平均场论是一种近似方法，它常常使原问题变得可解，易于计算。有时，平均场论可以给出非常精确的近似值。

在场论中，哈密顿量可以根据场平均周围起伏的大小来展计算。在这种背景下，平均场论可以看作是哈密顿量在涨落中的“零阶”展开。物理上，这意味着平均场系统没有波动，但这与“平均场”取代所有相互作用的观点不谋而合。平均场论常常为研究高阶波动提供便利。例如，当计算配分函数时，研究哈密顿量中相互作用项的组合有时候最多能产生微扰结果，或可以修正平均场近似值的费曼图。

Validity

一般来说，维数在确定平均场方法是否适用于任何特定问题时起着重要作用。有时存在一个[临界维度]，高于该临界维度的平均场论有效，低于该维度的平均场论无效。

由此，平均场论中的许多相互作用会被一个有效的相互作用所取代。如果场或粒子在原系统中表现出许多随机相互作用，它们往往会相互抵消，从而使平均有效相互作用和平均场论更加精确。这在高维情况下也是成立的，比如当哈密顿量包括远程力时，或者当粒子被扩展时(例如:聚合物)。金兹堡准则是衡量一个近似不好的平均场如何波动的表达式，通常取决于系统中的空间维数。

Formal approach (Hamiltonian)

平均场理论的形式基础是波格留波夫不等式。这个不等式说明了哈密顿量系统的自由能

[math]\displaystyle{ \mathcal{H} = \mathcal{H}_0 + \Delta \mathcal{H} }[/math]

有上界:

[math]\displaystyle{ F \leq F_0 \ \stackrel{\mathrm{def}}{=}\ \langle \mathcal{H} \rangle_0 - T S_0, }[/math]

其中，[math]\displaystyle{ S_0 }[/math]是熵，而 [math]\displaystyle{ F }[/math]和[math]\displaystyle{ F_0 }[/math]是亥姆霍兹自由能。平均值取参考系平衡系综的哈密顿量。在特殊情况下，参考哈密顿量是非相互作用系统的哈密顿量[math]\displaystyle{ \mathcal{H}_0 }[/math]，因此可以写成

[math]\displaystyle{ \mathcal{H}_0 = \sum_{i=1}^N h_i(\xi_i), }[/math]

[math]\displaystyle{ \xi_i }[/math] 是我们的统计系统的各个组成部分(原子、自旋等等)的自由度，我们可以考虑通过最小化不平等的右边来加强上限。最小化参考系是使用不相关自由度的真实系统的“最佳”近似，被称为平均场近似。

对于最常见的情况，目标哈密顿函数只包含成对相互作用，例如,

[math]\displaystyle{ \mathcal{H} = \sum_{(i,j) \in \mathcal{P}} V_{i,j}(\xi_i, \xi_j), }[/math]

其中[math]\displaystyle{ \mathcal{P} }[/math]是相互作用的对集合，最小化过程可以正式执行。定义[math]\displaystyle{ \operatorname{Tr}_i f(\xi_i) }[/math]为单个分量自由度上可观测的[math]\displaystyle{ f }[/math]的广义和(离散变量的和，连续变量的积分)。给出了近似自由能的表达式

[math]\displaystyle{ \begin{align} \lt math\gt \begin{align} 1.1.1.2.2.2.2.2.2.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3 F_0 &= \operatorname{Tr}_{1,2,\ldots,N} \mathcal{H}(\xi_1, \xi_2, \ldots, \xi_N) P^{(N)}_0(\xi_1, \xi_2, \ldots, \xi_N) \\ F_0 &= \operatorname{Tr}_{1,2,\ldots,N} \mathcal{H}(\xi_1, \xi_2, \ldots, \xi_N) P^{(N)}_0(\xi_1, \xi_2, \ldots, \xi_N) \\ 1,2，ldots，n } cal { h }(xi _ 1，xi _ 2，ldots，xi _ n) p ^ {(n)} _ 0(xi _ 1，xi _ 2，ldots，xi _ n) &+ kT \,\operatorname{Tr}_{1,2,\ldots,N} P^{(N)}_0(\xi_1, \xi_2, \ldots, \xi_N) \log P^{(N)}_0(\xi_1, \xi_2, \ldots,\xi_N), &+ kT \,\operatorname{Tr}_{1,2,\ldots,N} P^{(N)}_0(\xi_1, \xi_2, \ldots, \xi_N) \log P^{(N)}_0(\xi_1, \xi_2, \ldots,\xi_N), 1,2，ldots，n } p ^ {(n)} _ 0(xi _ 1，xi _ 2，ldots，xi _ n) log p ^ {(n)} _ 0(xi _ 1，xi _ 2，ldots，xi _ n) \end{align} }[/math]

其中[math]\displaystyle{ P^{(N)}_0(\xi_1, \xi_2, \dots, \xi_N) }[/math]是在变量[math]\displaystyle{ (\xi_1, \xi_2, \dots, \xi_N) }[/math]指定状态下找到参考系的概率。这个概率是由归一化玻尔兹曼因子给出的

[math]\displaystyle{ \begin{align} \lt math\gt \begin{align} 1.1.1.2.2.2.2.2.2.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3 P^{(N)}_0(\xi_1, \xi_2, \ldots, \xi_N) P^{(N)}_0(\xi_1, \xi_2, \ldots, \xi_N) P ^ {(n)} _ 0(xi _ 1，xi _ 2，ldots，xi _ n) &= \frac{1}{Z^{(N)}_0} e^{-\beta \mathcal{H}_0(\xi_1, \xi_2, \ldots, \xi_N)} \\ &= \frac{1}{Z^{(N)}_0} e^{-\beta \mathcal{H}_0(\xi_1, \xi_2, \ldots, \xi_N)} \\ 0(xi _ 1，xi _ 2，ldots，xi _ n)} &= \prod_{i=1}^N \frac{1}{Z_0} e^{-\beta h_i(\xi_i)} \ \stackrel{\mathrm{def}}{=}\ \prod_{i=1}^N P^{(i)}_0(\xi_i), &= \prod_{i=1}^N \frac{1}{Z_0} e^{-\beta h_i(\xi_i)} \ \stackrel{\mathrm{def}}{=}\ \prod_{i=1}^N P^{(i)}_0(\xi_i), 1} ^ n frac {1}{ z _ 0} e ^ {-beta h _ i (xi _ i)} stackrel { mathrm { def }{ = } prod _ { i = 1} ^ n p ^ {(i)} _ 0(xi _ i) , \end{align} }[/math]

其中[math]\displaystyle{ Z_0 }[/math]是配分函数。因此

[math]\displaystyle{ \begin{align} \lt math\gt \begin{align} 1.1.1.2.2.2.2.2.2.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3 F_0 &= \sum_{(i,j) \in \mathcal{P}} \operatorname{Tr}_{i,j} V_{i,j}(\xi_i, \xi_j) P^{(i)}_0(\xi_i) P^{(j)}_0(\xi_j) \\ F_0 &= \sum_{(i,j) \in \mathcal{P}} \operatorname{Tr}_{i,j} V_{i,j}(\xi_i, \xi_j) P^{(i)}_0(\xi_i) P^{(j)}_0(\xi_j) \\ F _ 0 & = sum _ {(i，j) in mathcal { p }算子名{ Tr } _ { i，j } v _ { i，j }(xi _ i，xi _ j) p ^ {(i)} _ 0(xi _ i) p ^ {(j)} _ 0(xi _ j)) &+ kT \sum_{i=1}^N \operatorname{Tr}_i P^{(i)}_0(\xi_i) \log P^{(i)}_0(\xi_i). &+ kT \sum_{i=1}^N \operatorname{Tr}_i P^{(i)}_0(\xi_i) \log P^{(i)}_0(\xi_i). & + kT sum { i = 1} ^ n 操作符名称{ Tr } i p ^ {(i)} _ 0(xi _ i) log p ^ {(i)} _ 0(xi _ i)。 \end{align} }[/math]

为了得到最小化，我们对单自由度概率 [math]\displaystyle{ P^{(i)}_0 }[/math] 求导，使用拉格朗日乘数来确保正确的归一化。最终得到的结果是自洽方程组

[math]\displaystyle{ P^{(i)}_0(\xi_i) = \frac{1}{Z_0} e^{-\beta h_i^{MF}(\xi_i)},\quad i = 1, 2, \ldots, N, }[/math]

平均场表示为

[math]\displaystyle{ h_i^\text{MF}(\xi_i) = \sum_{\{j \mid (i,j) \in \mathcal{P}\}} \operatorname{Tr}_j V_{i,j}(\xi_i, \xi_j) P^{(j)}_0(\xi_j). }[/math]

[math]\displaystyle{ H = -J \sum_{\langle i, j \rangle} (m_i + \delta s_i) (m_j + \delta s_j) - h \sum_i s_i, }[/math]

Applications 应用

平均场论在物理系统中有诸多应用，研究如相变^[8]等现象。

伊辛模型 Ising model

在这里我们定义[math]\displaystyle{ \delta s_i \equiv s_i - m_i }[/math]，这是自旋的涨落。

考虑一个维数为[math]\displaystyle{ d }[/math]的伊辛模型，哈密顿量为[math]\displaystyle{ H = -J \sum_{\langle i, j \rangle} s_i s_j - h \sum_i s_i, }[/math]。如果我们对右边展开，我们得到一个项，它完全依赖于自旋的平均值，与自旋构型无关。这是一个平凡的术语，它不影响系统的统计特性。下一项是自旋平均值与涨落值的乘积。最后，最后一项涉及两个涨落值的乘积。

[math]\displaystyle{ \sum_{\langle i, j \rangle} }[/math]表示所有最近邻居的和， [math]\displaystyle{ \langle i, j \rangle }[/math]和 [math]\displaystyle{ s_i, s_j = \pm 1 }[/math] 是近邻伊辛旋数。

引入涨落的平均值来调整旋系数 [math]\displaystyle{ m_i \equiv \langle s_i \rangle }[/math]. 得到更新后的哈密顿量为：

[math]\displaystyle{ H \approx H^\text{MF} \equiv -J \sum_{\langle i, j \rangle} (m_i m_j + m_i \delta s_j + m_j \delta s_i) - h \sum_i s_i. }[/math]

[math]\displaystyle{ H = -J \sum_{\langle i, j \rangle} (m_i + \delta s_i) (m_j + \delta s_j) - h \sum_i s_i, }[/math]

这些涨落在低维度上增强，使 MFT 成为高维度的更好近似值。

我们定义 [math]\displaystyle{ \delta s_i \equiv s_i - m_i }[/math]; 这是旋数的涨落。

同样，可以重新扩大这一需求。另外，由于伊辛链具有平移不变性，我们希望每个自旋的平均值与位置无关。这就产生了

对右侧展开，我们得到了一个完全依赖于自旋的平均值，这个值与自旋构型无关，它不会影响系统的统计性质。下一项是涉及自旋均值与涨落值乘积的项。最后一项涉及两个涨落值的乘积。

[math]\displaystyle{ H^\text{MF} = -J \sum_{\langle i, j \rangle} \big(m^2 + 2m(s_i - m)\big) - h \sum_i s_i. }[/math]

平均场近似忽略了这个二阶涨落项:

[math]\displaystyle{ H \approx H^\text{MF} \equiv -J \sum_{\langle i, j \rangle} (m_i m_j + m_i \delta s_j + m_j \delta s_i) - h \sum_i s_i. }[/math]

相邻自旋的和可以重写为 [math]\displaystyle{ \sum_{\langle i, j \rangle} = \frac{1}{2} \sum_i \sum_{j \in nn(i)} }[/math], 其中 [math]\displaystyle{ nn(i) }[/math] 表示 " [math]\displaystyle{ i }[/math]的最近邻居", 因为每个键参与两个自旋 [math]\displaystyle{ 1/2 }[/math] 避免了重复计算，简化了最终的表达式。

这些涨落在低维是会被放大，因此使得MFT在高维时可以更好地逼近。

[math]\displaystyle{ H^\text{MF} = \frac{J m^2 N z}{2} - \underbrace{(h + m J z)}_{h^\text{eff.}} \sum_i s_i, }[/math]

同样，和式可以重新展开。由于Ising链是平移不变的，我们预计每个自旋的平均值是位点无关的。于是有

[math]\displaystyle{ z }[/math] 是协调数。

伊辛哈密顿量已经解耦为一个具有有效平均场的单体哈密顿量的和

[math]\displaystyle{ h^\text{eff.} = h + J z m }[/math],它是外场 [math]\displaystyle{ h }[/math] 和相邻自旋引起的平均场的总和。值得注意的是，这个平均值域直接取决于最近邻居的数量，因此取决于系统的维数(例如，对于维数为 [math]\displaystyle{ d }[/math], [math]\displaystyle{ z = 2 d }[/math]的超立方格)。

[math]\displaystyle{ H^\text{MF} = -J \sum_{\langle i, j \rangle} \big(m^2 + 2m(s_i - m)\big) - h \sum_i s_i. }[/math]

把这个哈密顿量代入配分函数，求解有效的一维问题，我们得到了

相邻自旋的和可以写成 [math]\displaystyle{ \sum_{\langle i, j \rangle} = \frac{1}{2} \sum_i \sum_{j \in nn(i)} }[/math], 其中 [math]\displaystyle{ nn(i) }[/math]表示 [math]\displaystyle{ i }[/math]的最近邻居"，因为每个键参与两个自旋 [math]\displaystyle{ 1/2 }[/math] 避免了重复计算，简化了最终的表达式。

[math]\displaystyle{  Z = e^{-\frac{\beta J m^2 Nz}{2}} \left[2 \cosh\left(\frac{h + m J z}{k_\text{B} T}\right)\right]^N, }[/math]

[math]\displaystyle{ H^\text{MF} = \frac{J m^2 N z}{2} - \underbrace{(h + m J z)}_{h^\text{eff.}} \sum_i s_i, }[/math]

其中 [math]\displaystyle{ N }[/math] 是格点的数量。这是一个封闭而精确的系统配分函数表达式。我们可以得到系统的自由能和计算临界指数。特别地，我们可以得到磁化作为 [math]\displaystyle{ m }[/math] 的函数 [math]\displaystyle{ h^\text{eff.} }[/math]。

其中 [math]\displaystyle{ z }[/math]是协调数。伊辛哈密顿量已经解耦为一个具有有效平均场的单体哈密顿量的和

[math]\displaystyle{ h^\text{eff.} = h + J z m }[/math],它是外场 [math]\displaystyle{ h }[/math] 和相邻自旋引起的平均场的总和。值得注意的是，这个平均值域直接取决于最近邻居的数量，因此取决于系统的维数(例如，对于维数为 [math]\displaystyle{ d }[/math], [math]\displaystyle{ z = 2 d }[/math]的超立方格)。

将这个哈密顿量代入配分函数，求解有效的一维问题，得到：

[math]\displaystyle{ Z = e^{-\frac{\beta J m^2 Nz}{2}} \left[2 \cosh\left(\frac{h + m J z}{k_\text{B} T}\right)\right]^N, }[/math]

[math]\displaystyle{ T_\text{c} }[/math] 由以下关系给出：[math]\displaystyle{ T_\text{c} = \frac{J z}{k_B} }[/math].

其中 [math]\displaystyle{ N }[/math] 是格点的数量。这是一个封闭而精确的系统配分函数表达式。我们可以得到系统的自由能和计算临界指数。特别地，我们可以得到磁化作为 [math]\displaystyle{ m }[/math] 的函数 [math]\displaystyle{ h^\text{eff.} }[/math]。

因此，我们有两个方程在 [math]\displaystyle{ m }[/math] 和 [math]\displaystyle{ h^\text{eff.} }[/math], 这样我们就可以确定温度的函数[math]\displaystyle{ m }[/math] 。这导致了以下结论:

当温度大于某个值时 [math]\displaystyle{ T_\text{c} }[/math],唯一解为 [math]\displaystyle{ m = 0 }[/math]. 这个系统是顺磁性的。

对于 [math]\displaystyle{ T \lt T_\text{c} }[/math], 有两个非零解: [math]\displaystyle{ m = \pm m_0 }[/math]. 这个系统是铁磁性的。

[math]\displaystyle{ T_\text{c} }[/math] 由以下关系给出： [math]\displaystyle{ T_\text{c} = \frac{J z}{k_B} }[/math].

这表明MFT可以解释铁磁相变。

在其他系统中的应用

同样，MFT 也可以应用于其他类型的哈密顿量，如下列情况:

研究金属-超导体的跃迁。在这种情况下，磁化的类似物是超导间隙

液晶中指导性场的拉普拉斯场为非零时产生的分子场。
在蛋白质结构预测中确定一个固定的蛋白质主链的最佳氨基酸侧链排列(见自洽平均场(生物学))。
测定复合材料的弹性性能。

Extension to time-dependent mean fields

在平均场理论中，单点问题中出现的平均场是一个与时间无关的标量或向量。然而，情况并非总是如此: 在一种称为动态平均场理论(DMFT)的平均场理论的变体中，平均场变成了一个与时间有关的量。例如，DMFT 可以应用于哈伯德模型来研究金属-莫特-绝缘体的转变。

In mean-field theory, the mean field appearing in the single-site problem is a scalar or vectorial time-independent quantity. However, this need not always be the case: in a variant of mean-field theory called dynamical mean-field theory (DMFT), the mean field becomes a time-dependent quantity. For instance, DMFT can be applied to the Hubbard model to study the metal–Mott-insulator transition.