更改

添加19,789字节、 2020年10月14日 (三) 22:12

创建页面，内容为“（本页面正在编辑完善之中……） * 时代背景：第二次量子革命[http://blog.sina.com.cn/s/blog_4031963b0102vjfi.html] {| class="wikitable" |- |…”

（本页面正在编辑完善之中……）
* 时代背景：第二次量子革命[http://blog.sina.com.cn/s/blog_4031963b0102vjfi.html]
{| class="wikitable"
|-
| 第一次（17世纪，力学革命） || 天上和地上运动的统一 || 经典力学
|-
| 第二次（19世纪，电磁革命） || 电、磁、光的统一 || 电动力学
|-
| 第三次（20世纪，引力革命） || 时空和引力的统一 || 广义相对论
|-
| 第四次（20世纪，量子革命） || 粒子和波的统一 || 量子力学
|-
| 第五次（现在，第二次量子革命） || 信息和物质的统一？ || 量子引力？
|}
== 量子信息：从一到无穷 ==
*（量子）计算主义的世界观：
宇宙是台量子计算机，它的算法就是物理学。
*[https://en.wikipedia.org/wiki/Qubit 量子比特]是量子信息的基本单元。
=== 一个比特的量子信息 ===
==== 量子比特 ====
* 什么是量子比特？
:'''量子比特''' = 一个只有'''两个'''本征状态的量子系统
:<math>|\psi\rangle=\alpha|0\rangle+\beta|1\rangle</math>
* 什么是本征状态？
:类比：人脸识别，主成分分析，本征脸的线性组合。
:对于量子比特来说，像硬币只有两面，只有两张“本征脸”，称为0态和1态。

* 用2维向量表示一个量子比特的量子态：
:<math>|0\rangle=\left(\begin{matrix}1\\0\end{matrix}\right), |1\rangle=\left(\begin{matrix}0\\1\end{matrix}\right),
|\psi\rangle=\left(\begin{matrix}\alpha\\\beta\end{matrix}\right).</math>
:量子比特的任何量子态都是两个本征态的线性组合，其中组合系数<math>\alpha,\beta\in\mathbb{C}</math>称为'''概率幅'''。

*量子概率与经典概率：经典概率 = 量子概率的模平方。
:* 经典比特的概率分布：[https://en.wikipedia.org/wiki/Bernoulli_distribution Bernoulli分布]，p与1-p，是两个数。
:* 量子比特的概率分布：密度矩阵（量子化：数变成了矩阵）

==== 密度矩阵 ====
* '''密度矩阵''' = 态矢量的直积
:<math>\rho_\text{pure}=|\psi\rangle\langle\psi|=\left(\begin{matrix}\alpha\\\beta\end{matrix}\right)\left(\begin{matrix}\alpha^* &\beta^*\end{matrix}\right)=\left(\begin{matrix}|\alpha|^2 & \alpha\beta^* \\ \alpha^*\beta & |\beta|^2 \end{matrix}\right).</math>
:*对角元：经典概率
:*非对角元：量子相干性（quantum coherence）

* 测量（与环境耦合），0态和1态获得了不同的本征能量，退相干到经典比特。
:<math>|\psi\rangle=\alpha e^{-i E_0 t}|0\rangle+\beta e^{-i E_1 t}|1\rangle\to\rho_\text{pure}=\left(\begin{matrix}|\alpha|^2 & \alpha\beta^*e^{i(E_1-E_0)t} \\ \alpha^*\beta e^{i(E_0-E_1)t} & |\beta|^2 \end{matrix}\right).</math>
:非对角元相位快速变化，在时间平均下，非对角元趋于0.
:<math>\rho_\text{mixed}=\left(\begin{matrix}|\alpha|^2 & 0 \\ 0 & |\beta|^2 \end{matrix}\right).</math>

* 如何刻画两个密度矩阵的区别？[https://en.wikipedia.org/wiki/Von_Neumann_entropy von Neumann 熵]
:<math>S^{(1)}=-\mathrm{Tr}\rho \ln \rho</math>
*推广：n阶[https://en.wikipedia.org/wiki/Renyi_entropy Renyi 熵]（n趋于1极限退化为von Neumann熵）
:<math>S^{(n)}=\frac{1}{1-n}\ln\mathrm{Tr}\rho^n</math>
:* 纯态：熵=0
:* 混态：熵大于0，完全混态：熵=1比特。
*熵从何处来？
:熵是对无知的衡量，因此熵的产生意味着我们忘记了一些知识，丢失了一些量子信息，信息的丢失是熵的起源。纯态存储的量子信息被退相干抹去了，从而产生了熵。这个过程也被称为热化（thermalization）。如果一个量子比特完全热化，我们丢了多少量子信息？正好是一个比特！这也是“量子比特”中“比特”的含义由来。

==== 图解张量运算 ====
*如何形象地记住这些代数公式？'''张量网络'''图！
:* 矢量 - 一阶张量（一维数组） - 一条腿
:* 矩阵 - 二阶张量（二维数组） - 两条腿
:* 一般的张量（高维数组） - 多条腿
:* 标量（零为数组）- 标量无腿！
* 每条腿代表一个张量的指标。
:* 腿的维度（bond dimension）<math>D</math>：该腿指标跑遍<math>1,2,3,\cdots,D</math>（数组的界）。
:* 腿的权重（bond weight）<math>w_{ij}=\ln D_{ij}</math> （我们将会看到它会被解读为神经网络中的权重）
* '''直积'''：直接将张量放在一起。
* '''内积'''（指标缩并）：把腿连起来。

=== 两个比特的量子信息 ===
==== 量子纠缠 ====
* '''直积态'''：可因子分解的纯态（factorizable pure state）。
:<math>\begin{array}{ll}|0\rangle|0\rangle&=(1,0)^\intercal\otimes(1,0)^\intercal=(1,0,0,0)^\intercal\\
|0\rangle|1\rangle&=(1,0)^\intercal\otimes(0,1)^\intercal=(0,1,0,0)^\intercal\\
|1\rangle|0\rangle&=(0,1)^\intercal\otimes(1,0)^\intercal=(0,0,1,0)^\intercal\\
|1\rangle|1\rangle&=(0,1)^\intercal\otimes(0,1)^\intercal=(0,0,0,1)^\intercal\end{array}</math>
:一般地，<math>(\alpha_1,\beta_1)^\intercal\otimes(\alpha_2,\beta_2)^\intercal=(\alpha_1\alpha_2,\alpha_1\beta_2,\beta_1\alpha_2,\beta_1\beta_2)^\intercal</math> 是两量子比特的一个直积态。

*'''纠缠态'''：不是直积态的纯态（不可分解的纯态）
:例：Einstein-Podolsky-Rosen（EPR）对
:<math>\frac{1}{\sqrt{2}}\big(|0\rangle|0\rangle+|1\rangle|1\rangle\big)=\frac{1}{\sqrt{2}}(1,0,0,1)^\intercal</math>
:一旦测得第一个量子比特的状态是0（或1），另一个量子比特的状态“立刻”坍缩为0（或1），因此我们说这两个量子比特纠缠在一起。

* 量子力学有一种本质的'''非局域性'''，那就是'''量子纠缠'''。即使相隔遥远，也有一种幽灵般的“超距作用”（这一点曾经令Einstein感到不安）。

* 例：<math>\frac{1}{2}\big(|0\rangle|0\rangle+|0\rangle|1\rangle+|1\rangle|0\rangle+|1\rangle|1\rangle\big)</math>是不是一个纠缠态？答案：……。
:并不是线性组合得越厉害，纠缠就越大。
:那么怎么判断一个态是不是纠缠态？怎么衡量两个量子比特之间的纠缠的强弱？

==== 纠缠熵 ====
* '''约化密度矩阵'''：密度矩阵的部分迹（partial trace），类比于经典信息论中的边缘概率分布（marginal distribution）
:<math>\rho_A = \mathrm{Tr}_{\bar{A}}\rho</math>
:需要做一个人为的划分：系统<math>A</math>=第一个量子比特，环境<math>\bar{A}</math>=第二个量子比特。问系统与环境之间的纠缠。
* '''纠缠熵'''：约化密度矩阵的熵
:<math>S_A^{(1)}=-\mathrm{Tr}_A\rho_A\ln\rho_A</math>
:<math>S_A^{(n)}=\frac{1}{1-n}\ln\mathrm{Tr}_A\rho_A^n</math>
*例1：直积态<math>\frac{1}{2}(|0\rangle+|1\rangle)\otimes(|0\rangle+|1\rangle)=\frac{1}{2}(1,1,1,1)^\intercal</math>
:<math>\rho=\frac{1}{4}\left(\begin{matrix}1&1&1&1\\1&1&1&1\\1&1&1&1\\1&1&1&1\end{matrix}\right)\quad\to\quad\rho_A=\frac{1}{2}\left(\begin{matrix}1&1\\1&1\end{matrix}\right)</math>
:<math>\rho_A</math>的本征值：<math>p_{A,k}=0,1</math>。
:纠缠熵：<math>S_A^{(n)}=0</math>
*例2：纠缠态，EPR对<math>\frac{1}{\sqrt{2}}(|0\rangle|0\rangle+|1\rangle|1\rangle)=\frac{1}{\sqrt{2}}(1,0,0,1)^\intercal</math>
:<math>\rho=\frac{1}{2}\left(\begin{matrix}1&0&0&1\\0&0&0&0\\0&0&0&0\\1&0&0&1\end{matrix}\right)\quad\to\quad\rho_A=\frac{1}{2}\left(\begin{matrix}1&0\\0&1\end{matrix}\right)</math>
:<math>\rho_A</math>的本征值：<math>p_{A,k}=1/2,1/2</math>
:纠缠熵：<math>S_A^{(n)}=\ln 2</math> = 1比特。
* 纠缠熵是对纠缠的度量。为什么量子纠缠会导致熵的产生？直积态：量子信息独立地储存在每个量子比特内部。纠缠态：量子信息被分布在量子比特之间，只看一个量子比特，量子信息丢失了，信息的丢失 = 熵的产生。

*'''量子互信息'''：测量A能告诉多少关于B的信息？
:<math>I^{(n)}_{AB}=S^{(n)}_{A}+S^{(n)}_{B}-S^{(n)}_{A\cup B}</math>
*EPR对：超越经典互信息的2比特！（不但知道了ZZ关联还知道了XX关联）
*量子信息是分享的。信息既不再这里，也不在那里，那在哪里？范式的转变：从面向对象的物理学到面向关系的物理学。神经网络：信息不在任何神经元上，而是在神经元与神经元的连结关系之中。

信息寓于关系，网络是描述关系的语言。

==== 张量网络 ====
*量子态的张量表示
:<math>|\Psi\rangle=\sum_{s_1=0,1}\sum_{s_2=0,1}\Psi_{s_1,s_2}|s_1\rangle|s_2\rangle</math>
*直积态和纠缠态的张量网络表示。
:*直积态：<math>\Psi_{s_1,s_2}=A_{s_1}B_{s_2}, A=B=\frac{1}{\sqrt{2}}\left(\begin{matrix}1\\1\end{matrix}\right)</math>
::腿维度<math>D_{AB}=1</math>, 腿权重<math>w_{AB}=\ln D_{AB}=0</math> 相当于没有连边，因此也没有纠缠。
:*EPR态：<math>\Psi_{s_1,s_2}=\sum_{t=0,1}A_{s_1,t}B_{t,s_2}, A=B=\frac{1}{2^{1/4}}\left(\begin{matrix}1&0\\0&1\end{matrix}\right)</math>
::腿维度<math>D_{AB}=2</math>（张量指标<math>t=0,1</math>）, 腿权重<math>w_{AB}=\ln D_{AB}=\ln 2</math> 有一个比特的连边，表达了一个比特的量子纠缠。
::EPR态是两个量子比特的最大纠缠态（所有的量子信息都被分配到量子比特之间）。但一般来说，纠缠熵是介于0和1比特之间，连边权重也应该理解为一种有效维度（有效秩）的对数。
*量子纠缠 = 张量网络的连边。连边权重越大，量子纠缠越强。

=== 多个比特的量子信息 ===
==== 张量网络态 ====
*张量网络态
:<math>|\Psi\rangle=\sum_{[s]}\Psi_{[s]}|[s]\rangle</math>
:N个量子比特，N条腿（<math>[s_1,s_2,\cdots,s_N]</math>），每条腿的维度2，因此<math>\Psi_{[s]}</math>共有<math>2^N</math>元素。
*量子信息大数据！如何压缩？
:把量子信息储存在张量网络的结构之中。这与把学习获得的记忆存储在神经网络中有异曲同工之处。
神经网络编码经典信息，张量网络编码量子信息。

==== 面积律vs体积律 ====
* 纠缠熵在张量网络中的几何意义：网络的最少切割
:* '''面积律'''：纠缠熵正比于子系统面积
:* '''体积律'''：纠缠熵正比于子系统体积
* Matrix Product State (MPS)：面积律
:2016年诺贝尔物理学奖，David J. Thouless, F. Duncan M. Haldane, J. Michael Kosterlitz。其中Haldane教授的一个获奖工作是发现了一维的拓扑态：Haldane chain。这个拓扑态可以用一种张量网络来表达：
:<math>|\Psi\rangle=\sum_{[s=x,y,z]}\mathrm{Tr}(\cdots\sigma^{s_1}\sigma^{s_2}\sigma^{s_3}\cdots)|[s]\rangle</math>
:<math>\sigma^{x,y,z}</math>Pauli 矩阵，故称矩阵乘积态
:特点：不管子系统A有多大，纠缠熵都是2比特，正比于A的面积（两个点）
* 一般的多体量子系统，基态：量子有序，激发态：量子混沌
* Eigenstate Thermalization Hypothesis (ETH)：体积律
:ETH：纠缠熵 = 热力学熵
:例：随机图（k ~ const, c → 0）可以给出一个体积律
* 热力学的量子起源
:混沌=局域性的丧失，量子混沌=非局域的张量网络（长程连边，随机图）。纠缠在整个量子系统中扩散，量子信息以高度非局域的方式散布（scrambling），一切局域测量都无法提取，量子信息就像丢失了一样，这是熵的起源。虽然量子系统的时间演化是线性的、可逆的，而且量子信息事实上没有消失，但是在有限的复杂度(complexity)标度下，无法获取的信息只能忘记，遗忘是不可逆的，时间的方向性被演生出来。

== 张量网络：空间几何的量子织锦 ==
* 纠缠 - 网络 - 几何
空间源于量子纠缠
=== 全息对偶 ===
==== 量子纠缠与虫洞 ====
* 量子力学的非局域性：量子纠缠（EPR对）
* 广义相对论的非局域性：虫洞（ER桥）
* 量子纠缠和虫洞都很脆弱（EPR会退相干，而虫洞会坍缩关闭）
*Susskind和Maldacena(2013): ER=EPR [http://arxiv.org/pdf/1604.02589v1.pdf]
:*狭义的理解：纠缠的黑洞有虫洞相连，有虫洞相连的黑洞是纠缠的。
:*广义的理解：每对纠缠的量子比特之间都有一个量子虫洞（普朗克虫洞）。

*量子纠缠幽灵般的超距作用，是否违反相对论？否，因为有小虫洞相连，因此是一个点。可见量子比特之间的距离应该根据量子纠缠来定义：'''纠缠越强，距离越近'''！
*在张量网络上，两个张量之间的连边权重越大，纠缠越强，距离越近。因此张量网络的几何，正好就是全息空间几何，因为它们对距离的定义是一致的。

==== 纠缠熵的几何意义 ====
* AdS/CFT对偶 Ryu-Takayanagi 公式：
:boundary: 量子态的纠缠熵 = bulk: 全息空间中的测地线长度
:<math>S_{A}=\frac{1}{4G_N}|\gamma_A|</math>
:A：边界上的子系统，<math>\gamma_A</math>：全息空间中连接A的边界的测地线。
* 全息空间就是张量网络的几何化空间！
:量子态的纠缠熵 = 张量网络上的最短分割 = 全息空间的测地线
* 信息 - 网络 - 几何：量子信息 - 张量网络 - 全息空间

=== 量子临界和双曲空间 ===

* 量子临界现象：量子多体波函数中的无标度行为。
:*纠缠熵：对数律
::<math>S_{A}\sim \ln |A|</math>
:*关联函数，量子互信息：幂律
::<math>I_{AB}\sim |x_A-x_B|^{-\alpha}</math>

*MERA网络：双曲空间中的张量网络。
:*MERA本身是重整化算法，输入：多体量子系统的Hamiltonian，输出：基态的张量网络表示，通过对Hamiltonian做重整化将基态中的量子信息编码到张量网络中。
:*为什么是双曲空间？动力学决定几何：重整化的动力学（+临界系统）导致双曲几何。

*网络几何化有什么好处？非局域性质的局域化
:*纠缠熵：面积律（全息空间）
::<math>S_{A}\sim |\gamma_A|</math>
:*关联函数，量子互信息：指数律（全息空间）
::<math>I_{AB}\sim e^{-\alpha d_{AB}/l}</math>

=== 空间膨胀与坍缩 ===

* 超越量子临界：局域化与热化。
* 量子局域化 - 空间膨胀 - 暗能量
:局域化阻碍了长程量子纠缠的建立，直积态，量子比特彼此远离
* 量子热化（量子混沌）- 空间坍缩 - 黑洞
:量子混沌：长程量子纠缠泛滥，类似随机态（Page state），量子比特彼此靠近

== 纠缠特征学习：机器学习与演生时空 ==

=== 从测地线几何到统计力学模型 ===

==== 测地线 ====
*测地线是什么？测地线就是弯曲空间中的“直线”，连接两点路径最短的线。
*我们如何得到一条直线？把线“拉”直。
*“拉”是一个什么动作？拉就是要增加线的张力。张力就是单位长度上的弹性势能。
*因此引入张力把长度的最优化问题变成了能量的最优化问题，而能量的优化问题则交给统计模型去完成。
*什么时候测地线它拉不“直”？如果附近有引力源弯曲了空间！

==== 统计力学模型 ====
* Modularity算法：给定一个有边界的网络，先在网络上定义铁磁性（<math>w_{ij}>0</math>）的Ising 模型，并在边界上施加边界条件<math>\sigma_{\partial}</math>，经过测地线的起点和终点Ising自旋反号，
:<math>E[\sigma]=-\sum_{ij}w_{ij}\sigma_i \sigma_j,\quad (\sigma_i=\pm1)</math>
:低温极限（最大似然）：畴界自动就是一条测地线！能量正比于畴界长度，也就是测地线长度。贝叶斯统计：自由能正比于测地线长度
::<math>e^{-F[\sigma_\partial]}=\sum_{[\sigma/\sigma_\partial]} e^{-E[\sigma]}</math>

=== 随机张量网络 ===

*随机张量：每个元素是独立随机变量。比如Gaussian Unitary Ensemble (GUE)
:<math>P(T)=\frac{1}{Z}e^{-||T||^2}</math>
:只需要指定每条腿的维度<math>D</math>，或等价地，腿权重<math>w=\ln D</math>。
*'''随机张量网络'''：给定有权重的完全图<math>G=(V,E)</math>，由权重矩阵<math>w_{ij} (i,j\in V)</math>描述
:*每个顶点<math>i\in V</math>上定义一个随机张量<math>T_i</math>
:*每条边<math>\langle i j\rangle\in E</math>上腿权重为<math>w_{ij}</math>
:*按照连边对张量缩并（tensor trace, tTr）。每个图G都对应一类多体量子态，这些态的纠缠结构相同。
::<math>|\Psi_\text{RTN}\rangle=\sum_{[s]}\Psi[s]|[s]\rangle; \Psi=\mathrm{tTr}\;(T_1\otimes T_2\otimes \cdots)</math>
:*面向关系：张量的内容不重要，张量怎么缩并的很重要。忘记对象，只留连接。

*随机张量网络的Renyi纠缠熵。
:* 首先，需要在张量网络边界上指定一个子系统<math>A\subseteq \partial V</math>。用边界上的Ising构型来编码<math>\sigma_{i\in A}=-1</math>, <math>\sigma_{i\in \bar{A}}=+1</math> （<math>A\cup \bar{A}=\partial V</math>只限定边界，不对体内做限定）
:* 计算<math>|\Psi_\text{RTN}\rangle</math>在子系统A上的Renyi纠缠熵
::<math>P_\text{RTN}(A)\propto e^{-S^{(2)}_\text{RTN}(A)}= \frac{1}{Z}\sum_{[\sigma/\sigma_\partial]}e^{-E[\sigma]}</math>
*从量子回到经典：随机张量网络的纠缠熵问题变成复杂网络上的Ising模型。

=== 量子纠缠的机器学习 ===

*'''纠缠特征学习'''，无监督学习量子态中的纠缠结构
:*样本集：子系统A的划分，等价于边界（visible层）的Ising构型。
:*数据：量子态 <math>|\Psi\rangle</math>，<math>P_\Psi(A)=e^{-S^{(2)}_\psi(A)}</math>
:*模型：随机张量网络，<math>P_\text{RTN}(A)= \frac{1}{Z}\sum_{[\sigma/\sigma_\partial]}e^{-E[\sigma]}</math>
::模型参数：随机张量网络的腿权重<math>w_{ij}</math>，它也是Boltzmann机神经网络的权重。
:*目标：最小化<math>P_\text{RTN}</math>（模型）和<math>P_\psi</math>（数据）的KL divergence
*训练后，随机张量网络的几何就是演生的全息空间的几何，所以全息对偶可以看成一个逆Ising问题。
*时空的起源：我们的时空是在宇宙量子态的“大数据”冲刷下，通过“学习”演生出来的。
*物理上的限制：必须是Boltzmann机，权重正定（无阻错，有效的编码空间很小），而且不要去限定分层和连接结构（难训练，而且有规范冗余）

== 阅读材料 ==
关于这个议题的物理学背景，推荐《量子杂志》上的科普文章《时空的量子结构》。这篇文章一共有包含三节，其中以第二节内容最为相关：
:（一）[https://www.quantamagazine.org/20150424-wormholes-entanglement-firewalls-er-epr/ 纠缠的虫洞]
:（二）*[https://www.quantamagazine.org/20150428-how-quantum-pairs-stitch-space-time/ 网络的织锦]
:（三）[https://www.quantamagazine.org/20150430-space-time-interactive/ 量子几何]
:《赛先生》微信号上刊出了第二节的中文译文[http://iscientists.thenew123.com/news_829550.htm 将宇宙维系在一起的可能是量子幽灵作用]

在学术文献方面，我们将重点阅读以下两篇文章。

第一篇是G. Evenbly, G. Vidal的综述性文章《[http://arxiv.org/pdf/1106.1082v1.pdf 张量网络量子态和几何]》。Vidal教授是这个领域的开创者之一。如果觉得看文章很累，也可以观看Vidal教授2015年在KITP讲解这篇文章的[http://online.kitp.ucsb.edu/online/entangled_c15/vidal/ 演讲录像]。

第二篇是今年的一篇新文章《[http://arxiv.org/pdf/1601.01694.pdf 从随机张量网络到全息对偶]》，引入了随机张量网络，讨论了与全息几何的关系。

=== 补充材料 ===
深度网络与重整化群
* Pankaj Mehta, David J. Schwab, An exact mapping between the Variational Renormalization Group and Deep Learning [http://arxiv.org/abs/1410.3831]
* Why Deep Learning Works II: the Renormalization Group [https://charlesmartin14.wordpress.com/2015/04/01/why-deep-learning-works-ii-the-renormalization-group/]

思无涯咿呀咿呀

管理员

2,443

个编辑

更改

张量网络 (查看源代码)

2020年10月14日 (三) 22:12的版本

导航菜单

搜索