当概率成为复数——量子概率简介

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
Thingamabob讨论 | 贡献2020年10月14日 (三) 21:40的版本
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳到导航 跳到搜索


  • 作者:jake
  • 时间:2008-04

当概率成为复数——量子概率简介

介绍

与其说量子力学是一门物理,还不如说它是一种数学。数学关心的是符号之间抽象的关系与结构,而不关心符号对应的实物。这门诞生于量子物理的抽象数学被人们称为量子概率。量子概率不一定非得描述微观粒子,而可以描述更一般的宏观系统,例如人类的认知现象。注意,这种应用并不是把人类认知还原为大量的微观粒子,而是将认知主体作为一个完整的系统,而运用量子概率去描述。正如随机过程作为一个独立的数学分支可以脱离它的原始物理背景而应用到包括金融、生物等更广阔的系统中一样,量子概率也必将可以作为一套与经典概率不同的数学分支应用到各种领域之中。

本文绕开了那些繁杂的量子物理试验以及算符、波函数等量子力学的标准讲法,而是从概率幅可以取复数这个特点切入到量子概率的理论体系中。从这个角度看,量子概率可以说是将经典概率扩展到复数域之后的数学产物,因此整个量子概率体系的各种结论都可以自然得到。然而一个疑问是:究竟这样一种纯数学游戏般的概率扩充有什么实际意义呢?本文试图指出:量子概率——经典概率在复数域的扩充其实刻画的是观察者对于外界信息的不确定性情况下的描述,这种不确定性要比经典概率不确定更不确定:一个是量子概率考虑到了观察对观测系统的影响(当然,这是按照经典的哥本哈根解释,我们仅将观测对系统影响作为一种唯像的数学刻画,至于如何影响及其背后原理,包括比较新的退相干解释,我们不做过多讨论,这不是本文的重点),另一个是考虑到观察者处理信息能力的极限。

本文首先沿着将概率复数化的思路引入复数概率(即量子物理中的概率幅)的概念,之后为了看到将经典概率与复数概率的不同,我们从几何表示到不兼容属性对,再从不兼容属性对到复合系统到纠缠态再到贝尔不等式一路下来,其主要的目的就是展示复数概率与经典概率的区别。然而,这样做的代价是大家对复数概率的整个框架不甚了解。于是,我们在第四章,又重新用相对正规的数学定义出发,重新介绍了量子概率的体系框架。最后,我们将把量子概率体系如何应用到人类认知现象作了简单介绍。并进一步针对不兼容属性对以及纠缠和贝尔不等式的拓广进行了讨论。

如果概率可以取复数

当 i 进入物理学

所谓的复数就是形如下式所表示的数:

[math]\displaystyle{ a+bi }[/math]

其中a和b都是普通的实数,而i则表示[math]\displaystyle{ \sqrt{-1} }[/math],又称为虚数单位。i最早进入数学完全是偶然。在费罗的三次方程的求根公式中,i会以计算的中间步骤出现,但是又消失在最终的计算中(参见《虚数的故事》)。因为人们无法想象一个平方等于-1的数会是什么样子的,因此人们给它起了一个非常有诗意的名字:虚数(Imaginary number)。

虚数,故名思义,它只存在于人们想象之中,而无法找到任何现实对应。所以,长期以来,虚数从未真正进入过物理学(尤其是20世纪以前的经典物理学)领域,因为虚数不可能表达实实在在的物理量。即使在交流电路分析中,工程师、物理学家们用复数来表示电流和电压,但那也仅仅是一种“数学技巧”罢了。也就是说,如果我们不用复数,也能完成所有的运算,而这样只不过会让计算稍稍复杂一些罢了。

20世纪以后的物理学开始变得让人匪夷所思了。先是爱因斯坦的相对论打破了人们旧有的时空观念,接下来量子理论又开始挑战人们头脑中的实在观念。有趣的是,这两个革命性理论的建立都与虚数i在物理学中的应用分不开。

首先,在相对论中,虚数i连带着时间t和光速c构成了一个可以与空间相提并论的四维闵可夫斯基空间,在这个奇妙的四维空间里,物体的匀速运动被转化成了绕原点的旋转。更有意思的是,与空间等价的坐标系不是时间t,而是一个乘上了虚数i的虚时间。

如果说将i引入相对论中也不过是一种数学技巧(爱因斯坦建立的狭义相对论并不依赖于四维时空,因此也没有虚数i)。那么,在量子力学这个更让人费解的物理学理论中引入虚数i则是一种不可避免的事情。虚数i对应的是量子状态的相位,虽然相位仍然不可测量,但是它却是使得量子系统表现为区别于经典系统的主要原因。进一步,量子力学中虚数i的引入,还使得人们对概率的认识过渡到了对概率幅这一可以取复数的类概率量(之所以称之为类概率量,是因为概率幅的运算法则与经典概率的运算法则完全一致)的阶段。这篇文章则是从复数概率幅这个角度来介绍量子概率理论的。

将概率复数化

当我们抛一枚硬币出去,那么该硬币就会以概率p(1)出现正面,以概率p(0)出现反面,并且p(1)+p(0)=1。这句话的意思是,如果我抛掷硬币N次,出现正面的次数是n次,那么p(1)就解释为n/N,而p(0)就是(N-n)/N。显然,如果我直接将概率p(1)取为复数值,则没有任何意义,因为我们不再可能将p(1)解释为出现正面的次数占总的抛掷硬币次数的比例。

然而,经典概率论存在着一个致命的漏洞。在通常情况下,事件的概率并不是一个可观测的量。在每次抛硬币的过程中,我们实际上只能观测到正面或者反面,而无法观测概率p(1)。只有当我们进行了大量的实验,并且能够保证这些实验都是对同一个随机事件(例如在同一个条件下抛掷同一枚硬币),我们才能渐进地观测到某一个事件出现的概率。然而,在更多的无法进行重复试验的场合下(例如明天是否会下雨),我们仍然可以定义概率,但是这里的概率就是一个彻头彻尾不可观测的量。

正是概率的这种不可直接观测性,使我们有机可乘,从而可以将概率变成复数。我们并不是直接把硬币出现正面的概率p(1)定义为复数a+bi,而是定义一种叫做概率幅(在本文中又称为复数概率)的新量,即:

[math]\displaystyle{ \psi =a+bi }[/math]

并且,我们规定这个复数概率ψ可以按照下述规则转变为经典概率:

[math]\displaystyle{ p=|\psi {{|}^{2}}=\psi *\psi =(a-bi)(a+bi)={{a}^{2}}+{{b}^{2}} }[/math]

|ψ|表示求复数ψ的模,ψ*表示ψ的共轭复数,也就是说ψ乘以它自己的共轭就得到了ψ的模。当然,如果要求p表示经典概率,那么必须要求[math]\displaystyle{ {{a}^{2}}+{{b}^{2}}\in [0,1] }[/math]。正是因为在一次抛硬币随机试验中,我们原则上只能得到正面(1)或者反面(0)的观测,而不能得到关于概率p的任何信息。所以,我们不妨在这个观测过程上面做文章,我们假设每一次观测会发生3件事:

首先,在观测前,假设硬币正面朝上可以用一个复数概率来表示,例如:

[math]\displaystyle{ \psi (1)=\frac{1}{2}+\frac{1}{2}i }[/math]

然后,在测量的瞬间,我们定义复数概率会自动转变成概率,即按照如下原则得到正面朝上的概率:

[math]\displaystyle{ p(1)=|\psi (1){{|}^{2}}={{\left( \frac{1}{2} \right)}^{2}}+{{\left( \frac{1}{2} \right)}^{2}}=\frac{1}{2} }[/math]

最后,硬币会按照这个概率p(1)随机地出现正面或者反面。我们看到,如果进行大量的实验,我们仍然可以得到出现正面的频率是1/2。

总之,我们假设硬币出现正面这个随机事件不仅可以用概率p(1)来描述,而且还可以用复数概率ψ(1)进行描述。并且对一次随机试验的观测实际上是先从复数概率转变为经典概率,再由经典概率支配出现某一个观测值的比例。

因此,我们可以假设在概率背后还有一个更基本的复数概率制约着概率本身。正是因为概率本身并不是一个可以被直接观测到的量,所以我们再做一层复数概率的假设就不会引起实质的困难。尽管我们增加了理论的复杂性,但是我们终于可以成功地将概率复数化了。其实量子力学就是这么干的!

我们知道,某一个事件X的经典概率与该事件的复数概率存在着对应关系:

[math]\displaystyle{ P(X)=|\psi (X){{|}^{2}} }[/math]

然而,这个关系却不是对称的。从复数概率到经典概率的映射是一个多对一的映射。也就是说针对一个具体的概率值P(X),存在着无穷多个复数概率与其对应,可以证明这群复数概率满足:

[math]\displaystyle{ \psi (X)=\sqrt{P(X)}(\operatorname{Cos}\theta +i\ \operatorname{Sin}\theta )=\sqrt{P(X)}\exp (i\theta ) }[/math]

其中θ为任意实数。这群复数落到了以原点为圆心,以[math]\displaystyle{ \sqrt{P(X)} }[/math]为半径的圆上。这种多对一的关系使得复数概率完全可以涵盖经典概率的内容,甚至可以包含更丰富的信息。另一方面,复数概率具有更深的不可观测性,因为即使你对事件X进行了大量的测量,也仅仅能够得到复数概率的模的信息,而不可能确定它的相角θ,这就为我们估算复数概率带来了挑战。正是因为这个相角的存在,复数概率和经典概率表现出了本质的区别。

分布与向量表示

在经典概率中,一个随机变量可以取多个不同的值,这些取值构成了两两互斥的随机事件。我们假设随机变量X的可能取值为:{x1,x2,…,xn},那么我们可以定义n个概率:

[math]\displaystyle{ p({{x}_{i}})=P\{X={{x}_{i}}\text{ }\!\!\}\!\!\text{ , for i}=\text{1,2,}\cdots \text{,n} }[/math]

并且这些概率满足归一化条件:

[math]\displaystyle{ \sum\limits_{i=1}^{n}{p({{x}_{i}})}=1 }[/math]

那么这一组概率p(xi)就构成了X的一个概率分布。为了方便讨论,我们不妨将这一组概率写成一个向量的形式:

[math]\displaystyle{ F(X)={{p}_{1}}\left| {{x}_{1}} \right\rangle +{{p}_{2}}\left| {{x}_{2}} \right\rangle +\cdots +{{p}_{n}}\left| {{x}_{m}} \right\rangle }[/math]

其中pi=p(xi),pi|xi>表示对应的X在取值为xi的时候概率为p(xi)。我们知道,F(X)这个向量相当于n维空间中的向量(p1,p2,..,pn),其中pi就是该向量在第i个维度上的坐标。这样,|xi>就相当于是这n维空间中的第i个基向量。所以F(X)又可以写成坐标乘以相应的基向量再求和的形式。

按照前面的将概率复数化的思想,我们也可以为每个随机事件X=xi定义复数概率,这样n个复数概率也可以写成向量的形式:

[math]\displaystyle{ \Psi (X)={{\psi }_{1}}\left| {{x}_{1}} \right\rangle +{{\psi }_{2}}\left| {{x}_{2}} \right\rangle +\cdots +{{\psi }_{n}}\left| {{x}_{n}} \right\rangle }[/math]

并且变量X取值xi的经典概率就是:

[math]\displaystyle{ P\{X={{x}_{i}}\}={{\left| {{\psi }_{i}} \right|}^{2}} }[/math]

并且要求:

[math]\displaystyle{ \sum\limits_{i=1}^{n}{|{{\psi }_{i}}{{|}^{2}}}=1 }[/math]

在经典概率中,如果我们给定了随机变量X在各种可能值上的概率,也就是给定了向量F(X),那么系统的状态就给定了。因为,系统的任何性质都可以从概率分布中得到。同样的道理,在复数概率中,给定了向量Ψ(X),也就给定了系统的状态,因为系统的一切性质都可以从这个向量中导出。

在量子力学中向量Ψ(X)称之为一个量子系统的叠加态。这个状态与经典概率的分布F(X)还是很不一样的。在经典概率中,如果一个系统的概率分布是F(X),那么我们可以说变量X以p1的概率取值x1,以p2的概率出现x2,…。但是在状态为Ψ(X)的量子系统中,我们不能说系统以|ψ1|2的概率处于|x1>状态,以|ψ2|2的概率处于|x2>状态,……。这是因为这些状态之间会发生相互干涉影响,我们将在下一节中继续讨论这个区别。

由于概率是不可直接测量的量,因此,我们完全可以用复数概率来描述系统从而达到用经典概率描述等同的效果。例如,我们可以用经典概率分布:

[math]\displaystyle{ F(X)=\frac{1}{2}\left| 0 \right\rangle +\frac{1}{2}\left| 1 \right\rangle }[/math]

来表示一枚硬币处于正面(状态|1>)和反面(状态|0>)的概率各是0.5。同样,我们也可以假设这枚硬币处于一个可以用复数概率描述的量子叠加态:

[math]\displaystyle{ \Psi (X)=\left( \frac{1}{2}+\frac{1}{2}i \right)\left| 0 \right\rangle +\left( \frac{1}{2}+\frac{1}{2}i \right)\left| 1 \right\rangle }[/math]

或者:

[math]\displaystyle{ \Psi (X)=\frac{1}{\sqrt{2}}\left| 0 \right\rangle +\frac{1}{\sqrt{2}}\left| 1 \right\rangle }[/math]

那么,按照从复数概率到经典概率的转换,这两种描述不会产生任何可观测到的区别。进一步,我们可以在复数概率体系下定义随机变量的均值,这里不详述了,参加附录1。

多则不同

到此为止,量子概率和经典概率没有任何的不同之处。然而当我们考察两个以上事件或随机变量的时候,量子概率和经典概率才能表现出非常不同的特性。

事件与希尔伯特空间

我们知道,事件这个概念是概率论的基础。在量子概率体系中,事件不再对应经典的集合,而是对应于线性空间(线性代数没学好的读者,建议先补休一下线性代数),这个空间又称为希尔伯特空间。

仍然以抛硬币为例,我们知道一个硬币在具体的测量之前可以处于一种用复数概率描写的量子力学叠加态:

[math]\displaystyle{ \Psi (X)=\frac{1}{\sqrt{2}}\left| 0 \right\rangle +\frac{1}{\sqrt{2}}\left| 1 \right\rangle }[/math]

这个状态可以恰好用一个二维的线性空间表达:

概览变成复数-图1.png

图1 复数概率的向量表示

在图中,绿色的向量和红色的向量分别表示单位向量|0>和|1>

我们知道,在实验中,0表示的是抛掷硬币得到反面,1表示得到正面。出现正面或者反面实际上都是基本的事件。而在复数概率的向量表示中,这两个基本事件则变成了两个相互垂直,交于一点O的单位向量|0>和|1>。

这是一个非常关键的区别,在经典概率中,任何原子事件都可以用一个单元素的集合来表示,例如硬币正面朝上的事件可以用{1}这个集合来表示,集合中的元素只有一个1。但是,在复数概率中,这个原子事件则变成了向量|1>。读者一定会质疑,我们用向量表示原子事件又有什么好处呢?这与概率取复数值又有什么关系呢?答案就在于,只有这样扩展量子概率,我们才能表达不兼容属性。

不兼容属性

不兼容性的复数概率表示

不兼容属性(incompatible property)是量子概率——将概率论扩充到复数域的最特别的概念,也是区别复数概率和经典概率的本质所在。

所谓的一对不兼容属性就是指一个客观物体所具备的两种属性,这两种属性不能同时得到确切的测量值。当你知道了属性A的确切值之后,你就不能获知B的确切值了。我们知道,量子力学中有很多不确定(uncertain)对,这些不确定对,例如同一个粒子的位置和动量,或者是能量和时间就是不兼容属性对。

我们先从抽象的数学形式上考察复数概率是如何可以很好地表征不兼容属性以及不确定性原理的(Uncertainty Principle)。假设某一个系统具有属性A,属性A的取值可以有{U,D}(即上、下)两种可能。另外,该系统还具有属性B,B的取值可以由{L,R}(即左、右)两种可能。这样,我们就可以构成4组不同的原子事件{A属性为U,A属性为D, B属性为L和B属性为R}。我们知道,每个事件都可以用线性空间中的向量来表示。由于A属性要么取U要么取D,所以前两个事件就可以用两个相互垂直的向量来表示。同样的道理,后两个事件(B为L或者B为R)也可以用两个相互垂直的向量表示。显然,前两个事件张成了一个平面,后两个事件又张成了另一张平面,问题的关键是,当这两张平面重合在了一起会如何呢?如下图所示:

概览变成复数-图2.png

图2 同一个状态向量在两组不同基下面的表示

如图所示前两个事件(属性A取U或者D两个属性)的两个基向量是黑色的坐标系(|U>和|D>)。而后两个事件(属性B取L或者R两个属性)对应的基向量则用蓝色的坐标系(|L>和|R>)表示。这两个坐标系重合在了同一张平面上,只不过它们之间存在了一个夹角θ(在更一般的情况下该夹角可以取复数)。对于同一个向量,例如对图中的粗箭头来说,它在第一个坐标系下可以表示为:

[math]\displaystyle{ {{\psi }_{A}}=x\left| U \right\rangle +y\left| D \right\rangle }[/math]

那么,在第二个坐标系下(|L>和|R>构成的坐标系)的坐标就是:

[math]\displaystyle{ \left( \begin{matrix} x' \\ y' \\ \end{matrix} \right)=\left( \begin{matrix} \cos \theta & \sin \theta \\ -\sin \theta & \cos \theta \\ \end{matrix} \right)\cdot \left( \begin{matrix} x \\ y \\ \end{matrix} \right)=\left( \begin{matrix} x\cos \theta +y\sin \theta \\ -x\sin \theta +y\cos \theta \\ \end{matrix} \right) }[/math] (*)

因此,同样的向量可以表示为:

[math]\displaystyle{ {{\psi }_{B}}=x'\left| L \right\rangle +y'\left| R \right\rangle }[/math]

因此,ψA和ψB是同一个向量在不同坐标系下的表示。回想该向量的物理意义表达的是发生A取值U事件的概率是|x|2,取值D事件的概率是|y|2。而ψB则表达的是B属性取值L事件的概率是|x’|2,取值R的概率是|y’|2。然而,由于x’,y’与x,y存在着联系(*)式,所以A属性上面的概率分布就会对B属性造成影响,反之亦然。因此,A和B两个属性之间存在着一种强烈的联系。它们是不兼容性,即不能同时测准。这是因为,如果你确定地知道了A属性的取值就不可能完全知道B属性的取值了。

比如,假设我们确定地知道A属性的取值为U,即发生U事件的概率为1,则:

[math]\displaystyle{ {{\psi }_{A}}=1\left| U \right\rangle +0\left| D \right\rangle }[/math]

这样根据坐标变换(*)式,同样的状态反映在B属性上就成了:

[math]\displaystyle{ \left( \begin{matrix} x' \\ y' \\ \end{matrix} \right)=\left( \begin{matrix} \cos \theta & \sin \theta \\ -\sin \theta & \cos \theta \\ \end{matrix} \right)\cdot \left( \begin{matrix} 1 \\ 0 \\ \end{matrix} \right)=\left( \begin{matrix} \cos \theta \\ -\sin \theta \\ \end{matrix} \right) }[/math]

这样,只要θ不是0或者90度的整数倍,则我们必然得到B属性值是不确定的,它会以cos2θ的概率取值L,而以sin2θ的概率取值R。因此,我们说A和B是一对不兼容的属性,因为它们不能同时被测准。其实,在数学上存在着对L或者R发生的概率更简洁的运算方法,我们不在正文详述,具体请参见附录2。

总体来说,所谓的不兼容属性对实际上就是两组处于同一个平面的坐标系,它表达的是两个随机变量分布之间的一种深刻的联系。也就是说只要确定了两个不兼容属性,那么它们之间的夹角θ就确定下来,因此给定属性A上的复数概率分布,就必然会确定一组B上的复数概率分布。

为什么一定要复数概率?

也许读者会争辩说,在经典概率中,我们也可以引入上述这些坐标系转换的概念。例如我们可以画出类似的图2的那种图。我们也可以把经典概率表达成向量:

[math]\displaystyle{ F(X)=\frac{1}{2}\left| 0 \right\rangle +\frac{1}{2}\left| 1 \right\rangle }[/math]

然后,同样把这个向量投影到蓝色的坐标系下,得到新的向量表示:

[math]\displaystyle{ \left( \begin{matrix} x' \\ y' \\ \end{matrix} \right)=\left( \begin{matrix} \cos \theta & \sin \theta \\ -\sin \theta & \cos \theta \\ \end{matrix} \right)\cdot \left( \begin{matrix} 1/2 \\ 1/2 \\ \end{matrix} \right)=\frac{1}{2}\left( \begin{matrix} \cos \theta +\sin \theta \\ -\sin \theta +\cos \theta \\ \end{matrix} \right) }[/math]

然而,不幸的是,这种坐标转换后得到的新“概率分布”却不总能满足概率分布的要求。比如我们设θ=π/4,那么|L>的概率就是[math]\displaystyle{ \sqrt{2}/2 }[/math],|R>的概率则是0。所以这对数不能构成一个合格的概率分布。

只有当考虑复数概率的时候,才能引入坐标转换的概念,这是因为,坐标转换本质上来讲就是一种旋转操作,而旋转操作会保持向量的模(即向量长度)不改变。所以对于任何一个复数概率分布所对应的状态向量[math]\displaystyle{ {{\psi }_{A}}=x\left| U \right\rangle +y\left| D \right\rangle }[/math]来说,由于它的模必须是1,所以无论你转换到哪一个坐标系,它都保持长度不变,也就能保证新的向量所对应的经典概率分布是一个良定义的概率分布,即各个分量上面的概率求和为1。正是因为概率幅而非概率具有这种旋转模不变的性质,所以我们只能对复数概率进行坐标变换的定义。

盒子中的萤火虫

下面我们用一个宏观系统的例子来说明不兼容属性对。这个例子最早是由Cohen(参见:Cohen,D.W., An introduction to Hilbert space and quantum logic, Springer, New York,1989)引入来说明量子概率与经典概率区别的。我们引入这个例子的目的仅仅是说明复数概率的运算法则,有趣的是,如果你真的做出来这样一个萤火虫系统,你是不会观察到复数概率预测的那些古怪性质的。因此,不要误把萤火虫系统看作是符合复数概率的量子系统看待。

概览变成复数-图3.png

图3 盒子中的萤火虫

假设在一个黑盒子中放了只萤火虫,萤火虫可以随机地分别穿梭于左上、右上、左下、右下四个方格中的某一个。然而,盒子上仅开了两个洞,洞A在盒子的右侧,另一个洞B在盒子的上侧。这样,观察者仅仅能够通过这两个洞的某一个来观测盒子中的萤火虫。当观察者通过右侧的A洞来观察的时候,他(她)仅仅能得出萤火虫是在上U或者下D的结论,并且概率分别是1/2和1/2。当他通过上方的B洞来观察萤火虫的时候,他仅仅能够得到左L或者右R的结论,并且概率分别是3/8和5/8。但是,上、下的观测以及左、右的观测不能同时精确地做出。这样通过A,B两个洞来观测萤火虫就是一对不兼容的属性。

我们可以很好地用刚才讲述的复数概率运算法则来描述这个例子。假设观察者先从A洞观察萤火虫,这个时候,我们可以用一对复数概率来表示这种状态:

[math]\displaystyle{ {{\psi }_{A}}=\frac{1}{\sqrt{2}}\left| U \right\rangle +\frac{1}{\sqrt{2}}\left| D \right\rangle }[/math]

这可以表示为二维平面上的一个向量,如图3所示,只不过这个时候的x,y都取值1/sqrt(2),它们表示萤火虫处于上、下两个状态的概率分别是1/2。

下面我们再考虑从B洞观测萤火虫的观察者。我们知道尽管观察者变换了观察系统的视角,但是萤火虫本身并没有改变状态,因此萤火虫的状态表达不能改变。那么如何来表达观察者从B洞观测萤火虫的情况呢?我们知道,每一个属性值其实都是线性空间中的一个向量,这样具有两个不同值的属性就构成了一对相互垂直的单位向量。所以从B洞观测这个属性就可以表示为两个相互垂直的的向量|L>和|R>,如图2表示。

因此,根据(*)式,同样的向量在新基向量|L>和|R>下的坐标就是:

[math]\displaystyle{ \left( \begin{matrix} x' \\ y' \\ \end{matrix} \right)=\left( \begin{matrix} \cos \theta & \sin \theta \\ -\sin \theta & \cos \theta \\ \end{matrix} \right)\cdot \left( \begin{matrix} \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \\ \end{matrix} \right)=\left( \begin{matrix} \cos \theta +\sin \theta \\ -\sin \theta +\cos \theta \\ \end{matrix} \right)\frac{1}{\sqrt{2}} }[/math]

这样,只要我们取

[math]\displaystyle{ \theta =\arccos (\frac{\sqrt{3}-\sqrt{5}}{4}) }[/math]

就能使得新坐标是[math]\displaystyle{ (\sqrt{\frac{3}{8}},\sqrt{\frac{5}{8}}) }[/math],所以同样的状态向量也可以在新基B下表示为:

[math]\displaystyle{ {{\psi }_{A}}=\sqrt{\frac{3}{8}}\left| L \right\rangle +\sqrt{\frac{5}{8}}\left| R \right\rangle }[/math]

按照对复数概率的解释,我们就能以3/8的概率从B孔观测到萤火虫出现在左侧盒子,以5/8的概率出现在右侧的盒子。所以,我们就用复数概率很好地表达了盒子中的萤火虫这个例子。

仅仅用复数概率来表示萤火虫的例子还不能说明什么,更重要的是,给定了观察的属性对A,B两个孔后,那么θ值就是固定的数了。假如我们让萤火虫在U,D上面的复数概率分布发生改变,例如新的状态是:

[math]\displaystyle{ {{\psi }_{A}}=\frac{i}{2}\left| U \right\rangle +\frac{\sqrt{3}}{2}\left| D \right\rangle }[/math]

那么,我们必然会得到L和R上的复数概率分布会发生改变为:

[math]\displaystyle{ \frac{1}{8}((\sqrt{3}-\sqrt{5})i+\sqrt{6(4+\sqrt{15}})\left| L \right\rangle +\frac{1}{8}(3-\sqrt{15}-i\sqrt{2(4+\sqrt{15}})\left| R \right\rangle }[/math]

对应的概率就是0.742在L和0.258在R。所以两个概率分布必然存在着一种制约关系。这才是不兼容属性对的本质。

假设在盒子中有一个小妖精,它可以精确地知道萤火虫到底处于LU,RU,LD,RD之中的某一个的概率。比如说,萤火虫会以(1/8,3/8,1/4,1/4)的概率分别处于LU,RU,LD,RD之中。这样,根据边际概率公式,我们就可以求出萤火虫处于U的概率是1/8+3/8=1/2,处于D的概率是1/4+1/4=1/2,处于L的概率是1/8+1/4=3/8,处于R的概率是3/8+1/4=5/8,刚好与我们上例中从A孔观察和B孔观察得到的概率相等。这样,我们用不着什么复数概率,只要通过联合概率(1/8,3/8,1/4,1/4)就可以对这个问题进行完整的描述了。实际上,我们给出了属性A的概率分布和B的概率分布,我们总能给出一组联合概率分布数值满足要求。因此,在这一点上看,经典概率也可以模拟不兼容属性对的复数概率行为。

但不同的地方在于,我们的游戏规则规定了观察者只能从A或者B这两个孔的任何一个观察系统,而不能两个同时来做。

可是,凭什么不能同时测量A,B两个属性呢?我们完全可以这样来做:让张三盯住A孔看,李四盯住B孔看。这样每次测量张三能够知道萤火虫在上还是下,李四则知道萤火虫在左还是由,只要把它们的测量结果综合到一起,不就可以获得该系统任意两个属性组合的概率了吗?

但是,仔细想想就会发现,其实能够让两个观察者对不兼容属性对观测的时候有一个前提,这就是要保证张三看到的萤火虫系统和李四看到的萤火虫系统是同一个系统。但是我们也可以这样说,当两个观察者同时观测一个系统的时候,系统就呈现出了两份拷贝,一份呈现在张三眼里,一份呈现在李四眼里,并且这两份拷贝还呈现高度相关,当第一只萤火虫在上的时候第二只也必然在上。那么实际上这种情况与两个观察者看同一个系统是无法分辨的。因此,我们便可以通过研究两个相互纠缠的系统来研究同时测量两个不相容的属性的时候会发生什么。

实际上,这种将不相容测量对归结为一种更底层的联合概率分布的想法就是量子力学中著名的隐变量理论。而让两个人同时测量一个系统的不兼容属性对,并且可以用两个相互纠缠的系统来隐含实现的想法正是著名的EPR试验的本质。但是,历史的发展告诉我们,不管是隐变量理论还是EPR试验都不能将复数概率行为归结为经典概率行为。

下面我们先引入如何将两个不同的系统复合成一个更大的系统,接下来,我们将介绍纠缠态、贝尔不等式等最能区别复数概率与经典概率不同之处的概念。

复合系统

所谓的复合系统就是指由两个系统组成的新系统。例如,在刚才的萤火虫的例子中,如果我们考察两个盒子中的两只萤火虫,那么这两只萤火虫就构成了一个复合的系统。假如每只萤火虫在各自的盒子中都有|U>,|D>两种状态,那么两只萤火虫的组合就有|UU>, |UD>, |DU>和|DD>这四种状态分别表示两只萤火虫都在上,一只上一只下,一只下一只上和两只都在下这四种不同的事件。所以,我们要指定这两个萤火虫系统的状态,就必须要给定一个四维的空间的向量,分别表示两只萤火虫都在上、一只上一只下,一只下一只上和两只都在下的复数概率。

假如两只萤火虫的状态都是:

[math]\displaystyle{ }[/math][math]\displaystyle{ \psi =\alpha \left| U \right\rangle +\beta \left| D \right\rangle }[/math]

表示萤火虫以(|α|)2的概率处于上,而以(|β|)2的概率处于下方。那么两只处于该状态的萤火虫所构成的复合系统就对应状态:

[math]\displaystyle{ \begin{align} & \psi \otimes \psi =(\alpha \left| U \right\rangle +\beta \left| D \right\rangle )\otimes (\alpha \left| U \right\rangle +\beta \left| D \right\rangle )=\alpha \left| U \right\rangle \otimes (\alpha \left| U \right\rangle +\beta \left| D \right\rangle )+\beta \left| D \right\rangle \otimes (\alpha \left| U \right\rangle +\beta \left| D \right\rangle ) \\ & \quad \quad \quad ={{\alpha }^{2}}\left| U \right\rangle \otimes \left| U \right\rangle +\alpha \beta \left| U \right\rangle \otimes \left| D \right\rangle +\beta \alpha \left| D \right\rangle \otimes \left| U \right\rangle +{{\beta }^{2}}\left| D \right\rangle \otimes \left| D \right\rangle \\ & \quad \quad \quad ={{\alpha }^{2}}\left| UU \right\rangle +\alpha \beta \left| UD \right\rangle +\beta \alpha \left| DU \right\rangle +{{\beta }^{2}}\left| DD \right\rangle \\ \end{align} }[/math] 注意,我们这里定义了一个直积运算[math]\displaystyle{ \otimes }[/math],它的作用就是将两个系统粘合成一个新的复合系统,也就是把两个二维向量粘合成一个新的四维向量。它的运算规则符合分配率,并且该运算作用到复数上就是计算这两个复数的乘积。如果该运算作用到向量上,则表示将这两个向量组合在一起形成新的向量。因此[math]\displaystyle{ \left| U \right\rangle \otimes \left| D \right\rangle =\left| UD \right\rangle }[/math]

新向量是一个四维空间中的向量,这个四维空间的基向量分别是|UU>,|UD>,|DU>,|DD>。我们看到,按照直积运算得到的新向量[math]\displaystyle{ \psi \otimes \psi }[/math]就是两个[math]\displaystyle{ \psi }[/math]向量复合出来的系统状态。它表示以(|α|)4的概率两只萤火虫都在上面,以(|α|)2(|β|)2的概率一只在上一只在下……。我们看到这个计算是符合经典概率运算准则的。在经典概率中,如果一个萤火虫以|α|2的概率在上,|β|2的概率在下,则两只都在上的概率就是(|α|)4,一只上一只下的概率就是(|α|)2(|β|)2

同样的,对于萤火虫在左侧|L>这个事件来说,我们也可以计算两只萤火虫都在左侧的概率。首先,我们需要计算两个|L>向量的直积:

[math]\displaystyle{ \begin{align} & \left| L \right\rangle \otimes \left| L \right\rangle =(\cos \theta \left| U \right\rangle +\sin \theta \left| D \right\rangle )\otimes (\cos \theta \left| U \right\rangle +\sin \theta \left| D \right\rangle ) \\ & ={{\cos }^{2}}\theta \left| UU \right\rangle +\cos \theta \sin \theta \left| UD \right\rangle +\cos \theta \sin \theta \left| DU \right\rangle +{{\sin }^{2}}\theta \left| DD \right\rangle \\ \end{align} }[/math]

它是四维空间中的一个向量。那么对于任何一个系统状态[math]\displaystyle{ \psi \otimes \psi }[/math]来说,它在这个四维向量上的投影向量是:

[math]\displaystyle{ \begin{align} & (\psi \otimes \psi )\cdot (\left| L \right\rangle \otimes \left| L \right\rangle )\left| L \right\rangle \otimes \left| L \right\rangle ={{({{\alpha }^{2}},\alpha \beta ,\beta \alpha ,{{\beta }^{2}})}^{*}}({{\cos }^{2}}\theta ,\cos \theta \sin \theta ,\cos \theta \sin \theta ,{{\sin }^{2}}\theta )\left| L \right\rangle \otimes \left| L \right\rangle \\ & =({{\alpha }^{*2}}{{\cos }^{2}}\theta +2{{\alpha }^{*}}{{\beta }^{*}}\sin \theta \cos \theta +{{\beta }^{*2}}{{\sin }^{2}}\theta )\left| L \right\rangle \otimes \left| L \right\rangle ={{({{\alpha }^{*}}\cos \theta +{{\beta }^{*}}\sin \theta )}^{2}}\left| L \right\rangle \otimes \left| L \right\rangle \\ & ={{({{\alpha }^{*}}\cos \theta +{{\beta }^{*}}\sin \theta )}^{2}}({{\cos }^{2}}\theta \left| UU \right\rangle +\cos \theta \sin \theta \left| UD \right\rangle +\cos \theta \sin \theta \left| DU \right\rangle +{{\sin }^{2}}\theta \left| DD \right\rangle ) \\ \end{align} }[/math](**)

因此两个萤火虫都在左侧这个事件的发生概率就是上述向量的模平方。利用投影矩阵的方法,我们可以同样计算出这个向量,这里不再赘述,请参见附录3。总之,有了直积运算,我们就可以把多个系统粘合成一个大系统了。

纠缠态

下面,我们研究一类特殊的状态,它就是大名鼎鼎的纠缠态(entangled state)。 让我们还是以那只可怜的萤火虫为例来说明。假设我们制备了两个萤火虫系统,只不过这两个系统之间存在着微妙的联系。如下图:

概览变成复数-图4.png

图4 一个处于纠缠态的两个萤火虫系统

显然这是两个萤火虫系统,然而,这两个系统却存在着微妙的联系,也就是左右两只萤火虫会存在着联动。当我们从左面的A孔观察萤火虫的时候,如果左侧那个盒子中的萤火虫在上侧,那么右盒的萤火虫也在上面;反之毅然。那么处于这种纠缠态的萤火虫系统如何用复数概率表示呢?它是一种特殊的状态,可以表示为:

[math]\displaystyle{ \xi =\alpha \left| UU \right\rangle +\beta \left| DD \right\rangle }[/math]

首先,由于纠缠态是两个系统所表现出来的性质,因此我们必须在复合系统中来表示这种状态。其次,我们考察ξ状态的含义,按照复数概率到经典概率的映射,我们知道,系统将会以|α|2的概率处于状态|UU>之中,即两只萤火虫都处于上侧的概率是|α|2。另外,我们知道在复合系统的中,任何一个向量都有4个基,然而上式仅仅出现了两个,这说明|UD>和|DU>两个状态对应的复数概率都为0。也就是说系统不可能出现一只在上一只在下的状态。

我们知道,对于任何两个萤火虫系统组成的复合系统的状态都可以写成:

[math]\displaystyle{ ({{\alpha }_{1}}\left| U \right\rangle +{{\beta }_{1}}\left| D \right\rangle )\otimes ({{\alpha }_{2}}\left| U \right\rangle +{{\beta }_{2}}\left| D \right\rangle )={{\alpha }_{1}}{{\alpha }_{2}}\left| UU \right\rangle +{{\alpha }_{1}}{{\beta }_{2}}\left| UD \right\rangle +{{\alpha }_{2}}{{\beta }_{1}}\left| DU \right\rangle +{{\beta }_{1}}{{\beta }_{2}}\left| DD \right\rangle }[/math] 那么,假如纠缠态ξ就是两个特殊状态的复合的话,那么就要有:

[math]\displaystyle{ \left\{ \begin{matrix} {{\alpha }_{1}}{{\beta }_{2}}=0 \\ {{\alpha }_{2}}{{\beta }_{1}}=0 \\ {{\alpha }_{1}}{{\alpha }_{2}}=\alpha \\ {{\beta }_{1}}{{\beta }_{2}}=\beta \\ \end{matrix} \right. }[/math]

同时成立。但我们知道这是不可能的,除非所有的系数都等于0。所以,我们知道纠缠态是不能通过将两个单独的状态通过符合得到的。事实上,在量子力学中,人们就将纠缠态定义为不能表示成两个状态的复合的状态

纠缠态被认为是量子系统中的一种与能量、信息同等重要的资源,这正是因为纠缠态的出现,才使得经典概率与复数概率发生了质的不同。下面我们举一个例子来说明。假设两萤火虫系统处于纠缠态:

[math]\displaystyle{ \xi =\frac{1}{\sqrt{2}}\left| UU \right\rangle +\frac{1}{\sqrt{2}}\left| DD \right\rangle }[/math]

即两只萤火虫会以1/2概率同时出现在上侧,并以1/2的概率同时出现在下侧。下面再定义从B孔观察萤火虫得出L,R性质的测量与水平轴成角是60度。这样,根据直积运算,我们可以计算出来左盒的萤火虫处于上(下)侧、右盒的萤火虫处于上(下)侧,左盒的萤火虫处于左(右)侧,右盒的萤火虫处于左(右)侧的概率都是1/2。同时,还可以计算出来左盒的萤火虫处于上侧,而右盒的萤火虫处于左侧的概率是1/8(参见附录4)。

同样的道理,我们按照相似的方法计算出来从A孔观察左侧萤火虫,从B孔观察右侧萤火虫的各种组合的概率如下表:

表1. 复数概率计算得到的伪联合概率分布

U(左盒) D(左盒)
L(右盒) 1/8 3/8
R(右盒) 1/8 3/8

大家注意,这个表得出来的正是对上一节讨论的对同一个系统的两个不兼容属性由两个观察者同时测量的对应物。只不过,在这里我们把同一个系统换成了两个相互纠缠的萤火虫系统了。这样左盒对应的就是左侧观察者看到的系统,右盒就是右侧观察者看到的系统。我们认为,实际上两个观察者无法分辨究竟他们同时测量的萤火虫系统是同一个系统,还是两个不同的系统,但发生着相互纠缠。因此我们便可把对不兼容属性对同时测量的问题归结为对两个相互纠缠系统的测量问题。

表1相当于一个联合概率分布。然而这个联合分布是通过测量左侧萤火虫的A属性,同时测量右侧萤火虫的B属性得到的。根据这个联合分布,我们就能计算出单一属性的边际概率,我们知道萤火虫在左侧的概率就是1/8+3/8=1/2,在右侧的概率也是1/2。而萤火虫在上侧的概率是1/4,在下侧的概率是3/4。然而,之前我们已经计算出了萤火虫单独处于上侧的概率是1/2,而非1/4。出现了矛盾!

这个矛盾说明,我们不能将表1当作一个联合概率分布,也不能从它反过来构造某一个属性的边际概率分布,我们已经看出了复数概率系统与经典概率系统计算的差异。换句话说,一个复数概率系统中的不兼容属性对本质上是不能归结为背后的一种经典的联合概率分布模型的。

贝尔不等式——真正的破坏

然而,最本质地表征量子概率与经典概率的不同之处的还是贝尔不等式。贝尔不等式是科学家约翰.贝尔首先发现的经典概率系统中的一组不等式。然而,当采用复数概率的方法进行同样的计算的时候,这一不等式却被打破了,这说明复数概率法则存在着经典概率无法模仿的一面,从而证明了不存在经典的隐变量理论。进一步,人们实施了各种试验观察到电子的行为的确会破坏贝尔不等式,也就是说电子的行为不能够用隐含的经典概率来解释,而必须采用复数概率。

虽然原始的贝尔不等式非常复杂,但是我们可以简化它。一组最简单的贝尔不等式[1](参见:http://www.mtnmath.com/whatth/node60.html,原始的贝尔不等式讨论的是两个变量之间的相关性质,简化的贝尔不等式则集中到概率的性质,参见:Quantum Probability-Quantum Logic)就是下式:

[math]\displaystyle{ 1\ge P(A)+P(B)-P(A\cap B)\ge 0 }[/math] (***)

有A,B两个事件,那么A事件的概率加上B事件的概率减去A,B两事件同时发生的概率必须在[0,1]之间,我们用集合文式图可以很清楚地表达出来这个不等式的含义:

概览变成复数-图5.png

图5 贝尔不等式的文氏图

如图所示,假设集合的面积对应的就是该事件的概率。全集的面积为1。这样P(A∩B)表示的就是图中方格阴影部分的面积,而P(A)+P(B)-P(A∩B)就是斜影部分的面积。很显然当A和B完全重合的时候这部分面积最小为0。当A和B完全不重合并且A∪B为全集的时候这部分面积为最大为1。所以对于任意给定的两个事件A和B,这两个不等式必然成立。

然而,如果采用从复数概率出发得到的经典概率却有可能打破这两个不等式。让我们还是用萤火虫系统来说明。假设有两个黑箱子,它们分别关了两只萤火虫。并且这两只萤火虫是反关联的。也就是当左侧的萤火虫在上面,右侧的萤火虫就在下面,反之亦然。如下图式:

概览变成复数-图6.png

图6 破坏贝尔不等式的量子纠缠态

这样,我们可以用一个纠缠态来表述这两个萤火虫构成的系统:

[math]\displaystyle{ \xi =\frac{1}{\sqrt{2}}\left| UD \right\rangle -\frac{1}{\sqrt{2}}\left| DU \right\rangle }[/math]

进一步,我们假设观察者在箱子上凿了三个小孔,透过这些孔可以观察到萤火虫是处于孔的左侧还是右侧。假设从其中任意一个孔观察萤火虫得到左或者右分别可以用下列的投影矩阵表示[2]

[math]\displaystyle{ {{M}_{\theta }}(L)=\frac{1}{2}\left( \begin{matrix} 1 & {{e}^{-i\theta }} \\ {{e}^{i\theta }} & 1 \\ \end{matrix} \right),\quad {{M}_{\theta }}(R)=\frac{1}{2}\left( \begin{matrix} 1 & -{{e}^{-i\theta }} \\ -{{e}^{i\theta }} & 1 \\ \end{matrix} \right) }[/math]

其中θ表示从不同的孔观察的参数。我们设这三个不同的孔对应的参数分别为0, Pi/4, Pi/2。下面,我们来考察三个事件:

事件1:从第1个孔看到左盒的萤火虫在左侧,并且从第2个孔看它在右侧;

事件2:从第2个孔看到左盒的萤火虫在左侧,并且从第3个孔看它在右侧;

事件3:从第1个孔看到左盒的萤火虫在左侧,并且从第3个孔看它在右侧。

我们记事件Ai为从第i个孔看萤火虫在左侧,且用Ai上面加一横杠表示从第i个孔看萤火虫在右侧。那么,前面的三个事件就可以写作公式:

事件1:[math]\displaystyle{ {{A}_{1}}\cap \overline{{{A}_{2}}} }[/math],事件2:[math]\displaystyle{ {{A}_{2}}\cap \overline{{{A}_{3}}} }[/math],事件3:[math]\displaystyle{ {{A}_{1}}\cap \overline{{{A}_{3}}} }[/math]

这样事件1和2的交就是事件3,所以应该符合下列概率不等式:

[math]\displaystyle{ 0\le P(1)+P(2)-P(3)\le 1 }[/math]

另一方面,由于我们的设定,我们不能同时从两个孔看同一只萤火虫,但是我们可以利用两只萤火虫互相纠缠的性质,第一个观察者从第一个孔看左侧的萤火虫,第二个观察者在第2个孔看右侧的萤火虫。由于萤火虫反关联的性质,上面的三个事件又等价于:

事件1’:从第1个孔看到左盒的萤火虫在左侧,并且从第2个孔看到右盒的萤火虫在左侧;

事件2’:从第2个孔看到左盒的萤火虫在左侧,并且从第3个孔看右盒的萤火虫在左侧;

事件3’:从第1个孔看到左盒的萤火虫在左侧,并且从第3个孔看右盒的萤火虫在左侧。

因而我们可以定义这三个事件的投影矩阵,从而计算它们的概率,例如事件1’对应的投影矩阵是:

[math]\displaystyle{ {{M}_{0}}(L)\otimes {{M}_{\pi /4}}(L)=\frac{1}{2}\left( \begin{matrix} 1 & {{e}^{-i0}} \\ {{e}^{i0}} & 1 \\ \end{matrix} \right),\otimes \frac{1}{2}\left( \begin{matrix} 1 & {{e}^{-i\pi /4}} \\ {{e}^{i\pi /4}} & 1 \\ \end{matrix} \right),=\frac{1}{4}\left( \begin{matrix} 1 & {{e}^{-i\pi /4}} & 1 & {{e}^{-i\pi /4}} \\ {{e}^{i\pi /4}} & 1 & {{e}^{i\pi /4}} & 1 \\ 1 & {{e}^{-i\pi /4}} & 1 & {{e}^{-i\pi /4}} \\ {{e}^{i\pi /4}} & 1 & {{e}^{i\pi /4}} & {} \\ \end{matrix} \right) }[/math] 将该矩阵乘以纠缠态的状态向量[math]\displaystyle{ (\frac{1}{\sqrt{2}},0,0,\frac{1}{\sqrt{2}}) }[/math],再求所得向量的模平方就得到事件1’的概率是[math]\displaystyle{ {{\sin }^{2}}(\pi /8)/2\approx 0.0732 }[/math]。采用同样的方法可以计算出事件2’的概率是[math]\displaystyle{ {{\sin }^{2}}(\pi /8)/2\approx 0.0732 }[/math],事件3’的概率是[math]\displaystyle{ {{\sin }^{2}}(\pi /4)/2\approx 0.25 }[/math]。这样这三件事的概率就不满足不等式:

[math]\displaystyle{ P(1')+P(2')-P(3')\ge 0 }[/math]

从而破坏了这个最简单版本的贝尔不等式。这个例子说明,采用复数概率运算的纠缠系统是不符合经典概率法则的。

到此为止,我们才算真正领教了复数概率的威力,它在一些实例中能够破坏经典概率必须满足的贝尔不等式,这才是复数概率与经典概率最大的差别所在。我们看到,要想真正地破坏经典概率法则,纠缠态和不兼容的测量对都是必不可少的。在本例中,两个相互纠缠的萤火虫系统构成了测量对,而从三个不同的孔洞对萤火虫进行观察则构成了三个两两不相兼容的测量对,正是在这两个条件都具备的前提下才能真正破坏贝尔不等式。

假如你真的找来一只萤火虫,把它关进黑盒子里,再钻三个孔对它进行左、右的划分。你是否能看到按照复数概率法则运算得到的破坏贝尔不等式的情况呢?答案是否定的,我敢肯定,如果你做这样的试验,你肯定能够得到经典概率的结果。原因在于对于一切实存的系统来说,贝尔不等式(***)都必须成立。而量子则是一类波、粒二象性共存的非实存系统。换句话说,如果你能找到一个破坏该不等式的例子,那么你就找到了一类非实存系统。你可以尝试构造这样的例子,你会发现,要真的打破该不等式是非常困难的。

量子概率体系

前面我们按照一种纯粹启发式的思路,也就是如何将经典的实数概率扩展到复数概率的角度论述了整个一套新的概率体系,在文献中这套新的概率体系就被称为量子概率。这种思路的好处在于能够让读者较快地接触到复数概率这套理论最核心的概念,以及它与经典概率的不同之处。然而,这种方法的弱点在于叙述过于零乱,而且不能保证数学的清晰性。为了弥补这个不足,我们特意从较粗糙的公理化角度浅显地论述整个量子概率公理体系,这套公理化体系主要是由von Neumann在他的名著《Mathematical Foundations of Quantum Mechanics》建立起来的。读者可以参考这篇文章获得更清晰的描述。

基本概念

事件

在经典概率论中,我们用集合表示事件,用集合的交、并、补等运算来组合出更多的事件。同时,我们定义了两个特殊的事件,一个是不可能事件对应集合空集,另外一种事件为必然发生事件,它对应集合全集。

在量子概率中,我们用复线性空间(希尔伯特空间)H作为基本事件的集合。任意一个事件都是该线性空间中的一个子空间(直线、平面或者超平面)。在量子概率中,不可能事件对应着0向量,即0维的线性空间。必然事件则对应着整个线性空间H。

正如经典逻辑可以使用否、与、或等运算组合出各种新的事件一样。在量子概率中,我们也可以定义这三种运算。

定义1(否运算):设事件A对应的子空间为LA,那么~A事件则对应着垂直于LA的子空间记做[math]\displaystyle{ L_{A}^{\bot } }[/math]

例如,事件A对应的子空间LA为三维空间中的一条直线l,那么非A这个事件对应的子空间就是垂直于l的整个平面。

定义2(与运算):设事件A对应的子空间LA,事件B对应的子空间LB,那么事件A且B对应的子空间就是这两个线性子空间的交集,即

[math]\displaystyle{ {{L}_{A\cap B}}={{L}_{A}}\wedge {{L}_{B}} }[/math]

例如LA和LB都是三维空间中的两张平面,那么[math]\displaystyle{ {{L}_{A\cap B}} }[/math]就是这两张平面的交线。如果LA和LB都是三维空间中的直线,则它们的交[math]\displaystyle{ {{L}_{A\cap B}} }[/math]必然是一个点,这个点就是0维线性空间,因此是不可能事件。

定义3(或运算):设事件A对应的子空间LA,事件B对应的子空间LB,那么事件A或B对应的子空间就是由这两个空间所张成的更大空间。即:

[math]\displaystyle{ {{L}_{A\cup B}}=Span({{L}_{A}},{{L}_{B}}) }[/math]

注意,量子概率中的或运算与经典概率中事件的或运算是本质不同的,它不是两个子空间的并集,而是线性扩展Span。例如假如LA和LB分别是两条相交于一点直线,那么[math]\displaystyle{ {{L}_{A\cup B}} }[/math]就是这两条直线所张成的平面。

量子概率的运算性质大多与经典事件的运算性质相同,但有一个本质的区别,这就在于量子概率中的事件运算不一定满足分配率。即:

[math]\displaystyle{ {{L}_{A}}\wedge ({{L}_{B}}\vee {{L}_{C}})\ne ({{L}_{A}}\wedge {{L}_{B}})\vee ({{L}_{A}}\wedge {{L}_{C}}) }[/math]

但我们知道集合的运算是满足这个性质的。那么量子事件的运算是如何打破分配率的呢?让我们来看一个例子,如图:

概览变成复数-图7.png

图7 破坏分配律法则的量子事件运算

如图中所示的空间中有三条同在一个平面内的直线LA,LB,LC分别对应事件A,B,C,则LB∨LC就是整个平面,而[math]\displaystyle{ {{L}_{A}}\wedge ({{L}_{B}}\vee {{L}_{C}}) }[/math]就是LA这根直线。但反过来,由于[math]\displaystyle{ {{L}_{A}}\wedge {{L}_{B}} }[/math][math]\displaystyle{ {{L}_{A}}\wedge {{L}_{C}} }[/math]都是点,所以[math]\displaystyle{ ({{L}_{A}}\wedge {{L}_{B}})\vee ({{L}_{A}}\wedge {{L}_{C}}) }[/math]还是点,即不可能事件。所以量子事件不一定满足分配律。

互斥事件

一枚硬币要么朝上,要么朝下,不可能同时发生,每抛掷一次必然有一个发生,那么这两个事件构成了互斥事件。从数学上我们可以表达成:

定义4(互斥事件)给定一组事件A1,A2,…,An,它们分别对应子空间L1,L2,…,Ln,则这些子空间满足:

[math]\displaystyle{ {{L}_{i}}\wedge {{L}_{j}}=O,and\quad {{L}_{i}}\bot {{L}_{j}},\ for\ \forall i,j }[/math]

并且:

[math]\displaystyle{ Span({{L}_{1}},L{}_{2},\cdots {{L}_{n}})=H }[/math]

我们称这组事件互斥。

一组互斥事件往往对应同一个属性取不同的属性值。例如硬币只有正反两个可能取值。有趣的是,在经典概率中,我们通常可以用一条线上的不同点对应不同取值,例如一个人的身高有多种可能取值,这样所有的身高可以表示为一条直线。但是,在量子概率中,每一个属性值都对应着一条直线,这样n组属性值就对应着n条直线,并且这些属性值都是两两互斥的,也就是说这些直线两两垂直,而且所有这些可能的直线张成了一个n维希尔伯特空间。如下图,经典事件和量子事件表示的区别:

概览变成复数-图8.png

图8 经典概率与量子概率在互斥事件上表示的不同

概率与测量

在量子概率理论中,我们可以采用三个步骤来计算任意一个事件的概率。首先,我们要确定一个状态来表示系统所处的环境和条件。我们用|z>来表示该状态,它是希尔伯特空间H中的一个向量,并且这个向量的长度必须是1。即:

[math]\displaystyle{ \lt z|z\gt =1 }[/math]

这里,<z|表示向量|z>的共轭,而<z|z>则表示向量<z|和|z>的内积。例如如果|z>=(1+i,2-i),则<z|=(1-i,2+i),那么<z|z>=(1+i)(1-i)+(2-i)(2+i)=2+5=7。这是量子力学中的狄拉克符号记法。

其次,我们需要定义投影算子的概念。

定义5:(投影算子)每个事件A都对应了一个投影算子PA,我们可以把状态向量|z>通过PA的作用投射到事件A对应的子空间LA上,因此,利用数学语言,投影算子可以表达为:

[math]\displaystyle{ {{P}_{A}}:H\to {{L}_{A}} }[/math]

在几何上,投影算子就是求向量|z>到子空间LA上的投影向量,因此,这个投影就构成了一个向量:

[math]\displaystyle{ {{P}_{A}}\left| z \right\rangle }[/math]

这个概念可以用下列图形清晰地表达:

概览变成复数-图9.png

图9. 向量的投影

在图中,原向量为|z>,投影空间LA为一个平面,则|z>在其上的投影为红色向量。

如果我们给H选定了一组基向量,并且|z>也用基向量表示,那么投影算子PA就对应了一个矩阵称之为投影矩阵(参见附录2),这个矩阵满足性质:

[math]\displaystyle{ {{P}_{A}}{{P}_{A}}={{P}_{A}} }[/math]

从几何意义上很容易理解这个性质:任何一个向量往事件A对应的线性子空间上投影之后得到的向量再往A上投影则必然保持不变。

最后,我们计算该投影向量(红色向量)的模平方即为事件A的发生概率:

[math]\displaystyle{ \Pr (A)=|{{P}_{A}}\left| z \right\rangle {{|}^{2}}=\left\langle z \right|{{P}_{A}}\left| z \right\rangle }[/math]

这里介绍的计算事件概率的算法与前面讲到的复数概率到经典概率的映射相同。在量子概率中,测量是一个十分重要的过程,它不仅仅决定了一个事件发生的概率,而且也改变了系统的状态。也就是说,如果我们测量过状态是z的量子系统,并且得到事件A发生的结果,那么该量子系统的状态将变成:

[math]\displaystyle{ z'=\frac{{{P}_{A}}z}{|{{P}_{A}}z|} }[/math]

也就是说,我们将用A事件的概率|PAz|去重新归一化向量PAz,这样测量之后的状态z’又是一个长度为1的单位向量了。假如我们对状态z’再进行一次完全相同的测量,就会得到:

[math]\displaystyle{ \Pr (A)=|{{P}_{A}}z'{{|}^{2}}=|{{P}_{A}}\frac{{{P}_{A}}z}{|{{P}_{A}}z|}{{|}^{2}}=\frac{|{{P}_{A}}{{P}_{A}}z{{|}^{2}}}{|{{P}_{A}}z{{|}^{2}}}=\frac{|{{P}_{A}}z{{|}^{2}}}{|{{P}_{A}}z{{|}^{2}}}=1 }[/math]

所以,一旦测量PA得到A发生的概率之后,系统将会一直呈现出A事件保持不变。有趣的是,在量子概率中,我们将测量与投影算子密切地联系起来。一次测量,就是将某一个投影算子作用到一个状态向量上,测量的结果是让观察者得到一个确定的事件,同时也会让被测向量完成一次投影,形成一个新的向量。

我们可以将量子概率的运算法则应用到一组互斥事件上,这就相当于将一个高维空间中的向量|z>分别向一组相互垂直的直线投影,这样,可以验证量子概率满足测度的性质,即如果C=A∨B,并且A∧B=O,那么Pr(C)=Pr(A)+Pr(B)。

不相容属性对

我们说过,量子概率与经典概率最大的不同就是存在着相互不相容的属性对,也就是不能同时进行测量的两个属性。下面,我们给出不相容属性对的定义:

定义6:(不相容属性对)假设属性M有m个不同的属性值{M1,M2,…,Mm},这些属性值张成了m维线性空间H,并且每两个属性对所对应的子空间彼此垂直。 另有一个属性N,它也有m个属性值{N1,N2,…,Nm},这些属性值对应的子空间也张成一个m维的线性空间H',如果H=H’,则称M和N这两个属性不相容。

我们仍然从图形的角度来理解这个概念,假设m=2,这样M这个属性的两个属性值就张成了一个平面H。那么N这个属性的两个属性值张成的二维空间H’也是H,这就意味着,N对应的是H中的另外一个坐标系。如图10所示,黑色的坐标系就表示M属性,蓝色的坐标系表示N属性。

概览变成复数-图10.png

图10 不兼容属性对的测量

下面我们考虑两组不同的测量,第一组是先测量事件M1是否发生,再测量事件N1是否发生,第二组测量是先测量N1,再测量M1。按照前面定义的测量规则,第一组测量相当于把向量|z>先投影到M1直线上,然后将M1上的单位向量投影到x’上。这两种结果最终得到的系统状态是完全不同的,第一组测量最终得到的是|N1>上的单位向量,而第二组测量将得到|M1>上的单位向量。这不同的测量顺序导致不同的结果也会体现在投影算符上,即存在不等式:

[math]\displaystyle{ {{P}_{Ni}}{{P}_{Mj}}\ne {{P}_{Mj}}{{P}_{Ni}} }[/math]

我们看到,不同的测量顺序会导致不同的测量结果,这正是量子概率不兼容属性的一种特别的性质之一。

相容属性对

如果两个属性M和N可以被同时测量,则它们就构成了相容的属性对。在数学上,相容的属性对可以用复合系统来表示。

定义7(相容属性对):假设属性M有m个不同的属性值{M1,M2,…,Mm},另有一个属性N,它有n个属性值{N1,N2,…,Nn},那么如果这两组属性值可以张成m*n维空间H,并且每两个属性对的复合,即:

[math]\displaystyle{ {{M}_{i}}\otimes {{N}_{j}} }[/math], for any i,j

都构成了m*n维空间H中的一组基,那么这两个属性值就是相互兼容的。

所以,这m*n维的希尔伯特空间就可以写成:

[math]\displaystyle{ H=Span(...,{{M}_{i}}\otimes {{N}_{j}},...),\forall i\lt m,j\lt n }[/math]

下面,我们来研究一下相容属性对的测量。假设我有两个相容属性对,每个属性都具有2个可能的属性值(我们都用01来表示)。这样,全空间H就可以写成这两个属性对每两个属性值的组合张成的空间。

[math]\displaystyle{ H=Span(\left| 00 \right\rangle ,\left| 01 \right\rangle ,\left| 10 \right\rangle ,\left| 11 \right\rangle ) }[/math]

在这些基中,写在左侧的表示第一个属性值。下面我们对第一个属性值=0进行测量,而当第一个属性=0,第二个属性还有0和1两种可能,因此剩下的属性就张成了一个二维的线性空间,并且|00>和|01>构成了这个二维子空间的基向量。所以,对第一个属性值测量就相当于把一个四维空间中的向量投影到一个二维的平面上。

相容属性对的测量是不区分顺序的。比如我们先对第一个属性值=0进行测量,这样就把4维投影到|00>和|01>构成的二维平面上,然后再对第二个属性值是否为0进行测量,这样就把响量投影到|00>这个向量上面。反过来,如果先对第二个属性值是否为0进行测量,就把4维向量投影到|00>,|10>这个平面上,然后再对第一个属性值是否为0进行测量,就把向量又投影到|00>直线上,所以,这两种不同顺序的测量是完全相同的。也就是说兼容的属性对是不区分顺序的。

实际上,假如我们用n个不兼容属性对构成了一个庞大的系统,那么对这些属性的测量就是一个降维的过程,我们会把一个2n维中的向量逐渐压缩到一条直线上。然而,对不兼容属性的测量则不会产生降维的现象。如图10所示,我们将一条二维空间中的直线投影到不兼容属性值的某一条直线上,则这个向量仍然在二维空间中,并且这个投影还可以再次投影到这个空间中的另外一个不兼容属性上。

与经典概率的区别

我们看到,量子概率无非提供了另外一套不同于经典概率的概率运算法则。那么究竟量子概率与经典概率有什么区别和联系呢?

首先,针对一个属性的测量来说,量子概率和经典概率会得到完全相同的结果。进一步,对于兼容的属性对来说,量子概率与经典概率仍然没有区别。换句话说,量子概率中的兼容属性运算已经能够涵盖所有经典概率论的内容。

但是,针对不兼容属性对来说,很多经典概率的运算法则都不再成立。同时量子概率还预言了一些新的性质是经典概率中没有的。我们列出下表来表示这些区别和联系。

性质 经典概率运算 不兼容属性的事件A和B的量子概率运算
联合概率:Pr(A∧B) Pr(A∧B)=Pr(B∧A) 无定义
B) B)=Pr(A∧B)/P(B) [math]\displaystyle{ \frac{|{{P}_{A}}{{P}_{B}}\left| z \right\rangle {{|}^{2}}}{|{{P}_{B}}\left| z \right\rangle {{|}^{2}}} }[/math]
A) A)=Pr(A∧B)/P(A) [math]\displaystyle{ \frac{|{{P}_{B}}{{P}_{A}}\left| z \right\rangle {{|}^{2}}}{|{{P}_{A}}\left| z \right\rangle {{|}^{2}}} }[/math]
全概率公式 [math]\displaystyle{ \Pr (A)=\sum\limits_{i}^{{}}{\Pr (A|{{B}_{i}})\Pr ({{B}_{i}})} }[/math] 不成立

条件概率的互易性:

Pr(A|B)=Pr(B|A)

不满足 满足

双向随机性

[math]\displaystyle{ \sum\limits_{i}{\Pr ({{A}_{i}}|{{B}_{j}})}=\sum\limits_{j}{\Pr ({{A}_{i}}|{{B}_{j}})}=1 }[/math]

不满足 满足

既然经典概率系统的性质都可以在量子概率的兼容属性测量中找到对应,但是反过来,量子概率中的不兼容属性对具备的性质则具有特殊性,所以可以说量子概率是比经典概率蕴含了更多东西的概率运算系统。

应用与展望

量子认知

我们知道,量子概率中一个重要的性质就是测量在整个运算过程中的应用。测量是将量子的虚幻世界转变为现实世界的一条重要途径。深刻理解这个测量过程会发现,它与我们人类的自由意志存在着某种深刻的联系(参见:Stapp H.P. Mindful Universe: Quantum Mechanics and the Participating Observer. Springer, 2007).。因为,人类的意识本身就是在将各种不同的可能性转变成现实。这就使得很多大科学家和哲学家认为量子概率不仅能够描述微观粒子世界,也能够描述人类的意识、认知行为(例如彭罗斯所著的《皇帝新脑》)。虽然早期的应用充满了各种哲学思辨,但是最近,人们已经将量子概率应用到认知行为的解释方面做出了一些工作。

比如,J. R. Busemeyer 和Z. Wang就发现人类的决策就是一种类量子行为(请参看这个PPT),即可以用量子概率描述的宏观系统。他们设计了一组人类行为学试验,让人类被试作出决策。

首先,他们让每个人类被试观察下列一组头像图片:

概览变成复数-图11.png

图11 Busemeyer和Wang的试验

然后让被试在两组不同的实验条件下完成判断:是否会把这个人当做自己的朋友。在第一组实验中,试验者要求被试直接作出判断,会不会把这张脸当作自己的朋友。第二组试验则要求被试先把所有的脸归为两类:好人或者坏人,然后再根据这个归类的结果判断是否把这人当作自己的朋友。

下面我们考虑用量子概率的方法来对人类的决策行为进行建模。首先,我们利用是否是朋友这个属性作为基向量建立一个二维的线性空间,如下图:

概览变成复数-图12.png

图12 人类行为试验的量子概率表示

其次,我们假设被试初始的状态可以用向量|z>来表示。那么判断这张脸是属于好人还是坏人则是一个与是否为朋友这个属性的不兼容的属性,用蓝色的坐标系表示。

第一组试验要求被试直接做出朋友或者不是朋友的选择,而不管被试是把这张脸分类成好人还是坏人。这就相当于直接把向量|z>往|F>上进行投影,假设这个投影的长度也就是判断这张脸是朋友的概率为P(F)。

在第二组情况下,试验员相当于进行了两次连续的测量,首先让被试做出分类为好人还是坏人的测量,之后再作出是否把此人当作朋友的测量。这就相当于将向量|z>先投影到|G>或者|B>上,然后再将它投影到|F>上面,我们设在这种情况下测得的朋友概率是P’(F)。根据投影测量的性质,我们知道,P(F)是不等于P’(F)的,并且究竟哪一个概率大,需要由|z>以及两个坐标轴夹角决定。

假如人类的决策是按照经典概率运算的法则,那么P(F)就应该等于P’(F)。但是J. R. Busemeyer 和Z. Wang却发现试验结果是P(F)>P’(F)。因此,人类决策行为的这种对测量的敏感性可以很好的用量子概率来解释。(参考此文)。

我们知道,行为学家们告诉我们,人类的决策行为有很多反常规的特性,这些特性被称为人类决策的悖论(参见著名经济学家Kanneman的相关研究工作)。近年来,有些人将量子概率用于解释这些决策悖论取得了较好的效果。

然而,笔者认为,要验证人类认知、决策行为是否符合量子概率法则的一个重要因素就是考察贝尔不等式(***)是否能够被打破。如果我们在人类决策的例子中的确找到了打破贝尔不等式的例子,那么就有十分充足的理由说人类的决策行为不可以用经典概率描述。这里的困难之处在于,我们如何去构造类似纠缠态这样的人类行为状态呢?这里还有很长的路要走,我们将另写文章评述。

展望

当我们领教了复数概率以及量子概率体系的威力之后,冷静地思考,其实最核心的内容就在于不兼容属性对。我们能否将量子概率应用宏观体系中的关键就在于是否能够在宏观世界中找到不兼容的属性对。

然而,一旦我们试图去寻找,就会发现这实际上非常困难。有什么系统的性质会展现出类似电子那样速度和位置的不能同时被测准的性质呢?

也许在寻找这种不兼容属性对之前,应该深入理解不确定原理的含义。我们说A和B这两个属性是不兼容的,实际上是说A这个属性上各种值的概率分布与B属性的概率分布存在着紧密的联系。注意这种联系并不是说A和B两个属性的直接联系,而是说它们概率分布的间接联系。也就是说,如果我们说A表示人的身高,并且B表示此人的腿长,那么A和B通常会是正比关系,这两个属性就不是不兼容属性。用数学语言来说,不兼容属性对描述的是p(B)=f(p(A))这种关系,而非B=f(A)的关系,也就是一种对两个属性概率分布关系的间接描述。

更进一步,这种间接联系描述的是一种不确定性的制衡。按照不确定原理(Uncertainty Principle),我们对A属性知道的越多,对B属性知道得越少。这种知道的多和少既可以用误差ΔA来表示,也可以用熵S(p(A))来表示。所以,也有人证明了不兼容属性对之间也存在用熵来表达的不确定原理,形如:S(A)+S(B)>const(请参见:http://arxiv.org/abs/1001.4668)。

对概率的理解可以用客观频率法和主观概率法两种手段。如果从客观频率法的角度来理解不兼容属性对的确非常困难,那么我们不妨从主观概率的角度来理解。按照主观学派,我们对某事件的发生概率的解释不是该事件的频率,而是主观认为的对该事件发生的信念程度。按照这种理解,不确定原理在说什么呢?它其实在说,我们对两个属性A和B的认识存在着局限性,如果我们对A取某个特定值的信念程度越高,我们对B取值的看法就会变得非常模糊不清。

从这个角度看,不确定原理就会变得非常容易理解。由于我们人类的观察、信息处理能力非常有限,所以,在某一个特定时刻,我们掌握了A属性的性质,也就必然会伴随着对B属性的不掌握。例如,我们看到了月球的正面,就必然看不到月球的反面。因此,正反面就构成了一对不兼容的属性,它们会呈现出不确定的关系。

也许你会争论说,不对,虽然我不能同时看到正反两面,但是当我看正面的时候,反面也必然同时在那里啊,因为它是一个客观存在的事物啊!问题就出在这里,的确,如果坚持事物的客观实在性,我们便发现不兼容属性对似乎只能在量子那里找到答案。

但如果我们反过来看,认为世界的本原就不是唯物的,当我们看不到月亮背面的时候它就什么都不是,那么我们就会发现,几乎任何两个我们不能同时观察的属性或者事物都会呈现出不兼容的性质。

正如文章《系统中的观察者》提到的,笔者正在试图将观察者作为第一性的事物出发,重新构筑公理体系。在物质世界中,量子系统中的不确定原理和不兼容属性对是隶属于物质世界的一种蹩脚的性质,但也许它恰恰构成了精神世界中,万事万物的起点:观察者的一种第一原理(First principle)。换句话说,本来所有的属性都是不兼容的,都会呈现出测不准性质,而所谓的兼容恰恰是一种特例。其原因是,人类观察的性质就是在任意一个时间点,只能处理有限的信息。所以,在任意一个时刻,只可能有一个我存在,在每个时刻,我只能打下一个汉字,你也只能阅读一个单词,在任何一场球赛中只能有一个冠军。因此不确定关系:S(A)+S(B)>const就是一个必然的要求。

另外,在观察者体系中一个十分重要的问题就是如何从多个不同的观察者眼中看到一个完全相同的客观世界。在《系统中的观察者》一文中,我们把这个问题归结为一个通讯问题,也就是说只要多个观察者可以找到一种公共媒介,那么从他们的沟通之中就能构造出来一个共同的“客观世界”出来。

也许你已经看到了,其实这个问题和我们前面讲到的纠缠态存在着深刻的联系。纠缠态解决的恰恰就是不同的观察者对两个处于相互纠缠的系统进行观察并保持通信的能力。换句话说,如果我们能够真正构造出两个相互纠缠的虚拟世界呈现给不同的观察者,那么他们将会“误认为”他们看到的是一个客观世界!如果相互纠缠系统牵扯的属性全部是兼容的属性对,那么这种“客观世界”的伪装会不成问题。但是,一旦把不兼容属性对融入其中,就会发现致命的漏洞:对贝尔不等式的破坏!所以纠缠和不兼容属性对放在一起才是量子概率体系中最宝贵的资源。

冯诺依曼曾说,概率论中存在着一个漏洞(loophole),生命正是利用了这个漏洞而完成了自我复制。现在,我非常怀疑这个漏洞跟贝尔不等式有着深刻的联系。

附录1 用复数概率计算数学期望

在经典概率中,一种非常重要的运算操作就是求某一个函数的数学期望,假设X是一个随机变量,它的分布由F(X)刻画,f(x)是任意一个函数,那么随机变量f(X)的数学期望是:

[math]\displaystyle{ E(f(X))=\sum\limits_{i=1}^{i=n}{f({{x}_{i}})p({{x}_{i}})}=U(X)\cdot F(X) }[/math]

其中后一个表达式采用向量内积的方式书写,U(X)=(f(x1),f(x2),…f(xn))。同样的道理,我们也可以为复数概率定义数学期望。假设一个随机变量X,它可以用复数概率向量Ψ(X)来描述,f(x)是任意一个函数,那么f(X)的数学期望就是:

[math]\displaystyle{ E(f(X))=\sum\limits_{i=1}^{i=n}{f({{x}_{i}})|\psi ({{x}_{i}}){{|}^{2}}} }[/math]

当然,我们也可以把它写成两个向量内积的形式:

[math]\displaystyle{ E(f(X))=U(X)\cdot (|{{\psi }_{1}}{{|}^{2}},|{{\psi }_{2}}{{|}^{2}},\cdots ,|{{\psi }_{n}}{{|}^{2}}) }[/math]

然而,我们知道

[math]\displaystyle{ |{{\psi }_{i}}{{|}^{2}}={{\psi }_{i}}{{\psi }_{i}}^{*} }[/math]

所以数学期望的后半部分又可写作一对共轭复数向量内积的形式。

[math]\displaystyle{ E(f(X))=U(X)\cdot (\Psi (X)\cdot \Psi *(X)) }[/math]

这让我们联想到了线性代数中的二次型,也就是说,我们完全可以把上式改写成:

[math]\displaystyle{ E(f(X))=\Psi \cdot A\cdot {{\Psi }^{*T}} }[/math]

其中

[math]\displaystyle{ {{\Psi }^{*T}}={{({{\psi }_{1}}*,{{\psi }_{2}}*,\cdots ,{{\psi }_{n}}*)}^{T}}=\left( \begin{matrix} {{\psi }_{1}}* \\ {{\psi }_{2}}* \\ \vdots \\ {{\psi }_{n}}* \\ \end{matrix} \right) }[/math]

即原始向量Ψ的转置共轭矩阵。

[math]\displaystyle{ A=\left( \begin{matrix} f({{x}_{1}}) & 0 & \cdots & 0 \\ 0 & f({{x}_{2}}) & 0 & 0 \\ \vdots & 0 & \ddots & \vdots \\ 0 & 0 & \cdots & f({{x}_{n}}) \\ \end{matrix} \right) }[/math]

即A是一个对角阵,对角线元素分别为f(x1),f(x2),…,f(xn),可以验证采用矩阵和向量相乘的方法同样可以计算出随机变量f(X)的平均值。

附录2 投影矩阵

仍然以图2为例,我们看到,在几何上,发生|L>事件的概率就相当于是原始向量ψA在|L>这个向量上的投影值x’的模的平方|x’|2。对于任何一个基向量|V>:

[math]\displaystyle{ \left| V \right\rangle =a\left| U \right\rangle +b\left| D \right\rangle }[/math]

我们都可以构造出一个称之为投影矩阵的矩阵:

[math]\displaystyle{ \left| V \right\rangle \left\langle V \right|=\left( \begin{matrix} {{a}^{*}}a & a{{b}^{*}} \\ {{a}^{*}}b & {{b}^{*}}b \\ \end{matrix} \right) }[/math]

其中|V><V|是量子力学中的记法,表示从向量|V>构造的投影矩阵。这样该矩阵与原始向量的乘积就是原向量在|V>上面的投影向量:

[math]\displaystyle{ M=\left| V \right\rangle \left\langle V \right|\cdot {{\psi }_{A}}=\left( \begin{matrix} {{a}^{*}}a & a{{b}^{*}} \\ {{a}^{*}}b & {{b}^{*}}b \\ \end{matrix} \right)\cdot \left( \begin{matrix} x \\ y \\ \end{matrix} \right)=\left( \begin{matrix} {{a}^{*}}ax+a{{b}^{*}}y \\ {{a}^{*}}bx+{{b}^{*}}by \\ \end{matrix} \right) }[/math]

[math]\displaystyle{ }[/math]该向量的模平方就是发生|V>事件的概率。大家可以将a=Cosθ,b=Sinθ代入进行验证。因此,我们看到,只要我们知道了投影矩阵,我们便能计算投影矩阵对应的事件的概率。因此,在复数概率中,我们可以用投影矩阵来表示某一个确定的事件。

附录3 投影矩阵的复合

我们知道,每一个事件都对应了一个投影矩阵,那么|L>这个事件的投影矩阵(在|U>,|D>坐标下)是:

[math]\displaystyle{ \left| L \right\rangle \left\langle L \right|=\left( \begin{matrix} {{\cos }^{2}}\theta & \sin \theta \cos \theta \\ \sin \theta \cos \theta & {{\sin }^{2}}\theta \\ \end{matrix} \right) }[/math]

那么两只萤火虫都在左侧这个事件的投影矩阵(在四维的基向量组|UU>,|UD>,|DU>,|DD>下表示)就是:

[math]\displaystyle{ \begin{align} & \left| L \right\rangle \left\langle L \right|\otimes \left| L \right\rangle \left\langle L \right|=\left( \begin{matrix} {{\cos }^{2}}\theta \left| L \right\rangle \left\langle L \right| & \sin \theta \cos \theta \left| L \right\rangle \left\langle L \right| \\ \sin \theta \cos \theta \left| L \right\rangle \left\langle L \right| & {{\sin }^{2}}\theta \left| L \right\rangle \left\langle L \right| \\ \end{matrix} \right) \\ & =\left( \begin{matrix} {{\cos }^{2}}\theta \left( \begin{matrix} {{\cos }^{2}}\theta & \sin \theta \cos \theta \\ \sin \theta \cos \theta & {{\sin }^{2}}\theta \\ \end{matrix} \right) & \sin \theta \cos \theta \left( \begin{matrix} {{\cos }^{2}}\theta & \sin \theta \cos \theta \\ \sin \theta \cos \theta & {{\sin }^{2}}\theta \\ \end{matrix} \right) \\ \sin \theta \cos \theta \left( \begin{matrix} {{\cos }^{2}}\theta & \sin \theta \cos \theta \\ \sin \theta \cos \theta & {{\sin }^{2}}\theta \\ \end{matrix} \right) & {{\sin }^{2}}\theta \left( \begin{matrix} {{\cos }^{2}}\theta & \sin \theta \cos \theta \\ \sin \theta \cos \theta & {{\sin }^{2}}\theta \\ \end{matrix} \right) \\ \end{matrix} \right) \\ & =\left( \begin{matrix} {{\cos }^{4}}\theta & \sin \theta {{\cos }^{3}}\theta & \sin \theta {{\cos }^{3}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta \\ \sin \theta {{\cos }^{3}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{3}}\theta \cos \theta \\ \sin \theta {{\cos }^{3}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{3}}\theta \cos \theta \\ {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{3}}\theta \cos \theta & {{\sin }^{3}}\theta \cos \theta & {{\sin }^{4}}\theta \\ \end{matrix} \right) \\ \end{align} }[/math]

运算法则是先将右侧的矩阵分块放到左侧矩阵中的每一个元素上,然后再用左侧矩阵的每一个元素相乘,最后合并成一个4*4的矩阵。那么状态[math]\displaystyle{ \psi \otimes \psi }[/math]在这个新矩阵上的投影就是:

[math]\displaystyle{ \begin{align} & \left| L \right\rangle \left\langle L \right|\otimes \left| L \right\rangle \left\langle L \right|\cdot (\psi \otimes \psi )=\left( \begin{matrix} {{\cos }^{4}}\theta & \sin \theta {{\cos }^{3}}\theta & \sin \theta {{\cos }^{3}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta \\ \sin \theta {{\cos }^{3}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{3}}\theta \cos \theta \\ \sin \theta {{\cos }^{3}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{3}}\theta \cos \theta \\ {{\sin }^{2}}\theta {{\cos }^{2}}\theta & {{\sin }^{3}}\theta \cos \theta & {{\sin }^{3}}\theta \cos \theta & {{\sin }^{4}}\theta \\ \end{matrix} \right)\left( \begin{matrix} {{\alpha }^{2}} \\ \alpha \beta \\ \alpha \beta \\ {{\beta }^{2}} \\ \end{matrix} \right) \\ & =\left( \begin{matrix} {{\alpha }^{2}}{{\cos }^{4}}\theta +2\alpha \beta \sin \theta {{\cos }^{3}}\theta +{{\beta }^{2}}{{\sin }^{2}}\theta {{\cos }^{2}}\theta \\ {{\alpha }^{2}}\sin \theta {{\cos }^{3}}\theta +2\alpha \beta {{\sin }^{2}}\theta {{\cos }^{2}}\theta +{{\beta }^{2}}{{\sin }^{3}}\theta \cos \theta \\ {{\alpha }^{2}}\sin \theta {{\cos }^{3}}\theta +2\alpha \beta {{\sin }^{2}}\theta {{\cos }^{2}}\theta +{{\beta }^{2}}{{\sin }^{3}}\theta \cos \theta \\ {{\alpha }^{2}}{{\sin }^{2}}\theta {{\cos }^{2}}\theta +2\alpha \beta {{\sin }^{3}}\theta \cos \theta +{{\beta }^{2}}{{\sin }^{4}}\theta \\ \end{matrix} \right)=\left( \begin{matrix} {{\cos }^{2}}\theta {{(\alpha \cos \theta +\beta \sin \theta )}^{2}} \\ \sin \theta \cos \theta {{(\alpha \cos \theta +\beta \sin \theta )}^{2}} \\ \sin \theta \cos \theta {{(\alpha \cos \theta +\beta \sin \theta )}^{2}} \\ {{\sin }^{2}}\theta {{(\alpha \cos \theta +\beta \sin \theta )}^{2}} \\ \end{matrix} \right) \\ \end{align} }[/math] 因此,这个向量的模平方就是发生LL事件的概率。我们看到这个计算结果与**的计算结果是一致的。所以采用矩阵的方法完全可以完成同样的运算。当我们将两个系统做成复合系统的时候,所有的状态向量、矩阵也都可以进行同样的扩充。

附录4 利用投影矩阵计算两盒子中萤火虫处于各种状态的概率

萤火虫处于左侧这个事件对应的投影矩阵(参见附录2)就是:

[math]\displaystyle{ \left| L \right\rangle \left\langle L \right|=\left( \begin{matrix} {{\cos }^{2}}\pi /3 & \sin \pi /3\cos \pi /3 \\ \sin \pi /3\cos \pi /3 & {{\sin }^{2}}\pi /3 \\ \end{matrix} \right)=\left( \begin{matrix} 1/4 & \sqrt{3}/4 \\ \sqrt{3}/4 & 3/4 \\ \end{matrix} \right) }[/math]

当两个系统复合成一个更大的系统之后,我们可以在复合系统中执行下面的测量,仅观察左侧系统中的萤火虫处于左还是右,而无论右侧萤火虫的状态如何,这相当于执行如下投影矩阵所表示的测量:

[math]\displaystyle{ \left| L \right\rangle \left\langle L \right|\otimes I=\left( \begin{matrix} 1/4 & \sqrt{3}/4 \\ \sqrt{3}/4 & 3/4 \\ \end{matrix} \right)\otimes \left( \begin{matrix} 1 & 0 \\ 0 & 1 \\ \end{matrix} \right)=\left( \begin{matrix} 1/4 & 0 & \sqrt{3}/4 & 0 \\ 0 & 1/4 & 0 & \sqrt{3}/4 \\ \sqrt{3}/4 & 0 & 3/4 & 0 \\ 0 & \sqrt{3}/4 & 0 & 3/4 \\ \end{matrix} \right) }[/math]

通过把这个矩阵和纠缠态向量[math]\displaystyle{ \xi =\frac{1}{\sqrt{2}}\left| UU \right\rangle +\frac{1}{\sqrt{2}}\left| DD \right\rangle }[/math]相乘,再计算模的平方能计算出测量得到左侧萤火虫处于左室的概率是1/2。

类似地,我们还可以计算出左盒的萤火虫处于上(下)侧、右盒的萤火虫处于上(下)侧,左盒的萤火虫处于左(右)侧,右盒的萤火虫处于左(右)侧的概率都是1/2。

下面,我们计算观察到左盒的萤火虫在上侧,同时右盒的萤火虫在左侧舱室中的概率。这相当于求状态向量在下列投影矩阵上的投影长度:

[math]\displaystyle{ (\left| U \right\rangle \left\langle U \right|)\otimes (\left| L \right\rangle \left\langle L \right|=\left( \begin{matrix} 1 & 0 \\ 0 & 0 \\ \end{matrix} \right)\otimes \left( \begin{matrix} 1/4 & \sqrt{3}/4 \\ \sqrt{3}/4 & 3/4 \\ \end{matrix} \right)=\left( \begin{matrix} 1/4 & \sqrt{3}/4 & 0 & 0 \\ \sqrt{3}/4 & 3/4 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ \end{matrix} \right) }[/math]

从而得到投影的模平方即经典概率是1/8。也就是说左盒的萤火虫在上,同时右盒的萤火虫在左的概率就是1/8。

  1. 严格来说,该不等式不能叫贝尔不等式,它是贝尔不等式的极其简化的版本。但为了叙述方便,我们仍称它叫作贝尔不等式。
  2. 在原例中,是从0,45度,90度这三个不同的角度测量电子的自旋,为了隐去问题的物理含义,我们采用盒子上面开了三个不同的小孔来比喻