1 The principle of superposition
1.5 Mathematical formulation of the principle
叠加态现象意味着我们可以通过把状态相加得到新状态,所以表示状态的数学量肯定是可以相加的,随之我们联想到向量,但是有限维向量对于大多数量子系统都是够的,所以我们考虑一般化为无穷维。我们定义这种向量为 ket,并用 ∣ ⟩ |\ \rangle ∣ ⟩ 表示。ket 可以和复数 进行运算,得到:
c 1 ∣ A ⟩ + c 2 ∣ B ⟩ = ∣ R ⟩ c_1|A\rangle+c_2|B\rangle=|R\rangle c 1 ∣ A ⟩ + c 2 ∣ B ⟩ = ∣ R ⟩
更一般行的,我们可以考虑积分(注意这里的 x x x 只是任意一个自变量):
∫ ∣ x ⟩ d x = ∣ Q ⟩ \int|x\rangle dx=|Q\rangle ∫ ∣ x ⟩ d x = ∣ Q ⟩
如果一个 ket 可以被其他一些 ket 线性表示,则称这个 ket dependent on them。如果一组 ket 都不能线性表示彼此,则称他们相互 independent。
我们继续定义动力系统的每个状态都对应一个 ket,并进一步假设一个状态和自己叠加仍然是同一个状态 ,也就是:
c 1 ∣ A ⟩ + c 2 ∣ A ⟩ = ( c 1 + c 2 ) ∣ A ⟩ c_1|A\rangle+c_2|A\rangle=(c_1+c_2)|A\rangle c 1 ∣ A ⟩ + c 2 ∣ A ⟩ = ( c 1 + c 2 ) ∣ A ⟩
都是同一个状态。这个假设体现出量子系统和经典系统的差别。因为绝对大小不重要,其实只需要看 c 1 / c 2 c_1/c_2 c 1 / c 2 ,也就对应着 A, B 两个叠加态可以生成 two fold infinity 那么多的状态,和实验相符(这也是为啥系数要用复数)。
1.6 Bra and ket vectors
和 ket 对应,我们定义 bra 为 ⟨ ∣ \langle\ | ⟨ ∣ ,并可以和 ket 做 scalar product:
⟨ B ∣ A ⟩ = ϕ \langle B|A\rangle=\phi ⟨ B ∣ A ⟩ = ϕ
我们还定义 这个 scalar product 是一个 linear function,也就是:
⟨ B ∣ { ∣ A ⟩ + ∣ A ′ ⟩ } = ⟨ B ∣ A ⟩ + ⟨ B ∣ A ′ ⟩ ⟨ B ∣ { c ∣ A ⟩ } = c ⟨ B ∣ A ⟩ \begin{aligned}
\langle B | \{|A\rangle+|A'\rangle\}&=\langle B|A\rangle+\langle B|A'\rangle\\
\langle B | \{c|A\rangle\}&=c\langle B|A\rangle
\end{aligned} ⟨ B ∣ { ∣ A ⟩ + ∣ A ′ ⟩ } ⟨ B ∣ { c ∣ A ⟩ } = ⟨ B ∣ A ⟩ + ⟨ B ∣ A ′ ⟩ = c ⟨ B ∣ A ⟩
当一个 bra 和任何 ket 的 scalar product 结果都被定义时,bra 被完全确定。我们还定义 :
{ ⟨ B ∣ + ⟨ B ′ ∣ } ∣ A ⟩ = ⟨ B ∣ A ⟩ + ⟨ B ′ ∣ A ⟩ { c ⟨ B ∣ } ∣ A ⟩ = c ⟨ B ∣ A ⟩ \begin{aligned}
\{\langle B|+\langle B'|\} |A\rangle&=\langle B|A\rangle+\langle B'|A\rangle\\
\{c\langle B|\}|A\rangle &=c\langle B|A\rangle
\end{aligned} { ⟨ B ∣ + ⟨ B ′ ∣ } ∣ A ⟩ { c ⟨ B ∣ } ∣ A ⟩ = ⟨ B ∣ A ⟩ + ⟨ B ′ ∣ A ⟩ = c ⟨ B ∣ A ⟩
我们继续假设 bra 和 ket 有一个一一对应关系,称其中的一个是另一个的 conjugate imaginary,不过要注意,他们并不真的是复数,所以不能通过相加得到实部或者相减变成虚部。我们假设 :
⟨ B ∣ A ⟩ = ⟨ A ∣ B ⟩ ‾ \langle B|A\rangle=\overline{\langle A|B\rangle} ⟨ B ∣ A ⟩ = ⟨ A ∣ B ⟩
以及假设 :
⟨ A ∣ A ⟩ > 0 \langle A|A\rangle>0 ⟨ A ∣ A ⟩ > 0
除非 ∣ A ⟩ = 0 |A\rangle=0 ∣ A ⟩ = 0 。我们定义 ⟨ A ∣ \langle A| ⟨ A ∣ 或 ∣ A ⟩ |A\rangle ∣ A ⟩ 的长度为 ⟨ A ∣ A ⟩ \sqrt{\langle A|A\rangle} ⟨ A ∣ A ⟩ 。
如果 ⟨ B ∣ A ⟩ = 0 \langle B|A\rangle=0 ⟨ B ∣ A ⟩ = 0 ,我们称 ⟨ B ∣ \langle B| ⟨ B ∣ 与 ∣ A ⟩ |A\rangle ∣ A ⟩ 正交,进一步,我们认为如果两个 vector 正交,那么对应的 2 个 state 正交。
2 Dynamical variables and observables
2.7 dynamical variables and observerables
我们定义 linear operator α \alpha α 为 ∣ F ⟩ = α ∣ A ⟩ |F\rangle=\alpha|A\rangle ∣ F ⟩ = α ∣ A ⟩ ,它的线性体现在:
α { ∣ A ⟩ + ∣ A ′ ⟩ } = α ∣ A ⟩ + α ∣ A ′ ⟩ α { c ∣ A ⟩ } = c α ∣ A ⟩ \begin{aligned}
\alpha\{|A\rangle + |A'\rangle\}&=\alpha|A\rangle+\alpha|A'\rangle\\
\alpha\{c|A\rangle\}&=c\alpha|A\rangle
\end{aligned} α { ∣ A ⟩ + ∣ A ′ ⟩ } α { c ∣ A ⟩ } = α ∣ A ⟩ + α ∣ A ′ ⟩ = c α ∣ A ⟩
当确定了一个线性算子施加于任意 ket 的结果时,这个线性算子被完全确定了。我们可以累加和连乘线性算子,即:
{ α + β } ∣ A ⟩ = α ∣ A ⟩ + β ∣ A ⟩ { α β } ∣ A ⟩ = α { β ∣ A } \begin{aligned}
\{\alpha+\beta\}|A\rangle&=\alpha|A\rangle+\beta|A\rangle\\
\{\alpha\beta\}|A\rangle&=\alpha\{\beta|A\}
\end{aligned} { α + β } ∣ A ⟩ { α β } ∣ A ⟩ = α ∣ A ⟩ + β ∣ A ⟩ = α { β ∣ A }
不过要注意,一般情况下 α β ≠ β α \alpha\beta\ne \beta\alpha α β = β α 。继续如果我们考虑线性算子施加于 bra 上,我们可以用如下定义:
{ ⟨ B ∣ α } ∣ A ⟩ = ⟨ B ∣ { α ∣ A ⟩ } \{\langle B|\alpha\}|A\rangle=\langle B|\{\alpha|A\rangle\} { ⟨ B ∣ α } ∣ A ⟩ = ⟨ B ∣ { α ∣ A ⟩ }
我们来考察一下反过来的乘法 ∣ A ⟩ ⟨ B ∣ |A\rangle\langle B| ∣ A ⟩ ⟨ B ∣ ,这个东西很显然是个线性算子。
我们进一步假设一个 linear operator 对应当前时刻的一个 dynamical variable 。dynamical variable 就是类似于位移,动量,角动量之类的东西。
2.8 conjugate relations
定义 α \alpha α 的 adjoint 为 a ˉ \bar{a} a ˉ ,它满足 ⟨ P ∣ α \langle P|\alpha ⟨ P ∣ α 的 conjugate imaginary 是 α ˉ ∣ P ⟩ \bar{\alpha}|P\rangle α ˉ ∣ P ⟩ 。由这个特点,有:
⟨ B ∣ α ˉ ∣ P ⟩ = ⟨ P ∣ α ∣ B ⟩ ‾ \langle B|\bar{\alpha}|P\rangle=\overline{\langle P|\alpha|B\rangle} ⟨ B ∣ α ˉ ∣ P ⟩ = ⟨ P ∣ α ∣ B ⟩
用上式可以推出 α ˉ ˉ = α \bar{\bar{\alpha}}=\alpha α ˉ ˉ = α 。这个 ajoint 2 次就变回原来的值的特点,让他有点像 complex number。所以我们可以假设 linear operator 的 adjoint 对应的是 dynamical variable 的 conjugate complex,也可以因此称 adjoint 为 conjugate complex linear operator。
如果 α ˉ = α \bar{\alpha}=\alpha α ˉ = α ,也就是 self adjoint,他对应了一个 real dynamical variable ,我们也称它为 real linear operator。linear operator 可以分成 real 不分和 imaginary 部分,所以我们用 conjugate complex 而不是 conjugate imaginary 来描述对它的共轭操作。
linear operator 有很多类似复数的特性,例如我们可以得到 ξ η + η ξ \xi\eta+\eta\xi ξ η + η ξ 和 i ( ξ η − η ξ ) i(\xi\eta-\eta\xi) i ( ξ η − η ξ ) 是实的。还有,因为 ⟨ P ∣ A ⟩ ⟨ B ∣ \langle P|A\rangle\langle B| ⟨ P ∣ A ⟩ ⟨ B ∣ 的 conguate imaginary 是:
⟨ P ∣ A ⟩ ‾ ∣ B ⟩ = ⟨ A ∣ P ⟩ ∣ B ⟩ = ∣ B ⟩ ⟨ A ∣ P ⟩ \overline{\langle P|A\rangle}|B\rangle=\langle A|P\rangle|B\rangle=|B\rangle\langle A|P\rangle ⟨ P ∣ A ⟩ ∣ B ⟩ = ⟨ A ∣ P ⟩ ∣ B ⟩ = ∣ B ⟩ ⟨ A ∣ P ⟩
所以有:
∣ A ⟩ ⟨ B ∣ ‾ = ∣ B ⟩ ⟨ A ∣ \overline{|A\rangle\langle B|}=|B\rangle\langle A| ∣ A ⟩ ⟨ B ∣ = ∣ B ⟩ ⟨ A ∣
定理 :如果 ξ \xi ξ 是 real linear operator,且对于整数 m > 0 m>0 m > 0 ,有 ∣ P ⟩ |P\rangle ∣ P ⟩ 满足
ξ m ∣ P ⟩ = 0 \xi^m|P\rangle=0 ξ m ∣ P ⟩ = 0
则:
ξ ∣ P ⟩ = 0 \xi|P\rangle=0 ξ ∣ P ⟩ = 0
证明方式是利用 ⟨ P ∣ ξ 2 ∣ P ⟩ = 0 \langle P|\xi^2|P\rangle=0 ⟨ P ∣ ξ 2 ∣ P ⟩ = 0 。
2.9 Eigenvalue and eigenvectors
我们只考虑 real linear operator 的特征值和特征向量,即:
ξ ∣ P ⟩ = a ∣ P ⟩ ⟨ Q ∣ ξ = ⟨ Q ∣ b \xi|P\rangle=a|P\rangle\\
\langle Q|\xi=\langle Q|b ξ ∣ P ⟩ = a ∣ P ⟩ ⟨ Q ∣ ξ = ⟨ Q ∣ b
会发现有这样的特点:
特征值为实数。因为:
⟨ P ∣ ξ ∣ P ⟩ = a ⟨ P ∣ P ⟩ a ˉ ⟨ P ∣ P ⟩ = ⟨ P ∣ ξ ∣ P ⟩ ‾ = ⟨ P ∣ ξ ˉ ∣ P ⟩ = ⟨ P ∣ ξ ∣ P ⟩ = a ⟨ P ∣ P ⟩ \begin{aligned}
\langle P|\xi|P\rangle&=a\langle P|P\rangle\\
\bar{a}\langle P|P\rangle &= \overline{\langle P|\xi|P\rangle}=\langle P|\bar{\xi}|P\rangle\\
&=\langle P|\xi|P\rangle=a\langle P|P\rangle
\end{aligned} ⟨ P ∣ ξ ∣ P ⟩ a ˉ ⟨ P ∣ P ⟩ = a ⟨ P ∣ P ⟩ = ⟨ P ∣ ξ ∣ P ⟩ = ⟨ P ∣ ξ ˉ ∣ P ⟩ = ⟨ P ∣ ξ ∣ P ⟩ = a ⟨ P ∣ P ⟩
eigenvalue 对应的 eigenket 和 eigenvalue 对应的 eigenbra 是相同的
eigenket 的 conjugate imaginary 是相同 eigenvalue 的 eigenbra,所以我们可以称他们为 eigenstate
对于算子 ξ \xi ξ ,我们一般用 ξ ′ , ξ ′ ′ , ξ r \xi',\xi'',\xi^r ξ ′ , ξ ′ ′ , ξ r 表示特征值,而用 ∣ ξ ′ ⟩ |\xi'\rangle ∣ ξ ′ ⟩ 表示 ξ ′ \xi' ξ ′ 对应的 eigenket。
定理 :real dynamical variable 的 2 个不同的 eigenvalue 对应的 eigenvector 相互垂直。这个定理被称为 orthognality theorem 。
2.10 Observables
我们假设 ,任何我们可以观测的 dynamical variable 都是 real dynamical variable。虽然 complex dynamical variable 好像可以通过 2 次测量得到,但是在量子李学忠,由于 2 次观察会相互干扰,所以没法进行同时的 2 次观察。不过注意,这个假设反过来并不对,不是所有 real dynamical variable 都可以被观测。
我们继续假设 ,如果一个 dynamic system 在一个 real dynamical variable ξ \xi ξ 的 eigenstate 上,其特征值为 ξ ′ \xi' ξ ′ ,则它的观测值将会是 ξ ′ \xi' ξ ′ 。反之,如果观测值为 ξ ′ \xi' ξ ′ ,则状态为 ξ \xi ξ 的 eigenstate 上。
另外,为了 physical continuity,我们假设在第一次观测后马上进行第二次观测,两次的结果应该是相同的。我们也可以结合叠加态来推理得到,任何对 real dynamical variable 的观测结果总会是他的特征值。反过来说,所有特征值都有可能是测量结果。所以特征值的物理意义就是可能的测量结果。我们继续假设 ,观测前的状态必须 dependent on 观测后的结果。
不是所有 real dynamical variable 都有足够的 eigenstate 来 form a complete set,所以我们认为不能的量就不能被测量。因此我们称 eigenstate 能 form a complete set 的 real dynamical variable 为 observable 。所以可以被测量的就是 observable,那么反过来 observable 是否能被测量呢?理论上是可以的,但是实际是不是能构造出这样测量不好说。
observable ξ \xi ξ 满足,任意 ∣ P ⟩ |P\rangle ∣ P ⟩ :
∣ P ⟩ = ∫ ∣ ξ ′ c ⟩ d ξ ′ + ∑ r ∣ ξ r d ⟩ |P\rangle=\int|\xi'c\rangle d\xi'+\sum_r|\xi^rd\rangle ∣ P ⟩ = ∫ ∣ ξ ′ c ⟩ d ξ ′ + r ∑ ∣ ξ r d ⟩
这里加了个 c c c 和 d d d 主要是为了区分 ξ ′ \xi' ξ ′ 和 ξ r \xi^r ξ r 相等的时候的 eigenket,因为同一个特征值可以有好多不同的 eigenket。
很多时候很难从数学上判断一个 dynamical variable 是否 observable,但是可以从物理上考虑,如果可以被测量,那么我们就自然假设其 observable,例如,我们可以假设,系统的能量总是 observable 的。
我们可以证明,如果一个 dynamic variable 满足一个代数方程(即多项式),那么他的特征值个数等于多项式阶数,且它 observable(这个证明是通过构造得到的)。例如,∣ A ⟩ ⟨ A ∣ |A\rangle\langle A| ∣ A ⟩ ⟨ A ∣ (A A A 为 normalized ket)满足:
{ ∣ A ⟩ ⟨ A ∣ } 2 = ∣ A ⟩ ⟨ A ∣ A ⟩ ⟨ A ∣ = ∣ A ⟩ ⟨ A ∣ \{|A\rangle\langle A|\}^2=|A\rangle\langle A|A\rangle\langle A|=|A\rangle\langle A| { ∣ A ⟩ ⟨ A ∣ } 2 = ∣ A ⟩ ⟨ A ∣ A ⟩ ⟨ A ∣ = ∣ A ⟩ ⟨ A ∣
符合 x 2 − x = 0 x^2-x=0 x 2 − x = 0 ,所以其 observable,且其观测值只能是 1 或 0。
接下来我们考虑:
∣ X ⟩ = ∫ ∣ ξ ′ x ⟩ d ξ ′ , ∣ Y ⟩ = ∫ ∣ ξ ′ ′ y ⟩ d ξ ′ ′ |X\rangle=\int|\xi'x\rangle d\xi',\quad|Y\rangle=\int|\xi''y\rangle d\xi'' ∣ X ⟩ = ∫ ∣ ξ ′ x ⟩ d ξ ′ , ∣ Y ⟩ = ∫ ∣ ξ ′ ′ y ⟩ d ξ ′ ′
那么:
⟨ X ∣ Y ⟩ = ∫ ∫ ⟨ ξ ′ x ∣ ξ ′ ′ y ⟩ d ξ ′ d ξ ′ ′ \langle X|Y\rangle = \int\int \langle \xi'x|\xi''y\rangle d\xi'd\xi'' ⟨ X ∣ Y ⟩ = ∫ ∫ ⟨ ξ ′ x ∣ ξ ′ ′ y ⟩ d ξ ′ d ξ ′ ′
如果我们希望 ⟨ X ∣ Y ⟩ ≠ 0 \langle X|Y\rangle\ne0 ⟨ X ∣ Y ⟩ = 0 ,那么会有 ⟨ ξ ′ x ∣ ξ ′ y ⟩ → ∞ \langle\xi'x|\xi'y\rangle\rightarrow\infty ⟨ ξ ′ x ∣ ξ ′ y ⟩ → ∞ 。之前我们一直都在假设 scalar product 的结果是有限的,显然就不能有这个 range of eigenvalue 的情况了(对应着积分),我们的理论也就不适应很多实际场景,所以我们要假设:
∫ ⟨ ξ ′ x ∣ ξ ′ ′ x ⟩ d ξ ′ ′ > 0 , if ∣ ξ ′ x ⟩ ≠ 0 \int \langle\xi'x|\xi''x\rangle d\xi''>0,\quad\text{if}\ |\xi'x\rangle\ne0 ∫ ⟨ ξ ′ x ∣ ξ ′ ′ x ⟩ d ξ ′ ′ > 0 , if ∣ ξ ′ x ⟩ = 0
(这个式子我有点没理解...是指在什么情况下恒大于 0 呢?如果任何情况下都恒大于 0 的话,下面的证明的最后部分为啥不用呢)
原来的那种长度有限,scalar product 结果有限的空间在数学中称为希尔伯特空间。我们这里扩展使用一个更广泛的空间,让他俩都可以趋于无穷。
这样的结果使:
∣ P ⟩ = ∫ ∣ ξ ′ c ⟩ d ξ ′ + ∑ r ∣ ξ r d ⟩ |P\rangle=\int|\xi'c\rangle d\xi'+\sum_r|\xi^rd\rangle ∣ P ⟩ = ∫ ∣ ξ ′ c ⟩ d ξ ′ + r ∑ ∣ ξ r d ⟩
的结果唯一 。注意这个证明不是很平凡,因为不能直接讨论上面的新假设(因为新假设里,积分对应的 dynamical variable 的拆分里只有积分)。这里记录一下证明方法:
用反证法,假设不唯一,则存在:
0 = ∫ ∣ ξ ′ a ⟩ d ξ ′ + ∑ s ∣ ξ s b ⟩ 0=\int|\xi'a\rangle d\xi'+\sum_s|\xi^sb\rangle 0 = ∫ ∣ ξ ′ a ⟩ d ξ ′ + s ∑ ∣ ξ s b ⟩
这里 a , b a,b a , b 都是新的 label,s s s 是相减完剩下的部分。如果 s s s 中有一个 eigenket 不在积分范围中,设它为 ∣ ξ l b ⟩ |\xi^lb\rangle ∣ ξ l b ⟩ ,上式乘 ⟨ ξ l b ∣ \langle \xi^lb| ⟨ ξ l b ∣ ,则会只剩下 0 = ⟨ ξ l b ∣ ξ l b ⟩ 0=\langle \xi^lb|\xi^lb\rangle 0 = ⟨ ξ l b ∣ ξ l b ⟩ ,这与非 0 ket 长度大于 0 的假设相悖了。所以不存在这样的 ∣ ξ l b ⟩ |\xi^lb\rangle ∣ ξ l b ⟩ 。
类似地,如果积分不分存在一个 eigenvalue 不等于 ξ s \xi^s ξ s 中的任何一项,那么我们可以选出来这样的一个特征值 ∣ ξ ′ ′ a ⟩ |\xi''a\rangle ∣ ξ ′ ′ a ⟩ 其可以消掉求和的部分,得到的结果会违反 ∫ ⟨ ξ ′ ′ a ∣ ξ ′ a ⟩ d ξ ′ > 0 \int \langle\xi''a|\xi'a\rangle d\xi'>0 ∫ ⟨ ξ ′ ′ a ∣ ξ ′ a ⟩ d ξ ′ > 0 。
在剩下的情况中,我们从 s s s 中选一个 ∣ ξ l b ⟩ |\xi^lb\rangle ∣ ξ l b ⟩ ,会有:
0 = ∫ ⟨ ξ l b ∣ ξ ′ a ⟩ d ξ ′ + ⟨ ξ l b ∣ ξ l b ⟩ 0=\int\langle \xi^lb|\xi'a\rangle d\xi'+\langle \xi^lb|\xi^lb\rangle 0 = ∫ ⟨ ξ l b ∣ ξ ′ a ⟩ d ξ ′ + ⟨ ξ l b ∣ ξ l b ⟩
如果我们从积分范围中取一个 ∣ ξ l a ⟩ |\xi^la\rangle ∣ ξ l a ⟩ (因为特征值相同的 eigenket 就只差一个常数系数,所以可以随便取),则有:
0 = ∫ ⟨ ξ l a ∣ ξ ′ a ⟩ d ξ ′ + ⟨ ξ l a ∣ ξ l b ⟩ 0=\int\langle \xi^la|\xi'a\rangle d\xi'+\langle \xi^la|\xi^lb\rangle 0 = ∫ ⟨ ξ l a ∣ ξ ′ a ⟩ d ξ ′ + ⟨ ξ l a ∣ ξ l b ⟩
这里因为后面的式子的第一项有限,所以 ⟨ ξ l a ∣ ξ l b ⟩ \langle \xi^la|\xi^lb\rangle ⟨ ξ l a ∣ ξ l b ⟩ 有限,所以 ∫ ⟨ ξ l b ∣ ξ ′ a ⟩ d ξ ′ = 0 \int\langle \xi^lb|\xi'a\rangle d\xi'=0 ∫ ⟨ ξ l b ∣ ξ ′ a ⟩ d ξ ′ = 0 ,所以 ⟨ ξ l b ∣ ξ l b ⟩ = 0 \langle \xi^lb|\xi^lb\rangle=0 ⟨ ξ l b ∣ ξ l b ⟩ = 0 ,矛盾了。证毕。
2.11 Functions of observables
考虑 f ( ξ ) f(\xi) f ( ξ ) ,当我们测量到 ξ \xi ξ 为 ξ ′ \xi' ξ ′ 时,f ( ξ ) f(\xi) f ( ξ ) 的观察值应该是 f ( ξ ′ ) f(\xi') f ( ξ ′ ) 。对于一般性的函数,不太好从数学上证明这个式子,所以我们反过来,用这种方式来定义 f ( ξ ) f(\xi) f ( ξ ) :
f ( ξ ) ∣ ξ ′ ⟩ = f ( ξ ′ ) ∣ ξ ′ ⟩ for every eigenket ξ ′ of ξ f(\xi)|\xi'\rangle=f(\xi')|\xi'\rangle\quad \text{for every eigenket }\xi'\text{ of }\xi f ( ξ ) ∣ ξ ′ ⟩ = f ( ξ ′ ) ∣ ξ ′ ⟩ for every eigenket ξ ′ of ξ
简单推导,还有:
f ( ξ ) ‾ = f ˉ ( ξ ) \overline{f(\xi)}=\bar{f}(\xi) f ( ξ ) = f ˉ ( ξ )
以及对于 bra 来说,有:
⟨ ξ ′ ∣ f ( ξ ) = f ( ξ ′ ) ⟨ ξ ′ ∣ \langle\xi'|f(\xi)=f(\xi')\langle\xi'| ⟨ ξ ′ ∣ f ( ξ ) = f ( ξ ′ ) ⟨ ξ ′ ∣
我们来看 2 个常见的例子。
2.12 The general physical interpretation
第 10 节提到的物理阐释比较狭义,因为他只解释了 eigenstate。我们需要更为广义的解释。你可能会把观测 ξ \xi ξ 的值定义为 ⟨ x ∣ ξ ∣ x ⟩ \langle x|\xi|x\rangle ⟨ x ∣ ξ ∣ x ⟩ ,但是这样不行,因为假如说我们进一步做了观测 η \eta η ,得到了 ⟨ x ∣ η ∣ x ⟩ \langle x|\eta|x\rangle ⟨ x ∣ η ∣ x ⟩ ,从和经典系统类比的角度,我们会希望他们的乘积等于 ⟨ x ∣ ξ η ∣ x ⟩ \langle x|\xi\eta|x\rangle ⟨ x ∣ ξ η ∣ x ⟩ 或 ⟨ x ∣ η ξ ∣ x ⟩ \langle x|\eta\xi|x\rangle ⟨ x ∣ η ξ ∣ x ⟩ ,但显然这和我们前面对算子的定义有冲突了。
不过,如果我们定义 ⟨ x ∣ ξ ∣ x ⟩ \langle x|\xi|x\rangle ⟨ x ∣ ξ ∣ x ⟩ 为观测的平均值,那么就没问题了,因为乘积的平均本就不等于平均的乘积。所以我们定义 ⟨ x ∣ ξ ∣ x ⟩ \langle x|\xi|x\rangle ⟨ x ∣ ξ ∣ x ⟩ 为观测的平均值,前提是 ∣ x ⟩ |x\rangle ∣ x ⟩ 已经 normalize 过了。
我们可以进一步考虑观测取不同值的概率。我们可以把事件是否发生作为一个 observable,这个事件的函数为 f ( ξ ) = δ ξ a f(\xi)=\delta_{\xi a} f ( ξ ) = δ ξ a ,那么:
P a = ⟨ x ∣ δ ξ a ∣ x ⟩ P_a=\langle x|\delta_{\xi a}|x\rangle P a = ⟨ x ∣ δ ξ a ∣ x ⟩
如果 a a a 不是 ξ \xi ξ 的特征值,那么 δ ξ a = 0 , P a = 0 \delta_{\xi a}=0,\ P_a=0 δ ξ a = 0 , P a = 0 。
不过要注意,实际实验中,ξ \xi ξ 是不可能完全等于 ξ \xi ξ 的(总是要有误差的),所以这种等于特征状态的情况是一种数学上的理想化。(在 24 节和这里有呼应)
2.13 Commutability and compatibility
一个状态可能同时是 2 个 observable 的 eigenstate,即:
ξ ∣ A ⟩ = ξ ′ ∣ A ⟩ , η ∣ A ⟩ = η ′ ∣ A ⟩ \xi|A\rangle=\xi'|A\rangle,\quad\eta|A\rangle=\eta'|A\rangle ξ ∣ A ⟩ = ξ ′ ∣ A ⟩ , η ∣ A ⟩ = η ′ ∣ A ⟩
这时我们有:
ξ η ∣ A ⟩ = η ξ ∣ A ⟩ ( ξ η − η ξ ) ∣ A ⟩ = 0 \begin{aligned}
\xi\eta|A\rangle&=\eta\xi|A\rangle\\
(\xi\eta-\eta\xi)|A\rangle&=0
\end{aligned} ξ η ∣ A ⟩ ( ξ η − η ξ ) ∣ A ⟩ = η ξ ∣ A ⟩ = 0
我们定义 ξ η − η ξ = 0 \xi\eta-\eta\xi=0 ξ η − η ξ = 0 的情况下,ξ \xi ξ 和 η \eta η 相互 commute。注意,不 commute 的情况下也可能会存在共同 eigenstate(simultaneous eigenstate)。
定理 :如果 2 个 observable commute,他们的共同 eigenstate 可以 complete set。
我们考虑 η \eta η 的一个 eigenket ∣ η ′ ⟩ |\eta'\rangle ∣ η ′ ⟩ 可以利用 ξ \xi ξ 的 eigenket 扩展为:
∣ η ′ ⟩ = ∫ ∣ ξ ′ η ′ c ⟩ d ξ ′ + ∑ r ∣ ξ r η ′ d ⟩ |\eta'\rangle=\int|\xi'\eta'c\rangle d\xi'+\sum_r{|\xi^r\eta'd\rangle} ∣ η ′ ⟩ = ∫ ∣ ξ ′ η ′ c ⟩ d ξ ′ + r ∑ ∣ ξ r η ′ d ⟩
那么有:
0 = ( η − η ′ ) ∣ η ′ ⟩ = ∫ ( η − η ′ ) ∣ ξ ′ η ′ c ⟩ d ξ ′ + ∑ r ( η − η ′ ) ∣ ξ r η ′ d ⟩ 0=(\eta-\eta')|\eta'\rangle=\int(\eta-\eta')|\xi'\eta'c\rangle d\xi'+\sum_r{(\eta-\eta')|\xi^r\eta'd\rangle} 0 = ( η − η ′ ) ∣ η ′ ⟩ = ∫ ( η − η ′ ) ∣ ξ ′ η ′ c ⟩ d ξ ′ + r ∑ ( η − η ′ ) ∣ ξ r η ′ d ⟩
因为 commute,所以还有:
ξ ( η − η ′ ) ∣ ξ r η ′ d ⟩ = ( η − η ′ ) ξ ∣ ξ r η ′ d ⟩ = ( η − η ′ ) ξ r ∣ ξ r η ′ d ⟩ = ξ r ( η − η ′ ) ∣ ξ r η ′ d ⟩ \begin{aligned}
\xi(\eta-\eta')|\xi^r\eta'd\rangle &=(\eta-\eta')\xi|\xi^r\eta'd\rangle=(\eta-\eta')\xi^r|\xi^r\eta'd\rangle\\
&=\xi^r(\eta-\eta')|\xi^r\eta'd\rangle
\end{aligned} ξ ( η − η ′ ) ∣ ξ r η ′ d ⟩ = ( η − η ′ ) ξ ∣ ξ r η ′ d ⟩ = ( η − η ′ ) ξ r ∣ ξ r η ′ d ⟩ = ξ r ( η − η ′ ) ∣ ξ r η ′ d ⟩
即 ( η − η ′ ) ∣ ξ r η ′ d ⟩ (\eta-\eta')|\xi^r\eta'd\rangle ( η − η ′ ) ∣ ξ r η ′ d ⟩ 是 ξ \xi ξ 的一个 eigenket,类似的有 ( η − η ′ ) ∣ ξ ′ η ′ c ⟩ (\eta-\eta')|\xi'\eta'c\rangle ( η − η ′ ) ∣ ξ ′ η ′ c ⟩ 也是。那么由于展开唯一的时候的证明,可以得到:
( η − η ′ ) ∣ ξ ′ η ′ c ⟩ = 0 , ( η − η ′ ) ∣ ξ r η ′ d ⟩ = 0 (\eta-\eta')|\xi'\eta'c\rangle=0,\quad(\eta-\eta')|\xi^r\eta'd\rangle=0 ( η − η ′ ) ∣ ξ ′ η ′ c ⟩ = 0 , ( η − η ′ ) ∣ ξ r η ′ d ⟩ = 0
即所有能用来组成 ∣ η ′ ⟩ |\eta'\rangle ∣ η ′ ⟩ 的 eigenket 都是共同 eigenket,而所有的 ket 都可以用 ∣ η ′ ⟩ |\eta'\rangle ∣ η ′ ⟩ 组成,所以共同 eigenstate complete set。
后面我们会用证明中使用的 ∣ ξ ′ η ′ c ⟩ |\xi'\eta'c\rangle ∣ ξ ′ η ′ c ⟩ 这样的形式来表示 2 个 observable 的共同 eigenstate。
定理 :反过来也是,如果共同 eigenstate complete a set,则 2 个 observable commute。
证明方法是,因为 complete a set,加之 ( ξ η − η ξ ) ∣ ξ ′ η ′ ⟩ = 0 (\xi\eta-\eta\xi)|\xi'\eta'\rangle=0 ( ξ η − η ξ ) ∣ ξ ′ η ′ ⟩ = 0 ,所以任何 ∣ P ⟩ |P\rangle ∣ P ⟩ 都有 ( ξ η − η ξ ) ∣ P ⟩ = 0 (\xi\eta-\eta\xi)|P\rangle=0 ( ξ η − η ξ ) ∣ P ⟩ = 0 ,即 ξ η − η ξ = 0 \xi\eta-\eta\xi=0 ξ η − η ξ = 0
2 个 observable 的结论可以继续扩充至多个 observable。例如我们可以定义,对于 ξ , η , ζ , … \xi,\eta,\zeta,\dots ξ , η , ζ , … 这样的 commuting observables:
f ( ξ , η , ζ , … ) = f ( ξ ′ , η ′ , ζ ′ , … ) ∣ ξ ′ η ′ ζ ′ … ⟩ f(\xi,\eta,\zeta,\dots)=f(\xi',\eta',\zeta',\dots)|\xi'\eta'\zeta'\dots\rangle f ( ξ , η , ζ , … ) = f ( ξ ′ , η ′ , ζ ′ , … ) ∣ ξ ′ η ′ ζ ′ … ⟩
以及:
P a b c . . . = ⟨ x ∣ δ ξ a δ η b δ ζ c . . . ∣ x ⟩ P_{abc...}=\langle x|\delta_{\xi a}\delta_{\eta b}\delta_{\zeta c}...|x\rangle P a b c . . . = ⟨ x ∣ δ ξ a δ η b δ ζ c . . . ∣ x ⟩
从物理意义上,我们可以认为多个 commuting observables 是一次测量的多个数字结果,或者我们称这些 observation non-interfering or compatible。
3 Representations
3.14 Basic Vector
类似几何中使用数字坐标,我们也要考虑用如何把数字加进我们的抽象体系中。这种表示形式称为 representation,而在 representation 中一个抽象量的表达方式称为 representative。
我们取一个 complete set of bra vectors,称为 basic bra。我们可以用一个 ket 和 basic bra 的 scalar product 结果来表示它。例如对于一个只有 n n n 个状态的系统来说,我们可以用 1 , 2 , 3 , . . . , n 1,2,3,...,n 1 , 2 , 3 , . . . , n 来标记 n n n 个 basic bra,那么对应的 representative 是:⟨ 1 ∣ a ⟩ , ⟨ 2 ∣ a ⟩ , ⟨ 3 ∣ a ⟩ , . . . , ⟨ n ∣ a ⟩ \langle1|a\rangle,\langle2|a\rangle,\langle3|a\rangle,...,\langle n|a\rangle ⟨ 1 ∣ a ⟩ , ⟨ 2 ∣ a ⟩ , ⟨ 3 ∣ a ⟩ , . . . , ⟨ n ∣ a ⟩ 。
更一般地,我们可以y用一组实数参数 λ 1 , λ 2 , . . . λ u \lambda_1,\lambda_2,...\lambda_u λ 1 , λ 2 , . . . λ u 标记一个 basic bra,用 ⟨ λ 1 λ 2 . . . λ u ∣ \langle \lambda_1\lambda_2...\lambda_u| ⟨ λ 1 λ 2 . . . λ u ∣ 表示,而那么对应的一个 ket 的 representative 则是 ⟨ λ 1 λ 2 . . . λ u ∣ a ⟩ \langle \lambda_1\lambda_2...\lambda_u|a\rangle ⟨ λ 1 λ 2 . . . λ u ∣ a ⟩ 。(注意不是说一共有 u u u 个 basic bra)
为了方便,我们要求 basic bra 相互独立,并相互正交,这种 representation 称之为 orthogonal representation。
考虑一个 ⟨ λ 1 λ 2 . . . λ u ∣ b ⟩ = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣ a ⟩ \langle \lambda_1\lambda_2...\lambda_u|b\rangle=\lambda_1\langle \lambda_1\lambda_2...\lambda_u|a\rangle ⟨ λ 1 λ 2 . . . λ u ∣ b ⟩ = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣ a ⟩ ,这相当于 ∣ b ⟩ |b\rangle ∣ b ⟩ 是 ∣ a ⟩ |a\rangle ∣ a ⟩ 的 linear function 映射结果了,也就可以构建出 linear operator L 1 L_1 L 1 ,满足:
∣ b ⟩ = L 1 ∣ a ⟩ |b\rangle=L_1|a\rangle ∣ b ⟩ = L 1 ∣ a ⟩
那么我们有:
⟨ λ 1 λ 2 . . . λ u ∣ L 1 ∣ a ⟩ = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣ a ⟩ ⟨ λ 1 λ 2 . . . λ u ∣ L 1 = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣ \begin{aligned}
\langle \lambda_1\lambda_2...\lambda_u|L_1|a\rangle&=\lambda_1\langle \lambda_1\lambda_2...\lambda_u|a\rangle\\
\langle \lambda_1\lambda_2...\lambda_u|L_1&=\lambda_1\langle \lambda_1\lambda_2...\lambda_u|
\end{aligned} ⟨ λ 1 λ 2 . . . λ u ∣ L 1 ∣ a ⟩ ⟨ λ 1 λ 2 . . . λ u ∣ L 1 = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣ a ⟩ = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣
也就是说,所有 eigen bra 都是 L 1 L_1 L 1 的 eigenbra,λ 1 \lambda_1 λ 1 是特征值。
由于 basic bra 相互垂直,可以得到 L 1 L_1 L 1 是实的,同时是一个 observable,证明如下:
令 λ 1 ′ , λ 2 ′ , . . . λ u ′ \lambda_1',\lambda_2',...\lambda_u' λ 1 ′ , λ 2 ′ , . . . λ u ′ 和 λ 1 ′ ′ , λ 2 ′ ′ , . . . λ u ′ ′ \lambda_1'',\lambda_2'',...\lambda_u'' λ 1 ′ ′ , λ 2 ′ ′ , . . . λ u ′ ′ 分别是参数 λ 1 , λ 2 , . . . λ u \lambda_1,\lambda_2,...\lambda_u λ 1 , λ 2 , . . . λ u 的 2 组取值,那么有:
⟨ λ 1 ′ λ 2 ′ . . . λ u ′ ∣ L 1 ∣ λ 1 ′ ′ λ 2 ′ ′ . . . λ u ′ ′ ⟩ = λ 1 ′ ′ ⟨ λ 1 ′ λ 2 ′ . . . λ u ′ ∣ λ 1 ′ ′ λ 2 ′ ′ . . . λ u ′ ′ ⟩ ⟨ λ 1 ′ ′ λ 2 ′ ′ . . . λ u ′ ′ ∣ L 1 ∣ λ 1 ′ λ 2 ′ . . . λ u ′ ⟩ = λ 1 ′ ⟨ λ 1 ′ λ 2 ′ . . . λ u ′ ′ ∣ λ 1 ′ λ 2 ′ . . . λ u ′ ⟩ \begin{aligned}
\langle\lambda_1'\lambda_2'...\lambda_u'|L_1|\lambda_1''\lambda_2''...\lambda_u''\rangle &= \lambda_1''\langle\lambda_1'\lambda_2'...\lambda_u'|\lambda_1''\lambda_2''...\lambda_u''\rangle\\
\langle\lambda_1''\lambda_2''...\lambda_u''|L_1|\lambda_1'\lambda_2'...\lambda_u'\rangle &= \lambda_1'\langle\lambda_1'\lambda_2'...\lambda_u''|\lambda_1'\lambda_2'...\lambda_u'\rangle
\end{aligned} ⟨ λ 1 ′ λ 2 ′ . . . λ u ′ ∣ L 1 ∣ λ 1 ′ ′ λ 2 ′ ′ . . . λ u ′ ′ ⟩ ⟨ λ 1 ′ ′ λ 2 ′ ′ . . . λ u ′ ′ ∣ L 1 ∣ λ 1 ′ λ 2 ′ . . . λ u ′ ⟩ = λ 1 ′ ′ ⟨ λ 1 ′ λ 2 ′ . . . λ u ′ ∣ λ 1 ′ ′ λ 2 ′ ′ . . . λ u ′ ′ ⟩ = λ 1 ′ ⟨ λ 1 ′ λ 2 ′ . . . λ u ′ ′ ∣ λ 1 ′ λ 2 ′ . . . λ u ′ ⟩
因为 basic bra 相互正交,所以只有在整个表达完全相同的情况下(∀ r ∈ 1 , 2 , . . . , u , λ r ′ ′ = λ r ′ \forall r\in1,2,...,u,\ \lambda_r''=\lambda_r' ∀ r ∈ 1 , 2 , . . . , u , λ r ′ ′ = λ r ′ )的时候,右侧才非 0,此时左侧相等,也就有了 L 1 = L ‾ 1 L_1=\overline{L}_1 L 1 = L 1 ,所以是实的,因为 basic bra 都是他的 eigenbra,所以是 observable。
类似地我们可以定义 L 2 , L 3 , . . . , L u L_2,L_3,...,L_u L 2 , L 3 , . . . , L u ,因为所有 basic bra 都是 L L L 们的共同 eigenbra,所以他们相互 commute。由此,我们希望得到:
定理 :如果 ξ 1 , ξ 2 , . . . , ξ u \xi_1,\xi_2,...,\xi_u ξ 1 , ξ 2 , . . . , ξ u 是一组 commuting observables,我们可以对应的建立 orthogonal representation,其中的 basic bras 是 ξ 1 , ξ 2 , . . . , ξ u \xi_1,\xi_2,...,\xi_u ξ 1 , ξ 2 , . . . , ξ u 的共同 eigenbra。
如果固定一组特征值 ξ 1 ′ , ξ 2 ′ , . . . ξ u ′ \xi_1',\xi_2',...\xi_u' ξ 1 ′ , ξ 2 ′ , . . . ξ u ′ ,只有 1 个 independent simultaneous eigenbra。也就是,只有一个 ⟨ A ∣ \langle A| ⟨ A ∣ 满足
∀ i ∈ 1 , 2 , . . . , u , ⟨ A ∣ ξ i = ξ i ′ ⟨ A ∣ \forall i\in1,2,...,u,\ \langle A|\xi_i=\xi_i'\langle A| ∀ i ∈ 1 , 2 , . . . , u , ⟨ A ∣ ξ i = ξ i ′ ⟨ A ∣
那么我们可以直接选所有的 simultaneous eigenbra,根据 13 节的结论,他们 complete a set。而且他们中任何两个对应的特征值组中,肯定有一个不相等,也就可以证明他们是相互正交的。
如果固定一组特征值,有多个 independent simultaneous eigenbra。我们可以现在每一组特征组对应的 simultaneous eigenbra 中找到一些能 complete 这一组的 set 且相互正交的 eigenbra。(书里没说怎么取)
在上述的后一种情况下,我们可以用 ξ 1 ′ , ξ 2 ′ , . . . ξ u ′ \xi_1',\xi_2',...\xi_u' ξ 1 ′ , ξ 2 ′ , . . . ξ u ′ 来标记特征值组,用 λ 1 , λ 2 , . . . λ v \lambda_1,\lambda_2,...\lambda_v λ 1 , λ 2 , . . . λ v 来区分每个组里选的 eigenbra。所以 basic bra 就写作 ⟨ ξ 1 ′ ξ 2 ′ . . . ξ u ′ λ 1 λ 2 . . . λ v ∣ \langle\xi_1'\xi_2'...\xi_u'\lambda_1\lambda_2...\lambda_v| ⟨ ξ 1 ′ ξ 2 ′ . . . ξ u ′ λ 1 λ 2 . . . λ v ∣ 。然后我们可以随着 λ \lambda λ 定义 L 1 , L 2 , . . . L v L_1,L_2,...L_v L 1 , L 2 , . . . L v ,我们会观察到这些 L L L 与 ξ \xi ξ commute(因为 eigenbra complete a set 了)。这样 basic bra 就是 ξ 1 ’ , ξ 2 , . . . ξ u , L 1 , L 2 , . . . L v \xi_1’,\xi_2,...\xi_u,L_1,L_2,...L_v ξ 1 ’ , ξ 2 , . . . ξ u , L 1 , L 2 , . . . L v 的共同 observables 了。(注意,这里给出了从一组 commuting observable 怎么构建出 complete commuting observable)
我们定义 a complete set of commuting observables 是指一个 observable 集合,他们之间两两 commuting,对于一组特征值 只有 1 个 independent simultaneous eigenbra。那么上面证明中使用的 ξ 1 , ξ 2 , . . . , ξ u , L 1 , L 2 , . . . , L v \xi_1,\xi_2,...,\xi_u,L_1,L_2,...,L_v ξ 1 , ξ 2 , . . . , ξ u , L 1 , L 2 , . . . , L v 就是 a complete set of commuting observables,对应的特征值是 ξ 1 ‘ , ξ 2 ’ , . . . , ξ u ‘ , λ 1 , λ 2 , . . . , λ v \xi_1‘,\xi_2’,...,\xi_u‘,\lambda_1,\lambda_2,...,\lambda_v ξ 1 ‘ , ξ 2 ’ , . . . , ξ u ‘ , λ 1 , λ 2 , . . . , λ v ,也就是对应了 eigenbra。类似的 ⟨ λ 1 λ 2 . . . λ u ∣ L 1 = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣ \langle \lambda_1\lambda_2...\lambda_u|L_1=\lambda_1\langle \lambda_1\lambda_2...\lambda_u| ⟨ λ 1 λ 2 . . . λ u ∣ L 1 = λ 1 ⟨ λ 1 λ 2 . . . λ u ∣ 中的 L 1 , L 2 , . . . , L u L_1,L_2,...,L_u L 1 , L 2 , . . . , L u 也是 a complete set of commuting observable,对应的 eigenbra 是 ⟨ λ 1 λ 2 . . . λ u ∣ \langle \lambda_1\lambda_2...\lambda_u| ⟨ λ 1 λ 2 . . . λ u ∣ 。
由这个定义,我们可以将这节的主要结论总结为:
orthogonal representation 的 basic bras 是 a complete set of commuting observable 的 simultaneous eigenbra
给 a complete set of commuting observable,我们可以建立起一个 orthogonal representation,其中的 basic bras 是这个 complete set of commuting observable 的 simultaneous eigenbras
任何 commuting observables 可以通过增加 observables 来变成 a complete set of commuting observable
可以用特征值来标记 basic bras,这个特征值是指 basic bras 对应的 a complete set of commuting observable 的特征值。
basic bras 的 conjugate imaginaries 是 basic kets。我们有:
⟨ b ∣ λ 1 λ 2 . . . λ u ⟩ = ⟨ λ 1 λ 2 . . . λ u ∣ b ⟩ ‾ \langle b|\lambda_1\lambda_2...\lambda_u\rangle=\overline{\langle \lambda_1\lambda_2...\lambda_u|b\rangle} ⟨ b ∣ λ 1 λ 2 . . . λ u ⟩ = ⟨ λ 1 λ 2 . . . λ u ∣ b ⟩
下一节我们来考虑怎么处理 basic bra 的长度。
3.15 The δ \delta δ function
我们定义:
∫ − ∞ ∞ δ ( x ) d x = 1 δ ( x ) = 0 , for x ≠ 0 \begin{aligned}
\int_{-\infty}^{\infty}\delta(x)dx&=1\\
\delta(x)&=0\text{, for }x\ne0
\end{aligned} ∫ − ∞ ∞ δ ( x ) d x δ ( x ) = 1 = 0 , for x = 0
根据这个定义,可以得到最重要的一个特性:
∫ − ∞ ∞ f ( x ) δ ( x ) d x = f ( 0 ) \begin{aligned}
\int_{-\infty}^{\infty}f(x)\delta(x)dx=f(0)
\end{aligned} ∫ − ∞ ∞ f ( x ) δ ( x ) d x = f ( 0 )
我们还可以用下面的方式来定义 δ \delta δ :
ϵ ( x ) = 0 ( x < 0 ) ϵ ( x ) = 1 ( x > 0 ) \begin{aligned}
\epsilon(x)=0\quad(x<0)\\
\epsilon(x)=1\quad(x>0)
\end{aligned} ϵ ( x ) = 0 ( x < 0 ) ϵ ( x ) = 1 ( x > 0 )
而 δ ( x ) = ϵ ′ ( x ) \delta(x)=\epsilon'(x) δ ( x ) = ϵ ′ ( x ) 。
下面是 δ \delta δ 的其他一些特性:
δ ( x ) = δ ( − x ) x δ ( x ) = 0 δ ( a x ) = a − 1 δ ( x ) δ ( x 2 − a 2 ) = 1 2 a − 1 { δ ( x + a ) + δ ( x − a ) } ( a > 0 ) ∫ δ ( x − a ) d x δ ( x − b ) = δ ( a − b ) f ( x ) δ ( x − a ) = f ( a ) δ ( x − a ) \begin{aligned}
\delta(x)&=\delta(-x)\\
x\delta(x)&=0\\
\delta(ax)&=a^{-1}\delta(x)\\
\delta(x^2-a^2)&=\frac{1}{2}a^{-1}\{\delta(x+a)+\delta(x-a)\}\quad(a>0)\\
\int\delta(x-a)dx\delta(x-b)&=\delta(a-b)\\
f(x)\delta(x-a)&=f(a)\delta(x-a)
\end{aligned} δ ( x ) x δ ( x ) δ ( a x ) δ ( x 2 − a 2 ) ∫ δ ( x − a ) d x δ ( x − b ) f ( x ) δ ( x − a ) = δ ( − x ) = 0 = a − 1 δ ( x ) = 2 1 a − 1 { δ ( x + a ) + δ ( x − a ) } ( a > 0 ) = δ ( a − b ) = f ( a ) δ ( x − a )
3.16 Properties of the basic vectors
假设我们有一个 observable ξ \xi ξ ,它自己形成了一个 compete commuting set,也就是它的每个特征值 ξ ′ \xi' ξ ′ 只有一个 eigenstate。这样对应的 orthogonal representation 就是 ⟨ ξ ′ ∣ \langle\xi'| ⟨ ξ ′ ∣ 。这种情况下,如果所有的特征值都是离散 的,那么我们可以 normalize basic bra,也就有:
⟨ ξ ′ ∣ ξ ′ ′ ⟩ = δ ξ ′ ξ ′ ′ \langle\xi'|\xi''\rangle=\delta_{\xi'\xi''} ⟨ ξ ′ ∣ ξ ′ ′ ⟩ = δ ξ ′ ξ ′ ′
其中:
δ r s = 0 when r ≠ s = 1 when r = s \begin{aligned}
\delta_{rs}&=0\quad\text{when }r\ne s\\
&=1\quad\text{when }r= s
\end{aligned} δ r s = 0 when r = s = 1 when r = s
从上式,我们有:
∑ ξ ′ ∣ ξ ′ ⟩ ⟨ ξ ′ ∣ ξ ′ ′ ⟩ = ∑ ξ ′ ∣ ξ ′ ⟩ δ ξ ′ ξ ′ ′ = ∣ ξ ′ ′ ⟩ \sum_{\xi'}|\xi'\rangle\langle\xi'|\xi''\rangle=\sum_{\xi'}|\xi'\rangle\delta_{\xi'\xi''}=|\xi''\rangle ξ ′ ∑ ∣ ξ ′ ⟩ ⟨ ξ ′ ∣ ξ ′ ′ ⟩ = ξ ′ ∑ ∣ ξ ′ ⟩ δ ξ ′ ξ ′ ′ = ∣ ξ ′ ′ ⟩
由于这个式子对所有特征值 ξ ′ ′ \xi'' ξ ′ ′ 都成立,我们有:
∑ ξ ′ ∣ ξ ′ ⟩ ⟨ ξ ′ ∣ = 1 \sum_{\xi'}|\xi'\rangle\langle\xi'|=1 ξ ′ ∑ ∣ ξ ′ ⟩ ⟨ ξ ′ ∣ = 1
如果特征值是连续 的,我们不能 normalize basic bra,我们会有:
⟨ ξ ′ ∣ ξ ′ ′ ⟩ = c ′ ( ξ ′ ) δ ( ξ ′ − ξ ′ ′ ) ⟨ ξ ′ ∣ ξ ′ ′ ⟩ = c ′ ′ ( ξ ′ ′ ) δ ( ξ ′ − ξ ′ ′ ) \begin{aligned}
\langle\xi'|\xi''\rangle &= c'(\xi')\delta(\xi'-\xi'')\\
\langle\xi'|\xi''\rangle &= c''(\xi'')\delta(\xi'-\xi'')
\end{aligned} ⟨ ξ ′ ∣ ξ ′ ′ ⟩ ⟨ ξ ′ ∣ ξ ′ ′ ⟩ = c ′ ( ξ ′ ) δ ( ξ ′ − ξ ′ ′ ) = c ′ ′ ( ξ ′ ′ ) δ ( ξ ′ − ξ ′ ′ )
因为 δ \delta δ 的特性,所以实际上这两个式子的右边是相等的。
我们接下来考虑一组新的 basic bra,他们和原来的只差一个系数,也就是:
⟨ ξ ′ ∗ ∣ = k ′ ⟨ ξ ′ ∣ , ∣ ξ ′ ∗ ⟩ = k ′ ‾ ∣ ξ ′ ⟩ \langle\xi'^*|=k'\langle\xi'|,\quad|\xi'^*\rangle=\overline{k'}|\xi'\rangle ⟨ ξ ′ ∗ ∣ = k ′ ⟨ ξ ′ ∣ , ∣ ξ ′ ∗ ⟩ = k ′ ∣ ξ ′ ⟩
这时我们有:
⟨ ξ ′ ∗ ∣ ξ ′ ′ ∗ ⟩ = k ′ k ′ ′ ‾ c δ ( ξ ′ − ξ ′ ′ ) \langle\xi'^*|\xi''^*\rangle = k'\overline{k''}c\delta(\xi'-\xi'') ⟨ ξ ′ ∗ ∣ ξ ′ ′ ∗ ⟩ = k ′ k ′ ′ c δ ( ξ ′ − ξ ′ ′ )
由 δ \delta δ 的形式,我们可以在式子中将 k ′ ′ k'' k ′ ′ 替换为 k ′ k' k ′ 。
如果我们取 ∣ ∣ k ’ ∣ ∣ = c ′ − 1 ||k’||=c'^{-1} ∣ ∣ k ’ ∣ ∣ = c ′ − 1 ,也就是适当地调整长度,就可以有简化版的表达形式:
⟨ ξ ′ ∗ ∣ ξ ′ ′ ∗ ⟩ = δ ( ξ ′ − ξ ′ ′ ) \langle\xi'^*|\xi''^*\rangle = \delta(\xi'-\xi'') ⟨ ξ ′ ∗ ∣ ξ ′ ′ ∗ ⟩ = δ ( ξ ′ − ξ ′ ′ )
类似于离散的情况,我们有:
∫ ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ = 1 \int|\xi'\rangle d\xi'\langle\xi'|=1 ∫ ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ = 1
综合起来 ,我们可以有(这里的推导我没太细看...):
∑ ξ r ∣ ξ r ⟩ ⟨ ξ r ∣ + ∫ ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ = 1 \sum_{\xi^r}|\xi^r\rangle\langle\xi^r| + \int|\xi'\rangle d\xi'\langle\xi'|=1 ξ r ∑ ∣ ξ r ⟩ ⟨ ξ r ∣ + ∫ ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ = 1
这也就意味着任意 ∣ P ⟩ |P\rangle ∣ P ⟩ 可以表示为:
∣ P ⟩ = ∑ ξ r ∣ ξ r ⟩ ⟨ ξ r ∣ P ⟩ + ∫ ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ P ⟩ |P\rangle =\sum_{\xi^r}|\xi^r\rangle\langle\xi^r|P\rangle + \int|\xi'\rangle d\xi'\langle\xi'|P\rangle ∣ P ⟩ = ξ r ∑ ∣ ξ r ⟩ ⟨ ξ r ∣ P ⟩ + ∫ ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ P ⟩
且 ⟨ Q ∣ P ⟩ \langle Q|P\rangle ⟨ Q ∣ P ⟩ 为:
⟨ Q ∣ P ⟩ = ∑ ξ r ⟨ Q ∣ ξ r ⟩ ⟨ ξ r ∣ P ⟩ + ∫ ⟨ Q ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ P ⟩ \langle Q|P\rangle =\sum_{\xi^r}\langle Q|\xi^r\rangle\langle\xi^r|P\rangle + \int\langle Q|\xi'\rangle d\xi'\langle\xi'|P\rangle ⟨ Q ∣ P ⟩ = ξ r ∑ ⟨ Q ∣ ξ r ⟩ ⟨ ξ r ∣ P ⟩ + ∫ ⟨ Q ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ P ⟩
也就是可以用 representative 的 scalar product 表达 ket 与 bra 的 scalar product。
我们继续考虑有一组 commuting observables ξ 1 , ξ 2 , . . . , ξ u \xi_1,\xi_2,...,\xi_u ξ 1 , ξ 2 , . . . , ξ u 组成了 complete commuting set。他们组成的 orthogonal representation 将是 ⟨ ξ 1 ′ . . . ξ u ′ ∣ \langle \xi'_1...\xi'_u| ⟨ ξ 1 ′ . . . ξ u ′ ∣ ,∣ ξ 1 ′ . . . ξ u ′ ⟩ |\xi'_1...\xi'_u\rangle ∣ ξ 1 ′ . . . ξ u ′ ⟩ 。我们进一步假设其中的 ξ 1 , ξ 2 , . . . , ξ v \xi_1,\xi_2,...,\xi_v ξ 1 , ξ 2 , . . . , ξ v 的特征值是离散的,ξ v + u , . . . , ξ u \xi_{v+u},...,\xi_u ξ v + u , . . . , ξ u 的特征值是连续的。
大致推导一下,我们可以有:
⟨ ξ 1 ′ . . . ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ = δ ξ 1 ′ ξ 1 ′ ′ . . δ ξ v ′ ξ v ′ ′ δ ( ξ v + 1 ′ − ξ v + 1 ′ ′ ) . . δ ( ξ u ′ − ξ u ′ ′ ) \langle \xi'_1...\xi'_u|\xi''_1...\xi''_u\rangle=\delta_{\xi'_1\xi''_1}..\delta_{\xi'_v\xi''_v}\delta(\xi'_{v+1}-\xi''_{v+1})..\delta(\xi'_u-\xi''_u) ⟨ ξ 1 ′ . . . ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ = δ ξ 1 ′ ξ 1 ′ ′ . . δ ξ v ′ ξ v ′ ′ δ ( ξ v + 1 ′ − ξ v + 1 ′ ′ ) . . δ ( ξ u ′ − ξ u ′ ′ )
同样,有这样的推广结果:
∑ ξ 1 ′ . . ξ v ′ ∫ . . ∫ ∣ ξ 1 ′ . . . ξ u ′ ⟩ d ξ v + 1 ′ . . d ξ u ′ ⟨ ξ 1 ′ . . . ξ u ′ ∣ = 1 \sum_{\xi'_1..\xi'_v}\int..\int|\xi'_1...\xi'_u\rangle d\xi'_{v+1}..d\xi'_u\langle \xi'_1...\xi'_u|=1 ξ 1 ′ . . ξ v ′ ∑ ∫ . . ∫ ∣ ξ 1 ′ . . . ξ u ′ ⟩ d ξ v + 1 ′ . . d ξ u ′ ⟨ ξ 1 ′ . . . ξ u ′ ∣ = 1
在一些特殊情况下,我们会把上面的两个式子调整为:
⟨ ξ 1 ′ . . . ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ = ρ ′ − 1 δ ξ 1 ′ ξ 1 ′ ′ . . δ ξ v ′ ξ v ′ ′ δ ( ξ v + 1 ′ − ξ v + 1 ′ ′ ) . . δ ( ξ u ′ − ξ u ′ ′ ) ∑ ξ 1 ′ . . ξ v ′ ∫ . . ∫ ∣ ξ 1 ′ . . . ξ u ′ ⟩ ρ ′ d ξ v + 1 ′ . . d ξ u ′ ⟨ ξ 1 ′ . . . ξ u ′ ∣ = 1 \begin{aligned}
&\langle \xi'_1...\xi'_u|\xi''_1...\xi''_u\rangle=\rho'^-1\delta_{\xi'_1\xi''_1}..\delta_{\xi'_v\xi''_v}\delta(\xi'_{v+1}-\xi''_{v+1})..\delta(\xi'_u-\xi''_u)\\
&\sum_{\xi'_1..\xi'_v}\int..\int|\xi'_1...\xi'_u\rangle\rho' d\xi'_{v+1}..d\xi'_u\langle \xi'_1...\xi'_u|=1
\end{aligned} ⟨ ξ 1 ′ . . . ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ = ρ ′ − 1 δ ξ 1 ′ ξ 1 ′ ′ . . δ ξ v ′ ξ v ′ ′ δ ( ξ v + 1 ′ − ξ v + 1 ′ ′ ) . . δ ( ξ u ′ − ξ u ′ ′ ) ξ 1 ′ . . ξ v ′ ∑ ∫ . . ∫ ∣ ξ 1 ′ . . . ξ u ′ ⟩ ρ ′ d ξ v + 1 ′ . . d ξ u ′ ⟨ ξ 1 ′ . . . ξ u ′ ∣ = 1
例如在极坐标的情况下,可以去 ρ ′ = sin θ ′ \rho'=\sin{\theta'} ρ ′ = sin θ ′ ,来把积分项变成 sin θ ′ d ϕ ′ d θ ′ d r \sin{\theta'}d\phi'd\theta'dr sin θ ′ d ϕ ′ d θ ′ d r 。
3.17 The representation of linear operator
我们接下来考虑 linear operator。还是先考虑一个 ξ \xi ξ 组成一组 compute commuting set 的情况。同时进一步考虑只有离散 的特征值。那么 ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ⟩ \langle \xi'|\alpha|\xi''\rangle ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ⟩ 的值就定义了 α \alpha α 。所以我们可以用这样的矩阵形式表示:
[ ⟨ ξ 1 ∣ α ∣ ξ 1 ⟩ ⟨ ξ 1 ∣ α ∣ ξ 2 ⟩ ⟨ ξ 1 ∣ α ∣ ξ 3 ⟩ . . ⟨ ξ 2 ∣ α ∣ ξ 1 ⟩ ⟨ ξ 2 ∣ α ∣ ξ 2 ⟩ ⟨ ξ 2 ∣ α ∣ ξ 3 ⟩ . . ⟨ ξ 3 ∣ α ∣ ξ 1 ⟩ ⟨ ξ 3 ∣ α ∣ ξ 2 ⟩ ⟨ ξ 3 ∣ α ∣ ξ 3 ⟩ . . . . . . . . . . . . . . . . . . . . . . . . ] \begin{bmatrix}
\langle\xi^1|\alpha|\xi^1\rangle & \langle\xi^1|\alpha|\xi^2\rangle & \langle\xi^1|\alpha|\xi^3\rangle & . & .\\
\langle\xi^2|\alpha|\xi^1\rangle & \langle\xi^2|\alpha|\xi^2\rangle & \langle\xi^2|\alpha|\xi^3\rangle & . & .\\
\langle\xi^3|\alpha|\xi^1\rangle & \langle\xi^3|\alpha|\xi^2\rangle & \langle\xi^3|\alpha|\xi^3\rangle & . & .\\
...&...&...&.&.\\
...&...&...&.&.
\end{bmatrix} ⎣ ⎢ ⎢ ⎢ ⎢ ⎡ ⟨ ξ 1 ∣ α ∣ ξ 1 ⟩ ⟨ ξ 2 ∣ α ∣ ξ 1 ⟩ ⟨ ξ 3 ∣ α ∣ ξ 1 ⟩ . . . . . . ⟨ ξ 1 ∣ α ∣ ξ 2 ⟩ ⟨ ξ 2 ∣ α ∣ ξ 2 ⟩ ⟨ ξ 3 ∣ α ∣ ξ 2 ⟩ . . . . . . ⟨ ξ 1 ∣ α ∣ ξ 3 ⟩ ⟨ ξ 2 ∣ α ∣ ξ 3 ⟩ ⟨ ξ 3 ∣ α ∣ ξ 3 ⟩ . . . . . . . . . . . . . . . . ⎦ ⎥ ⎥ ⎥ ⎥ ⎤
其中 ξ 1 , ξ 2 , ξ 3 , . . . \xi_1,\xi_2,\xi_3,... ξ 1 , ξ 2 , ξ 3 , . . . 是特征值。如果 α \alpha α 是实的,我们有:
⟨ ξ ′ ∣ α ∣ ξ ′ ′ ⟩ = ⟨ ξ ′ ′ ∣ α ∣ ξ ′ ⟩ \langle\xi' | \alpha | \xi''\rangle=\langle\xi''|\alpha|\xi'\rangle ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ⟩ = ⟨ ξ ′ ′ ∣ α ∣ ξ ′ ⟩
对应上面的矩阵就是对角元素为实,和对角线对称的元素互为共轭。这种矩阵我们称之为 Hermitian matrix。
如果 α = ξ \alpha=\xi α = ξ ,或者更一般地,α = f ( ξ ) \alpha=f(\xi) α = f ( ξ ) 矩阵就成了对角矩阵,矩阵的每个元素的值为 f ( ξ ′ ) δ ξ ′ ξ ′ ′ f(\xi')\delta_{\xi'\xi''} f ( ξ ′ ) δ ξ ′ ξ ′ ′ 。
由上一节的结论,我们有:
⟨ ξ ′ ∣ α β ∣ ξ ′ ′ ⟩ = ⟨ ξ ′ ∣ α ∑ ξ ′ ′ ′ ∣ ξ ′ ′ ′ ⟩ ⟨ ξ ′ ′ ′ ∣ β ∣ ξ ′ ′ ⟩ = ∑ ξ ′ ′ ′ ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ′ ⟩ ⟨ ξ ′ ′ ′ ∣ β ∣ ξ ′ ′ ⟩ \begin{aligned}
\langle\xi'|\alpha\beta|\xi''\rangle&=\langle\xi'|\alpha\sum_{\xi'''}{|\xi'''\rangle\langle\xi'''|\beta|\xi''\rangle}\\
&=\sum_{\xi'''}{\langle\xi'|\alpha|\xi'''\rangle\langle\xi'''|\beta|\xi''\rangle}
\end{aligned} ⟨ ξ ′ ∣ α β ∣ ξ ′ ′ ⟩ = ⟨ ξ ′ ∣ α ξ ′ ′ ′ ∑ ∣ ξ ′ ′ ′ ⟩ ⟨ ξ ′ ′ ′ ∣ β ∣ ξ ′ ′ ⟩ = ξ ′ ′ ′ ∑ ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ′ ⟩ ⟨ ξ ′ ′ ′ ∣ β ∣ ξ ′ ′ ⟩
所以线性算子的乘积等于对应的矩阵乘积。
总结一下,当只有一个 ξ \xi ξ 且特征值离散 的时候,有:
任何线性算子都可以用一个矩阵表示;
unit operator 对应了 unit matrix;
real linear operator 对应了Hermitian matrix;
ξ \xi ξ 和 f ( ξ ) f(\xi) f ( ξ ) 对应对角矩阵;
2 个 linear operator 的乘积对应他们各自对应的矩阵的乘积
考虑连续特征值 时,α \alpha α 的 representative 是 ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ⟩ \langle\xi'|\alpha|\xi''\rangle ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ⟩ ,我们可以称这样对应的为广义的 matrix。我们会发现,上面的 5 项也都成立(这里的证明我没细看,但是直观感觉是比较明显的)。具体来说,公式上,有:
⟨ ξ ′ ∣ f ( ξ ) ∣ ξ ′ ′ ⟩ = f ( ξ ′ ) δ ( ξ ′ − ξ ′ ′ ) ⟨ ξ ′ ∣ α β ∣ ξ ′ ′ ⟩ = ∫ ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ′ ⟩ d ξ ′ ′ ′ ⟨ ξ ′ ′ ′ ∣ β ∣ ξ ′ ′ ⟩ \begin{aligned}
\langle\xi'|f(\xi)|\xi''\rangle&=f(\xi')\delta(\xi'-\xi'')\\
\langle\xi'|\alpha\beta|\xi''\rangle&=\int\langle\xi'|\alpha|\xi'''\rangle d\xi''' \langle\xi'''|\beta|\xi''\rangle
\end{aligned} ⟨ ξ ′ ∣ f ( ξ ) ∣ ξ ′ ′ ⟩ ⟨ ξ ′ ∣ α β ∣ ξ ′ ′ ⟩ = f ( ξ ′ ) δ ( ξ ′ − ξ ′ ′ ) = ∫ ⟨ ξ ′ ∣ α ∣ ξ ′ ′ ′ ⟩ d ξ ′ ′ ′ ⟨ ξ ′ ′ ′ ∣ β ∣ ξ ′ ′ ⟩
上面的第二个式子定义了广义的矩阵乘。
不过在定义广义的对角矩阵的时候,我们希望保持广义的对角矩阵能和其他的对角矩阵相互 commute。因此我们限定对角矩阵满足
⟨ ξ ′ ∣ w ∣ ξ ′ ′ ⟩ = c ′ ( ξ ′ ) δ ( ξ ′ − ξ ′ ′ ) \langle\xi'|w|\xi''\rangle=c'(\xi')\delta(\xi'-\xi'') ⟨ ξ ′ ∣ w ∣ ξ ′ ′ ⟩ = c ′ ( ξ ′ ) δ ( ξ ′ − ξ ′ ′ )
同时有离散和连续特征值的情况可以简单地推广,这里就不展开了。
那么对于有 ξ 1 , ξ 2 , . . . , ξ u \xi_1,\xi_2,...,\xi_u ξ 1 , ξ 2 , . . . , ξ u 的情况,α \alpha α 的 representative 仍然可以看作一个 matrix。其中不同行对应了不同的 ξ 1 ′ , . . . , ξ u ′ \xi'_1,...,\xi'_u ξ 1 ′ , . . . , ξ u ′ ,不同列对应了不同 ξ 1 ′ ′ , . . . , ξ u ′ ′ \xi''_1,...,\xi''_u ξ 1 ′ ′ , . . . , ξ u ′ ′ ,我们可以类似的定义以满足上面的 5 条规则,不过其中第 4 条要转为:
任何 ξ m ( m = 1 , 2 , . . . , u ) \xi_m\ (m=1,2,...,u) ξ m ( m = 1 , 2 , . . . , u ) 或他们的函数都可以被表示为一个对角矩阵。
此时的对角矩阵定义为:
⟨ ξ 1 ′ . . . ξ u ′ ∣ w ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ = c ′ δ ξ 1 ′ ξ 1 ′ ′ . . δ ξ v ′ ξ v ′ ′ δ ( ξ v + 1 ′ − ξ v + 1 ′ ′ ) . . δ ( ξ u ′ − ξ u ′ ′ ) \langle\xi'_1...\xi'_u|w|\xi''_1...\xi''_u\rangle=c'\delta_{\xi_1'\xi_1''}..\delta_{\xi'_v\xi''_v}\delta(\xi'_{v+1}-\xi''_{v+1})..\delta(\xi'_{u}-\xi''_{u}) ⟨ ξ 1 ′ . . . ξ u ′ ∣ w ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ = c ′ δ ξ 1 ′ ξ 1 ′ ′ . . δ ξ v ′ ξ v ′ ′ δ ( ξ v + 1 ′ − ξ v + 1 ′ ′ ) . . δ ( ξ u ′ − ξ u ′ ′ )
伴随着比较 trivial 的 linear operator 的相加对应了他们对应的矩阵之和,我们有 linear operator 和矩阵由相同的 algebraic relation。
我们可以进一步延伸,将 ket 表示为一个单列的矩阵,其中每行的元素为 ⟨ ξ 1 ′ . . . ξ u ′ ∣ P ⟩ \langle\xi'_1...\xi'_u|P\rangle ⟨ ξ 1 ′ . . . ξ u ′ ∣ P ⟩ ,bra 则是单行,每列的元素为 ⟨ Q ∣ ξ 1 ′ . . . ξ u ′ ⟩ \langle Q|\xi'_1...\xi'_u\rangle ⟨ Q ∣ ξ 1 ′ . . . ξ u ′ ⟩ 。注意这种定义顺便还给了 ∣ P ⟩ ⟨ Q ∣ |P\rangle\langle Q| ∣ P ⟩ ⟨ Q ∣ 的矩阵定义。
3.18 Probability amplitudes
由 13 节的结论,我们有:
P ξ 1 ′ . . . ξ u ′ = ⟨ x ∣ δ ξ 1 ξ 1 ′ . . . δ ξ u ξ u ′ ∣ x ⟩ P_{\xi'_1...\xi'_u}=\langle x|\delta_{\xi_1\xi'_1}...\delta_{\xi_u\xi'_u}|x\rangle P ξ 1 ′ . . . ξ u ′ = ⟨ x ∣ δ ξ 1 ξ 1 ′ . . . δ ξ u ξ u ′ ∣ x ⟩
如果 ξ \xi ξ 只有离散 特征值,那么我们有:
P ξ 1 ′ . . . ξ u ′ = ∑ ξ 1 ′ ′ . . . ξ u ′ ′ ⟨ x ∣ δ ξ 1 ξ 1 ′ . . . δ ξ u ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ ⟨ ξ 1 ′ ′ . . . ξ u ′ ′ ∣ x ⟩ = ∑ ξ 1 ′ ′ . . . ξ u ′ ′ ⟨ x ∣ δ ξ 1 ′ ′ ξ 1 ′ . . . δ ξ u ′ ′ ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ ⟨ ξ 1 ′ ′ . . . ξ u ′ ′ ∣ x ⟩ = ⟨ x ∣ ξ 1 ′ . . . ξ u ′ ⟩ ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ = ∣ ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ ∣ 2 \begin{aligned}
P_{\xi'_1...\xi'_u}&=\sum_{\xi''_1...\xi''_u}\langle x|\delta_{\xi_1\xi'_1}...\delta_{\xi_u\xi'_u}|\xi''_1...\xi''_u\rangle \langle \xi''_1...\xi''_u|x\rangle\\
&=\sum_{\xi''_1...\xi''_u}\langle x|\delta_{\xi_1''\xi'_1}...\delta_{\xi_u''\xi'_u}|\xi''_1...\xi''_u\rangle \langle \xi''_1...\xi''_u|x\rangle\\
&=\langle x|\xi'_1...\xi'_u\rangle\langle\xi'_1...\xi'_u|x\rangle\\
&=|\langle\xi'_1...\xi'_u|x\rangle|^2
\end{aligned} P ξ 1 ′ . . . ξ u ′ = ξ 1 ′ ′ . . . ξ u ′ ′ ∑ ⟨ x ∣ δ ξ 1 ξ 1 ′ . . . δ ξ u ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ ⟨ ξ 1 ′ ′ . . . ξ u ′ ′ ∣ x ⟩ = ξ 1 ′ ′ . . . ξ u ′ ′ ∑ ⟨ x ∣ δ ξ 1 ′ ′ ξ 1 ′ . . . δ ξ u ′ ′ ξ u ′ ∣ ξ 1 ′ ′ . . . ξ u ′ ′ ⟩ ⟨ ξ 1 ′ ′ . . . ξ u ′ ′ ∣ x ⟩ = ⟨ x ∣ ξ 1 ′ . . . ξ u ′ ⟩ ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ = ∣ ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ ∣ 2
所以概率即为平方和。
对于部分离散部分连续 特征值的情况,我们则有:
P ξ 1 ′ . . . ξ u ′ d ξ v + 1 ′ . . d ξ u ′ = ∣ ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ ∣ 2 d ξ v + 1 ′ . . d ξ u ′ P_{\xi'_1...\xi'_u}d\xi'_{v+1}..d\xi'_u=|\langle\xi'_1...\xi'_u|x\rangle|^2d\xi'_{v+1}..d\xi'_u P ξ 1 ′ . . . ξ u ′ d ξ v + 1 ′ . . d ξ u ′ = ∣ ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ ∣ 2 d ξ v + 1 ′ . . d ξ u ′
因此,我们可以称一个 normalized ket 或 bra 的 prepresentative 为 probability amplitudes,它的 square of modulus 为对应的概率或概率密度。当 ∣ x ⟩ |x\rangle ∣ x ⟩ 不能被 normalize 时,因为合起来会发散,我们称 ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ \langle\xi'_1...\xi'_u|x\rangle ⟨ ξ 1 ′ . . . ξ u ′ ∣ x ⟩ 为 relative probablity amplitutdes。
上面的概率等式只有在 basic vector 是 ξ \xi ξ 们的 simultaneous eigenvector 的时候才成立。这个时候所有的 ξ \xi ξ 都是对角矩阵(这个条件是当且仅当的)。所以我们可以称这种情况为 ξ \xi ξ diagnoal in the representation 。
在实践中,
我们会希望要考虑的 observable 是 diagonal 的,因为这样可以算概率,数学上也简单些;
我们会注意到他们相互 commute;
我么你之后会发现他们可以组成 a complete commuting set(不过不够的话我们可以添加一些使得其 complete);
我们用这个 complete commuting set 来构造 orthogonal representation。
这样定义的 representation 除去一个 phase factor(e i γ e^{i\gamma} e i γ ,因为 phase factor 的长度为 1)之外被确定下来了,因为大多是情况下 phase factor 都无所谓,所以我们可以认为 representation 被 diagonal observables 完全确定下来了。另一方面,我们本来就是用 diagonal observables 来表示的 basic vectors,所以也就呼应上了。
我们可能会对同一个动力学系统中的 2 个不同的 representation 感兴趣。我们会有这样的转换方程:
⟨ η 1 ′ . . . η w ′ ∣ P ⟩ = ∑ ξ 1 ′ . . ξ v ′ ∫ . . ∫ ⟨ η 1 ′ . . . η w ′ ∣ ξ 1 ′ . . ξ u ′ ⟩ d ξ v + 1 ′ . . d ξ u ′ ⟨ ξ 1 ′ . . ξ u ′ ∣ P ⟩ ⟨ ξ 1 ′ . . . ξ u ′ ∣ P ⟩ = ∑ η 1 ′ . . η x ′ ∫ . . ∫ ⟨ ξ 1 ′ . . . ξ u ′ ∣ η 1 ′ . . η w ′ ⟩ d η x + 1 ′ . . d η w ′ ⟨ η 1 ′ . . η w ′ ∣ P ⟩ \begin{aligned}
\langle\eta'_1...\eta'_w|P\rangle&=\sum_{\xi'_1..\xi'_v}\int..\int\langle\eta'_1...\eta'_w|\xi'_1..\xi'_u\rangle d\xi'_{v+1}..d\xi'_u\langle\xi'_1..\xi'_u|P\rangle\\
\langle\xi'_1...\xi'_u|P\rangle&=\sum_{\eta'_1..\eta'_x}\int..\int\langle\xi'_1...\xi'_u|\eta'_1..\eta'_w\rangle d\eta'_{x+1}..d\eta'_w\langle\eta'_1..\eta'_w|P\rangle
\end{aligned} ⟨ η 1 ′ . . . η w ′ ∣ P ⟩ ⟨ ξ 1 ′ . . . ξ u ′ ∣ P ⟩ = ξ 1 ′ . . ξ v ′ ∑ ∫ . . ∫ ⟨ η 1 ′ . . . η w ′ ∣ ξ 1 ′ . . ξ u ′ ⟩ d ξ v + 1 ′ . . d ξ u ′ ⟨ ξ 1 ′ . . ξ u ′ ∣ P ⟩ = η 1 ′ . . η x ′ ∑ ∫ . . ∫ ⟨ ξ 1 ′ . . . ξ u ′ ∣ η 1 ′ . . η w ′ ⟩ d η x + 1 ′ . . d η w ′ ⟨ η 1 ′ . . η w ′ ∣ P ⟩
也就是我们只需要 ⟨ η 1 ′ . . . η w ′ ∣ ξ 1 ′ . . ξ u ′ ⟩ , ⟨ ξ 1 ′ . . . ξ u ′ ∣ η 1 ′ . . η w ′ ⟩ \langle\eta'_1...\eta'_w|\xi'_1..\xi'_u\rangle,\langle\xi'_1...\xi'_u|\eta'_1..\eta'_w\rangle ⟨ η 1 ′ . . . η w ′ ∣ ξ 1 ′ . . ξ u ′ ⟩ , ⟨ ξ 1 ′ . . . ξ u ′ ∣ η 1 ′ . . η w ′ ⟩ 这些系数就可以进行转换了,我们称这些量为 transformation functions 。
(这一节最后有一个关于变换的非平凡的结论)
3.19 Theorems about functions of observables
定理 :一个和 observable ξ \xi ξ commute 的 linear operator w w w 也和 ξ \xi ξ 的任何函数 commute
因为我们有:
ξ w − w ξ = 0 \xi w-w\xi=0 ξ w − w ξ = 0
考虑一个让 ξ \xi ξ diagonal 的 representation。如果 ξ \xi ξ 自己不能构成 a complete commuting set,那么我们需要增加一些 observable,我们称这些增加的 observable 为 β \beta β 。那么上面的式子就变成了:
⟨ ξ ′ β ′ ∣ ξ w − w ξ ∣ ξ ′ ′ β ′ ′ ⟩ = 0 \langle\xi'\beta'|\xi w-w\xi|\xi''\beta''\rangle=0 ⟨ ξ ′ β ′ ∣ ξ w − w ξ ∣ ξ ′ ′ β ′ ′ ⟩ = 0
即:
( ξ ′ − ξ ′ ′ ) ⟨ ξ ′ β ′ ∣ w ∣ ξ ′ ′ β ′ ′ ⟩ = 0 (\xi'-\xi'')\langle\xi'\beta'|w|\xi''\beta''\rangle=0 ( ξ ′ − ξ ′ ′ ) ⟨ ξ ′ β ′ ∣ w ∣ ξ ′ ′ β ′ ′ ⟩ = 0
也就是:
( ξ ′ − ξ ′ ′ ) ⟨ ξ ′ β ′ ∣ w ∣ ξ ′ ′ β ′ ′ ⟩ = 0 (\xi'-\xi'')\langle\xi'\beta'|w|\xi''\beta''\rangle=0 ( ξ ′ − ξ ′ ′ ) ⟨ ξ ′ β ′ ∣ w ∣ ξ ′ ′ β ′ ′ ⟩ = 0
对应到不管是连续特征值还是离散特征值的定义,我们都可以得到 w w w 是 diagonal with repsect to ξ \xi ξ 。
从这个式子,我们也可以得到:
( f ( ξ ′ ) − f ( ξ ′ ′ ) ) ⟨ ξ ′ β ′ ∣ w ∣ ξ ′ ′ β ′ ′ ⟩ = 0 (f(\xi')-f(\xi''))\langle\xi'\beta'|w|\xi''\beta''\rangle=0 ( f ( ξ ′ ) − f ( ξ ′ ′ ) ) ⟨ ξ ′ β ′ ∣ w ∣ ξ ′ ′ β ′ ′ ⟩ = 0
反着推,就有 f ( ξ ) w − w f ( ξ ) = 0 f(\xi)w-wf(\xi)=0 f ( ξ ) w − w f ( ξ ) = 0 ,证毕。
从物理上考虑,这也是非常合理的,因为如果 2 个 observation compatible。那么因为我们可以同时计算出他们两个的函数的值,所以他们的函数的值也应该是和他俩 compatible 的。
定理 :一个和 complete set of commuting observable commutes 的 linear operator 一定是这些 observable 的函数。
可以用 w w w 的 diagonal element 来构造这个函数(作为这个函数的定义)。
定理 :如果任意和 observable ξ \xi ξ commute 的 linear operator 都和 linear operator g g g commute,那么 g g g 是 ξ \xi ξ 的函数。
定理一和定理三在我们把 ξ \xi ξ 换成一组 commuting observable ξ 1 , ξ 2 , . . . , ξ r \xi_1,\xi_2,...,\xi_r ξ 1 , ξ 2 , . . . , ξ r 时也成立。
3.20 Developments in notation
上述的 representation 中任意 ket ∣ P ⟩ |P\rangle ∣ P ⟩ 都可以用一组 complete commuting set of observables ξ 1 , . . . , ξ u \xi_1,...,\xi_u ξ 1 , . . . , ξ u 表示为 ⟨ ξ 1 ′ . . . ξ u ′ ∣ P ⟩ \langle\xi'_1...\xi'_u|P\rangle ⟨ ξ 1 ′ . . . ξ u ′ ∣ P ⟩ ,或者我们简写为 ⟨ ξ ′ ∣ P ⟩ \langle\xi'|P\rangle ⟨ ξ ′ ∣ P ⟩ 。这个 representative 是 ξ ′ \xi' ξ ′ 的函数,我们称为 ψ ( ξ ′ ) \psi(\xi') ψ ( ξ ′ ) 。我们就有 ψ \psi ψ 完全定义了 ∣ P ⟩ |P\rangle ∣ P ⟩ 。所以我们既可以直接用 ψ \psi ψ 来标记 ∣ P ⟩ |P\rangle ∣ P ⟩ ,也就是:
⟨ ξ ′ ∣ P ⟩ = ψ ( ξ ′ ) ∣ P ⟩ = ∣ ψ ( ξ ) ⟩ \begin{aligned}
\langle\xi'|P\rangle&=\psi(\xi')\\
|P\rangle&=|\psi(\xi)\rangle
\end{aligned} ⟨ ξ ′ ∣ P ⟩ ∣ P ⟩ = ψ ( ξ ′ ) = ∣ ψ ( ξ ) ⟩
进一步我们有:
⟨ ξ ′ ∣ f ( ξ ) ∣ P ⟩ = f ( ξ ′ ) ⟨ ξ ′ ∣ P ⟩ = f ( ξ ′ ) ψ ( ξ ′ ) \langle\xi'|f(\xi)|P\rangle=f(\xi')\langle\xi'|P\rangle=f(\xi')\psi(\xi') ⟨ ξ ′ ∣ f ( ξ ) ∣ P ⟩ = f ( ξ ′ ) ⟨ ξ ′ ∣ P ⟩ = f ( ξ ′ ) ψ ( ξ ′ )
根据上面的定义,也就得到了:
f ( ξ ) ∣ P ⟩ = ∣ f ( ξ ) ψ ( ξ ) ⟩ f ( ξ ) ∣ ψ ( ξ ′ ) ⟩ = ∣ f ( ξ ) ψ ( ξ ) ⟩ \begin{aligned}
f(\xi)|P\rangle&=|f(\xi)\psi(\xi)\rangle\\
f(\xi)|\psi(\xi')\rangle&=|f(\xi)\psi(\xi)\rangle
\end{aligned} f ( ξ ) ∣ P ⟩ f ( ξ ) ∣ ψ ( ξ ′ ) ⟩ = ∣ f ( ξ ) ψ ( ξ ) ⟩ = ∣ f ( ξ ) ψ ( ξ ) ⟩
也就是对于这种新的表达方式,那个竖线在哪里都一样,也就不需要加这个竖线了。所以我们有:
∣ P ⟩ = ψ ( ξ ) ⟩ |P\rangle=\psi(\xi)\rangle ∣ P ⟩ = ψ ( ξ ) ⟩
还可以进一步缩减为 ψ ⟩ \psi\rangle ψ ⟩ 。
我们可以认为 ψ ( ξ ) ⟩ \psi(\xi)\rangle ψ ( ξ ) ⟩ 是 ψ ( ξ ) \psi(\xi) ψ ( ξ ) 乘一个 standard ket ⟩ \rangle ⟩ ,所以任何 ket 都可以被当成是一个 ξ \xi ξ 的函数乘 standard ket。例如 basic ket ∣ ξ ′ ′ ⟩ |\xi''\rangle ∣ ξ ′ ′ ⟩ 就可以表达为:
∣ ξ ′ ′ ⟩ = δ ξ 1 ξ 1 ′ ′ . . δ ξ v ξ v ′ ′ δ ( ξ v + 1 − ξ v + 1 ′ ′ ) . . δ ( ξ u − ξ u ′ ′ ) |\xi''\rangle=\delta_{\xi_1\xi''_1}..\delta_{\xi_v\xi''_v}\delta(\xi_{v+1}-\xi''_{v+1})..\delta(\xi_u-\xi''_u) ∣ ξ ′ ′ ⟩ = δ ξ 1 ξ 1 ′ ′ . . δ ξ v ξ v ′ ′ δ ( ξ v + 1 − ξ v + 1 ′ ′ ) . . δ ( ξ u − ξ u ′ ′ )
standard ket 可以理解为 ψ = 1 \psi=1 ψ = 1 。
我们可以进一步收缩 ket 的表达形式为 ψ ( ξ ) \psi(\xi) ψ ( ξ ) ,这样的表达形式称为波函数(wave function) 。所以在使用波函数的时候,要注意其实右边是有一个 standard ket 的,所以不能在右侧乘 operator 。也因为波函数是 ket 的 representative,所以他的 square of modulus 会得到概率。
我们可以用类似的方式来表示 bra,例如用 ⟨ ϕ ( ξ ) ∣ \langle\phi(\xi)| ⟨ ϕ ( ξ ) ∣ 表示 ⟨ Q ∣ \langle Q| ⟨ Q ∣ 。在这种表示方法下,∣ ψ ( ξ ) ⟩ |\psi(\xi)\rangle ∣ ψ ( ξ ) ⟩ 的 conjugate imaginary 是 ⟨ ψ ˉ ( ξ ) \langle\bar{\psi}(\xi) ⟨ ψ ˉ ( ξ ) 。同样,我们可以把表达形式缩减为 ⟨ ϕ ( ξ ) \langle\phi(\xi) ⟨ ϕ ( ξ ) ,并定义 standard bra ⟨ \langle ⟨ 。standard bra 是 standard ket 的 conjugate imaginary。进一步,我们也可以仅用 ϕ ( ξ ) \phi(\xi) ϕ ( ξ ) 表示 bra,对应 the conjugate imaginary aof a wave function,只能在右边乘 operator。
我们还可以构建出 ⟨ f ( ξ ) ⟩ \langle f(\xi)\rangle ⟨ f ( ξ ) ⟩ ,他是一个数,对应:
⟨ f ( ξ ) ⟩ = ∑ ξ 1 ′ . . ξ v ′ ∫ . . ∫ f ( ξ ′ ) d ξ v + 1 ′ . . d ξ u ′ \langle f(\xi)\rangle=\sum_{\xi'_1..\xi'_v}\int..\int f(\xi') d\xi'_{v+1}..d\xi'_u ⟨ f ( ξ ) ⟩ = ξ 1 ′ . . ξ v ′ ∑ ∫ . . ∫ f ( ξ ′ ) d ξ v + 1 ′ . . d ξ u ′
我们接下来讨论一下为啥需要扩展 notation 。假设有一个 dynamical system,用来表述它的 dynamical variable 可以被分为 A , B A,B A , B 2 个集合,其中 A A A 中任意的元素和 B B B 中任意元素 commute。我们接下来考虑一个只用 A A A 就能表示的 dynamical system,称为 A-system,以及一个只用 B B B 就能表示的,称为 B-system。那么原来的 dynamical system 可以被看做 A-system 和 B-system 的组合,且有如下的 mathematical scheme:
取 A-system 中的一个 ket ∣ A ⟩ |A\rangle ∣ A ⟩ 和 B-system 中的一个 ∣ B ⟩ |B\rangle ∣ B ⟩ ,我们定义一个满足交换律和分配率的乘法 ∣ a ⟩ ∣ b ⟩ |a\rangle|b\rangle ∣ a ⟩ ∣ b ⟩ ,即:
∣ a ⟩ ∣ b ⟩ = ∣ b ⟩ ∣ a ⟩ { c 1 ∣ a 1 ⟩ + c 2 ∣ a 2 ⟩ } ∣ b ⟩ = c 1 ∣ a 1 ⟩ ∣ b ⟩ + c 2 ∣ a 2 ⟩ ∣ b ⟩ ∣ a ⟩ { c 1 ∣ b 1 ⟩ + c 2 ∣ b 2 ⟩ } = c 1 ∣ a ⟩ ∣ b 1 ⟩ + c 2 ∣ a ⟩ ∣ b 2 ⟩ \begin{aligned}
|a\rangle|b\rangle&=|b\rangle|a\rangle\\
\{c_1|a_1\rangle+c_2|a_2\rangle\}|b\rangle&=c_1|a_1\rangle|b\rangle+c_2|a_2\rangle|b\rangle\\
|a\rangle\{c_1|b_1\rangle+c_2|b_2\rangle\}&=c_1|a\rangle|b_1\rangle+c_2|a\rangle|b_2\rangle
\end{aligned} ∣ a ⟩ ∣ b ⟩ { c 1 ∣ a 1 ⟩ + c 2 ∣ a 2 ⟩ } ∣ b ⟩ ∣ a ⟩ { c 1 ∣ b 1 ⟩ + c 2 ∣ b 2 ⟩ } = ∣ b ⟩ ∣ a ⟩ = c 1 ∣ a 1 ⟩ ∣ b ⟩ + c 2 ∣ a 2 ⟩ ∣ b ⟩ = c 1 ∣ a ⟩ ∣ b 1 ⟩ + c 2 ∣ a ⟩ ∣ b 2 ⟩
然后我么定义 A-variable 只会作用于 ∣ a ⟩ |a\rangle ∣ a ⟩ ,B-variable 只会作用于 ∣ b ⟩ |b\rangle ∣ b ⟩ ,这使得 A-variable 和 B-variable commute。
所以任何 dynamical variable 都可以作用于 ∣ a ⟩ ∣ b ⟩ |a\rangle|b\rangle ∣ a ⟩ ∣ b ⟩ ,那么我们可以把这个乘法看作是原来的系统的一个 ket,或者说:
∣ a ⟩ ∣ b ⟩ = ∣ b ⟩ ∣ a ⟩ = ∣ a b ⟩ |a\rangle|b\rangle=|b\rangle|a\rangle=|ab\rangle ∣ a ⟩ ∣ b ⟩ = ∣ b ⟩ ∣ a ⟩ = ∣ a b ⟩
我们继续取 A-system 中的 complete set of variable ξ A \xi_A ξ A 且为 diagonal,B-system 中的 ξ B \xi_B ξ B ,我们就分别对 A-system 和 B-system 有 basic bra ⟨ ξ A ′ ∣ \langle\xi'_A| ⟨ ξ A ′ ∣ 和 ⟨ ξ B ′ ∣ \langle\xi'_B| ⟨ ξ B ′ ∣ ,且乘积:
⟨ ξ A ′ ∣ ⟨ ξ B ′ ∣ = ⟨ ξ A ′ ξ B ′ ∣ \langle\xi'_A|\langle\xi'_B|=\langle\xi'_A\xi'_B| ⟨ ξ A ′ ∣ ⟨ ξ B ′ ∣ = ⟨ ξ A ′ ξ B ′ ∣
是原系统的 basic bra,其中 ξ a ′ , ξ B ′ \xi'_a,\xi'_B ξ a ′ , ξ B ′ 均为 diagonal。我们还有:
⟨ ξ A ′ ∣ a ⟩ ⟨ ξ B ′ ∣ b ⟩ = ⟨ ξ A ′ ξ B ′ ∣ a b ⟩ \langle\xi'_A|a\rangle\langle\xi'_B|b\rangle=\langle\xi'_A\xi'_B|ab\rangle ⟨ ξ A ′ ∣ a ⟩ ⟨ ξ B ′ ∣ b ⟩ = ⟨ ξ A ′ ξ B ′ ∣ a b ⟩
也就是 ∣ a b ⟩ |ab\rangle ∣ a b ⟩ 的 representative 的为 ∣ a ⟩ |a\rangle ∣ a ⟩ 和 ∣ b ⟩ |b\rangle ∣ b ⟩ 的 representative 的乘积。
我们可以定义 standard ket ⟩ A \rangle_A ⟩ A 和 ⟩ B \rangle_B ⟩ B ,分别对应了 representation ξ A \xi_A ξ A 和 ξ B \xi_B ξ B ,那么他们的乘积 ⟩ A ⟩ B \rangle_A\rangle_B ⟩ A ⟩ B 则是原系统的 standard ket,对应 representation ξ A \xi_A ξ A 和 ξ B \xi_B ξ B 。所以任意原系统的 ket 可以被表示为:
ψ ( ξ A ξ B ) ⟩ A ⟩ B \psi(\xi_A\xi_B)\rangle_A\rangle_B ψ ( ξ A ξ B ) ⟩ A ⟩ B
在一些情况下,我们可能不想定义 A-system 的 standard ket,这时我们可以将原系统的 ket 定义为 ∣ ξ B ⟩ ⟩ B |\xi_B\rangle\rangle_B ∣ ξ B ⟩ ⟩ B ,只要:
∣ ξ B ⟩ = ψ ( ξ A ξ B ) ⟩ A |\xi_B\rangle=\psi(\xi_A\xi_B)\rangle_A ∣ ξ B ⟩ = ψ ( ξ A ξ B ) ⟩ A
这样我们就可以把系统分解为 A-system 的 ∣ ξ B ⟩ |\xi_B\rangle ∣ ξ B ⟩ 和 B system 的 wave function ξ B \xi_B ξ B 。在 66 节中有这种 notation 的例子。
上述的表达方式可以进一步拓展,类似于定义:
∣ a ⟩ ∣ b ⟩ ∣ c ⟩ . . . = ∣ a b c . . . ⟩ |a\rangle|b\rangle|c\rangle...=|abc...\rangle ∣ a ⟩ ∣ b ⟩ ∣ c ⟩ . . . = ∣ a b c . . . ⟩
(这里我没太看懂。。。但是从侧面可以看出来一个系统是如何分解成 2 个相互不耦合的系统的)
4 The Quantum Conditions
4.21 Posisson brackets
我们接下来定义不满足交换律的算子之间的关系(ξ η − η ξ \xi\eta-\eta\xi ξ η − η ξ ),这种关系我们称为 quantum conditions ,或者 commutation relations。不同的动力学系统会有不同的 quantum conditions,不过很多情况下,我们会和经典场景进行类比来得到对应的结果。
在经典动力学理论中,有一个概念叫 Poisson Bracket(下称 P.B.),他是指:
[ u , v ] = ∑ r { ∂ u ∂ q r ∂ u ∂ p r − ∂ u ∂ p r ∂ v ∂ q r } [u,v]=\sum_r{\{\frac{\partial u}{\partial q_r}\frac{\partial u}{\partial p_r}-\frac{\partial u}{\partial p_r}\frac{\partial v}{\partial q_r}\}} [ u , v ] = r ∑ { ∂ q r ∂ u ∂ p r ∂ u − ∂ p r ∂ u ∂ q r ∂ v }
P.B 的特点是:
[ u , v ] = − [ v , u ] [ u , c ] = 0 [ u 1 + u 2 , v ] = [ u 1 , v ] + [ u 2 , v ] [ u , v 1 + v 2 ] = [ u , v 1 ] + [ u , v 2 ] [ u 1 u 2 , v ] = [ u 1 , v ] u 2 + u 1 [ u , v 2 ] [ u , v 1 v 2 ] = [ u , v 1 ] v 2 + v 1 [ u , v 2 ] [ u , [ v , w ] ] + [ v , [ w , u ] ] + [ w , [ u , v ] ] = 0 \begin{aligned}
{[u,v]}&=-[v,u]\\
[u,c]&=0\\
[u_1+u_2,v]&=[u_1,v]+[u_2,v]\\
[u,v_1+v_2]&=[u,v_1]+[u,v_2]\\
[u_1u_2,v]&=[u_1,v]u_2+u_1[u,v_2]\\
[u,v_1v_2]&=[u,v_1]v_2+v_1[u,v_2]\\
[u,[v,w]]+[v,[w,u]]+[w,[u,v]]&=0
\end{aligned} [ u , v ] [ u , c ] [ u 1 + u 2 , v ] [ u , v 1 + v 2 ] [ u 1 u 2 , v ] [ u , v 1 v 2 ] [ u , [ v , w ] ] + [ v , [ w , u ] ] + [ w , [ u , v ] ] = − [ v , u ] = 0 = [ u 1 , v ] + [ u 2 , v ] = [ u , v 1 ] + [ u , v 2 ] = [ u 1 , v ] u 2 + u 1 [ u , v 2 ] = [ u , v 1 ] v 2 + v 1 [ u , v 2 ] = 0
下面我们来尝试构建一个 quantum P.B.。我们希望 quantum P.B. 能有上面的这些性质。我们注意到:
[ u 1 u 2 , v 1 v 2 ] = [ u 1 , v 1 v 2 ] u 2 + u 1 [ u 2 , v 1 v 2 ] = [ u 1 , v 1 ] v 2 u 2 + v 1 [ u 1 , v 2 ] u 2 + u 1 [ u 2 , v 1 ] v 2 + u 1 v 1 [ u 2 , v 2 ] = [ u 1 u 2 , v 1 ] v 2 + v 1 [ u 1 u 2 , v 2 ] = [ u 1 , v 1 ] u 2 v 2 + u 1 [ u 2 , v 1 ] v 2 + v 1 [ u 1 , v 2 ] u 2 + v 1 u 1 [ u 2 , v 2 ] \begin{aligned}
{[u_1u_2,v_1v_2]}&=[u_1,v_1v_2]u_2+u_1[u_2,v_1v_2]\\
&=[u_1,v_1]v_2u_2+v_1[u_1,v_2]u_2+u_1[u_2,v_1]v_2+u_1v_1[u_2,v_2]\\
&=[u_1u_2,v_1]v_2+v_1[u_1u_2,v_2]\\
&=[u_1,v_1]u_2v_2+u_1[u_2,v_1]v_2+v_1[u_1,v_2]u_2+v_1u_1[u_2,v_2]
\end{aligned} [ u 1 u 2 , v 1 v 2 ] = [ u 1 , v 1 v 2 ] u 2 + u 1 [ u 2 , v 1 v 2 ] = [ u 1 , v 1 ] v 2 u 2 + v 1 [ u 1 , v 2 ] u 2 + u 1 [ u 2 , v 1 ] v 2 + u 1 v 1 [ u 2 , v 2 ] = [ u 1 u 2 , v 1 ] v 2 + v 1 [ u 1 u 2 , v 2 ] = [ u 1 , v 1 ] u 2 v 2 + u 1 [ u 2 , v 1 ] v 2 + v 1 [ u 1 , v 2 ] u 2 + v 1 u 1 [ u 2 , v 2 ]
也就是:
[ u 1 , v 1 ] ( u 2 v 2 − v 2 u 2 ) = ( u 1 v 1 − v 1 u 1 ) [ u 2 , v 2 ] [u_1,v_1](u_2v_2-v_2u_2)=(u_1v_1-v_1u_1)[u_2,v_2] [ u 1 , v 1 ] ( u 2 v 2 − v 2 u 2 ) = ( u 1 v 1 − v 1 u 1 ) [ u 2 , v 2 ]
由于上式对所有 u , v u,v u , v 都成立,所以有:
u 1 v 1 − v 1 u 1 = i ℏ [ u 1 , v 1 ] u 2 v 2 − v 2 u 2 = i ℏ [ u 2 , v 2 ] \begin{aligned}
u_1v_1-v_1u_1&=i\hbar[u_1,v_1]\\
u_2v_2-v_2u_2&=i\hbar[u_2,v_2]
\end{aligned} u 1 v 1 − v 1 u 1 u 2 v 2 − v 2 u 2 = i ℏ [ u 1 , v 1 ] = i ℏ [ u 2 , v 2 ]
这里 ℏ \hbar ℏ 明显是不依赖 u 1 , v 1 , u 2 , v 2 u_1,v_1,u_2,v_2 u 1 , v 1 , u 2 , v 2 的,所以他是个数。我们还希望 P.B. 是 real 的,加上第 8 节的结论,i ( ξ η − η ξ ) i(\xi\eta-\eta\xi) i ( ξ η − η ξ ) 是 real operator,所以 ℏ \hbar ℏ 是实数。这样我们就有了 quantum P.B. 的定义:
u v − v u = i ℏ [ u , v ] uv-vu=i\hbar[u,v] u v − v u = i ℏ [ u , v ]
为了让理论和实践匹配,我们取 ℏ = h / 2 π \hbar=h/2\pi ℏ = h / 2 π 。
那么下一步我们来考虑 quantum P.B. 的式子是啥。我们希望保证在简单情况下,量子 P.B. 的指和经典情况下相同,即:
[ q r , q s ] = 0 , [ p r , p s ] = 0 , [ q r , p s ] = δ r s [q_r,q_s]=0,[p_r,p_s]=0,[q_r,p_s]=\delta_{rs} [ q r , q s ] = 0 , [ p r , p s ] = 0 , [ q r , p s ] = δ r s
对应地也有:
q r q s − q s q r = 0 p r p s − p s p r = 0 q r p s − p s q r = i ℏ δ r s \begin{aligned}
q_rq_s-q_sq_r&=0\\
p_rp_s-p_sp_r&=0\\
q_rp_s-p_sq_r&=i\hbar\delta_{rs}
\end{aligned} q r q s − q s q r p r p s − p s p r q r p s − p s q r = 0 = 0 = i ℏ δ r s
这些称为 fundamental quantum conditions。这几个条件可以有效的帮我们找到有 classic analogue 的动力学系统的 quantum condition。
4.22 Schodinger's representation
考虑有 n n n 个自由度的动力学系统,他们的 canonical coordinates 和 momenta 为 q r q_r q r ,p r p_r p r ,我们假设 q r q_r q r 均可观测,且其特征值连续 (对应实际物理意义中,位移可以被观察在任何位置)。让我们用 q q q 建立 representation,在其中 q q q 为 diagonal。并且暂时假设各个 q 组成了 a complete commuting set,后面会证明 (这里原文说 pretty obvious from inspection that they do,但是我有点不理解...难道是说类似于可以用 3 个维度建立坐标系吗?)。下面我们考虑 n = 1 n=1 n = 1 ,有:
q p − p q = i ℏ qp-pq=i\hbar q p − p q = i ℏ
任何 ket 可以表示为 ψ ( q ) ⟩ \psi(q)\rangle ψ ( q ) ⟩ ,然后我们可以对应地得到 d ψ / d q ⟩ d\psi/dq\rangle d ψ / d q ⟩ ,这个 representative 是原来的 representative 的导数。这个新 ket 是之前的 ket 的 linear function(满足相加和乘标量的性质),所以也就相当于是在原 ket 上施加了一个 linear operator,我们称这个 linear operator 为 d / d q d/dq d / d q ,也就有了:
d d q ψ ⟩ = d ψ d q ⟩ \frac{d}{dq}\psi\rangle=\frac{d\psi}{dq}\rangle d q d ψ ⟩ = d q d ψ ⟩
因为上面的式子对于任何 ψ \psi ψ 都成立,那么取 ψ = 1 \psi=1 ψ = 1 ,也就是化简为 standard ket,有:
d d q ⟩ = 0 \frac{d}{dq}\rangle=0 d q d ⟩ = 0
考虑第 7 节中 linear operator 的定义,我们应该可以用如下的方式将 d / d q d/dq d / d q 作用于 bra ⟨ ϕ ( q ) \langle\phi(q) ⟨ ϕ ( q ) :
{ ⟨ ϕ d d q } ψ ⟩ = ⟨ ϕ { d d q ψ ⟩ } \{\langle\phi\frac{d}{dq}\}\psi\rangle=\langle\phi\{\frac{d}{dq}\psi\rangle\} { ⟨ ϕ d q d } ψ ⟩ = ⟨ ϕ { d q d ψ ⟩ }
通过 representative 将上式展开,我们有(注意算子不能随便拿到左边去,然后结合一下 20 节的定义):
∫ ⟨ ϕ d d q ∣ q ′ ⟩ d q ′ ψ ( q ′ ) = ∫ ϕ ( q ′ ) d q ′ ψ ( q ′ ) d q ′ = ϕ ( q ′ ) ψ ( q ′ ) ∣ a b − ∫ d ϕ ( q ′ ) d q ′ d q ′ ψ ( q ′ ) = − ∫ d ϕ ( q ′ ) d q ′ d q ′ ψ ( q ′ ) \begin{aligned}
\int\langle\phi\frac{d}{dq}|q'\rangle dq'\psi(q')&=\int\phi(q')dq'\frac{\psi(q')}{dq'}\\
&=\left.\phi(q')\psi(q')\right\vert_{a}^{b}-\int \frac{d\phi(q')}{dq'}dq'\psi(q')\\
&=-\int \frac{d\phi(q')}{dq'}dq'\psi(q')
\end{aligned} ∫ ⟨ ϕ d q d ∣ q ′ ⟩ d q ′ ψ ( q ′ ) = ∫ ϕ ( q ′ ) d q ′ d q ′ ψ ( q ′ ) = ϕ ( q ′ ) ψ ( q ′ ) ∣ a b − ∫ d q ′ d ϕ ( q ′ ) d q ′ ψ ( q ′ ) = − ∫ d q ′ d ϕ ( q ′ ) d q ′ ψ ( q ′ )
也就有:
⟨ ϕ d d q ∣ q ′ ⟩ = − d ϕ ( q ′ ) d q ′ ⟨ ϕ d d q = − ⟨ d ϕ d q \begin{aligned}
\langle\phi\frac{d}{dq}|q'\rangle&=-\frac{d\phi(q')}{dq'}\\
\langle\phi\frac{d}{dq}&=-\langle\frac{d\phi}{dq}
\end{aligned} ⟨ ϕ d q d ∣ q ′ ⟩ ⟨ ϕ d q d = − d q ′ d ϕ ( q ′ ) = − ⟨ d q d ϕ
上述的推导要求在边界处为 0。实际情况中一般都会满足,具体的扩展定义放在了下一节。这种边界条件上的限制往往在物理上也是对应的,例如对于笛卡尔坐标系,q q q 的边界在正负无穷,边界条件就是要求在正负无穷处 vanish。
因为 d / d q ⋅ ψ ⟩ d/dq\cdot \psi\rangle d / d q ⋅ ψ ⟩ 或者 d ψ / d q ⟩ d\psi/dq\rangle d ψ / d q ⟩ 的 conjugate imaginary 是 ⟨ d ψ ˉ / d q \langle d\bar{\psi}/dq ⟨ d ψ ˉ / d q ,即 ⟨ ψ ˉ ⋅ d / d q \langle \bar{\psi}\cdot d/dq ⟨ ψ ˉ ⋅ d / d q ,所以 d / d q d/dq d / d q 的 conjugate complex 是 − d / d q -d/dq − d / d q ,即 d / d q d/dq d / d q 是 pure imaginary linear operator。
我们继续来考虑 d / d q d/dq d / d q 的 representative。我们有:
∣ q ′ ′ ⟩ = δ ( q − q ′ ′ ) ⟩ |q''\rangle=\delta(q-q'')\rangle ∣ q ′ ′ ⟩ = δ ( q − q ′ ′ ) ⟩
则有:
d d q ∣ q ′ ′ ⟩ = d d q δ ( q − q ′ ′ ) ⟩ ⟨ q ′ ∣ d d q ∣ q ′ ′ ⟩ = d d q ′ δ ( q ′ − q ′ ′ ) \begin{aligned}
\frac{d}{dq}|q''\rangle&=\frac{d}{dq}\delta(q-q'')\rangle\\
\langle q'|\frac{d}{dq}|q''\rangle&=\frac{d}{dq'}\delta(q'-q'')
\end{aligned} d q d ∣ q ′ ′ ⟩ ⟨ q ′ ∣ d q d ∣ q ′ ′ ⟩ = d q d δ ( q − q ′ ′ ) ⟩ = d q ′ d δ ( q ′ − q ′ ′ )
另外,考虑 d / d q d/dq d / d q 和 q q q 的 commutation relation:
d d q q ψ ⟩ = d q ψ d q ⟩ = q d d q ψ ⟩ + ψ ⟩ \frac{d}{dq}q\psi\rangle=\frac{dq\psi}{dq}\rangle=q\frac{d}{dq}\psi\rangle+\psi\rangle d q d q ψ ⟩ = d q d q ψ ⟩ = q d q d ψ ⟩ + ψ ⟩
也就是:
d d q q − q d d q = 1 \frac{d}{dq}q-q\frac{d}{dq}=1 d q d q − q d q d = 1
和上面 q , p q,p q , p 的 commutation relation 对比,会发现 − i ℏ d / d q -i\hbar d/dq − i ℏ d / d q 和 p p p 与 q q q 有相同的 commutation relation。
扩展至任意 n n n 。 我们把 ket 表示为 ψ q 1 . . . q n ⟩ = ψ ⟩ \psi{q_1...q_n}\rangle=\psi\rangle ψ q 1 . . . q n ⟩ = ψ ⟩ ,并引入 ∂ / ∂ q r ( r = 1 , . . . , n ) \partial/\partial q_r\ (r=1,...,n) ∂ / ∂ q r ( r = 1 , . . . , n ) ,定义为:
∂ ∂ q r ψ ⟩ = ∂ ψ ∂ q r ⟩ \frac{\partial}{\partial q_r}\psi\rangle=\frac{\partial \psi}{\partial q_r}\rangle ∂ q r ∂ ψ ⟩ = ∂ q r ∂ ψ ⟩
类似 n = 1 n=1 n = 1 的情况,我们还有:
∂ ∂ q r ⟩ = 0 ⟨ ϕ ∂ ∂ q r = − ⟨ ∂ ϕ ∂ q r ∂ ∂ q r q s − q s ∂ ∂ q r = δ r s \begin{aligned}
\frac{\partial}{\partial q_r}\rangle&=0\\
\langle\phi\frac{\partial}{\partial q_r}&=-\langle\frac{\partial\phi}{\partial q_r}\\
\frac{\partial}{\partial q_r}q_s-q_s\frac{\partial}{\partial q_r}&=\delta_{rs}
\end{aligned} ∂ q r ∂ ⟩ ⟨ ϕ ∂ q r ∂ ∂ q r ∂ q s − q s ∂ q r ∂ = 0 = − ⟨ ∂ q r ∂ ϕ = δ r s
另外,还有:
∂ ∂ q r ∂ ∂ q s ψ ⟩ = ∂ 2 ψ ∂ q r ∂ q s ⟩ = ∂ ∂ q s ∂ ∂ q r ψ ⟩ \frac{\partial}{\partial q_r}\frac{\partial}{\partial q_s}\psi\rangle=\frac{\partial^2\psi}{\partial q_r\partial q_s}\rangle=\frac{\partial}{\partial q_s}\frac{\partial}{\partial q_r}\psi\rangle ∂ q r ∂ ∂ q s ∂ ψ ⟩ = ∂ q r ∂ q s ∂ 2 ψ ⟩ = ∂ q s ∂ ∂ q r ∂ ψ ⟩
也就是:
∂ ∂ q r ∂ ∂ q s = ∂ ∂ q s ∂ ∂ q r \frac{\partial}{\partial q_r}\frac{\partial}{\partial q_s}=\frac{\partial}{\partial q_s}\frac{\partial}{\partial q_r} ∂ q r ∂ ∂ q s ∂ = ∂ q s ∂ ∂ q r ∂
我们可以直接取:
p r = − i ℏ ∂ ∂ q r p_r=-i\hbar\frac{\partial}{\partial q_r} p r = − i ℏ ∂ q r ∂
也不会有任何 inconsistency。这种可能性证明了 q q q 肯定 for a complete commuting set,因为 q q q 和 p p p 的函数一定是 q q q 和 − i ℏ ∂ / ∂ q r -i\hbar\partial/\partial q_r − i ℏ ∂ / ∂ q r 的函数,而因为 − i ℏ ∂ / ∂ q r -i\hbar\partial/\partial q_r − i ℏ ∂ / ∂ q r 不能和所有 q q q commute,所以能和所有 q q q commute 的只能是 q q q 的函数。
如果 p r p_r p r 不等于 − i ℏ ∂ / ∂ q r -i\hbar\partial/\partial q_r − i ℏ ∂ / ∂ q r ,那么由于 p r + i ℏ ∂ / ∂ q r p_r + i\hbar\partial/\partial q_r p r + i ℏ ∂ / ∂ q r commute with q q q ,所以:
p r = − i ℏ ∂ / ∂ q r + f r ( q ) p_r=-i\hbar\partial/\partial q_r+f_r(q) p r = − i ℏ ∂ / ∂ q r + f r ( q )
因为 p r p_r p r 和 − i ℏ ∂ / ∂ q r -i\hbar\partial/\partial q_r − i ℏ ∂ / ∂ q r 都是实的,所以 f r ( q ) f_r(q) f r ( q ) 是实的。对于任意 f f f ,有:
∂ ∂ q r f ψ ⟩ = f ∂ ∂ q r ψ ⟩ + ∂ f ∂ q r ψ ⟩ ∂ ∂ q r f − f ∂ ∂ q r = ∂ f ∂ q r \begin{aligned}
&\frac{\partial}{\partial q_r}f\psi\rangle=f\frac{\partial}{\partial q_r}\psi\rangle+\frac{\partial f}{\partial q_r}\psi\rangle\\
&\frac{\partial}{\partial q_r}f-f\frac{\partial}{\partial q_r}=\frac{\partial f}{\partial q_r}
\end{aligned} ∂ q r ∂ f ψ ⟩ = f ∂ q r ∂ ψ ⟩ + ∂ q r ∂ f ψ ⟩ ∂ q r ∂ f − f ∂ q r ∂ = ∂ q r ∂ f
继续带入,有:
p r f − f p r = − i ℏ ∂ f ∂ q r p_rf-fp_r=-i\hbar\frac{\partial f}{\partial q_r} p r f − f p r = − i ℏ ∂ q r ∂ f
即:
[ f , p r ] = ∂ f ∂ q r [f,p_r]=\frac{\partial f}{\partial q_r} [ f , p r ] = ∂ q r ∂ f
另外,我们还有:
( p r − f r ) ( p s − f s ) = ( p s − f s ) ( p r − f r ) (p_r-f_r)(p_s-f_s)=(p_s-f_s)(p_r-f_r) ( p r − f r ) ( p s − f s ) = ( p s − f s ) ( p r − f r )
加之 quantum condition p r p s = p s p r p_rp_s=p_sp_r p r p s = p s p r ,则有:
p r f s + f r p s = p s f r + f s p r p_rf_s+f_rp_s=p_sf_r+f_sp_r p r f s + f r p s = p s f r + f s p r
继续分组带入,有:
∂ f s / ∂ q r = ∂ f r / ∂ q s \partial f_s/\partial q_r=\partial f_r/\partial q_s ∂ f s / ∂ q r = ∂ f r / ∂ q s
这意味着 f r = ∂ F / ∂ q s f_r=\partial F/\partial q_s f r = ∂ F / ∂ q s ,其中 F F F independent of r r r (这里应该是说,所有方向都用同一个 F F F )。从而得到:
p r = − i ℏ ∂ / ∂ q r + ∂ F / ∂ q s p_r=-i\hbar\partial/\partial q_r+\partial F/\partial q_s p r = − i ℏ ∂ / ∂ q r + ∂ F / ∂ q s
接下来,我们可以通过调整 phase factor 来把这个 F F F 消掉 。我们取新的 basic bra 为:
⟨ q 1 ′ . . . q n ′ ∗ ∣ = e i γ ′ ⟨ q 1 ′ . . . q n ′ ∣ \langle {q'_1...q'_n}^{*}|=e^{i\gamma'}\langle {q'_1...q'_n}| ⟨ q 1 ′ . . . q n ′ ∗ ∣ = e i γ ′ ⟨ q 1 ′ . . . q n ′ ∣
这里 γ ′ = γ ( q ′ ) \gamma'=\gamma(q') γ ′ = γ ( q ′ ) 是 q ′ q' q ′ 的实函数。那么反过来就有 ψ ⟩ ∗ = e − i γ ψ ⟩ \psi\rangle^*=e^{-i\gamma}\psi\rangle ψ ⟩ ∗ = e − i γ ψ ⟩ ,即:
⟩ ∗ = e − i γ ⟩ \rangle^*=e^{-i\gamma}\rangle ⟩ ∗ = e − i γ ⟩
类似的我们可以定义 ( ∂ / ∂ q r ) ∗ (\partial/\partial q_r)^* ( ∂ / ∂ q r ) ∗ ,有:
( ∂ ∂ q r ) ∗ ψ ⟩ ∗ = ∂ ψ ∂ q r ⟩ ∗ = e − i γ ∂ ψ ∂ q r ⟩ = e − i γ ∂ ∂ q r ψ ⟩ = e − i γ ∂ ∂ q r e i γ ψ ⟩ ∗ (\frac{\partial}{\partial q_r})^*\psi\rangle^* = \frac{\partial\psi}{\partial q_r}\rangle^* = e^{-i\gamma}\frac{\partial\psi}{\partial q_r}\rangle = e^{-i\gamma}\frac{\partial}{\partial q_r}\psi\rangle = e^{-i\gamma}\frac{\partial}{\partial q_r}e^{i\gamma}\psi\rangle^* ( ∂ q r ∂ ) ∗ ψ ⟩ ∗ = ∂ q r ∂ ψ ⟩ ∗ = e − i γ ∂ q r ∂ ψ ⟩ = e − i γ ∂ q r ∂ ψ ⟩ = e − i γ ∂ q r ∂ e i γ ψ ⟩ ∗
即:
( ∂ ∂ q r ) ∗ = e − i γ ∂ ∂ q r e i γ (\frac{\partial}{\partial q_r})^*=e^{-i\gamma}\frac{\partial}{\partial q_r}e^{i\gamma} ( ∂ q r ∂ ) ∗ = e − i γ ∂ q r ∂ e i γ
再因为 ( ∂ / ∂ q r ) f = f ( ∂ / ∂ q r ) + ∂ f / ∂ q r (\partial /\partial q_r)f=f(\partial/\partial q_r)+\partial f/\partial q_r ( ∂ / ∂ q r ) f = f ( ∂ / ∂ q r ) + ∂ f / ∂ q r ,也就是:
( ∂ ∂ q r ) ∗ = e − i γ ∂ ∂ q r e i γ = ∂ ∂ q r + i ∂ γ ∂ q r (\frac{\partial}{\partial q_r})^*=e^{-i\gamma}\frac{\partial}{\partial q_r}e^{i\gamma}=\frac{\partial}{\partial q_r}+i\frac{\partial \gamma}{\partial q_r} ( ∂ q r ∂ ) ∗ = e − i γ ∂ q r ∂ e i γ = ∂ q r ∂ + i ∂ q r ∂ γ
只要选择 γ \gamma γ 使得 F = ℏ γ + a constant F=\hbar\gamma + \text{a constant} F = ℏ γ + a constant ,则有 p r = − i h ( ∂ / ∂ q ) ∗ p_r=-ih(\partial/\partial q)^* p r = − i h ( ∂ / ∂ q ) ∗
这种 representation 被称为 Schrodinger's representation ,因为这也是薛定谔在 1926 年在他最初的量子力学 formulation 中使用的 representation。Schrodinger's representation 在 canonical q q q 和 p p p 存在的时候存在,而且仅由他们决定(只相差一个常数 phase factor)。
另外,因为这种表示中有 p r ⟩ = 0 p_r\rangle=0 p r ⟩ = 0 ,也就也为这 standard ket 是所有 momenta 的 eigenket 且其特征值为 0。以及有:
⟨ q 1 ′ . . . q n ′ ∣ ∂ ∂ q r ψ ⟩ = ⟨ q 1 ′ . . . q n ′ ∣ ∂ ψ ∂ q r ⟩ = ∂ ψ ( q 1 ′ . . . q n ′ ) ∂ q r ′ = ∂ ∂ q r ′ ⟨ q 1 ′ . . . q n ′ ∣ ψ ⟩ ⟨ q 1 ′ . . . q n ′ ∣ ∂ ∂ q r = ∂ ∂ q r ′ ⟨ q 1 ′ . . . q n ′ ∣ ⟨ q 1 ′ . . . q n ′ ∣ p r = − i ℏ ∂ ∂ q r ′ ⟨ q 1 ′ . . . q n ′ ∣ p r ∣ q 1 ′ . . . q n ′ ⟩ = i ℏ ∂ ∂ q r ′ ∣ q 1 ′ . . . q n ′ ⟩ \begin{aligned}
\langle q'_1...q'_n|\frac{\partial}{\partial q_r}\psi\rangle = \langle q'_1...q'_n|\frac{\partial \psi}{\partial q_r}\rangle &= \frac{\partial\psi(q_1'...q'_n)}{\partial q'_r}=\frac{\partial}{\partial q'_r}\langle q'_1...q'_n|\psi\rangle\\
\langle q'_1...q'_n|\frac{\partial}{\partial q_r}&=\frac{\partial}{\partial q'_r}\langle q'_1...q'_n|\\
\langle q'_1...q'_n|p_r&=-i\hbar\frac{\partial}{\partial q'_r}\langle q'_1...q'_n|\\
p_r| q'_1...q'_n\rangle&=i\hbar\frac{\partial}{\partial q'_r}| q'_1...q'_n\rangle
\end{aligned} ⟨ q 1 ′ . . . q n ′ ∣ ∂ q r ∂ ψ ⟩ = ⟨ q 1 ′ . . . q n ′ ∣ ∂ q r ∂ ψ ⟩ ⟨ q 1 ′ . . . q n ′ ∣ ∂ q r ∂ ⟨ q 1 ′ . . . q n ′ ∣ p r p r ∣ q 1 ′ . . . q n ′ ⟩ = ∂ q r ′ ∂ ψ ( q 1 ′ . . . q n ′ ) = ∂ q r ′ ∂ ⟨ q 1 ′ . . . q n ′ ∣ ψ ⟩ = ∂ q r ′ ∂ ⟨ q 1 ′ . . . q n ′ ∣ = − i ℏ ∂ q r ′ ∂ ⟨ q 1 ′ . . . q n ′ ∣ = i ℏ ∂ q r ′ ∂ ∣ q 1 ′ . . . q n ′ ⟩
4.23 The momentum representation
让我们重新来考虑只有 1 个自由度,可以用 q q q 和 p p p 描述的系统,并假设 q q q 特征值范围是从 − ∞ -\infty − ∞ 到 ∞ \infty ∞ 。那么根据 Schrodinger's representation,p p p 的 eigenket ∣ p ′ ⟩ |p'\rangle ∣ p ′ ⟩ 满足:
p ′ ⟨ q ′ ∣ p ′ ⟩ = ⟨ q ′ ∣ p ∣ p ′ ⟩ = − i ℏ d d q ′ ⟨ q ′ ∣ p ′ ⟩ p'\langle q'|p'\rangle=\langle q'|p|p'\rangle=-i\hbar\frac{d}{dq'}\langle q'|p'\rangle p ′ ⟨ q ′ ∣ p ′ ⟩ = ⟨ q ′ ∣ p ∣ p ′ ⟩ = − i ℏ d q ′ d ⟨ q ′ ∣ p ′ ⟩
这个微分方程的解为:
⟨ q ′ ∣ p ′ ⟩ = c ′ e i p ′ q ′ / ℏ \langle q'|p'\rangle=c'e^{ip'q'/\hbar} ⟨ q ′ ∣ p ′ ⟩ = c ′ e i p ′ q ′ / ℏ
其中 c ′ = c ( p ′ ) c'=c(p') c ′ = c ( p ′ ) 与 q ′ q' q ′ 无关。
不过问题来了,orthogonality theorem 不成立了。因为如果取另一个 p p p 的 eigenket ∣ p ′ ′ ⟩ |p''\rangle ∣ p ′ ′ ⟩ ,会有:
⟨ p ′ ∣ p ′ ′ ⟩ = ∫ − ∞ ∞ ⟨ p ′ ∣ q ′ ⟩ d q ′ ⟨ q ′ ∣ p ′ ′ ⟩ = c ′ ˉ c ′ ′ ∫ − ∞ ∞ e i ( p ′ ′ − p ′ ) q ′ / ℏ d q \langle p'|p''\rangle=\int_{-\infty}^{\infty}\langle p'|q'\rangle dq'\langle q'|p''\rangle=\bar{c'}c''\int_{-\infty}^{\infty}e^{i(p''-p')q'/\hbar}dq ⟨ p ′ ∣ p ′ ′ ⟩ = ∫ − ∞ ∞ ⟨ p ′ ∣ q ′ ⟩ d q ′ ⟨ q ′ ∣ p ′ ′ ⟩ = c ′ ˉ c ′ ′ ∫ − ∞ ∞ e i ( p ′ ′ − p ′ ) q ′ / ℏ d q
这个积分正常来说不收敛(因为积分出来是 sin \sin sin 和 cos \cos cos )。但是我们可以类比 Cesaro summation 定义 ,如果一个积分在上界 q ′ q' q ′ 的值是 cos a q ′ \cos{aq'} cos a q ′ 或 sin a q ′ \sin{aq'} sin a q ′ ,那么当 q ′ q' q ′ 趋于无穷时,认为这个 值为 0(即我们选取震荡的平均值)。这样就把 orthogonality theorem 恢复了。
当 p ′ ′ p'' p ′ ′ 和 p ′ p' p ′ 很接近时,上式的右边就逐渐趋近于 δ \delta δ 函数了(这里没太明白为啥积分为 1)。其实也就是证明:
∫ − ∞ ∞ e i a x d x = 2 π δ ( a ) \int_{-\infty}^{\infty}e^{iax}dx=2\pi\delta(a) ∫ − ∞ ∞ e i a x d x = 2 π δ ( a )
可以用 Fourier inversion theorem 中的:
lim g → ∞ ∫ − ∞ ∞ f ( a ) d a ∫ − g g e i a x d x = lim g → ∞ ∫ − ∞ ∞ f ( a ) 2 a − 1 sin a g d a = 2 π f ( 0 ) \lim_{g\rightarrow \infty}\int_{-\infty}^{\infty}f(a)da\int_{-g}^{g}e^{iax}dx = \lim_{g\rightarrow \infty}\int_{-\infty}^{\infty}f(a)2a^{-1}\sin{ag}\ da=2\pi f(0) g → ∞ lim ∫ − ∞ ∞ f ( a ) d a ∫ − g g e i a x d x = g → ∞ lim ∫ − ∞ ∞ f ( a ) 2 a − 1 sin a g d a = 2 π f ( 0 )
来证明上面的式子。
所以我们有:
⟨ p ′ ∣ p ′ ′ ⟩ = c ′ ˉ c ′ ′ 2 π δ [ ( p ′ − p ′ ′ ) / ℏ ] = c ′ ˉ c ′ ′ h δ [ ( p ′ − p ′ ′ ) = ∣ c ′ ∣ 2 h δ ( p ′ − p ′ ′ ) \begin{aligned}
\langle p'|p''\rangle=\bar{c'}c''2\pi\delta[(p'-p'')/\hbar]&=\bar{c'}c''h\delta[(p'-p'')\\
&=|c'|^2h\delta(p'-p'')
\end{aligned} ⟨ p ′ ∣ p ′ ′ ⟩ = c ′ ˉ c ′ ′ 2 π δ [ ( p ′ − p ′ ′ ) / ℏ ] = c ′ ˉ c ′ ′ h δ [ ( p ′ − p ′ ′ ) = ∣ c ′ ∣ 2 h δ ( p ′ − p ′ ′ )
回到 ∣ p ′ ⟩ |p'\rangle ∣ p ′ ⟩ ,任意一个 ∣ X ⟩ |X\rangle ∣ X ⟩ 可以用 p p p 的 eigenket 表示,因为 ⟨ q ′ ∣ X ⟩ \langle q'|X\rangle ⟨ q ′ ∣ X ⟩ 可以通过 Fourier analysis 的方式用 ⟨ q ′ ∣ p ′ ⟩ \langle q'|p'\rangle ⟨ q ′ ∣ p ′ ⟩ 表示。因此 p p p 是 observable,这也和实验相对应。
这样就形成了 q q q 和 p p p 的一种对称性。他们俩的特征值范围都是 − ∞ -\infty − ∞ 至 ∞ \infty ∞ ,他俩的 commuting relation 只差一个负号。之前我们选的 representation 里 q q q 是 diagonal,p = − i ℏ d / d q p=-i\hbar d/dq p = − i ℏ d / d q ,那么如果我们选 p p p 为 diagonal 的 representation,则有:
q = i ℏ d d p q=i\hbar\frac{d}{dp} q = i ℏ d p d
这种 representation 称为 momentum representation 。不过 momentum representation 没有 Schrodinger's representatino 那么有用,因为重要的动力学量往往是由 p p p 组成的 power series。momentum representation 只对特定问题有用(见第 50 节)。
接下来让我们计算一下这俩 representation 之间的变换关系。同样由于对称性,并根据:
⟨ p ′ ∣ q ′ ⟩ = c ′ ( q ′ ) e − i q ′ p ′ / ℏ \langle p'|q'\rangle=c'(q')e^{-iq'p'/\hbar} ⟨ p ′ ∣ q ′ ⟩ = c ′ ( q ′ ) e − i q ′ p ′ / ℏ
因此 c ′ c' c ′ 实际上 Independent of p ′ p' p ′ 与 q ′ q' q ′ ,也就是个数字。那么我们可以进一步调整,让:
⟨ p ′ ∣ p ′ ′ ⟩ = δ ( p ′ − p ′ ′ ) \langle p'|p''\rangle=\delta(p'-p'') ⟨ p ′ ∣ p ′ ′ ⟩ = δ ( p ′ − p ′ ′ )
这时 ∣ c ∣ = h − 1 / 2 |c|=h^{-1/2} ∣ c ∣ = h − 1 / 2 ,然后我们可以选一个 constant pahse factor,就有 c = h − 1 / 2 c=h^{-1/2} c = h − 1 / 2 ,那么
⟨ q ′ ∣ p ′ ⟩ = h − 1 / 2 e i p ′ q ′ / ℏ \langle q'|p'\rangle=h^{-1/2}e^{ip'q'/\hbar} ⟨ q ′ ∣ p ′ ⟩ = h − 1 / 2 e i p ′ q ′ / ℏ
就是我们的 transformation function 了。
类似地推导可以拓展至 n n n 个自由度,会有:
q r = i ℏ ∂ / ∂ p r ⟨ q 1 ′ q 2 ′ . . . q n ′ ∣ p 1 ′ p 2 ′ . . . p n ′ ⟩ = ⟨ q 1 ′ ∣ p 1 ′ ⟩ ⟨ q 2 ′ ∣ p 2 ′ ⟩ . . . ⟨ q n ′ ∣ p n ′ ⟩ = h − n / 2 e i ( p 1 ′ q 1 ′ + p 2 ′ q 2 ′ + . . . + p n ′ q n ′ ) / ℏ \begin{aligned}
q_r&=i\hbar\partial/\partial p_r\\
\langle q_1'q_2'...q_n'|p_1'p_2'...p_n'\rangle&=\langle q_1'|p_1'\rangle\langle q_2'|p_2'\rangle...\langle q_n'|p_n'\rangle\\
&=h^{-n/2}e^{i(p_1'q_1'+p_2'q_2'+...+p_n'q_n')/\hbar}
\end{aligned} q r ⟨ q 1 ′ q 2 ′ . . . q n ′ ∣ p 1 ′ p 2 ′ . . . p n ′ ⟩ = i ℏ ∂ / ∂ p r = ⟨ q 1 ′ ∣ p 1 ′ ⟩ ⟨ q 2 ′ ∣ p 2 ′ ⟩ . . . ⟨ q n ′ ∣ p n ′ ⟩ = h − n / 2 e i ( p 1 ′ q 1 ′ + p 2 ′ q 2 ′ + . . . + p n ′ q n ′ ) / ℏ
4.24 Heisenberg's principle of uncertainty
由 18 节中的坐标转化公式,我们有:
⟨ p ′ ∣ X ⟩ = h − 1 2 ∫ − ∞ ∞ e − i q ′ p ′ / ℏ d q ′ ⟨ q ′ ∣ X ⟩ ⟨ q ′ ∣ X ⟩ = h − 1 2 ∫ − ∞ ∞ e i p ′ q ′ / ℏ d p ′ ⟨ p ′ ∣ X ⟩ \langle p'|X\rangle=h^{-\frac{1}{2}}\int_{-\infty}^{\infty}e^{-iq'p'/\hbar}dq'\langle q'|X\rangle\\
\langle q'|X\rangle=h^{-\frac{1}{2}}\int_{-\infty}^{\infty}e^{ip'q'/\hbar}dp'\langle p'|X\rangle ⟨ p ′ ∣ X ⟩ = h − 2 1 ∫ − ∞ ∞ e − i q ′ p ′ / ℏ d q ′ ⟨ q ′ ∣ X ⟩ ⟨ q ′ ∣ X ⟩ = h − 2 1 ∫ − ∞ ∞ e i p ′ q ′ / ℏ d p ′ ⟨ p ′ ∣ X ⟩
这证明了 2 个 representative 是互相的 Fourier component。
我们考虑一个在 Schrodinger representative 下表示为一个 wave packet 的 ket,就是说这个函数除了在特定的一个范围,其他位置都很小,并假设这个范围的宽度大约是 Δ q ′ \Delta q' Δ q ′ ,以及假设在这个范围内函数大约按一个特定的频率周期性波动。那么如果我们对这个函数做傅里叶分析,应该只有这个特定的频率附近的 Fourier component 的振幅会不那么小。这些不那么小的频率的范围大约是 1 / Δ q ′ 1/\Delta q' 1 / Δ q ′ 这个量级(因为频率是波长的倒数)。那么在上式中,( 2 π ) − 1 p ′ / ℏ = p ′ / h (2\pi)^{-1}p'/\hbar=p'/h ( 2 π ) − 1 p ′ / ℏ = p ′ / h 即为频率,所以在 wave packet 的情况下,p ′ p' p ′ 不那么小的范围 Δ p ′ = h / Δ q ′ \Delta p'=h/\Delta q' Δ p ′ = h / Δ q ′ 。
从物理上考虑这个问题,wave packet 表示了 q q q 的测量值有 Δ q ′ \Delta q' Δ q ′ 的误差,另外 p p p 的测量有 Δ p ′ \Delta p' Δ p ′ 的误差,而两个误差的乘积为:
Δ q ′ Δ p ′ = h \Delta q'\Delta p'=h Δ q ′ Δ p ′ = h
在多自由度的系统中每个方向都分别有这样的公式。这个公式称为 Heisenberg's Principle of Uncertainty。这展示了我们没法同时给 2 个 non-commuting observables 确定数值,以及量子力学中观测之间的 incompatible 。除了上述的 wave packet 的情况,一般误差之积会大于 h h h 。
进一步,如果我们完全确定了 q q q ,则完全不能确定 p p p ,这和 18 节的概率公式能相互呼应。(具体呼应需要之后细看)。
另外,很显然不会出现 q q q 或 p p p 在为任何值的概率均非零,所以也就对应了我们的测量不可能测量到这两个东西的 eigenstate(不然另一个就完全不确定了),这也呼应上了 12 节结尾提到的测量不会无限精准。
4.25 Displacement Operators
在第二章中,我们就把 state 和 dynamic variable 做了物理上的诠释(is essentially a physical scheme),那么如果我们让他们都移动一下(例如在笛卡尔坐标系上平移一个 δ x \delta x δ x ),新 state 和 dynamic variable 之间的关系应该不变。或者说,这个新的 state 和 dynamic variable 应该由原有的加之位移的方向和长度完全决定。
根据叠加态关系,假如有:
∣ R ⟩ = c 1 ∣ A ⟩ + c 2 ∣ B ⟩ |R\rangle = c_1|A\rangle + c_2|B\rangle ∣ R ⟩ = c 1 ∣ A ⟩ + c 2 ∣ B ⟩
那么理论上,移动了之后,应该有:
∣ R d ⟩ = c 1 ∣ A d ⟩ + c 2 ∣ B d ⟩ |Rd\rangle = c_1|Ad\rangle + c_2|Bd\rangle ∣ R d ⟩ = c 1 ∣ A d ⟩ + c 2 ∣ B d ⟩
这意味着存在一个 linear operator D D D (因为满足 linear function 的条件),满足:
∣ P d ⟩ = D ∣ P ⟩ |Pd\rangle = D|P\rangle ∣ P d ⟩ = D ∣ P ⟩
也因为上面移动的不变形,我们有:
⟨ Q d ∣ P d ⟩ ⟨ Q ∣ D ˉ D ∣ P ⟩ D ˉ D = 1 \langle Qd|Pd\rangle\\
\langle Q|\bar{D}D|P\rangle\\
\bar{D}D=1 ⟨ Q d ∣ P d ⟩ ⟨ Q ∣ D ˉ D ∣ P ⟩ D ˉ D = 1
类似的如果有一个别的 dynamic variable,会有:
v ∣ P ⟩ = ∣ R ⟩ v d ∣ P d ⟩ = ∣ R d ⟩ = D ∣ R ⟩ = D v ∣ P ⟩ = D v D − 1 ∣ P d ⟩ v d = D v D − 1 v|P\rangle=|R\rangle\\
v_d|Pd\rangle=|Rd\rangle=D|R\rangle=Dv|P\rangle=DvD^{-1}|Pd\rangle\\
v_d=DvD^{-1} v ∣ P ⟩ = ∣ R ⟩ v d ∣ P d ⟩ = ∣ R d ⟩ = D ∣ R ⟩ = D v ∣ P ⟩ = D v D − 1 ∣ P d ⟩ v d = D v D − 1
下一步我们来考虑无穷小的位移,由物理上的连续型,下面这个极限应该存在:
lim δ x → 0 ∣ P d ⟩ − ∣ P ⟩ δ x = lim δ x → 0 D − 1 δ x ∣ P ⟩ \lim_{\delta x\rightarrow 0}\frac{|Pd\rangle-|P\rangle}{\delta x}=\lim_{\delta x\rightarrow 0}\frac{D-1}{\delta x}|P\rangle δ x → 0 lim δ x ∣ P d ⟩ − ∣ P ⟩ = δ x → 0 lim δ x D − 1 ∣ P ⟩
即 lim δ x → 0 ( D − 1 ) / δ x \lim_{\delta x\rightarrow 0}(D-1)/\delta x lim δ x → 0 ( D − 1 ) / δ x 存在。我们称这个线性算子为 the displacement operator for the x-direction 并用 d x d_x d x 表示。在 δ x \delta x δ x 很小的时候,我们可以用:
D = 1 + δ x d x D=1+\delta x\ d_x D = 1 + δ x d x
也就有了(中间忽略了 2 阶项):
( 1 + δ x d ˉ x ) ( 1 + δ x d x ) = 1 δ x ( d ˉ x + d x ) = 0 (1+\delta x\ \bar{d}_x)(1+\delta x\ d_x)=1\\
\delta x(\bar{d}_x+d_x)=0 ( 1 + δ x d ˉ x ) ( 1 + δ x d x ) = 1 δ x ( d ˉ x + d x ) = 0
所以 d x d_x d x 是个 pure imaginary linear operator。带入上面的式子,有:
v d = ( 1 + δ x d ˉ x ) v ( 1 − δ x d x ) = v + δ x ( d x v − v d x ) v_d=(1+\delta x\bar{d}_x)v(1-\delta xd_x)=v+\delta x(d_xv-vd_x) v d = ( 1 + δ x d ˉ x ) v ( 1 − δ x d x ) = v + δ x ( d x v − v d x )
所以有了:
lim δ x → 0 ( v d − v ) / δ x = d x v − v d x \lim_{\delta x\rightarrow 0}(v_d-v)/\delta x=d_xv-vd_x δ x → 0 lim ( v d − v ) / δ x = d x v − v d x
假如说我们把实验仪器放置的位置的测量值为 x x x ,那么他平移了一点之后的值应该是 x d = x − δ x x_d=x-\delta x x d = x − δ x ,也就有了:
d x x − x d x = − 1 d_xx-xd_x=-1 d x x − x d x = − 1
这是 d x d_x d x 和 x x x 的 quantum condition。因为我们之前有 q p − p q = i ℏ qp-pq=i\hbar q p − p q = i ℏ ,所以我们可以适当调整 d x d_x d x 使得:
p x = i ℏ d x p_x=i\hbar d_x p x = i ℏ d x
这是一个 fundamental result,给了 displacement operator 新的意义。另外 p x , p y , p z p_x, p_y, p_z p x , p y , p z 相互 commute 也与 3 个方向的 displacement 相互 commute 相联系。
4.26 Unitary transformation
我们可以扩展从上一节的 D D D ,假设:
α ∗ = U α U − 1 \alpha^*=U\alpha U^{-1} α ∗ = U α U − 1
那么假如 ∣ α ′ ⟩ |\alpha'\rangle ∣ α ′ ⟩ 是 α \alpha α 的 eigenket,我们有:
α ∗ U ∣ α ′ ⟩ = U α U − 1 U ∣ α ′ ⟩ = U α ∣ α ′ ⟩ = α ′ U ∣ α ′ ⟩ \alpha^*U|\alpha'\rangle=U\alpha U^{-1}U|\alpha'\rangle=U\alpha|\alpha'\rangle=\alpha'U|\alpha'\rangle α ∗ U ∣ α ′ ⟩ = U α U − 1 U ∣ α ′ ⟩ = U α ∣ α ′ ⟩ = α ′ U ∣ α ′ ⟩
所以 U ∣ α ′ ⟩ U|\alpha'\rangle U ∣ α ′ ⟩ 是 α ∗ \alpha^* α ∗ 的 eigenket,且特征值相等。另外我们还会有:
( α 1 + α 2 ) ∗ = U ( α 1 + α 2 ) U − 1 = U α 1 U − 1 + U α 2 U − 1 = α 1 ∗ + α 2 ∗ ( α 1 α 2 ) ∗ = U α 1 α 2 U − 1 = U α 1 U − 1 U α 2 U − 1 = α 1 ∗ α 2 ∗ (\alpha_1+\alpha_2)^*=U(\alpha_1+\alpha_2)U^{-1}=U\alpha_1U^{-1}+U\alpha_2U^{-1}=\alpha_1^*+\alpha_2^*\\
(\alpha_1\alpha_2)^*=U\alpha_1\alpha_2 U^{-1}=U\alpha_1 U^{-1}U\alpha_2 U^{-1}=\alpha_1^*\alpha_2^* ( α 1 + α 2 ) ∗ = U ( α 1 + α 2 ) U − 1 = U α 1 U − 1 + U α 2 U − 1 = α 1 ∗ + α 2 ∗ ( α 1 α 2 ) ∗ = U α 1 α 2 U − 1 = U α 1 U − 1 U α 2 U − 1 = α 1 ∗ α 2 ∗
我们再来研究一下假如 α \alpha α 和 α ∗ \alpha^* α ∗ 都是实的,对 U U U 有啥要求,因为 α , α ∗ \alpha, \alpha^* α , α ∗ 是实的,所以有:
α ∗ U = U α U ‾ α ∗ = α U ‾ \alpha^*U=U\alpha\\
\overline{U}\alpha^*=\alpha\overline{U}\\ α ∗ U = U α U α ∗ = α U
把第一行乘 U ‾ \overline{U} U ,再用这两行的关系交换顺序,就有:
U ‾ α ∗ U = U ‾ U α U ‾ U α = α U ‾ U \overline{U}\alpha^*U=\overline{U}U\alpha\\
\overline{U}U\alpha=\alpha\overline{U}U U α ∗ U = U U α U U α = α U U
也就是 U ‾ U \overline{U}U U U 和所有 real linear operator commute,再因为任意 linear operator 可以分为实部和虚部的和,所以也就是可以和任意 linear operator commute。因此 U ‾ U \overline{U}U U U 是个数,且很明显是实数(conjugate 相等),而且还是个正数,因为 ⟨ P ∣ U ‾ U ∣ P ⟩ \langle P|\overline{U}U|P\rangle ⟨ P ∣ U U ∣ P ⟩ 和 ⟨ P ∣ P ⟩ \langle P|P\rangle ⟨ P ∣ P ⟩ 都得是正的。那么我们不妨假设:
U ‾ U = 1 \overline{U}U=1 U U = 1
并称 linear operator 为 unitary ,α ∗ \alpha^* α ∗ 这样的变化为 unitary transformation 。
在经典力学 中,我们可以通过变换来从一组 q r , p r q_r,p_r q r , p r 转换成 q r ∗ , p r ∗ q_r^*, p_r^* q r ∗ , p r ∗ ,且保持相同的 P.B. 关系。我们下面证明 unitary 也有这样的性质,从而表明 unitary transformation 在量子力学中等同于经典力学中的。我们首先注意到,q r , p r q_r, p_r q r , p r 们的关系满足:
q r q s − q s q r = 0 p r p s − p s p r = 0 q r p s − p s q r = i ℏ δ r s q_rq_s-q_sq_r=0\\
p_rp_s-p_sp_r=0\\
q_rp_s-p_sq_r=i\hbar\delta_{rs}\\ q r q s − q s q r = 0 p r p s − p s p r = 0 q r p s − p s q r = i ℏ δ r s
而这些代数关系都会在 unitary transformation 下保持。而反过来,如果有 q r ∗ , p r ∗ q_r^*, p_r^* q r ∗ , p r ∗ 满足 P.B. relation,我们是可以找到对应的 U U U 的。
考虑 Schrodinger representation,并把 basic ket ∣ q 1 ′ . . . q n ′ ⟩ |q_1'...q_n'\rangle ∣ q 1 ′ . . . q n ′ ⟩ 表示为 ∣ P ⟩ |P\rangle ∣ P ⟩ ,那么因为我们假设 q r ∗ , p r ∗ q_r^*, p_r^* q r ∗ , p r ∗ 满足 P.B. relation,所以我们也可以找到他们对应的 Schrodinger representation,其中 q r ∗ q_r^* q r ∗ 是 diagonal 的,而 p r ∗ p_r^* p r ∗ 是 − i ℏ ∂ / ∂ q r ∗ -i\hbar\partial/\partial q_r^* − i ℏ ∂ / ∂ q r ∗ ,我们把这个 representation 的 basic ket 表示为 ∣ q ∗ ′ ⟩ |{q^*}'\rangle ∣ q ∗ ′ ⟩ ,假设我们用如下的方法定义 U U U :
⟨ q ∗ ′ ∣ U ∣ q ′ ⟩ = δ ( q ∗ ′ − q ∗ ) \langle {q^*}'|U|q'\rangle=\delta({q^*}'-q^*) ⟨ q ∗ ′ ∣ U ∣ q ′ ⟩ = δ ( q ∗ ′ − q ∗ )
其中 δ ( q ∗ ′ − q ′ ) = δ ( q 1 ∗ ′ − q 1 ′ ) δ ( q 2 ∗ ′ − q 2 ′ ) . . . δ ( q n ∗ ′ − q n ′ ) \delta({q^*}'-q')=\delta({q_1^*}'-q_1')\delta({q_2^*}'-q_2')...\delta({q_n^*}'-q_n') δ ( q ∗ ′ − q ′ ) = δ ( q 1 ∗ ′ − q 1 ′ ) δ ( q 2 ∗ ′ − q 2 ′ ) . . . δ ( q n ∗ ′ − q n ′ ) ,那么就有:
⟨ q ∗ ′ ∣ U ‾ ∣ q ′ ⟩ = δ ( q ∗ ′ − q ∗ ) \langle {q^*}'|\overline{U}|q'\rangle=\delta({q^*}'-q^*) ⟨ q ∗ ′ ∣ U ∣ q ′ ⟩ = δ ( q ∗ ′ − q ∗ )
以及:
⟨ q ′ ∣ U ‾ U ∣ q ′ ′ ⟩ = δ ( q ′ − q ′ ′ ) \langle q'|\overline{U}U|q''\rangle = \delta(q'-q'') ⟨ q ′ ∣ U U ∣ q ′ ′ ⟩ = δ ( q ′ − q ′ ′ )
即 U ‾ U = 1 \overline{U}U=1 U U = 1 ,所以 U U U 是 unitary operator。进一步我们有:
⟨ q ∗ ′ ∣ q r ∗ U ∣ q ′ ⟩ = q r ∗ ′ δ ( q ∗ ′ − q ∗ ) ⟨ q ∗ ′ ∣ U q r ∣ q ′ ⟩ = q r ′ δ ( q ∗ ′ − q ∗ ) \langle {q^*}'|q_r^*U|q'\rangle={q_r^*}'\delta({q^*}'-q^*)\\
\langle {q^*}'|Uq_r|q'\rangle=q'_r\delta({q^*}'-q^*) ⟨ q ∗ ′ ∣ q r ∗ U ∣ q ′ ⟩ = q r ∗ ′ δ ( q ∗ ′ − q ∗ ) ⟨ q ∗ ′ ∣ U q r ∣ q ′ ⟩ = q r ′ δ ( q ∗ ′ − q ∗ )
右侧这俩式子实际上是相等的。所以我们有了:
q r ∗ U = U q r q r ∗ = U q r U − 1 q_r^*U=Uq_r\\
q_r^*=Uq_rU^{-1} q r ∗ U = U q r q r ∗ = U q r U − 1
因为 22 节中的:
⟨ q ′ ∣ p r = − i ℏ ∂ ∂ q r ′ ⟨ q ′ ∣ p r ∣ q ′ ⟩ = i ℏ ∂ ∂ q r ′ ∣ q ′ ⟩ \langle q'|p_r=-i\hbar\frac{\partial}{\partial q_r'}\langle q'|\\
p_r|q'\rangle=i\hbar\frac{\partial}{\partial q_r'}|q'\rangle ⟨ q ′ ∣ p r = − i ℏ ∂ q r ′ ∂ ⟨ q ′ ∣ p r ∣ q ′ ⟩ = i ℏ ∂ q r ′ ∂ ∣ q ′ ⟩
我们有:
⟨ q ∗ ′ ∣ p r ∗ U ∣ q ′ ⟩ = − i ℏ ∂ ∂ q r ∗ ′ δ ( q ∗ ′ − q ∗ ) ⟨ q ∗ ′ ∣ U p r ∣ q ′ ⟩ = i ℏ ∂ ∂ q r ′ δ ( q ∗ ′ − q ∗ ) \langle {q^*}'|p_r^*U|q'\rangle=-i\hbar\frac{\partial}{\partial {q_r^*}'}\delta({q^*}'-q^*)\\
\langle {q^*}'|Up_r|q'\rangle=i\hbar\frac{\partial}{\partial q_r'}\delta({q^*}'-q^*)\\ ⟨ q ∗ ′ ∣ p r ∗ U ∣ q ′ ⟩ = − i ℏ ∂ q r ∗ ′ ∂ δ ( q ∗ ′ − q ∗ ) ⟨ q ∗ ′ ∣ U p r ∣ q ′ ⟩ = i ℏ ∂ q r ′ ∂ δ ( q ∗ ′ − q ∗ )
显然有右侧相等。所以有:
p r ∗ U = U p r p r ∗ = U p r U − 1 p_r^*U=Up_r\\
p_r^*=Up_rU^{-1} p r ∗ U = U p r p r ∗ = U p r U − 1
也就证明了 unitary transformation 的所有性质。
对于最开始的式子,如果我们认为 U U U 和 unity 只差一个无穷小量(即做无穷小的 unitary transformation),我们有:
U = 1 + i ϵ F U − 1 = 1 − i ϵ F U=1+i\epsilon F\\
U^{-1}=1-i\epsilon F U = 1 + i ϵ F U − 1 = 1 − i ϵ F
那么就有:
α ∗ − α = i ϵ ( F α − α F ) = i ϵ [ α , F ] \alpha^*-\alpha=i\epsilon(F\alpha-\alpha F)=i\epsilon[\alpha, F] α ∗ − α = i ϵ ( F α − α F ) = i ϵ [ α , F ]
如果 α \alpha α 为 q q q 或 p p p ,这个变换等同于 classical infinitesimal contact transform(这是啥。。。)。
5 The equation of motion
5.27 Schrodinger's form for the equation of motion
考虑一个从未被 disturb 过的系统,我们假设 t t t 时刻的 state 对应的 ket 为 ∣ t ⟩ |t\rangle ∣ t ⟩ ,而同一时刻的不同状态,我们用 A A A 来标识(如 ∣ A t ⟩ |At\rangle ∣ A t ⟩ )。如果我们希望一个时刻的状态能决定另一个时刻 的状态,那么意味着 ∣ A t o ⟩ |At_o\rangle ∣ A t o ⟩ determines ∣ A t ⟩ |At\rangle ∣ A t ⟩ except for a numerical factor。加上叠加态原理,这意味着如果在 t 0 t_0 t 0 时刻有:
∣ R t 0 ⟩ = c 1 ∣ A t 0 ⟩ + c 2 ∣ B t 0 ⟩ |Rt_0\rangle=c_1|At_0\rangle+c_2|Bt_0\rangle ∣ R t 0 ⟩ = c 1 ∣ A t 0 ⟩ + c 2 ∣ B t 0 ⟩
则在 t t t 时刻有:
∣ R t ⟩ = c 1 ∣ A t ⟩ + c 2 ∣ B t ⟩ |Rt\rangle=c_1|At\rangle+c_2|Bt\rangle ∣ R t ⟩ = c 1 ∣ A t ⟩ + c 2 ∣ B t ⟩
这意味着 ∣ P t ⟩ |Pt\rangle ∣ P t ⟩ 是 ∣ P t 0 ⟩ |Pt_0\rangle ∣ P t 0 ⟩ 的 linear function,即:
∣ P t ⟩ = T ∣ P t 0 ⟩ |Pt\rangle=T|Pt_0\rangle ∣ P t ⟩ = T ∣ P t 0 ⟩
其中 T T T 为 linear operator,且 independent of P P P , only depending on t t t and t 0 t_0 t 0 。
我们继续假设 ∣ P t ⟩ |Pt\rangle ∣ P t ⟩ 和 ∣ P t 0 ⟩ |Pt_0\rangle ∣ P t 0 ⟩ 的长度相等。这是一个物理上的假设,他相当于是加强了 the principle of superposition,即,对于任意复数 c 1 , c 2 c1,c2 c 1 , c 2 ,都有 c 1 ∣ P t ⟩ + c 2 ∣ Q t ⟩ c_1|Pt\rangle+c_2|Qt\rangle c 1 ∣ P t ⟩ + c 2 ∣ Q t ⟩ 的长度等于 c 1 ∣ P t 0 ⟩ + c 2 ∣ Q t 0 ⟩ c_1|Pt_0\rangle+c_2|Qt_0\rangle c 1 ∣ P t 0 ⟩ + c 2 ∣ Q t 0 ⟩ ,也就是:
∣ c 1 ∣ 2 ⟨ P t ∣ P t ⟩ + ∣ c 2 ∣ 2 ⟨ Q t ∣ Q t ⟩ + c 1 c 2 ˉ ⟨ Q t ∣ P t ⟩ + c 2 c 1 ˉ ⟨ P t ∣ Q t ⟩ = ∣ c 1 ∣ 2 ⟨ P t 0 ∣ P t 0 ⟩ + ∣ c 2 ∣ 2 ⟨ Q t 0 ∣ Q t 0 ⟩ + c 1 c 2 ˉ ⟨ Q t 0 ∣ P t 0 ⟩ + c 2 c 1 ˉ ⟨ P t 0 ∣ Q t 0 ⟩ ⟨ Q t ∣ P t ⟩ = ⟨ Q t 0 ∣ P t 0 ⟩ \begin{aligned}
|c_1|^2\langle Pt|Pt\rangle + |c_2|^2\langle Qt|Qt\rangle &+ c_1\bar{c_2}\langle Qt|Pt\rangle + c_2\bar{c_1}\langle Pt|Qt\rangle=\\
|c_1|^2\langle Pt_0|Pt_0\rangle + |c_2|^2\langle Qt_0|Qt_0\rangle &+ c_1\bar{c_2}\langle Qt_0|Pt_0\rangle + c_2\bar{c_1}\langle Pt_0|Qt_0\rangle\\
\\
\langle Qt|Pt\rangle&=\langle Qt_0|Pt_0\rangle
\end{aligned} ∣ c 1 ∣ 2 ⟨ P t ∣ P t ⟩ + ∣ c 2 ∣ 2 ⟨ Q t ∣ Q t ⟩ ∣ c 1 ∣ 2 ⟨ P t 0 ∣ P t 0 ⟩ + ∣ c 2 ∣ 2 ⟨ Q t 0 ∣ Q t 0 ⟩ ⟨ Q t ∣ P t ⟩ + c 1 c 2 ˉ ⟨ Q t ∣ P t ⟩ + c 2 c 1 ˉ ⟨ P t ∣ Q t ⟩ = + c 1 c 2 ˉ ⟨ Q t 0 ∣ P t 0 ⟩ + c 2 c 1 ˉ ⟨ P t 0 ∣ Q t 0 ⟩ = ⟨ Q t 0 ∣ P t 0 ⟩
所以 ∣ P t ⟩ |Pt\rangle ∣ P t ⟩ 和 ∣ P t 0 ⟩ |Pt_0\rangle ∣ P t 0 ⟩ 的关系类似于 25 节中 displaced 和 undisplaced kets,不过这里是 time displacement 了。那么对应地,我们可以推导出:
T ‾ T = 1 \overline{T}T=1 T T = 1
即 T T T 是 unitary。我们取一下极限(假设物理使该极限存在):
d ∣ P t 0 ⟩ d t 0 = lim t → t 0 ∣ P t ⟩ − ∣ P t 0 ⟩ t − t 0 = { lim t → t 0 T − 1 t − t 0 } ∣ P t 0 ⟩ \frac{d|Pt_0\rangle}{dt_0}=\lim_{t\rightarrow t_0}{\frac{|Pt\rangle-|Pt_0\rangle}{t-t_0}}=\{\lim_{t\rightarrow t_0}{\frac{T-1}{t-t_0}}\}|Pt_0\rangle d t 0 d ∣ P t 0 ⟩ = t → t 0 lim t − t 0 ∣ P t ⟩ − ∣ P t 0 ⟩ = { t → t 0 lim t − t 0 T − 1 } ∣ P t 0 ⟩
仍然同 25 节,给这个极限乘上 i ℏ i\hbar i ℏ ,并定义为 H H H ,并将 t 0 t_0 t 0 一般化为 t t t 有:
i ℏ d ∣ P t ⟩ d t = H ( t ) ∣ P t ⟩ i\hbar\frac{d|Pt\rangle}{dt}=H(t)|Pt\rangle i ℏ d t d ∣ P t ⟩ = H ( t ) ∣ P t ⟩
这就是 Schrodinger's form for the equation of motion,其中只包含了一个 real linear operator H ( t ) H(t) H ( t ) ,他的实际表示方法由动力系统的特点决定。我们假设 H ( t ) H(t) H ( t ) 是系统的总能量 ,有 2 个理由:
为了和经典力学相似,这点下一节会讲;
因为我们一直在和 25 节中位移 displacement 相比较,而相对论中将能量和时间的关系与动量和位移的关系相同。(这个需要我之后查查...)
继续带入上面的关系,有:
i ℏ d T d t ∣ P t 0 ⟩ = H ( t ) T ∣ P t 0 ⟩ i\hbar\frac{dT}{dt}|Pt_0\rangle=H(t)T|Pt_0\rangle i ℏ d t d T ∣ P t 0 ⟩ = H ( t ) T ∣ P t 0 ⟩
对任何 ket ∣ P t 0 ⟩ |Pt_0\rangle ∣ P t 0 ⟩ 成立,所以我们有:
i ℏ d T d t = H ( t ) T i\hbar\frac{dT}{dt}=H(t)T i ℏ d t d T = H ( t ) T
如果我们选 a complete set of commuting observables ξ \xi ξ diagonal 来做 representation,并假设 ⟨ ξ ′ ∣ P t ⟩ = ψ ( ξ ′ t ) \langle\xi'|Pt\rangle=\psi(\xi't) ⟨ ξ ′ ∣ P t ⟩ = ψ ( ξ ′ t ) ,也就是 ∣ P t ⟩ |Pt\rangle ∣ P t ⟩ 可以表示为 ψ ( ξ ′ t ) ⟩ \psi(\xi't)\rangle ψ ( ξ ′ t ) ⟩ ,那么上面的式子可以变成:
i ℏ d ∂ t ψ ( ξ ′ t ) ⟩ = H ψ ( ξ ′ t ) ⟩ i\hbar\frac{d}{\partial t}\psi(\xi't)\rangle=H\psi(\xi't)\rangle i ℏ ∂ t d ψ ( ξ ′ t ) ⟩ = H ψ ( ξ ′ t ) ⟩
这个方程被称为 Schrodinger's wave equation,他的解 ψ ( ξ ′ t ) \psi(\xi't) ψ ( ξ ′ t ) 是 time-dependent wave functions。它表示了系统的运动状态,以及 the square of its modulus 给了 ξ \xi ξ 在 t t t 时刻处在某个特殊值的概率。对于一个可以用 canonical coordinates 和 momenta 描述的系统,我们可以用 Schrodinger representation,并和 22 节一样转换 H H H (使用 f ( q 1 . . . q n , p 1 , . . . , p n ) = f ( q 1 , . . . , q n ) , − i ℏ ∂ / ∂ q 1 , . . . , − i ℏ ∂ / ∂ q n f(q_1...q_n,p_1,...,p_n)=f(q_1,...,q_n),-i\hbar\partial/\partial q_1,...,-i\hbar\partial/\partial q_n f ( q 1 . . . q n , p 1 , . . . , p n ) = f ( q 1 , . . . , q n ) , − i ℏ ∂ / ∂ q 1 , . . . , − i ℏ ∂ / ∂ q n )。
5.28. Heisenberg's form for the equations of motion
之前一节,我们将 the state of undisturbed motion 对应为了一个 moving ket,也就是每个时刻的状态对应了该时刻的 ket,我们称这种观点为 Schrodinger's picture 。还可以用另一种视角,认为 state 对应的是 fixed vector,而 dynamic variable 对应的是 moving linear operator,这被称为 Heisenberg picture 。注意,没说 Schrodinger's picture 里的算子和时间无关。
来看公式。从 Schrodinger's picture 的一个运动的 ket ∣ α ⟩ |\alpha\rangle ∣ α ⟩ ,假如我们逆转一下时间变换 T T T ,就有:
∣ α ∗ ⟩ = T − 1 ∣ α ⟩ |\alpha^*\rangle=T^{-1}|\alpha\rangle ∣ α ∗ ⟩ = T − 1 ∣ α ⟩
这样 ∣ α ∗ ⟩ |\alpha^*\rangle ∣ α ∗ ⟩ 就相当于与时间无关了,也就是 fixed 了。那么做到这件事,需要:
α ∗ = T − 1 α T \alpha^*=T^{-1}\alpha T α ∗ = T − 1 α T
那么为了表现出 Heisenberg picture 中 operator 的运动,我们用 v t v_t v t 来替代 α ∗ \alpha^* α ∗ ,即:
v t = T − 1 v T T v t = v T v_t=T^{-1}vT\\
Tv_t=vT v t = T − 1 v T T v t = v T
两边关于 t t t 求导,就是:
d T d t v t + T d v t d t = v d T d t \frac{dT}{dt}v_t+T\frac{dv_t}{dt}=v\frac{dT}{dt} d t d T v t + T d t d v t = v d t d T
加之 i ℏ ( d T / d t ) = H ( t ) T i\hbar(dT/dt)=H(t)T i ℏ ( d T / d t ) = H ( t ) T ,有:
H T v t + i ℏ T d v t d t = v H T i ℏ d v t d t = T − 1 v H T − T − 1 H T v t = v t H t − H t v t \begin{aligned}
HTv_t&+i\hbar T\frac{dv_t}{dt}=vHT\\
i\hbar \frac{dv_t}{dt}&=T^{-1}vHT-T^{-1}HTv_t\\
&=v_tH_t-H_tv_t
\end{aligned} H T v t i ℏ d t d v t + i ℏ T d t d v t = v H T = T − 1 v H T − T − 1 H T v t = v t H t − H t v t
其中 H t = T − 1 H T H_t=T^{-1}HT H t = T − 1 H T 。我们也就可以用 P.B. 表示成:
d v t d t = [ v t , H t ] \frac{dv_t}{dt}=[v_t, H_t] d t d v t = [ v t , H t ]
这被称之为 Heisenberg's form for the equations of motion。我们称 H H H 为 Schrodinger dynamical variable,H t H_t H t 为 Heisenberg dynamical variable。这个 P.B. 关系可以和经典力学做对比,因为经典力学中,也是 dynamical variable 随时间变化的。在经典力学中 ,有:
q r d t = ∂ H ∂ p r , d p r d t = − ∂ H ∂ q r \frac{q_r}{dt}=\frac{\partial H}{\partial p_r},\quad\frac{dp_r}{dt}=-\frac{\partial H}{\partial q_r} d t q r = ∂ p r ∂ H , d t d p r = − ∂ q r ∂ H
这里的 H H H 是 Hamiltonian。那么对于一个是 q , p q,p q , p 且不显式依赖 t t t 的 v v v ,有:
d v d t = ∑ r { ∂ v ∂ q r d q r d t + ∂ v ∂ p r d p r d t } = ∑ r { ∂ v ∂ q r ∂ H ∂ p r − ∂ v ∂ p r ∂ H ∂ q r } = [ v , H ] \begin{aligned}
\frac{dv}{dt}&=\sum_r\{\frac{\partial v}{\partial q_r}\frac{dq_r}{dt}+\frac{\partial v}{\partial p_r}\frac{dp_r}{dt}\}\\
&=\sum_r\{\frac{\partial v}{\partial q_r}\frac{\partial H}{\partial p_r}-\frac{\partial v}{\partial p_r}\frac{\partial H}{\partial q_r}\}\\
&=[v, H]
\end{aligned} d t d v = r ∑ { ∂ q r ∂ v d t d q r + ∂ p r ∂ v d t d p r } = r ∑ { ∂ q r ∂ v ∂ p r ∂ H − ∂ p r ∂ v ∂ q r ∂ H } = [ v , H ]
这个和量子系统相同的性质,让我们可以将 H t H_t H t 与 Hamiltonion 类比。考虑到经典系统中,如果 Hamiltonian 关于 q , p q,p q , p 的函数确定了,那么整个系统就在数学上确定了,而在量子系统中 H H H (Schrodinger's picture)或者 H t H_t H t (Heisenberg picture)的 commuting relation 确定了,equation of motion 就确定了,系统也就确定了,所以我们称 H H H 为 Hamiltonian of dynamic variable。
在个别情况下,由于量子系统需要考虑到 2 个算子能否 commute 的问题,所以不能直接类比经典系统的 Hamiltonian 函数,但是在原子物理涉及到的基本场景下,一般我们是可以做这样的类比的。所以我们也可以用和描述经典系统相同的方式去描述量子系统,例如描述具有某种质量的粒子在场中受力。
假如说 v t v_t v t 与时间无关,再因为我们有 T ( t 0 ) = 1 T(t_0)=1 T ( t 0 ) = 1 ,所以:
v t = v t 0 = v v_t=v_{t_0}=v v t = v t 0 = v
我们称这样的 v t v_t v t 或 v v v 为 constant of motion 。这要求 v v v 与 H H H commute(P.B. 为 0 了),一般满足这个条件要求 H H H 是 constant,这样我们也可以得到 H t H_t H t 是 constant,即如果 Hamiltionian 在 Schrodinger's picture 里是 constant 的,在 Heisenberg picture 中一样是。(这里的逻辑推导我没明白...)
对于一个孤立的,没有施加任何外力的系统,运动过程总是有一些常量的。例如,我们认为总能量 Hamiltonian 是不变的,以及从物理上来说,我们可以认为移动了一个小距离后总能量不变,也就是 D D D 和 H H H commute,也是 constant of the motion。那么考虑无穷小的位移,我们有 d x , d y , d z d_x,d_y,d_z d x , d y , d z 是 constant,根据 25 节的结论,这对应了 p p p 是 constant of the motion。另一方面,在旋转之后,总能量也应该不变,这会导出角动量是 constant of the motion(在 35 节会证明),所以在 Heisenberg's picture 下能有能量守恒,动量守恒和角动量守恒定律。
这两种形式中,在实际情况下 Schrodinger's picture 更好用一些,因为 wave function 是个函数,而 Heisenberg's picture 的 operator 要用多很多的数来表示。但是 Heisenberg's picture 让我们能在量子系统里类比很多经典力学中的特性。
5.29 Stationary states
考虑一个能量为恒定的动态系统。那么从:
i ℏ d T d t = H ( t ) T i\hbar\frac{dT}{dt}=H(t)T i ℏ d t d T = H ( t ) T
(因为这一节中所有的量都和 H H H commute,所以可以把 H H H 当成普通的代数量),所以我们可以积分得到(假设我们认为 t = t 0 t=t_0 t = t 0 时,T = 1 T=1 T = 1 ):
T = e − i ( t − t 0 ) / ℏ T=e^{-i(t-t_0)/\hbar} T = e − i ( t − t 0 ) / ℏ
这使得 Schrodinger's wave function 变成了:
∣ P t ⟩ = e − i H ( t − t 0 ) / ℏ ∣ P t 0 ⟩ |Pt\rangle=e^{-iH(t-t_0)/\hbar}|Pt_0\rangle ∣ P t ⟩ = e − i H ( t − t 0 ) / ℏ ∣ P t 0 ⟩
以及 Heisenberg 方程里:
v t = e i H ( t − t 0 ) / ℏ v e − i H ( t − t 0 ) / ℏ H t = H v_t=e^{iH(t-t_0)/\hbar}ve^{-iH(t-t_0)/\hbar}\\
H^t=H v t = e i H ( t − t 0 ) / ℏ v e − i H ( t − t 0 ) / ℏ H t = H
不过就像上一节说的,Heisenberg 这个形式不太好用,我们还是回来看 Schrodinger 的形式。
如果 t 0 t_0 t 0 时刻的状态是系统能量的 eigenstate ,那么 ∣ P t 0 ⟩ |Pt_0\rangle ∣ P t 0 ⟩ 是 H H H 的 eigenket,我们假设特征值为 H ′ H' H ′ ,那么根据 11 节的特性,有:
∣ P t ⟩ = e − i H ′ ( t − t 0 ) / ℏ ∣ P t 0 ⟩ |Pt\rangle=e^{-iH'(t-t_0)/\hbar}|Pt_0\rangle ∣ P t ⟩ = e − i H ′ ( t − t 0 ) / ℏ ∣ P t 0 ⟩
也就是 ∣ P t ⟩ |P_t\rangle ∣ P t ⟩ 和 ∣ P t 0 ⟩ |P_{t_0}\rangle ∣ P t 0 ⟩ 只相差一个 phase factor。所以 state 会一直是能量的 eigenstate。进一步可以发现 ∣ P t ⟩ |Pt\rangle ∣ P t ⟩ 的方向也没变(我感觉这里的意思是他在成比例的旋转),所以其实就是这个 state 没在变,我们称之为 stationary state 。对于 stationnary state,观测结果的概率分布是不随时间变化的。
转为用波函数表示,我们有:
ψ ( ξ t ) = ψ 0 ( ξ ) e − i H ′ t / ℏ \psi(\xi t)=\psi_0(\xi)e^{-iH't/\hbar} ψ ( ξ t ) = ψ 0 ( ξ ) e − i H ′ t / ℏ
以及薛定谔方程变为:
H ′ ψ 0 ⟩ = H ψ 0 ⟩ H'\psi_0\rangle=H\psi_0\rangle H ′ ψ 0 ⟩ = H ψ 0 ⟩
我们称这样的 ψ 0 \psi_0 ψ 0 为 H H H 的 eigenfunction。
在 Heisenberg picture 里,stationary states 是能量的 eigenvector。我们可以建立一个 representation,其中所有的 basic vector 都是能量的 eigenvector,这些 basic vector 也就对应了 stationary state。这样的 representation 被称为 Heisenberg representation 。在这种 representation 中,能量是 diagonal 的,其他 diagonal dynamical variable 都能和能量 commute,也就是 constant of the motion。建立这样的一个 representation 就是找到一组 constant of the motion 作为 a complete commute set,那么由 19 节的定理 2,H H H 是这些 observable 的函数。一般为了方便,我们有时直接把能量放在里面。
假设这种表示的 basic vector 是 ⟨ α ′ ∣ \langle \alpha'| ⟨ α ′ ∣ 和 ∣ α ′ ′ ⟩ |\alpha''\rangle ∣ α ′ ′ ⟩ ,那么能量是 α \alpha α 的函数,也就是 H = H ( α ) H=H(\alpha) H = H ( α ) ,那么有:
⟨ α ′ ∣ v t ∣ α ′ ′ ⟩ = ⟨ α ′ ∣ e i H ( t − t 0 ) / ℏ v e − i H ( t − t 0 ) / ℏ ∣ α ′ ′ ⟩ = e i ( H ′ − H ′ ′ ) ( t − t 0 ) ⟨ α ′ ∣ v ∣ α ′ ′ ⟩ \begin{aligned}
\langle\alpha'|v_t|\alpha''\rangle&=\langle\alpha'|e^{iH(t-t_0)/\hbar}ve^{-iH(t-t_0)/\hbar}|\alpha''\rangle\\
&=e^{i(H'-H'')(t-t_0)}\langle\alpha'|v|\alpha''\rangle
\end{aligned} ⟨ α ′ ∣ v t ∣ α ′ ′ ⟩ = ⟨ α ′ ∣ e i H ( t − t 0 ) / ℏ v e − i H ( t − t 0 ) / ℏ ∣ α ′ ′ ⟩ = e i ( H ′ − H ′ ′ ) ( t − t 0 ) ⟨ α ′ ∣ v ∣ α ′ ′ ⟩
其中 H ′ = H ( α ′ ) , H ′ ′ = H ( α ′ ′ ) H'=H(\alpha'), H''=H(\alpha'') H ′ = H ( α ′ ) , H ′ ′ = H ( α ′ ′ ) 。这个式子就展示了 Heisenberg dyanmical variable 对应的 Heisenberg matrix 的每个元素是啥样的。上式对应了一个频率
∣ H ′ − H ′ ′ ∣ / 2 π ℏ = ∣ H ′ − H ′ ′ ∣ / h |H'-H''|/2\pi\hbar=|H'-H''|/h ∣ H ′ − H ′ ′ ∣ / 2 π ℏ = ∣ H ′ − H ′ ′ ∣ / h
也就是说频率和能量差对应,这个结果和 Combination Law of Spectroscopy 以及 Bohr's Frequency Condition 相联系,这个频率对应了能级 α ′ \alpha' α ′ 和 α ′ ′ \alpha'' α ′ ′ 之间变化时辐射或吸收的电磁波的频率。H H H 的特征值就是 Bohr's energy level(能级),相关内容会在 45 节讨论。
5.30 The Free Particle
最基础的量子力学系统就是一个自由粒子,也就是没有受任何外力的粒子。那么在笛卡尔坐标系下,假如它的动量在 3 个维度上是 p x , p y , p z p_x,p_y,p_z p x , p y , p z ,那么对应的 Hamiltonioan 根据牛顿力学是:
H = 1 2 m ( p x 2 + p y 2 + p z 2 ) H=\frac{1}{2m}(p_x^2+p_y^2+p_z^2) H = 2 m 1 ( p x 2 + p y 2 + p z 2 )
在相对论下是:
H = c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 1 2 H=c(m^2c^2+p_x^2+p_y^2+p_z^2)^{\frac{1}{2}} H = c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 2 1
我们可以直接把这两个式子拿进量子力学(算子的平方根是啥在 11 节定义过了)。我们首先来求解 Heisenberg equation of motion。由 21 节中的 quantum condition,我们有 p x , p y , p z p_x,p_y,p_z p x , p y , p z 相互 commute,所以由 19 节的定理 1,有 p x p_x p x 和 H H H commute,即 p x p_x p x 是 constant of motion,和经典力学的公式相同。另外因为:
i ℏ d x t d t = x t H t − H t x t = x t c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 1 2 − c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 1 2 x t i\hbar\frac{dx_t}{dt}=x_tH_t-H_tx_t=x_tc(m^2c^2+p_x^2+p_y^2+p_z^2)^{\frac{1}{2}}-c(m^2c^2+p_x^2+p_y^2+p_z^2)^{\frac{1}{2}}x_t i ℏ d t d x t = x t H t − H t x t = x t c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 2 1 − c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 2 1 x t
而由于 22 节中的(这里把 p p p 和 q q q 换过来了,所以还取了共轭):
q r f − f q r = i ℏ ∂ f ∂ p r q_rf-fq_r=i\hbar\frac{\partial f}{\partial p_r} q r f − f q r = i ℏ ∂ p r ∂ f
所以有:
x ˙ t = ∂ ∂ p r c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 1 2 = c 2 p x H \dot{x}_t=\frac{\partial}{\partial p_r}c(m^2c^2+p_x^2+p_y^2+p_z^2)^{\frac{1}{2}}=\frac{c^2p_x}{H} x ˙ t = ∂ p r ∂ c ( m 2 c 2 + p x 2 + p y 2 + p z 2 ) 2 1 = H c 2 p x
那么:
v = ( x ˙ t 2 + y ˙ t 2 + z ˙ t 2 ) = c 2 ( p x 2 + p y 2 + p z 2 ) 1 2 / H v=(\dot{x}_t^2+\dot{y}_t^2+\dot{z}_t^2)=c^2(p_x^2+p_y^2+p_z^2)^{\frac{1}{2}}/H v = ( x ˙ t 2 + y ˙ t 2 + z ˙ t 2 ) = c 2 ( p x 2 + p y 2 + p z 2 ) 2 1 / H
都和经典理论相对应。
让我们接下来考虑动量的 eigenstate,对应的 eigenvalue 是 p x ′ , p y ′ , p z ′ p_x',p_y',p_z' p x ′ , p y ′ , p z ′ ,这个状态肯定也将会是 H H H 的 eigenstate,对应的特征值为:
H ′ = c ( m 2 c 2 + p x ′ 2 + p y ′ 2 + p z ′ 2 ) 1 2 H'=c(m^2c^2+{p_x'}^2+{p_y'}^2+{p_z'}^2)^{\frac{1}{2}} H ′ = c ( m 2 c 2 + p x ′ 2 + p y ′ 2 + p z ′ 2 ) 2 1
那么这个 state 在 Schrodinger's representative 中对应的波动函数满足:
p x ′ ψ ( x y z ) ⟩ = p x ψ ( x y z ) ⟩ = − i ℏ ∂ ψ ( x y z ) ∂ x ⟩ p_x'\psi(xyz)\rangle=p_x\psi(xyz)\rangle=-i\hbar\frac{\partial\psi(xyz)}{\partial x}\rangle p x ′ ψ ( x y z ) ⟩ = p x ψ ( x y z ) ⟩ = − i ℏ ∂ x ∂ ψ ( x y z ) ⟩
对于 p y , p z p_y, p_z p y , p z 来说也是一样,所以我们可以求解得到:
ψ ( x y z ) = a e i ( p x ′ x + p y ′ y + p z ′ z ) / ℏ \psi(xyz)=ae^{i(p_x'x+p_y'y+p_z'z)/\hbar} ψ ( x y z ) = a e i ( p x ′ x + p y ′ y + p z ′ z ) / ℏ
其中 a a a 和 x , y , z x,y,z x , y , z 均无关。加上上一节的和时间相关的项,我们有:
ψ ( x y z ) = a 0 e i ( p x ′ x + p y ′ y + p z ′ z − H ′ t ) / ℏ \psi(xyz)=a_0e^{i(p_x'x+p_y'y+p_z'z-H't)/\hbar} ψ ( x y z ) = a 0 e i ( p x ′ x + p y ′ y + p z ′ z − H ′ t ) / ℏ
其中 a 0 a_0 a 0 和 x , y , z , t x,y,z,t x , y , z , t 均无关。
这个解也确实是个“波”函数,我们可以得到对应的频率为 v = H ′ / h v=H'/h v = H ′ / h ,波长为 λ = h / ( p x ′ 2 + p y ′ 2 + p z ′ 2 ) 1 / 2 = h / P ′ \lambda=h/({p_x'}^2+{p_y'}^2+{p_z'}^2)^{1/2}=h/P' λ = h / ( p x ′ 2 + p y ′ 2 + p z ′ 2 ) 1 / 2 = h / P ′ 。波速满足:
λ v = H ′ / P ′ = c 2 / v ′ \lambda v=H'/P'=c^2/v' λ v = H ′ / P ′ = c 2 / v ′
上面的几个式子都是相对论系统下的不变量,德布罗意就是通过这样的不变量,在发现量子力学之前就求得了上面的波函数,这个波函数因此被称为 de Broglie waves 。
在质量 m m m 很小而经典系统中的速度 v v v 为 c c c 时,波速也为 c c c ,这个波就会类似于光子产生的光波,区别在于他们不涉及 polarization 以及包含一个 complex exponential 而不是 sines 和 cosines。上面的式子也可以用来将 光子的能量和频率,动量和波长联系起来。
上面求得的这个波函数的特点是,粒子在任何一个 volume 中出现的概率都是相同的,和 volume 的位置无关,这也就成了海森堡测不准原理的一个例子,也就是在动量完全确定的时候,位置是完全未知的。当然,实践中不会有这样的粒子,实践中的例子一般都是用 wave packet 表示的,也就是由多个上面的波函数叠加得到。在流体动力学(hydrodynamics)中,wave packet 的速度,即波的 group velocipy 为:
d v d ( 1 / λ ) = d H ′ d P ′ = c d d P ′ ( m c 2 + P ′ 2 ) 1 2 = c 2 P ′ H ′ = v ′ \frac{dv}{d(1/\lambda)}=\frac{dH'}{dP'}=c\frac{d}{dP'}(mc^2+P'^2)^{\frac{1}{2}}=\frac{c^2P'}{H'}=v' d ( 1 / λ ) d v = d P ′ d H ′ = c d P ′ d ( m c 2 + P ′ 2 ) 2 1 = H ′ c 2 P ′ = v ′
所以 wave packet 的速度方向和大小都和例子的速度相同。
5.31 The Motion of Wave Packets
对于一个有 classical analogue 的 dynamical system,状态在量子力学中都应该对应为 wave packet(波包),也就是坐标和动量都都在一个小范围内,其精确度由海森堡测不准原理限定。一个合适的理论应该保证在量子力学中的 wave packet 的 classical analogue 也是 wave packet,且运动的方式和 Schrodinger's equation 规定的相符。下面我们来证明一下这件事。
假设在 Schrodinger's representation 下,time-dependent wave function 为:
ψ ( q t ) = A e i S / ℏ \psi(qt)=Ae^{iS/\hbar} ψ ( q t ) = A e i S / ℏ
其中 A A A 和 S S S 是 real function,且不会随 q , t q,t q , t 剧烈变动。那么我们带入波动方程,有:
i ℏ ∂ ∂ t A e i S / ℏ ⟩ = H ( q r , p r ) A e i S / ℏ ⟩ { i ℏ ∂ A ∂ t − A ∂ S ∂ t } ⟩ = e − i S / ℏ H ( q r , p r ) A e i S / ℏ ⟩ i\hbar\frac{\partial}{\partial t}Ae^{iS/\hbar}\rangle=H(q_r,p_r)Ae^{iS/\hbar}\rangle\\
\{i\hbar\frac{\partial A}{\partial t}-A\frac{\partial S}{\partial t}\}\rangle=e^{-iS/\hbar}H(q_r,p_r)Ae^{iS/\hbar}\rangle i ℏ ∂ t ∂ A e i S / ℏ ⟩ = H ( q r , p r ) A e i S / ℏ ⟩ { i ℏ ∂ t ∂ A − A ∂ t ∂ S } ⟩ = e − i S / ℏ H ( q r , p r ) A e i S / ℏ ⟩
很显然 e − i S / ℏ e^{-iS/\hbar} e − i S / ℏ 是个 unitary linear operator,也就可以对应一个 unitary transformation。因为 27 节有结论:
p r f − f p r = − i ℏ ∂ f / ∂ q r q r f − f q r = i ℏ ∂ f / ∂ p r p_rf-fp_r=-i\hbar\partial f/\partial q_r\\
q_rf-fq_r=i\hbar\partial f/\partial p_r p r f − f p r = − i ℏ ∂ f / ∂ q r q r f − f q r = i ℏ ∂ f / ∂ p r
加之 S S S 不依赖 p r p_r p r 所以有:
e − i S / ℏ q r e u S / ℏ = q r e − i S / ℏ p r e u S / ℏ = p r + ∂ S / ∂ q r e^{-iS/\hbar}q_re^{uS/\hbar}=q_r\\
e^{-iS/\hbar}p_re^{uS/\hbar}=p_r + \partial S/\partial q_r e − i S / ℏ q r e u S / ℏ = q r e − i S / ℏ p r e u S / ℏ = p r + ∂ S / ∂ q r
那么带入 H H H 就有:
e − i S / ℏ H ( q r , p r ) e u S / ℏ = H ( q r , p r + ∂ S / ∂ q r ) e^{-iS/\hbar}H(q_r,p_r)e^{uS/\hbar}=H(q_r, p_r + \partial S/\partial q_r) e − i S / ℏ H ( q r , p r ) e u S / ℏ = H ( q r , p r + ∂ S / ∂ q r )
因为 unitary transformation 保代数关系,所以上面的方程变成了:
{ i ℏ ∂ A ∂ t − A ∂ S ∂ t } ⟩ = H ( q r , p r + ∂ S ∂ q r ) A ⟩ \{i\hbar\frac{\partial A}{\partial t}-A\frac{\partial S}{\partial t}\}\rangle=H(q_r,p_r+\frac{\partial S}{\partial q_r})A\rangle { i ℏ ∂ t ∂ A − A ∂ t ∂ S } ⟩ = H ( q r , p r + ∂ q r ∂ S ) A ⟩
我们进一步假设 ℏ \hbar ℏ 是小量可以被忽略,这样我们还会进一步忽略 p r p_r p r ,因为 p r = − i ℏ ∂ / ∂ q r p_r=-i\hbar\partial/\partial q_r p r = − i ℏ ∂ / ∂ q r ,上面的式子就变成了:
− ∂ S ∂ t = H c ( q r , ∂ S ∂ q r ) -\frac{\partial S}{\partial t}=H_c(q_r, \frac{\partial S}{\partial q_r}) − ∂ t ∂ S = H c ( q r , ∂ q r ∂ S )
是 phase factor S S S 的微分方程。这个方程由 classical Hamiltionian H c H_c H c 决定,这个方程被称为 Hamilton-Jacobi equation。这个方程允许 S S S 为实函数,所以和最开始我们假设的波函数形式并没有冲突。
(中间这段是继续求解 A A A ,我直接跳过了...后面有一段关于波包的延展...有点没看懂...)
5.32 The Action Principle
5.33 The Gibbs Ensemble
我们上述的讨论基本都在假设 dynamical system 在某一时刻处于某一确定的状态,类似于经典理论中坐标和动量都被确定了。这一节我们来讨论经典力学 中的 Gibbs ensemble,即我们考虑一个 phase space ,它的维度是系统自由度的 2 倍(因为有位移和动量),并且我们只给这个系统在某个状态的概率分布,那么我们就可以把这个系统看成是 phase space 中的流体,流体的质量就是系统处于 phase space 的某个体积的概率。假如引入对应的密度 ρ \rho ρ ,则有:
∂ ρ ∂ t = − ∑ r { ∂ ∂ q r ( ρ d q r d t ) + ∂ ∂ p r ( ρ d p r d t ) } = − ∑ r { ∂ ∂ q r ( ρ p a r t i a l H ∂ p r ) − ∂ ∂ p r ( ρ p a r t i a l H ∂ q r ) } = − [ ρ , H ] \begin{aligned}
\frac{\partial \rho}{\partial t}&=-\sum_r\{\frac{\partial}{\partial q_r}(\rho\frac{dq_r}{dt})+\frac{\partial}{\partial p_r}(\rho\frac{dp_r}{dt})\}\\
&=-\sum_r\{\frac{\partial}{\partial q_r}(\rho\frac{partial H}{\partial p_r})-\frac{\partial}{\partial p_r}(\rho\frac{partial H}{\partial q_r})\}\\
&=-[\rho, H]
\end{aligned} ∂ t ∂ ρ = − r ∑ { ∂ q r ∂ ( ρ d t d q r ) + ∂ p r ∂ ( ρ d t d p r ) } = − r ∑ { ∂ q r ∂ ( ρ ∂ p r p a r t i a l H ) − ∂ p r ∂ ( ρ ∂ q r p a r t i a l H ) } = − [ ρ , H ]
我们可以把它看作是这个流体的 equation of motion。它和 Heisenberg equation of motion 就差了个负号。
另外,作为 r h o rho r h o ,它应该有:
∫ ∫ ρ d q d p = 1 \int\int\rho dqdp=1 ∫ ∫ ρ d q d p = 1
如果 β \beta β 为 dynamical variable 的函数,它的平均值会是 ∫ ∫ β ρ d q d p \int\int\beta\rho dqdp ∫ ∫ β ρ d q d p 。我们在用的时候经常会假设:
∫ ∫ ρ d q d p = k \int\int\rho dqdp=k ∫ ∫ ρ d q d p = k
来模拟 k k k 个相似且相互不干扰的 dynamical system。
下面我们来证明在量子力学中有类似的 ρ \rho ρ 。我们假设一个动力系统可能出在离散的状态 中,并用 m m m 标记这些状态,用 ∣ m ⟩ |m\rangle ∣ m ⟩ 标注对应的 normalized ket,P m P_m P m 表示处于该状态的概率。我们定义 ρ \rho ρ 为:
ρ = ∑ m ∣ m ⟩ P m ⟨ m ∣ \rho=\sum_m|m\rangle P_m\langle m| ρ = m ∑ ∣ m ⟩ P m ⟨ m ∣
假设 ∣ ρ ′ ⟩ |\rho'\rangle ∣ ρ ′ ⟩ 是 ρ \rho ρ 的 eigenvalue,我们会有:
∑ m ⟨ ρ ′ ∣ m ⟩ P m ⟨ m ∣ ρ ′ ⟩ = ρ ′ ⟨ ρ ′ ∣ ρ ′ ⟩ ∑ m P m ∣ ⟨ m ∣ ρ ′ ⟩ ∣ 2 = ρ ′ ⟨ ρ ′ ∣ ρ ′ ⟩ \sum_m\langle \rho'|m\rangle P_m\langle m|\rho'\rangle=\rho'\langle\rho'|\rho'\rangle\\
\sum_mP_m|\langle m|\rho'\rangle|^2=\rho'\langle\rho'|\rho'\rangle m ∑ ⟨ ρ ′ ∣ m ⟩ P m ⟨ m ∣ ρ ′ ⟩ = ρ ′ ⟨ ρ ′ ∣ ρ ′ ⟩ m ∑ P m ∣ ⟨ m ∣ ρ ′ ⟩ ∣ 2 = ρ ′ ⟨ ρ ′ ∣ ρ ′ ⟩
因为 P m ≥ 0 P_m\ge0 P m ≥ 0 ,我们有 ρ ′ ≥ 0 \rho'\ge0 ρ ′ ≥ 0 。ρ \rho ρ 的特征值非负对应了经典理论中的 ρ \rho ρ 非负。
我们下面来推导 ρ \rho ρ 的 equation of motion,注意到在 Schrodinger's picture 中,ket 和 bra 会随时间变化,而 P m P_m P m 不会(因为在没有外界干扰的情况下,系统不会从一个状态变到另一个状态),那么我们有:
i ℏ d ρ d t = ∑ m i ℏ { d ∣ m ⟩ d t P m ⟨ m ∣ + ∣ m ⟩ P m d ⟨ m ∣ d t } = ∑ m { H ∣ m ⟩ P m ⟨ m ∣ + ∣ m ⟩ P m ⟨ m ∣ H } = H ρ − ρ H \begin{aligned}
i\hbar\frac{d\rho}{dt}&=\sum_m i\hbar\{\frac{d|m\rangle}{dt}P_m\langle m|+|m\rangle P_m\frac{d\langle m|}{dt}\}\\
&=\sum_m \{H|m\rangle P_m\langle m|+|m\rangle P_m\langle m|H\}\\
&=H\rho-\rho H
\end{aligned} i ℏ d t d ρ = m ∑ i ℏ { d t d ∣ m ⟩ P m ⟨ m ∣ + ∣ m ⟩ P m d t d ⟨ m ∣ } = m ∑ { H ∣ m ⟩ P m ⟨ m ∣ + ∣ m ⟩ P m ⟨ m ∣ H } = H ρ − ρ H
也和经典力学的结论对应上了。同时 ρ \rho ρ 也是只要给了最初的值就能推出来后面每一刻的值了。
12 节中我们提到过,一个系统在状态 m m m 时的观测 β \beta β 的结果的平均值为 ⟨ m ∣ β ∣ m ⟩ \langle m|\beta|m\rangle ⟨ m ∣ β ∣ m ⟩ ,所以多个系统的平均值会为 ∑ m P m ⟨ m ∣ β ∣ m ⟩ \sum_m P_m\langle m|\beta|m\rangle ∑ m P m ⟨ m ∣ β ∣ m ⟩ 。那么假如我们有一个由离散 的 basic ket 组成的 ∣ ξ ′ ⟩ |\xi'\rangle ∣ ξ ′ ⟩ representation,这相当于:
∑ m P m ⟨ m ∣ β ∣ m ⟩ = ∑ m , ξ ′ P m ⟨ m ∣ ξ ′ ⟩ ⟨ ξ ′ ∣ β ∣ m ⟩ = ∑ m , ξ ′ ⟨ ξ ′ ∣ β ∣ m ⟩ P m ⟨ m ∣ ξ ′ ⟩ = ∑ ξ ′ ⟨ ξ ′ ∣ β ρ ∣ ξ ′ ⟩ \begin{aligned}
\sum_m P_m\langle m|\beta|m\rangle&=\sum_{m,\xi'} P_m\langle m|\xi'\rangle\langle\xi'|\beta|m\rangle\\
&=\sum_{m,\xi'} \langle\xi'|\beta|m\rangle P_m\langle m|\xi'\rangle\\
&=\sum_{\xi'} \langle\xi'|\beta\rho|\xi'\rangle
\end{aligned} m ∑ P m ⟨ m ∣ β ∣ m ⟩ = m , ξ ′ ∑ P m ⟨ m ∣ ξ ′ ⟩ ⟨ ξ ′ ∣ β ∣ m ⟩ = m , ξ ′ ∑ ⟨ ξ ′ ∣ β ∣ m ⟩ P m ⟨ m ∣ ξ ′ ⟩ = ξ ′ ∑ ⟨ ξ ′ ∣ β ρ ∣ ξ ′ ⟩
由 17 节的矩阵乘结论,最后也等于 ∑ ξ ′ ⟨ ξ ′ ∣ ρ β ∣ ξ ′ ⟩ \sum_{\xi'} \langle\xi'|\rho\beta|\xi'\rangle ∑ ξ ′ ⟨ ξ ′ ∣ ρ β ∣ ξ ′ ⟩ 。这个式子也对应了经典力学中的公式。对于连续的 representation 我们也会有:
∫ ⟨ ξ ′ ∣ β ρ ∣ ξ ′ ⟩ d ξ ′ = ∫ ⟨ ξ ′ ∣ ρ β ∣ ξ ′ ⟩ d ξ ′ \int \langle\xi'|\beta\rho|\xi'\rangle d\xi'=\int \langle\xi'|\rho\beta|\xi'\rangle d\xi' ∫ ⟨ ξ ′ ∣ β ρ ∣ ξ ′ ⟩ d ξ ′ = ∫ ⟨ ξ ′ ∣ ρ β ∣ ξ ′ ⟩ d ξ ′
我们称这个积分为 diagonal sum in the continuous case,由 18 节的坐标变换公式,我们可以证明,diagonal sum 对于任何 representation 值都是相同的。
另外,因为 ∣ m ⟩ |m\rangle ∣ m ⟩ normalized,在 ξ ′ \xi' ξ ′ 离散 的条件下所以我们有:
∑ ξ ′ ⟨ ξ ′ ∣ ρ ∣ ξ ′ ⟩ = ∑ ξ ′ , m ⟨ ξ ′ ∣ m ⟩ P m ⟨ m ∣ ξ ′ ⟩ = ∑ m P m = 1 \sum_{\xi'}\langle\xi'|\rho|\xi'\rangle = \sum_{\xi',m}\langle\xi'|m\rangle P_m\langle m|\xi'\rangle = \sum_m P_m=1 ξ ′ ∑ ⟨ ξ ′ ∣ ρ ∣ ξ ′ ⟩ = ξ ′ , m ∑ ⟨ ξ ′ ∣ m ⟩ P m ⟨ m ∣ ξ ′ ⟩ = m ∑ P m = 1
这对应了经典理论中概率密度之和为 1。由 18 节的公式,我们更是有 ξ \xi ξ 取 ξ ′ \xi' ξ ′ 的概率为:
∑ m ∣ ⟨ ξ ′ ∣ m ⟩ ∣ 2 P m = ⟨ ξ ′ ∣ ρ ∣ ξ ′ ⟩ \sum_m|\langle \xi'|m\rangle|^2P_m=\langle\xi'|\rho|\xi'\rangle m ∑ ∣ ⟨ ξ ′ ∣ m ⟩ ∣ 2 P m = ⟨ ξ ′ ∣ ρ ∣ ξ ′ ⟩
这也和上面的求和为 1 呼应上了。
Gibbs ensemble 的一个重要的应用就是温度为 T T T 的热力学平衡态系统。Gibbs 证明了在经典系统中,这个密度为:
ρ = c e − H / k T \rho=ce^{-H/kT} ρ = c e − H / k T
其中 H H H 是 Hamiltonian,和时间无关(应该是说平衡态的时候和时间无关),k k k 是 Boltzmann's constant,我们可以直接把这个式子拿到量子理论中。在高温下,ρ = c \rho=c ρ = c ,也就有了 ⟨ ξ ′ ∣ ρ ξ ′ ⟩ = c ⟨ ξ ′ ∣ ξ ′ ⟩ = c \langle\xi'|\rho\xi'\rangle=c\langle\xi'|\xi'\rangle=c ⟨ ξ ′ ∣ ρ ξ ′ ⟩ = c ⟨ ξ ′ ∣ ξ ′ ⟩ = c 。所以在高温场景下,所有离散状态的概率相同 。(这个结论在第 9 章用于论述玻色子的分布和经典统计力学的不同。)