1. 考える問題
今回は、平均場近似についてまとめてみる。
平均場近似とは、粒子間の相互作用を平均化してしまう近似で、多体問題を解くときに使われる一番シンプルな簡単化の手法だ。このような物理系を「解く」と言ったときには、時間発展を考えるというよりも、普通、基底エネルギー・基底状態を求めること、もしくは完全なエネルギースペクトルを求めて分配関数を計算することを言うことが多い。このページでは、平均場近似がよく使われるスピン系の問題を例として、特に基底状態を求める問題に焦点を合わせる。
一般に平均場近似といったときには、熱力学的挙動が考えられることが多いような気がする。そういうときには自由エネルギーやある温度での磁化などが話題になって、基底状態に関しての話はあまりされない。自分はそっちのほうが気になったので、ちょっとまとめてみようと思い立った。
というのも、個人的に、有限系で考えられることの多いHartree-Fock近似が、電子系における平均場近似であることをしっかり理解しておきたいと思ったからだ。それと有限系の基底状態を平均場近似で求めることは、離散最適化問題、特に最近話題の量子アニーリングの解けるイジングモデルの近似解法としても (多分) 有用だろう。
分配関数を計算することによって、「普通」の相転移点などの情報を得ることができる。このようなときには、相転移温度が話題になることが多い。一方で、絶対零度におかれて基底状態しか存在しない物理系でも、温度ではない物理系のパラメータ (例えば相互作用の強さ) を変えることで相転移が起こる場合がある。このような相転移では基底状態を求めることが重要になる。
このページでは、\(i\)番目のスピンに作用する x, y, z 方向のスピン演算子をそれぞれ \(s_i^x, s_i^y, s_i^z\) と書くことにする。また、スピンの状態ベクトルは \(\ket{\uparrow}, \ket{\downarrow}\) が \(s^z\) に感してそれぞれ \(+1, -1\) の固有値を持つ状態とする。
2. 1次元縦磁場イジングモデル
イジングモデルは、スピン量子数 1/2 を持つスピンが相互作用している系を非常に簡単化したもので、全体に均一な磁場 \(h\) が加えられ、最近接スピンの間でのみ強度 \(J\) の相互作用が存在するようなモデルだ。「縦磁場」イジングモデルでは、\(z\)方向に磁場 \(h\) を加え、相互作用としては \(s_{i}^z s_{j}^z\) の形を仮定する。 ここでは、\(N\) 個の円状に並んだスピン系を考えよう。このとき系のハミルトニアンは
\[H = -J\sum_{i=1}^{N} s_{i}^z s_{i+1}^z - h \sum_{i=1}^N s_i^z \tag{1}\]
である。上の式では \(N+1\) 番目のスピンが現れてしまうが、スピンが円状にんらんでいることから、 \(N+1\) 番目のスピンは \(1\) 番目のスピンを表すという約束にする。このハミルトニアンの基底状態を探すことが目標である。
さっそく平均場近似を導入して、(1)の平均場近似による近似解を導き出す。平均場近似では、
基底状態を探索する空間として、積状態のみを仮定する。つまり、
\begin{align}
\ket{\psi (\b{\alpha}, \b{\beta})} &= \bigotimes_{i=1}^N \ket{\psi(\alpha_i, \beta_i)}_i \\
&= \bigotimes_{i=1}^N\left(\alpha_i \ket{\uparrow}_i + \beta_i \ket{\downarrow}_i\right) \tag{2}
\end{align}
という状態を仮定して、この空間で最低のエネルギー期待値を持つ状態を探すのが平均場近似である。この状態はどうやっても量子力学的な相関 (エンタングルメントなど) を持つことは無く、ある意味古典的な近似とも言える。平均場近似ではない本当の基底状態は一般に、\(2^N\) 個の複素数 \(c_\xi\) を使って
\[\ket{\psi_{\text{exact}}} = \sum_{\xi = \downarrow\cdots\downarrow}^{\uparrow\cdots\uparrow} c_\xi \ket{\xi}\]
と表されるべきものであることに注意。平均場近似では、これを (2) 式のように制限することによって、パラメータを \(2N\) 個の複素数 \(\b{\alpha}, \b{\beta}\) に削減して計算を楽にするのだ。
今回の問題については、さらに簡単化できる。今解こうとしているハミルトニアン (1) を見ると、スピン\(i\)とスピン\(j\)を区別する必要が無いことがわかるので、探索する空間を以下の状態に制限する。
\[\ket{\psi (\alpha, \beta)} = \bigotimes_{i=1}^N\left(\alpha \ket{\uparrow}_i + \beta \ket{\downarrow}_i\right) \tag{3}\]
さて、(1)のハミルトニアンの作用を考えてみよう。このように量子的な相関の全く無い状態を仮定したのだから、(1)のハミルトニアンの作用のうち、\(i\)番目のスピン状態の空間 \(\ket{\psi}_i = \alpha \ket{\uparrow}_i + \beta \ket{\downarrow}_i\) のみに作用する部分だけを取り出してやろう。それをするには、\(i\) 番目以外のスピンについてハミルトニアンを平均化してしまえば良い。これが平均場近似と呼ばれるゆえんだ。もともとのハミルトニアン (1) の中で、\(i\) 番目のスピンに作用する部分は、
\[-J (s_{i-1}^z s_i^z + s_i^z s_{i+1}^z) - h s_i^z\]
なので、\(H_i\) を平均化後のハミルトニアンとすると、
\begin{align}
H_i &= \bigotimes_{j\neq i}^N \bra{\psi(\alpha, \beta)}_j \left(-J (s_{i-1}^z s_i^z + s_i^z s_{i+1}^z) - h s_i^z\right) \bigotimes_{k\neq i} \ket{\psi(\alpha, \beta)}_k \\
&= -J ((|\alpha|^2 - |\beta|^2) s_i^z + s_i^z (|\alpha|^2 - |\beta|^2)) - h s_i^z \\
&= (-2J(|\alpha|^2 - |\beta|^2) - h) s_i^z
\end{align}
を得る。
この計算は \(\bigotimes_{j\neq i} \ket{\psi(\alpha, \beta)}_j\ket{\uparrow}_i\), \(\bigotimes_{j\neq i} \ket{\psi(\alpha, \beta)}_j\ket{\downarrow}_i\) という2つの基底でハミルトニアンを行列表示していると考えても良い。
このハミルトニアンのもとでの基底状態は
\[E(\alpha,\beta) = \bra{\psi(\alpha, \beta)}_i H_i \ket{\psi(\alpha, \beta)}_i\]
を規格化条件 \(|\alpha|^2+|\beta|^2=1\) のもとで最小にするような状態である。
\[E(\alpha,\beta) = (-2J(|\alpha|^2 - |\beta|^2) - h)(|\alpha|^2 - |\beta|^2)\]
なので、これの最小値を拘束条件下で求めるために、\(\alpha = \cos \frac{\theta}{2}, \beta = \sin \frac{\theta}{2}\)と変数変換すると (一般に\(\alpha, \beta\)は複素数だが、\(|\alpha|, |\beta|\)しか現れていないので、実数と仮定しても問題ない)
\[E(\alpha,\beta) = (-2J\cos\theta - h)\cos \theta \]
を得る。\(\cos\theta = x\) とおいて少し変形すれば
\begin{align}
E(\alpha,\beta) &= -2J x^2 - h x \\
&= -2J \left(x + \frac{h}{4J}\right)^2 + \frac{h^2}{8J}
\end{align}
となるので、\(|x|\lt 1\)に注意して、平均場近似 (3) による基底状態は
\[\ket{\psi_g} = \left\{\begin{array}{lcc}
\ket{\uparrow} & h \geq 0, & J \geq 0\\
\ket{\downarrow} & h \leq 0, & J \geq 0 \\
\ket{\uparrow} & -\frac{h}{4J} \geq 1, & J \leq 0\\
\ket{\downarrow} & -\frac{h}{4J} \leq -1, & J \leq 0 \\
\sqrt{\frac{1}{2}-\frac{h}{8J}}\ket{\uparrow} + \sqrt{\frac{1}{2}+\frac{h}{8J}}\ket{\downarrow} & |\frac{h}{4J}| \leq 1, & J \leq 0
\end{array}\right. \tag{4}\]
となる。
よって
- \(J \geq 0\) (全てのスピンが同じ方向を向きたい状況) のとき、全てのスピンが磁場 \(h\) の方向を向く。
- \(J\leq 0\) (全てのスピンが隣と逆方向を向きたい状況) のとき、\(h\) があるしきい値 \(4J\) よりも大きければ全てのスピンが磁場の方向を向き、逆に小さければ、一つのスピンに着目したとき、\(\frac{1}{2}-\frac{h}{8J}\), \(\frac{1}{2}+\frac{h}{8J}\) の確率で磁場と逆向きになる
ということが、平均場近似から言える結論である。
3. 平均場近似の精度
平均場近似によって、(4) のような基底状態を得ることができたわけだが、その精度はどれほどだろうか?
精度を定量的に評価するために、(4) の状態が基底状態となる確率を調べてみよう。
それには、基底状態を求める必要がある。(1) のイジングモデルの基底状態を求めるのは簡単だ。\(J\gt 0\) の場合は、全スピンが \(h\) の方向に揃っている状態が基底状態であることは明らかだと思うので、\(h\gt 0\) かつ \(J\lt 0\) の場合について考えてみよう。まず、全てのスピンが +z 方向を向いている状態 \(\ket{\uparrow\cdots\uparrow}\) は、エネルギー
\[\bra{\uparrow\cdots\uparrow}H\ket{\uparrow\cdots\uparrow} = -N (J+h)\]
を持つ。相互作用が小さい場合はこれが基底状態である。ここから一つのスピンを反転させると、エネルギーは
\[ -(N-2) J - (N-1)h + 2J + h = -(N-4) J - (N-2)h\]
と変化する。したがって、隣り合うスピンが同じ方向を向いているような 1 スピンを反転させると、\(4J + 2h\) だけエネルギーが変化する。相互作用が十分に強く、\(4J \lt -2h\) なら、スピンを反転させるたびにエネルギーは減少し、それはスピンが互い違いになるまで続く。よってこの場合の基底状態は、隣同士のスピンが互いに異なる方向を向いているような状態である。一方で、\(4J \gt -2h\) なら、エネルギーの減少は起こらず、全てのスピンが同じ方向を向いている状態が基底状態である。
平均場近似では、しきい値が \(h\) と \(4J\) の大小によって決められていたのとは対照的である。本来のしきい値は \(h\) と \(2J\) の大小によって決まるものなのだ。
簡単のため、スピン数 \(N\) は偶数とすると、隣同士のスピンが互いに異なる方向を向くような配置は \(\uparrow\downarrow\uparrow\cdots\downarrow\), \(\downarrow\uparrow\downarrow\cdots\uparrow\) の 2 通りのみである。平均場近似では、それぞれのスピンが独立に \(\frac{1}{2}-\frac{h}{8J}\), \(\frac{1}{2}+\frac{h}{8J}\) という確率で \(\ket{\uparrow}, \ket{\downarrow}\) の方向を取るので、そのような状態が実現する確率は
\[2\left(\frac{1}{2}-\frac{h}{8J}\right)^{N/2}\left(\frac{1}{2}+\frac{h}{8J}\right)^{N/2}\]
である。かなり低い確率のようだ。しかし少しだけなら励起状態が混じっても良いと言うのであれば、もう少し上がるだろう。とはいっても、平均場近似によって、「ある閾値を超えるとスピンが全部揃い、超えないときにはスピンが揃わない」という定性的な議論はできているとも考えられる。
しかしでも低すぎる気もする。多分全てのスピンの状態を同じと仮定したのがまずかったんだろう。
4. 一般的なイジングモデルの平均場近似
次は \(j, k\) 番目のスピン間に結合 \(J_{jk}\) が存在する最も一般的なモデルを考えよう。以下のハミルトニアンの基底状態を求める問題を考える。
\[H = -\sum_{j=1}^{N}\sum_{k=1}^{j-1} J_{jk} s_{j}^z s_{k}^z - \sum_{j=1}^N h_j s_k^z \tag{5}\]
これを平均場近似で解く方程式を立てると、平均場近似の何たるかがわかるかも。(\(j=k\)のところでは \(J\) ) (5) についても、平均場近似の解として
\begin{align}
\ket{\psi (\b{\alpha}, \b{\beta})} &= \bigotimes_{j=1}^N \ket{\psi(\alpha_j, \beta_j)}_j \\
&= \bigotimes_{j=1}^N\left(\alpha_j \ket{\uparrow}_j + \beta_j \ket{\downarrow}_j\right)
\end{align}
を仮定して、この空間の中で最低のエネルギーを取る状態を探してみよう。先と同じように、\(i\) 番目のスピンに作用するハミルトニアン \(H_i\) を取り出すには、
\[H_i = \left(\bigotimes_{j\neq i}\bra{\psi(\alpha_j, \beta_j)}_j\right)H\left(\bigotimes_{j\neq i}\ket{\psi(\alpha_j, \beta_j)}_j\right)\]
によってハミルトニアンを平均化してやれば良い。やってやると、
\begin{align}
& H_i\\
& = -\sum_{j=1}^{N}\sum_{k=1}^{j-1} J_{jk} \left(\bigotimes_{l\neq i}\bra{\psi(\alpha_l, \beta_l)}_l\right)s_{j}^z s_{k}^z\left(\bigotimes_{l\neq i}\ket{\psi(\alpha_l, \beta_l)}_l\right) - \sum_{k=1}^N h_j \left(\bigotimes_{l\neq i}\bra{\psi(\alpha_l, \beta_l)}_l\right) s_k^z \left(\bigotimes_{l\neq i}\ket{\psi(\alpha_l, \beta_l)}_l\right) \\
& = -\sum_{j=1}^{N} J_{ji} \expect{s_j^z} s_{i}^z - h_i s_i^z - \sum_{1\leq j\leq N \land j \neq i}\sum_{k\lt j \land k \neq i} J_{jk} \expect{s_{j}^z} \expect{s_{k}^z} - \sum_{j\neq i}^N h_j \expect{s_j^z}
\end{align}
ここで、\(\expect{s_j^z}\) はスピン演算子の期待値で、
\begin{align}
\expect{s_j^z} = |\alpha_j|^2 - |\beta_j|^2
\end{align}
である。
これで \(i\) 番目のスピンのみに作用するハミルトニアンを作ることができたので、先と同じように、このハミルトニアンを最小化する \(\alpha_i, \beta_i\) をそれぞれ求めてやれば良い。
しかし、このハミルトニアン \(H_i\) は、着目しているスピン以外の状態を示す \(\alpha_j, \beta_j\) が入っている。そこで、このハミルトニアンの最小化問題を解くには次のようにする。
- 適当な初期値 \(\{\alpha_i^{(0)}\}\) を決める。
- \(\{H_i\}\) を計算する。
- \(\{H_i\}\) を最小化するものとして、\(\{\alpha_i^{(1)}\}\)を決める。
- 2 に戻るか、収束したら終了する。
この計算方法は、自己無撞着法 (self consistent field (SCF) 法) と言われる方法である。
Hartree-Fockと同じ手続きだ。でもここでは解かない。
5. 横磁場イジングモデル
最後に、量子相転移をすることで有名な横磁場イジングモデルについて平均場近似をしてみて終わりにしよう。ここでは円上に配置された横磁場イジングモデルを考えることにする。ハミルトニアンは
\[H = -J\sum_{i=1}^{N} s_{i}^z s_{i+1}^z - h \sum_{i=1}^N s_i^x \tag{6}\]
の形である。これまでのモデルでは、磁場項が \(s_i^z\) (z軸方向) だったのに対して、\(s_i^x\) (x軸方向) になっているのが特徴である。ここでも
\[\bigotimes_{j=1}^N \ket{\psi(\alpha_j, \beta_j)}_j = \bigotimes_{j=1}^N\left(\alpha_j \ket{\uparrow}_j + \beta_j \ket{\downarrow}_j\right)\]
の形の解を仮定して、\(i\)番目のスピンに作用するハミルトニアンを求めてやる。しかし (6) のハミルトニアンをみると、先と同じようにそれぞれのスピンに区別が無いことがわかるので、
\[\ket{\psi (\alpha, \beta)} = \bigotimes_{i=1}^N\left(\alpha \ket{\uparrow}_i + \beta \ket{\downarrow}_i\right) \tag{3}\]
と探索する空間を制限してしまおう。
それでもって計算してやると、全く同様にして
\begin{align}
H_i = -2J(|\alpha|^2 - |\beta|^2)s_i^z - h s_i^x
\end{align}
を得て、このハミルトニアンを最小化するには、
\begin{align}
\bra{\psi(\alpha, \beta)}_i H_i \ket{\psi(\alpha, \beta)}_i &= -2J(|\alpha|^2 - |\beta|^2)(|\alpha|^2 - |\beta|^2) - h (\alpha^*\beta - \alpha\beta^*)
\end{align}
を最小化する \(\alpha,\beta\) を探せば良いことになる。簡単のため \(\alpha, \beta\) は実数であると仮定し、\(\alpha = \cos\frac{\theta}{2}\), \(\beta = \sin\frac{\theta}{2}\)と置くと、
\begin{align}
H_i &= -2J \cos^2\theta - h \sin\theta\\
&= -2J (1-\sin^2\theta) - h \sin\theta\\
&= 2J\sin^2\theta - h \sin\theta -2J\\
&= 2J\left(\sin\theta - \frac{h}{4J}\right)^2 - 2J - \frac{h^2}{2J}\\
\end{align}
ということで、\(|\frac{h}{4J}|\leq 1\) のときになにか起きそうなことがわかる。さっきと同じ要領で考えると、\(\ket{\rightarrow}, \ket{\leftarrow}\) をそれぞれ \(s^x\) の固有値 \(1, -1\) に対応する固有状態として、\(H_i\) の基底状態は、
\[\ket{\psi_g} = \left\{\begin{array}{lcc}
\ket{\rightarrow} & h \geq 0, & J \leq 0\\
\ket{\leftarrow} & h \leq 0, & J \leq 0 \\
\ket{\rightarrow} & \frac{h}{4J} \geq 1, & J \geq 0\\
\ket{\leftarrow} & \frac{h}{4J} \leq -1, & J \geq 0 \\
\frac{1}{\sqrt{2}}\left(1\pm\sqrt{1-\left(\frac{h}{4J}\right)^2}\right)\ket{\uparrow} + \frac{1}{\sqrt{2}}\left(1\mp\sqrt{1-\left(\frac{h}{4J}\right)^2}\right)\ket{\downarrow} & |\frac{h}{4J}| \leq 1, & J \geq 0
\end{array}\right. \tag{4}\]
となる。
この場合でも、ある閾値によって基底状態の性質が大きく変わることを示唆する結果が得られた。もちろん、これは平均場近似の結果なので、上と一緒で定性的な理解に過ぎないが、量子相転移の一端を感じることができる。
上でやった縦磁場イジングモデルと大きく異なるのは、\(s^x_i\)という項と\(s^z_i s^z_j\)という項が非可換であることである。これによって、例えば\(J=0\)での基底状態\(\ket{\rightarrow}\)からスタートし、\(J\)を少しずつ大きくしていったとき\(\ket{\rightarrow}\)ではない状態に移ることが可能になっている。一方で縦磁場イジングモデルの場合は、\(J=0\)での基底状態\(\ket{\uparrow}\)からスタートして\(J\)を少しずつ大きくしたとしても、常に\(\ket{\uparrow}\)がハミルトニアンの固有状態であるために、別の状態に移ることはありえない。