物理とか

Index

時間依存の摂動 - Magnus展開と平均ハミルトニアン


1. ダイソン級数のおさらいとその問題

これまでに、初期状態\(\ket{\psi(0)}\)を、ある時刻\(t\)での状態\(\ket{\psi(t)}\)に写す「時間発展演算子」\(U(t)\)というものを考え、それに関する摂動論を展開した。時間発展演算子とは、 \[\ket{\psi(t)} = U(t)\ket{\psi(0)}\tag{1}\] となるような演算子のことで、ハミルトニアンが\(H_0+\lambda H_1(t)\) (\(H_0\):大きなハミルトニアン・\(H_1\):摂動ハミルトニアン・\(\lambda\):小さな実数) と書かれているとき、これに対するシュレディンガー方程式は \[i\hbar\frac{d}{dt}U(t) = (H_0 + \lambda H_1(t)) U(t)\tag{2}\] である。前回導入した相互作用表示では、 \[\ket{\psi_I(t)} = e^{iH_0t}\ket{\psi(t)},~H_I(t) = e^{iH_0t}H_1(t)e^{-iH_0t}\tag{3}\] とすることで方程式を簡単化することができた。相互作用表示における時間発展演算子\(U_I(t):~U_I(t)\ket{\psi_I(0)} = \ket{\psi_I(t)}\)は \[\frac{d}{dt}U_I(t) = -i\lambda H_I(t)U_I(t)\tag{4}\] という方程式に従う。前回は\(U_I(t)\)を \[U_I(t) = I + \lambda U_I^{(1)}(t) + \lambda^2 U_I^{(2)}(t) + \cdots \tag{5}\] と\(\lambda\)のべき乗で摂動展開する方法で(4)を解いた。その解は、ダイソン級数と呼ばれる形で得られ、 \begin{align} U_I(t) &= \mathcal{T}\left[\exp \left(-i\lambda\int_0^t dt_1H_I(t_1)\right)\right]\tag{6}\\\\ &= I + \sum_{k=1}^\infty (-i\lambda)^k \int_0^t dt_1\int_0^{t_1}dt_2\cdots\int_0^{t_{k-1}}dt_k H_I(t_1)H_I(t_2)\cdots H_I(t_k) \tag{7} \end{align} となった。ただし\(\mathcal{T}\)は時間順序演算子で、演算子の積を時間順序に並び替える演算子 \[\mathcal{T} \left[A(t_1)B(t_2)\right] = \left\{ \begin{array}{lc} A(t_1)B(t_2)& (t_1\gt t_2)\\ B(t_2)A(t_1)& (t_2\gt t_1) \end{array}\right. \] である。

一応今回やるものと比較したかったので、ダイソン級数についておさらいしておいたが、別にダイソン級数を知らなければ読み飛ばしていただければ問題無い。平均ハミルトニアンの理論を展開するのに、ダイソン級数の知識はいらないと思う。

前回は触れなかったが、ダイソン級数による摂動展開には少しだけ問題がある。それは、ある次数\(N\)で計算を打ち切り、 \[U_I(t) \approx I + \sum_{k=1}^N (-i\lambda)^k \int_0^t dt_1\int_0^{t_1}dt_2\cdots\int_0^{t_{k-1}}dt_k H_I(t_1)H_I(t_2)\cdots H_I(t_k)\] と近似した時、\(U_I(t)\)がユニタリーでないというところだ。ユニタリーにならないということはつまるところ、この近似では量子力学の原理である、\(\ket{\psi_I(t)}\)の規格化条件\(\braket{\psi_I(t)}{\psi_I(t)}\)が保たれないということを意味する。もちろん、十分短い時間スケールや、十分大きな\(N\)を取れば、かなり良い近似にはなっているのだが、それでも規格化条件が保たれないのはなんとなく気持ちが悪い。

このことを踏まえて、今回は、このダイソン級数による摂動解とは少し違った形式による摂動解である

平均ハミルトニアン

理論を説明してみようと思う。平均ハミルトニアン理論では、ユニタリー性を保ったまま摂動展開するので上のような問題は現れないのだ。

2.方針

今回は、摂動の無いとき、\(U(t) = e^{-iH_0 t}\)という時間発展演算子がシュレディンガー方程式の解であったことを踏まえて、 \[U_I(t) = e^{-i\Omega(t)}\] の形を仮定するのが平均ハミルトニアン理論のやり方である。(\(\Omega(t)\)は時間依存のエルミート演算子。)

これを(4)に代入すると、 \[\frac{d}{dt}e^{-i\Omega(t)} = -i\lambda H_I(t) e^{-i\Omega(t)}\tag{8}\] となり、今回はこの方程式に従う\(\Omega(t)\)を、摂動展開 (摂動の大きさを表すパラメータ\(\lambda\)のべき乗で展開) して解くことが目標となる。この摂動展開のことは

Magnus展開

とも呼ばれる。かなり導出が長くなってしまったのでここで結果だけ書いておくと、 \begin{align} \Omega(t) = &\lambda\int_0^t dt_1 H_I(t_1) \\ & - \frac{i\lambda^2}{2}\int_0^t dt_1\int_0^{t_1} dt_2 [H_I(t_1),H_I(t_2)] \\ & - \frac{\lambda^3}{6}\int_0^t dt_1\int_0^{t_1} dt_2 \int_0^{t_2} dt_3 \left([H_I(t_1),[H_I(t_2),H_I(t_3)]] + [H_I(t_3),[H_I(t_2),H_I(t_1)]]\right)\\ & \cdots \end{align} となる。

3.左辺の微分を処理する

(8)の左辺の微分に関して、指数関数の肩に乗っているのが普通の関数\(f(t)\)なら、合成関数の微分を使って、 \[\frac{d}{dt}e^{f(t)} = \frac{df}{dt}e^{f(t)}\] となるが、演算子の場合はそう簡単には行かない。実は次のような公式がある。(行列指数関数の微分参照) \[\frac{d}{dt}e^{-i\Omega(t)} = -i\int_0^1 e^{-is\Omega(t)}\frac{d\Omega}{dt}e^{-i(1-s)\Omega(t)} ds \tag{9}\] この公式だけでは複雑過ぎて前に進めなさそうだが、もう一つ、以下のHadamard の公式 \[e^A B e^{-A} = \sum_{n=0}^\infty \frac{1}{n!} \underbrace{[A,[A,\cdots,[A}_n,B]\cdots]\tag{10}\] を使うと進められる。\([A,B]\)は交換子で、\([A,B] = AB-BA\)という演算を表す。この公式を使うにあたって、交換子が\(n\)個あることを毎回上のように書くのは大変なので、ある演算子\(A\)と交換子を取るという演算子\(\ad_A\)を次のように定義する。 \[\ad_A B = [A,B]\] \(\ad_A\)も線形演算子であり、\(\ad_A\)の固有値や固有ベクトルというものも考えられることに注意しておこう。さらに、この演算子のべき乗を、 \[ad_A^n B = \underbrace{\ad_A(\ad_A(\cdots(\ad_A}_n B) = \underbrace{[A,[A,\cdots,[A}_n,B]\cdots]\] とする。そうすると、Hadamard公式は \[e^A B e^{-A} = \sum_{n=0}^\infty \frac{1}{n!} \ad_A^n B\tag{11}\] と書き直される。

さて、(9)式をHadamard公式(11)を使って変形していこう。 \begin{align} \frac{d}{dt}e^{\Omega(t)} &= -i\int_0^1 e^{-is\Omega(t)}\frac{d\Omega}{dt}e^{is\Omega(t)} ds ~e^{-i\Omega(t)}\\ &= -i\int_0^1 \left[\sum_{n=0}^\infty \frac{1}{n!} \ad_{-is\Omega(t)}^n \left(\frac{d\Omega}{dt}\right)\right] ds~e^{-i\Omega(t)}\\ &= -i\int_0^1 \left[\sum_{n=0}^\infty \frac{(-is)^n}{n!} \ad_{\Omega(t)}^n \left(\frac{d\Omega}{dt}\right)\right] ds~e^{-i\Omega(t)}\\ &= -i\sum_{n=0}^\infty \int_0^1 \frac{(-i)^n s^n}{n!} ds~\ad_{\Omega(t)}^n \left(\frac{d\Omega}{dt}\right)~e^{-i\Omega(t)}\\ &= \sum_{n=0}^\infty \frac{(-i)^{n+1}}{(n+1)!}\ad_{\Omega(t)}^n \left(\frac{d\Omega}{dt}\right)~e^{-i\Omega(t)}\tag{12}\\ \end{align} ここまでやっておいて、元のシュレディンガー方程式に戻ろう。

4. 解く

シュレディンガー方程式 (8) に今計算した (12) を代入すると、 \[\sum_{n=0}^\infty \frac{(-i)^{n+1}}{(n+1)!}\ad_{\Omega(t)}^n \left(\frac{d\Omega}{dt}\right)~e^{\Omega(t)} = -i\lambda H_I(t) e^{\Omega(t)}\] 両辺に右から\(e^{i\Omega(t)}\)を掛けて\(e^{-i\Omega(t)}\)を消してやれば、 \[\sum_{n=0}^\infty \frac{(-i)^{n+1}}{(n+1)!}\ad_{\Omega(t)}^n \left(\frac{d\Omega}{dt}\right) = -i\lambda H_I(t)\tag{13}\] を得る。これが\(\Omega(t)\)に関する微分方程式であり、ここからはこれを解いて\(\Omega(t)\)を求めることが目標となる。
\(\Omega(t)\)を摂動展開する前に、まずは\(\frac{d\Omega}{dt}=\cdots\)の形にすることを目指してみよう。それをするには、左辺の\(\frac{d\Omega}{dt}\)にかかっている演算子、 \[F = \sum_{n=0}^\infty \frac{(-i)^{n+1}}{(n+1)!}\ad_{\Omega(t)}^n \tag{14}\] の逆 \(F^{-1}\) を両辺にかければ良いだろう。これを考えるために、\(\ad_{\Omega(t)}\)が対角化できると仮定し、固有値を\(\{\alpha\}\)、対応する固有ベクトルを\(\{A_\alpha\}\)とする。ここで実は今回考える範囲では、\(\ad_{\Omega(t)}\)はエルミート演算子なので、それぞれの固有ベクトルは直交するように取れることを注意しておく。さらに任意の演算子が\(A_\alpha\)の線形結合で表せる (完全性) と仮定しよう。(最後にエルミート性の証明を書いておくことにする。)

このあたりから少しずつ難しくなってくるが、\(\ad_{\Omega(t)}\)は\(\Omega(t)\)や\(H_I(t)\)のような演算子にかかる演算子なので、固有ベクトル\(A_\alpha\)は演算子である。

そうすると、固有ベクトル\(A_\alpha\)への射影演算子を\(P_\alpha\)として、\(\ad_{\Omega(t)}\)は次のように書ける。 \[\ad_{\Omega(t)} = \sum_\alpha \alpha P_\alpha\tag{15}\]

難しく見えるかもしれないが、量子力学でよくやられるハミルトニアンの対角化と同じことで、ハミルトニアン\(H\)の固有状態を\(\ket{n}\)、固有値を\(E_n\)としたときに\(H = \sum_n E_n \ket{n}\bra{n}\)と書けるのと全く同じことをしている。

(15)を(14)に代入すると、射影演算子の性質\(P_\alpha^n =P_{\alpha}\)と、\(A_\alpha\)が直交していることから\(P_\alpha P_\alpha' = \delta_{\alpha\alpha'}I\) (\(I\)は恒等演算子) となることに注意して、 \[F = -i\sum_\alpha \sum_{n=0}^\infty \frac{(-i\alpha)^n}{(n+1)!} P_{\alpha}\tag{16}\] を得る。この中で、\(n\)に関する和の部分を計算してやると、 \begin{align} \sum_{n=0}^\infty \frac{(-i\alpha)^n}{(n+1)!} &= \frac{1}{-i\alpha} \sum_{n=0}^\infty \frac{(-i\alpha)^{n+1}}{(n+1)!}\\ &= \frac{1}{-i\alpha} \sum_{n=1}^\infty \frac{(-i\alpha)^{n}}{n!}\\ &= \frac{1}{-i\alpha} \left(-1 + \sum_{n=0}^\infty \frac{(-i\alpha)^{n}}{n!}\right)\\ &= \frac{e^{-i\alpha}-1}{-i\alpha}\tag{17} \end{align} となる。したがって、 \[F = -i\sum_\alpha \frac{e^{-i\alpha}-1}{-i\alpha} P_\alpha\tag{18}\] を得る。

上の計算だと\(\alpha=0\)の場合を無視してしまっているがとりあえず後回しにする。

\(F^{-1}\)は \[F^{-1}F = FF^{-1} = I = \sum_\alpha P_\alpha (完全性)\] となるような演算子だから、(18)の係数を逆数としたものが\(F^{-1}\)としての性質を持つだろう。したがって、 \[F^{-1} = i\sum_\alpha \frac{-i\alpha}{e^{-i\alpha}-1} P_\alpha\tag{19}\] である。さて次に、これだと\(F^{-1}\)がどんな演算子なのかわかりにくいので、(14)を(18)へ変形するためにやったことを全く逆回しにして、この(19)式を\(\ad_{\Omega(t)}\)によって書き直してやる。それにはまず、係数\(\frac{-i\alpha}{e^{-i\alpha}-1}\)をテイラー展開して級数表示してやらないといけないが、これは次の公式を使ってしまおう。 \[\frac{z}{e^z-1} = \sum_{n=0}^\infty \frac{B_n}{n!}z^n\tag{20}\] ここで\(B_n\)はベルヌーイ数で、最初の数項をあげてみると、\(B_0 = 1\), \(B_1 = -\frac{1}{2}\), \(B_2 = \frac{1}{6}\), \(B_4 = -\frac{1}{30}\)である。(\(n\geq 3\)で奇数番目のものは全て0になるらしい。) したがって、 \begin{align} F^{-1} &= i\sum_\alpha \sum_{n=0}^\infty \frac{B_n}{n!}(-i\alpha)^n P_\alpha \\ &= i\sum_{n=0}^\infty \frac{B_n}{n!}\sum_\alpha(-i\alpha P_\alpha)^n \\ &= i\sum_{n=0}^\infty \frac{B_n}{n!}(-i)^n \left(\sum_\alpha\alpha P_\alpha\right)^n \\ &= i\sum_{n=0}^\infty \frac{(-i)^nB_n}{n!}\ad^n_{\Omega(t)}\tag{21} \end{align} を得る。
長くなってしまったが、今導いた\(F^{-1}\)を(13)の両辺にかけると、 \[\frac{d\Omega}{dt} = \lambda\sum_{n=0}^\infty \frac{(-i)^n B_n}{n!}\ad^n_{\Omega(t)}H_I(t)\tag{22}\] を得る。ここまでしておいて、\(\Omega(t)\)を摂動展開してやる。これまでの摂動論と同じように、 \[\Omega(t) = \Omega^{(0)}(t) + \lambda\Omega^{(1)}(t) + \lambda^2\Omega^{(2)}(t) + \cdots\tag{23}\] と\(\Omega(t)\)を摂動の大きさ\(\lambda\)でべき展開してやる。これから(22)を解くわけだが、その前に初期条件も先に説明しておこう。もともと\(U_I(t) = e^{\Omega(t)}\)という仮定から出発していて、\(t=0\)での\(U_I(t)\)の初期条件は\(U_I(0)=I\)であったことを思い出すと、\(\Omega\)に対する初期条件は、\(\Omega^{(k)}(0) = 0\)となることがわかる。

さて、これを(22)に代入して、両辺で\(\lambda\)の次数ごとに等式を作ると、 \begin{align} \frac{d\Omega^{(0)}}{dt} &= 0 \\ \frac{d\Omega^{(1)}}{dt} &= B_0 H_I(t) = H_I(t)\\ \frac{d\Omega^{(2)}}{dt} &= -i B_1 [\Omega^{(1)}(t),H_I(t)] = \frac{i}{2} [\Omega^{(1)}(t),H_I(t)] \\ \frac{d\Omega^{(3)}}{dt} &= -i B_1 [\Omega^{(2)}(t),H_I(t)] - \frac{B_2}{2!} [\Omega^{(1)}(t),[\Omega^{(1)}(t),H_I(t)]] \\ &= \frac{i}{2} [\Omega^{(2)}(t),H_I(t)] - \frac{1}{12} [\Omega^{(1)}(t),[\Omega^{(1)}(t),H_I(t)]] \cdots \end{align} が得られる。これらを上から順に積分して解いていこう。
0次の式: 初期条件\(\Omega^{(0)}(0)=0\)から変化しないわけだから、 \[\Omega^{(0)}(t)=0\]

1次の式: 両辺積分して、 \[\Omega^{(1)}(t) = \int_0^t dt_1 H_I(t_1) \]

2次の式: \begin{align} \frac{d\Omega^{(2)}}{dt} &= \frac{i}{2} \left[\int_0^t dt_1 H_I(t_1),H_I(t)\right] \\ &= \frac{i}{2} \int_0^t dt_1 [H_I(t_1),H_I(t)] \\ \Omega^{(2)}(t) &= -\frac{i}{2}\int_0^t dt_1\int_0^{t_1} dt_2 [H_I(t_1),H_I(t_2)] \end{align}

3次の式: 計算仮定を書くのが面倒なので結果だけ。 \begin{align} \Omega^{(3)}(t) &= -\frac{1}{6}\int_0^t dt_1\int_0^{t_1} dt_2 \int_0^{t_2} dt_3 \left([H_I(t_1),[H_I(t_2),H_I(t_3)]] + [H_I(t_3),[H_I(t_2),H_I(t_1)]]\right) \end{align} 4次以上は面倒なので計算していない。"Magnus expansion"で英語検索すればきっと色々出てくるはず。一応各項がエルミートになっていることには注目しておいても良いかもしれないな。

5. 終わりに

最後に、なぜこの摂動展開が「平均」ハミルトニアン理論と呼ばれるか説明して終わりにしよう。

結局今回導出した式は、 \[U_I(t) = \exp\left[-i\left(\lambda\Omega^{(1)}(t) + \lambda^2\Omega^{(2)}(t) + \cdots\right)\right]\] という式だった。実際に近似式として使うときには、例えば1次の項で打ち切って、 \[U_I(t) \approx \exp\left[-i\left(\lambda\Omega^{(1)}(t) \right)\right]\] のようにするわけだが、これを次のように変形してみる。 \begin{align} U_I(t) &\approx \exp\left[-i\left(\lambda\int_0^t dt_1 H_I(t_1) \right)\right]\\ &= \exp\left[-i\left(\frac{1}{t}\int_0^t dt_1 \lambda H_I(t_1) \right)t\right] \end{align} これと時間依存しないハミルトニアン\(H\)による時間発展演算子 \(\exp(-iHt)\)を比べると、 \[H \longleftrightarrow \frac{1}{t}\int_0^t dt_1 \lambda H_I(t_1)\] という対応が見えてくる。\(\tilde {H_I} = \frac{1}{t}\int_0^t dt_1 \lambda H_I(t_1)\)はハミルトニアンの時間平均をとったものだから、今回導出した摂動展開において、1次の摂動は、時間\(t\)の間のハミルトニアンの平均値\(\tilde{H_I}\)による時間発展を表していると言えるだろう。そういうわけで、この理論は「平均」ハミルトニアンと呼ばれるのである。

\(\ad_\Omega\)のエルミート性

ある演算子\(H\)がエルミート演算子であることの定義は、それが作用するベクトル空間の内積\((A,B)\)に関して、 \[(HA,B) = (A,HB)\] が成り立つことである。\(\ad_\Omega\)は演算子にかかる演算子だから、演算子同士の内積を考える必要があるが、今回は Hilbert-Schmidt 内積\((A,B) = \Tr(A^\dagger B)\)について証明しよう。\(\Omega\)のエルミート性を忘れないようにして、正直に計算していけば示せる。 \begin{align} (\ad_\Omega A,B) &= \Tr([\Omega, A]^\dagger B)\\ &= \Tr((A^\dagger\Omega - \Omega A^\dagger) B)\\ &= \Tr(A^\dagger\Omega B) - \Tr( \Omega A^\dagger B)\\ &= \Tr(A^\dagger\Omega B) - \Tr( A^\dagger B\Omega )\\ &= \Tr(A^\dagger [\Omega, B])\\ &= (A, \ad_\Omega B) \end{align} これで終わり。

\(\alpha=0\)の場合の話

\(\alpha=0\)のベクトル\(A_0\)に対して\(F\)がどのように作用するか考えてみる。 \[F = \sum_{n=0}^\infty \frac{(-i)^{n+1}}{(n+1)!}\ad_{\Omega(t)}^n\] だったから、\(FA_0\)は\(n=0\)の項だけ残って、\(FA_0 = -iA_0\)となる。つまり\(F\)は\(A_0\)に関して\(-i\)を掛けるという作用をする。ところで\(\alpha\neq 0\)に関しては \[F = -i\sum_\alpha \frac{e^{-i\alpha}-1}{-i\alpha} P_\alpha\tag{18}\] となっていて、厳密には\(\alpha=0\)の値は定義できていなかったが、\(\alpha\to 0\)の極限では \[\lim_{z\to 0}\frac{e^z-1}{z} = 1\] なので、まあ特に問題なく(18)によって連続的に (\(\alpha=0\)をそこまで特別扱いせずとも) 定義できるのだ。厳密化するなら一応場合分けする必要しておけばいいんじゃないだろうか。

というわけで\(\alpha=0\)はうまくなっているんだが、問題は実は\(\alpha = 2\pi m\) (\(m\)は整数) であるときに現れる。このとき\(F\)の固有値に\(0\)が現れ、(18)式からわかるように、このときは\(A_{2\pi m}\)成分が消えてしまって復元できなくなる。つまり\(F^{-1}\)が定義できないのだ。よって、このときは今回できたような Magnus展開をすることはできない (収束しなくなる)。これがおそらくMagnus展開の (簡単な) 収束半径を決めるんだろう。

\(F\)の固有値が\(2\pi\)になってしまうと収束しないわけだが、それに到達しないほど十分小さな\(t\)なら問題無い。