量子情報科学 講義ノート (6 月 17 日改定) この講義ノートは、 「量子情報科学」の授業の基盤となる資料である。ここで は語りで進める授業内容を、より整った形式で解説してある。ただし実際の授 業の進行と下記の章の流れとは必ずしも一致しない。とくに第11章の「生命 とはなにか」は、授業では第4章と第3章の間で行われる。 目次 まえがき 第 I 部 自然認識と思惟の方法 第1章 自然の認識と人間の知的な活動の歴史 第2章 情報学の基礎 第3章 論理と計算の基礎 第4章 思惟の数理 第 II 部 物理学における情報と計算の概念 第5章 古典的物理学の成立 第6章 熱力学の第2法則と Entropy の概念 第5章 熱力学から統計力学へ Maxwell の Demon と Boltzmann の原理 第6章 線形代数と量子力学 Schmidt の分解定理 第7章 量子力学で計算できる系 第8章 多粒子系の量子力学 第9章 量子統計力学:Density Matrix/Operator Formalism 第10章 量子情報と量子コンピュータ 物理過程としての計算とその限界 第 III 部 生命を考える 第11章 生命とは何か:計算機と生命系の相似と相違 第12章 生命の分子的な素過程 第13章 生命の基本装置と仕組み 第14章 宇宙と生命の誕生と発展:創造の仕組みと理論 第Ⅳ部 第15章 まとめ 科学的認識と思惟の方法論の進歩 参考文献 1 まえがき この講義は物理学における「情報」と「計算」の概念を検証することにより、 自然科学(物理、化学、生物学)と情報学および計算技術との関係を幅広く理 解することを目的としている。 今日、先端科学技術と言われるナノテクノロジー Nanotechnology、バイオテ クノロジー Biotechnology、IT(Information Technology)は、1920年代 に生まれた量子力学、1940年代に生まれた分子生物学、計算機、計算素子 (トランジスター)、情報学を源流としている。それらの新しい学問から、今日 の計算化学を生み出した量子化学、バイオテクノロジー、ゲノム解読計画、半 導体技術、ディジタル技術、通信技術、ナノテクノロジーなどが派生してきた。 このように新しい分野が生まれる時には異なる分野の専門家の出会いや、異分 野からの参入など、学問の出会いと知的な交配が見られる。 20世紀において自然科学としての物理学と化学と生物学とは互いに地続き になった。こうした統合の主役を果たしたのは量子力学である。それゆえに量 子力学が形を整えた頃、 「量子力学を解けば化学の問題は解決する」という意味 のことを量子力学の創設者の一人である P.M.A. Dirac が述べた。このことを敷 衍して、「量子力学の方程式を解けば生物学も、それ以外の問題も基本的には、 解くことができる」という、考えが生まれている。しかし、 「量子力学への還元 論」とも呼ぶべきこうした素朴な楽観論には反対論も少なくない。例えば、生 物であるヒトの心や知性も物理学を適用すれば原理的に理解できるようになる のだろうか?心や知性も情報、計算過程として理解できるのだろうか。こうし た疑問から物質と精神の2元論への支持は根強い。最近は、 「計算の物理的な限 界」を根拠とする反対論が注目されている。簡単に言えば、仮に系が計算可能 であったとしても、そのための計算機を作るには、宇宙の物質全体を遥かに越 えた素材が必要であり、また、必要な計算時間は、宇宙の年齢を遥かに超え、 事実上不可能であるという説である。生命のような複雑系の計算は、こうした 計算の物理的な限界に容易に到達してしまうであろう。ゆえに、生物を理解す るためには、原子分子レベルの理論計算による予測だけではなく、生物に特有 の構築原理を探すことが必要になる。 ここでいう生物特有の構築原理のひとつは、生物が単なる物質の集まりでな く、情報(プログラム)によって構築される自己構築、自己増殖系であるとい う特徴である。この特徴は計算機を連想させる。計算機とは、計算を実行する ための機械(道具)であり、数学的には Turing Machine である。ゆえに生物学 2 には、部品(構成要素)の物理化学的な性質をしらべる研究と、計算のような 情報機械としての性質をしらべる研究の双方が含まれていなければならない。 後者の研究は、核酸(DNA や RNA)やタンパク質の配列解析技術の進歩、普及と ともに盛んになってきた。Bioinformatics は、そうした生物学の情報計算技法 への要請から生まれてきた研究分野である。 物理学は、我々の自然認識の基礎であり基本的な枠組みである空間 Space、時 間 Time、物質 Matter を与える。しかし自然の存在である生物の理解に必要な「情 報」という概念は、これまでの物理学の中ではほとんど問題こされてこなかっ た。このことは情報処理の特別な過程である計算についても言える。ながらく 計算は数学の問題であり、計算過程を物理学の対象として論ずるようになった のは、最近のことである。さらに言えば、現在ITという言葉が巷にあふれて いるが、ITの基盤である情報と計算の概念が、自然科学とどのように関係し ているかが論じられることも、これまではほとんどなかった。ヒトの存在やそ の特徴である知性までも認識や理解の対象にするならば、現在の自然科学(物 理学、化学、生物学)だけでは不十分なことは明らかである。すなわち、いわ ゆる自然科学を補う「情報と計算の科学」を追加しなければ、我々は正しく自 然を認識することができない。 そこで我々は、情報と計算の概念や理論をしらべ、それらが物理学とどう関 係しているかを明にすることが必要であると考える。その出発点となるのが、 物理学の中で情報という概念がどのように意識され始めたかをしらべることで ある。今日の情報理論では、情報はエントロピーによって測られる。しかし、 その源流は Maxwell の Demon 問題への Leo Szilard の論文や、John von Neumann の量子統計力学の理論、Satoshi Watanabe(渡辺慧)の原子核の核子の相関の 強さを測るエントロピーなど物理学にある。そこで情報のエントロピーと物理 学のエントロピーの概念の誕生とそれらの間の関係をまずしらべる。最近は、 いわゆる量子計算 Quantum Computing との関係で、物理学においても情報や計 算の概念が論ぜられることが多くなった。そこで、古典的な熱力学で導入され たエントロピーが、現在の量子計算で扱われる情報やエントロピーとどうつな がるかもしらべてみることとする。量子計算の理論を展開するためには、量子 力学を密度行列(密度演算子)によって定式化することが行われている。この 定式化の中で重要な役割を果たすのが、E. Schmidt の(積分方程式に関する) 理論であるが、この理論は、統計学の主成分分析、情報学の情報縮約理論、さ らに量子化学の自然軌道展開 Natural Orbital Expansion の基礎をなすもので ある。 3 一方、ヒトゲノム解読計画の完了が宣言された生物学においては、情報とい う概念が飛躍的に重要性を増している。もともと、今日の分子生物学は、タン パク質の構造を決定していくというような構造学派の仕事と、遺伝子のコード (暗号)やタンパク質のアミノ酸配列に象徴される配列 Sequence を研究する情 報学派に支えられてきた。こうした配列データが蓄積されだすと、その処理に は必然的にコンピュータが使われるようになった。これが Bioinformatics であ る。しかし、こうした Bioinformatics はコンピュータ技法の生物分野への応用 であり、言わばサービスの技法の域をでていない。生物系における(負の)エ ントロピーの重要さを指摘したのは、量子力学の創設者の一人である E. Schrodinger であるが、彼の議論は非平衡、非線形、複雑系の物理学に引き継が れ、この視点から生命系を理解しようという研究が今日では盛んになってきて いる。こうした中で化学は、生物学と物理学を結びつける学問として、ますま す重要な役割を果たすことが期待されている。 最後に、情報と計算と深く関係していると思われるが、人間の認知能力、知 性、心である。それらの理解は、現代科学に残された大きな未解決領域となっ ている。おそらくこうした問題の解決には、物理学、化学、生物学、情報計算 学のすべてが動員されなければならないであろう。そのためには、これらの諸 学の間の概念や言葉が共通にならなければならない。米国では、ナノテクノロ ジー、バイオテクノロジー、IT に認知科学 Cognitive Science を加えて、これ らを統合することで、人間の行動能力を強化しようという国家計画が検討され ている。 こうした科学、技術の歴史と最前線を理解することは、易しいことではない。 しかし、この講義は学生や若い研究者がそうした問題への関心を高め、自ら疑 問を発し、自ら考え、さらに勉強を続ける習慣をつけてもらう契機となる機会 を提供することをめざしている。 4 第1章 自然の認識と人間の知的な活動の歴史 1.1 情報の視点からみた人類の歴史 この章では、今日の情報や計算に関る学問がどのように形成されてきたかを、 考察する。そのために、人類の歴史、数学や自然科学、技術の歴史を簡単に辿 ってみる。この視点から知っておくべきできごとを簡単な年代としてまとめた のが、表1である。この表を背景に、我々の視点からみて重要な事柄を列挙し てみる。 情報とことば 人類が他の生物との生存競争に勝ち抜き、壮大な文明を築きえたのは、直立 して自由になった手、効率的なコミュニケーションを可能する音声能力、象徴 Symbol を操る言語能力、さらに言語を操る補助手段となる、具体的なもののイ メージを脱した、抽象的な記号を発明し、それを簡便に記録できる筆記用具や 記録媒体(紙など)を発明しえた知的な能力にある。化学物質を使ったコミュ ニケーションは、生物一般で広く行われている。また、音声を使ったコミュニ ケーションは、動物の社会で観察される。チンパンジーやゴリラは、さらにヒ トに近いコミュニケーション能力を有している。ゴリラに手話を教えた研究者 もいる。しかし人間は、言語と記号、それらの記録法、さらには記号によって 操作されるうる道具(計算機)を発明して、加速度的に知識と、構造物と、道 具を多様にしてきた。いずれも自由になった活動的な手、広域の音声と言語、 思考能力の賜物である。 霊長類(サルの類)から、ヒトの直系の子孫であるアウルトラロピテクス Australopithecus が出現したのは 400 万年前(消滅したのは 130 万年前)、その 子孫であるホモ・ハビリス Homo habilis の出現は 200 万年前(消滅は 150 万年 前)、次に出現したのがホモ・エレクトゥス Homo erectus で、栄えたのは 170-50 万年前、いまのヒトである Homo sapiens に近い原始人(女性、研究者はルシー と呼んでいる)が地球上(アフリカ)出現したのは 150 万年前頃と推定されて いる。次に化石だけで知られているネアンデルタール Neanderthal 人が出現し たのが 12−3 万年前(最近は 20 万年前という説になっている)、このネアンデ ルタールと競合的に生存して、競争に打ち勝った現在の人類ホモ・サピエンス が出現したのは、ネアンデルタール人出現の少し後代である。この一部がネア ンデルタール人を生存競争から絶滅の追い込んだクロ・マニオン人である。彼 らは、フランスの洞窟絵画などの文化的な遺産を大量に残している。人類の起 源に関する歴史は相次ぐ化石の発見から、まだ見直しが続いているが、優れた 5 手の機能に依存した樹上生活から草原生活に適する直立機能の獲得、道具の使 用能力、 (クロ・マニオン人がネアンデルタールに較べて優れていたといわれて いる)発音能力などは、現在の人類を特徴づける能力が進化の過程で次第に獲 得されてきたことを物語っている。 人間の優れた言語、思考能力は、動物の神経系や脳の比較からも裏付けられ ている。神経系は、外界の刺激を受け取る受容体の信号を運動(筋肉)組織に 伝達する役割を果たしているが、受容体から筋肉組織の間の信号伝達回路であ る脳は、進化の過程で非常に複雑なものに発達している。これは脊索動物、脊 椎動物、哺乳類、霊長類、ヒトへと辿ることができる。ヒトの脳は、運動を司 る小脳に大脳が重なった構造をしている。大脳でも言語に関係した側頭葉と好 奇心や創造性に関係した前頭葉の発達が(霊長類に較べて)著しいことが分か っている。ヒトをヒトたらしめている最も特徴的な器官は、前頭葉だというこ とになる。 社会的な情報機能の構築 情報機能から見たヒトの特徴は、個体における情報処理能力だけでなく、社 会的な情報機能の構築能力にもある。人類史において、治水技術の確立や、大 規模居住環境(都市)の構築、経済圏の創造、活動や知的な思索の記録、工芸 品、ある種の医療技術などが見られるのは、およそ 4,000 年ぐらい前からであ る。紀元前5世紀ごろになると、現在の文学や科学や宗教でも、しばしば引用 される情報や書物が登場してくる。 この頃には、思考力を鍛え、次の世代に継承する学校がつくられている。プ ラトン(427-347BC)の学校、アカデミア(386BC 設立)は、そのうちの有名 なものである。民族として宗教と不可分の学校と教育を重視したのは、ユダヤ 人である。一世紀頃、古代都市エルサレムがローマ軍により包囲され滅亡が運 命づけられたユダヤ人(Yohanan ben Zakkai)たちが、一計を案じて包囲軍に 町が陥落した後、学校を再建してもらう約束を取り付けた逸話はよく知られて いる。ユダヤ教に限らず、キリスト教の修道院、仏教のお寺のような宗教の教 団あるいは修行者の訓練組織は、学校の特徴を備えている、 中世ヨーロッパにおいては、大学 University が生まれる。最初の大学は 1159 年、イタリアのボローニヤで建設されたボローニヤ大学である。ただし、イス ラムの大学であるアズハル大学(975年)が世界最初の大学であるとする説 もある。この他に、ライデン大学、ハイデルベルク大学なども古い大学である。 学校と並んで、重要な大規模な図書館もすでに古代エジプトにアレキサンド 6 リアに建設されている。これに関しても、メソポタミアの宗教上の中心地であ ったニップールニップーの神殿内にあったとされる図書館が世界最古であると する説もある。アレキサンドリア図書館の起源は紀元前3世紀にさかのぼり、 数多くのパピルス文書などを 保管していたという。エジプト考古庁は、「世界 最古の総合大学」と称しているという。ここには、薬草園もあった。 この他にも、1264 年に設立されたイギリスのマートン・カレッジ(Marton College)、。イギリスで出版されるすべての本が収められている、図書館ボドリ アン(The Bodleian Libraly)など、今日も機能している古い大学、図書館は 沢山知られている。 人類が蓄積してきた情報を飛躍的に増大させた、次の革新的な技術は、15 世 紀半ばに発明された活版印刷術(グーテンベルグ、1440)である。これによっ て印刷された聖書が宗教改革を呼び、ヨーロッパのルネサンスを引き起す原因 にもなった。さらに、19 世紀の後半になると西欧でタイプライターがオフィス で使われるようになった。このことが女性のオフィスへの進出、つまり職業婦 人の出現につながった。 文字の違いから、日本語のタイプライターは、西欧ほど普及しなかった。日 本語を表記する機械は、コンピュータのワード・プロセッサーとしての機能実 用レベルに達した 1980 年代の後半に過ぎない。文書作成手段の普及に関して、 日本は欧米に較べて1世紀遅れたことになる。 19世紀末より現代にいたる、社会的な情報処理機能の発展に寄与した技術 としては、写真機、電信電話、無線通信、マイクロフィッシュ、ラジオ、テレ ビ、計算機、計算機周辺装置と媒体、複写機、計算機通信システム(とくにイ ンターネット)が挙げられる。この他に忘れてならないのが、精密な時計と地 図、現在では GPS である。これによって現代人は、事象を容易に時間的、空間 的に把握できるようになった。人間の強みは、こうした道具を個人的に使用す るたけでなく、それらを発明、改善していく知識を、学校、図書館、企業活動 などにより、社会の中に定着させ、磨き上げてきたことにある。 情報知識の時代 情報機器の進歩が発達した現代は、知識の時代と言われる。P. Drucker はそ の著、Age of Discontinuity(我が国では「断絶の時代」と訳されている)で、 そうした時代は、1970 年代から始まったと指摘している。労働人口の中核は、 7 農業、工業から知識労働へと移行しているが、現在の知識労働者たちは、組織 に属さないと能力を発揮できにくい状況になっている。それは、人間の社会が 高度に情報知識に依存するようになっており、情報知識に関る資源が社会と組 織に集中する傾向がすすんでいるからである。 1.2 思惟と自然認識 思惟(しい)とは、人間の思考行為のことであり、英語では Think に対応す る。人間の思惟能力は、自然を認識しようという努力する過程で磨かれてきた。 自然とは、外界であり、生存している環境である。野生食料の採取にしても、 栽培農業にしても、家畜を飼うことしせよ、外界について学ぶことが不可欠で ある。同じことは、住居を構えることにも、衣服を作ることにも言える。ゆえ に、古代文明が成立した 4000 年前頃には、今日の科学、技術の原型が生まれて いる。生存の不安が減った人間は、純粋の好奇心あるいは楽しみのために考え、 議論を戦わし、自らの思考能力を鍛えるようになった。このような過程で、現 代に通用する哲学、数学、科学が生まれた。また美術、工芸、兵器、その他の 技術が洗練されてきた。それは、古代のギリシャ、インド、中国にさまざまな 賢者が出現した時代 500-300B.C.でもある。この時代の哲学、数学、文学は、現 代にも通用するレベルにたっしていた。例えば、ソクラテス、プラトン、アリ ストテレス、釈迦、老子、孔子の哲学や宗教的な言葉は、今日でも教えられ、 学ばれている。また、ユークリッドの(幾何学)原論も、完成度の高い数学上 の著作である。同時代あるいはそれに続く時代において、ギリシャの学者たち は、原子論(デモクリトス)、太陽のまわる地球の回転(アリスタルコス)、地 軸の周りの回転(ピタゴラス派のヒケタス Hiketas)など自然認識の正しく説を 提出している。また多少時代は下るが、プトレマイオス(73-151AD)も、太陽 と地球入れ替えれば後の地動説とほとんど同じになる天体運動説をだしている。 ただ、自然科学においてはアリストテレスの誤った考えがはびこることにな った。彼の考えは中世まで、すなわちルネッサンスが始まるまで力のあった教 会の教義に入れられていたい。このことに力のあったのは、中世スコラ哲学の 権威トマス・アクイナスであった(1225-1274)。その権威に疑問を提出したの が、フランシスコ派の修道士、オッカム William Ockham(1280/5-1347/9)である。 彼はトマス・アクイナスの神の存在を証明する5つの議論の中の、第1の運動 に関る部分が正しくないと指摘した。その説は、 「動いているものには動かして いるものがある」というアリストテレスの説である。この指摘は慣性の概念を 生み、学者たちに受け入れられるようになった。これによって、このことだけ ではなく、アリストテレスの説に疑問がもたれるようになった。 8 こうした自然認識の進歩や天体の運行に関するコペルニクスの観察(1543) とケプラーの理論的な考察(1609)を経て、ガリレオーニュートンの力学が完 成する。ガリレオ(1564-1642)の没年がニュートン(1642-1727)の誕生年で あることは興味深い。同時代のデカルトの数理的自然観、ライプニッツの微積 分学も現代につながっている。アリストテレスの説が訂正されるまでに、約 2000 年かかったことになる。 熱力学、電磁気学、光学、統計力学など、物理学のその他の分野がかたちを なしてきたのは、1850 年代頃である。力学を含め、これらの古典的な物理学は、 その後数学的な形式が大いに整えられた。例えば、力学からは後の量子力学の 誕生にも役立った解析力学が生まれた。ほとんど完成したかに見えた古典物理 学も、20 世紀になる頃、相対性理論と量子論という2つの革命的な理論によっ て改変を余儀なくされた。これによって古典物理学、とくに力学によって構築 された空間と時間に関する認識、自然の観測や観測データの解釈という、基本 的な思考の枠組みも変革を余儀なくされた。アインシュタインは、この 2 大革 命の大きな担い手でありながら、量子力学の観測と解釈に関しては、反対の立 場をとった。しかし 1950 年代には、こうした論争も決着し、新しい理論の正し さはゆらぎないものになった。ガリレオーニュートンの力学が建設されて約 200 年経過した後、次の 100 年で、現代物理学の枠組みがほぼ完成したことになる。 もちろん、現代の物理学は、素粒子論(量子色力学)や宇宙論、非平衡の統計 力学などにおいて、さらに理論が発展しているが、1950−60 年代頃までの物理 学の教科書の多くは、いまでも通用している(例、Sommerfield)。 この時代まで、数学と物理学はかなり重なっていた。19 世紀までは、数理物 理学と称されてもいた。ポアンカレやフォン・ノイマンは実際に双方にまたが って影響力を発揮した数学者である。しかし彼ら以後、両者の乖離が著しくな っている。物理学と化学、化学と生物学が接続されたのも、ほぼ 20 世紀の後半 である。 現代科学の方法論は、仮説を立てることとその正誤を実験あるいは観測によ って検証することである。その際、判断根拠として統計的な仮説検定理論が使 われる。そうした信頼性の高い理論は、近代的な確率論に基づく統計学から生 まれてきた。こうした理論は現在でも改良されているが、その原型が Fisher ら によって 1950 年頃までにつくられている。 科学の発展は技術や産業の発展と相互に影響しあっている。ルネッサンス以 後、アリストテレスの思想はガリレオーニュートン理論で置き換えられた。産 業革命は工業的な装置の開発により、19 世紀の物理学の発展をうながした。カ ルノーの熱力学の研究は、効率のよい熱機関の開発が動機になっている。ヒト 9 ラーの台頭は、ユダヤ人知識人の大移動をもたらしたが、第 2 次大戦中、大戦 後のアメリカの科学、技術の発展に大きく寄与した。その戦後に、電子計算機、 ロケット、ジェット機、トランジスタ、情報工学や計算工学の基礎理論などが 相次いで生まれた。これらは、知識社会を到来させることなる。19 世紀以後、 新しい技術が成熟し、大きな産業として社会に影響をおよぼすには、およそ半 世紀かかっている。現在の量子計算の研究は、より優れた計算機をつくりたい ということから始まっている。それは、ちょうどカルノーがより効率のよい熱 機関を開発したいという欲求から熱力学の誕生をもたらした基礎的な研究をし たことを連想させる。 1.3 数学と情報計算 先に述べたように、現代の数学に通じる数学が生まれたのは、哲学や自然哲 学と同じくギリシャにおいてである。それ以後、数学の進歩を一時担ったのは、 アラビア(イスラム圏)である。数学は天文学のような自然科学だけでなく、 測量、土木、建築、工芸、美術など幅広い分野と関係している。そのような関 係において常に新しい知識が加わったと思われる。ガリレオーニュートンの力 学がつくられていた頃、ニュートンとライプニッツの微積分学やデカルトの幾 何学など、近代数学の基盤づくりがなされた。それ以後、ガウス、オイラー、 フェルマー、ガロア、アーベル、リーマン、カントール、デテキンド、ラグラ ンジュ、ヒルベルトなど多くの偉大な数学者が輩出し、数論、解析学、代数学、 幾何学などが大きく発展した。こうした数学の本流とも言える進歩の中に潜ん でいたのが、論理的な思考方法、論理学である。 人間は必ずしも言葉によって考えるわけではないが、考えを表現するために は言語を使う。とくに他人と議論する場合は、相手が同意するような共通の論 理や修辞を使う必要がある。論理的な思考方法は、宗教の経典の解釈をめぐる 議論、裁判など紛争事の裁定、学問的な論争、弁論などによって磨かれてきた。 また、哲学者は、洗練された対話術、弁論術、推論術、証明術として整理して きた。アリストテレスはそれらの集大成者として知られている。ユークリッド は数学の中の幾何学において、こうした厳密な思考を展開した。それが彼の(幾 何学)原論である。同様に洗練された思考術は、古代ギリシャだけでなく、古 代インド、古代中国にもすでに存在していた。それから中世まで、西欧文化は 停滞していたが、先に述べたようにイスラム文化圏では数学が発達した。 西欧は、ルネッサンス以後、デカルトの方法序説やブールの思考の法則 Laws of 10 Thought などをへて、思考方法における数学からの影響が増大してきた。さらに 19世紀の後半に発表されたカントールの集合論は、数学の根底をゆさぶった だけでなく、人間の思考の限界についても大いに考えさせるものであった。集 合論の矛盾の解決は、数学者だけでなく哲学者の挑戦課題となり、逆に、数学 と論理学を一体なるものとした。このような数学の基礎に関する論議は、20 世紀の始めの相対論や量子論による物理学の改革と時期を同じくしている。デ ィビット・ヒルベルト、ヘルマン・ワイル、フォン・ノイマンなどは双方に大 きな影響を及ぼした数学者である。 集合論の提唱に端を発した「数学の基礎」や「正しいとはどういうことか」、 人間の思考の基盤と限界はどこにあるのか、などに関する論議は、数学を公理 から再構成しようという試み、数学基礎論 Mathematical Logic の発展につなが った。その流れの中から、ゲーデルの不完全性定理が生まれた。この定理によ れば、「いかなる体系化された知識にも限界がある」こと、その限界とは、「そ の体系の中で表現される問題の中には、その体系の中では正しいかそうでない かが結論できないものが存在すること」になる。 こうした厳密な語論を展開するための方法論として、ギリシャ時代からの論 理学が深められ、命題論理や述語論理などとして整理されるようになった。こ うした抽象化は計算の可能性を広げることにもなった。 数学には、厳密な思考方法としての論理の他に、計算という側面も含まれて いる。計算法あるいは計算術と数学とは関係が深いが同じではない。計算術に は、実際に数を操作するための熟練が要求されるため、偉大な数学者が、偉大 な計算の達人とは限らない。数学は計算法の基礎を与え、それを論理的に深め る。計算道具としての算盤には長い歴史があるが、計算のための機械の発明は、 ずっと遅れていた。数学者パスカル、バベッジ、などの挑戦があったが、電動 ではあるが手の操作に頼った計算機がビジネスや科学計算に使われるようにな ったのは、20 世紀になってのことである。タイガー計算機はその一例である。 IBM もそうした事務機器としての計算機を扱っていた。電子計算機が開発された のは、第2次大戦の直後の 1946-8 年頃であり、ビジネスや科学計算の高級な道 具として世に広まったのは、1950 年代、多くの科学者が利用できるようになっ たのは、1960 年代からである。この頃になっても、タイガー計算機は研究者に 使われていた。いまや計算機は科学者のなくてはならない道具になっている。 計算の機械化は、論理の形式化と表裏の関係にある。それは情報操作を計算 によって行う情報処理技術と直接関係している。計算は数あるいは数の代入を 想定した記号に対する操作である。計算機は、数を入力として受け取り、数を 11 出力する。数によって情報が表現されることもあるが、情報はそれ以外のさま ざまな記号(symbol)や表現手段(例えば顔の表情など)が使われる。情報は 発信者と受け手がおり、その媒介体が存在する。この意味で通信と不可分の関 係にある。計算ではそうした発信や受信、さらに媒介体は想定されていない。 人間のコミュニケーションの手段である言葉は、文字で表現される。文字は適 当な約束の下に数に置き換えられる。これは符号化(coding)の1種である。 顔の表情なども適当に数値化することができる。これはディジタル化 (digitalization)と呼ばれる操作である。情報が数で表現できれば、計算に よって情報の操作あるいは処理を行うことができる。ゆえに情報処理は計算に 変換できる。 情報に関わるもうひとつの基本操作は、伝送である。伝送には送り手と受け 手が存在する。実用上、送られる情報はしばしば送り手によって符号化 encoding され、受け手によって復元 decoding される。情報伝送における課題は正確さと 効率である。すなわち、送り手の手元にある、送ろうとする情報を誤りなく、 受け手に送信することである。さらに、より大量の情報をより早く送信するこ と求められる。これは、符号化と伝送路の通信容量の問題になる。実際問題と しては、これにさらにエネルギー消費やコストを低く抑えることや、通信内容 の秘密を保つことなどという問題も加わる。これらが通信に課せられた技術的 な課題である。こうした処理も計算に変換され、計算機で効率的に実行できる。 その誕生以来、 (電子)計算機には、より大きな数を扱うこと、より高速に計 算を実行することが求められている。このことは、計算機を科学計算や給与計 算のような計算よりは、情報処理機として使うときについても言えることであ る。 表 X は、計算機が科学研究や技術開発の現場にどのよう計算機が使われるよ うになったかを要約したものである。この分野は計算機が最初に応用された分 野であり、また、常にもっとも高性能の計算機が最も先端的な使われ方をされ てきたところである。 Hermann Weyl, Philosophy of Mathematics and Natural Science, Princeton University Press, 1949 ヘルマン・ワイル、数学と自然科学の哲学、岩波書店、1959 (広大工学図書 401,W-64) 12 表X 科学研究や技術開発の情報計算環境の進歩 1960年代まで:IBM に象徴される汎用コンピュータ Main Frame のみの時代 であり、一般の研究者である利用者はコンピュータにふれることはなく(バッ チ処理)、FORTRAN で書き紙のカード(パンチカード)をセンターに渡して計算 してもらるだけであった。 1970年代:DEC(Digital Equipment)社の実験室用のパソコンが使われる ようになった。同時に MIT の多くのユーザが遠隔地から対話型で利用する時分 割利用の大型コンピュータ、DEC10/20 を利用した LISP 言語による人工知能研究 が始まった。Evans & Sutherland で代表される Graphic Display で分子グラフ ィックスが試みられた。 1980年代:仕事に使える PC が出現した。IBM が Microsoft と提携し、PC(AT) のスタンダードとなった。アップル社が、Zerox の Pala Alto 研究所が開発した グラフィカルな操作を重視した技術を実用化した Mac を開発した。80 年代の後 半 に は 、 Unix を OS と し 、 LAN ( Local Area Network ) の 構 築 が 容 易 な Workstation(現在の Server)が出現した。UNIX との関係で C 言語が普及した。 1990年代:Internet すなわち TCP/IP を通信のプロトコルとする広域ネット ワークが普及し、画像も扱える WWW(World Wide Web)技術が爆発的に普及した。 これと従来の PC と Workstation の高性能化が起きた。マシン環境では GUI (Graphical User Interface)、プログラミング言語では Network に対応した JAVA、 Script 言語である Perl などが広く使われるようになった。 2000年代:Internet には、携帯電話を含むさらに多くの情報機器が接続さ れるようになり、Ubiquitous Computing の時代となった。あらゆる品物につけ られるネットワーク端末タグも開発されている。Internet は Agent と呼ばれる ような、知識を操作し意味を解釈する Semantic Network への発展を模索してい る。また、計算性能が高く価格が安い、PC や Linux を OS とする PC を多数並列 に接続した Cluster が普及している。この技術はさらにネットワーク上に多数 の共同利用コンピュータを置く Grid Computing へと発展している。また WWW の 基礎となった言語 HTML に変わってデータの統合に容易な XML が研究されている。 13 1.4 思惟の機械化 20世紀の後半、計算機が出現してから、思惟の機械化、すなわち、計算機 に人間のように考えることをさせようという研究が始まった。この研究分野は 人工知能とも呼ばれる。その後、研究領域はどんどん広がり、いまやあらゆる 学問、人間の知的な活動のあらゆる可能性と関係するようになった。これは進 歩ではなく、むしろ停滞の兆しとなっている。というのは、そのように広がっ てしまった学問には、もはや理解可能な体系も統一の原理もないからである。 それぞれの研究者は勝手に研究を宣伝し、仲間の間だけで議論していることが 多い。同じことは人型ロボットの研究についても言える。人間のような2本足 走行と手を使えるロボットという運動機能に絞ったロボットの開発は、目的が 明確であるが、 「人間のように対話する」というような機能開発の目標は、極め てあいまいである。人工知能以外にも、人間の知的な活動については、哲学、 大脳生理学、教育学、心理学、認知科学などとして研究されている。 以下では、とくに厳密な思惟が要求される科学研究や技術開発分野における 思惟の機械化あるいは人間の思考の機械による支援という、より限定された、 しかしより明確な目標を念頭に置いて、思惟の方法論とその機械化について考 えてみる。 我々の出発点となるのは、思考には、いくつかの基本パターンがあるという 考えである。すなわち、人間の思考には、いくつかの先験的といってよいよう な基本パターンがあるという考えである。それらは真実を発見することと、何 か設定された目標を達成するために、組み合わされて使われる。こうした思考 の基本パターンは、帰納、演繹、発想、計画である。帰納とは、事実、科学で 言えばデータを集めて、一般的になりたつ規則(法則)を導くことである。演 繹とは、ある前提と人々が先験的に正しいと認めている推理の形式とによって、 新しい真実を導くことである。発想とは、帰納でも演繹でもない、しばしば直 感と呼ばれる思考能力によって、新しい考えを思いつくことである。計画とは、 与えられた目標を以下に達成するかに関する方法論である。これらはまさに基 本的な要素であって、現実の思考はこうした要素を入れ子にしたり、結合した りした、複雑な構造になっている。 興味深いことは、これらの基本パターンに対応した情報計算技法がすでに開 発されていることである。 帰納 Induction この手法は事実やデータを集め、そこから一般的な規則を導くとう手法であ 14 る。これは近代的な実験を基礎とする自然科学の基盤となる方法論であるが、 それを一般化、形式化した理論や方法論は案外少なく、統計学、データ解析、 データマイニング、パターン認識などに関連している。ここには2つの過程が ある。ひとつは、集めたデータを分析したより普遍的な規則に関する仮説を立 てることである。これは明らかに発見に属する仕事である。もうひとつは、仮 説を検証して誤りがないか吟味することである。この2つの過程はちょうど、 刑事事件の犯人の捜査逮捕と裁判による判断に相当する。統計学にも発見的、 探索的な前者の過程に対応する理論、例えば探索的データ解析 Exploratory Data Analysis と、厳密な検証のための仮説検定がある。 どちらかと言えば、データマイングやパターン認識は、仮説発見型の方法論 である。パターン認識の英語は、Pattern Recognition であるが、これは与えら れたパターンを把握する cognition(認知)の過程とそこで得られた規則を使っ た再認識、再認知 recognition の過程を含んでいる。 演繹 Deduction 演繹は演繹的推論とも呼ばれ、前提となる命題に正しいと思われる推論規則 を適用して新しい命題を導く手法である。この手法は、数学基礎論において最 も厳密に研究され、体系化されている。それは述語論理を形式化したもので、 計算の基礎的な研究にも深く関係している。計算機が普及してからは、述語論 理が計算機に人間のような判断能力を与えようとするいわゆる人工知能の研究 に応用されるようになった。これは人間の経験知識を論理的に書き下して、こ れを機械に実行させるプログラムに変換するという方法論である。こうした方 法論はエキスパートシステム、人工知能、知識工学などと呼ばれている。 発想 Abduction 発想はいわゆる突然思いつくという人間の頭脳の働きである。数学者(アル キメデス、ポアンカレ、岡潔)や科学者(ニュートンの逸話、DNA2重ラセンモ デル、ベンゼンの6員環モデルなど)のヒラメキによる発見体験はよく知られ ている。何らかの問題解決において、解決方法を発見する「発見的な方法 Heuristics」も、発想の例である。人工知能の研究として、例えば計算機に幾 何学の定理を発見させるというような研究も行われているが、実用的なものに なっていない。厳密なアルゴリズムによらない、不定積分を求めることや因数 分解のような問題も発見的に行われる。こういう問題にはすでに優れた数式処 理プログラムがある。人間ができないような膨大な組み合わせをしらべて、何 らかの発見を計算機に行わせることは可能である。チェスや将棋のようなゲー ムがその例である。 15 計画 計画とはある目標を達成するために効率のよい手順を吟味し、選択すること である。こうした方法論のひとつは、第2次世界大戦中に発達した Operations Research (OR)で開発された線形計画法、ベルマン R. Bellman による動的計画 法などの数理計画法である。もうひとつは、これも第2次世界大戦中に発達し たロケットの制御などの目的で発達した制御工学 Control Theory である。第2 次世界大戦後間もなく、情報学の創設に関ったウィナーN. Wiener は、サイバネ ティクス Cybernetics という本を著して、大きな関心を呼んだ。今日の複雑系 のように、サイバネティクスは一時、独立した研究分野となって大いに期待さ れた。 このような技法は医学や医療サービスに応用されている。また、工場の生産 性や事務仕事の効率を向上させるために管理手法も計画の学に入る。さらには、 個人の仕事や時間管理なども計画の学と関係している。 発想の普遍性と価値観 人間の思考パターンは、上記のように一応分類することができる。しかし、 それは「基本」であって、実際問題ではこれらの思考過程は互いに入れ子のよ うに相互に関係し、組み合わされる。例えば帰納においてどのような規則を思 いつくかという過程や、演繹における推論規則や公理の選択、計画における目 標の想定などは、すべて何らかの手段で思いつかねばならない。それは誰でも できることではなく、人間の本能その他の先験的な要素、資質や気質、意識、 外部環境からの刺激、感動、情動などさまざまな因子が働いていると考えられ ている。つまり、「自動的に」とか、「機械にやらせる」、「論理的に証明する」 と言っても、まったく人間の主観を排除した機械思考が行われているわけでは ない。自然科学における正しさも、自然現象や実験と矛盾がないことが決め手 になるが、同じ結果に関しても解釈には巾があり、主観が排除されているとは 言えない。 例えばパターン認識においても、対象をn次元ベクトルとしても、それぞれ の座標間の相互の重みを理論的に決定することは難しい。しかし、その重み次 第で、ベクトル間の距離は変わってしまい、 「似ている、似ていない」という議 論は、根本からなりたたなくなる。そもそも対象をどのような述語あるいは観 測値で記述するかが大問題である。この点に関して、渡辺(慧)は、対象とそれ を記述する命題を価値観(主観)に基づいて選択しないと、いかなる対象の間 の類似度も、他の組のそれと等しくなることを、述語から構成される束の構造 から証明し、これを「みにくいアヒルの子の定理」と呼んだ(渡辺、知るとい 16 うこと、第4章)。 神沼は、医学診断を行うコンピュータ・システム研究の経験から、人工知能 と人間の判断力の違いは、人間の「感じる心」にあるという印象をもった。す なわち、 「我思う、ゆえに我あり」ではなく、「我感じ、我思う」が正しいのであ る。この意味では、レイチェル・カーソン Rachel Carson の The Sense of Wonder の涵養が、知性教育においても重要であろう。 ついでに言えば、医科学が進歩すれば、あらゆる医学の診断の答えは一つに 収斂すべきものである。しかし治療法の選択は、患者の価値観に左右されるか ら、どんなに医学が進歩しても、客観的には決められない。これは科学的な発 見と計画との人間の行為としての根本的な違いでもある。 集団的な思考技法 帰納、演繹、発想はアリストテレスの時代から言われてきたことであり、長 い歴史がある。計画の学が意識され始めたのは、総力戦と言われた第2次大戦 時の軍事や、戦後の経営においてである。これらはすでに広く普及した方法論 となっている。それでは、思惟の方法論のフロンティアは何であろうか。 ひとつは個人の思考能力の拡大であり、もう一つは、複数の人間の思考であ る。前者においては、認知科学と呼ばれるような、人間の思考過程の研究と連 携して展開されることになろう。後者においては、爆発的な成長を遂げている ネットワーク技術が基盤となるであろう。また、共通の知識基盤の構築、その ための知識の表現、発表方式などの改革が必要である。 集団的な思考技法開発の難しさは、集団の構成者の価値観が違うことである。 価値観を同じくする人間を集めると発想が限られてしますから、この二律背反 にどう対処するかが課題となるであろう。 情報と知識の扱いの革新 集団的な思考技法の進歩と連動しているのは、組織や社会における情報や知 識の扱いを革新することである。例えば、大学、大規模な研究機関、図書館、 学術雑誌、学会などと言った、情報と知識に関る基盤的な組織と、そこにおけ る情報と知識の扱い、そのために専門家の養成などを含め Innovation の機会は 沢山ある。それらは、情報学の新しいフロンティアでもある。 1.5 自然科学研究を支援する思惟の方法論と環境 以上のような普遍的な思考パターンに対応した方法論は、計算機の進歩とと もに、自然科学のそれぞれの分野の知識や方法論と組み合わされて研究者の思 考を支援する方法論として発展している。例えば、化学であれば、Chemical 17 Informatics (Chemoinformatics、Cheminformatics)、Chemometrics, Molecular Graphics、生物学であれば Biostatistics, Bioinformatics、Computational Biology 、 医 学 で は Medical Statistics, Medical Informatics, Neuroinformatics, Immunoinformatics などいう名称の下で、独立した学会や研 究集会が組織されている。このように思惟の方法論は自然科学の研究の基礎的 な方法論であり、基盤となっている。同様な方法論は、工学、心理学、教育学、 社会科学、経済学、金融、危機管理、経営学、軍事学など、ありとあらゆる研 究開発分野に浸透している。 こうした研究に関る思惟を支援する基盤となる情報計算システムには、分野 に依存しない共通した構築原理がある。これを図 によって簡単に説明しよう。 この図は、研究者を中心として見た仕事の環境である。彼(女)は、外部の世 界、自分の研究室、実験室あるいは野外という3つの世界と関っている。彼は、 何らかの考え(仮設)に基づく実験あるいは野外での観測あるいは調査を行う。 その結果は、オンラインあるいはバッチで研究室に集められる。それらのデー タは、文書やデータ・ファリルなど情報として蓄積される。研究者はこれらの データを解析し、結果を報告書とし、その一部を雑誌や本、その他の媒体とし て外部に発表する。研究者は、発表された研究報告を集め、自らの研究室から 利用できるようにする。 研究開発環境への IT の浸透は、最初は理論計算やデータ処理、データの統計 解析のバッチ処理、On line による文書閲覧、データベース、実験や野外調査機 器 へ の コ ン ピ ュ ー タ 組 み 込 み 、 実 験 デ ー タ 管 理 ( Laboratory Information Management System, LIMS)などから始まった。その後、次第に研究者の創造的 な思考を直接的に支援する知識やデータのシステム化に移行している。Grid Computing, Ubiquitous computing, Semantic Web を指向する現在の IT の潮流 は、研究者が必要とするデータと知識をより容易に入手することを可能にし、 自分の仮説を検証する Modeling の構築やそれに基づく Simulation をより容易 に実施できるような方向に進んでいる。Internet/WWW の普及は研究者にとって もっとも重要な研究データと研究原著論文へのアクセスを飛躍的に向上させた。 18 外の世界 研究者の思考の世界 実験室・野外研究 On Line Access In House 実験・野外 文書システム 文書・データ データ収集 データベース 参照システム 解析、蓄積 実験・野外測定 IT 組み込み機器 R&D 支援システム 出版事業 研究成果 研究者の 外部報告書 の文書化 知識と 学術誌・商業出版 と蓄積 アイデア 実験 野外調査測定 図1.一般的な研究開発における情報環境 データの収集と蓄積: 知識の収集と蓄積 LIMS:撮影、撮像 一般的な文献、データ 数値、波形、画像 専門領域の研究情報 データの蓄積と管理 (データベース) データ、知識の表現 表、図形による視覚化 問題ごとの Model、定式化 普遍的な思考支援 Protein Folding 帰納:データからの Docking Study 規則の抽出 Sequence analysis 演繹:演繹的推論 Homology Search 目標達成:制御論 -omics data analysis 図2. 思考支援には普遍的な技法と個別の技法の組み合わせがある。 19 最近は、データだけでなく、その分野の基盤となる知識や個別の知識をコン ピュータに蓄え、必要に応じて連係して参照できるような「知識基盤環境」づ くりが盛んになっている。こうした方向への試みは、最近の生物医学において とくに顕著である。その好例は、細胞内の信号伝達経路網 Pathway/Network に 特化したオンライン雑誌である Nature の The AFCS Signaling Gateway と Science の Signal Transduction Knowledge Environment(STKE)である。これらはいず れも数年前(2000 年頃)に相次いで刊行された。これらのオンライン誌は、従 来の雑誌とデータベースを組み合わせた情報知識ベースであり、データや知識 を視覚的に表現する機能ももっている。おそらく同様な試みは、他の多くの分 野で始まるであろう。 こうしたある分野における情報計算技法を、その分野に属させるのが、それ とも情報計算に区分するのかは議論のあるところである。例えば、Chemical Informatics や Bioinformatics は、Chemistry あるいは Biology の一部と考え るべきなのか、Informatics に分類すべきなのかは議論のあるところである。例 えば、Chemical Informatics としては、コンピュータで扱えるような分子の記 述法、分子構造データベース、分子構造推定、分子グラフィクス、化学反応デ ータベース、有機合成における経路探索、構造活性相関解析、高分子エネルギ ー地勢 Energy Landscape の主成分表示などがある。これらは分子のエネルギー は反応を理論的に計算する計算化学と深いつながりがある。Bioinformatics は、 DNA の塩基配列やタンパク質のアミノ酸配列など、生体分子の配列情報の記録、 配列データのデータベース、配列データの解析、分子構造の立体表示、配列デ ータからの高次構造予測などから始まったが、最近は、いわゆる Omics(DNA チ ップや Proteomics, Metabol/nomic などの)データの解析、タンパクータンパ ク相互作用、Pathway/Network データベース、細胞や生理学的な現象や疾病の Modeling や Simulation にまで発展している。 さらに化学と生物学の双方に関係した医薬品開発では、医薬品候補分子のデザ イン、生体高分子と低分子化合物であるリガンドとの結合解析 Docking Study、 ADME/Tox (生体における医薬品の吸収、分布、代謝、排泄と毒性)予測の問題が ある。また、医学となると画像診断、病名診断(患者の状態推測)、治療法の選 択、最適な薬物投与計画などの研究がある。 上に述べた化学、生物医学や医薬品開発の Informatics には、確率統計学の 手法、データ解析、パターン認識、クラスタリング、データマイニング、人工 知能、動的計画法、データベース、グラフィクスなどが含まれているが、これ らは情報学の手法そのものである。このような分野で学際的な共同研究が如何 に重要であるかは、明らかであろう。 20 1.6 学際的な人材の必要性 上記で見たように、計算機の進歩に後押しされた思惟の数理的な方法論(情 報計算技法)は、Meta Science/Meta Technology としての性格を備えているた め、自然科学を始めとする多くの研究分野に浸透している。生物医学における 動きはとくに急である。残念ながら変化が急なだけに、受け入れ側の意識はま だあまり高くない。簡単に言えば、彼らにとって情報計算技法は道具であり、 化学反応の試薬や分析装置と同じく、それはサービスとして提供されるべき対 象であるとしか認識されていない。つまり自分たちでも使い方に習熟されば、 専門家の依存する必要はないと考える伝統的な分野の研究者は少なくない。こ んことは、こうした思惟の方法論が力を発揮すること妨げている。さらに、科 学や技術の革新をさまたげることになっている。このような誤解が蔓延してい る大きな原因の一つは、情報計算技法の研究者自身に、 「情報計算技法は思惟の 方法論である」認識が欠けていることである。すなわち、現在、統計学、パタ ーン認識、人工知能、計算機による推論、数理計画法などとバラバラに展開さ れている技法を思惟の方法論という視点から体系化することが必要である。こ うした作業は、脳科学や認知科学の進歩により、人間の思考行為の仕組みが明 らかにされることと平行して進められなければならない。そうした体系化は、 情報計算技法の教育にも考慮されるべきであろう。このことについては、この 講義の最後に再度議論することにする。 1.7 新しい目標 人間の思考力の開放 これまでの人工知能の方法論は明らかな行き詰まりをみせている。これまで、 その指導理念は一貫して、 「計算機に人間のような知能的な働きをさせる」こと であった。その究極的な目標は人間のように思考する人間型のロボットである。 このような技術の流れの問題は、 「何を人間らしいとするか」であるが、いずれ の方向であれ、ある方向を定めれば、少しずつ成果が上がっていくであろうこ とは、自明であろう。 しかし、計算機応用の立場から言えば、これまで取り上げられてこなかった 課題は、人間の思考能力を計算機を使って、如何に拡大するかである。あらゆ る分野でコンピュータが使われるようになった現在、こうした研究が行われて いると考えるのが自然だが、実際には研究はそれほど支援されていない。 人間の頭脳活動は、価値観や感情に支えられている。蓄えられている知識に も左右される。超能力と呼ばれるような、言語で明らかにできない働きもある。 21 思惟の共同作業の方法論と道具 人工知能のもうひとつの研究課題は、複数の人間による思惟の共同作業の支 援である。科学研究や技術開発はその例であるが、社会問題の解決というよう な課題も対象になりうる。そのためには、現在の社会で知識がどのように生成 され管理されているかを分析し、新しい方式を考察しなければならない。H.G. ウエルズの世界頭脳 World Brain はそうした課題に対する先駆的な洞察だと言 えよう。 新しい教養としての情報計算学 次なる社会における科学研究や技術開発の担い手は現在の若手研究者である。 現在の自然科学の専攻者にとって、情報計算技法は、便利な道具に過ぎない存 在であると思われるしかし情報と計算の学問にはそれ以上の意味がある。物理 学のトレーニングが数学の学習なくして成り立たないように、これからの自然 科学者は、情報と計算の学の基本と、それらの学問と自分たちの専門分野との 関係を学んでおく必要があるだろう。そうした教育は単にコンピュータをどう 使うかを越えたレベルの話でなければならない。 なお、化学、生物学とその関連科学における情報学と計算利用に関する学会 が、計算情報化学生物学会 Chem-Bio Informatics Society (CBI 学会である。 www.cbi.or.jp)。 22 表1.知っておくべきできごとのおよその年代 宇宙の年齢 150−200億年 太陽系の誕生 地球の年齢 46億年前 生命の誕生 35−40億年前 光合成細菌(藍藻類)による大気中酸素の生成 真核生物の出現 18億年前 動植物の祖先の出現 12億年前 カンブリア紀の生命の爆発 動物の陸上への進出 哺乳類の出現 恐竜の絶滅 20億年前 5−6億年前 3.5-4 億年前 2億年前 6500 万年前 霊長類の出現 ヒトの祖先の出現 200-400 万年前 現代のヒト(Homo sapience)の登場 50 万年前 ヒトの類縁種の最後の絶滅(ネアデンタール人など) 都市国家の誕生 4000-5000 年前 今日に続く宗教(ユダヤ教)が生まれる 4000 年前 賢者(ソクラテス、釈迦、老子、孔子)の出現 秦の始皇帝 12-13 万年前 300-500BC 230-221BC キリストの誕生 ローマ帝国の最盛期 100 (753BC-476 西ローマ帝国、−1453 東ローマ帝国) ゲルマン民族の移動 (5 世紀、450 頃) イスラム教(モハメッド)の宣言 610 日本国の成立 23 グーテンベルグの印刷技術 1440 西欧ルネッサンス 大航海時代 大西洋・アメリカ(1418-1460, 1492-1504)太平洋・インド(1497-98) ガリレオーニュートンの世界観(1609-1687) 産業革命ーフランス革命 19世紀後半 オフィスにタイプライター(1714)出現 自動車、電気、無線、鉄鋼、船、飛行機 現代物理学の形成 1850-1950:電磁気学、熱・統計力学、相対論、量子論 第 1 次大戦(1914-1918):機関銃、毒ガス、戦車 航空機の発達 第 2 次大戦(1939-1945) ロケット、ジェット機、レーダー、計算機 核兵器:マンハッタン計画(1941 年 12 月、1945 年 7 月に3個完成) 石油産業の興隆 半導体技術(トランジスター)の発明(1947) 分子生物学の台頭 核兵器開発競争 人工衛星(1957), 有人月旅行アポロ 11 号(1969) 組み換え DNA 技術の登場 1972 年 インターネットの普及 1992-4 年 クローン動物(羊, Dolly)の誕生 1996 年 ヒト・ゲノム解読計画完了 2003 年 科学史のサイト:www.ou.edu/cas/hsci/rel-site.htm www2.ncsu.edu/ncsu/chass/mds/stslinks.html 24 表2.物理学的な世界観の形成 デモクリトス、原子論 アリストテレス ユークリッド 幾何学原論 300BC コペルニクス 「天体の回転」1543.ケプラー(1571-1630; 1609) ガリレオ(1564-1642):望遠鏡で単体観察(1609) デカルト(1596-1650) ニュートン(1642-1727) プリンキピア(1687) カント 宇宙論(1765) 産業革命・フランス革命 ボルタ 定常電流(1800) カルノー、クラウジウス、トムソン(ケルビン)熱力学 (1824) マックスウエル メンデレーフ 周期律表 マックスウエル ボルツマン 電磁気学(1865) (1869) 熱学(1871) 統計力学(1866-72) ヒルベルト空間論、シュミットの積分方程式理論 プランクの量子仮説 (1900) アインシュタイン:特殊相対性理論、光量子仮説、ブラウン運動論(1905)、一般相対論(1915) 量子力学の完成 (1920-28):化学と物理学の接続 量子電磁力学 QED(Quantum Electro Dynamics)(1927-1950) 核爆弾の開発 電子計算機、Cybernetics、Shannon の情報理論 ( 1946-8) DNA2 重ラセン構造の提唱(1953):情報学的生命観 Big ban 宇宙論 ガモフ(1940 年代の理論):ハッブル銀河の後退(1929) 、エディントン膨 張宇宙(33), ペンジャス/ウイルソン宇宙黒体輻射観測(67) 弱い統一理論(1967)量子色力学 Quantum Chromodynamics 25 表4.Nanotechnology, Biotechnology IT に関連した20世紀の科学・技術の起源 物理学 化学 生物学 情報学/IT Darwin/Mendel 1900 Max. Planck de Vries (Mendel) 量子論 遺伝子 Schroginer 1920 F. Harber 量子力学 Born-Heisenberg P.A.M. Dirac 1930 量子化学 von Neumann Watanabe 1940 Turing Machine 情報エントロピー Schrodinger What is Life?/DNA Perutz/Protein 構造 Computer 電子回路 半導体物理 Organic Chem Cybernetics (石油化学) Shannon 通信理論 1950 DNA2 重ラセン Lowdin 1960 IBM MRC Mol. Lab. Feynman 遺伝コード FORTRAN Nano Lecture オペロン説 Network Gaussian Pattern 認識 1970 遺伝子組み換え 分子 Graphics Sequencing DFT? 統一理論 AI Graphics Chip Com Rational Design PC 1980 Bio ブーム 複雑系 Comb. Chem C.elegans 常温核融合 Carbon Mol. Kinase 並列推論 BM 回路素子 Workstation AFM/STM 1990 Internet Pathway/Network 2000 Nanotech Large Scale Comp. Genome Grid 物質創製 Chemical Genomics Semantic Web Mesoscopic Ubiquitous 26 演習問題 以下の演習問題のうち、A は必修、B、C、D は任意。 A. 自分の現在の研究課題に関して次の分析、考察を行え。 (1)その研究課題の基盤となる理論、計算および実験の道具を列挙せよ。 (2)理論に関しては、それがいつ、どのような経過で成立したかを考察 せよ。 (3)道具に関しては、その根本原理がいつごろ発見されたかをしらべよ。 (4)上記(2)、(3)に関して、発見者、発明者はどのような人間であ ったか、どのような人生を辿ったかをしらべよ。彼の性格や生活と 仕事との関係を考察せよ。 (5)その研究課題は、10年立ったらどうなるか?50年ではどうか? B. 表1および2に関する演習 1.表1の年代が入っていないところを埋めよ。これらの年代のうち、科学(計 測技術を含む)の進歩で大きく変化しているものはないか。その理由も述べよ。 2.物理学中心の表2に、メンデレーフの周期律表(1869)、尿素の合成(1900?)、 空気中の窒素固定(ハーバー法)ダーウィンの「種の起源」(1859)、メンデル の遺伝法則(1865/66)、エィブリーらの遺伝物質が DNA であることの発見(1944) , ワトソンとクリックの DNA の 2 重ラセン構造の発見(1953)など、化学や生物 学の重要な仕事を書き込め。また、西洋中心以外の歴史的な事項を書き込んで みよ。 3.科学の世界で、よく知られた Nature はいつ創刊されているか? Science は どうか? 4.アインシュタインの業績を年代にしていみよ。表2や表3の中の事項とど う関っているか考察せよ。 C. 表3に関係した演習問題 1.Nano, Bio, IT に関連する先駆的な提案や仕事を大雑把な年表にしてみよ。 27 どのようなことに気づくか。20世紀の Visionary Scientist/Technologist を (分野を問わず)挙げ、その理由を述べよ。 2.米国の Department of Energy は、Genome to Life と呼ぶ、生物学研究への 学際的な研究計画を推進している。ここでは、Computational Biology も重要な 課題になっている。Internet でこの計画をしらべ、この計画の目標、到達手段、 個別の研究課題を分析し、計算化学の役割を考察せよ。 3.現在の世界最速のコンピュータ(地球シミュレータ)の千倍早いコンピュ ータ、100万倍早いコンピュータの出現時期を予測せよ。こうしたコンピュ ータは計算化学や生命科学にどのようなインパクトを与えうるか考察せよ。 (参 考情報:Internet により、IBM 社が開発中の Blue Gene や Grid Computing 計画 をしらべよ)。 4.米国では、National Science Foundation (NSF) や Department of Commerce が 2001 年 末 に 、 Nanotechnolgy, Biotechnology, Information Technlogy, Cognitive Science を結集して、ヒトの能力開発をめざそうという Workshop を 開催し、その結果を、Converging Technologies for Improving Human Performance という報告書にまとめた。これは Internet で読むことができる。この報告書を 読み、その意義を分析せよ。 5.図書館、マイクロフィルム、投影機から今日の WWW を 1930 年代に予見して いた H.G. Wells は、技術の進歩に較べて、学校や学会が遅れていると指摘して いる。かれは、巨大図書館とそこに蓄えられた知識を低コストに世界中に配信 できる仕組みを Global Brain と呼び、これによって世界をよくしようと構想し た。IT 革命の進行に較べて、知識を生み出し、それを活用する学校、研究所、 学会、研究開発のやり方など、遅れているところはなにか、どのような Innovation が考えうるかを考察せよ。 6. Nano, Bio, IT の進歩がもたらしている、あるいはもたらすかもしてない脅 威、危険性について考察せよ。 D. New Horizon:未来への希望と危惧 自然と生命の歴史は、単純な基本法則から複雑な現象が生まれることを示唆 している。以下について考えよ。 (1)計算機、IT の進歩 28 (2)生命の今後の進化と生命の改変と創造に関る創始技術 Genesis Technology の可能性 (3)環境問題 (4)人類の自己認識:頭脳はどのようにできているか? (5)我が国の基幹科学と技術 基礎文献 量子情報科学 04(4 月12日) :www.qulis.org ⇒NaBiT 資料⇒量子情報 1. 科学 2. 神沼二眞、ハイテクと日本の未来、紀伊国屋書店、1992 3. 中野達也、生命科学とインターネット、オーム社、1997 4. 神沼二眞、第三の開国ーインターネットの衝撃、1994 5. 神沼、渋谷泰一訳、原爆の開発;小沢、神沼訳、水爆の開発(上・下) 紀伊国屋書 (Richard Rose, Making Atomic Bomb, Dark Sun) 29 第2章 情報学の基礎 2.1 はじめに 情報学についてはいろいろ捉え方があり、専門家の間でも意見は一致しない。この講義 では、情報学とは思惟を計量的にする研究であると定義する。思惟は数学でもなく、自然 科学でもない。それらと深い関係にあるが、Art of Thinking とでも呼ぶべき、術 Art の要 素もある。我々が関心があるのは、そうした性格をもつ人間の行為としての思惟をできる だけ計量化し、できれば機械化する方法論である。 2.2 集団の性質の計量と数理 自然科学が対象とする現象あるいは事象(できごと)は、集団に関っていることが多い。 こうした集団を特徴づけるのは、その集団の性質に関る何らかの量を測ると、その結果が 測定ごとに変化してしまうことである。この変化は、集団を構成する要素が多いほど大き くなる。単一の要素からなる系であっても、何か計測しようとすると必ず、系の外部の系 と作用させなければならないから、測定時に全体の系は複合系となる。 物理学では、微視的な系(Microscopic System)と巨視的な系(Macroscopic System) と区別する。例えば、熱力学の対象となる気体は、巨視的には、体積、圧力、温度などに よって全体の状態が表現される。これに対して微視的には、気体の構成要素である個々の 気体分子の質量、位置、速度などが問題にされる。仮にN個の分子で構成されている気体 を考えると、N個の系全体をとった巨視的な状態量が同一であっても、構成要素である個々 の分子の状態は、それぞれの場合で異なっていることが普通である。こうした微視的な世 界の測定量と巨視的な世界の測定量を結びつけるのが(古典的な)統計力学であり、この 時、微視的な世界を量子力学で記述するのが量子統計力学である。 天気予報の基礎となる気象学も集団を対象とする。それも天気という客観化が難しい対 象をできるだけ計量化、客観化して扱うことを追求している。天気予報は未来を予言する ことであるから、結果が的中することもあり、的中しないこともある。天気というような 巨視的かつ複雑な系において、気温、湿度、雲の量などを測ると、結果は微細に見れば毎 回違ってくる。 生物すなわち生命系もさまざまな種類の分子を要素とする集団である。生物学者が重要 視するのは、ゲノムを構成するDNAが担っている遺伝的な特性である。ゲノムとは遺伝 を担うDNAのすべてを意味する。DNA は生物の外から観察されるさまざまな特徴や性質 1 (生物学では形質という)を左右する遺伝子が並んでいる。遺伝子の違いは遺伝子型 Genotype と呼ばれる。これは微視的な描像である。これに対して外か観察できる形質であ る表現型 Phenotype は、巨視的な描像である。この間をつなぐことが、生物学の大きな課 題である。ただし、両者の因果関係は単純な1対1にはなっていない。例えば、ゲノムを 同じくする生物は、クローン Clone と呼ばれる。一卵性双生児はクローンと同じと考えら れる。クローン生物の集団を考えても、重さ、あるいは個々の生物を構成する総細胞数、 エネルギー消費量などは互いに微妙に違っている。マウスやヒトなどでは知能や行動にも バラツキがある。 科学は、集団を計測した場合、その結果がどのくらい信頼できるかを問題にする。すな わち、まったく同一の系でも、時間を違えて計測すると結果が異なることがあり、構成要 素(あるいはその一部)が同一の集団でも、集団としての観測量にはバラツキがある。集 団を特徴づける量は、個々の観測値ではなく、それらの時間的な平均値であり、あるいは 同一(コピー)集団を多数集めた時の平均値であり、バラツキぐあい(ゆらぎ)であり、 観測自体の信頼度などである。この最後の「観測自体の信頼度」とは、我々の「観測の確 からしさ」、あるいは観測結果に依存した我々の「知識の確からしさ」であるということが できる。さらに、確からしい知識をもたらしてくれる情報ほど、良質の情報だということ がいえる。 情報は得られる知識の量に比例している。得られる知識は、状況が多様性に富んでいる ほど価値がある。例えば、晴天ばかり続く地方で、 「明日は晴天」と予言しても情報として の価値はない。そのことはほぼ確実に起きるからである。しかし、天気の変わりやすい地 方や季節で、信頼性高く、 「明日の天気はしかじか」と予言することは、価値がある。この ように考えると、予言が含有している情報量、あるいは予言がもたらす知識の量は、起こ りうる個々の出来事(事象)と、それらが実際に起きる確率とに関係している、というこ とが見えてくる。そこで次に、情報を計る尺度であるエントロピーEntropy を導入するが、 そのためには、確率の概念を理解していなければならない。ただし必要な確率論は極めて 初等的なものである。そこで以下では最もやさしい確率論を復習しておく。 2 2.2 初等確率論 2.2.1 確率を論ずる時大切なのは、実験 Experiment あるいは試行 Trial と、その結果である標 本(見本)点 Sample point とその集まりである。標本空間である。例えばサイコロを振る という実験に関しては、 「1の目がでる」、 「3の目がでる」という結果が標本点である。サ イコロを振る場合、6つの可能な標本点の全体が、標本空間になる。ここで新たに事象 Event という概念を標本空間の部分集合として定義する。部分集合というのは、ある集合 に属する元(げん、要素)の任意の組である。なにもない集合(空集合)とすべての元を 集めた集合(すなわち出発点となった集合)自身も部分集合の 1 種とみなす。部分集合の 数はもとの集合の要素の数より大きくなる。 例えばサイコロを1回だけ振る実験に関しては、起こりうるのは1から6のいずれの目 がでるだけである。この場合は、それぞれの標本点自身を部分集合、すなわち事象と見な すことができる。これら6つの事象は、異なる事象は同時に起きないという意味で、互い に排他的であり、それら全体では標本空間となる。 しかし、サイコロを2回振る実験を考えると、2回の出た目をたした結果が偶数になる 場合と奇数になる場合とが考えられる。これらを、それぞれ「偶数となる事象」、「奇数と なる事象」すれば、それぞれの事象は、36個の標本点を2つの組に分割した、2つの部 分集合となる。この時、サイコロを2回振る実験結果は、必ずこの2つの部分集合(和が 偶数となる部分集合と、和が奇数になる部分集合)のいずれかになる。すなわち、偶数部 分集合(事象)と奇数部分集合(事象)は、互いに排他的であり、両者を合わせると標本 空間そのものとなる。部分集合を任意にいくつかつくると、それらの構成要素には重複が 見られる。以下では、標本点は有限か、あるいは可符番(Countable)無限であるとする。 すなわち、それらは、1番、2番、3番、というように自然数の対応するように並べられ ると仮定する。 一般に、複数の事象の組であり、試行によって、その中の1つ、そしてただ1つだけの 結果が常に起きるような事象の集合を、「事象の完全な組、A complete system of events」 と称する。確率はこうした事象の完全な組に対して定義される。完全な事象の組について は、個々の事象の起きやすさは、多数の試行を繰り返す実験を行うことにより、実際に起 きた回数によって計量することができる。それぞれの結果が出た回数を試行の総数で割る と、0 から1の値が得られる。これがそれぞれの事象の確率である。事象の完全な組に属す る事象は、互いに排他的であるから、可能な事象(結果)の各々の確率をすべて足すと1 になる。事象同士が排他的でないと、この結果は保証されない。情報エントロピーも、こ うした事象の完全な組に対して定義される。 3 確率の定義 ある完全な事象の組 A を考える。A の要素を A1 , A2 , ..., Am とすれば、 (1) A1 ∪ A2 ∪ ... ∪ Am = A, Ai ∩ A j = Φ (空集合) この A1 , A2 , ..., Am に対して、負でない数、 P ( A1 ), P ( A2 ), ..., P ( Am ) を対応させる。 (2)これらの数は、 P ( A1 ) + P( A2 ) + ... + P ( Am ) = 1 を満たす。この数を確率と呼ぶ。 この定義では、確率を事象に対して定義したが、これらの事象を一つの標本点からなる 事象とすれば、確率は各標本点に対して定義される。(1)と(2)の関係も満足される。 したがって、これらの定義は事実上同等である。この場合、ある事象 E の確率は、その事 象を構成するすべての標本点の確率の和となる。また、お互いに共通の標本点をもたない 2つの事象の確率は、それぞれの確率の和になる。 P ( Ai ∪ A j ) = P( Ai ) + P( A j ) これが初等確率論の立場である。その特徴は、有限あるいは可符番(Countable)無限の 標本空間あるいは事象の組を基礎にしていることである。もう少し高等な現代の確率論は、 より複雑な標本空間を対象にできる(ルベーグ、Lesbesque)積分論や測度論(Measure Theory)の上に構築される。現代数学流に言えば、 「確率とはルベーグ測度である」という ことになる。 確率論の歴史 確率は、17世紀の Fermat (1601-1665), B. Pascal (1623-1662), Huygens (1629-1695) らの賭け事のような確率的な事象や期待値の計算への関心から生まれた。その後、こうし た理論の発展に寄与したのは、Jacob Bernoulli (1654-1705), De Moivre (1667-1754), Bayes (1702-1761), P. Laplace (1749-1827), Gauss (1777-1855), Poisson (1781-1840).近 代的な確率論の発展には、Chebyshev (1821-1894), A.A. Markov(1856-1922), A. M. Llyapunov(1857-1918) ロシアの研究者が大きく寄与している。近代的な確率論の建設には 同じくロシア(ソ連)の A.N. Kolmogorov, A. Ya. Khinchin の 1920-30 年の研究が大きく 寄与している。 確率と組み合わせ問題 実際の確率の計算には、場合の数を算出する必要から組み合わせ問題が関係しているこ とが多い。また、場合の数を幾何学的な面積に対応させて推定することも行われる。また、 繰り返し測定するという条件を満たす現象として、時系列的な現象も確率論の対象になる。 気象学、市場価格の変動などはその例である。保険会社では、リスクや保険という危険性 4 に関る数量化が問題になる。 箱の中の玉を取り出す問題 よく出てくるのが、箱あるいは壷(urn)の中の玉を取り出す問題である。玉が色で区別 されている場合、玉を取り出した後また戻す場合、戻さない場合などによってさまざまな 問題がつくられる。 箱の玉を入れる問題 統計力学では、あるエネルギー状態を1つの箱とし、その状態にある系の数を箱の中の 玉の数に対応させる模型が使われる。いくつかの箱に入れる玉は、互いに弁別(区別)可 能である場合と弁別不可能な場合を想定する。箱に玉を入れる方法が何通りあるかが問題 となる。 ビュファオン(G.L. Buffon)の針。机の上の紙の上に等間隔(距離 D )の平行線を多数 引く。ここにある長さ(L)の針を無作為い落として、平行線と交わる場合を数える。この 確率を P とすれば、P = 2L/Dπで与えられる。ここで、πは円周率である。ゆえに、繰り 返し実験を行えば、πのおよその数値を求めることができる。 面積からの確率計算。同じように円周率を乱数を使ってもとめる方法がある。 (簡単のため に一辺が2の)正方形に内接する(半径1の)円を描く。乱数をつかってこの図の上に任 意の点を無作為に印す。このうち円の内部に入る場合を数えると、この確率からπを求め ることができる。 多数の繰り返し、大きな数、極限への移行 実際の問題に確率が定義されている場合、試行の回数が少ないと、確率がゼロでない事 象も起きない可能性がある。しかし、多くの試行を行えば、それらは確実に起き、しかも その割合は、確率の近づいていくと考えられる。沢山の試行は数学では無限の場合に移行 させられる。これは現実の世界では不可能な操作である。例えば、偏りのないコインを投 げる場合、表裏のでる確率をそれぞれ 1/2 とするモデルが立てられよう。しかし、有限の 試行回数nでは、表裏の出る割合は、1/2 とは多少異なるだろう。しかし、無限回の繰り返 しでは、確実に 1/2 となると考えられる。これを数学的に証明しているのが、 「大数の法則」 と呼ばれる定理であり、その場合の確率への近づき方を明らかにしているのが、 「中心極限 定理」である。確率論において、この2つの理論は、経験と数学的なモデルとを結びつけ る重要な成果と考えられている。 なお、組み合わせ問題などが沢山でてくる統計物理学においては、場合の数の爆発が問 題になる。そうした問題でよく使われるのが、次のスターリングの公式である。 5 log n ! = n log n − n + 1 1 log ( 2 π n ) + O ( ) ≅ n log n − n 2 n 2.2. 条件付き確率:Bayes の理論 ある事象 K が起きる確率を P(K)とし、K と別の事象 H の起きる確率を P(H)とし、K と H とが同時に起きる確率を P(KH)とする。定義から P(KH)と P(HK)とはもちろん等し い。P(H)が正となるような H に対して、「H が起きた下での K がおきる確率」を P (K | H ) = P ( KH ) P (H ) で定義する。 事象の完全な組Aを考える。その各々の事象を A1, A2, …、An とする。これに対して別 の事象 K をとる。 P ( K ) = ∑ P ( Ai ) P ( K | Ai ) i 次のようにも書ける。 P ( Ai | K ) = P ( Ai K ) P ( Ai ) P( K | Ai ) = = P( K ) P( K ) P ( Ai ) P( K | Ai ) ∑ P ( Ai ) P ( K | Ai ) i これをベイズの規則(定理)と呼ぶ。 K が完全事象の組{K1, K2, …、Am}の場合は、各 Kjについて、上の式を書き下すこ とができる。意味を考えると式の見掛けほど難しくないことが理解されよう。 例。ジャンケンをする時、左右両方の手をつかうとする。どちらの手を使うかでは、 {左手、 右手}が完全事象の組をつくる。また、 {グー、チョキ、パー}のいずれがでるかも別な完 全事象の組をつくる。 さまざまな分布 以下では初等確率論の中で重要な分布 Distribution をいくつか紹介する。こ れらの分布は実際問題に役立つ確率モデルを立てるのに役立つ式である。これ らの分布によってある確率(モデル)が定義されると、その(事象の完全な組 に関する)和が1になること、確率変数を考えた場合、その平均や分散を求め ることが多くに教科書にある。これらに関する議論はここでは省略されている が、一度は、これらについて自分で確認されると、それぞれに分布や確率論そ 2.2.3 6 のものへの理解が深まるだろう。 ベルヌイ Bernoulli 列 ある事象 A に注目し、試行の結果は A が起きるか起きないかだけだとする。 また A の起きる確率をp、起きない確率をq=1−pとする。こうした試行を n回独立に繰り返す。独立にと言う意味は、ある回の試行が他の回のそれに影 響を与えないという意味である。この結果得られた結果の列を、長さnのベル ヌイ列という。 ある事象が起きた場合を1、そうでない場合を0に対応させると、長さnの ベルヌイ列は、( x1 , x 2 ,・・・, xn ) , xi = 1 or 0 で表現される。この中で1に等しい xi の数を n0 、0に等しい xi の数を n1 とし、 p( x1 , x2 ・・・ , , x n ) = p n1 q n0 とおく。 長さnのベルヌイ列を元とする集合 Ω の部分集合 B をとり、その元をあらたに事象として 定義し、その事象(新しい)A に対して、 µ ( A) = ∑ ( x1 , x2 ・・・ , , xn )∈A p ( x1 , x 2 ・・・ , , xn ) なる実数値関数 µ を定義する。この µ は確率、µ ( A) は、事象 A の確率と定義できる。 この定義はいわゆる確率のモデルとしての条件を満たしている。 独立試行をn回繰り返した時、注目する事象 A がk回起きる確率、すなわち、 長さnのベルヌイ列で求める事象がk個含まれている確率を求めてみよう。こ れを集合 B の元としての事象 Ak で表したとしたら、 µ ( Ak ) = ∑ ( x1 , x 2 ・・・ , , x n )∈ Ak p ( x1 , x 2 ・・・ , , xn ) = n Ck p k q n −k = n! p k (1 − p ) n − k ≡ Pn ( k ) k ! ( n − k )! となる。これをベルヌイの公式 Bernoulli’s formula と呼ぶ。 7 2項分布 ベルヌイの公式で与えられる確率 Pn (k ) は2項分布 Binomial Distribution と呼ば れる。ゆえに、 Pn ( k ) ≡ Bn , p ( k ) ≡ n! p k (1 − p ) n − k = n C k p k q n − k k!( n − k )! という書く場合もある。2項分布という名前は、 n ( p + q ) n = ∑ n Ck p k q n −k k =0 のように、2項展開の各項に等しいからである。 多項分布 多項分布は2項分布の場合を拡張した式である。この場合、1回の試行 E に関して E1 , E 2 , ..., E m という互いに交わりのない事象のいずれかが、確率 p1 , p2 , ..., pm で起きる と仮定する。定義から、 p1 + p2 + ... + pm = 1 である。こうした試行を n 回繰り返すと、拡張された意味でのベルヌイ列は、 ( x1 , x 2 ・・・ , , x n ) , xi = E1 , E 2 , .., E m となる。この長さ n のベルヌイ列をとった時、 E1 が k1 , E 2 が k 2 , .., E m が k m 回だけ起きる確率を P ( k1 , k 2 ・・・ , , k m ) とすれば、 P ( k1 , k 2 ・・・ , , km ) = n! p1k1 p k22 ⋅ ⋅ ⋅ pmk m k1! k 2 !⋅ ⋅ ⋅k m ! となる。 (証明)これは2段階で証明できる。まず、起こりうる結果を箱と想定し、 n 個の玉を、 E1 に k1 , E 2 に k 2 , .., E m に k m 個だけ入れる方法を数えると、上記右辺の 分数項になり、こうしたことが起きる確率は、それぞれの試行が独立であるこ とから、それぞれの確率の冪の積(非分数部分)となる。 この確率を k1 + k 2 + ... + k m = n となる、あらゆる ( k1 , k 2 ・・・ , , k m ) に関する和をとれば1となる。 ∑ P( k1 , k 2 ・・・ , , km ) = ∑ n! p1k1 p k22 ⋅ ⋅ ⋅ pmk m = 1 k1! k 2 !⋅ ⋅ ⋅k m ! 8 なぜなら右辺の各項は下記の左辺の(多項)展開項に等しいからである。 ( p1 + p2 + ... + pm ) n = 1n = 1 2項分布 Pn (k ) を最大にする k を k 0 として、もっとも確からしい most probable な k と 呼ぶ。この k 0 は、次の2つの不等式を満足させるものである。 np − (1 − p ) ≤ k 0 ≤ np + p 2項分布 Pn (k ) の平均は np である。 k =n ∑ kP (k ) = np k =1 n 2項分布 Pn ( k ) の分散、すなわち、 ( k − np ) の平均は、 np(1 − p ) である。 2 k =n ∑ (k − np) k =1 2 Pn ( k ) = np(1 − p ) 正規分布 Normal Distribution、あるいはガウス分布 Gaussian Distribution 2項分布と同じ性質の p、q すなわち p+q=1 と、離散的な n, k に関して Pn ( k ) = 2 1 e − ( k − np ) / 2 npq 2πnpq を正規分布(あるいはガウス分布)と呼ぶ。 この正規分布の k (を確率変数とみた時)の平均 m は、m = np である。分散 は2項分布と同じく、npq である。 k =n ∑ (k − np) k =1 2 Pn ( k ) = npq = np(1 − p ) 9 この平均 m と分散 σ を用いると正規分布は、 P(k ) = 2 2 1 e − ( k − m ) / 2σ 2π σ と書ける。これは、 N ( m, σ 2 ) と表す。 幾何分布 ある1と0の間にある正数pとq=1−p、および自然数 k で定義される G p ( k ) = q k −1 p を幾何分布 Geometric Distribution という。 幾何分布は、上記と同じベルヌイ列、すなわち、 「試行の結果は A が起きるか 起きないかだけだとする。また A の起きる確率をp、起きない確率をq=1− pとする」において、初めて事象Aが起きるのが k 回めである確率に対応する。 k を確率変数と見なした時の上記の幾何分布の平均は 1/p、分散は q / p 2 である。 超幾何分布 あたり玉がp個、外れ玉がq個、合計p+q個の壷から、n個の玉を取り出した時、当 たり玉が k 個含まれている確率は、 P ( k ) ≡ HG p , q ,n ( k ) = p Ck ⋅q Cn − k / p + q Cn で与えられる。パラメーター、 p, q, n で与えられるこの分布を超幾何分布 Hyper Geometric Distribution と呼ぶ。 ポアッソン Poisson 分布 ただ1つのパラメーター λ をもつ Pλ ( k ) = e − λ λk λk − λ ≡ ⋅e k! k! 10 をポアッソン分布という。 ポアッソン分布は、稀な現象がある時間間隔の間に起きる確率に対応している。 k (を確率変数とみた時)の平均は λ 、分散も λ である。 分布間の関係 先の2項分布に Bn , p ( k ) において、np = λ を保ったまま、p → 0, n → ∞ とすると、 1 ポアッソン分布に移行する。同じく2項分布で p → , n → ∞ とすれば、正規分布 2 に移行する。超幾何分布において、 p , q の個数を大きくし、 p /( p + q) を改めて 2項分布の確率 p と考えると、それは2項分布に移行する。 乱数 確率モデルに基づく数値実験を行う場合、乱数を使うことがよくおこなわれ る。こうした方法はシミュレーション Simulation としてよく行われる方法でも ある。その基礎になるのが、区間 0 ≤ x < 1 で定義された一様な乱数である。そ うした一様な乱数は数字の列として与えられるが、 (1) この数字の列における数の出現には規則性があってはならないが、 (2) どの数字も同じような頻度で出現しなければならない という、一見、相矛盾するような2つの条件を満たさねばならない。しかし、 実際にこうした性質をもった数字列をつくるのは難しいので、実際には、かな りな程度これらの条件を満足している擬似的な乱数で代用する。 合同式法 Congruence Method 計算機で容易に発生させられる擬似乱数は、あらかじめ選択した定数 a, c, m を 用いた式、 rn +1 ≡ a ⋅ rn + c (mod m ) ; x n = rn / m によって生成される。よく使われる実際の定数は、 a = 1229, c = 351750, m = 1664501 である。こうした一様乱数を元にすれば、正規分布やポアッソン分布など他の 確率分布にしたがう乱数を生成することができる(和達三樹、十河清、 pp.134-144) 。 11 通常のソフトウエアには、一様分布の乱数を発生させる関数しかないのが普通でしたが GAUSS が「乱数に強い」と呼ばれるようになったのは、ソフトウエアの名前からも明らか なように、標準正規分布を含む、ほとんどすべての乱数を発生させる関数を標準で装備し ている点にあります。(http://yosuke3105.hp.infoseek.co.jp/lec5_1.pdf) 12 2.2.4 確率変数 Random Variable 確率事象の完全な組を標本空間 Sample Space と呼ぶ。標本空間上で定義された関数を確 率変数と呼ぶ。関数の値は離散量である場合と連続量である場合がある。 例。射撃の腕を競う競技。決められた的を狙って撃つ、射撃の腕を競う競技を考える。的 は、正方形の板で、その中心に円が描かれている。この丸の中に命中させれば得点は3点、 円の外側でも的に当たれば2点、的を外した場合は1点とする。得点1,2,3を獲得す る確率を p1 , p2 , p3 とし、X を一回の射撃で獲得する得点とすれば、X は、離散量、1,2, 3を値とする確率変数となる。すなわち、X は、値とそれに対応する確率で定義される。 一般に離散的な確率変数 X は、値を x1 , x2 , ..., xm とそれに対応した確率、 p1 , p2 , .., pm に よって定義される。 上記の確率変数 X の期待値(平均) <X> を、 < X > = x1 p1 + x2 p2 + ... + xm pm で定義する。定義により、 < X 2 > = x1 p1 + x2 p2 + ... + xm pm 2 2 2 任意の2つの確率変数 X,Y の和、X+Y の期待値は、それぞれの期待値の和に等しい。 < X + Y > = < X > + <Y > 互いに独立な標本空間で定義される2つの確率変数 X,Y の積、X・Y の期待値は、それぞれ の期待値の積に等しい。 < X・Y > = < X >・< Y > 13 2.3 自然科学の事例 物理学の事例 ボルツマン分布 Boltzmann Distribution 平衡状態にある(N個からなる)多粒子の系ある。それらは、離散的なエネルギー値、 E1 , E2 , E3 , ..., Ei , ... をとるとする。ある状態における系は、上記のいずれかのエネルギー値をとるから、これ を確率事象とみなすことができる。この時、系がエネルギー Ei をとる確率 P ( Ei ) が、 P( Ei ) = e − Ei / kT , Z Z = ∑ e − Ei / kT i で与えられる場合、この系のエネルギー値に関する分布をボルツマン分布という。ここで、 k、Tはそれぞれ、ボルツマン定数と温度である。 ここで、もちろん、 ∑ P( E ) = 1 i i が満足されているとする。このZを状態和あるいは分配関数と呼ぶ。 例題。2状態系 エネルギーが E1 と E 2 という2つの状態のみをとりうる、ボルツマン分布にしたがう系 がある。各状態を占める確率 P1 と P2 を、エネルギーの差 E 2 − E1 = DE の関数で表せ。 答え。確率の比、 P1 / P2 をもとめることにより、次の結果をうる。 P1 = 1 、 1 + e − DE / kT P2 = 1 1 + e + DE / kT 問題(昨年度の期末試験問題、ただし選択)。 1次元の自由度をもった粒子が N 個からなる仮想的な集団を考える。それぞれの粒子は、 +(up), または、―(down)の状態をとり、−状態のエネルギーが高く+μB、+状態 は−μB とする。ただしμは、各粒子に固有な物理量、B は外部の物理量とする。(これは スピンによる磁気能率μをもった電子のような粒子が外部磁場 B の中にある場合に相当す る)。各粒子の間の相互作用はないと仮定する。ここで+状態にある粒子の個数を n、−状 態にある粒子の個数を n’とする。もちろん、N = n + n’ である。次の問いに答えよ。 (1) この N 粒子系の状態は n で決まる。あるnに対して同等な状態の数 N Cn はいくつ あるか。答え。 N Cn = 14 (2) この N 粒子系がとりうる可能な状態の数は、どれだけか。答え。 。 (3)N, n, n’ が大きいと仮定し、この2状態系の集団が熱的平衡にあるとすると、ある 粒子が+(up)状態にある確率は n/N に等しくなるが、これはボルツマン分布から、 P+ = n = Ce −( − µB ) / kT N で与えられる。ただし、 C は、規格化によって定まる定数である。この式は、―(down) 状態に関してはどうなるか。 P+ に対応する確率を P− として、対応する式を書け。 n' = N (4)規格の条件、 P+ + P− = 1 から、C を求めよ。答え C = P− = (5)この温度における磁気能率の平均、 µ = µ( n n' ( n − n' ) − )=µ を求めよ。ここで N N N 最後の結果は、正弦双曲線関数、 e x − e− x e x + e− x をもちいて表せ。答え。 µ = tanh x ≡ 。 (6)粒子の平均エネルギーを求めよ。 E = 。 (7)温度が(絶対温度で)ゼロの時、n と n’ はどうなるか。 (8)温度が無限大の時、n と n’ はどうなるか。 (9)温度が無限大の時、1粒子がそれぞれ、+および−の状態にある確率を求め、情報 エントロピーを求め、これにボルツマン定数 k を乗じて1粒子当たりの物理的なエントロピ ーを求めよ。答え。 S ( ∞ ) = 。 マックスウエル分布 Maxwell Distribution 理想気体が、体積 V の容器に入れられた、(絶対)温度 T で熱平衡状態にある時の構成要 素である各気体分子を考える。簡単のためにこれらは、同一の質量mの、古典的な粒子と する。1 個の分子の運動エネルギーは、 1 2 ε = mv 2 = 1 p2 、 2 m となる。ただし、ここで、v、pはベクトルである。気体が薄く、他の粒子とポテンシャ 15 ル・エネルギーが無視できるとすれば、ボルツマン分布のエネルギーを運動エネルギーだ けとした分配関数が求められる。これより、位置rと速度vを変数とした相空間を考える 3 と、分子の速度の絶対値が、v と v+dv である確率 f (v)d v は、 3 1 m 2 − 2 mv 2 f (v)d v = 4πv ( ) e dv 、 (体積要素は、 d 3v = 4πv 2 dv ) 2πkT kT 3 2 1 2kT 2 ) である。なお、速度の各成分 で与えられる。この分布による最も確からしい早さは ( m の分布は、正負対称のガウス分布(正規分布)となり、その平均はもちろんゼロである。 この速度分布は、成分が複数ある理想気体にも適用できる。 例題。室温(300 度 K)で平衡状態にある窒素気体の分子の速さはどれだけか。 解:窒素の分子量は 28、これとアボガドロ数から、分子の質量は約 4.6x10-23g.これから、 確からしい速さは、約 420m/sec となる。(Berkeley, 下、p.263) 化学の事例 生物学の事例 確率事象の事例としてのメンデル遺伝学 外観からも識別できる生物の特徴が世代を越えて継承されるという事実に、数学的な法 則が隠されていることに気がついたのは、グレゴリ・メンデルである。外観上の特徴(形 質)のことなるエンドウマメを交配させて、それらがどのような確率で次の世代あるいは、 さらにその次の世代に継承されるかをしらべる実験によって、彼は後に「メンデルの法則」 と呼ばれる確率事象を発見した。この法則は、生命の特徴が液体(スープ)の色のように、 異なる種類を混ぜ合わせるとその中間の性質になるのではなく、粒のように交じり合わず、 世代を越えて同じものが、ただ異なった頻度で出現する、ということを示した。 メンデル自身は、この法則がどのようなメカニズムに依存しているかにいつては、何も 語っていない。彼の仕事は。長い間生物学者に知られていなかったが、1900 年に発表され た de Vries の論文などで、再発見された。その後、マーラーらは、ショウジョウバエを使 った実験で、形質を決定する粒子的な因子が線状に位置しているというイメージに到達し た。次に、遺伝子と呼ばれることになったこの遺伝形質の決定因子が線状にならんだ実態 が何かが問題になった。最初はタンパク質が遺伝子を載せているのではないかと考えられ たが、Rockefeller 研究所のエヴリーO. Avery らは肺炎双球菌を使った実験で、遺伝形質 16 を担う物質が核酸 DNA であることを証明した。 この論文が出版されたのは 1944 年の1月で、 同じ年出版された Schrodinger の What is life?に先立つものであった。エヴリーの仕事 もなかなか注目されなかった。彼の仕事の正しさが評価されたのは、バクテリアに寄生す るウィルス(バクテリオ・ファージ)を使うという研究がなされてからのことである。こ うした斬新な手法を生物学にもちこんだ研究者たちはファージ学派と呼ばれる。その中に は物理学から転向したデリュブリックなども含まれている。その後、ワトソンとクリック の DNA の2重ラセン構造モデルが発表された。それはエヴリーの論文やシュレディンガー の本が出版されてから 9 年後の、1953 年のことである。 DNA の上に実際にどのように遺伝子が載っているかは、DNA の塩基の並びが鋳型情報とな って mRNA(メッセンジャーRNA)が合成され、それが鋳型となってアミノ酸の鎖であるタン パク質が合成されるというメカニズムが明らかにされたことで、解明された。さらにこの 仕組みは、遺伝子の働きをするのが、DNA の3つの連続した塩基部分であることに対応して いる。すなわち DNA の3つの塩基は、結局アミノ酸の鎖の構成単位である1つのアミノ酸 に対応しているのである。アミノ酸は、20種類あるが、4種類ある DNA の塩基の3つの 組は 64 種類あるので、この対応には、冗長性 redundancy がある。遺伝コード(暗号)と 呼ばれる。この対応は、すべての生物で共通である。このことは、生物が共通の祖先をも っていることの証拠の一つとされている。(ただし、細胞の中のミトコンドリアと(植物細 胞だけに存在する)葉緑体は、それだけで独立した細胞のような存在であり、遺伝コード もわずかに異なっている。)F.クリックは、DNA の情報が mRNA にコピーされ、さらにア ミノ酸の鎖(テープ)であるタンパク質の構造へと反映される過程を、「分子生物学のセン トラル・ドグマ」と呼んだ。 17 2.4 情報エントロピー 2.4.1 1948 年の C. Shannon 論文 今日、情報理論の基礎と目されているのは、Claude E. Shannon が 1947-1948 年頃に発 表した理論である。中でも彼が導入した情報の尺度 measure of information としての entropy は、その中核となる概念である。Shannon の entropy は、確率を基礎に定義され る。この意味で、ロシアの数学者 A. I. Khinchin は、情報学は応用確率論の1分野である と述べている。 この entropy は、確率事象の組 probabilistic scheme、すなわちそれぞれの事象に確率が 付与された事象の完全な組に対して定義される。いまそうした組をA, 各々の事象を A1, A2, …、An、その確率を p1,p2,…, pm とする。 A1 , A2 ,..., An A = p1 , p2 ,..., pn このAに対して、 H(p1,p2,…, pn)= -Σ pi log pi を確率事象の組AのエントロピーEntropy と定義する。この式は、Shannon によって通信 工学において導入された。後で出てくる物理学の Entropy と区別するために、この Entropy を情報エントロピーInformational Entropy と呼ぶことにする。次に、定義からただちに導 かれる情報エントロピー H の性質をしらべてみよう。 H は、負でない。 まず、和として表される H の各項、-pi log pi をしらべてみる。確率であるから、pi は、 0から1の間の値をとるが、この時 log pi は負であるから、-pi log pi は常に正かゼロであ る。また、0・log 0 = 0, 1・log 1 = 0 だから、H は、0 と1を裾野とする山型の曲線となる。 このことから、H は0か、あるいは正となる。H が0となるのは、いずれか事象が確率の pi が1で確実に起き、他の事象は起きない特別な場合である。 (お浚い)関数 f ( x) = − x log x, ( 0 ≤ x ≤1) 関数 log x は、 x が0から正の領域で、−無限大から単調増加し, x =1 のところで 0 に なる。この間は負でるから、関数全体は、この間で山形の(上に凸な)関数となる。注)凸関 数は、下に凸型をしている関数と定義される。 18 H は等確率の時最大となる。 H が最大となるのは、すべて事象が同じ確率で起きる、pi =1/n の場合、 H = - Σ(1/n)log n-1 = - Σ(1/n)(-1) log n = log n である。 ここで n = 2 で、一方が起きる確率がp、したがってもう一方が1−pの場合、 A , A2 , A = 1 p, 1 − p H = − p log p − (1 − p ) log (1 − p ) を考える。この H を、pの関数として描くと、p は、0から1をとり、H はp= 0.5 を 中心とする対象の山のかたちとなる。すなわち、 A , A2 A = 1 0.5,0.5 が H の最大値を与える。この場合、対数の底として2をとると、 log 2 = 1 となる。対数 の底として2をとった場合、Entropy の単位をビット bit と呼ぶ。したがって、bit を単位 として H を描くと、ピーク値は、1となる。 エントロピーの計量 数学的なエントロピーの定義では、対数の底は任意であるが、物理学では自然対数の底 となる e, 情報理論では 2 を底とすることが多い。 10 を底とする場合も考えられる。一般に、 対数の底の変換は、 log b k = log b a・log a k , すなわち、log a k = による。例えば、 log 2 k = log e k 1 = log e k log e 2 0.6932 複合事象と条件付きエントロピー 2つの事象の完全な組、A, B A1 , A2 ,..., An 、 A = p1 , p2 ,..., pn B1 , B2 ,..., Bn B = q1 , q2 ,..., qn 19 log b k log b a があった時、それらの複合事象を AB、その事象 Ak Bl の確率を π kl とし、A にお いて Ak が起きた時、B が Bl である(条件付きの)確率を qkl 、すなわち π kl = pk qkl とすれば、 H ( AB) = H ( A) + H A ( B) ≤ H ( A) + H ( B) H A ( B) ≤ H ( B) が成り立つ。ただし、 H A ( B) = ∑ pk H k ( B), k H k ( B) =− ∑ qkl log qkl l と定義する。これを条件付きエントロピーという。 [証明] 証明すべき2つの不等式のうち、下の不等式を証明すれば、上はその帰結となる。 下の不等式の証明には、 x log x, ( 0 ≤ x ≤1) が(下に)凸関数であることから、一般の凸関 数 f に対して成り立つ不等式、 ∑ λ f ( x ) ≥ f (∑ λ x ), ただし、λ ≥ 0, ∑ λ i l i i i i i k = 1に k を利用し、 ∑p q k k kl log qkl ≥ ql log ql , ただし、∑ pk qkl = ql k を導く。 2つの事象が独立であれば、上記の不等式が等式になることは、明らかである。すなわ ち、 A, B が独立なら、 H ( AB) = H ( A) + H ( B) 、 H A ( B) = H ( B) である。 2.3.2 情報エントロピー関数の性質 エントロピー関数の唯一性 上記のように、等確率の時に最大となり、2つの事象の組の、条件付き確率事象に関し て上の不等式がなりたち、さらに、事象の組に、絶対起こりえない(確率が 0 の)事象を 加えても値が変わらないような事象確率の関数は、定数を除いて上記で定義したエントロ ピー関数と等しくなることが証明される。この意味で、エントロピー関数には唯一性があ 20 る。 エントロピーと情報 上記で定義したエントロピーは、ある確率事象の組がもつ可能性の尺度であり、それら の事象(群)に関する我々の知識の不確定さの尺度(測度 Measure)であると解釈される。 また、1回の実験(試行)によってある結果が出されると、このあいまいさが解消する。 したがって、その実験によってもたらされる情報は、知識の不確定さの減少に等しくなる。 2つの事象が独立な時は、一方の実験結果で、他方の結果は影響を受けない。したがっ て2つが複合した事象群に関する我々の知識の不確定さは、それぞれの不確定さの和にな る。しかし、2つの事象の間に依存関係があれば、一方の結果が出ている場合、他方の結 果に関し、何らかの類推ができると考えれるので、もう一方の条件付のエントロピーは、 独立したエントロピーより、常に小さい。すなわち、一方の実験が行われている場合に他 方を実験してもらされる情報は、後者を単独に行った場合より、常に小さくなる。 Shannon は、彼が導入した、情報エントロピーを「情報、選択、不確定さの尺度 measure」 として、情報理論の中で中心的な役割を果たす量であるといっている。また、この量は統 計力学のエントロピーとくにボルツマンの H と同じ形式であるとも言っている(Shannon p.50)。ボルツマンの H は、統計力学が扱う微視的な世界と巨視的な世界の法則である熱力 学とを結ぶ、重要な理論である。次章ではこのことを見ていく。 21 2.4.3 さまざまな情報エントロピー 我々は、最初に情報エントロピーを、確率事象の(完全な)組 A1 , A2 ,..., An A = p , p ,..., p 1 2 n に対して、 n H = − ∑ pi log pi i =0 と定義した。ここで新しく相対エントロピーという量を定義する。相対エントロピーは、 2つの事象の完全な組、A, B A1 , A2 ,..., An 、 A = p , p ,..., p 1 2 n B1 , B2 ,..., Bn B = q , q ,..., q 1 2 n に対して、 H ( A, B) = ∑ pi log i pi qi = (∑ pi log pi − ∑ pi log qi ) i i によって定義さる。この定義は一見したところ符号を情報エントロピーと異にしているが、 H ( A, B) ≡ ∑ pi log i pi q = − ∑ pi log i qi pi i とも書けることに注意されたい。この量は負でない値をとり、ゼロになるのは、 pi = qi が 等しい時に限る。それゆえこの量は、2つの確率事象の組、A, B の間の距離のような関数 であるとされている。このことは、Gibbs の定理あるいは、Gibbs の不等式と呼ばれている 式で証明されている。相対エントロピーは、Kullback 情報量、ダイバージェンス Divergence などとも呼ばれる。 Gibbs の定理(不等式) H ≥ 0 であり、等号が成り立つのは、2つの事象の組が同一である( pi = qi がすべて の i について成り立つ)時だけである。 [証明] まず、 f ( x, y ) = − x(log x − log y ) − x + y, ( 0 ≤ x , 0 ≤ y ) 22 を考える。この関数を y を固定して x だけを動かしたとして、変化を見る。 ∂f = log x − log y, ∂x ∂2 f 1 = >0 2 ∂x x であるから、 0 ≤ x なる定義域で x は(谷状にへこんだ)凹関数 concave function になり、最 小値は、 x = y なる時で、値はゼロ f ( y, y ) = 0 となる。したがって、 f ( x, y ) = − x(log x − log y ) − x + y ≥ 0, ( 0 ≤ x , 0 ≤ y ) ここで、 x = pi , y = qi と置き、さらに不等式の和をとり、 ∑ p (log p i i i − log qi ) = ∑ pi log i ∑ p = ∑q i i = 1 を思い出せば、 pi ≥0 qi が得られる。 問題。ギブスの不等式で、 qi = 1 / n と置けば、 1 1 − ∑ pi log pi ≤ − ∑ log n n エントロピーの上限を与える式がえられる。 フッシャーFisher 情報行列 確率事象の組 A1 , A 2 ,..., A n A = p , p ,..., p n 1 2 において、確率が m 個の連続パラメーターに依存しているとする。すなわち、 pi = pi (λ1 , λ2 ,..., λm ) さらに、これらの各パラメータが微小量だけ違っている分布、 qi = qi (λ1 + δλ1 , λ2 + δλ 2 ,..., λm + δλ m ) とする。これを相対エントロピーの定義における事象の組 B と考え、テイラー展開を使う と、 23 S ( A, B) = ∑ pi (λ ) log i pi (λ ) 1 m m = ∑∑ I st (λ ) δλsδλt qi (λ ) 2 s =1 t =1 をうる。ただしここで、 n I st (λ ) ≡ − ∑ pi (λ ) i =1 ∂ log pi (λ ) ∂ log pi (λ ) ∂λs ∂λt と定義した。これは、 n × n 次元の行列であり、Fisher 行列 Fisher’s Information matrix と呼ばれる。 24 2.5 情報と通信 ・通信理論:符号論と暗号 ・シャノンの通信理論 ・情報理論の真価 25 2.6 Sampling 理論:Analog から Digital へ 情報時代と言われる今日、我々の身近な情報の多くがディジタル形式で扱われるように なった。文字フォント、音楽、放送、カメラなどもディジタル化が進行している。これら の情報はすべて 1,0 で符号化されるようになってきている。まさに、bit bang!と呼ぶべき現 象である。ここで重要になるのは、アナログ信号をどの程度の細かさでディジタル・デー タに変換したらよいかということである。この問題に対する一つの指針を与えてくれるの が、シャノンのサンプリング定理 Shannon’s Sampling Theorem である。この定理のこと は、情報エントロピーを紹介しているシャノンの有名な本、C. Shannon and W. Weaver, The Mathematical Theory of Communication, Univ. of Illinois, 1949、の中で、定理 13 として言及さ れている(p.86)。ただ、この定理は、Whittaker を始めとする、他の研究者によっても報告 されている。 ある変数 t の関数 f (t ) がフーリエ変換 g (ω ) を有している f (t ) = 1 2π ∞ ∫ g (ω ) e − 2πiωt dω −∞ とする。フーリエ変換が存在するためには、関数は連続である必要はないが、不連続点が 飛び飛びであり、可積分(積分可能)である必要がある。 (ここで ω =ν / 2π 、ν は振動数、 ω は角振動数と呼ばれる。)この時、 g (ω ) が、 g (ω ) = 0, | ω | > W である時、関数 f (t ) の周波数は、最高周波数 W に帯域制限されているという。 サンプリング定理 関数 f (t ) の最高周波数が W に帯域制限されていれば、 f (t ) = ∞ ∑ −∞ nπ sin (ν maxt − nπ ) = ) ν max ν maxt − nπ f( ∞ n ∑ f ( 2W ) −∞ sin π (2Wt − n) π (2Wt − n) が成り立つ。ここで、 n は(ゼロおよび正および負の)整数である。 この定理は、 f (t ) の値が、 nπ ν max = n , 2W n = 0, ± 1, ± 2, Λ なる t の値のところでわかってさえいれば、f (t ) は誤りなく正確に再現されることを保証し 26 ている。変数 t を時間とすれば、時間的な変動するアナログ信号は、1 秒間に最高周波数の 2 倍の割合でサンプリングすれば、正確に記録再現できることを意味している。画像をビデ オカメラからディジタル形式で読み込む時も、この定理が使える。もっと一般のアナログ 信号のディジタル化においても、どの程度の頻度でサンプリングしたらよいかの目安を与 えるものである。しかし、信号やノイズの周波数特性がよく知られている通信などの場合 と異なり、一般の場合は、最高周波数に関する情報があらかじめ分かっていないこともあ る。この場合は、少なくとも原理的には、記録再現の正確さの保証はない。 27 2.7 確率過程 Stochastic Process 時系列現象,Brown 運動,マルコフ過程.隠れマルコフ過程 Brown 運動 Brown 運動とは、大英博物館の植物主任をしていたブラウン(Robert Brown)が 1828 年、1832 年の論文で報告した、顕微鏡下の花粉から生じた微粒子が示す不規則な動きのこ とである。彼はこれを Active molecule と呼んだ。この微粒子の動きはかなり世俗的にも知 られるようになったが、科学的な結論を見るに至らなかった。1905 年、 (特殊)相対性理論 と光量子仮説という重要な論文を発表したアインシュタイン A. Einstein は、ブラウン運動 に関して画期的な論文を発表した。 彼の考察は、(1)分子運動論によれば微粒子を含む溶液は浸透圧をもつはずだという推 論と、もしそうであるならそれは何らかの外力の存在する条件下では、(2)溶液中におけ る拡散過程と釣り合っているはずだという推論、さらに(3)溶液中の微粒子が見せる不 規則な動きは統計的な現象としてしらべることができるだろうという推論、を基礎として いる。最初の2つの推論は統計力学や溶液論と関係する物理学そのものであり、第3のそ れは数学的である。実際、彼の結論から、ブラウン運動の背景にある物理的な実態として の「分子」の実在が観測にかかることが示唆された。後にフランスのペラン(J. Perrin) は、アインシュタインの理論に基づいて、アボガドロ数の実験的な推定を行い、それが正 しい数値を与えることを検証した。このことは、当時はまだ疑いが残っていた分子の存在 を前提としたボルツマンの統計力学(熱の理論)の考え方の正しさを証明するものであっ た。ゆえに今日では、アインシュタインのブラウン運動の理論は、分子の実在を示した最 初の仕事として記憶されている。 拡散現象は、多粒子系が熱平衡に到達しようとする時に見られる一般的な現象である。 溶液中に溶けている(溶質としての)粒子系の拡散現象は、それらの粒子系の熱的なゆら ぎと関係している。その後の物理学においては、そうしたゆらぎを研究する非平衡系を扱 う理論として、線形応答理論や揺動散逸理論 Fluctuation Dissipation Theory などがつく られた。ブラウン運動やその後の非平衡の理論は、平衡系にない生物内のさまざまな現象 解明に役立つと期待されている。最近、生体分子がⅠ分子単位に観測可能になってきたこ とから、このような理論的な解析への興味が高まっている。 アインシュタインの論文の第3の視点、不規則な粒子の動きを記述する数学的な方法は、 その後、1923 年に発表されたウィナー(N. Wiener)の論文で(ウィナー測度として)し っかりした基礎が与えられた。ブラウン運動は、近代的な確率論の創始者であるコルモゴ 28 ロフら、ソ連の数学者たちによって精力的に研究された確率過程(マルコフ過程)の典型 的な例である。こうした理論も、数学の世界で大いに発展され、経済学にまで影響を与え るまでになった。後者でよく知られているのは、ノーベル経済学賞をえたブラック(F. Black)とショールズ(M. Scholes)らの債権の価格と株価の変動を表す理論である。 次に初等確率論の立場から、アインシュタインのブラウン運動論を解説する。 最初に問題とする規則な動きを定義する量を導入する。簡単のためにそれは、 (1) 座標としてxが取れる次元の運動で、 (2) 動きは、正の方向、負の方向、あるいは動かないの3種類で、その確率は、正ある いは負方向に動く場合がp、動かない場合が 1-2p とする。 (3) 動く場合の大きさ(幅)は、一律に a てある (4) 観測の時間間隔は1律に、τとする、すなわち、ある位置からτ時間経過した次の ステップで対象物(酔っ払いあるいは粒子)は、距離 a だけ正方向に移動している か、負方向に移動しているか、あるいは同じ位置にいるかである、 というものである。 この仮定の下に、対象物の位置 x を離散的な時間 t ≡ Nτ の確率変数とみなして、その2 2 乗の期待値、< x (t ) >を求めることができる。それは < x (t ) > = 2 pa N 2 2 となる。ここで、拡散定数を D ≡ pa 2 / τ で定義すれば、 < x (t ) > = 2 Dt 2 となる。 こうした粒子が沢山あり、相互作用は無視できる程度とする。今度は時刻 t における場 所 x における粒子密度 ρ (t , x ) の時間変化を差分方程式でしらべ、 a / τ を一定に保って 2 a → 0, τ → 0 の極限を取れば、 ∂ ∂2 ρ ( x, t ) = D 2 ρ ( x, t ) ∂x ∂t という拡散方程式が得られる。これはガウス型の解をもつことで知られている。 2 x − N0 4 Dt ρ (t , x ) = e . 4πDt ただし、 N 0 は最初に x = 0 にあった粒子数である。この解は最初の粒子集合 N 0 が、ガウス 分布にしたがって時間とともに拡散していく様子を表している。 29 第2章補講 A2.1 数学的な復習 確率論の初歩を思い出したついでに、情報エントロピーを理解するための初歩的な数学 をもう少し復習しておこう。 (1)指数関数と対数関数 (2)順列、置換 Permutation (3)2項展開係数 (4)組み合わせ問題:n個の部屋にr個の玉を分配する問題:古典粒子、量子粒子の場 合 その1−基本的な数、記号、関数の説明 以下に出で来る数、記号、関数は、互いに関係しあって定義されたり、説明されている。 したがって以下の説明も順序だってはいない。 数e 数 e は、無限級数の和 the sum of infinite series、 e =1 + 1 1 1 + + +・・・ 1! 2! 3! あるいは、数列の極限 1 e = lim (1 + ) n n →∞ n 数 e は、超越数2乗根や立方根のような多項方程式 Polynomial Equation の根であらわさ れる代数的な数、algebraic number ではなく、超越数 transcendental number と呼ばれる。 数 e は円周率 π とならぶ体表的な超越数である。数 e は無理数でもある。 数 e の値は、 e = 2.718281・・・ 数 e を底とする対数は、自然対数とよばれる。 log e = 1 である。 30 指数関数 Exponential Function 実数 x に対して、 e x を指数関数 the exponential function と呼ぶ。 対数関数 Logarithmic Function 関数関係 x = ay が成り立つ時、 y = log a x と表現する。 階乗!記号 ある数、nを正の整数とした時、n の階乗(かいじょう) 、n-factorial を 1 から n に到る 正の整数 1,2,..,n の積を n!で表す。すなわち、 n! = 1・2・3・・・n = n(n-1)・・・1 便宜上、0! = 1 と定義する。 スターリングの公式 Starling’s formula この公式は、n!の数値を求める場合に非常に有用であり、確率統計論、統計力学などで使 われる。Courant and John, pp.504-507. log n ! = n log n − n + 1 1 log ( 2 π n ) + O ( ) 2 n ≅ n log n − n ガンマ関数 The Gamma Function ガンマ関数は、下記のような積分で定義される。 ∞ Γ (n ) = ∫e −x x n −1 dx (n > 0) 0 ガンマ関数と階乗を結びつける重要か式が、 Γ( n ) = ( n − 1)( n − 2)・・・2・1 = ( n − 1)! である。ガンマ関数を用いると、 31 n! = Γ( n + 1) = ∫ e − x x n dx ( n > −1) と書ける。 2項係数 Binomial Coefficient n k 正の整数、n と k (n ≥ k ) に対して、2項係数 Binomial Coefficient を、 n n( n − 1)( n − 2・・・ ) ( n − k + 1) n! = = k! k! ( n − k )! k n k によって定義する。この を2項係数と呼ぶ。 本によって2項係数はさまざまな記法が使われる。例えば、 n k , C n , n C k , Cn ( k ), ... k は、同じ意味で使われる。ただし、注意すれば混乱することはない。 32 この章の課題 1.付録1を読み、その最後にある課題のいくつかを考察せよ。 2.演習問題 日常的な現象、例えば天気や行動、例えばじゃんけん、などから、情報エントロピーが定 義できると思われる事象の組を探せ。2つの事象の組に関しても例を考えてみよ。 33 参考文献 初等確率論 B. V. Gnedenko and A. Ya. Khinchin, An Elementary Introduction to the Theory of Probability, translated from 5th Russian Edition by L. Boron and S.F. Mack, Dover, NY, 1962 確率論の教科書 W. Feller, An Introduction to Probability Theory and Its Applications (Vol.1), John Wiley, 1957 未完の草稿からつくられてはいるが、新しいセンスにあふれた優れた入門書。 小堀あき宏、確率・統計入門、岩波書店、1973 世界的な確率論学者によって書かれた優れた入門書の復刻版。 伊藤清、確率論の基礎(新版)、岩波書店、2004 この本の巻末にある解説、池田信行、 「概要とその背景」は、簡潔な確率論の発展史として 優れている。 確率と情報理論の入門 C. Shannon and W. Weaver, The Mathematical Theory of Communication, Univ. of Illinois, 1949 A.I. Khinchin (translated by R.A. Silverman and M.D. Friedman), mathematical foundation of information theory, Dover, NY, 1957 有本卓、確率・情報・エントロピー、森北出版、1980 ヤグロム(井関清志、西田俊夫訳)、情報理論入門、みすず書店、1958 年 豊田正、情報の物理学、講談社サイエンティフィック、1997 年 Bioinformatics の基礎となる確率論としては、次がよい。 R. Durban, et. al., Biological sequence analysis, Cambridge Univ. Press, 1998 34 第3章 論理と計算の基礎 3.1 はじめに この章では、計算機設計の基礎になる論理、論理回路、計算機の原型に関係した数学や 記述法を紹介する。現在の計算機の基礎になっている理論は、論理回路である。それは、 基本的にオン・オフで動作する電子的なスィッチ回路である。論理回路の基礎となる数学 は論理関数であるが、それを最初に考えたのは, George Boole (1815-1864)である。彼は、確 率を論ずる、思考の法則 Laws of Thought (1854)という本の中で、人間の思考を記述する 方法として今日の Boole 代数を紹介している。この考え方は、19世紀の後半のカントー ルの集合論の論理と基本的に同じものである。こうした論理に関する数学は、20世紀初 頭の数学基礎論の議論の中で、命題論理や述語論理などとして整理された。 3.2 論理と集合 現代数学の基礎には集合論がある。数学で重要なのは、自然数 N、整数 Z、実数 R、複素 数 C などの集合である。情報学が対象とするような集合は、このような明快に定義された 要素だけから構成されてはいない。もちろん数学でいう集合は、その集合に属しているか 否かが明快に定義できるものに限られている、実際問題に数学的な手法を応用する場面で は、定義はしばしばあいまいになる。例えば、ある病気をもった人の集合などは、病気の 理解度に応じて内容が変わってくる。量子力学における状態という概念は日常的な意味と は違った意味で定義が難しい例である。例えば、あるスリットを通過した光子の全体など は、そうした例である。 集合の算法 ある集合 Ω の部分集合の集合 A, B, …を考える。 φ を空集合とすると、 φ ⊆ A⊆Ω 任意の集合 A, B の間に積集合 conjunction set A ∧ B 和集合 disjunction set A ∨ B を定 義できる。集合 Ω を普遍集合 Universal set という。 これらの算法に関して、 巾等律 Idempotent law 交換律 Commutative law 結合律 Associative law 吸収律 Absorptive law A∧ A = A∨ A = A A ∧ B = B ∧ A, A ∨ B = B ∨ A ( A ∧ B) ∧ C = A ∧ ( B ∧ C ) ( A ∨ B) ∨ C = A ∨ ( B ∨ C ) ( A ∧ B) ∨ A = A, ( A ∨ B) ∧ A = A 1 φ ∧ A = φ, φ ∨ A = A Ω ∧ A = A, Ω ∨ A = Ω ( A ∧ B) ∨ C = ( A ∨ C ) ∧ ( B ∨ C ) ( A ∨ B) ∧ C = ( A ∧ C ) ∨ ( B ∧ C ) 分配律 Distributive law が成り立っている。しかも、これらの算法に関する上記の関係の組は、 Ω と φ 、 ∨ と ∧ と を入れ替えても変わらないという意味で、双対になっている。 もし、 A → B という関係を、 A ⊂ B の意味とすれば、これらの集合、すなわち、A, B, …、 および Ω 、 φ は、束 Lattice となる。集合に対応したこの束は Boole 束と呼ばれる。 3.3 論理関数あるいは Boole 関数 変数が n 個の関数で、それぞれの変数は 0 か1かの値しかとらないものを論理関数とい う。論理関数は Boole 関数とも呼ばれる。 2 変数の間の演算 ・、-、→ を下の表で定義する。ここで、 x → y 最初に 2 変数 x, y に関する基本演算+、 は、 x + y と等価である。 入力変数 x y 論理和 論理積 否定 x+y x⋅ y x 排他的論理和 含意 y x⊕ y x→ y 0 0 0 0 1 1 0 1 0 1 1 0 1 0 1 1 1 0 1 0 0 1 1 0 1 1 1 1 0 9 0 1 3変数以上の基本演算+、・、-、→ は、2変数の演算から括弧をもちいることで、容易 に定義できる。 x + y + z = ( x + y ) + z, x ⋅ y ⋅ z = ( x ⋅ y) ⋅ z 排他的論理和、否定 x 、含意の拡張も同様である。 問題。3つの変数、x, y, z に対して、x + y 、x + z 、( x + y ) ⋅ ( x + z ) の真理値を作成せよ。 2 論理関数と集合演算との等価性 論理変数の演算に関し、変数 x, y , z を集合に、0 を空集合 φ に、1 を普遍集合 Ω に対応 させ、論理和演算 + を、論理積演算・を ∧ に対応させると、全く等価となる。 3.4 論理と束の関係 順序関係 ある集合に属する元(あるいは集合の集合に属する集合)の間に定義された関係 ≤ が、 次の規則を満足する時、 反射律 反対称律 推移律 A≤ A A≤ B A≤ B かつ かつ B ≤ A ならば A = B B ≤ C ならば A ≤ C これを順序関係と呼ぶ。こうした順序関係がある集合を順序集合と呼ぶ。 束 順序関係が定義された集合 L において、その任意の2つの元 A, B を選んだ時、必ず、 C ≤ A, C ≤ B となる最大の C (Inf{ A, B })、および A ≤ C ' , B ≤ C ' となる最小の C ' (Sup{ A, B })が存在する時、これを束と呼ぶ。ここで、 Inf{ A, B }を A ∩ B 、Sup{ A, B }を A ∪ B と書く。 定理。空でない集合 L 上に2項演算、 ∪, ∩ が定義されていて、交換律、結合律、吸収律が 成立していれば、巾等律も成り立ち、L は束をなす。(田中尚夫、pp.9) 束の例 ある集合(普遍集合)の部分集合からなる集合に関しては、 A ⊂ B なる A, B に対して改 めて、 A ≤ B と定義すれば、この集合間に定義されたこの関係 ≤ は、順序としての性質を 満たす。この部分集合からなる集合は束をなす。 同様にブール関数の集合も束になる。これをブール束と呼ぶ。 束においては次の規則が成り立つ (1) x ≤ z ならば x ∪ ( y ∩ z ) ≤ ( x ∪ y ) ∩ z 3 (2) (3) x ∪ ( y ∩ z) ≤ ( x ∪ y) ∩ ( x ∪ z) x ∩ ( y ∪ z) ≤ ( x ∩ y) ∪ ( x ∩ z) 上記の ≤ が等号=になる場合を考える。すなわち、 (5) 分配律 Distributive law x ≤ z ならば x ∪ ( y ∩ z ) = ( x ∪ y ) ∩ z x ∪ ( y ∩ z) = ( x ∪ y) ∩ ( x ∪ z) (6) 分配律 Distributive law x ∩ ( y ∪ z) = ( x ∩ y) ∪ ( x ∩ z) (4) モジュラー律 Modular law のうち、モジュラー律が成り立つ束をモジュラー束、分配律が成り立つ束を分配束という。 分配律の方がモジュラー律より強い条件である。 問題。分配束はモジュラー束である。 3.5 ブール代数 2つの元、 I , O をもつ集合 B が、2つの2項演算 ∪, ∩ 、と1つの一項演算―をもち、 これらの演算に関して閉じており、これらの演算に関して、次の条件を満たすならば、B を ブール代数という。 交換律 Commutative law 結合律 Associative law 吸収律 Absorptive law 分配律 Distributive law x ∪ y = y ∪ x, x ∩ y = y ∩ x ( x ∪ y) ∪ z = x ∪ ( y ∪ z) ( x ∩ y) ∩ z = x ∩ ( y ∩ z) ( x ∪ y ) ∩ x = x, ( x ∩ y ) ∪ x = x x ∪ ( y ∩ z) = ( x ∪ y) ∩ ( x ∪ z) x ∩ ( y ∪ z) = ( x ∩ y) ∪ ( x ∩ z) x ∪ I = I , x ∩ O = O ; x ∪ O = x, x ∩ I = x x ∪ x = I, x ∩ x = O ここで、 x, y, z は B に属する。 上の定理によって、ブール代数も束となる。ここで順序は、 x ≤ y ⇔ x∪ y = y ⇔ x∩ y = x によって定義する。 定義によって、ブール代数はもちろん分配束あり、モジュラー束である。 3.6 命題論理と述語論理 正しい(真)か、誤り(偽)であるかを判定できる表現(文)のことを命題と呼ぶ。命 4 題の集合に関しても ∧ 、 ∨ 、→ 、~などの演算を定義できる。ここで、~は命題演算の否 定記号である。ある命題を x とし、これを論理関数の変数に対応させ、真である場合の値を 1、偽である場合の値を 0 とすれば、命題の集合は論理関数の集合と等価になる。 ただ論理関数は回路設計に使われ、命題に関する演算体系は、命題論理 Propositional Logic として、3段論法のような数学の定理証明法を形式化するために整備された。したが って、両者の表現方法、両者で使われる記号は異なっている。命題論理はその性格を定義 する公理系と推論規則から出発する。公理系や推論規則をどう選択するかは、命題論理を 利用して何をしようかという、目的によって決められる。 ただし、命題論理の中の命題の表現においては、 「すべての・・・について・・・である」、 とか、「ある・・・について・・・である」というような、対象が特定のものに限定されな い表現は、許されないことになっている。そこで、こうした「すべての・・・」や「ある・・・」 というような表現を認める論理体系を述語論理という。述語論理のうち、 「すべての・・・」 や「ある・・・」という表現を自然数のような数学において基本的な対象のみに関して認 める場合を1階述語論理 First-order predicate logic、1階の対象の集合に関しても、 「すべ ての・・・」や「ある・・・」という表現を許す場合を2階述語論理、Second-order predicate logic、さらに一般的な場合を高階述語論理 Higher-order predicate logic と呼ぶ。 命題論理や述語論理は、数学の証明などを含む演繹的な推論をコンピュータにやらせよ うという研究が盛んになった 1980 年代に、コンピュータのアーキテクチャー(設計原理)、 やプログラミングなど視点からも研究されるようになった。もともと数学のおける証明の 形式化は、ある意味で人間に依存しない機械的な処理過程によって証明を行おうという思 想が含まれていた。この意味では、コンピュータによる推論の自動化は、数学基礎論と深 い関係にあると言えよう。 5 3.7 論理回路 論理演算を実行する回路を論理回路 Logical Circuit/Gate という。以下はその例と定義で ある。 AND A B OR A AND B A OR B XOR NOT XOR NAND NOT(A) A NAND B 0 0 0 0 0 1 1 0 1 0 1 1 1 1 1 0 0 1 1 0 1 1 1 1 1 0 0 0 CONTROLLED NOT CONTROLLED CONTROLLED NOT A B A’ B’ A B C A’ B’ C’ 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 1 1 0 1 1 0 1 0 0 1 0 1 1 1 0 0 1 1 0 1 1 1 0 0 1 0 0 1 0 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 0 真理表 CONTROLLED NOT(CN) は、A は A を(A'として)出力し、B に関しては、A が 0 なら ば同じ内容を、A が 0 なら、反転した内容(not B)を出力する。 CONTROLLED CONTROLLED NOT(CCN)は、A,B は同じ内容を、C は、A,B が共に1の時反転した 内容を、それ以外は同じ内容を出力する。 6 論理回路の完全な組 ある一組の論理回路、例えば、AND, NOT, OR を選択すれば、他の論理回路は実現でき る。これを素子の組の万能性という。例えば、NAND は、それだけで万能性を有している。 NAND は AND と NOT で表現できるから、AND と NOT も万能性を有する。同様に NOR も万能性を有している。 等価回路 外部への動作としては等価な回路はいくつも考えられる。実用的には、素子の数が少な いとか、結線の数が少ないなどが問題にされる。しかし、多量に製造される今日の汎用の 回路では、それほどの効率は追求されない。 可逆回路 論理回路からの出力が入力より少ないと出力から入力を復元することは不可能になる。 こうした回路を不可逆回路という。これに対して、入力を復元できる回路を可逆回路とい う。熱力学の可逆過程のように、可逆回路による計算はエネルギー消費が低いことが予想 される。また、その代償として速度が遅いことも予想される。可逆性を保ちながら速度を 落とさない演算回路の開発が量子計算の一つの目標である。 回路の設計 論理回路は、与えられた多変数のブール関数の真理表を実現するように作成される。変 数の制限なく、どんなブール関数も ∨, ∧, − の組み合わせで表現される。ブール関数が論理 式として与えられている場合、その真理表を求めることは、基本となる論理式に分解し、 その真理表を参考にすれば容易に作成できる。その逆の場合、ブール関数の真理表が与え られえている場合は、ブール関数値が1であるものと 0 であるものに注目して、それぞれ の行ごとに ∧ だけで結合された論理式を ∨ でさらに結合した表現(主選言(加法)標準形) とするか、0 であるものだけに注目して、それぞれの行ごとに ∨ だけで結合された論理式を ∧ でさらに結合した表現(主選言(乗法)標準形)とするか、に整理すればよい。(演繹的な 推論の項参照) 7 3.8 計算機 証明の可能性と計算の可能性 何が証明できるか、どのような数が計算できるかに関する議論は、20世紀の前半の数 学において、さらに深まった。証明できる、あるいは計算できるとは、有限回の手続きで 解をうる手順(Feynman のいう effective procedure)が存在しなければならないkとを意 味する。これについて Kleene, Post, Church などにより、さまざま計算体系を仮定した計 算の可能性に関する議論がなされた。この問題に関して、チューリング A. Turing は、今日 の計算機の時代を先取りするような視点から、アプローチした。 抽象化された計算機 Turing Machine Gödel の不完全性定理に刺激を受けたチューリングは、1937 年に、On Computable numbers という論文を発表し、この中で後にチューリング・マシン Turing Machine と呼 ばれるようになった仮想的な計算機械を記述した。この機械は区切りがつけられた枡をも つ(無限に)長いテープと、そのテープに数字などの記号を書いたり消去したりできるヘ ッドと、有限の内部状態をもつ機械から構成されている。内部状態は、テープから読み出 された情報によって、推移し、ヘッドのなすべき操作を出力する。この部分は、今日では 有限オートマトンと呼ばれる仮想的な機械である。テープの部分は、今日のコンピュータ のプログラムに相当する。このプログラムを適当に書くことにより、チューリング・マシ ンは、どんな特別な目的をもったチューリング・マシンの真似をさせることもできる。こ の意味で、チューリング・マシンにあらゆる仲間の機械の機能を真似させられるという意 味で、万能性をもたせることができる。この仮想的な機械は、万能チューリング・マシン Universal Turing Machine (UTM) と呼ばれる。 この仮想的な機械を利用して、チューリングは、 「計算できるあるいは証明できる問題は万能チューリング・マシンで証明あるいは計算可 能である」 という考えを述べた。今日、彼のこの提唱は正しいと受け入れられている。今日まで、チ ューリング・マシンを原理的に越える機械は提唱されていない。残る問題は効率だけであ る。例えば、現在話題になっている量子コンピュータのモデルである量子チューリング・ マシンが原理的にできることも、古典的なチューリング・マシンと同じである。 電子計算機(Hardware, Software、Network)の発展 8 チューリングが計算の原理的な可能性に関する問題にアプローチするために仮想的な計 算機械のアイデアを提唱してまもなく、第2次大戦が始まった。これによって、軍事目的 から計算を機械的かつ高速に実行する必要性が高まり、自動計算機械実現に向けた努力が 始まった。そうした中から電子計算機の原型が形をなしていきた。 今日コンピュータと呼ばれる電子計算機の元祖となった機械 ENIAC( Electronic Numerical Integrator And Calculator)が、米国のペンシルバニア大学の J.P. Eckert と J.W. Mauchly によって開発されたのは、第2次大戦直後の 1945 年である。その後すぐプログラ ムを内蔵するより洗練された EDSAC や EDVAC が米国のプリンストンと英国のケンブリ ッジで相次いで開発された。これらの初期のコンピュータは、真空管を使っていた。この 時期、米国のベル研究所でトランジスターは発明された。1950 年代には、半導体トランジ スター技術にもとづく素子がコンピュータに使われるようになった。その後、半導体によ る回路素子技術の進歩に依存するように、演算機能や記憶容量など、コンピュータの性能 は指数関数的な向上を続けている。これは、Moore の法則と呼ばれている。 今日のほとんどのコンピュータは、内蔵したプログラムを逐次的に実行するという意味 で、von Neumann 型(アーキテクチャーArchitecture)と呼ばれる。これに対して、大規 模な科学計算などには、並列型と呼ばれる計算機が使われている。計算機の改良は、 (1)人間にとっての使い勝手をよくし、コストを引き下げる (2)演算機能、記憶容量を増大させる (3)人間のような認知や思考能力を備えさせる を目標としている。 第1の目的は、商業的な成功のかぎを握る要素であり、今日のPC(パーソナルコンピ ュータ)はそうした努力の成果である。 第2の目的に関しては、コンピュータあるいはその部品である演算装置や記憶装置はし ばしば、特定の目的に開発されたものと、汎用に開発されたものに分けて考えることがで きる。汎用コンピュータに特定の目的の装置を組み込むことも行われる。例えば、計算能 力を必要とする画像解析やシミュレーション計算用のボードを汎用機に組み込むというよ うな組み合わせである。こうした試みはいつの時代にもなされている。これに対して、計 算全体をある目的に合わせ設計、開発するというのは、利用者も必然的に少なくなるから、 大変な贅沢であって、コストが高くある。スーパーコンピュータと呼ばれる計算機がその 例であり、我が国が開発した地球シミュレータも、その典型的な例である。だが月日が立 つと、こうしたコンピュータの性能は、やがて汎用機に凌駕されることなるため、「スーパ ーコンピュータとはその時代の最速機」だと一般には受け取られている。 第3の目的は俗に人工知能と呼ばれる研究に属する。この目的に関しては、昔からハー ドウエアを開発しょうとする試みと、コンピュータの万能性を利用してソフトウエアを開 発し、知的な行為を計算機上でシミュレートしようという試みとがあった。これは人間の 9 頭脳作業と似たことを行わせようと言う試みであるが、脳に到る前の感覚系における情報 処理や、脳からの信号で動く運動系の制御を含めた全体モデルの研究も盛んになってきた。 いわゆるロボットの研究がこれである。その一方で、脳自身の機能を特別な機械で実現さ せようという研究は、汎用コンピュータの性能とコストの減少で意義が失われてきた。 さらに早い計算機の必要性 計算機が世に出た頃、この種の計算の需要がどれだけあるかを予測した専門家の意見は、 全世界で数台あれば十分だろうというものだったと言われている。しかし、コンピュータ の市場が広がれば広がるほど、コンピュータの性能の向上と価格低下への要請は一貫して 大きくなっている。例えば、最近の携帯電話の普及は、携帯電話のテレビ電話化と通信セ ンタ-化を促し、大量の画像処理機能を要求するようになった。コンピュータ性能の需要 予測は技術だけに依存せず、使い手である一般大衆の心理に左右されるようになってきて いる。 電子計算機が定着した 1960 年代から今日まで、新しい計算機を開発しようというプロジ ェクトが、幾度か提唱された。我が国においても、大規模集積回路、高速に推論を実行す ることを売り物にした第5世代コンピュータ、その後継計画である次世代コンピュータ、 光コンピュータ、生物化学素子、脳型コンピュータ、地球シミュレータ、など、新しいさ まざまな大型プロジェクトがあった。現在、関心を集めているのは Grid Computer である。 このうちで成功したのは、実用的な目的の大規模集積回路と地球シミュレータである。 前者は、計算機のもならず現在の携帯電話にも利用されている超微細電子回路の開発につ ながる技術である。地球シミュレータや Grid Computer は、大規模な計算に徹した問題に 応用されている。例えば、IBM は、自社技術の宣伝も狙った超高速コンピュータの開発目 標としてチェスの世界チャンピオンと対局する Deep Blue を開発した。現在は、Bleu Gene という名称で、アミノ酸の配列からタンパク質の高次構造を予想する超高速(ペタフロッ プス程度)コンピュータを開発している。地球シミュレータ開発プロジェクトが当初掲げ た目標は、気候を全地球的な規模で長期に予測することであった。この種の科学計算とし ては、分子計算(量子化学計算)がある。しかし、第5世代コンピュータや脳型コンピュ ータなど、概念的に新しい計算機の開発計画は、期待どおりの成果はあげていない。こう した計画がめざしているのは、人間のような「賢い計算機」の開発である。 計算機の開発には、(1)より早い計算機、(2)より広く使われる計算機、(3)より賢 い計算機、という目標が設定されてきた。これに加えて(4)頻繁なモデルチェンジにも 耐える環境に優しい、水に流せて捨てられるような計算機、という目標も近未来に現実的 になるだろう。 10 3.8 超高速の計算機を必要とする問題 Algorithm とNP完全 計算機に実行させたい問題には、簡単に解けるものから、原理的には解けるが実際問題 としてどのくらい時間がかかるのか分からない問題まで、さまざまである。そこで計算の 手間を見積もる研究が行われている。この問題を考えるためには、どのような手段で計算 するかという計算モデル(あるいは計算機)を定義しなければならないが、ここでは詳し くは立ち入らない。ただ、いくつかの定義を述べておこう。 計算不能:ある問題の解法(Algorithm, 問題を解くための具体的な手順)が存在しない 時、計算不能 uncomputable という。この場合、疑問に答えられないという意味で決定不 可能 undecidable ともいう。 例:あるプログラム P と入力データ x が与えられたとして、このプログラムが停止するか 否かは決定できない。これを、プログラムの停止問題という。 例:ナップサック問題。 A と a1 , a2 ,Λ , an とが自然数で与えられた時、 a1 , a2 ,Λ , an の中か らいくつかの数を選択して和が A となるようにできるか?この問題はすべての部分集合を n 試せばできるか否かを決定できる。この意味で原理的には解ける。しかし、、 2 ある部分集 合のすべてを試す手間は nc が大きくなると、急激に大きくなる。 例:巡回セールスマン問題。いくつかの都市を巡回しなければならないセールスマンが、 総距離がある与えられた値以下であるルートを求める問題。この問題は後にでていくる NP 完全問題である。 k k P:入力のサイズを n として時、ある定数 k が存在して、 n のオーダー(すなわち O ( n ) ) のステップで解くアルゴリズムが存在するクラスの問題を、決定性多項式時間(あるいは 多項式時間 polynomial time)と呼び、P であらわる。 nk EXPTIME:上記において、 O (2 ) のステップで解くアルゴリズムが存在する時、指数関 数時間呼ぶ。 計算モデルのうち、either or 文をあるステップ数で実行できる機構をもつ計算モデルを非 決定性の計算モデルという。そうでない計算モデルを決定性モデルという。 NP: 非決定性の計算モデルによって多項式ステップで解ける問題を非決定性多項式時間 11 non deterministic polynomial time と呼ぶ。これは NP とあらわされる。 NP 完全:非決定性の計算モデルにより多項式ステップで解け、さらに非決定性の計算モデ ルによって解く限りではどうしても多項式ステップが必要な問題を NP 完全と呼ぶ。 NP 完全問題は、それを解くのに必要な計算量の下限が存在する問題である。 P と NP とが等しいかそうでないかは、計算数学の未開決問題になっている。仮にある NP 完全問題が P で解けることを示すか、解けないことを示せれば、この未解決問題は決着す る。現在まで、多数の NP 完全問題が見つかっているが、P で解くアルゴリズムはみつかっ ていない。もちろん、P で解けないことも証明されていないが、NP 完全問題は多項式ステ ップでは解けないのではないかと予想されている。 これらの概念はチューリング・マシンを計算モデルとしても定義することができる。 暗号問題 量子計算機もそうであるが、超高速計算機のひとつの重要な応用課題は、暗号解読であ る。暗号技術はネットワーク社会となり、いわゆる公開かぎの利用が普及することに伴い、 情報化社会の中核技術の一つとして浮上してきた。この技術の計算上の問題は、ある与え られた大きな数を素数の積に分解することである。これを素因数分解という。 素因数分解問題以外にも、計算機能を要求する数学的な問題は沢山ある。こうした問題 への挑戦において、超高速計算機にその性能を発揮させるためには、効率のよい解法 Algorithm を探すとともに、それを実行させるためのプログラムにも工夫を凝らさなければ ならない。 12 3.9 思惟の限界 計算機の進歩は、考える力を拡大している。論理的な思考の産物である数学も、自然認 識としての科学も、進歩している。人間に考える力を涵養させる要因として宗教や哲学が ある。例えば、宗教における思考法には、ユダヤ教(ヘブライニズム)、キリスト教、イスラ ム教、インドの原始宗教(ブラフマン/アートマン、仏教、密教)、中国思想すなわち易経、 老子(道教)、荘子、論語(孔子)、日本の神道(シントウ)などが含まれる。また、哲学に は、ギリシャ哲学、インド哲学、中国思想、イスラム思想、スコラ哲学(中世の神学)などが 含まれる。 我々は、これを思惟(考えること)と呼ぶ(思惟の方法論、中村元) 。こうした宗教や哲 学的な思惟の根源には何らかの「感じる力」が働いている。仏教学者の玉城康四郎は、人 類の教師とも呼ぶべきブッダ(釈迦)、孔子、ソクラテス、キリストらは、皆何らかの天の 声(霊的な声)を聞いていたと推測している(玉城康四郎、仏道探求、1999 年、春秋社)。 感じる体験が考える体験の以前にあることは、人間の思考の特徴である。自然に対する The Sense of Wonder もそうした感覚につながる。こうした仕組みを組み込んだ思考機械はまだ 開発されていない。 論理的、理性的な思考においては、感動というような主観的な体験に依存しない方法論 を極限まで追及する。そうした方向の究極に位置している研究領域が数学基礎論 Mathematical Logic である。それは、公理から出発するユークリッドの原論や、デカルト の思惟の方法論(「方法序説」)などをへて、G. Cantor の集合論の波紋で新しい展開を見た。 それが、数学の公理化(D. Hilbert)である。1928 年、ヒルベルトとアッケルマンが「記 号論理学の基礎」で述語論理を形式的に体系化する試みを発表した。1935 年、ゲーデル Kurt Gödel(1906-1978)は、彼の名前を冠した完全性定理および不完全定理を発表した。ゲ ーデルの完全性定理は、「(数学の基礎になっている)論理体系は、内容的に完全である」 ことを示した。ゲーデルの不完全性定理は、 「自然数論を含む述語論理の体系 Z は、もし無 矛盾ならば、形式的に不完全である」という内容である。その後 G. Gentzen(19361 年) は、 「集合論を含まない「純粋の自然数論」を含む体系 Z は、もし無矛盾ならは、不完全で ある。純粋の自然数論は無矛盾であり、不完全である」ことを証明した。これらの定理は 数学の体系を構築した時、その体系自身が無矛盾である(誤謬が無い)ということを必ず しも証明できないことを示した。ゲーデルの不完全性定理は人間の知性の限界を示す定理 とも言われている。 公理主義は、数学基礎論だけでなく数学全体を公理論的に見直す風潮を生み出した。フ ランスの N. Bourbaki グループの公理的な記述による数学の再構成はそうした例である。 公理主義の影響は物理学にも及んだ。 13 計算機が進歩してくると、計算機の限界あるいは実用的な意味での計算の限 界が議論されるようになってきた。計算の限界に関る議論は、「理論的な予測」 に関する議論とも関係がある。例えば古典物理学においては、ラプラスのデモ ン(1814)が昔から知られていた。天体力学を研究していたラプラスは、対象 系の方程式、境界条件、初期条件を知れば、系の未来は予測できる、そしてこ の考えは宇宙の将来予想にも適用できる、という説を提唱した。これに対して は自由意志を否定するものだというような反論や、量子力学のような本質的に 確率的な現象を無視していると批判されている。マックスウエルのデモンの研 究者であるランダウアー・ロイド(Landauer-Lloyd)は、仮に正しい予測理論 があったとしても、実際の予測は「計算の限界」によって阻まれると主張して いる。すなわち将来、仮に量子計算のような超高速計算機が開発されても、不 確定性原理、光速、熱力学の第2法則、宇宙の計算資源などを考慮に入れると、 10120 bits の情報処理が限界であると論じている。 一般に、ある系を理解しようとすると、その系の振る舞いを予測することが 課題になる。複雑な系の場合は、それをより簡単な部分に還元して理解しよう という方法論(還元論)がとられる。しかし、部分にわけてしまっては本質が 失われてしまうような系の場合、こうした還元論にも限界がある。このような 系は、何らかの分解不可能な Organizing Principle に支配されていると考えら れる。生命系の場合、こうした原理は Biological Principle と呼ばれる。そうし た原理がどうしても必要なのか、還元論だけでよいのか、議論は分かれている。 非常に簡単な法則にしたがうが、振る舞いは極めて複雑になるという系があ る。こうした系は、複雑系 Complex System と呼ばれる。複雑系の研究は、こ れからの科学の重要課題と見なされている。そこでは、これまでの物理学の基 盤であった、平衡と線形に代わって、非平衡、非線形が主役とされている。 参考文献 George Boole, Laws of Thought, 1854 (Dover の復刻版あり) S. Watanabe, Knowing and Guessing, John Wiley, 1969 Richard P. Feynman (J.G. Hey and R.W. Allen eds.), Feynman Lecture on Computation, Addison Wesley, 1996(原康夫他訳、ファイマン計算機科学、岩波書店、1999 年) 竹内外史、数学基礎論の世界、日本評論社、1972 竹内外史、八杉 満利子、証明論入門 改題「数学基礎論」、共立出版 1988 Seth Lloyd, Ultimate physical limits to computation, Nature, 406, 2000, 1047-1054. 14 第4章 古典物理学におけるエントロピーと情報 4.1 力学から古典物理学へ この章では古典物理学がどのように体系化されてきたかを簡単に振り返ってみる。古典 物理学は、天体の動きを理解しょうという努力の中から形成されてきた自然認識の方法で ある力学に遡ることになる。 力学 現代の物理学の起源は、ガリレオとニュートンによる力学にある。それは次の3つの法 則として知られている。 (1) 外力が働いていない物体は等速運動をする(慣性の法則)。 (2) 運動の変化すなわち加速度と質量の積は外力に等しい(ニュートンの運動方程式)。 (3) 2つの物体が力を及ぼしあっている場合、それらの力の大きさは等しく、向きは反 対である(作用反作用の法則)。 これらの法則は、天体の動きや地球上の物体に働く重力についての考察から導かれたも ので、ガリレオによって認識され、ニュートンによって一般的な原理として、著書「プリ ンキピア」の中で、まとめた形で述べられた法則である。これらの法則は、今日ではニュ ートンの名を取って、ニュートンの力学と呼ばれている。とくに第2法則は、 F = α m, α = d 2 x / dt 2 と表現される。ここで、 F は力でベクトル、 α = d 2 x / dt 2 は同じくベクトルで加速度、 m は物体の質量、 x は物体の位置を表す座標でこれもベクトルである。物体は大きさが無 視できる点、すなわち質点と理想化されている。 このニュートンの力学は、その後発展した古典物理学の基礎となった理論であり、現在 もそのまま使われているほど完成度が高い。「プリンキピア」が出版されたのは 1687 年で あるが、その後、さまざまな問題、とくに天体の運動に応用されながら、数学的な形式が 洗練されていった。例えば、2体の運動の一般解として楕円軌道が導かれた。その焦点は 2つの天体の質量中心である。約 100 年後には、ラグランジュが最小作用の原理(変分法) を取り入れた解析力学(1788)を発表している。解析力学は 19 世紀に入り天体の運動(天 体力学 Celestial Mechanics)を研究する過程でさらに体系化された。ラプラスの天体力学 が発表されたのは 1802 年である。 1 電磁気学 19世紀の中頃になると、力学以外の物理学の原理的な法則に関する研究が体系化され、 古典物理学が完成される。その一つが電磁気学である。それはクーロン(Charles A. Coulomb, 1736-1806)、ボルタ(1745-1827)、オーム(Georg S. Ohm, 1787-1854)、アン ペール(A-M. Ampère, 1775-1836)、エルステッド(H. C. Oersted, 1777-1862)、ファラ デー(Michel Faraday, )らによって個別の法則として記述され、マックスウエル(J. C. Maxwell, )によって基本方程式群にまとめられた。今日、マックスウエルの名前で呼 ばれるそれらの基本方程式は、以下のものである。 (1)クーロンの法則 ∇ ⋅ D = 4π ρ (3)単磁極は存在しない 4π 1 ∂D J + c c ∂t ∇⋅B = 0 (4)ファラデーの法則 ∇×E = − (2)アンペールの法則の補正 ∇×H = 1 ∂B c ∂t ただし、これらの方程式は Gauss 系で書かれている。また、 E は電場 Electric Field D は電気変位 Electric Displacement あるいは電束密度 Electric Flux Density、 B は磁束密度 Magnetic Flux Density H は磁場 Magnetic Field ρ は電荷 Electric charge J は電流密度 Current Density と呼ばれる量である。これらの量の間には、 D = E + 4π P H = B − 4π M ∇⋅ J + ∂ρ =0 ∂t とく関係がある。ここで P は巨視的な分極 Macroscopic Polarization(単位体積当たりの電 気双極子モーメント J107), M は巨視的な磁化 Macroscopic Magnetization(単位体積当 たりのモーメント J151)である。電荷と電流密度の関係式は、電荷が消滅せず電流となる 連 続 性 を 表 し て い る 。 E, D, B, H は す べ て ベ ク ト ル 量 で あ り 、 ∇ ⋅ f ≡ div f , ∇ × A ≡ curl A とも書かれる。ただし f は任意のスカラー、 A は任意のベ クトルである。 2 上記(2)のアンペールの法則の補正はマックスウエルによって行われた。補正のもと になったアンペールの法則は、 (2)’ ∇×H = 4π J c という、変位電流の時間変化が欠けた形であった。これを J→J + 1 ∂D 4π ∂t と置き換えたのは、マックスウエルの洞察力による。彼は、 (2) ’の div(湧き出し)をと ると左辺は、 div ( curl H ) ≡ ∇ ⋅ ∇ × H = 0 となり、常に0になる(ベクトルの計算の規則により、div curl は常に0となる) 。一方、 右辺は 4π ∇ ⋅ J となるが、これが0であるということは、閉曲面からの電流の湧き出しが c 0になるということを意味する。しかし、物理的な考察では、閉曲面からの電流の湧き出 しは、その閉曲面内部の電荷の減少に等しいはずである。それは連続の式 ∇⋅ J + ∂ρ =0 ∂t の意味するところでもある。一方、 (2)のように補正した式の div をとると、左辺は0に なるが、右辺も、 4π 1 ∂D 4π 1∂ 4π ∂ρ ∇⋅ J + ∇⋅ = ∇⋅ J + ∇⋅ D = ( ∇⋅ J + ) = 0 ∂t ∂t c c c c ∂t c となる。ここで最初の等式は、div と時間に関する編微分操作の交換可能性を、第2の等式 はクーロンの法則を、最後の等式は電荷の保存則を使った。 古典物理学の力と相対論 マックスウエルは時間的に変化する電場および磁場に関する方程式を解き、いわゆる電 磁場の存在と、その伝播測度が光の速さに等しいことを見出した。これを有力な根拠とし て、彼は光が電磁波だと結論した。この発見により、電気、磁気、光に関する理論はマッ クスウエルの方程式に立脚すべしという理念が確立した。ニュートン力学とマックスウエ ルの電磁気学は、古典物理学の基盤となった。ニュートン力学には2つの物体の間に働く 重力の法則 F = −G m1m2 r r3 が含まれていた。ここで G は重力定数、力 F と距離rはベクトル量、 m1 , m2 は、それぞれ の物体の質量である。電磁場中にある荷電粒子(電荷qをもつ)に働く力は、 3 F = q (E + ローレンツ(H.A. Lorentz, 1 v × B) c )力と呼ばれる。ニュートンの運動の方程式とマックスウエ ルの方程式、および重力とローレンツ力は、古典物理学のすべての理論の基盤である。と くに微視的な現象は、これらの方程式を直接解くことによって説明されるようになった。 ただ、19世紀の末から20世紀の始めにかけて、ローレンツやアインシュタインの(特 殊)相対性理論の登場によってニュートン力学は、一部補正されることになる。すなわち 力学の第2法則、ニュートンの運動方程式は、 F= d ( p ), dt p= mv 1 − v2 / c2 となる。ただし、マックスウエルの方程式は変更を受けない。このことをファイマン(R. 2 2 Feynman)は、 「磁場は相対論の効果である、電磁気の法則は v / c 程度の精度で正しい結 果を与える」と表現している(ファイマン、訳本 p12)。 熱力学と統計力学 ニュートン力学やマックスウエルの電磁気学は、考察の対象となる系が小数の粒子から なっているか、あるいは多数であっても剛体 Rigid body や弾性体 Elastic body と呼ばれる ような自由度が小さなかたちに扱える場合に有効である。しかし気体のように多数の粒子 からなる系では、それらの粒子をすべて含めた運動方程式を解くことは不可能である。そ うした系に関しては、微視的状況を個々に問題にすることはできず、巨視的な測定量や性 質だけに注目することしかできない。熱に関係した現象もそうした取り扱いしかできない。 熱に関する研究は、効率的な熱機関をつくりたいというカルノー(S. Carnot )によって 基礎がつくられ、クラウジウス、トムソンらによって熱力学として体系化された。 熱力学の法則は次の3つにまとめられる。 (1)第1法則、エネルギー保存則。ある系の変化(過程)に伴う内部エネルギーの増大 は、その変化の過程で吸収した熱と、なされた仕事の和に等しい。 (2)第2法則、最終結果が、同じ温度に保たれている熱源から仕事をさせられる熱(work heat)を取り出して、それをすべて仕事に変換するだけで、それ以外の変化は起こさない ような過程は不可能である(Lord Kelvin)。 (3)第3法則、絶対零度におけるすべての系の entropy は常にゼロにとれる。 (Nernst’s theorem)。 4 これに第0法則として、物質の温度は定義できる(~1931年頃)、を加える場合もある。 第1の法則は、熱と仕事は、変換可能であり、等価であるという(Joule による)考えも とづくもので、ニュートン力学に熱の概念を導入することによって、エネルギー保存則が 成り立つようにしたものである。運動している物体が摩擦のような抵抗を受ける現象を解 析する場合、ニュートン力学だけでは不十分なのである。 第2法則は、 「その過程の最後の結果が、ある温度にある物体から熱を取り出し、それより高い温度の 物体に受け渡すだけであるような過程は不可能である(Clausius)。」 「孤立系におけるいかなる変化(過程)においても、最終状態の entropy は、最初の状態 のそれより減少することはない。」 「孤立系において entropy が最大の状態は最も安定な状態である。」 などとも表現される。これらの表現が同等であることを証明することは、熱力学の教科書 の最初の仕事になっている。 第3法則は、 「有限回の変化(過程)を踏んで、物質の温度を絶対零度にもっていくことはできない。」 ことを表している。この法則は物質が原子からできているという仮定から導かれる(アト キンス、p.15)。 熱力学の法則のうち最初に認識されたのは、第2法則であり、それは基本的にカルノー の考察の成果である。それは 1980 年代の前半であったが、クラウジウスやトムソン(ケル ビン)らによって整理されたのは、1980 年代の後半である。その過程でエントロピーとい う概念も始めて導入された。この概念は、その導入者であるクラウジウス自身や絶対温度 の概念を考えたネルストなどにも正しく理解されていなかった。気体の分子的な運動論を 研究する過程で、エントロピーの本質を洞察したのは、ボルツマンである。 気体に関しては、マックスウエルとボルツマンらによって分子運動論が構築され、そこ から統計力学が生まれた。マックスウエルは、構成要素である粒子同士の相互作用が希薄 な場合の気体の粒子の速度の分布を算定することに成功した。速度の分布とは、ある速度 の微小範囲を指摘した時、その範囲の速度をもつ粒子の数がどれだけかを教えるものであ る。すなわち、粒子の速度はベクトル量であるが、それの絶対値が、v と v+dv である確率 f (v)d 3v は、 3 1 mv 2 kT m 2 −2 f (v)d v = 4πv ( ) e 2πkT 3 2 dv 、 (体積要素は、 d 3v = 4πv 2 dv ) 1 で与えられるとマックスウエルは推定した。この分布による最も確からしい早さは ( 2kT 2 ) m である。なお、速度の各成分の分布は、正負対称のガウス分布(正規分布)となり、その 平均はもちろんゼロである。この速度分布は、成分が複数ある理想気体にも適用できる。 5 ポテンシャルエネルギーを無視できるとした場合、気体のエネルギーは運動エネルギー のみであるから、速度の絶対値の分布が分かれば、運動エネルギーの平均値も求められる。 それは巨視的な気体の状態に関する式、PV = nRT、などと関係づけられる。このようにし てマックスウエルは、集団を構成する要素である個々の粒子の状態を表す量(この場合は 速度)と集団の巨視的な観測量(温度、体積、圧力など)とを関係づける道を示した。 ボルツマンは、マックスウエルの考察をさらに進め、巨視的な状態量である熱力学的な エントロピーSと微視的な粒子系の取りうる状態の数W との間に、 S = k log W という関係があることを発見した。ここで定数k は、ボルツマン定数である。彼はまた、 平衡状態にある(N個からなる)多粒子の系が、離散的なエネルギー値、 E1 , E2 , E3 , ..., Ei , ... をとるとした場合、系がエネルギー Ei をとる確率 P ( Ei ) が、 e − Ei / kT , P( Ei ) = Z Z = ∑ e − Ei / kT i で与えられることを示した。ここで、k、Tはそれぞれ、ボルツマン定数と温度である。こ れをボルツマン分布という。また Z は分配関数と呼ばれる。 こうした考察により、巨視的な世界を記述する熱力学は、微視的な世界の記述から出発 する統計力学と関係づけられるようになった。これによって、熱力学と統計力学は、巨視 的な物理法則に関する物理学の基礎理論となり、力学や電磁気学とならぶ古典物理学の基 盤理論となった。熱力学や統計力学の理論が体系化されたのも、19 世紀の後半である。こ うして古典物理学は、20 世紀になる頃までに数学的に整理された理論体系となった。 その他の分野 光学、流体力学 古典物理学の完成と見直し ほとんど完成されたかに見えた古典物理学は、20 世紀の始めに2つの挑戦を受ける。そ の一つは、すでに述べた(特殊)相対論であり、もう一つは量子論である。量子力学は 1928 年のディラックの相対論的電子論の論文で、完成された。さらにその間にアインシュタイ ンの一般相対論が発表され、宇宙論に新たな展開をもたらした。しかし、力学に続く電磁 気学、熱力学、統計力学、特殊および一般相対論、量子力学が出揃い、古典物理学の修正 がなされたのは、19 世紀の中頃から 20 世紀の中頃(1850-1950 年頃)の約 100 年間であ ったということができる。それ以後の物理学は、素粒子を記述する(場の)理論、宇宙論 (一般相対論や量子力学による)宇宙論と、さまざまな分野への応用へと発展している。 6 4.2 解析力学と統一的な方法論としての最小作用の原理 解析力学は原理的にニュートンの運動方程式を数学的に洗練した方法である。ここでは、 統計力学にでてくるような多数の粒子を構成要素とする系を例として、この方法を説明す る。 質量 m を有する単一の粒子(質点)に関するニュートンの力学の運動方程式(第2法則) は、 F = m d 2 r / dt 2 となる。ここで、 F は物体に働いている力であり、 r は座標、 t は時間である。運動量は、 p = m dr / dt ρ ρ ρ で定義される。力 F 、座標 r 、運動量 p はすべてベクトルであり F , r , p などと書くこと もある。具体的な成分は、 ρ F = ( Fx , Fy , Fz ) = ( F1 , F2 , F3 ) ρ r = ( x, y, z ) = ( x1 , x2 , x3 ) ρ p = ( px , p y , pz ) = ( p1 , p2 , p3 ) などと表記される。もし複数の粒子を考えると、すべてに添え字 i などをつけ、 i 番目の粒 子の質量を mi とすれば、力、座標、運動量の成分も同じように添え字で表す。 ρ Fi = ( Fix , Fiy , Fiz ) = ( Fi1 , Fi 2 , Fi 3 ) ρ ri = ( xi , yi , zi ) = ( xi1 , xi 2 , xi 3 ) ρ pi = ( pix , piy , piz ) = ( pi1 , pi 2 , pi 3 ) 運動方程式は ρ ρ d 2 ri Fi = mi , i = 1, 2, 3, ... d t2 となるが、これは、 d 2 xi ; Fix = mi d t2 d 2 yi ; Fiy = mi d t2 d 2 zi Fiz = mi d t2 という成分ごとに成り立つ式を代表させたものである。 7 力、座標、運動量は時間とともに変化すると考えられるので、時間の関数と見なせる。座 標 x 、運動量 p の時間に関する微分は、座標 x&、運動量 p&などと表記する。 上記の表記における座標は直交座標を想定していた。問題によっては、他の座標系の方 が便利なことがある。例えば極座標や円柱座標はよく使われる。極座標は、 r ,θ , φ ( r ≥ 0, 0 ≤ θ ≤ π , 0 ≤ φ ≤ 2π ) が使われる。直交座標と極座標との間には次の関係 がある。 x = sin θ cos φ y = sin θ sin φ z = r cos θ こうした一般の座標では、直交座標の時のように各成分に関する式は同じ形にはならな い。そこでそれぞれの粒子ごとの座標や運動量の成分を、粒子の添え字で識別するのでは なく、単に1列にならべた添え字を使うのが一般的である。そして座標としては q 、運動量 としては p を使うのが習慣になっている。これを一般化座標と呼ぶ。すなわち、 q1 , q2 , ...., qi , ... それに対応する運動量を p1 , p2 , ...., pi , ... と表記する。例えば、粒子1および2からなる2粒子系の場合、直交座標系を選べば、そ れぞれの粒子の座標ベクトル r1 , r2 は、 r1 = ( x1 , y2 , z 3 ) = ( x11 , x12 , x13 ) r2 = ( x2 , y2 , z2 ) = ( x21 , x22 , x23 ) などと書けるが、これをまとめて、 x1 , x2 , ...., xi , ..., x f の形に書けば、2つの表記法は以下のように対応している。 ( x1 , x2 , ...., x6 ) = ( x1 , y1 , z1 , x2 , y2 , z3 ) = ( x11 , x12 , x13 , x21 , x22 , x23 ) ただし、実際にはどちらを1あるいは2と呼ぶかは問題にならない。重要なのはいくつの 座標(成分)が必要かである。その総数をその(力学)系の自由度と呼び f で表すのが習 8 慣である。したがって一般化された座標は、 q1 , q2 , ...., qi , ..., q f これに対応して運動量は p1 , p2 , ...., pi , ..., p f と表される。添え字の使い方は座標の場合と同じである。ここで「対応する運動量」が何 を意味するかは、直交座標の場合は対応する座標成分の微分に質量を掛けた量として明ら かであるが、一般の場合はまだ分からない。 ハミルトン関数とラグランジュ関数 一般座標 Generalized coordinate, 一般化運動量を定義したところでそれらを変数とす る2つの重要な関数を導入する。それらがハミルトン関数 Hamiltonian とラグランジュ関 数 Lagrangian である。普通は、まずラグランジュ関数 Lagrange’s function、L が、 L = L (q1 ,.., qk ,..., q&1 ,..., q&k ..., t ) と与えられたとして、ハミルトニアン関数と一般化運動量を H = ∑ pk q&k − L, pk = − k ∂L , ∂q&k で定義する。最初に導入するラグランジュ関数は、 L =T−V と仮定されるのが普通である。ただし、T は運動エネルギー, V は位置エネルギーである。 運動エネルギーは、直交座標の場合、単一粒子が V = 1 2 1 mr& = = m ( x&2 + y&2 + z&2 ) 2 2 であり、これを全部の粒子に足したものである。位置 Potential エネルギーは、 F = − ∇V によって力 F と結びついている。ここでこれも単一粒子の分を総計したものになる。 9 一般の場合、運動エネルギーは、一般化座標 qk とその時間微分 q&k の関数であり、位置エ (添え字が)対 ネルギーは座標だけの関数である。したがって、一般化された運動量 pk を、 応する一般化された座標の時間微分 q&による偏微分によって定義することが可能である。 上で定義したハミルトン関数 H は実は運動エネルギーと位置エネルギーを合計した全エ ネルギーに対応した関数である。すなわち、 H =T+V この式の中の量もすべて一般化座標および一般化運動量の関数である。ハミルトン関数や ラグランジュ関数の重要性は、各粒子の運動がこれらの関数で記述できることにある。 ハミルトン関数による運動の記述 ハミルトン関数と一般座標、一般運動量の間には次の関係がある。 p&i = − ∂H , ∂qi q&i = ∂H , ∂pi i = 1, 2, ... これをハミルトンの正準方程式 Hamilton’s canonical equations と呼ぶ。ここで qk 座標と 運動量 pk は、互いに共役 Conjugate な正準変数 Canonical variable と呼ばれる。 ラグランジュ関数による運動の記述 系の運動は次の方程式でも記述できる。 d ∂L ∂L ( ) − = 0, ∂qi dt ∂q&i i = 1, 2, ... この方程式をラグランジュの運動方程式と呼ぶ。この方程式は δ ∫ t2 t1 L dt = 0 という変分方程式の解になっている。すなわちラグランジュの方程式は、ラグランジュ関 数の時間に関する経路積分の変分を停留値ならしめるという条件から導かれる方程式であ る。変分によって表現されたこのことをハミルトンの原理と呼ぶ。これは変分問題の特別 な場合である。一般にこのような形の変分問題の解はオイラーの方程式を満たす関数であ る。ゆえに、ラグランジュの方程式をオイラー・ラグランジュの方程式と呼ぶこともある。 (ラグランジュ関数の変分に関する解であるオイラーの方程式、すなわちハミルトンの原 10 理を満たす関数を与えるのがラクランジュの方程式というややこしいことになる。) 上記の積分は作用積分 Action integral と呼ばれ、しばしば S と表記される。 S= ∫ t2 t1 L dt またこの積分は経路に沿った積分 Path integral でもある。物理学の中で作用は力と動いた 距離の積と定義される。物理学の中には作用積分と同じような積分とその極値問題がいく つも存在している。光の経路はその一例である。 正準変換 Canonical Transformation 一般化座標 qk と一般化運動量 pk 、ハミルトン関数 H をもつ系に関して、変数変換を考 え、新しいハミルトンとする。 Qi = Qi (q, p, t ), Pi = Pi (q, p, t ) H →K このような変換がハミルトンの運動方程式を ∂K , P& i = − ∂Qi ∂K , Q&i = ∂Pi i = 1, 2, ... 満たす時、この変換を正準変換 Canonical Transformation と呼ぶ。この条件は、 t2 δ ∫ (∑ Pi Qi − K (Q, P, t ) ) dt = 0 t1 δ ∫ (∑ pi qi − H (q, p, t ) ) dt = 0 t2 t1 この条件が同時に満足されるためには、被積分関数同士がある任意の関数Fの全微分だけ 違っている必要がある。そうであれば、このような違いの積分は、 ∫ dF dt = F (1) − F (2) dt t2 t1 となり、任意の関数でゼロになる。このような関数を変換の母関数 Generating Function と呼ぶ。関数Fは、次の方程式を満足するものである。 d ∑ p q& − H = ∑ P Q&− K + dt i i i こうしたFにより、新旧のハミルトン関数は、 11 i F K= H+ Pi = − ∂F , ∂Qi ∂F , . ∂t p&i = ∂K , ∂q&i i = 1, 2, ... とかける。 ハミルトンージャコビの方程式 正準変換の母関数Fの変数が、 F (qi , P, t ) のように選ばれている時は、 H (q1 , q2 , ...q f , ∂F ∂F ∂F , ...., ,t) + = 0、 ∂q f ∂t ∂q1 が満たされる。これをハミルトンージャコビの方程式と呼ぶ。 ポアッソンの括弧 解析力学において、2つの力学変数、 u , v が、正準変数 qk 、 pk の関数である時、ポアッ ソンの括弧 Poisson Bracket が、次のような定義される。 ∂u ∂v ∂u ∂v − [u , v] = ∑ ∂pk ∂qk k ∂qk ∂pk この関係式は、量子力学の交換関係 commutation relation を導くために重要である。 運動方程式の同等性 最初に述べた運動の方程式と上で定義したさまざまな運動方程式は、一方から他方が導 けるという意味で実は同等である。運動の方程式はポアッソンの括弧からも導ける。そう した同等性の証明は解析力学の中のある部分を占めている。実際の同等性を具体的な系で 確認してもよう。 量子力学の教科書でよく紹介されている初等的に解ける系とハミルトニアンは、次のよ うなものに限られている。 12 自由粒子 調和振動子 H = H = 中心力場中の粒子 1 2 1 2 1 mv = p = ( p x2 + p y2 + p z2 ) 2 2m 2m mq&2 kq 2 mq&2 mω 2 q 2 + = + , ただし、 ω = 2 2 2 2 H = k/m 1 ( px2 + p y2 + pz2 ) + V (r ), ただし、r は x 2 + y 2 + z 2 2m これらのうち、最初の2つの系によって運動方程式の同等性を証明するのは、容易である。 最後の例は極座標の扱いがあるので、多少計算は面倒になる。 解析力学のご利益 それではなぜわざわざわずらわしい手続きを経てこうした定式化を行うのであろう。そ の最も大きな理由は、一般化されたことで、他の理論との対応をつけやすくなり、見通し がよくなることであろう。例えばニュートン力学では対応が考えられにくい量子力学との 関係も、解析力学であればある程度の対応をつけることができる。また、力学と電磁気学 とを統一的に論ずることもできる。さらに、一般化座標と運動量によって定義される2 f 次 元の空間は、統計力学では状態空間、位相空間、あるいは単に相空間 Phase space と呼ば れ、重要な概念となる。また、上記ではラグランジュ関数やハミルトニアン関数を直交座 標を基礎にしたニュートン力学の視点から導入した。しかし、素粒子論などでは、こうし た古典的な視点に縛られず、より天下り的にラグランジュ関数を導入する。それが適当か どうかは、結果次第というわけである。 見通しがよくなるという利点の一つは、対称性と保存量の関係が理解されやすいことで ある。系がさまざまな対称性を有していれば、それはラグランジュ関数やハミルトン関数 に反映されているはずである。対称性とは、座標系を平行移動(変換)しても、回転して も関数の形が変わらないことを意味する。そのような対称性があると保存される物理量が あることが知られている(ネーターNoether の定理)。ただ、多くの初等的な問題は、問題 にあった個別の方法で解くのが便利であり、解析力学の方法を適用するのは、泰山鳴動し て鼠一匹、あるいは鶏を割くに牛刀をもってす、というような具合になりかねない。しか し、解析力学の方法を理解することは、初等的な力学から脱出して、より高次の理論物理 学の世界を訪ねる足慣らしとなるのである。 小出昭一郎、解析力学、岩波書店、1983 年 13 4.3 熱力学のエッセンス 熱力学が相手にする要素の数 力学に較べると熱力学は理解し難いという定評がある。力学は質点のように1つ、2つ と数えられる粒子か、あるいは剛体のように物体を構成する要素は多いが互いの束縛が強 いため各要素は勝手に運動することが許されない(自由度が小さい)系を対象にする。こ れに対して熱力学では、コップの中の水とか、やかんの中の蒸気というような膨大な数の 構成要素がかなり自由に動いている系を対象とする。こうした物体を構成する要素の数が どのくらいかの目安となるのがアボガドロ数である。 アボガドロ数 Avogadoro’s number 同じ圧力、同じ体積の気体は、気体の種類によらず同じ数の分子を含む。1気圧、22.414 リットルでは、6.022x1023 個の分子が含まれる。この数だけの構成要素(分子、原子、イオ ン)を含む物質の量を1モルと呼ぶ。 ついでに、この数と関係の深い数も紹介しておく。それらは気体定数とプランク定数と ボルツマン定数である。 A. Avogadoro’s number, 6.022 x 1023 R, Gas constant, 8.314 x 107 erg/mol・egrees = 1.986 cal/mol・degrees h, Planck’s constant, 6.55 x 10-27 cm.2.gm.sec-1 k, Boltzmann constant, R/A, 1.38x10-16 erg/degree すなわち熱力学が扱う系を構成する粒子の数はざっと 1024 のオーダー(桁、order)であ る。こうした系はさまざまな状態をとりうるだろう。ゆえに、これらの状態のすべてにつ いて知ることは不可能であろう。しかし膨大な数からなる系でも外から見た場合に落ち着 いた変化のないように見えることがある。対象とする系が、巨視的な観察では動きの見ら れない時、「系は(熱的)平衡状態にある」という。巨視的に見て平衡状態にある系は、少 ない数の変数で記述できるだろう。こうした変数を熱力学の変数と呼ぶとすれば、これら の変数の間の関係を見つけることが、熱力学の課題になる。また、このような系の巨視的 な振る舞いが何らかの法則にしたがっているなら、そうした法則は、熱力学の変数によっ て記述できるであろう。さらに、その法則を使えば、変数の間の関係式も導けるであろう し、系の巨視的な振る舞いを予測することもできるであろう。これが熱力学の基本的な考 え方である。 法則は、実際にさまざまな系を観察したり、実験を行ったりして、それらの結果をさま ざまな角度から分析、吟味し、推論を行ったりして、仮説を立て、さらにそれを検証する 14 実験や観察を行うことで導かれる。そうして得られたのがすでに述べた熱力学の法則であ る。 熱力学の法則 熱力学の法則は、以下のように表現される。 第0法則:物質の温度 T は定義できる。 第1法則:エネルギー保存則。ある系の変化(過程)に伴う内部エネルギーの増大dU は、 その変化の過程で吸収した熱dQ と、なされた仕事dW の和に等しい。すなわち、 dU = dQ + dW 第2法則:(2-1)最終結果が、同じ温度に保たれている熱源から仕事をさせられる熱 (work heat)を取り出して、それをすべて仕事に変換するだけで、それ以外の変化は起こ さないような過程は不可能である(Lord Kelvin)。これと同等な表現は、 (2-2)その過程の最後の結果が、ある温度にある物体から熱を取り出し、それより高 い温度の物体に受け渡すだけであるような過程は不可能である。(Clausius)。 (2-3)孤立系におけるいかなる変化(過程)においても、最終状態のエントロピー entropy は、最初の状態のそれより減少することはない。 (2-4)孤立系において entropy が最大の状態は最も安定な状態である。 第3法則、絶対零度におけるすべての系の entropy は常にゼロにとれる。(Nernst’s theorem)。 このように述べられた法則の内容を理解するためには、まず、そこで使われている概念 を正しく理解する必要がある。第1法則の中には内部エネルギーと熱という2つの概念が でてくる。そのうちの内部エネルギーは系の構成要素のすべての運動エネルギーとポテン シャル・エネルギーの和であり、仕事は力学で定義される力と移動距離の積と考えてよい。 しかし熱量は力学にはない概念である。そこで、第1法則は、 「Newton 力学に熱という概念 を導入してエネルギー保存則が成り立つようにした」、とも、「熱と仕事は、変換可能であ り、等価である(Joule)」とも言われる。このことは、 「熱をやったりとったりすることは、 仕事をしてあげたりされたりすることと交換可能である」ということを意味している。こ のことは経験的な事実と考えられる。 第2法則にはさまざまな同等な表現がある。その中にはエントロピーを使った表現もあ り使わない表現もある。 (2-1)、 (2-2)は、エントロピーという概念を使わない表現 であるが、これらの表現においては「過程」という概念が使われている。この場合の過程 とは仕事の方法、あるいは熱機関の機構と運転の仕方を意味している。第2法則は、そう した機関のデザインや性能の限界を述べた、工学的な命題であると見ることができる。こ れらは自然法則を述べたというより、人間の能力あるいは人為の限界に関する命題である。 15 これは、自然法則を述べる場合、自然だけの話をしないで、人間の営みを例として、その 限界を指摘することで、自然の仕組みを教えるという論法の例である。実は、第1法則に 関してもこのような表現は可能である。それは「外からエネルギーを供給しないで、永久 に仕事をするような、永久機関はつくれない」という表現である。このような機関は、エ ネルギー保存則にしたがわないからである。第2法則は、 「第2法則を破るような機関をつ くって運転することはできない」ということを意味している。前者の永久機関を第1種永 久機関、第2法則を破るような機関を第2種の永久機関と呼ぶこともある。 問題:「自分自身を、他の物体を利用しないで、静かに持ち上げることはできない」、とい う法則は、人間に言及しない表現としては、どんな法則に対応しているか? 第2法則が人間の営みを例として挙げた法則であれば、そうした人間の営みに触れず、 その代わりにエントロピーを使った表現においても、人間の営みに関る何かが継承されて いるはずである。しかもそれはエントロピーという概念に関係しているはずである。それ は何であろうか。エントロピーの定義を見るとこの疑問に対する答えが見えてくる。熱力 学の歴史から言うと最初にエントロピーという概念を導入したのはクラウジウスであるが、 それは次の最初の式、今日クラウジウスの不等式と呼ばれている式であった。 1.クラウジウス Clausius:彼は熱源 T1 , T2 , T3 , ... 、機関本体の作業物質への熱の出入りが Q1 , Q2 , Q3 ,... であるように運転されていている場合を考察し、以下の式が成り立つことを見 出した。そしてこの式の左辺の量をエントロピー(変化の量)と呼んだ。 Q1 Q2 Q3 + + + ... T1 T2 T3 ≤ 0 , ( 等号は可逆過程のみ) ただし、ここで熱量の符号は作業物質に移動する場合を正と約束している。 2.より洗練されたエントロピーの定義: S ( A ) = ∫ A O dQ T 、ただし積分は可逆過程に とる。 S (B ) − S ( A) ≥ ∫ B A dQ 、 熱力学の第2法則 T 第2の式はより洗練されている。これは最初の不等式を無限に沢山の過程に分解したこと に相当する。第2の定義の積分には但し書きがある。それは、 「積分は可逆過程を辿ること」 という、但し書きである。これは明らかに行為を規定する但し書きであり、熱機関を運転 する時の注意を継承した条件と見ることができる。そのような注意を守らない一般の場合 16 はどうなるか。その答えが最初のクラウジウスの不等式である。 それでは可逆過程とは如何なる過程であるか。それは、 「ある熱力学的な状態 A にある系 を異なる状態 B に移行させる時、その間に起きるすべての変化を反対向きにしながら、逆 に B から出発して A に戻れる時、最初の A から B にいたる過程を可逆過程と呼ぶ」、という ことで定義される。クラウジウスは、上記1の不等式を導いた熱機関が可逆的な運転が可 能な場合は、不等式が等式になることを見出した。これは経験則である。そうした可逆的 な運転の具体的な方法というのが、カルノーによって見出されたカルノー・サイクルにほ かならない。カルノー・サイクルは、カルノーの考えた2つの熱源をもつ熱機関(カルノ ー・エンジン)の運転方法である。この方法はより多くの熱源をもつ熱機関に容易に拡張 できる。それゆえ、エントロピーの定義における積分を可逆過程にとるということは、多 数の熱源をもつ熱機関をカルノーのやり方で運転するということに他ならない。エントロ ピーを定義する積分式にはこのような物理的、あるいは工学的な操作が対応しているので ある。 以上のことは、第2法則の理解には、カルノー・サイクルとエントロピーの説明と理解 が必要不可欠であることを物語っている。すなわち、熱力学の法則の説明には、エントロ ピーを定義する線積分とある熱機関とその運転方法という2つの、しかも互いに深く関係 している概念がどうしてもでてくるのである。 もちろんエントロピーも力学にはなかった概念である。熱力学ででてくる力学にはない3 つの基本概念、温度、熱量、エントロピーは、微分の形式 d S = d Q /T で結びついている。この関係は熱力学の法則の核心であり、加速度、力、質量を結びつけ るニュートン力学の第2法則を想起させる。この式のもつ数学的な意味にも注意しなけれ ばならない。後にでてくるが、熱量の微分 d Q は、全微分の条件を満たしていない。そ れゆえ d ' Q と書くこともある。しかし、それを温度で割った d Q / T は全微分である。 そしてこれが全微分なら、それに対応した関数 S が存在し、それは上記のエントロピーに 関する不等式で表現された関係を満たすのである。 温度、熱量、エントロピーに圧力と体積を加えると、初等的な熱力学の基本的な変数の すべが揃う。すなわち、熱力学の対象となるような系の巨視的な状態やその変化は、こう した変数の値を手掛かりにしらべていける、というのが熱力学の立場である。もちろん対 象とする物体によっては、系の状態を記述する巨視的な変数はこの他にもいろいろ考えら れる。例えば磁場の中におかれた物質の磁化する割合である磁化率はそのような例である。 次に、カルノーが考察した仮想的な熱機関を説明しておく。 17 カルノー・エンジンとカルノー・サイクル 熱力学の創始者カルノー(Sadi Carnot, 1796-1832)は効率のよい熱機関をつくるため の基本アイデアとして、現実を理想化した可逆的に運転できる機関と過程とを考えた。そ のためにこの熱機関における熱の移動は、2つの(部分)系の間に温度差がない場合に限 った。カルノーの熱機関は、高温 TH の熱源とそれより低温 TL の熱源、作業物質(普通気体) を含む熱機関の本体、それが仕事をする物体から構成されているとする。この機関を次の ような4つの過程を辿って運転する。運転は全過程で可逆的(準静的)である。 (1)機関の本体を高熱源に接触させ、この温度を保って(等温的に)作業物質を膨張させる。 この間に熱 QH が熱源から機関本体に移動する。 (2)機関本体を高熱源から離し、断熱的に低い温度 TL になるまで、さらに膨張させる。 (3)機関の本体を断熱装置から離して、低熱源に接触させ、この温度を保って(等温的に) 作業物質を収縮させる。この間に熱 QL が機関本体から熱源に移動する。 (4)機関本体を低熱源から離し、断熱的に高い温度 TH まで、さらに収縮させる。 この4過程は最初に戻るから、サイクルとなり、連続して運転することができる。この サイクル過程をカルノー・サイクルという。カルノー・サイクルの要点は、「熱の移動は必 ず温度差のない場合に限る」というやり方である。温度差があると可逆的ななくなるから である。 問題。作業物質として完全(理想)気体を使った場合のカルノー・サイクルを V-p 平面、 T-S 平面の閉曲線として図示せよ。 熱機関の効率 熱機関の効率 η を一般的な蒸気機関のそれと同じように定義する。この時、 η= W Q − QL TH − TL = H = QH QH TH = 1− TL Q Q'L =1 − L ≥ 1 − ' TH QH QH が成り立つ。ここで、上記の W = QH − QL は第1法則をもちいている。また、熱から温度 による表現への変換には、第2法則の結果である、次の等式 18 QL TL = QH TH による。ここで 等号が成り立つのはカルノー・サイクルの場合である。カルノー・サイクルは2つの温度 の異なる熱源をもち、可逆的に運転される熱機関であり、最も効率の高いものである。以 下、この式の意味することを説明しよう。 カルノー・サイクルの場合、全体系での熱の増減はないので、高熱源系熱放出に伴うエ ントロピーの減少と、低熱源における熱吸収によるエントロピーの増大が打ち消しあって、 全体としてのエントロピーの増減はない。したがって、 QH QL Q T = , または、 H = H TH TL QL TL が成り立つ。したがって、カルノー・サイクルでは、 η= W T −T T Q = H L = 1 − L = 1− L QH TH TH QH となる。同じように運転されるが、可逆過程で運転されない機関の場合、熱の放出、吸収 に‘をつければ、その効率は、カルノー・サイクルのそれより悪くなる。 η' = W Q'L = 1 − ' ≤ η (カルノー・サイクルの効率) QH QH ただし、ここで Q'L Q T ≥ L = L ' Q H QH TH が証明なく使われている。不等号の右辺は可逆過程の場合である。 上記の不等式は、「温度が定められた2つの熱源によって可逆的に働く熱機関の効率は、 2つの熱源の温度だけで決まり、 η= TH − TL T = 1− L TH TH となる。この効率を越える熱機関はない」、ことを意味する。したがって、カルノー・サイ 19 クルの効率が最も高い。これをカルノーの原理(定理)と呼ぶ。上記では、この原理を導 くために、「孤立系のエントロピーは増大する」という表現の第2法則が使われている。 また、 Q'L Q T ≥ L= L ' Q H QH TH から、 Q ' L TL Q'H Q'L ≥ , すなわち、 − ≤0 Q ' H TH T' H TL ' ここで、 Q L は、機関本体が外部に放出する熱であるから、これを本体への負の流入の形、 (−Q ' L ) と書けば、 Q ' H ( −Q ' L ) + ≤0 T' H TL となる。もちろん等号が成り立つのは、可逆過程の場合である。この式は、クラウジウス の方程式(不等式)と呼ばれる Q1 Q2 Q3 + + + ... ≤ 0 T1 T2 T3 の特別な場合になっている。ここでも、等号が成り立つのは、可逆過程の場合である。こ の和を循環過程でとり、熱源の数を無限にしていくと、和は閉曲線の沿った積分となる。 例題。0 度 C と、100 度 C にある2つの熱源を利用した熱機関の最大効率を求めよ。温度を 絶対温度に変換すると、 η max = 100 / 373 = 0.27 となる。 温度と熱の関係 カルノー・サイクルでは、熱源の2つの温度と、熱の出入りに関して、 QH QL Q T = , または、 H = H TH TL QL TL 20 が成り立つ。この式は、可逆過程においては、温度と熱のうち、一方の変化を知れば他方 の変化を類推できることを示唆している。温度と熱はこうした双子のような深い関係にあ る。熱力学では、こうした温度を実際に定義できる(第0法則)ことを、また、 「絶対零度 においてエントロピーはゼロになる」となること(第3法則)を教えている。これも経験 則である。ただし実際には、有限回の変化(過程)を踏んで、物質の温度を絶対零度にも っていくことはできない。すなわち、全体零度とは、現実には実現できず、単に極限をと った 仮想の状態である。また第3法則は、物質が原子からできているという仮定か ら導かれるが、後者が認められるようになったのは、20 世紀に入ってのことである(アト キンス、p.15)。 4.4 熱力学エントロピーのさらなる理解 熱力学の法則のエッセンスを述べたところで、エントロピーについて、もう少し詳しく みてみよう。そのためには、基礎となる数学を紹介し、次にエントロピーの概念を最初に 導入したクラウジウスの論法とその後の洗練された定式化に話を発展させる。これは熱力 学をエントロピーの立場から見直す作業とも言える。エントロピーを実際に計算してみる 力をつけるようにすることが最終的な目標である。 熱力学のための数学:完全微分 微分形式の性質:2 変数の微分形式 X ( x, y )dx + Y ( x, y )dy において、 ∂X ∂Y = ∂x ∂y が成り立つ時、この形式は完全微分 Exact differential 形式であるという。この等式は、 オイラーEuler の積分可能条件と呼ばれる。この場合、ある関数 f ( x, y ) が存在して、 df = X ( x, y )dx + Y ( x, y )dy = ∂f ∂f dx + dy ∂x ∂y となる。ここで、 df = 0 であれば、この微分方程式は全微分方程式 Total differential equation と呼ばれ、積分 可能である。この場合、 x − y 平面における任意の閉曲線に沿った積分はゼロになる。 ∫ df =0 一般に、2変数に関するある微分形式が与えられた場合、各々の係数である関数に関す る編微係数が等しいことと、 f のような(与えられた微分形式が、その完全微分となるよ 21 うな)関数が存在することと、この関数の経路に沿った積分がゼロになることとは、同値 である。閉経路に沿った積分がゼロになることとは、ある関数の始点A、終点Bの線積分 の値が、経路に依存しないことを意味する。 この定理は3変数の場合に拡張できる。3 変数の微分形式 X ( x, y, z )dx + Y ( x, y, z )dy + Z ( x, y, z )dz がある関数 f ( x, y, z ) の完全微分であれば、3 次元に拡張された偏微分係数(偏微係数)の 関係、 ∂X ∂Y , = ∂y ∂x ∂Y ∂Z = , ∂z ∂y ∂Z ∂X = ∂x ∂z が満たされる。 f = ( X , Y , Z ) とすれば、この条件は、ベクトル解析記法を用いて、 curl f ≡ ∇ × f = 0 と書ける。さらに、2変数の場合と同じく、3 次元空間の閉曲線に沿った積分もゼロになる。 なお、積分因子が存在する条件は、ベクトルである f が、自身の curl と直交すること、 f・curl f = 0 である。(Sommerfeld, p.2) 3 次元空間のベクトル(関数)に拡張されたこの定理は、Potential(関数)の存在とそ の性質に関係している。ポテンシャルも位置だけで決まる関数であり、積分経路は問題に ならない。微分形式に関するこの議論は、例えば、和達三樹、物理のための数学、岩波書 店、1988 年, Courant & John II, p.623 を参照のこと。 上記の議論は、より一般的な n 個の変数の微分形式、Pfaff 形式 Pfaffian に拡張できる。 こうした立場から熱力学を公理的に構成しようとしたのが、C. Carathéodory である。この 場合、上で述べたように、微分形式が完全微分であり、ゼロに等しければ、 df = 0 から積 分が求まる。微分形式が完全微分でない場合でも、ある関数を乗じて完全微分とすること ができることがある。この関数を積分因子と呼ぶが、このような関数が一般的に求められ るという保証はない。熱力学に出てくる量 dq (熱量)は全微分ではない。しかし、これを 温度Tで割った(つまり、1/T を乗じた) dq / T ≡ dS は全微分となり、 S の閉経路に沿っ た積分はゼロになる。すなわち、温度は積分因子に関係している。ただし、エントロピー の定義においては、この積分の経路をたどる過程が可逆的でなければならないという条件 がついている。 熱力学の変数のうち、全微分となる関数は、状態量 property と呼ばれる。内部エネルギ ーは状態量であるが、熱も仕事も状態量ではない。状態量は、状態をあらわす変数である、 温度、圧力、体積などと同じく、熱力学的な状態を記述する「変数」ではあるが、すべて の変数が必ずしも「状態量」ではない。 22 問題。次の微分形式は積分可能か? 2 y 3dx + 3xy 2 dy Clausius による熱力学の entropy 熱力学は、微視的な対象を多数含む巨視的な系の全体の状態を問題にする。例えば、同 種の分子が多数集まった気体の状態は、気体の容器の体積、容器の壁面への圧力、温度な どで特徴づけられる。それらの変数がある値をとったのが、巨視的な(熱力学的な)ある 状態である。いま、2つの状態 A と B があった時、A の状態から B の状態への変化を考える。 この時、B から A への変化が、仕事や熱の受け渡しに関して逆の関係にできる時、この変化 は可逆的(reversible transformation)であるという。Carnot cycle は、可逆的な変化で 熱機関が運転される例である。 これらの概念をもちいて状態 A の entropy が、 S (A) = ∫ A O dQ T と定義される。ただし、上記の積分は O から A への可逆的変換にそってなされなければな らない。また、状態 O は、任意の基準状態であり、通常絶対零度が採用される。 上記の式を天下り式に与えたが、その理由を説明する。すでに強調したように、熱力学 の第2法則はさまざまに表現される。そこでエントロピーを用いない表現から出発すれば、 エントロピーを定義する上記の式は、第2法則から導くべき対象になる。われわれは、む しろエントロピー概念によって第2法則を表現する。したがって、そのための仮定は、 熱の増分 dQ は全微分でないが、それに積分因子 1 / T を乗じた分 dQ / T は全微分である。 という仮定である。そうであればある関数 S が存在して、 dS = dQ / T は全微分となり、そ の閉曲線にそった積分はゼロになる。 ∫ dQ T = 0 ただし、物理学的な要請として、その時の線積分は物理的には可逆過程となるものに限定 する。ここまでは、エントロピーという関数が確かに存在するという主張である。 次に、状態 A から状態 B への変化に伴う entropy 変化量は、一般に 23 S (B ) − S ( A) ≥ ∫ B A dQ T となる。ここで等号は可逆過程に限る、という命題を天下り式に与える。これを第2法則 の後半の部分とする。 孤立系を考えてみると、右辺の積分の中の熱の出入りの項は、孤立系が熱の出入りはな いことから、すべてゼロであるから、右辺はゼロになる。したがって、 S ( B ) − S ( A ) ≥ 0 , または、 S (B ) ≥ S ( A) すなわち、「孤立系の変化において、エントロピーは常に増大する、変化のないのは、可逆 過程だけである」、ことが導ける。 同じことであるが、このことは「孤立系における変化は、entropy の増大の方向に向いて いる。それ以上変化のない状態は、熱平衡状態だけである」、「孤立系のエントロピーは熱 平衡状態にある時、最大である」などと表現される。 また、「孤立系が entropy が最大の状態にあるとすれば、他のいかなる状態へも遷移しな い。なぜなら、そうした変化は entropy の増大をもたらすからである。したがって孤立系 に関しては、entropy が最大の状態が最も安定な状態となる」、などとも表現できる。 また、始めの状態と終状態が同じの場合、ある状態 A から同じ状態 A に戻るサイクルに 関して、 ∫ dQ T ≤ 0 が成り立つ。ここで等号が成り立つのは可逆的なサイクルに限る。これはクラウジウスの 不等式に他ならない。 熱力学の第2法則を以上のように表現すると、最初に述べた、クラウジウスやケルヴィ ンの命題、 「その過程の最後の結果が、ある温度にある物体から熱を取り出し、それより高い温度に ある物体に受け渡すだけであるような過程は不可能である(Clausius)」、 「最終結果が、同じ温度に保たれている熱源から仕事をさせられる熱(work heat)を取り 24 出して、それをすべて仕事に変換するだけで、それ以外の変化は起こさないような過程は 不可能である(Lord Kelvin)」、 は、エントロピーを基礎とした第2法則の表現(命題)から導かれる。この議論には、カ ルノー・エンジンとカルノー・サイクルが登場する。これらの命題は、効率的な熱機関を つくるための原理を与えるものである。熱力学の第2法則は、そこにある大きな制限があ ることを示している。それは、あらゆる熱機関の効率は可逆的に運転されているカルノー・ エンジンのそれを越えられないという命題、 η max = TH − TL T = 1− L TH TH である。 再び温度について 我々のいささか公理的(天下り的)な第2法則からすれば、温度は、熱についての微分 形式を全微分にするための積分因子の逆数ということになる。また、理想の熱機関では、 QL TL = QH TH が成り立つから、熱量の出入りを計測できれば、温度の比例関係をつかむことができる。 絶対温度のゼロ点に関しては、エントロピーを定義する積分式がヒントを与えてくれる。 この(線)積分は、基準となる状態0から任意の状態 A までになるが、出発点となる基準状 態のとり方は任意である。また、不定積分にも任意性がある。そこで、温度がゼロの状態 は、エントロピーをゼロと定めることができる。この温度が絶対温度である。絶対温度の 概念を最初に導入したのは、ケルヴィン(トムソン)であるが、 熱力学の第3法則:絶対零度におけるすべての系の entropy は常にゼロにとれる(Nernst’s theorem)。 を主張したのは、ネルストであった。面白いことにネルスト自身は、エントロピーという 言葉が嫌いだったという。 熱力学的な Entropy の実際の計算 25 我々は上記で、全微分でない dQ に積分因子 1 / T を乗じた、 dQ / T を dS と置くことで、 熱力学的な状態量であるエントロピーを導入した。エントロピーの存在はこれによって与 えられたが、実際にそれを求める手段は、可逆的な過程に沿った積分を実行する必要があ る。 すなわち、ある系が温度 T という状態にある時の entropy は、一般的な熱容量 heat capacity、C(T)を用いて、 S (T ) = ∫ T 0 dQ T T = ∫ 0 C (T ) dT T で求めることができる。 ここで熱量がわからないと、積分はできないが、この定義から熱容量の性質で簡単に導 けることがある。すなわち、上記の積分式において、T→0の時には、エントロピーSも0 になる。それゆえ、C(T)→0とならなければならない。 熱容量は、体積か、圧力かのいずれかを一定して計られている。したがって、実際の計 算で使われるのは、 CV = ( dQ ∂U )V = ( )V , ∂T ∂T Cp = ( dQ ∂U ∂V )p = ( ) p + p( ) p ∂T ∂T ∂T あるいは、 である。ここで、 CV は、体積一定の下での熱容量(定積熱容量)と呼ばれる量であり、 C p は、圧力一定の下での熱容量(定積熱容量)と呼ばれる量である。上記の C p を導く時には、 エネルギー保存則を拡張した、(エネルギー+熱)の保存則、 U = TS − pV , du = Tds − pdv, ( v, s ) をもちいた。この式は、いずれの過程を辿る変化でも成立するため、計算においてよく使 われる。 熱容量に関して手掛かりが掴めたとして、さらに、実際に積分する時は、どの状態変数 を独立にするか、すなわち、どのような空間の曲線に沿って線積分するかを決めなければ ならない。それに応じて、どのような熱容量が使えるかをしらべてみる必要がある。例え ば、独立変数を T, V の2つとすれば、いわゆる T-V 図が描ける空間内の曲線に沿って積分 することになる。実際の積分はそれぞれの変数ごとにまとめて実行する。 26 例をあげよう。まず、状態量を表現する状態変数のうち、V と T を独立とする。そうする と、 dU = ( ∂U ∂U )V dT + ( )T dV ∂V ∂T これにより、 dS = 1 ∂U 1 ∂U ( )V dT + p + ( )T dV T ∂T T ∂V ここで、定積熱容量を使うと、 ( ∂U )V = CV (T ) ∂T だから、 dS = 1 1 ∂U C V dT + p + ( )T dV T T ∂V となる。 完全気体のエントロピー 以上は一般的に成り立つが、これを N 個の分子からなる完全気体に適用してみる。完全 気体 Perfect Gas(理想気体 Ideal Gas)、については、 pV = NkT = nRT が成り立つ。ただし k は、ボルツマン定数、 n は気体のモル数である。また、完全気体のエ ネルギーは体積に依存しない。すなわち、 U = U (T ) である。したがって、この場合には、 上のエントロピー微分の最後の項は、ゼロになる。したがって、積分すれば、 T S (T ,V , N ) = ∫ Cv (T ' ) dT ' + Nk log V + C ' T' となる。ここで、 C ' は積分の定数である。一般に CV (T ) はもちろん温度に依存するが、 かなり広い温度で一定( CV )とみなすことができる。この領域においては、上の式の積分 を簡単におこなえ、次の結果をうる。 S (T ,V , N ) = CV log T + Nk logV + C ' 演習問題として、いろいろな計算を試みる。 27 4.5 状態方程式と熱力学ポテンシャル 気体の方程式 理想気体の状態方程式:構成要素である粒子が希薄であり、互いの相互作用が無視でき るとする(理想)気体の圧力 P、体積 V, 温度 T の間には、 PV = nRT = NkT の関係がある。これを状態方程式と呼ぶ。ただし、 k はボルツマン定数 ( k = R / A, R = 気体定数, A = アボガドロ数 ), n=モル数、N =分子数 A. Avogadoro’s number, 6.022 x 1023 R, Gas constant, 8.314 x 107 erg/mol・egrees = 1.986 cal/mol・degrees h, Planck’s constant, 6.55 x 10-27 cm.2.gm.sec-1 k, Boltzmann constant, R/A, 1.38x10-16 erg/degree ファン・デル・ワールス van der Waals の状態方程式。理想気体ではない気体のうち、最 も簡単な状態方程式をもつ気体として知られている。 (P + a ) = ( v − b) RT , v = V / n(1モル当たりの体積) v2 これは実際の気体の状態を記述する近似式として使われる。定数 a,b はさまざまな実際の気 体の測定値から決められている。 気体のエネルギー N 個の粒子(分子)からなる理想気体がある。分子の速度の絶対値(速さ)の平均をv、 質量をmとする。 全エネルギーは, E = N mv / 2 である。 2 圧力は、 P = (1 / 6) ( N / V ) × 2mv × v = (1 / 3)( N / V )mv = ( 2 / 3) E / V 2 ゆえに、 E = 2 2 NkT ; 1モル( A = N)では、E = RT 3 3 理想気体のエネルギーは体積に依存せず、温度のみの関数となる。 熱力学における変数変換と熱力学ポテンシャル 熱力学の変数のうち、全微分となる関数は、状態量 property と呼ばれる。内部エネルギ ーは状態量であるが、熱も仕事も状態量ではない。温度、圧力?、体積は状態量である。 しかし熱力学的な状態を記述する「変数」が、必ずしも「状態量」ではない。 28 示量性変数と示強性変数:熱力学系の巨視的な状態を表す変数である状態変数 state variable には、物質の量や大きさに比例する示量性 extensive 変数と、物質の量や大きさ に依存しない示強性 intensive 変数の 2 種類がある。 示量性変数:質量、体積、エネルギー、エントロピーなど 示強性変数:温度、圧力、密度など 熱力学ポテンシャル 一般に関数を記述しようとすると、独立変数と従属変数とを区別する。熱力学の第1法則 を記述する熱量、内部エネルギー、仕事という3つの量のうち、状態量は、内部エネルギ ー、U だけである。第2法則によって、状態量であるエントロピー、S が定義された。これ と気体の状態の記述で使った変数、体積 V と圧力 P を加えると、 U;P, V, T, S が現れた。従属変数 U の記述には、残りの変数のうち2つを独立変数として選ぶことがで きるが、その選び方には任意性がある。(U はしばしば E とも書かれる。) 熱力学では、熱力学ポテンシャルと呼ばれる、さまざまな関数が定義されている。これ らの関数の微分形式は、完全微分になっている。次によく使われる熱力学ポテンシャルを 紹介しておく。最後は、微分形式をつくるのに選択した独立変数の組である。 エネルギーEnergy エンタルピーEnthalpy 自由エネルギーFree energy ギブスエネルギーGibbs energy U = TS − PV , dU = TdS − PdV , (V , S ) H = U + PV , dH = TdS + VdP, ( P, S ) F = U − TS , dF = − SdT − PdV , (V , T ) G = H − TS , dG = − SdT + VdP, ( P, T ) 上記の自由エネルギーは、ヘルムホルツ Helmholts の自由エネルギーともいう。同じく、 ギブス Gibbs エネルギーは、ギブス自由エネルギー、自由エンタルピーとも呼ばれる。多 成分からなる系では、それぞれの系の組成(分子の数)の変化が問題になる。ある系を定 温定圧に保ってある成分を微少量加えた時のギブス自由エネルギーの増分を化学ポテンシ ャル Chemical Potential と呼ぶ。これはその成分1モルのギブス自由エネルギーに等しい。 ルジャンドル変換 Legendre Transformation これらの関数は、独立変数が異なっている。ある関数(例えば上の第1式の u)の全微分形 式にあらわれる2つの独立変数のうちの1つ(例えばs)を、それと共役(対)となって いるもうひとつの変数(例えば T)に変換したい場合、従属変数(例えば u)から、共役関 係にある2変数の積(例では TS)を引かねばならない(例では F)。この変換規則をルジャ 29 ンドル変換という。この際2つの変数の積の微分をとる時は、 d ( xy ) = xdy + ydx であることに気をつける。 注:物理学では、独立変数と従属変数を交換するあらゆる変換をルジャンドル変換とい う。いま f を x の関数とすれば、微分は、 d f = X 1 dx1 + ..., X1 = ∂f ∂x1 の形になる。そこで、新しい関数 g を g = f − X 1 x1 を で定義すれば、その微分は、 dg = − x1 dX 1 + ... となり、 X 1 を独立変数にできる。 V F E (U) T S G H P 熱力学ポテンシャルの微分形式を書き下すための図。 熱力学ポテンシャル、E(U),F,G,H は反時計周りに配置されている。その斜めの両端は、 独立変数である。それらの微少量と対となる変数は縦と横の軸を辿った先であり、矢印の 先にあれば+、後ろにあればーをつける。 これらの熱力学ポテンシャルを用いると、次のような表現ができる。 ・孤立系では、熱平衡にある時、エントロピーが最大になる。 30 ・温度と圧力が一定の系では、熱平衡にある時は、自由エネルギーが最低になる。 ・温度が一定の系が外界になしうる最大の仕事は、自由エネルギーの減少量を越えない。 ・温度と圧力が一定の系では、系が外界になしうる仕事は、G の減少量を越えられない。 ・エンタルピー変化は、化学反応における反応物のモル数に依存する。 つまり、問題を解く際、見通しを立て易くなる。 問題 1.微分と偏微係数の関係を利用して、T , S , V , p などの状態量を熱力学のポテンシャルの 偏微分として表せ。この時、偏微分の時に固定される変数を露に書け。例えば、 T =( ∂U )V . ∂S 2. 熱力学ポテンシャルの微分形式が全微分であることから、導かれる偏微係数の間に成り 立つ関係を列挙せよ。例えば、 ( ∂T ∂p ) S = − ( )V . ∂S ∂V これらの関係式はマックスウエル Maxwell の関係式と言われる。 3. 内部エネルギーU に関する全微分と、自由エネルギーに関する偏微係数の間に成り立つ 関係から、熱力学的状態方程式、 ( (ヒント) ∂U ∂S ∂p )T = T ( )T − p = T ( )V − p ∂V ∂V ∂T du = Tds − pdv 、および ( ∂S ∂p )T = ( )V ∂V ∂T 4.同じくエンタルピーを使って熱力学的状態方程式、 ( ∂H ∂S ∂V )T = V + T ( )T = V − T ( ) P ∂T ∂P ∂P を導け。 (ヒント) d H = T dS + V dP を使え。 5. 熱力学的状態方程式を1モルのファン・デル・ワールス気体に適用すれば、 ( ∂P R )V = ∂T v −b ( RT ∂U a )T = − P = 2 >0 v −b ∂V v を得る。等温膨張によって内部エネルギーは増大する。これは分子間力に逆らって膨張さ せる仕事が、内部エネルギーとして蓄えられることを表している(菅、p.77) 31 4.6 熱力学から統計力学へ 熱力学の対象となる物理系は、膨大な数の小さな物体から構成されている。小さな物体 の正体は原子や分子であるが、熱力学が体系づけられた 19 世紀においては、その実態は今 日ほど明らかだったわけではない。ただ、どのくらいの数の小さな物体を相手にしている かということは、見当がついていた。つまり、アボガドロ数(約 6x1023)に相当する数の小 さな球(粒子)でイメージされるような小物体が含まれるということは想像していたと思 われる。 もちろん、こうした膨大な数の粒子の状態を正確に知ることはできない。そこで熱力学 は、こうした膨大な数の個々の状態を問題にすることなく、それらが全体として、外から 見て、安定した、変化が起きていないように見える状態に落ち着いている時(平衡状態) に測定を行い、それらの測定値の間の関係をしらべて状態方程式を書き、また、法則を発 見し、これらの法則が多くの実験を通じて正しいことを経験してきた。状態方程式は、変 数あるいは状態量をもちいて、 f ( P, V , T , , ...) = 0. とういうように書ける。しかし、状態方程式は複数ある。一体どれだけの状態方程式を書 き下ろすことができたら系を本当に理解したといえるのだろうか。この疑問に答えてくれ るのが、統計力学である。それは次のような意味においてである。 いま、平衡状態にある多粒子(たいていはN個と記す)が、離散的なエネルギー値、 E1 , E2 , E3 , ..., Ei , ... をとるとする。ある状態における系は、上記のいずれかのエネルギー値をとるものとすれ ば、これを確率事象とみなすことができる。実際に各エネルギー値がどのようになるかは、 古典的な力学や量子力学で求めることになる。このことができたとすると、統計力学の基 本的な課題は系がエネルギー Ei をとる確率 P ( Ei ) を求めることにある。系のエネルギーを 求めることが常に可能ではないように、この確率を求めることもいつもできるという保証 はない。しかし、それが可能である場合のあることを示したのが、ボルツマンである。す なわち、彼はある条件の下なら、系がエネルギー Ei をとる確率 P ( Ei ) が、 e − Ei / kT P ( Ei ) = , Z ただし、Z = ∑ e − Ei / kT i で与えられることを示した。ここで k、Tはそれぞれ、ボルツマン定数と温度である。 もちろん、確率であることから、 ∑ P( E ) = 1 i i である。このような確率分布をボルツマン分布と呼び、こうした分布にしたがう系を Canonical 集合(あるいは Gibbs ensemble)と呼ぶ。 32 このZを状態和あるいは分配関数と呼ぶが、重要なことは、仮にZが求まっているとす れば、Zからさまざまな熱力学量を求めることができることである。定義によってZは温 度の関数であるが、 β = 1 / kT によって新しいパラメーターを導入すれば、分配関数は β を変数として、 Z ( β ) = ∑ e − βEi i と表せる。これをもちいれば、 Z = e − Fβ , すなわち、F = − 1 β log Z と分配関数と熱力学関数の一つである自由エネルギーが関係づけられる。他の熱力学関数 についても同様である。カノニカル集団におけるエントロピーを、 S = − k ∑ P( Ei ) log P( Ei ) によって定義することもあるが、この定義は、分配関数から導いた熱力学関数としてのエ ントロピーと同じになる。後者は、当然、熱力学関数の定義式、 F = E − ST を満足する。 さらにボルツマン分布は、上で定義したエントロピーを最大にする分布であることも容 易に証明できる。ゆえに、ボルツマン分布にしたがう巨視的な系を知ろうとするなら、状 態和あるいは分布関数を求めなければならない。そしてそのためには、まず系の可能なエ ネルギー値を力学あるいは量子力学的な手法で求めておかねばならない。この連係作業に よって、始めて微視的な力学の世界と熱力学的な巨視的な世界の記述方式との間に関係が つけられたことになる。 実は上記のエントロピーの定義式の中の分布確率の平均は、状態が取りうる数 W の対数に等しい。すなわち、 log W = − ∑ P( E ) log P( E ) i i ゆえに、 S = k log W が成り立つ。この関係式はボルツマンの原理と呼ばれる。 ボルツマンのエントロピーの解釈 ボルツマン Boltzmann は、マックスウエルの構築した巨視的な世界と微視的な世界との 結び目をさらに強固にした。彼が提唱したのは、熱力学的なエントロピーSが、微視的な 33 世界の統計量である「状態の数」W と S = k log W という関係にあるということであった。ただし、 k = R / A, R = gas constant, A =Avogadoro number は、ボルツマン定数と呼ばれる。今日この関係は、 ボルツマンの原理 Boltzmann’s Principle と呼ばれている。この式は、彼が眠るウィーンの墓の墓石に刻まれている。彼はさまざま な批判にあって、悩みながら量子力学が登場する直前の 1907 年に自殺した。このことは有 名であるが、実は彼自身はこの形の式を記述したことはなかったという。この式を最初に 使ったのは実は、黒体輻射の研究から量子(h、Plank constant)仮説を提唱したプランク Max Plank であり、それが書かれたのは有名な彼の熱力学の本の初版(1906 年)において である。比例定数kを導入したのも Plank である。Boltzmann は、「エントロピーとある状 態のとる確率とが比例関係にある」ことを指摘したのであるが、この考えをボルツマンの 原理 Boltzmann’s Principle として宣伝したのは、むしろアインシュタイン A. Einstein であった。彼が用いたのは、 W = eS / k という式の方であったという(Sommerfeld, p.213 による)。 クラウジウスのエントロピーとボルツマンのエントロピー 巨視的な系を相手にする熱力学においても。最初は「確率」という概念が表にはでてこ なかった。クラウジウスによって最初に導入されたエントロピーは、熱を温度で割った量 の収支、あるいは完全微分、 d S = d Q / T によって存在が保証された関数として、 積分式で定義されていた。このエントロピーと確率事象の完全な組によって定義された情 報エントロピーとの関連は露には見えてこない。しかし、ボルツマンの原理によって状態 数と関係づけられたエントロピーは、情報エントロピーと基本的に同じ概念であることが 理解できる。歴史的な順序から言えば、情報エントロピーの概念は統計力学と量子力学で 先に導入された。それゆえシャノンも彼の関数にエントロピーの名前を付けたというのが 正しい。シャノンにこの名前を使うように示唆したのは、フォン・ノイマンだった。すで に、密度演算子による量子統計力学の定式化を試みていたノイマンは、この両者に通じて いた。 34 4.7 統計力学の原理の初等的解説 ファイマンはその著、Statistical Mechanics の冒頭で、統計力学の話はボルツマン分布 という頂上に登る話と、それから滑り降りてくる話の2つであると述べている。ボルツマ ン分布を導くには、全粒子の座標と速度からなる相空間 Phase Space に占める系の状態の 数の議論を基礎にすることが多い。ここではもっと簡単な確率的なモデルで、ボルツマン 分布を導くことにする。 状態の数と等確率 統計力学では、平衡状態にある多数の構成要素を含む系の全エネルギーがある値の近傍 にある場合、これらの系は巨視的(熱力学的に)には、同じとみなせると考える。そして そうした実現可能な微視的な状態は、同じ確率で出現すると考える。エネルギーが EとE + dE との間にある微視的な状態数は、 W ( E )dE , あるいは、Ω( E )dE と表される。 ボルツマン分布 Boltzmann Distribution 離散的なエネルギー値 E1 , E2 , E3 , ..., Ei , ... 、をとりうる系が、平衡状態にある時、 Ei にあ る確率は、 P ( Ei ) = e − Ei / kT , Z Z = ∑ e − Ei / kT Zは、分配関数 、 i で与えられる。ただし、 k はボルツマン定数。 k = R / A, R = gas constant, A =Avogadoro number である。 (証明の筋道) ステップ1.この問題を E1 , E2 , E3 , ..., Ei , ... 、という箱に、 n 個の玉を、 E1 に n1 , E2 に n2 , .., Em に nm というように入れる方法の数を求める問題とする。そ れは、 W (n1 , n2 ・・・ , , nm ) = n! n1!n2!⋅⋅⋅ nm! 、 ただし、 n1 + n2 + ... + nm = n で与えられる。ここで、 「物理的に実現される状態は、この数を最大にする組に相当する: という仮定をする。これが熱平衡の条件と仮定するのである。 ステップ2.この問題は、束縛条件、 n1 E1 ,+ n2 E 2 + n3 E3 ..., + nm E m = E , n1 + n2 + ... + nm = n , E は全エネルギー n は全粒子数 の下で、 log W を最大とする (n1 , n2 ・・・ , , nm ) の組を求める変分問題となる。その 35 解は、束縛条件にラグランジュの未定係数法を使うことと、 log W の式にスター リングの公式、 log n ! = n log n − n + 1 1 log ( 2 π n ) + O ( ) ≅ n log n − n , ( n が大きい時) 2 n を使うことで求められる。 ステップ3.最後に、熱力学的な考察などにより、未定係数を同定する。 Boltzmann 分布とボルツマンの原理との関係 上記の状態数の対数 log W は、スターリングの公式をもちいれば、 log W = n log n − ∑ ni log ni i ここで系が状態 i 占める確率を P( Ei ) = ni / n とおくと、 1 log W = − ∑ P( Ei ) log P( Ei ) 。 n i 左辺は定数を除いてボルツマンのエントロピーに、右辺は情報エントロピーとなる。実際 に、 S = − k∑ P( Ei ) log P( Ei ) i によってエントロピーを定義し、上記の場合を考えれば、 k log W = − n k ∑ P( Ei ) log P( Ei ) = n S 。 i ボルツマンの原理 Boltzmann’s principle は、 S = k log W ( S はエントロピー、Wは状態数 ) であるが、上記 n 個の系の総エントロピーであることを考えれば、1つの系のエントロピ ーは、ちょうど情報エントロピーに k を掛けたものとなり、ボルツマンの原理が妥当なこ とがわかる。 また、このエントロピーの定義によれば、ボルツマン分布がエントロピーを最大にする分 布であることも容易に理解できる。 ボルツマン分布の求め方 (未入力) 36 相空間の分割問題 古典統計力学において、分配関数を求まるためには、力学系を記述するための相空間 Phase Space が必要になる。この相空間を小さな領域 Cell に分割して、それぞれの領域に 存在する状態の数を数える必要があるが、どれだけの領域にわけるかについては、手掛か りがなかった。この手掛かりは、後に、量子論のプランク定数によって与えられた。プラ ンクは、黒体輻射の問題に調和振動子モデルを使ったが、同時に量子仮説の源になったプ ランク定数hを導入した。量子仮説は、多数の粒子からなる系のエネルギーが、連続では なく、離散的(飛び飛び)なことを保障する。この保障は、位相空間を小部屋 Cell に分割 して状態数を数えるという操作を可能ならしめるものであり、統計力学の方法論の基盤と f なるものである。すなわち、 f の自由度を有する系の場合、領域の大きさは h となる。プ ランクがこの仮説を提唱したのは、ちょうど世紀の変わる、2000 年であった。 4.8 気体運動における分子の速度分布 熱力学的な粒子の数は膨大であるから、力学の基本である粒子の位置や速度(あるいは 運動量)を測定したり、決定したりすることは諦めなければならない。しかしながら、そ の集団としての振る舞いや、個々の粒子の状態を確率的に表現することはできるかもしれ ない。否、むしろ数が膨大だからこそ、確率的な記述は正確さをまし、「ほとんど確からし く起きる」ことは、確実に起きると言えるだろう。これがボルツマン分布の精神であるが、 彼の発想を刺激したのは、マックスウエル Maxwell の「気体分子の運動論 Kinetic Theory of Gas」の仕事である。彼が考えた気体は、膨大な数の粒子(分子)からなっているが、個々 の粒子は衝突以外の干渉は互いにしていないと仮定できる系である。マックスウエル Maxwell は、電磁気学を体系化した人として著名であるが、気体運動論の先達者でもあった。 そして、このマックスウエルの仕事を畏敬の念をもって注目していたのが、ボルツマンで あった。 マックスウエルは、容器中に閉じ込められながらも、壁や互いに衝突しながらも、自由 に運動している気体分子をモデルとして、それらの分子の速度(ベクトル量)や、それらの 3方向への成分、速度の絶対値である速さなどの、分布を計算した。分布というのは、あ る粒子が、例えば、速さが v と、v+dv の間にある確率である。 この気体を理想気体と想定して、体積 V の容器に入れられており(絶対)温度 T で熱平 衡状態にあるとする。さらに、簡単のためにこれらは、同一の質量m の、古典的な粒子と する。1 個の分子の運動エネルギーは、 1 2 ε = mv 2 = 1 p2 、 2 m 37 であるとする。ただし、ここで速度および運動量v、pはベクトルである。気体が薄く、 他の粒子とポテンシャル・エネルギーが無視できるとすれば、ボルツマン分布のエネルギ ーを運動エネルギーだけとした分配関数が求められる。これより、これもベクトルである 位置rと速度vを変数とした相空間を考える。そうすると、分子の速度の絶対値が、v と v+dv である確率 f (v)d 3v は、 3 1 mv 2 kT m 2 −2 f (v)d v = 4πv ( ) e 2πkT 3 2 dv 、 (体積要素は、 d 3v = 4πv 2 dv ) で与えられる。 1 2kT 2 この分布による最も確からしい早さは ( ) である。また、速度の各成分の分布は、正 m 負対称のガウス分布(正規分布)となり、その平均はもちろんゼロである。しかし速さ(速 度の絶対値)の平均はゼロではない。また、個々の粒子の速さの平均の2乗は、運動エネ ルギーに比例している( e =mv / 2 )から、これに粒子の数を乗ずれば、運動エネルギーが 2 求まることになる。これらの粒子がポテンシャル場の中にいないとすれば、エネルギーは 運動エネルギーだけになり、これは内部エネルギーそのものである。これによって微視的 な世界の量と巨視的な世界の量が結びついたことになる。 マックスウエルの速度分布は、成分が複数ある理想気体にも適用できる。 例題。室温(300 度 K)で平衡状態にある窒素気体の分子の速さはどれだけか。 解:窒素の分子量は 28、これとアボガドロ数から、分子の質量は約 4.6x10-23g.これから、 確からしい速さは、約 420m/sec となる。(Berkeley, 下、p.263) ボルツマン分布とマックスウエル分布との関係 我々のボルツマン分布の求め方は多項式分布によっている。この分布は、nが大きい場 合、ガウス分布に移行することが知られている。粒子の数が多いマックスウエル分布はま さにこのケースである。 Boltzmann の H 定理 ボルツマンはマックスウエルと同じように気体分子の運動を研究したが、彼の関心は分 子同士が衝突する過程にもあった。そうした衝突過程で彼が導入したのが H 関数である。 この関数は、 S = − kH によって S と関係している。S と H とは、定数と符号が違うだけであるが、H 関数の方は無 38 次元であり、この点 k のお陰で、熱量の(したがってエネルギーと同じ)単位を温度で割っ た次元を有する S よりも、情報エントロピーに近い。この H に関して、Boltzmann は H 定理 と呼ぶ関係を導いた。彼は無数の衝突が起きている気体分子系を想定し、ある衝突の前後 の H を計算すると、H が常に減少していくことを示した。そうすると十分時間が立ち、した がって十分の多くの衝突が系の内部で起きると、最早 H 減少できない状態が実現するだろ う。この H 最小となるこの状態は、最大の W をもつ状態でもある。 ここで、孤立系に関する熱力学の帰結を思い起こせば、熱力学的な平衡状態にある、す なわち entropy が最大の状態は、それに対応する微視的な力学的な状態の数が最大の状態 である、ということが、ボルツマンの原理(対応関係)を認めれば導かれることになる。 一般に、ある巨視的な状態に対応する力学的な(微視的な)状態は、いろいろある。それ らの総数 W とし、それを可能な状態の総数で割るとその状態の出現確率がえられる。これ により、熱的な平衡状態は、微視的な状態の出現確率が最も大きいもの、すなわち「最も 確からしく出現する」(巨視的な)状態ということができる。 ボルツマンの発想 Boltzmann の原理、つまりはクラウジウスの熱力学的エントロピーの確率的な解釈によっ て、熱力学のような巨視的な世界を記述する方法と、力学系という微視的な世界を記述す る方法とが、対応づけられたことになる。熱力学の entropy がやはり確率事象と関係して いることがこれで明らかにされた。それにしても彼はどのようにして、この原理に当たる 式を思いついたのだろう。彼が実際に使ったのは一般の熱力学のエントロピーS ではなく、 分子運動論に出てくる H であるから、この疑問は、H が確率的な表現と結びついていること を、どうして気がついたのだろうかということになる。分子運動論において彼は衝突の前 後における変化を計算していると言ったが、この H は H = ∫ f・log f dv という形をしていた。ここで f は、ある粒子の速度が v と v +dv との間にある確率である(も ちろんこれらはベクトル量であるが、議論の本質には関係ない)。この確率は完全気体に関 して、すでにマックスウエルによって求められていた。この意味でボルツマンの仕事はマ ックスウエルの仕事を下敷きにしている。この H が衝突を繰り返していく過程で減少して いくという結果が、容器に閉じ込められた完全気体が、孤立系として内部で微視的な衝突 を繰り返しながら平衡状態に到達していく、エントロピーの増大過程そのものであると、 ボルツマンは類推したのであろう。この類推が統計力学の礎石となるボルツマンの原理を 導いたことになる。 4.9 分配関数と熱力学ポテンシャル 39 ボルツマンの原理からボルツマンの分布へ ボルツマンの原理、 S = k logW は、熱力学という巨視的な世界の状態量を微視的な世界のできごとの確率に対応する「状 態の数」とを結びつける。ここで W を知るためには、巨視的、熱力学的なある一つの状態 に対応する複数の微視的、力学的な状態の数を知る必要がある。例えば、互いに運動によ って影響を及ぼしあっている N 個の同一粒子からなる系が、全体として熱的なある状態と は、それらの粒子全体のエネルギーがある値をとっている場合となる。この場合、個々の 粒子がどのような状態にあるかを考えると、同一の全体エネルギーを与えるような個々の 粒子の状態の数は複数あると考えられる。この数が Bolzmann の考えた状態の数 W である。 実際に W を求めるためには、こうした微視的な状態の数の数え方を知らなければならない。 それでは、この状態の数は実際にどのように求められるのか、そして微視的な世界の確率 (分布)はどのような構造をしているのか、ということが問題になる。この問題は、まさ に統計力学の課題に他ならない。以下では、この問題に取り組んでみる。まず、よく出て くる記号や数を復習しておく。 状態数 Number of States、W 分布 Distribution, 分布関数 Distribution Function, 状態和/分配関数 Zustanssumme/Partion Function, Z 相空間 Phase Space Boltzmann constant, k = R/A Avogadoro’s number; A, または N A 、6.03 x 1023 気体定数 Gas constant; R, 8.314 x 107 erg/degrees = 1.986 cal/degrees Planck’s constant, h, 6.55 x 10-27 cm.2.gm.sec-1 また、組み合わせ問題における場合の数の計算方法、指数関数と対数関数、それら(の 合成関数)の微分や積分がよくでてくるので、これらに関する数学的な基本操作も思い起 こしておこう。 ボルツマン分布 Boltzmann Distribution 平衡状態にある多粒子(たいていはN個からなる)が、離散的なエネルギー値、 E1 , E2 , E3 , ..., Ei , ... をとるとする。ある状態における系は、上記のいずれかのエネルギー値をとるから、これ を確率事象とみなすことができる。この時、系がエネルギー Ei をとる確率 P ( Ei ) が、 40 e − Ei / kT P( Ei ) = , Z Z = ∑ e − Ei / kT i で与えられる場合、この系のエネルギー値に関する分布をボルツマン分布という。ここで、 k、Tはそれぞれ、ボルツマン定数と温度である。 ここで、もちろん、 ∑ P( E ) = 1 i i が満足されているとする。このZを状態和あるいは分配関数と呼ぶ。 仮にZが求まっているとすれば、Zからさまざまな物理量を求めることができる。定義 によってZは温度の関数であるが、 β = 1 / kT によって新しいパラメーターを導入すれば、分配関数は β の関数として、 Z ( β ) = ∑ e − βEi i と表せる。 ボルツマン分布の定義より、ある有限の温度では、エネルギーが低いほど、その状態に 系がいる確率は高くなる。また、温度が高い( T → ∞ )と、どのエネルギー値をとる確率 も等しくなる。 分配関数が求まると、他の熱力学的な量も求めることができる。しかし、ここでは、 S = − ∑ P( Ei ) log P( Ei ) によってエントロピーを、 Z = e − Fβ , すなわち、F = − 1 β log Z によって、自由エネルギーを定義する。 これらの定義が、巨視的な世界の法則である熱力学の式に矛盾しないことは、 例えば、 41 F = E − ST 確かめることができる。ただし、ここでEとしては、確率 P ( Ei ) によるエネルギーの平均値 E = ∑ P( Ei ) Ei = i 1 ∑ Eie− Ei / kT Z i をとる。 (証明略) ボルツマンの原理は、我々が微視的な粒子系が取りうるエネルギーさえ求めれば、後は、 微視的な状態数を考慮した確率分布(Boltzmann)、あるいは状態和・分配関数の助けをか りで、平衡状態の温度に対応する、平均、エントロピー、自由エネルギーなどを計算する ことを可能にする。そこで次の問題は、さまざまな系で実際に多粒子系のエネルギーを求 めることである。 ここで重要なボルツマン分布の性質を述べておこう。それは、「ボルツマン分布は、ボル ツマンの原理の式の log W を(したがって当然 W を)最大にするような分布であるという ことである。このことは、「巨視的な孤立系が熱的な平衡状態にあれば、エントロピーは最 大になるる」ということの意味を微視的な視点から説明している。すなわち、そうした系 の微視的な状態をしらべてみれば、それらはボルツマン分布をしているのである。 状態の数と分配関数の計算 分配関数 Z が計算できる系として、次のような系を紹介する。 理想気体と Maxwell の分布 調和振動子 Fermi-Dirac 粒子系:金属の中の電子ガス Bose-Einstein 粒子系: 磁性体(スピン系) 4.10 20世紀へ 42 ブラウン運動と分子の実在 熱力学から統計力学への道を開拓したボルルマンは,1906 年 9 月 5 日、休暇で訪れていた アドリア海に臨む村で、自殺した。マックスウエルや彼らの築いてきた気体分子運動論で は、活発に運動している微視的な粒子を想定している。だが、20 世紀に到るまで、そうし た原子や分子が実在することは、科学者に広く受け入れられていたことではなかった。実 在が疑われる原子、分子説は、例えばオストワルド Ostwald やマッハ Mach のような、エネ ルギー論者と呼ばれる一部の科学者や科学哲学者の激しい攻撃にさらされた。こうした批 判に繊細なボルツマンはひどく悩んでいたと言われている。彼が自殺する前年の 1905 年に、 アインシュタインは後の物理学の発展に大きな影響を及ぼした物理学史上の重要論文を立 て続けに発表したが、その中の一つがブラウン運動に関する論文だった。ブラウン運動は、 花粉から出た微粒子が不規則に動く様子が顕微鏡で観察される現象であるが、そうした運 動は微粒子がまわりの水分子に衝突された結果である。アインシュタインはそうした微粒 子の動き(ある時間の間の平均移動距離の2乗平均)が時間に比例するという関係を導い た。発表された。こうした式を手掛かりに、実際に分子論を基礎づけるアボガドロ数を決 定したのは、ぺラン Perrin であった。このような仕事によって分子の実在は実験的に証明 されたことになる。 ブラウン運動をモデルとして、時間的に変化する確率事象の研究を発展させたのは、ウ ィナー N. Wiener である。こうした仕事は、コルモゴロフ Kolmogolov らによって確率測 度論としてさらに発展した。こうした理論は、統計力学の確率的な基礎を与える得るエル ゴード仮説 Ergodic hypothesis の研究や、情報通信理論にも引き継がれている。 第2法則の波紋 第2法則は、科学者、哲学者、一般人にも大きな話題を投げかけた。宇宙には熱的な死 が訪れること、孤立系としての生物(生命系)が生存していくためには、エントロピー増 大と戦わねばならないことなどである。さらに、ものごとが起きる方向を決めると考える と、時間の方向を定める概念でもあるということになる。さらに、次のようなパラドック スによって、物理学と知的な生物との関係を考慮しなければならないことも、話題になっ てきた。 マックスウエルの悪魔 Maxwell’s Demon ある気体分子がある部屋(容器)に閉じ込められている。この部屋の真ん中には仕切りを 入れ、開閉できる窓がついている。この環境で熱的な平衡状態に達している。次に、この 窓を通過できる分子の速度を見張れる悪魔がいて、分子の速度を観測しながら、一方の部 屋の分子の平均の速さが、他方のそれより多くなるように、窓を素早く開閉するとする。 窓などへの衝突による熱的な消失がなく、分子の観測が情報操作だけで、仕事を伴わない 43 とすると、この気体のエントロピーは平衡状態より低くなり、熱力学の第2法則に矛盾す る。 この問題は、マックスウエルの悪魔と呼ばれている。悪魔の仕事は観測(情報入手)を基 礎にしているが、そうした情報操作にも熱力学的な仕事が必要であり、悪魔自身のエント ロピーは増大する。したがって、気体分子と悪魔を含めた全体系を考えると、エントロピ ーは減少しないと考えられる。この問題は、物理系に知的な存在を含めると自然法則が敗 れる(ように見える)ひとつの典型例として、量子力学の観測の問題とともに、多くの議 論を呼んできた。この問題を考察して後の研究者に大きな影響を与えたのが、1929 年に発 表されたシラード L. Szilard の論文である。この論文は、物理学の中に情報の概念を持ち 込んだ最初の論文と言われている。実際に、この問題は、後にブュリリオン Brillion によ って情報学的な立場から議論された(L. Bullouin, Science and Information Theory(2nd ed.), Academic Press, 1962)。 非線形、非平衡、複雑系の理論 古典物理学も、その後に登場した相対論や量子論も数学的には線形の方程式を基礎にし ている。現実の世界の記述には、非線形な理論が必要なことは理解されているが、非線形 の数学は難解である。また、一般に生物は平衡とはほど遠い状態にあるから、生物の生物 らしい現象を記述しようとすれば、非平衡の熱力学、統計力学が必要になる。こうした理 論は、20 世紀の後半になって、盛んになってきた。現在それらの理論は複雑系 Complex System の理論と呼ばれるようになっている。そうした研究を支えているのは、計算機によ るシミュレーションである。計算機が科学の世界で広く利用できるようになってきたのは、 1950 年代以後であることを考えると、こうした議論が20世紀の後半から盛んになってき たことも、理解できる。複雑系については、「物理学から見た生命」の章で紹介する。 おわりに 熱力学は、実験と経験を基に思考を重ねて確立された体系である。巨視的な対象に関 する議論であったのにも関わらず、20世紀に至ってもその価値は減じていない。それど ころか、熱力学の第2法則は、宇宙論や生命の科学に関連して大きな関心をもたれている。 Schrödinger が生命は負のエントロピーを取り入れているという意味のことを述べたのは 有名である。また、現実の世界が推移する向きとしての時間と、エントロピー増大法則と の関係は、研究者や哲学者の論議を呼んでいる。さらに、最近の超高速計算機の開発にお いては、消費電力を少なくすることが大きな課題になっている。ここでは、計算の物理的 な課程における熱力学的な考察が必要である。さらに、熱力学で導入されたエントロピー の概念は、情報理論の中心概念となった。さらに、その後は、生物学への応用を意識した、 非線形の数学理論、非平衡の熱力学・統計力学、複雑系の理論が生まれてきた。このよう 44 に、熱力学、とくに第2法則は、まだ多くの挑戦課題の源になっている。 45 第2章の付録 熱力学の建設に貢献した人々 Nicolas Leonard Sadi Carnot, 1796-1832 James Prescott Joule, 1818-1889 Rudolf Clausius, 1822-1888 William Thomson (Lord Kelvin), 1824-1907 James Clerk Maxwell, 1831-1879 Ludwig Boltzmann, 1844-1907 熱力学の定数など A. Avogadoro’s number, 6.02 x 1023 R, Gas constant, 8.314 x 107 erg/mol・egrees = 1.986 cal/mol・degrees h, Planck’s constant, 6.55 x 10-27 cm.2.gm.sec-1 k, Boltamann constant, R/A, 1.38x10-16 erg/degree 1 calorie = 4.185x107erg 1eV = 1.60x10-19 J = 1.60x10 Celsius 温度、C;絶対温度 K, 室温 –12 erg T(K) = 273.15 + t(c) T = 290K or 300K. 46 第4章の参考文献 学部における物理学の新しい教育実験。物理学の統一的な理解をめざしている。 Austin Gleeson, Discovery Learning Project/Physics 341 (http://www.ph.utexas.edu/~gleeson/) 古典力学、解析力学については、 電磁気学については、 熱力学と統計力学の基礎に関して、最も優れた初心者向けの解説書は、 朝永振一郎、物理学とは何だろうか(上、下)、岩波新書。 この上巻は、カルノー、クラウジウスの第2法則とエントロピーの解説に、下巻は、気体 (分子)運動論を用いての Maxwell と Boltamann の仕事の紹介になっている。 時間論の古典である、 渡辺慧、時間の歴史、東京図書、1973 年 熱学に関する歴史的な考察 山本義隆、熱学思想の史的展開、現代数学社、1987 年 高林 熱力学と統計力学の教科書 Enrico Fermi, Thermdynamics, Prentice-Hall, 1937 (Dover ed., 1956) Arnold Sommerfeld, Thermodynamics and Statistical Mechanics, Academic Press, 1964 菅宏、はじめての化学熱力学、岩波書店、1999 年 久保亮五監訳、統計物理(上・下)―バークレー物理学コース5、丸善、1970 年 F. Mandel 著/和田八三久・岡野光次・早川礼之助訳、統計物理学(I,I)-マンチェスター 物理学シリーズ、共立出版、1975/1976 年 マンチェスター物理学シリーズの統計物理学(I,II) これらの本には、文中および章末によい演習問題がある。 47 ボルツマンの原著論文の訳。 物理学史研究刊行会編、統計力学(物理学古典論文叢書6)、東海大学出版会、1970 年 読み物 P. W. アトキンス/米沢富美子・森弘之訳、エントロピーと秩序、日経サイエンス、1992 年 戸田盛和、いまさら熱力学?、丸善、1997 年 48 2.A 理解を深めるための例題と問題 例。強磁性体モデル スピンが 1/2 であるN個の磁性原子からなる系を考える。各原子の取りうる状態は、ス ピンが上向きか、下向きかの2つである。この系は、十分低温では、スピン同士の相互作 用で、その向きが互いに平行になるように揃うと仮定する。絶対零度では、スピンはすべ て同じ向きになるとすれば、N 個の系の可能な状態の数Wは1である。また、温度が無限大 の場合は、スピンの向きは完全に乱雑になるから、可能な状態の数Wは、2N で与えられ るので、ボルツマンのエントロピーは S = k log W = kN ln 2 となる。一方、熱容量をもちい たクラウジウス流の熱力学のエントロピーによれば、 ∫ ∞ 0 C (T ) dT = S ( ∞ ) = kN ln 2 T となる。これは、スピン相互作用の詳細、C(T) の温度依存性に関係なく、常に成り立つ。 (Berkely 統計物理(下)、p.235)。 熱力学を復習するための演習問題 熱量計:銅でできた重さ 750g の熱量計に 200g の水が入っていて、平衡状態にあり、この 温度は 20 度Cである。この熱量計に、重さ 30g の氷を入れ、熱量計を断熱壁で覆い、外部 に熱が逃げないようにする。水の比熱は、4.18Jg-1deg-1、銅のそれを 0,418Jg-1deg-1、氷の 溶解熱を 333Jg-1 とする。氷の溶解熱は、0度Cで、氷を水へと溶かす時必要な熱量である。 ここで、 (1) 十分時間が経過して、全部氷が解け水になってすべてが平衡状態に達したとすると、 温度はいくらか? (2) この平衡状態に達するまでの全体の系のエントロピーの変化はどれだけか? 単位 を J/deg として求めよ。 (3) 上記(1)の状態から、全部の水を再び最初の温度、20 度Cに上げるには、どれだ けの仕事(J単位)が必要か? 答え:(1)12.6 度C,(2)、12.8J/deg、(3)9.4x10J (Berkeley 統計物理(下)、p.244、問題 5.17) 49 第4章補遺―1 Maxwell のデモン研究の歴史 マックスウエルのデモンは、1871 年に出版されたマックスウエルの本、Theory of Heat に登場した。その中では、「気体分子を2つに分けている容器の壁の小穴を監視しているあ る知的な存在“a being”であり、彼は個々の分子を見て、より早いもの来たら容器の A の部 分から B へと通し、より遅いものは B から A へと通すように、小穴の窓を開閉する”who can see the individual molecules, opens, and closes this hole , so as to allow only the swifter molecules to pass from A to B, and only slower ones to pass from B to A.”。こうした存在 は、第2法則に反し、仕事をする(エネルギーを消費する)ことなしに平衡状態にあった B の温度を上げ、A の温度を下げることができる。」と述べられている。この存在をマックス ウエルの知的な悪魔 Maxwell’s intelligent demon と呼んだのは、同じ熱力学の創始者の一 人であるトムソン William Thomson,つまりケルビン卿 Lord Kelvin である。このように紹 介した彼の論文は 1874 年に発表されている。後にマックスウエル自身が、デモンの性格を 再定義している。つまり、この存在は、分子の速さを観察して、慣性(つまり質量)や摩 擦のない窓を動かすだけの存在であり、第2法則が統計的ものであることを実証する目的 で創造された。この目的には、知的な存在でなく単なるバルブでも同じ働きをすると言え ようと言っている。 熱力学の存在であったマックスウエルのデモンに今日の情報学に関係した存在であると いう視点を与えたのはシラード L. Szilard の 1929 年の論文である。この論文では、デモン が今日でいう 1 ビットの情報を獲得する過程が分析されている。その結論は、1ビットの 情報を獲得するには、 S = k log 2 のエントロピーの増加が伴うというものであった (Szilard の論文の式(3))。彼の結論は、第2法則に反すると思われた平衡状態からの逸 脱は、情報入手に伴うエントロピーの増大で帳消しにされるというものであった。1940 年 代の終わりから 50 年代の初めにかけて、ブリルアン Leon Brillouin とゲイバーDennis Gabor は、分子の速度の計測に光を用いる過程を分析し、やはり情報入手にはエネルギー 消費が伴うことを証明して、デモンのような存在がありえないことを主張した。彼らの仕 事は、純粋に情報的な存在であったデモンを物理的な計測を行う現実的な存在として考察 する道を開いた。また、ここから当時台頭し始めた情報学と物理学との間の関係を探る試 みが始まった。 1961 年、ランダウアーRolf Landauer は、計算機の内部で行われている記憶の消去過程 が、外部にエントロピーを排出しているという説を発表した。この説は、後にランダウア ーの原理 Landauer’s Principle と呼ばれるようになった。彼は Brillouin の仕事に言及し、 計算過程は測定過程に類似していると述べている。彼の仕事は、ベネット Charles Benette を刺激し、ベネットは 1973 年の論文で、記憶を消去しない可逆的な計算が原理的には可能 なことを証明した。さらにランダウアーとベネットは 1982 年に発表した論文の中で、情報 を獲得する過程が問題なのではなく、マックスウエルのデモンが仕事をするには、記憶を 消去する過程が必要なことが問題だと指摘した。つまり、後者の過程でエネルギーが消費 50 されるので、第2法則を破るような働きはできないという考察がなされた。彼らによって、 マックスウエルのデモンは、古典物理学(熱力学)や情報学的な視点からだけではなく、 量子計算、量子情報の視点からも論ぜられるようになった。 今日、ランダウアーやベネットらの見解は広い支持をえているが、こうした説を批判する 説もあり、マックスウエルのデモンをめぐる論争はまだ終結していない。 物理学的な過程としての計算 マックスウエルのデモンをめぐる論争を通じて、物理学者も、情報処理や計算という過 程にもエネルギー消費やエントロピーの増大が伴うということ受け入れるようになった。 そもそもデモンを考案したマックスウエル自身、デモンとエントロピーを結び付けては考 えていなかった。マックスウエルが「ある存在 a being」と呼んだ主人公を、の「マックス ウエルの知的なデモン」と呼ぼうと提案したトムソン(ケルビン卿)の論文に答える形で、マ ックスウエルは、彼の「ある存在」を再定義して、「熱平衡状態にある系に温度差を生じさ せる仕事をする」ことがこのデモンのミッションであると再定義している。しかし、シラ ード Szilard の考察以後、分子の位置情報を得るにしろ、速度を計測するにせよ、記憶を消 去するにせよ、情報処理の過程には、エントロピーの増大とエネルギーの消費(散逸)が 伴うという合意が物理学者の間に形成された。 シラード Szilard は、1分子からなる「気体」を考え、この分子が容器の右半分にあるか、 左半分にあるかを決定する過程では、系に対してある仕事をして、k log 2 の情報をうるが、 これは、同じ量のエントロピーの減少を意味すると考えた。ここで、熱力学的なポテンシ ャルとエントロピーの間の、 F = U − TS という関係と、内部エネルギーが変化しないことと、熱浴と接触しているために温度が一 定であると仮定すれば、 δF = − T δS となる。したがって、 k log 2 のエントロピーの減少( − k log 2 の増大)は、自由エネルギ ー F が、 kT log 2 だけ増大したことを意味する。すなわち系には、それだけの仕事がなさ れたことになる。実際に系がどれだけ仕事をされたかは、容器の壁をピストンを押しなが ら半分の体積に縮小する過程として、最初の気体の体積を V1 = V 、最後の体積を V1 = V / 2 とすることで求められる。すなわち、 V2 V2 V1 V1 δW = ∫ (− p) dv = − k T ∫ 1 V dv = − k T ln 2 = k T ln 2 v V1 51 となる。 ただし、ここで理想気体の状態方程式 pV= N k T で、分子は1個と仮定しているから、 N = 1 を使っている。 したがって情報量1ビットを処理するのに、 k T ln 2 のエネルギーを必要とするが、これ は、 ( k はボルツマン定数 k B である)、約 3 × 10 −21 Joule に当たる。フォン・ノイマンはこ の量は、何らかの情報処理をする時は必ず諸費しなければならないエネルギー量であると 指摘した。Feynman は、トランジスター回路の場合、1スイッチ当たりのエネルギー消費 8 は 10 kT だと見積もっている。生体の中で DNA を鋳型として RNA がコピーされる過程で は、RNA ポリメラーゼが酵素として働くが、ビット当たりに換算しておよそ 100kT ほどの エネルギーが使われていると見積もっている(Feynman, p.166)。 こうした情報処理に伴うエネルギーの散逸は、計算過程においても発生する。この時重 要なのは、計算のエネルギー消費は、計算のスピードに依存していることである。すなわ し、可逆回路のようなエネルギー効率のよい回路を使って、ゆっくりと計算すれば、エネ ルギー消費は少なくてすむ。このトレイド・オフをどう有利にするかが問題である。こう した問題は、量子計算にも引き継がれる。 参考文献 1.Leo Szilard, On the decrease of entropy in a thermodynamic system by the intervention of intelligent system, Behavior Science, 9, pp.301-310, 1964 (この論文は、L. Szilard, Űber die Entropieverminderung in einem thermodynamischen System bei Eigengriffen intelligenter Wisen,Zeitschrift für Phsik, Vol.53, pp.40-856, 1929 の A. Rapoport, M. Knoller による英文訳) 2.Richard P. Feynman (J.G. Hey and R.W. Allen eds.), Feynman Lecture on Computation, Addison Wesley, 1996(原康夫他訳、ファイマン計算機科学、岩波書店、1999 年) 2.C. H. Bennett, "The Thermodynamics of Computation - A Review", Int. J. Theoretical Physics 21(12):905-940 (December, 1982). 3.H.S. Leff and A.F. Rex (eds), Maxwell Demon 2: Entropy, Classical and Quantum Information, Computing, Institute of Physics Pub., 2003 4. John D. Nortonl, Eaters of the Lotus: Landauer’s Principle and the Return of Maxwell’s Demon, (DRAFT) Revision April22, April 21, 04; March 29, 22, 2004 (http://www.pitt.edu/~jdnorton/papers/Eaters.pdf.) 52 第4章補遺―2 物理学のエントロピー S. Watanabe, Knowing and Guessing, Wiley, 1969 相対エントロピーのもうひとつの定義 相対エントロピーをもう少し違った形で定義することができる(Watanabe, Knowing and Guessing, p.12)。これは、2つの事象の組を考える代わりに、ひとつの事象の組の各 事象に重み wi を割り当てるのである。重みであるから、 ∑w i = 1, wi ≥ 0 i を満たすものとする。このことを、 A1 , A2 ,..., An A' = w1 , w2 ,..., wn p , p ,..., p n 1 2 と書くことにする。これに対して、 S * ( p, w) = −∑ pi log i = − ∑ pi log i pi Awi pi + log A wi をもうひとつの相対エントロピーと定義する。ただし、A は任意の定数である。これは pi , wi を事象の確率とする2つの事象の組に関する(最初に定義した)相対エントロピーに定数 項を加えたものになっている。 ギブスの不等式あるいは最初の相対エントロピーの性質により、 S * ( p, w) MAX = log A , ただし、pi = wi に対して となる。また、 A = n, wi = 1 n A1 , A2 ,..., An 1 1 1 すなわち、 A' = n , n , ..., n p1 , p2 ,..., pn 53 であれば、 n 1 S * ( p, ) A = n = − ∑ pi log pi ≡ H n i =1 となる。 観測の疎視化 Coarse-grained observation もうひとつの相対エントロピー、 S * ( p, w) は、以下のような手順で情報エントロピーか ら導くことができる。 A1 , A2 ,..., An A' = w1 , w2 ,..., wn p , p ,..., p n 1 2 いま確率事象の組の事象の数 n が大きく、 A1 , A2 ,..., An を n1 , n2 ,..., nν づつまとめたν 個の集 団に分割したとする。その i 番目の事象の組を改めて複合事象 Fi とし、その確率を pi = 1 pn ; pn i ≡ pk ∑ ni i {Al がFiに属するp kについて} と定義する。すなわち、 A1 , A2 ,..., An1 ; An1 + 1 , Λ , An1 + n 2 ; Λ ; An1 +Λ + nν −1 ,Λ , An A' = F1 , F2 , Λ Λ , Fν p1 , p2 , Λ Λ , pν これより重みをもった新たな確率事象の組 F 、 F1 , F2 ,..., Fν F = n1 , n2 ,..., nν p , p ,..., p ν 1 2 を定義できるが、もとの A' を A1 , A2 ,..., An1 ; An1 + 1 , Λ , An1 + n 2 ; Λ ; An1 +Λ + nν −1 ,Λ , An A* = Λ , pν p1 , p1 ,Λ , p1 ; p2 , Λ Λ , p2 ; Λ ; pν , Λ 54 に置き換えた確率事象の組を考えることもできる。ここでは、後者を考え、便宜のために、 これを A1 , A2 ,..., An1 ; An1 + 1 , Λ , An1 + n 2 ; Λ ; An1 +Λ + nν −1 ,Λ A* = p1*, p *2 ,Λ , p *n ; p *n +1 , Λ Λ , p *n + n ; Λ ; p *n +Λ + n −1 , Λ 1 1 1 2 1 ν , An Λ , p *n と考える。この A *に関する情報エントロピーを H ( A*) とすれば、 n H ( A*) = − ∑ pi * log pi * = − ∑ i =1 {ni } ni pni ∑n i =1 i log pni ni = − ∑ pni log {ni } pni ni 最後の式の和は、ν 個の分割された集合に対して取られる。ここで、上記の確率事象の組の 重みを規格化したもの wi = ni / n に置き換え、 pi を定義 pi = にしたがって、 pni ni 1 pn ; pn i ≡ pk ∑ ni i {Al がFiに属するp kについて} に置き換えると、重み付けられた確率事象の組がえられる。 F1 , F2 ,..., Fν n n n F = 1 , 2 , ..., ν n n n pn pn p n 1 , 2 ,..., ν nν n1 n2 これに関して、 A = n と置いたもうひとつの相対エントロピーを求めると、上の H ( A*) と 全く等しくなる。 pni =1 、とすると、すなわち、ある ni 個の事象からなるグルーピングし た組( Fi )の起きる確率 pni が1であれば、それ以外はすべてゼロになり、 H ( A*; pni = 1) = log ni となる。また、もし、 pni = ni / n であれば、もうひとつの相対エントロピーは最大値をと る。 55 H ( A *; pni = ni / n) max = log n 上で定義したもうひとつの相対エントロピー H ( A*) と、その特別な場合とは、それぞれ 熱力学および統計力学の Gibbs のエントロピーおよび Boltzmann のエントロピーのモデル となっている。すなわち、 n H ( A*) = − ∑ pi * log pi * = − ∑ pni log Gibbs のエントロピー i =1 Boltzmann のエントロピー {ni } pni ni H ( A *; pni = ni / n) max = log n である。以上の議論によって、Shannon, Gobbs, Boltzmann エントロピー意味の違いも理 解されるであろう。 状態数による定義 いまある n 個からなる多粒子系が離散的な状態、例えば、離散的なエネルギー値、 E1 , E2 , E3 , ..., Ei , ... にそれぞれ n1 , n2 , n3 , ..., ni , ... づつ占めているとする。ただし、 ∑n i =n i とする。系がこうした状態をとる可能性の数(すなわち n 個の粒子を並べ替えたこうした配 置をとる組み合わせの数)は、 W= n! n1!n2!n3! ..., ni !... で与えられる。 この対数を考えるが、 n が大きいとするとスターリングの公式を用いれば、 log n! ≅ n log n − n となるから、 56 logW ≅ n log n − n − ∑ (ni log ni − ni ) = − n∑ ( pi log pi ) i ただし、 log W ≅ n log n − n − i ∑ (n log n − n ) = − n∑ ( p log p ) とする。これは、 i i i i i i i S micro = − ∑ ( pi log pi ) i の n 倍になる。この S micro は、集団の構成要素である単一系のエントロピーであり、 57 第5章 量子力学入門 5.1 はじめに この章とそれに続くいくつかの章では、量子力学について解説する。その目的は2つあ る。ひとつは、すでに紹介した、情報エントロピー、熱力学的なエントロピー、ボルツマ ンの原理などが、量子論の世界にどのように引き継がれるかを検証することである。繰り 返しになるが、熱力学的なエントロピーと系の微視的な状態の数とを結びつけるボルツマ ンの原理は、情報エントロピー、熱力学的なエントロピーを結びつけるとともに、熱力学 と統計力学とを結ぶ要(かなめ)となっている原理である。しかし古典論では、考察対象 となる系の構成要素である粒子の座標や運動量はいくらでも細かく決定できるとされてい るので、区分すべき状態(状態空間あるいは相空間)はいくらでも増えてしまう。古典統 計力学のこの困難は、状態空間の区分には最小の単位が存在するという仮説によって救わ れるが、そうした仮説に根拠を与えるのが量子力学である。すなわち、量子力学はボルツ マンの原理に一層の根拠を与える理論である。さらに量子力学は系がとりうるエネルギー の値を求めることも可能にする。この章では、必要な量子力学の知識を、簡単な系を紹介 しながら簡潔にお浚いする。次の章では、多粒子系や統計力学に関わる系を取り上げ、ボ ルツマンの思想が量子力学にどのように継承されていくのかを検証する。 量子力学を解説するもうひとつの目的は、最近注目を集めている量子計算(機)Quantum Computing (Computer)、量子情報 Quantum Information を理解するための準備としてで ある。急激に研究者の増えてきたこの分野を理解するためには、もちろん量子力学の知識 が必要であるが、そうした知識は、 「シュレディンガー方程式を解けばよいというような」、 どちらかと言えば量子力学を使いこなすことだけに関心のある研究者たちが関心を示して こなかった、量子力学の原理的な側面と深く関係している。 量子力学のさまざまな原理は、日常の経験からすれば、大いに奇妙に感じられるもので ある。とくに不確定性関係や、観測とその結果を解釈する問題は、量子力学の創設期から 論争の的であり、永く研究者を悩ませていた。しかし量子力学が実際問題解決に有用だと いう認識が広がると、そうした原理的な問題は、哲学づきの一部の研究者たちだけの関心 事と見なされ、実際の応用とは無縁のことと、一般の研究者には受け取られるようになっ た。ところが最近の量子計算、量子情報への関心の高まりは、こうした事情に変化をもた らしつつある。すなわち、これまで哲学的、あるいは形而上学的であり、それゆえ、例え ば工学の世界などとは無関係であると思われていた量子力学の原理を見直すことが、効率 的な量子計算機や安全な暗号法の開発に必須であると認識されるようになってきたのであ る。そのような原理的な問題に関する話題とは、アインシュタインらの EPR, シュレゲィ ンガーの猫、 (量子的)絡み合い Entanglement、局所性 Locality 多世界解釈、ベルの不等 式、Kochen-Specker の定理、POVM (Positive Operator-Valued Measure)、さらに量子論 理 Quantum Logic などである。 1 今日、量子力学に関する書物は、和書洋書とも膨大な数が存在している。とくに上で述 べたような量子力学を使いこなすという意味では、レベルに応じた良書が多数存在してい る。しかし、新しく台頭してきた量子計算や量子情報にもつながるような原理的な話題を バランスよく扱っている書は少ない。入門書あるいは独習書となるとほとんどないという のが現状である。量子力学の見直しにつながるこれらの課題については、後で章を改めて 紹介するが、それらの課題の議論をするための量子力学は、シュレディンガー方程式を解 くという応用を志向した解説書とは違った理論展開が必要であり、そのためには表記法も 違ったものを使う必要がある。それらは Dirac の(ブラ・ケット)記法、射影演算子、密 度行列あるいは密度演算子、スピンおよびパウリ行列、2状態系の表現などである。我々 は、量子力学と量子統計力学の入門にあたるこの章と次の章において、これらの理論や表 記法をできるだけ紹介する。それは、量子計算や量子情報の話題と手法に円滑に移行する ための助けとなるだろう。また、これらの章では、具体的な計算事例も挙げている。読者 は自分の手で数式を追い、必要なら参考文献を参照するなどして、理解することに努めら れたい。 5.2 量子力学の発展史 量子力学の構築にいたる歴史は、およそ3期に分けることができる。第1期は、古典力 学が完成したかに思われた 19 世紀の末、新しい物理学誕生の引き金となった、X 線、電子、 ゼーマン効果、放射能が発見された 1995 年から、プランクによる黒体輻射における量子仮 説が発表された 1900 年をへて、2005 年までである。第2期は、光量子仮説、ブラン運動、 (特殊)相対性理論という、いずれも後世の物理学や数学に大きな影響を与えたアインシ ュタイン3つの論文が、立て続けに発表された 1905 年から、原子核物理学の端緒となった ラザフォードらの実験、彼の知遇をえたボーアの水素原子のスペクトルの不連続性を説明 したモデルの提唱、現在のレーザー技術の基礎となったアインシュタインによる光の誘導 放出に関わる確率(A,B)を量子仮説に基づいて求める計算法の発表、アインシュタイン の一般相対論の発表、それが日蝕の観測で実証されたとされた 1919 年頃までである。最後 は、3つの異なる方法により、量子論が量子力学として定式化され、さらにそれらの内容 が同一であることが確認された 1920 年代である。 この最後の時期においては、まず、ド・ブロイ de Broglie が物質波の概念を提唱した。 そ れ よ り 前 、 ア イ ン シ ュ タ イ ン は 、 波 で あ る 光 が エ ネ ル ギ ー E = hν 、 運 動 量 p = hν / c = h / λ をもつ粒子のように振舞うと言ったが、それとちょうど対照的に、電子 のような運動量 p = mv( , mは質量、vは速度) をもつ(物質)粒子には、波長、 λ = h / p の波が伴うという説をド・ブロイは、1923-4 年にかけて発表した。シュレディンガーはこ の考えを発展させて 1926 年に、有名なシュレディンガーの方程式を提唱した。これらが波 2 動方程式の流れである。一方、1925 年から、ハイゼンベルクとボルン、ヨルダンらは、状 態の遷移に注目した行列力学を提唱した。行列力学は量子力学とも呼ばれた。行列力学で は、行列と見なされる座標(成分)と運動量(成分)とは必ずしも可換(掛け算の順序を 変えた時等しく)にならない。ハゼンベルクは、このことから、両者を任意の精度で同時 に測定できないという、不確定性原理を導いた。 これとは独立に、ディラックは、古典的な解析力学のポアッソン括弧式が可換でない場 合を含む座標と運動量の関係がカギだという推理から、これらの座標や運動量を新しい種 類の数(q-数、q-number, quantum number の意味)と見なし、新しい交換関係を基礎に した理論を構築した。この理論では、古典的な座標や運動量は普通の数(c-数、c-number, classical number を意味する)である。これも 1925 年のことである。ディラックの定式化 には、1点で無限大になり、それ以外ではゼロであるδ関数が使われていた。 これら3つの定式化は結局、同じ結論を導く同じ内容の理論であることがすぐ明らかに なった。また、これらの理論がさまざまな対象に適用され、実験結果と一致したことで、 量子力学は完成された。それは 1927 年頃のことである。ただし、この時点では、スピンの 存在と特殊相対論的な扱いとが残されていたが、これらも 1928 年に発表されたディラック の相対論的な電子論の方程式により、2つながら解決された。 量子力学が完成した後の 1932 年には、中性子、陽電子、重水素などが発見され、核物理 学と素粒子論の発展が始まったが、1920 年代に完成された量子力学は、基本的にそれ以後 の現在にいたる理論に引き継がれている。理論のそれ以後の挑戦課題は、電磁場におかれ た粒子の問題で、これは量子電気力学(量子電磁力学)Quantum Electrodynamics, ある いは、相対論的場の理論 Relativistic Field Theory と呼ばれる。これはマックスウエルが理 論を構築した電磁場に量子力学をもちこむことであるが、無限大がでてきてしまうことで、 研究者を悩ませていた。この問題は一応、繰り込み理論という物理学的な処理で回避され たが、本質的な解決にはいたっていない。素粒子物理学の発展は、数多く発見された素粒 子とそれらが関与するさまざまな性質の力とを、統一的な視点から説明する「統一理論」 の研究を盛んにした。 1920 年代に完成された非相対論的な量子力学のその後の発展は、応用範囲が広がったこ とと、計算法が工夫されたこと、計算機により実際に計算可能な対象が増えたことである と言えよう。初期の頃から、研究者を悩ませていた観測と結果の解釈問題は、すっきりと 解決されたわけではなかったが、実際問題の解決にはあまり関係しない、どちらかと言え ば哲学的議論と見なされてきた。事情が変わってきたのは、量子計算や量子暗号への関心 が高まってきた最近においてである。 年表 1895-1905 年:新発見の時代 95年 陰極線からの放電現象から J. J. Thomson によって、電子が発見される。 3 95 年 磁場によってスペクトル線が広がるゼーマン Pieter Zeeman 効果が発見される。 95 年 レントゲン Röntogen により X 線が発見される。 96 年 ベックレル Henri Becquerel により、最初の放射能、ベクレル線が発見される。そ のすぐ後に、キュリーM. Curie による天然鉱物からの放射能の検出実験が開始さ れる。 98 年 ラザフォード E. Rutherford ウランからの放射能、アルファ線(実はヘリウム原子 核)、ベータ線(電子)を発見、すく後にフランスのヴィラール P.V. Villard がガ ンマ線を発見。 1900 年 プランクMax Planck、黒体輻射の理論に作用量子 h (プランク定数)導入。 1905-1919 年:前期量子論の時代 05 年 アインシュタイン A. Einstein、光量子仮説、ブラウン運動、相対性理論に関する 論文3篇を発表。 13 年 ボーア N. Bhor 量子論を基礎に水素原子のエネルギー準位を説明する最初のモデ ルを発表。 14 年 アインシュタイン、一般相対論発表。 19 年 日蝕による観察で一般相対論の正しさが確認されたとされた。 19 年 ラザフォード原子核変換に関する最初の報告発表。 1920-1930 年:量子力学の完成期 波動方程式の導入 23-24 年 ドゥ・ブロイが物質波の理論を提唱、この理論を検証することになる電子線の 回折実験が 1921-3 年に、ダヴィッソン C.J. Davisson とクンスマン C.H. Kunsman によって行われた。 26 年 ドゥ・ブロイの考えを発展させたシュレデンガーが、いわゆるシュレデンガー方程 式を発表。 行列力学/量子力学 25 年 ハイゼンベルク、遷移確率にもとづく理論を発表、これがボルン、ヨルダンの協力 で行列力学に発展する。 非可換数による量子力学 25 年 ディラックがポアッソンの括弧式とデルタ関数を基礎に量子力学を定式化。 28 年 ディラック、相対論的電子論を発表、この方程式の解に含まれた負のエネルギー電 子の穴が陽電子であることは、32 年に実験的に確認された。 4 量子力学以後 1932 年 中性子、陽電子、重水素などが発見され、また、ローレンスらによるサイクロトロ ンの実験で初めて核の崩壊現象が報告された。これらの仕事は、素粒子物理学に 発展する。 1939 年 ハーン O. Hahn とシュトラウス F. Strassman が中性子によって照射したウラン の核分裂現象を発見。核エネルギーを解放する技術の開発研究が加速する。 5 5.3 量子力学のエッセンス 5.3.1解析力学の表現 量子力学を古典力学から類推によって導く方法を対応の原理と呼ぶ。その方法を理解す るには、まず、古典力学をいわゆる解析力学と呼ばれる、ラグランジュやハミルトンの形 式に書き直さなければならない。解析力学では、ある系を記述するのにハミルトンの正準 方程式 Hamilton’s canonical equations を用いる。 p&k = − ∂H , ∂qk q&k = ∂H , ∂pk H = H ( p1 ,.., pk ,..., q1 ,..., qk ...) ここで qk 座標と運動量 pk は、互いに共役 Conjugate な正準変数 Canonical variable と呼 ばれる。ハミルトン関数 H はこれらの変数の関数であり、系の全エネルギーをあらわす。 この方程式は、ラグランジュ関数 Lagrange’s function、L、 L = L (q1 ,.., qk ,..., q&1 ,..., q&k ..., t ) を導入することで、 H = ∑ pk q&k − L, pk = − k ∂L , ∂q&k と書くことができる。 解析力学において、2つの力学変数、 u, v が、正準変数 qk 、 pk の関数である時、ポアッ ソンの括弧 Poisson Bracket が、次のような定義される。 ∂u ∂v ∂u ∂v − [u , v] = ∑ ∂pk ∂qk k ∂qk ∂pk この関係式は、量子力学の交換関係 commutation relation を導くために重要である。 5.3.2 物質と波の2重性 古典的な粒子と違って、量子力学の粒子は物質的な存在であると同時に波としての性質 ももっている。逆に、光のような波も物質である粒子のように振舞う。エネルギーE と運動 量 p をもつ粒子は、A exp[i ( k・x − ωt ) で表現される。ここに、k は波動ベクトル、( 2πλ )n 、 nは波動ベクトルの単位ベクトルである。逆に振動数ν を有する光は、 E = hν のエネルギ ーを有する(光)量子として振舞う。 5.3.3 系の状態表現と観測量 系の状態と重ね合わせの原理 6 量子力学では、物理系の状態は、ある空間上の点(ベクトル)に対応する。これは線形 ベクトル空間の点が満たす性質であるが、量子力学の状態(ベクトル)は線型に重ね合わ せることができる。すなわち、A,B が状態なら、aA+bB も状態である。実は、この空間は 複素数が登場するヒルベルト空間である。習慣として、このベクトルは、波動関数 Ψ 、あ るいは状態ベクトル | Ψ 〉 などであらわされる。物理系に対応する状態ベクトルは規格化さ れている。すなわち、 ∫ Ψ * Ψdx, || 〈 x | Ψ 〉 ||2 は1になる。 これは、2つのベクトル | x〉, | Ψ 〉 の間に、内積 〈 x | Ψ 〉 が定義されうるからである。この 内積によって2つのベクトル間の距離も定義できる。 演算子または作用素 Operator と交換関係 解析力学における変数は、普通の数であり、実数である。しかし、量子力学におけるこ れらの変数は、数ではなく演算子(または作用素)Operator である。これらの作用素は、 状態ベクトルも要素であるヒルベルト空間上で定義される。この意味で、(複素数を要素と する)行列とみなせる。このことは、量子力学の一般的な変数について言える。 実数や複素数のような数であれば、2つの変数 x,yに関して、常に xy = yx, すなわち、[ x, y ] ≡ xy − yx = 0 が成り立つ。しかし、このことは量子力学の変数では一般には成り立たない。ただし、変 数が行列であると仮定すれば、このことは直感的に納得できよう。記号[ ]で定義される量子 力学の Poisson Bracket(交換関係)は、任意の2つの変数に対する次の式をいう。 xy − yx = iη[ x, y ] 2つの変量がこれを0にする時、交換可能であるという。とくに、量子力学の系の座標 qk と 運動量 pk の間には、 [qk , ql ] = 0, [ pk , pl ] = 0, [qk , pl ] = δ kl または、 qk ql − ql qk = 0, pk pl − pl pk = 0, qk pl − pl qk = iηδ kl という関係がある。ここで、 pk = − i η ∂ ∂qk とおいても、上の交換関係は満足される(Dirac, p.91)ので、両者を同一視する。すなわ 7 ち、 pk は、微分作用素、 − iη ∂ と同一視できる。ここで η は、プランク定数を 2π で割 ∂qk iη った、 η = h / 2π である。同様に、 qk は、微分作用素、 相対論的な量子論では、 E = iη ∂ と置き換えられる。また、 ∂pk ∂ という対応がなされる。 ∂t 基底座標系 あるベクトル空間がある時、その任意の点を、適当な係数によって、線型の重ね合わせ として表現できるような特別な、互いに直交したベクトルの組が存在する。これを基底(座 標)系という。基底座標系は沢山あり、互いに一方から他方に変換することができる。後 の Schrödinger の方程式を満たす固有関数(ベクトル)は、一つの基底系になる。 観測可能な物理量 位置や運動量などの物理量は、この空間で定義された作用素に対応するが、とくに観測 可能な物理量 Observable は、その固有ベクトルが基底となりうるものである。 5.3.4 Schrödinger の方程式 観測量の中でも特別に重要なのは、エネルギーの値 E の観測である。この行為に対応す るのが、ハミルトン Hamilton の作用素すなわち Hamiltonian, H である。H は、対称行列 を複素化した Hermite 行列であり、その固有値は実数になる。この作用素は、物理系の状 態 Ψ (ベクトル)の時間的な変化を決定するものである。 iη ∂ Ψ=HΨ ∂t これを Schrödinger の方程式と呼ぶ。もし H が時間に依存しないとすると、エネルギーを E とすれば、これは普通の数(実数)で、しかも一定である。これを用いて、Schrödinger の方程式の解は、 Ψ = Ψ0 e − iEt / η , HΨ0 = EΨ0 となる。 H Ψ = EΨ Schrödinger の方程式 を解くことで求められる。ここで、 Ei を固有値、 Ψi をその固有値に属する状態(固有ベク トル)とすると、 HΨi = Ei Ψi , i = 1,2,3, ... 8 となる。古典論では H は、運動エネルギーTと位置エネルギーの和であり、座標 qk や運動 量 pk の関数である。 H =T +V = p2 +V 2m 量子力学では、これを演算子と見なし、運動量を微分演算子 pk = − iη ∂ ∂qk とし、座標は普通の変数と見なすと、よく知られた Schrödinger の波動方程式をうる。 (− η2 2 ∇ +V ) Ψ = E Ψ 2m (注)応用的な立場では、この方程式を、ちょうどニュートンの運動方程式のように、天 下り的に書き下ろして、それを解くことを「量子力学」であるとするのが一般的である。 しかし、ベクトル空間に基礎を置いた量子力学の形式の中で Schrödinger の波動関数を導 く過程はそう分かりやすくない。そこには、時間の推移を決めるユニタリ演算子が介入す るからである。時間に依存した状態 Ψ を、時間に異存しない 子、 e − iEt / η Ψ0 と結びつける因 はそうした演算子の実態を示す例である。 5.3.4 射影演算子 状態ベクトル | Ψ 〉 をもちいて、この状態への射影演算子、 P[ Ψ ] =| Ψ 〉〈 Ψ | を定義できる。 射影演算子とは、ベクトル空間における部分空間への射影を意味する。例えば、座標に関 する全固有ベクトルの張る空間への射影演算子の和 ∑ | xi 〉〈 xi | = 1 を用いれば、任意の状 i 態ベクトル、| Ψ 〉 の展開ができる。すなわち、| Ψ 〉 = ∑ | xi 〉〈 xi | Ψ 〉 。これは、状態ベク i トルの座標系による表示に他ならない。 5.3.6 統計的な性質 観測値 量子力学系が状態ベクトル | Ψ 〉 に対応する状態にある時、観測可能量 A の機値値は 〈 Ψ | A | Ψ 〉 で与えられる。期待値とは、通常の確率論や統計学でいうように、こうした観 測を多数回繰り返した結果の平均値である。 9 不確定性原理 交換関係を満たさない2つの変量を同時に観測すると、それらの精度の間には、 ∆q ∆p ≥ η , Heisenberg(p.18)、Landau, Lifshitz (p.47) という不等式が成立する。すなわち、双方を任意の精度で観測することはできない。ここ で ∆q, ∆p は、それぞれ座標および運動量(成分)の測定値の標準偏差をあらわす。これをハ イゼンベルク Heisenberg の不確定性原理 Uncertainty Principle という。不確定性原理は、 時間とエネルギーの間にも成り立つ。すなわち、 ∆t ∆E ≥ η . 不確定性原理の表現には、多少のバラツキがある。例えば、 ∆q ∆p = h , ∆q ∆p = h , Heisenberg (p.14) Dirac (p.98) h , Pauli(p.22) 2 ∆q ∆p = η / 2 = h / 4π これら違いは、 ∆q, ∆p で何を言い表しているか、どのような前提で誤差を計算している ∆q ∆p ≥ かによる。波束関数の場合、不確定性原理は、Fourier 変換あるいは Fourier 逆変換に関る 理論を利用して導ける。 スピン Spin 量子力学においても古典論からの対応による粒子の(軌道)角運動量が定義され、その 作用素は座標や運動量作用素との交換関係を満足する。これ以外に、量子力学の粒子は、 微小なコマの自転運動のような角運動量,スピン角運動量を有している。スピン角運動量に 対応する作用素は普通σで表され、その成分は、ある種の交換関係を満たす。電子、核子 (陽子と中性子)、光子など、量子力学に登場する基本的な粒子のスピン角運動量の固有値 は、 η を単位として、整数かあるいは半整数倍かのいずれかをとる。 粒子の不弁別性と統計的な性格 量子力学の粒子は、ボース・アインシュタイン Bose-Einstein 粒子とフェルミ・ディラッ ク Fermi-Dirac 粒子に大別される。前者は、整数倍のスピンをもち、複数の粒子が同じエ ネルギー状態をとることができる。後者は、半整数倍のスピンをもち、同一のエネルギー 状態を占められるのは、高々1個の粒子だけである。この最後の規則をパウリの排他律 Pauli’s Exclusion Principle という。 5.4 量子力学の数学的な手法 量子力学の建設に使われた数学は、当の創設者たちにとっても新しい不慣れなものであ 10 った。最初、ハイゼンベルクは行列を知らず、それが使えると指摘したのは、年長者のボ ルンだった。ディラックも解析力学のポアッソンの括弧式は、そんな式を見たことがある という程度の記憶しかなかったという。ただ、波動方程式は、数理物理学者にとって馴染 みのあるものであった。水素原子や調和振動子に関するシュレディンガー方程式の解は、 Legendre ルジェンドル多項式やエルミート Hermite 多項式で与えられるが、これらの関数 に関する記述が、ちょうど 1924 年に出版された、クーランとヒルベルトによる、「数理物 理学の方法、Methoden der Mathematischen Physik」の初版に含まれている。 この本を実際に執筆したのは、クーランであるが、この本の題材は多くヒルベルトの講 義や仕事からとられている。その中心課題は積分方程式である。積分方程式を離散的に書 くと、行列の演算になる。固有方程式、固有関数、固有値は、固有関数を固有ベクトルと すれば、そのまま行列の話になる。この意味で、積分方程式は線形空間の理論と対応づけ られる。実際にディラックの量子力学の本では、両者の間を自由に行き来している。ただ、 積分方程式では、行列に対応させた時、無限次元の空間になる。有限と無限との違いは、 後者では、何かの和をとった時、収束するか、しないかを、気にしなければならないこと にある。数学では、この点が厳密であり、量子力学の基盤となるヒルベルト空間の点、す なわち関数は、2乗可積分という条件を満たさねばならない。これは状態ベクトル、状態 関数に対して要求される条件でもある。シュレディンガー方程式を解く場合に頼りになる (特殊)関数群に関しても、それらによって、任意の関数が完全に正確に展開 expand でき るか否かが問題となる。もちろんここで問題になる関数は、基本的に複素関数である。こ うした議論は、上記のクーランとヒルベルトの本に詳しい。 一方、量子力学の最も根源に位置し、シュレディンガー方程式を導く前提でもある、座 標変数と運動量変数の成分の間に仮定される交換関係を、数学者は新しい代数と捉えた。 交換関係が定義された量子力学の作用素やそれらが作用する状態ベクトルについては、空 間や時間の対称性、粒子の入れ替えに対する対称性や反対称性が見られるが、これらは、 ある種の代数や、群論の視点からの研究対象になる。こうしたことから、ワイル H. Wyle は「群論と量子力学、Gruppentheorie und Quantenmechanik」の初版を、早くも 1928 年に著した。やや遅れて、フォン・ノイマンもヒルベルト空間と作用素に基礎を置く、「量 子力学の数学的基礎、Grundlagen der Quantenmechanik」を著した。この著書の中の第 5 章と第 6 章では、観測の理論や統計作用素(密度行列)の方法が論じられており、今日の 量子情報論の源泉の一つになっている。群論は、多粒子系の計算や結晶構造記述に有用で あり、量子化学でもよく利用されている。 ディラックの発明したデルタδ関数は、数学者の関心を引き、超関数 Generalized Function の理論が作られた。超関数に関しては、シュワルツ L. Schwartz, ゲルファンド Gelfand らの本がよく知られている。 11 5.5 量子力学の解釈 一時、量子力学の解釈は哲学的な問題と見なされていた。量子力学の枠組みは、数学的 には Hilbert 空間と呼ばれる複素数の関数空間で与えられる。その枠のなかで、空間上の点 (ベクトル) 、内積、ベクトルの規格(Norm)化、作用素、ユニタリ作用素 Unitary Operator, 固有値、固有ベクトル、基底による展開などが論じられるが、これらはほとんど数学の言 葉である。それらに、現実の観測行為や、観測値、物理量などを如何に対応させるかが、 物理学になる。量子力学の記述として Hilbert 空間が使われる大きな理由は、量子力学現象 が重ね合わせの原理にしたがっているからである。Hilbert 空間の雛形は線型空間である。 また物理的な状態に対応するベクトルが、複素数の関数であることは、そのままでは現実 の観測値にできないことと関係している。現実の測定できるのは、共役な関数あるいは数 を用いて積分した実の値である。 したがって、複素数の世界は、現実には見ることのできない世界である。しかし、それ はある種の因果律で支配され、状態であればシュレディンガーの方程式にしたがって推移 している。そうした複素数の世界は、観測という行為によって、実なる結果を返してくる のであるが、その値の可能性は限られている。それが、観測量 Observable の固有値である。 ただ観測によって、いずれの固有値が得られるかは、確率的である。その確率を与えるの が、この観測量に対応した作用素の固有ベクトルで展開した時の係数(の絶対値)である。 それゆえにこの展開係数は、確率振幅と呼ばれる。観測値が固有値に対応することは、そ れらが離散的である場合がありうることの根拠になっている。とくに、エネルギーの場合、 この離散(飛び飛びの値をとること)を特徴づけるのが、プランク定数である。 量子力学のこの確率的性格は、対象となる集団が多数の粒子から構成されているという ような、古典物理学の世界のそれとは異なっている。後者における確率の必要性は、「本当 は知ることができるのだが、数が多いので、それを実行するのは現実的でないので、統計 量で我慢しておく」という性格のものである。古典物理学の世界では、例え数が多くとも、 その気になれば、観測したり、決定したりできる筈であるという世界の話である。量子力 学では事情が異なる。どんなにその気になっても、ある量を正確に、あるいは確率的でな く、測ることはできないのである。この原理的な不可知性、あるいは、不弁別性こそ量子 力学の本質であり、また、決定論を好む研究者の攻撃の標的になってきた理由である。 そうした批判としてとくに有名なのは E. Schrödinger と A. Einstein の思考実験である。 これらは、それぞれ以下の論文で発表された。 E. Schrödinger, Naturwissenschaften 23, p.807、1935 A. Einstein, B.Podolsky, and N. Rosen, Can quantum-mechanical deswcription of physical reality be considered complete?, Physical Review, 47, 1935, pp.777-80 12 シュレディンガーの論文は、「シュレディンガーの猫」と呼ばれている仮想実験であり、 原子核の崩壊を検出できるガイガー・カウンターの出力を、猫を入れている容器の中の毒 ガス発生装置に導き、この容器の蓋を開くことを「観測の実施」と見なす。蓋が開けられ るまでの猫は、死んでいる状態と生きている状態が「重ね合わされた」状態にいると解釈 されるパラドックスである。この仮想実験に関する論争はまだ決着していない。 アインシュタインらの論文は、3人の名前をとって、EPR という固有名詞で呼ばれてい る。この論文の主張を今日的な言葉で表現すれば、(1)量子力学の解釈をめぐっては、隠 れた変数を持ち出して遠隔作用を否定する理論が提出されてきたが、量子力学はそうした 理論とは整合性のとれない理論である、(2)量子力学はそれ自身、非局所的 Non-local な 理論である、ことを主張している、とされている。その後 EPR の妥当性を検証する実験的 な方法として、ベルの不等式が提案された(1964 年)。現在は、実験技法の進歩で、この不 等式による EPR 効果、つまり、遠隔作用の存在(非局所性)は証明されたような状況にあ る。ただしこの現象は、現在の量子情報の主要な課題の一つとなっている。 量子力学においても日常的な意味での統計的な問題はある。それらには、多体問題(同 種の多粒子系)や古典統計力学が対象にしたのと同じような系を扱う場合に出会うことに なる。この場合に注意すべきは、量子力学本来の確率性、統計性と、日常生活の意味での それを明確に区別することである。 なお、量子力学の創設期に強い影響力を発揮した、N. Bohr は相補原理を提唱し、不確定 性関係すら、そのひとつの現れであると主張した。 13 5.6 量子力学による計算事例 量子力学が形をなした 1920 年代に Dirac 語ったという次の宣言は有名である。 The underlying physical laws necessary for the mathematical theory of a large part of physics and the whole chemistry are thus completely known, and the difficulty is only that exact application of these laws leads to equations much too complicated to be soluble. その後誕生した計算機は、計算の困難さを大きく改善したが、初学者にとって理解しや すい、理論的な扱いがやさしい問題はそう多くない。以下はその例外的な課題である。 5.6.1 自由粒子 空間中を他から力を及ぼされないで自由に運動している、粒子を考える。最も簡単なの は、粒子が、質量mを有する、古典力学の質点とみなせる場合である。もう少し複雑なの は、統計力学でいう単一成分の完全(理想)気体の場合である。この場合は、粒子は分子 であり、全体で回転したり、原子間の距離が周期的に変化する振動があったりする。また、 完全気体の場合は、容器には閉じ込められて入るが、ポテンシャル場などはなく、互いに 衝突する機会がないと近似でき、壁では完全に弾性的(エネルギーの消費がなく)跳ね返 ると仮定してよい粒子を想定する。ただ、容器に入れられているという条件は、無限に高 い障壁の中で運動しているとしてもよい。後者の場合も、境界条件を適当にすると、解は 平面波で与えられる。 完全に自由に運動する粒子 時間に依存した一般の Schrödinger の方程式は、 iη ∂ Ψ = HΨ ∂t であるが、一般に、自由粒子のような、孤立した系のエネルギーは保存されるので、ハミ ルトニアンは、時間に依存しないと仮定できる。このよう系の状態は定常状態 Stationary State にあるという。この場合のエネルギーを E とすれば、これは普通の数(実数)である。 これを用いて、Schrödinger の方程式の解は、 Ψ = Ψ0 e − iEt / η , HΨ0 = EΨ0 となる。ただし、 Ψ0 は時間を含まない関数であり、上の第2の方程式の解である。 14 ここまでは一般的な議論であるが、ここで、自由粒子のハミルトニアンを H = 1 2 1 2 1 mv = p = ( p x2 + p y2 + p z2 ) 2 2m 2m ここで、運動量(成分)の微分作用素への置き換え、 p x → − iη ∂ ∂ ∂ , p y → − iη , p z → − i η , ∂z ∂x ∂y を行えば、 η2 ∂ 2 η2 1 ∂2 ∂2 2 2 2 ( px + p y + pz ) = − ( )=− ∆ + + H = 2m 2m ∂x 2 ∂y 2 ∂z 2 2m と表記できる。ここで、最後の辺への移行には、ラプラッシャン Laplacian と呼ばれる微 分に関する作用素表記、 ∂2 ∂2 ∂2 ∆≡ 2 + 2+ 2 ∂z ∂y ∂x を用いた。 − ∂2 ∂2 η2 ∂ 2 ( 2 + 2 + 2 ) Ψ0 = E Ψ0 2m ∂x ∂z ∂y − η2 ∆ Ψ0 = E Ψ0 2m 1次元の場合にこの方程式を書けば、 d2 2m Ψ0 = − 2 E Ψ0 2 dx η これは次の解をもつ。 15 Ψ0 = C e ipx / η , p = 2mE 時間依存の解は、 Ψ = C e − (i / η) Et + ( i / η) px , p = 2mE となる。これはエネルギー E が負でない時、任意の座標値に対して、有限の値になる。 5.6.2 閉じ込められた自由粒子 以下の議論は、バークレー統計物理学上、pp.185-191, マンチェスター統計物理学 I,pp.175-181. 自由粒子の定常状態の解 Ψ0 の方程式を次の形に書き直す。 ∆ Ψ0 + k 2 Ψ0 = 0 , ここで、k = 2mE / η これは一般的な古典的な3次元の波動方程式であり k は、波を表す3次元波数ベクトル、 kの大きさを表す。波動に関しては、さまざまな量が定義されている。それらの間の関係 は、 (位相)速度v, 振動数ν、角振動数ω、波長λとすれば、 k = 2π / λ , v = λν , ω = 2πν , v = ω / k となる。 いま、自由粒子が閉じ込められている容器を一辺の長さが L の立方体とする。 壁面でゼロとなる境界条件 最初に境界条件として、容器の面(壁の位置)で、解がゼロとなるものを採用する。こ の条件は、ちょうど両端が固定された弦の振動を3次元にしたものに相当する。この解を 定常波 Standing Wave と呼び、次のように表せる。 Ψ0 ( x , y , z ) = const . × sin ( ρ π2 k 2 = 2 ( n x2 + n y2 + n z2 ) , L n yπ n xπ nπ x ) sin ( y ) sin ( z z ), L L L n x , n y , n z = 1 . 2, Λ ρ ただし、ここで、 k は、3つの成分をもつベクトル k = ( k x , k y , k z ) になっている。 ρ π π π k = ( k x , k y , k z ) = ( nx , nx , nz ) , L L L 16 nx , n y , nz = 1. 2,Λ この解は、最初に仮定した境界条件を満足している。これを量子力学の解とみなすと、 2 η2 2 π 2 η2 2 π 2 η2 nx2 n\ y nz2 2 2 E= k = ( nx + n y + nz ) = ( + + ) 2m 2mL2 2m L2 L2 L2 もし、立方体の代わりに、辺の長さがそれぞれ Lx , L y , Lz , の直方体だとすれば、 2 η2 2 π 2 η2 nx2 n\ y nz2 E= k = + ) ( + 2m 2m L2x L2y L2z となる。上の、 nx , n y , nz = 1. 2, Λ は量子数である。 周期的な境界条件 簡単のために再び一辺が L の立方体の場合を考え、L の周期で解が等しくなるという境 界条件を設定する。すなわち、 Ψ0 (0, y , z ) = Ψ0 ( L, y , z ), Ψ0 ( x,0, z ) = Ψ0 ( x, L, z ), Ψ0 ( x, y ,0) = Ψ0 ( x, y , L ), この解は、同じく波数ベクトルと3組の整数をもちいて、 ρρ Ψ 0 ( x , y , z ; n x , n y , n z ) = const . × exp ik ⋅ x ρ 2π 2π 2π k= ( nx , ny , nz ) , n x , n y , n z = 1. 2, Λ L L L ρ ρ p = ηk , E ( n x , n y , n z ) = p 2 / 2 m = η 2 k 2 / 2 m ρ となる。これは自由粒子の解と同じ平面波である。ベクトル k は3つの数の組、 nx , n y , nz = 1. 2, Λ で指定される飛び飛びの値しか取れない。それらの存在点は、かんか 間隔が、 2π / L である格子点である。 状態数 17 同じような自由粒子が多数あるとする。これは互いに相互作用していないと仮定する。 ρ 立方体に閉じ込められ、周期的な境界条件にしたがう粒子の場合、 k が k + dk である k の 数は、間隔が 2π / L である格子空間で、半径が k と k + dk の球面に挟まれた球殻の体積 4πk 2 dk の中に含まれる格子点の数に等しい。格子点を密度を f (k ) とすれば、 f (k ) dk = (4πk 2 dk ) /( 2π 3 Vk 2 dk ) = 2π 2 L となる。これを運動量で表現すれば、 f ( p) dp = V 4π p 2 dp h3 となる。 上記の2つの境界条件は同じ状態数を与える。最初の境界条件の場合の状態数は、k の角 成分に関し、正の値の象限を問題にする。これは、第2の境界条件の 1/8 の範囲である。と ころが、格子間隔は π / L で半分であり、格子点の密度は8倍稠密である。したがって、状 態数は同じになる。 平均エネルギー N個の自由粒子が長さ Lx , L y , Lz , の直方体に入れられ平衡状態にあるとする。この系を 構成する個々の粒子は、上で見たように離散的なエネルギー値、 ε 1 , ε 2 , ε 3 , ..., ε i , ... をとると、1つの分子を独立した系と考えると、それが特定のエネルギー ε i をとる確率 P (ε i ) は、ボルツマン分布、 e −ε i / kT , P (ε i ) = Z Z = ∑ e −ε i / kT i で与えられる。このZは状態和あるいは分配関数と呼ばれる。 新しいパラメーターを、 β = 1 / kT とすると、分配関数は β の関数として、 18 Z ( β ) = ∑ e − βEi i と表せ、これにより。 E ≡ P( Ei ) = e −ε i / kT ∂ ln Z =− Z ∂β とも書ける。 Z = ∑ exp [ − βπ 2 η2 nx2 nx , n y , nz ( 2m L2x + n\2y L2y + nz2 )] L2z ここで、 nx , n y , nz = 1. 2, Λ はすべての可能な値をとる。 Z = Zx Zy Zz 、 ∑ exp [ − Zi = ni βπ 2 η2 ni2 2m L2i i = x, y , Z ], の形に変数分離できる。それぞれの項は、 Zi = ∫ = ( ∞ 1/ 2 exp [ − 2m β )1 / 2 ( βπ 2 η2 n i2 2m L2i ] dn i , Li ∞ ) exp [ − u ]du , π η ∫0 i = x, y, z u ≡( 2m β )1 / 2 ( ここで、積分の下限を変えたが、これから生ずる誤差は無視できる。 ∫ ∞ 0 exp [− u ]du = π / 2 積分を実行すれば、 Z i = ( m / 2π / η ) Li / β , Z = ( m / 2π / η ) 3 Lx Ly Lz β 3 / 2 = ( m / 2π / η ) 3 Vβ 3 / 2 19 πη L ) ni となる。これより、 ln Z = ln V − 3 ln β + 3 ln ( m / 2π / η ) 2 これより、平均エネルギーを求めると、 e −ε i / kT ∂ ln Z =− Z ∂β 31 3 ) = kT = − (− 2β 2 ε ≡ P(ε i ) = この結果は、1分子の平均エネルギーは、容器の体積に依存せず、(絶対)温度のみの関数 であることを示している。 E = Nε = 3 NkT 2 考えている気体が単原子でなく、上で考慮した重心の併進運動にあたる運動以外に、分 子としての回転のような自由度があるとすると、それらは独立に扱えるから、個々のエネ ルギー ε Total は、併進エネルギー ε trans と回転のエネルギー ε rotate の和になる。 ε Total = ε trans + ε rotate この場合も、エネルギーは容器の体積に依存しない。 5.6.3 調和振動子 Harmonic Oscillator 古典力学でおなじみのばねに結ばれた質点粒子の運動。線型振動子 Linear Oscillator と も呼ばれる。電磁場を始め、さまざまな場は、こうした振動子が沢山集まった系であると 近似される。古典力学の解は、3角関数の重ね合わせ、量子力学の解はエルミート Hermite 多項式によって得られる。 調和振動子の古典 (以下の古典的な扱いは、Courant & John, 404 による。 )力の定数を k , ( k > 0 ) とする ばねに結ばれた質量 m の質点が 1 次元の x 座標に関して、他の束縛や摩擦がなく自由に運 動している。座標の原点 x = 0 をバネの力が働かない点にとると、位置 x における力は、 − k x となる。ニュートン Newton の法則から、 20 m& x&= − k x この運動方程式だけでは、運動の様子は決定されない。それを決定するのが、初期条件で ある。ここで、初期条件として、 初期速度を、 x&t = 0 = v0 初期位置を、 xt = 0 = x0 、 とする。運動方程式を解くために、 ω = k / m とおけば、 d 2x = −ω 2 x 2 dt となる。ここで変数変換、 τ = ωt とおけば、 d 2x =−x dτ 2 この方程式の解として、 sin τ , cos τ があり、一般解はそれらの線型の重ね合わせ(1 次結 合)で与えられる。そして、初期条件が解を一意的に決定する。もとの方程式の一般解は、 x(t ) = c1 cos ωt + c2 sin ωt [問題] これが一般解であることを確かめよ。また、初期条件から、 c1 , c2 を決定せよ。 上記の一般解は、 x(t ) = a sin ω (t − δ ) = − a sin ωδ cos ω t + a cos ωδ sin ω t とも書ける。これは、一般解の係数を、 c1 = − a sin ωδ , c2 = a cos ωδ と置いたことに相当する。 この解は、 時間 (t ) に関して周期的であり、その間隔すなわち周期 period は、T = 2π / ω 、 最大の変位 maximum displacement あるいは振幅 amplitude は a 、で与えられる。周期の 逆数を 1 / T = ω / 2π 、を振動数、 ω を角振動 circular or angular frequency と呼ぶ。 古典的な調和振動子が重要な理由 フーリエ級数展開を思い出そう。 21 f ( x) = ∞ 1 a0 + ∑ (aν cos νx + bν sin νx), 2 ν =1 これは 2π の周期をもち、その周期の中で、連続かつ1次および2次微分可能な関数を、さ まざまな振動数を有する、調和振動子の解の線型結合であらわせるという定理であり、数 学においても、物理学においても重要な定理である。この複素への拡張がフーリエ変換で ある。例えば電磁場はさまざま振動数をもつ調和振動子の集合として扱われる。また、一 般の力学系でも、ある種の座標を導入すれば、系を調和振動子の集まりとみなすことがで きる。 解析力学による解法 古典力学の中で、量子力学の雰囲気を感じさせるのが、解析力学である。すでに述べ たように解析力学では、ある系を記述するのにハミルトンの正準方程式 Hamilton’s canonical equations を用いる。 p&k = − ∂H , ∂qk q&k = ∂H , ∂pk H = H ( p1 ,.., pk ,..., q1 ,..., qk ...) ここで qk 座標と運動量 pk は、互いに共役 Conjugate な正準変数 Canonical variable と呼 ばれる。ハミルトン関数 H はこれらの変数の関数であり、系の全エネルギーをあらわす。 ハミルトン関数は、運動エネルギー,T と位置 Potential エネルギー,V の和である。位置 Potential エネルギーは、 F = − ∇V によって力 F と結びついている。上で論じた、ニュートン Newton の運動方程式、、 m& x&= − k x にしたがう、調和振動子の場合、 V = kx 2 , 2 F =− dV = − kx dx である。ただし、以下では座標を x の代わりに q と書く。ハミルトン関数は、 H = T +V = ここで、 ω = mq&2 kq 2 mq&2 mω 2 q 2 + = + , ただし、 ω = 2 2 2 2 k/m k / m は、最初の議論と同じである。ここで、新しい変数の組 P, Q を。 22 2P sin Q, mω q= p= 2mωP cos Q によって導入し、ハミルトン関数を書き換える。 H = ωP cos 2 Q + ωP sin 2 Q = ωP ここで、 P, Q は、新しい正準変数の条件を満たしている。その意味は、 p, q の代わりに、 この2つの変数によっても、ハミルトンの正準方程式が満足されるとい意味である。ここ では、このことを証明なく、使う(Goldstein, Classical Mechnics, p.246)。 これより、系のエネルギーE を思い出すと、P は、エネルギーを角振動数で割ったものとな る。すなわち H = E = ωP, P = E /ω 。 ハミルトンの正準方程式を Q に関して解くと、 ∂H Q&= =ω ∂P これより、 Q= ∂H = ωt + α , ただし、αは初期条件で決定される定数 ∂P これより、 q= 2E sin (ωt + α ) mω 2 これも調和振動子の解であり、実は、最初の議論と同じ内容を含んでいる。 量子力学による扱い 量子力学においても、調和振動子は極めて重要なモデル系である。単一系の代表的な解 法は2つある。第1は、素直に Schrödinger の方程式を解析的に解く方法であり、第2は、 数の演算子 Number operator を使う方法である。後者の方法は、スピン角運動量や、多粒 子系の第2量子化でも使われる「格好のいい方法」である。いずれの方法も、古典力学の 23 ハミルトン関数に対応した量子力学のハミルトン演算子から出発する。その形は、 H = T +V = p&2 kq 2 p&2 mω 2 q 2 + = + , ただし、 ω = 2m 2 2m 2 k/m ただし、 p, q は観測量に対応した作用素である。 Schrödinger の方程式を素直に解く方法 ここで再び、 q を x に戻し、一般的な置き換え、 p → − iη d を行う。ただし、ここで dx は座標は1つだけだから、偏微分は微分となる。ここでもエネルギーを E とし、時間に依 存しない Schrödinger の方程式に代入すると、次の方程式をうる。 d 2ψ 2m 1 + 2 ( E − mω 2 )ψ = 0 2 dx η 2 ここで変数変換を行い、座標 x の代わりに次元のない変数 ξ = ξを mω x η を導入すると、 d 2ψ + [ (2 E / ηω ) − ξ 2 ]ψ = 0 2 dξ ここで、括弧の中の第1項を無視できるほど ξ 2 が大きくなる、 ξ の正負の遠方領域をかん がえると、 2 d 2ψ = ξ 2ψ , すなわち、 ψ (ξ ) = e ±ξ / 2 2 dξ をうるが、発散しない解を採用すると、一般解は、 ψ = e ±ξ 2 /2 χ (ξ ) と書け、 χ (ξ ) は、次の方程式を満たさねばならないことになる。 24 χ ' ' − 2ξχ ' + 2nχ = 0 ただし、 2n = ( 2 E / ηω ) − 1 、すなわち、 E = ηω ( n + 1 ) 2 となる。 上の χ に関する2階の常微分方程式の解は、エルミート多項式 Hermite Polynimoals、 H n (ξ ) で与えられる。すなわち、 χ = const. × H n (ξ ), 2 2 H n (ξ ) = ( − 1) n eξ d n (e −ξ ) / dξ n , n = 0,1, 2,Λ ここで1粒子系に関する分配関数 z を求める。 z= ∞ ∑e − βηωn e − β ηω 1 2 =e − βηω 1 2 − βηω (1 + e − βηω + e − 2 βηω + Λ ) = n=0 1 2 e 1 − e − βηω こうした粒子が N 個集まった系は、 − βηω 1 2 e Z =z =( )N − βηω 1− e N これより N 個の系の平均エネルギーは、 − βηω 1 − βηω 2 ∂ ln Z ∂ ∂ ln e e =− ) = − N{ E =− N ln ( − β ηω ∂β ∂β ∂β 1− e Nηω 1 1 1 = N ηω + = Nηω ( + βηω ) − βηω −1 2 1− e 2 e 1 2 − ∂ ln (1 − e − βηω )} ∂β となる。(バークレー統計物理上、問題 4.22) 5.6.4 軌道角運動量 Orbital Angular Momentum 3次元空間の中で運動している1つの粒子の座標がx、運動量がpである時、軌道角運 動量 m を、ベクトル記法で、 m= x× p 25 と定義する。成分で書けば、 mx yp z − zp y m y = zp x − xp z 、 mz xp y − yp x となる。この定義と座標と運動量との基本的な交換関係から、次の交換関係が導ける。 [mx , m y ] = mz , [m y , mz ] = mx , [ mz , mx ] = m y ここで、括弧は量子力学のポアッソン括弧式であり、一般的な定義は、 uv − vu = iη[u, v] 量子力学の系の座標 qk と運動量 pk の間には、 [qk , ql ] = 0, [ pk , pl ] = 0, [qk , pl ] = δ kl または、 qk ql − ql qk = 0, pk pl − pl pk = 0, qk pl − pl qk = iηδ kl という関係がある。 角運動量の交換関係は、ベクトル記法と括弧式により、 m × m = iη m 複数の粒子の角運動量(ベクトル) 、は互いに交換するので、総角運動量 M は、各粒子の 角運動量 mi の和 M = ∑ m になる(ここの m は、ベクトル成分ではなく、ベクトル自身)。 i i i ここで、軌道角運動量の大きさの 2 乗の相当するスカラー積 m 2 = mx2 + m y2 + mz2 を定義すれば、これは、軌道角運動量の3つの成分と交換する。そこで、これらのいずれ の成分と m とは、同時対角化できる。その時の同時固有状態ベクトルを、| l , m〉 と表記し、 2 次の固有値方程式を満たすとする。 m 2 | l , m ' 〉 = l (l + 1) η2 | l , m ' 〉 m x | l, m 〉 = m η| l, m 〉 ここで、 l は負でない整数であり、 m は、下記を満足する 2l + 1 の値をとる。 ' 26 − l ≤ m' ≤ l 具体的な固有関数を座標表示で求めるためには、運動量を座標微分演算で置き換えねば ならない。極座標、 r ,θ , φ ( r ≥ 0, 0 ≤ θ ≤ π , 0 ≤ φ ≤ 2π ) 、 x = sin θ cos φ y = sin θ sin φ z = r cos θ を採用すると、 mx = − iη ( − sin φ m y = − iη ( cos φ m z = − iη ∂ ∂ − cot cos φ ) ∂θ ∂φ ∂ ∂ − cot sin φ ) ∂θ ∂φ ∂ ∂φ 1 1 ∂ ∂ ∂2 (sin θ )+ m = −η sin 2 θ ∂ φ 2 ∂θ sin θ ∂ θ 2 2 となる。この演算子の固有関数は球面調和関数 Ylm (θ , φ ) を用いて求められる。 1 ∂ ∂ 1 ∂2 − (sin θ )+ Ylm (θ , φ ) = λ Ylm (θ , φ ) ∂θ sin 2 θ ∂φ 2 sin θ ∂θ この固有値方程式の λ = l (l + 1), ( l ≥ | m |, m は整数) に対する解として定義される。 5.6.5 球対称ポテンシャル中の粒子 水素原子の最も簡単な量子力学モデルは、球対称であるクーロン・ポテンシャル中で運 動する荷電粒子すなわち、電子である。この場合のクーロン力のポテンシャルは、極座標 をもちいた動径座標 r , ( r ≥ 0) を用いて、 V (r ) = − e r である。以下ではもっと一般の、ポテンシャル関数が r , ( r ≥ 0) だけに依存する場合をま ず考える。Schrödinger 方程式、 27 η2 ∂ 2 ∂2 ∂2 [− ( + + ) + V (r ) ]Ψ0 = E Ψ0 2m ∂x 2 ∂y 2 ∂z 2 は、極座標表記 ∂2 ∂2 ∂2 ∆≡ 2 + 2+ 2 ∂x ∂y ∂z = ∂ ∂ ∂2 1 ∂ 2 ∂ 1 1 1 + + ( r ) (sin θ ) ∂r ∂θ r 2 ∂r r 2 sin θ ∂θ sin 2 θ ∂φ 2 を用いることで、 − 1 1 ∂ ∂ 1 ∂2 η2 1 ∂ 2 ∂ ( r ) + (sin ) + θ Ψ + V (r ) Ψ = EΨ 2m r 2 ∂r ∂r r 2 sin θ ∂θ ∂θ r 2 sin 2 θ ∂φ 2 となる。この方程式は、 Ψnlm (r ,θ ,φ ) = Rnl (r ) Ylm (θ ,φ ) と置くことにより、動径部分と2つの角の部分の方程式に分離できる。すなわち、動径の 関数に関する 1 d 2 dR 2m λ (r ) + [ 2 ( E − V (r )) − 2 ] R(r ) = 0 2 r dr dr r η と2つの角の関数に関する 1 ∂ ∂ 1 ∂2 (sin θ ) + Ylm (θ , φ ) + λ Ylm (θ , φ ) = 0 ∂θ sin 2 θ ∂φ 2 sin θ ∂θ になる。後者は、 Ylm (θ , φ ) = Θ(θ )Φ (φ ) と置くことによりさらに分離できる。まず、 28 Φ m (φ ) = 1 imφ e , 2π mは正負の整数 次に、 Θ(θ ) = P ( w), w = cos θ と置けば、 d dP m2 [(1 − w2 ) ] + (λ − )P = 0 dw dw 1 − w2 が得られる。この方程式の解は、ジャンドル多項式 Legendre Polynomials で与えられる。 5.6.6 スピン系 量子力学の形成期に理論と実験との検証するモデルなったのが、水素原子のエネルギー 準位だった。上記の球面ポテンシャル中の粒子系は、実験値とよく一致した。すなわち、 それらは、主量子数 principle quantum number(または動径量子数 radial quantum number)、n, 副量子数(あるいは方位量子数軌道角運動量量子数 azimuthal or orbital quantum number)、l、磁気量子数 magnetic quantum number、m、の組み合わせで与え られる。最後のmは、ゼーマン効果と呼ばれる、一様な磁場の中に置かれた原子のスペク トル線(エネルギー準位)の分離をもたらす。しかし、この分離は、実際には、さらに微 細な分離が隠されていることがわかり(異常ゼーマン効果)、この実験事実を説明するため に、電子が軌道運動量とは別の内部的な回転自由度をもっていると結論づけられた。これ がスピン角運動量の発見である。後に、量子力学の対象となる電子、陽子、中性子、その 他の素粒子は、磁性を帯びた微小なコマのような回転に伴う「スピン Spin」という自由度 と磁気モーメントを有している。ただし、同じ回転に伴う自由度でも軌道角運動量は、古 典力学の角運動量に対応しているが、スピン角運動量は純粋に量子力学で扱われる自由度 であり、「コマのような」は全くの比喩であり、実際の運動の古典的な対応イメージではな い。 古典論との対応がうまくいかない理由はもうひとつある。古典電子論では、軌道角運動 量を有する荷電粒子は、その大きさに対応した磁気モーメントをもつ。粒子の電荷を e と すると、 ρ M = e ρ L 2mc ρ ρ となる。ただし、 L は軌道角運動量ベクトル、 M は磁気モーメントである。量子化された 29 ρ 電子の場合、電荷は負の-e となる。量子化された角運動量を L とした時、その磁気モーメ ρ ント µ は、 ρ µ=− e ρ L 2mc ρ であたえられる。これに対して内部自由度の回転にあたるスピン角運動量の場合、 L に対 ρ 応する量を S とすると、 ρ µ=− e ρ e 1 ρ ρ ησ = − µ B σ S =− mc mc 2 ρ となる。ただし σ は後ででてくるパウリのスピン行列を成分とするベクトルである。また、 また、 µB ≡ eη eh = 2mc 4π mc は、磁気モーメントの単位でボーア磁子と呼ばれる。 (注、この表記では、ディラックの教科書にならって、角運動量に η を含めている。これを 外に出した表記法だと、 ρ µ=− eη ρ L、 2mc ρ µ=− eη ρ S mc となる。) ρ ρ 磁場 B の中に置かれた磁気モーメント µ のエネルギーは、古典論、量子論ともに、 ρ ρ U = −µ⋅B である。 (これは、一般のポテンシャルの定義と同じく、力が F = − grad U で導かれること による。容易にわかるように、磁場と磁気モーメントは反平行の時、エネルギーは最大に なる。)ただし、量子力学の場合、このエネルギーは演算子であり、ハミルトニアン H (の 一部)となる。これは磁性に関する議論の基本になる。 30 磁性は、固体の中にスピンを有する磁性原子の状態によって決められる。最も簡単なモ デル系は、各原子のスピンが上向きか下向きかの2つの微視的な状態をとる。これは、統 計力学でよく使われるモデル系である。上の電子スピンのモデルは、この場合に、上向き と下向きをとる原子のスピンの磁気モーメントは、電子の µ に依存するとすれば、1電子 (原子)のエネルギーは、 ε =± µ B となり、分配関数は、 z = ∑ eε / kT = e βµB + e − βµB したがって、N 個の電子の分配関数は、 Z = z N = ( e βµB + e − βµB ) N これにより、ある体積を閉めている N 個の電子当たりのエネルギーは、 E =− ∂ ln Z e βµ B − e − βµ B = − µ BN βµ B ∂β e + e − βµ B 磁場の弱い時は、 M =| E e βµB − e − βµB µ 2 NB | = µBN βµB ≅ + e − βµB B e kT となり、磁場に比例した磁化が起きる。この比例係数を(定温)磁化率という。これを すれば、 χ= µ2N kT となる。高温では磁化率が小さくなる。 31 χと 復習:スピン角運動量 スピン角運動量(ベクトル) S の各成分の満たす交換関係は、軌道角運動量のそれと同 じに定義される。 [S x , S y ] = S z , [S y , S z ] = S x , [S z , S x ] = S y ベクトル記法で書けば、 S × S = iη S となる。 ただし、軌道角運動量と違い、その表現行列は2行2列であり、 S = ここで 1 ησ 2 σ の成分は、パウリ行列である。 スピンの状態は、一般に S z の2つの固有値、 ms = ± 1 、に対応した2つの固有状態の 2 重ね合わせで表現できる。 1 1 1 1 1 Sz | , ± 〉 = ± η | , ± 〉 2 2 2 2 2 これらは、z 軸に対してスピンが上向き、下向きの状態に対応している。これらの固有状態 は、簡単に 1 1 1 1 | , + 〉 = | + 〉, | , ± 〉 = | − 〉 2 2 2 2 と書けば、一般のスピン状態は、この2つの状態の重ね合わせとなる。その係数を χ + , すれば、 χ+ | χ 〉 = χ + | + 〉 + χ − | − 〉 = χ− と表される。これを2成分スピノールと呼ぶ。 パウリ Pauli 行列 以下の2行 2 列の行列のうち、最初の3つをパウリ行列という。 32 χ− と 0 − i 0 1 1 0 1 0 , σ z = , σ 0 ≡ E2 = σ x = , σ y = 1 0 0 0 1 0 1 − i 問題:任意の2行 2 列の行列は、単位行列とパウリ行列の線型結合(1 次結合)で表せる。 (ヒント)ある要素が1で他の 3 要素が0である4つの行列が。こうした線型結合になる ことを証明すればよい。 交換関係 パウリのスピン行列の間には、通常の 2 行 2 列の行列と同じ規則の積が定義できる。こ れに関して、 σ iσ j − σ jσ i = 2iσ k , σ iσ j + σ jσ i = 2δ ij , ここで、 (i, j , k = x, y, z ) が成り立つ。ここで、 δ ij は、クロネッカーのデルタである。 ベクトル記法により、パウリ行列を成分とするベクトル σ を定義できる。すなわち、 σ = (σ x , σ y , σ z ) . 問題(河原林 p.101): A, B を任意の 2 行 2 列行列とする時、 (σ・A) (σ・B) = A・B + iσ・( A × B) . 問題:3 次元の任意の単位ベクトル n に対して (σ・n) = σ 0 ≡ 1 が成り立つ。 2 問題(河原林 p.101):同じく任意の単位ベクトル n 、実数 φ にたいして、 e − iφσ ⋅n = (cos φ ) 1 + i (sin φ ) σ ⋅ n 問題(吉川 p.62):任意の 3 次元ベクトル v = (v x , v y , v z ) に対して、 vz , vx − i v y , また、| v | = v x 2 + v y 2 + v z 2 (v・σ ) = v xσ x + v yσ y + v zσ z = v +i v , −v y z x とする時、下記が成り立つ。 33 e iσ ⋅v = (cos | v |) 1 + i v ⋅ σ (sin | v |) スピン回転行列の表現 3 次元空間のおける Euler 角 α , β , γ のスピン 1/2 の回転、D (1/ 2) (α , β , γ ) を表す 2 行 2 列 の行列は、 D(1/ 2) (α, β , γ ) = e α β γ −i σ x −i σ y −i σ z 2 2 2 e e − 2i (α +γ ) β e cos 2 = i (α −γ ) β e2 sin 2 β sin 2 i (α +γ ) β e2 cos 2 −e i − (α −γ ) 2 と表現される。(吉川 p.135-136)、(河原林 p.101-102) 5.7 量子力学の現在 この章は、量子力学が形成される歴史から始めた。それは、1928 年のディラックの相対 論的量子論によって一応の完成をみた。専門家でさえ、この理論の本質を明快に理解して いるとは言えないほどの難解さを秘めてはいても、さまざまに工夫されながら、現実問題に 適用されることにより、確かな理論としての評価をゆるぎないものとした。それでは、こ の理論は、その後さらにどのように進化して、今日に至っているのか。以下これについて 簡単に述べておこう。 より高次の理論をめざして 量子力学発展の本道と言えるのは、さらに極微、さらに高エネルギーの自然現象を支配 する法則を求めた挑戦であろう。量子力学が一応完成したすぐ後の 1932 年に中性子、陽電 子、翌年はニュトリーノなどが発見され、素粒子物理学の幕が開いた。その後、巨大加速 器のような人工的な装置を使った実験と自然界に見られる高エネルギー現象である宇宙線 の観測によって、さらに多くの素粒子、基本的な粒子が発見された。それらを整然と分類 し、それらの間の相互関係や相互作用のメカニズムを説明する理論が研究された。これは 量子力学をさらに洗練する試みである。こうした理論家の挑戦に立ちはだかった最初の難 問は、電磁場の量子化である。これはマックスウエルの電磁気学の量子化であるが、無限 大の解消に悩まされた。この難問は、繰り込み理論と呼ばれる、処理によって、一応解決さ れたが、多くの研究者がこれは抜本的な解決策ではないと感じていた。その後、多数の素 粒 子と それら の間 に働く 力と をうま く分 類、整 理す るクォ ーク Quark 仮説 が、 M. 34 Gell-Mann や日本の研究者らによって提出され、実験がこれを検証した。クォークを説明 するための基礎になったのが、量子色力学 Quantum Chromodynamics と呼ばれる理論で あり、それは次第に正しいと認められるようになった。クォークは核力のような強い力の 理論である。これに対して、ワインバーグとサラムが弱い相互作用と電磁気力を含んだ理 論をつくった。これらの理論が確立したのは、だいたい 1982 年頃のことである。これは素 粒子物理学の幕が開いてからちょうど50年になる。これらの理論は、さらに互いの理論 を統一する方向を模索している。この他に自然界には、アインシュタインの一般相対論が 問題にした重力がある。後者を含めた「大統一理論」が、現在の理論物理学の目標である。 観測と解釈の問題 量子力学の形成期に活発に行われていた観測と解釈の問題は、量子力学の概念的な基礎 を明確にするために必須の作業だった。この問題は決して明快に解決されたわけではない が、量子力学の応用はそれを横目に見ながら活発に展開され、成功を収めた。したがって、 一般の物理学者は、決着がつきそうもない思考実験問題を相手にする必要を感じなくなっ てきた。つまり、そうした問題を理解しなくても、当面の問題解決には困らなくなってい た。それでも、観測問題に関する会議がいくどか開かれ、議論がなされてきた。 最近こうした状況に変化がみられるようになってきた。その一つの理由は、実験技術が 進歩したことによって、かっての思考実験が、いまや実際に試みて見られる実験になって きたことである。このことを関係するが、量子計算への関心の高まりである。こうした潮 流は、最初に観測理論を構築した J. von Neumann の仕事、とくに密度行列(演算子)に よる形式の重要性を再認識させることになった。あまり難解なので「読まん本ノイマン」 と呼ばれてきた彼の「量子力学の数学的基礎」 (1932 年刊)が再び脚光を浴びてきたのであ る。 その大きな契機となったのは、アインシュタインらの EPR やシュレゲィンガーの猫の問 題の中核である(量子的)絡み合い Entanglement や局所性 Locality に対するベルの不等 式や Kochen-Specker の定理を実験によって検証する試みが可能になり、その結果がアイン シュタインら主張を否定するものであったことである。いまやこうした研究は哲学ではな く、物理学になり、量子計算や量子情報という応用の視点からも関心をもたれるようにな ってきた。 計算理論の進歩 量子力学が最も広く使われているのは、原子、分子、固体とくに磁性や半導体の問題だ ろう。こうした問題には、超伝導や超流動など、古典物理学では扱えない現象も含まれて いる。ここでの主要な課題は、「如何に精度の高い近似的な解を求めるか?」という計算技 法を開発する問題になっている。とくに、最もエネルギー準位の低い(基底)状態を利用 して、より高い準位の状態を求める摂動法の改良が試みられた。量子力学の解法としては、 35 シュレディンガーの描像(表示)によるシュレディンガー方程式を解く方法が最もよく知 られているが、この他にもハイゼンベルクの描像(表示)による運動方程式を解く方法も、 量子力学の建設期から知られていた。その後、ファイマンの経路積分による方法が発表さ れて人気を博するようになった。この独特の方法は、ファイマンが学生時代に考案した計 算法で、変分原理、解析力学の作用積分の方法を発展させたものである。この方法は多く の応用がなされている非相対論的量子力学では、計算が煩わしいだけで、特に有用ではな いが、場の量子論や(量子)統計力学では、便利な方法であると評価されている(例えば、 Sakurai pp. 1109-123)。量子力学が2電子原子、分子、同種の多粒子系、統計力学。化学 反応に本格的に応用され始めたのは、理論が完成した直後の 1930 年代からのことである。 それ以後、量子力学の枠の中ではあるが、より複雑な系を相手にできるように計算方法に は、工夫が凝らされてきた。対称性に注目した群論の応用もその一つである。 計算技法の進歩 計算の理論が進歩しても、量子力学で解析的な解を求められる問題は、例外的に少ない。 これを補うのが、計算機を使った数値計算である。現在のコンピュータを物理学の問題に 応用した先駆者は、最初の計算機の開発に関わった von Neumann とフェルミ Fermi だっ た。当時の電子計算機と今の超高速計算機の性能は隔絶している。計算機の進歩は、数値 計算だけでなく、その前段階の数式処理の自動化も可能にした。ウォルフマンらの開発し た Mathematica は、その一例である。計算のためのプログラムの作成(プログラミング) も組織的、集団的に行われるようになり、大規模なパッケージが使われるようになってき ている。量子化学の各種のパッケージは、その例である。ただしそうした大きなプログラ ムの間違えを発見することも難しくなってきている。 36 第5章の参考文献 量子力学の参考書は膨大な数になる、以下はその一部である。 比較的新しいやしく書かれた教科書 砂川重信、量子力学の考え方、岩波書店、1993 量子力学と基礎数学 今村勤、物理と行列、岩波書店、1994 竹内外史、線形代数と量子力学、1981 量子力学の教科書(古典) 朝永振一郎、量子力学(I, II)、みすず書房、1969, 1952 P.M.A. Dirac, The Principles of Quantum Mechanics (4th ed.), Oxford Univ. Press, 1963 R. P. Feynman, Feyman Lectures on Physics, vol. 5, Addison-Wesley, 1965? L.D. Landau and E. M. Lifshitz, Quantum Mechanics, Addison-Wesley, 1958 A. Messiah, Quantum Mechanics, Interscience, 1961 L. Schiff, Quantum Mechanics (3rd ed.), McGraw Hill, 1968 L. Pauling and E.B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill, 1935 量子力学のパイオニアたちによる本 Heisenberg, Principles on Quantum Mechanics, W. Pauli、Quantum Mechanics 現代的な教科書 J.J. Sakurai, Modern Quantum Mechanics,1986/1994 河原林研、量子力学(岩波講座 現代の物理学3、第2次刊行版)、岩波書店、1997 A. Peres, Quantum Theory: Concepts and Methods, Kluwer Academic, 1993 (大場一郎、山中由也、中里弘道 共訳:量子論の概念と手法、丸善、2001 年 量子情報、量子計算の入門書 M. Nielson and I. Chuang, Quantum computation and quantum information, Cambridge University Press, 2000(これは 700 頁近いが、基礎的なことがよく書いてある。) 37 量子力学の成立に関する読み物は沢山ある 古典物理学から量子力学への転換を数学的な道具とともに解説した名著 A. d’Abro, THE RISE OF THE NEW PHYSICS (Two volumes), D. Van Nostrand, 1939 (Dover edition, 1951) 20世紀の物理学に関しては エミリオ・セグレ/久保亮五、矢崎裕二訳、X 線からクォークまで、みすず書房、1982 年(イ タリア語の原著、1976 年;英訳版、1980 年) 量子論が誕生した頃の数学に関しては、 C.リード/いやなが健一訳、ヒルベルト、岩波書店、1972 年(C. Reid, Hilbert, Springer, 1970) アインシュタインの業績に関しては、 P.A.Schilpp ed., Albert Einstein: Philosopher-Scientist Vol 1, Tudor Publishing, 1949 量子力学の数学的手法の古典 H. Wyel/ translated by H.P. Robertson, The Theory of Groups and Quantum Mechanics, Dover, 1950 John von Neumann, Mathematische Grundlagen der Quantummechinics, Apringer, Berlin,1932 (英 語訳、R. T. Bayer, Mathematical Foundation of Quantum Mechanics, Princeton University Press, 1955; 井上健、広重徹、恒藤敏彦訳、量子力学の数学的基礎、みすず書房、1957 年)、この 中の5章、6章が観測の理論になっている。 物理と情報に関する読み物 Hans Christian von Baeyer, Information The New Language of Science, Weidenfeld & Nicolson, London, 2003 量子力学と観測の理論に関する論文集 J. Archibald Wheeler and W. H. Zurek (eds.), Quantum Theory and Measurement, Princeton Univ. Press, 1983 P. Gibbins, Particles and Paradoxes The limit of Quantum Logic, Cambridge Univ. Press, 1987(P. ギビンズ/金子務、宇多村俊介訳、量子論理の限界、産業図書、1992 年). 38 高林武彦、量子力学―観測と解釈問題、海鳴社,2001 高林武彦、量子力学とは何か,サイエンス社,1999. 清水明、新版量子論の基礎―その本質のやさしい理解のために、サイエンス社、2004 年 量子電磁力学(場の理論)の発展史 S. S. Schweber, QED and the Men Who Made It, Princeton University Press., 1994 西島和彦、素粒子の統一理論に向かって、岩波書店、1995 南部陽一郎、クゥオーク、講談社(ブルーバックス)、 量子色力学の教科書 牟田泰三, Foundations of Quantum Chromodynamics , 1998 年(第2版) 39 第 5 章の補遺 量子力学の数学と表記法のお浚い 複素数と指数関数 量子力学では、複素数が基本になる。そこで、複素数とその関数としてよくでてくる指 数関数についてお浚いする。 Taylor テイラー級数展開 ある領域で定義された実数あるいは複素 x の関数は以下のように展開できる。 f ( n ) ( x0 ) ( x − x0 ) + Λ = f ( x) = f ( x0 ) + f ' ( x0 )( x − x0 ) + Λ + n! ∞ ∑ k =0 f ( k ) ( x0 ) ( x − x0 ) k! ただし、いずれの場合も微分係数の存在と、収束が保証されているとする。 複素数の指数関数 , x, y は実数)に対して、 複素数、 z = x + i y( e iy = cos y + i sin y 、 e z = e x (cos y + i sin y ) 、 と定義される。最初の式から、 cos y = e iy + e − iy , 2 sin y = eiy − e − iy 2i 指数関数、3角関数の級数展開 ez = 1 + z + z2 zn +Λ + +Λ 2! n! cos z = 1 − z2 z4 z6 + − +Λ 2! 4! 6! sin z = 1 − z3 z5 z7 + − +Λ 3! 5! 7! この級数展開は、指数関数の3角関数による和の表現と整合性がとれている。 演算子の指数関数 量子力学の演算子 A の指数関数を次のように級数、あるいは極限として定義する。 ∞ e xA xk k x = ∑ A = lim (1 + A) k → ∞ k k k = 0 k! (注)量子力学では物理量は下記の線形代数の演算子に対応する。演算子の具体的な表現 1 は行列であるから、上記の例は、行列を変数と見なした関数の一例である。こうした関数 の扱いで注意すべきことは、演算子の間の可換性である。演算子も行列の可換性が保証さ れていないから、2つの演算子(行列)の積を入れ替える場合には、注意が必要である。 2つ以上の変数の積を入れ替える場合には、わざわざ交換関係(ポアッソンの括弧式)を 使わねばならない。 フーリエ変換とデルタ関数 もともと熱の伝導の解析から生まれたフーリエ変換は、量子力学でも、情報通信理工学 でも役に立つ理論であり、計算法である。ディラックの導入したデルタ関数もこの理論の 中でうまく説明される。また、自然な表示をとると、座標と運動量が互いにフーリエ変換 の関係で結ばれており、このことから不確定性関係が導かれる。これらのことは、ぜひま とめてお浚いされたい。 線形代数 量子力学の系の状態はヒルベルト空間の点に対応し、観測量はこの空間で定義された演 算子(作用素)である。そこでこれらの概念を、線形代数とともに、もう一度お浚いして おく。ただし、一般の教科書で説明されて事柄は省略するか、ごく簡単に説明し、そうし た本にあまり触れられていない必要なことがらを多少詳しく解説する。初等幾何学から容 易に類推できる線形代数(線形空間)は量子力学理論の基礎的な性格をつかむのに非常に 便利はモデルである。量子力学の本当の基礎はヒルベルト空間であるが、両者の違いは要 素が実数か複素数であるかと、次元が有限か無限かである。この違いは数学者には大きい が、物理学の場合、最初はあまり気にせず、線形代数でさまざまな性質や概念を直観的に 把握するのがよい。 線型空間 量子力学の重ね合わせの原理は、基本空間が線型であることを要求する。線形空間とは、 その空間に属する2つの元(げん、要素)の1次結合が、またその空間に属するものであ る。この空間の元はベクトルと呼ばれる。ベクトルとは数の組であるが、この数が実数の 場合を実線型空間、複素数の場合を複素線型空間と呼ぶ。ベクトルがn個の組に対応する 時、n次元線型空間と呼ぶ。こうした空間のうち、任意の2つの元に対してスカラー量(単 なる数)を対応させる内積を定義できるものを考える。 内積 x, y を2つの実線型空間ベクトルとし、それらがそれぞれ、( x1 , x2 ,Λ , xn ), ( y1 , y2 ,Λ , yn ) に 対応するとすれば、この時の内積は、 2 ( x, y ) = x1 y1 + x2 y2 + Λ + xn yn で定義される。 複素数の場合は、多少定義が異なる。それには複素数の共役数 conjugate を使う。ある複 素数zが実部 x と虚部 y によって、x+iy と表されるとすれば、z の複素共役(数)complex conjugate、z*は、x−iy で与えられる。(複素共役を z で表す記法もある。)ここで、もち ろん、 i = − 1 である。この記法を用いて、複素線型空間の2つのベクトル x, y の内積を、 ( x, y ) = x1 * y1 + x2 * y2 + Λ + xn * yn で定義する。 定義から次が成り立つ。 ( x, y ) = ( y, x) * = ( y1 * x1 + y2 * x2 + Λ + yn * xn ) * = x1 * y1 + x2 * y2 + Λ + xn * y 内積に関しては次のことが成り立つ。 (1) ( x, x) ≥ 0 (2) ( x, y ) = ( y, x) (3) (λx, y ) = λ ( x, y ) (4) ( x + y, z ) = ( x, z ) + ( y, z ) 次の不等式が重要である。 ノルム Norm と距離 内積が重要なのは、それによってノルムや距離を定義できるからである。ノルムはベク トルの大きさを抽象化した量であり、任意の要素に関して定義される。内積が定義されて いれば任意のベクトル x ノルム || x || は、 || x || = ( x, x) で定義される。ノルムに関しては次のことが成り立つ。 (1) || x || ≥ 0, ただし、等号は加法の単位元0に限る (2) 任意の実数λに対して、λ || λx || = | λ | ⋅ || x || (3)任意の2つのベクトルに対して、 || x + y || ≤ || x || + || y || ノルムに関しては、次の Cauchy-Schwarz 不等式が重要である。 3 | ( x, y ) | ≤ || x || || y || これより、 || x + y || ≤ || x || + || y || をうる。 上記のノルムによって、任意の2つのベクトル x, y の間に距離 d ( x, y ) を次のように定 義できる。 d ( x, y ) = || x − y || 実は、距離というのは、2つのベクトルによって定義される次の関係を満たす関数であ る。 (1) d ( x, y ) ≥ 0, ただし等号は、x= y のみ。 (2) d ( x, y ) = d ( y, x) (3) d ( x, y ) + d ( y, z ) ≤ d ( x, z ) 上の距離の定義は、実際にこれらの関係を満たす。なお、最後の(3)は、Cauchy-Schwarz の不等式から導かれる。 線型作用素 線型空間の任意のベクトルを他のベクトルに変換する写像(作用素)のうち、線型の性 質を満たすものを線型作用素(線型演算子)と称する。いま f が線型作用素だとすれば、 任意の数 a と、任意のベクトル x, y に対して、 f (ax) = a( fx), f ( x + y ) = f ( x)+ f ( y ) が成り立つ。n次元ベクトル空間の線型作用は、nxn 次の行列に対応させられる。演算子 f に対して 以下に量子力学の中でとくに重要な演算子を紹介する。 恒等演算子:これは、任意のベクトルをそれ自身に写像する、 f ( x) = x 、演算子であり、 普通 I と表記する。単位行列に対応する。 逆演算子:演算子 f に対して、 f −1 f = f f −1 = I となるような f −1 を逆演算子という。 f が 4 逆演算子を有するかどうかは、 f に対応した行列の行列式がゼロでないかどうかによる。 ゼロでなければ、逆行列が存在し、それに対応した線形演算子も存在する。行列式がゼロ でない行列を正則行列という。 射影演算子: P = I を満たす演算子であり、部分空間への射影を行う演算子である。 2 エルミート共役(演算子) :ある演算子 f に対して、エルミート共役 Hermite conjugate あ + るいは随伴 ajoint 演算子 f を、内積を利用して定義する。 ( f + x, y ) = ( x, fy ) + ある複素行列 H のエルミート共役行列 H は、 H を転置し、各要素を複素共役に置き換え た行列である。 ( H + )ij = H ji * エルミート共役な演算子が自分自身であるような演算子 f + = f は、エルミート Hermitian 演算子、あるいは自己随伴 self-ajoint 演算子という。量子力学の観測量は、このエルミー ト演算子に対応する。 ユニタリ演算子:ある演算子 U が、内積を不変にする時、すなわち、任意の2つのベクト ルに関して、 (Ux, Uy ) = (U +Ux, y ) = ( x, y ) を 満 た す 時 、 ユ ニ タ リ Unitary で あ る と い う 。 定 義 か ら 明 ら か に ユ ニ タ リ 性 は 、 UU + = U +U = I という条件と同等である。 物理学で重要な関係 3つの演算子 UとHとT の間の関係を、 U = exp [iαH ], T (t + ε , t ) = 1 + i ε H (t ) η で定める。ただし、αとtとε は実数のパラメータ、ε は ε が無視できるほど小さいとする。 2 この時、 U あるいは T がユニタリであれば H はエルミートであり、その逆も成り立つ。 5 注:ここでは演算子の関数を扱っている。行列と演算子の関数に関しては、後の記述を参 照のこと。 極分解。 A を行列とすると、正定符号行列 J と K 、およびユニタリ行列 U によって、 A = U J = KU と表現できる。これを A の極分解という。第2式は、右極分解、第3式は、左極分解と呼 ばれる。 特異値分解。 A を正方行列とすると、ユニタリ行列 U と V 、および対角行列 D によって A = U DV と表現できる(対角行列とは、対角要素だけがゼロでない行列である)。これを A の特異値 分解という。 Trace 行 列 の 対 角 要 素 の 和 を Trace あ る い は Spur と い う 。 行 列 A, B, C に 関 し て 、 Tr ( A − B ) = Tr ( A) − Tr ( B ), Tr ( AB ) = Tr ( BA) , Tr ( ABC ) = Tr (CBA) = Tr ( ACB ) ヒルベルト空間 Hilbert Space 内積と距離が定義された複素線型空間のうち、さらに完備性を備えたものがヒルベルト 空間である。完備性というのは、任意のコーシー列 Cauchy sequence がこの空間の中の点 に収束することを意味する。収束という概念は、空間の中の点列に定義された距離に依存 している。こうした距離は内積や距離によって定義されている。完備性はそれを一歩進め て極限においても同じ空間に属していることを保障する条件である。 量子力学の数学的な基礎になるヒルベルト空間は、無限次元のものを考えていたが、最 近は有限次元のヒルベルト空間が使われるようになり、無限次元という条件は取り去られ ている。 量子力学の表記法 量子力学は、上記のようなヒルベルト空間を基礎にしているが、そこで使われる表記法 6 は、数学のそれとかなり違っている。とくに量子計算や量子情報では、ブラ、ケット記法 を始めとするディラックが導入した便利な記法が使われているため、通常のベクトルや行 列の表記との翻訳が必要になる。また、物理学では和と積分との間を比較的自由に往来す る。これも収束性などに敏感な数学者には、違和感を与える数式処理である。これの多く は本質的な問題ではないが、便宜上は重要な問題である。数学と物理学の表記法の違いか らくるこうした心理的な障壁を除去するのに役立つよう、いくつかの点を説明しておく。 Dirac ブラケット記法 Dirac の記法のケットおよびブラ・ベクトルをそれぞれ縦および横ベクトルで表現する。 両者は実線型空間では転置の関係にあると見なせるが、複素空間ではエルミート共役の関 係にある。すなわち、ブラ・ベクトルの要素は、ケット・ベクトルを転置し、各要素を複 素共役に置き換えたものとなる。すなわち、 実数線型空間あるいは複素線型空間におけるベクトルと内積の表記、 v1 v v ≡ 2, Μ v n u + ≡ (u1*, u2 *,Λ , un *) ; (u , v) ≡ u1 * v1 + u2 * v2 + Λ + un * vn は、ディラック記法では、次のようになる。 v1 v | v〉 ≡ 2 , Μ v n 〈u | ≡ (u1*, u2 *,Λ , un *) ; 〈u | v〉 ≡ u1 * v1 + u2 * v2 + Λ + un * vn また、内積の定義から、 〈 u | v〉 * = 〈 v | u 〉 である。ケットの離散的な集合 {| ξ i 〉}, i = 1, 2,Λ が正規直交系をなせば、 〈ξi | ξ j 〉 = δ ij 7 となる。これは内積による直交の定義でもある。 ブラ・ベクトルの写像としての線型演算子は、エルミート共役であるケット・ベクトル に関する線型演算子との対応で定義される。 ( f | u 〉 ) + ≡ 〈u | f + この定義によれば、 (〈u | f + ) | v〉 = ( f +u, v) = (v, fu ) = 〈v | ( f | u 〉 ) となる。もし演算子がエルミート(自己共役)なら ( 〈 u | f + ) | v〉 = 〈 v | ( f | u 〉 ) = 〈 v | f | u 〉 と書くことができる。 2つのベクトル u, v に対して、ドット積・を次によって定義する。 v1u1* v1 v u * v2 + v ⋅ u ≡ ⋅ (u1*, u2 *,Λ , un *) ≡ 2 1 Μ Λ v v u * n n 1 v1u 2 * Λ v1u n * v2u 2 * Λ v 2 u n * Λ Λ Λ vnu 2 * Λ v n u n * このドット積に対応するディラックのブラ・ケット記法の量は、 v1u1* v1 v u * v2 | v 〉〈 u | ≡ ⋅ (u1*, u2 *,Λ , un *) ≡ 2 1 Μ Λ v v u * n n 1 v1u 2 * Λ v1u n * v2u 2 * Λ v 2 u n * Λ Λ Λ vnu 2 * Λ v n u n * であるが、これは演算子である。ここで、 | u 〉〈 u | はベクトル | u 〉 の張る空間への射影演算 子となる。 ドット積は、行列としては普通の掛け算である。順序を逆にすれば、これは2つのベク トルの内積となる。これとは別にベクトルあるいは行列の間に、テンソル積を定義できる。 テンソル積は次元を異にするベクトルあるいは行列の間にも定義できる。 8 A = [ Aij ], i = 1,Λ , m , j =1, Λ , n ; B = [ Bij ], i = 1,Λ , p , j =1, Λ , q とすれば、 A11B A12 B Λ A B A B Λ 22 A ⊗ B = 21 Λ Λ Λ Am1B Am 2 B Λ A1n B A2 n B Λ Amn B となる。ここで各要素は、行列 B によってさらに展開され、 nq × mp 次行列、 ( A ⊗ B)αβ = Aij Bkl , α = n(i − 1) + k , β = n( j − 1) + l となる。 ドット積もテンソル積も、基底となる座標系の選択に依存するが、いずれの座標を選択 しても同じ議論(数学的に同型となるので、ここでは露(あらわ)に基底を選択した表記 を省略している。テンソル積は、複合的な系の状態表現に使われる。 | α1 〉 ⊗ | α 2 〉 ⊗ Λ | α n 〉 ≡ | α 1 α 2 Λ α n 〉 ドット積を用いると、完全関係は、恒等演算子を用いて、 ∑ | i 〉〈 i | = I i と書ける。恒等演算子は対角成分がすべて1で、他はゼロの行列に対応する。完全関係に より任意のベクトルが展開できる。 | ξ 〉 ∑ | i 〉〈 i | = ∑ | i 〉〈 i | ξ 〉 = ∑ 〈 i | ξ 〉 | i 〉 i i i ここで展開係数 〈 i | ξ 〉 は複素数である。 座標と運動量との関係 量子力学における座標と運動量の間には、交換関係が成り立つ。すなわち、座標 qk と運 動量 pk の間には、 [qk , ql ] = 0, [ pk , pl ] = 0, [qk , pl ] = δ kl または、 qk ql − ql qk = 0, pk pl − pl pk = 0, という関係がある。ここで、 9 qk pl − pl qk = iηδ kl pk = − iη ∂ ∂qk とおいても、上の交換関係は満足される(Dirac, p.91)ので、両者を同一視する、という のが、量子力学の基盤となっている。 また、座標と運動量ベクトルは、任意のベクトルをそれぞれの固有ベクトルで展開でき るという意味で、完全系(基底)をなすが、そのために、デルタ関数を使った条件、 〈ξ ' |ξ '' 〉 = δ (ξ ' − ξ '' ) を仮定している。ただし、ここでξ , ξ は、座標または 運動量の固有値であり、離散値 ' '' の場合は、デルタ関数はクロネッカーのデルタで置き換える。この2つの関係から、両者 の表示を結ぶ 〈 q ' | p ' 〉 = c e ip ' q'/η 関係が導かれる。 この関係から、自由度が1の系の波動関数の座標表示と運動量表示の間には、 ψ (q' ) = 〈 q ' |ψ 〉 = h −1/ 2 +∞ +∞ −∞ −∞ −1 / 2 iq ' p ' / η iq ' p ' / η ∫ e 〈 p'|ψ 〉 dp' = h ∫ e ψ ( p' ) dp' +∞ +∞ −∞ −∞ ψ ( p' ) = 〈 p ' |ψ 〉 = h −1/ 2 ∫ e −ip 'q '/ η 〈 q' |ψ 〉 dq' = h −1/ 2 ∫e iq ' p ' / η ψ (q' ) dq' という関係がある。すなわち、両者はフーリエ逆変換とフーリエ変換の関係で結ばれてい るのである。自由度がより高い場合は、高次のフーリエ変換(および逆変換)となる。 パウリ Pauli 行列 以下の2行 2 列の行列のうち、最初の3つをパウリ行列という。 0 1 1 0 1 0 0 − i , σ 0 ≡ E2 = , σ x = − 0 0 1 0 1 σ x = , σ x = i 1 0 問題:任意の2行 2 列の行列は、単位行列とパウリ行列の線型結合(1 次結合)で表せる。 (ヒント)ある要素が1で他の 3 要素が0である4つの行列が。こうした線型結合になる ことを証明すればよい。 10 交換関係 パウリのスピン行列の間には、通常の 2 行 2 列の行列と同じ規則の積が定義できる。こ れに関して、 σ iσ j − σ jσ i = 2iσ k , σ iσ j + σ jσ i = 2δ ij , ここで、 (i, j , k = x, y, z ) が成り立つ。ここで、 δ ij は、クロネッカーのデルタである。 ベクトル記法により、パウリ行列を成分とするベクトル σ を定義できる。すなわち、 σ = (σ x , σ y , σ z ) . 問題(河原林 p.101): A, B を任意の 2 行 2 列行列とする時、 (σ・A) (σ・B) = A・B + iσ・( A × B) . 問題:3 次元の任意の単位ベクトル n に対して (σ・n) = σ 0 ≡ 1 が成り立つ。 2 問題(河原林 p.101):同じく任意の単位ベクトル n 、実数 φ にたいして、 e − iφσ ⋅n = (cos φ ) 1 + i (sin φ ) σ ⋅ n 問題(吉川 p.62):任意の 3 次元ベクトル v = (v x , v y , v z ) に対して、 vz , vx − i v y , また、| v | = v x 2 + v y 2 + v z 2 (v・σ ) = v xσ x + v yσ y + v zσ z = v +i v , −v y z x とする時、下記が成り立つ。 e iσ ⋅v = (cos | v |) 1 + i v ⋅ σ (sin | v |) スピン回転行列の表現 3 次元空間のおける Euler 角 α , β , γ のスピン 1/2 の回転、D (1/ 2) 11 (α , β , γ ) を表す 2 行 2 列 の行列は、 D(1/ 2) (α, β , γ ) = e α β γ −i σ x −i σ y −i σ z 2 2 2 e e − 2i (α +γ ) β e cos 2 = i (α −γ ) β e2 sin 2 β sin 2 i (α +γ ) β e2 cos 2 −e i − (α −γ ) 2 と表現される。(吉川 p.135-136)、(河原林 p.101-102) 軌道角運動量 Orbital Angular Momentum 3次元空間の中で運動している1つの粒子の座標がx、運動量がpである時、軌道角運 動量 m を、ベクトル記法で、 m= x× p と定義する(m の代わりに L が使われることも多い)。成分で書けば、 mx yp z − zp y m y = zp x − xp z 、 mz xp y − yp x となる。この定義と座標と運動量との基本的な交換関係から、次の交換関係が導ける。 [mx , m y ] = mz , [m y , mz ] = mx , [ mz , mx ] = m y ここで、括弧は量子力学のポアッソン括弧式であり、一般的な定義は、 uv − vu = iη[u, v] 量子力学の系の座標 qk と運動量 pk の間には、 [qk , ql ] = 0, [ pk , pl ] = 0, [qk , pl ] = δ kl または、 qk ql − ql qk = 0, pk pl − pl pk = 0, qk pl − pl qk = iηδ kl という関係がある。 角運動量の交換関係は、ベクトル記法と括弧式により、 m × m = iη m 12 複数の粒子の角運動量(ベクトル) 、は互いに交換するので、総角運動量 M は、各粒子の 角運動量 mi の和 M = ∑ m になる(ここの m は、ベクトル成分ではなく、ベクトル自身)。 i i i ここで、軌道角運動量の大きさの 2 乗の相当するスカラー積 m 2 = mx2 + m y2 + mz2 を定義すれば、これは、軌道角運動量の3つの成分と交換する。そこで、これらのいずれ の成分と m とは、同時対角化できる。その時の同時固有状態ベクトルを、| l , m〉 と表記し、 2 次の固有値方程式を満たすとする。 m 2 | l , m ' 〉 = l (l + 1) η2 | l , m ' 〉 m x | l, m 〉 = m η| l, m 〉 ここで、 l は負でない整数であり、 m は、下記を満足する 2l + 1 の値をとる。 ' − l ≤ m' ≤ l 具体的な固有関数を座標表示で求めるためには、運動量を座標微分演算で置き換えねば ならない。極座標、 r ,θ , φ ( r ≥ 0, 0 ≤ θ ≤ π , 0 ≤ φ ≤ 2π ) を採用すると、 mx = − iη ( − sin φ m y = − iη ( cos φ m z = − iη ∂ ∂ − cot cos φ ) ∂θ ∂φ ∂ ∂ − cot sin φ ) ∂θ ∂φ ∂ ∂φ 1 1 ∂ ∂ ∂2 m 2 = − η2 (sin θ )+ sin 2 θ ∂φ 2 ∂θ sin θ ∂θ となる。この演算子の固有関数は球面調和関数を用いて求められる。 スピン角運動量 量子力学の対象となる電子、陽子、中性子、その他の素粒子は、磁性を帯びた微小なコ マのような回転に伴う「スピン Spin」という自由度と磁気モーメントを有している。同じ 回転に伴う自由度でも軌道角運動量は、古典力学の角運動量に対応しているが、スピン角 13 運動量は純粋に量子力学で扱われる自由度である。スピン角運動量(ベクトル) S の各成 分の満たす交換関係は、軌道角運動量のそれと同じに定義される。 [S x , S y ] = S z , [S y , S z ] = S x , [S z , S x ] = S y ベクトル記法で書けば、 S × S = iη S となる。 ただし、軌道角運動量と違い、その表現行列は2行2列であり、 S = ここで 1 ησ 2 σ の成分は、パウリ行列である。 スピンの状態は、一般に S z の2つの固有値、 ms = ± 1 、に対応した2つの固有状態の 2 重ね合わせで表現できる。 1 1 1 1 1 Sz | , ± 〉 = ± η | , ± 〉 2 2 2 2 2 これらは、z 軸に対してスピンが上向き、下向きの状態に対応している。これらの固有状態 を、簡単に 1 1 1 1 | , + 〉 = | + 〉, | , ± 〉 = | − 〉 2 2 2 2 と書けば、一般のスピン状態は、この2つの状態の重ね合わせとなる。その係数を χ + , すれば、 χ+ | χ 〉 = χ + | + 〉 + χ − | − 〉 = χ− と表される。これを2成分スピノールと呼ぶ。 複合系 Composite system の記述 14 χ− と 複合系の記述にはテンソル積を用いる。ここで、複合系とは2つの電子、あるいは電子 と陽子、同種粒子の集まり、スピン統計の異なる異種粒子の集まりなど物理的に分別可能 と思われる複数の系の集合である場合もあるし、弁別できない N 個の同種粒子系のうちの s 個と N − s 個という相補的な、しかし実際に弁別不可能な複数の系である場合もある。 複合的な系の状態表現するに使われる | α1 α 2 Λ α n 〉 は、実はテンソル積、 | α1 α 2 Λ α n 〉 ≡ | α 1 〉 ⊗ | α 2 〉 ⊗Λ | α n 〉 なのである。 例えば、1/2 のスピンをもつ粒子の場合、基底を S z の2つの固有値、ms = ± 1 、 2 に対応した2つの固有状態 1 1 1 1 1 Sz | , ± 〉 = ± η | , ± 〉 2 2 2 2 2 をとることが多い。これらは、z 軸に対してスピンが上向き、下向きの状態に対応している。 これらの固有状態は、簡単に 1 1 1 1 | , + 〉 = | + 〉, | , ± 〉 = | − 〉 2 2 2 2 と書かかれ、一般のスピン状態は、この2つの状態の重ね合わせとなる。これに対して | + +〉 あるいは | + −〉 と書けば、これは2粒子系のスピン状態が2つとも | + 〉 あるいは、第1の粒 子がで第2が | −〉 の状態にあることを表している。すなわち、 | + +〉 ≡ | +〉 ⊗ | +〉 、 | + −〉 ≡ | +〉 ⊗ | −〉 という意味である。 + ,− の代わりに 0、1 で表記する方法では、 | 1 1〉 ≡ | 1〉⊗ | 1〉 | 1 0〉 ≡ | 1〉⊗ | 0〉 の意味で用いる。 さらに、単一粒子系の運動量あるいは角運動量とスピンというように、演算子としての 作用空間(領域)が異なり、互いに干渉し合わないような表示系に関する場合もある。こ の場合は粒子の内部自由度を表現する状態ベクトルとそれ以外の自由度を表現する状態ベ クトルのテンソル積(直積)によって、全体の系の状態を記述するベクトルを構成できる。 例えば、単一の粒子でも、位置に関する状態は、 | x ' 〉 で表し、スピンの状態を | ±〉 で表し、 15 | x ' ± 〉 ≡ | x ' 〉 ⊗ | ±〉 の意味に用いることがある。 作用素に関しても同様な考えができる。例えば粒子の軌道角運動量の作用素を m 、スピ ン角運動量のそれを S 、その和と J とすれば、 J =m + S と、 J = m ⊗ 1s + 1 p ⊗ S とは、同じ内容の表現である。ここで、 1s , 1 p はそれぞれスピン空間と位置空間における 恒等演算子である。 複合系が実際の多粒子系である場合、例えばスピンを有する粒子系の場合、1粒子の波 動関数において、特定の向きのスピン成分を観測すると、上向き、下向きというようなは きりした結果を与える。これに対して、実験系が多くの粒子系からなり、それらのうち上 向きの観測値を与えるものが30パーセント、下向きが70パーセント含まれているとい うような場合を記述できない。この場合の30パーセントや70パーセントは、波動関数 が与える確率振幅とは無関係な、日常的な意味での頻度である。こうしたさまざまな状態 にある、単一系あるいは複合系を記述するのが密度演算子である。 第4章で密度演算子を量子力学的な状態 | α 〉 への射影演算子の1次結合であり、係数は m 負でない実数であり、その和は1に等しいと定義した。 ρ = ∑ | α m 〉 pm 〈α m | , m ∑p m =1 m ただし、これらの状態は直交している必要はない。またこの定義では、状態ベクトルが1 粒子系のものなのか、多粒子系のものなのかなどは指定していない。 部分系 A と B からなる複合系 AB の密度演算子を ρ AB とすれば、部分系の密度演算子は、 それぞれ ρ A ≡ TrB { ρ AB } , ρ B ≡ TrA { ρ AB } で与えられる。ただし、部分 Trace は、 A の任意の2つのベクトル | a1 〉 , | a2 〉 と B の任意の 16 2つのベクトル | b1 〉 , | b2 〉 によって、 TrB {| a1 〉 〈 a 2 | ⊗ | b1 〉 〈 b2 | = | a1 〉 〈 a 2 | TrB {| b1 〉 〈 b2 |} と定義される。 2状態系の記述 ここでいう2状態系とは、系の取りうる状態が2つしかない量子力学系のことである。 実際にはもっと自由度があっても、他の自由度を無視して構わないという近似が成り立つ 系のことを意味する。スピンという内部自由度だけに着目した単一電子の状態とか、電場 の中にあるアンモニア分子は、3つの水素原子の張る平面に対する窒素原子の位置に関し に関して2状態系で近似できる。また光子の偏光も、右回りの旋光性の状態と左回りの旋 光性を示す状態という2状態系で記述できる。水素分子のイオンの場合、1個の電子が2 0 つの陽子の核のいずれかの近くにいるという2つの可能性の重ね合わせになる。 K 粒子に ついても同様なことが言える。 2状態系の状態は2次元のヒルベルト空間の点である状態ベクトルに対応する。ハミル トニアンは4成分だけである。2状態系は基本的に、1/2 のスピンを有する電子のスピン状 態を記述するのと同じ方法が使える。この意味で2状態系は等価である。(ファイマン、量 子力学 p.210、高林武彦、量子力学とは何か、p.125、Sakurai, p.22, p.26, p.163) 定義によって、1/2 のスピン粒子に関しては基本演算子がパウリ行列 S = σ を用いて、 1 ησ 2 となる。スピンの状態は、一般に S z の2つの固有値、 ms = ± 状態の重ね合わせで表現できる。 1 1 1 1 1 Sz | , ± 〉 = ± η | , ± 〉 2 2 2 2 2 と書いたが、全スピンの固有値 1/2 を省略して、 1 S z | ± 〉 = ± η | ±〉 2 17 1 、に対応した2つの固有 2 と書くことにする。2成分のベクトル表記では、 1 | + 〉 ≡ , 0 0 | − 〉 ≡ 1 これと同じ表記法により、 S x および S y の上向き、下向きの固有状態を | S x ;± 〉 = 1 1 | +〉 ± | −〉 2 2 | S y ;± 〉 = 1 i | +〉 ± | −〉 2 2 これらの演算子をドット積で表現すれば、 Sz = η [ | +〉 〈+ | − | −〉 〈− | ] 2 Sx = η [ | +〉 〈− | + | −〉 〈+ | ] 2 Sy = η [ − i | +〉 〈− | + i | −〉 〈+ | ] 2 問題。スピンに関するパウリ行列 0 1 1 0 1 0 0 − i , σ 0 ≡ E2 = , σ x = 0 0 1 0 1 − σ x = , σ x = i 1 0 を思い出して、上記の固有ベクトルとドット積の演算子表現が正しいことを確かめよ。 18 第6章 多粒子系と量子統計力学の基礎 6.1 はじめに 先の章では、量子力学の概略を説明しながら、具体例として簡単な系の扱いを紹介した。 この章では、多数の粒子系を対象とした量子力学をお浚いする。この話題は、多体問題と 呼ばれる同種の粒子系の波動関数を求める問題と、量子力学を基礎とした統計力学の問題 に大別される。ここでは、まず前者に関する議論を展開してから、統計力学の問題に移る。 量子力学の世界においては、二重の統計性に注意しなければならない。そのひとつは量 子論独特の非決定性、非弁別性からくるものであり、古典物理学においては出会わない論 理である。量子力学においては、単一系の場合でも確率の問題に遭遇する。すなわち、あ る系がどのような状態にあるか、観測でしらべようとしても結果は確定的ではなく、確率 的になる。これは古典物理学では遭遇しなかった問題である。 もう一つは、扱う対象物の多さからくる日常的な意味での統計性である。熱力学が扱う 系は、微視的に見れば位置や、速度を決定でき、互いに弁別可能な粒子から構成されてい る。ただ粒子の数が膨大(アボガドロ数、約 10 の 24 乗程度)であるため、現実には個々 の粒子まではとても目か届かない。それゆえ集団としての統計的な量を測定し、その間の 関係をしらべることで満足しておく、というのが古典物理学の立場である。この立場につ いては、すでにある程度の例を提示し、扱い方を紹介してきた。 しかし厳密に言えば、古典物理学における統計的な手法である統計力学の展開において は、未解決の重要問題が残されている。それは、ある巨視的な状態に対応する微視的な状 態を数える問題で遭遇する、エネルギー準位が離散的であるとする仮定の妥当性や、相空 間を分割する際に、最小の領域 cell を導入する問題である。いずれの場合も、連続ではな く離散的であることを特徴づける量は、プランク定数hから導かれる。しかし古典物理学 では、その根拠を説明できない。それを与えるのが量子力学である。 この章で扱う、量子力学の多粒子系の扱いにおいては、力学の多粒子系に本来的に備わ っている統計性と、日常的な意味での「同じような系を沢山考え、その平均をとる」とい う統計とを共に考慮しなければならない。さらに、一つの多粒子系の部分系、例えば1粒 子系や 2 粒子系の平均的な振る舞いを問題にすることもある。このような問題では、単一 の量子力学において最も基本的な量であった、波動関数(固有状態ベクトル)よりも、密 度行列(作用素、演算子)が頼りになる。なぜなら、それは、上記の2つの統計的な性格 を同時に備えているからである。さらに、密度演算子の固有値を事象の確率とするエント ロピーが定義できる。これらのエントロピーは、熱力学はもとより統計力学の(ボルツマ 1 ンの)エントロピーより、さらに直接的に情報エントロピーに対応づけられる。すなわち、 量子統計力学における密度演算子によって定義されるエントロピーは、物理的なエントロ ピーであると同時に、情報エントロピーとしての性格も明瞭に備えている。 ボルツマンの原理が、熱力学と統計力学を結ぶ要であるとすれば、量子統計力学の密度 演算子は、量子力学統計情報論を結ぶ要であると言うことができる。 6.2 スピンと多粒子系の統計 ここでは、同じ種類の量子力学的な粒子からなる、多粒子系を取り上げる。量子力学的 な粒子という意味は、これらの粒子が、内部自由度であるスピン角運動量をもっているこ と、同種の粒子は互いに弁別不可能であるということである。 ス ピン という 内部 自由度 によ って、 これ らの粒 子は 、ボー ス・ アイン シュ タ イ ン Bose-Einstein 粒子とフェルミ・ディラック Fermi-Dirac 粒子に大別される。すなわち、前 者は、スピンの値が整数値(0, 1, 2, …)であり、後者は半整数値(1/2,3/2, 5/2、…)であ る。以下、簡単にフェルミ粒子(フェルミオン)、ボース粒子(ボゾン)と呼ぶ。電子、陽 子(水素の原子核)、中性子、 µ 中間子はフェルミ粒子であり、電磁場、固体の中の振動を 量子化したフォノンはボース粒子である。この規則は素粒子一般にも成り立ち、素粒子の 複合系にも成り立つ。中間子、 π , π はボゾンであり、ヘリウム He はフェルミオンであ ± 3 0 4 り、 He はボゾンである。いままでのところ、この規則に反する例は見つかっておらず、 自然の基本的な規則と考えられている。 スピンと統計性に関するこの規則は、非相対性理論からは導けない。この原理を相対性 理論の立場から導いたのは、パウリ W.Pauli であり、彼の論文が Physical Review に発表 されたのは、1940 年である。(W. Pauli, The connection between spin and statistics, Phys. Rev., 58, 1940, pp.716-722.) 。この論文の証明は簡単ではないため、ほとんどの教科書に は説明されていない。言わば公理の扱いをうけている。パウリは、フェルミ粒子は、「同一 の量子力学状態を2つ以上の粒子が占めることができない」、というパウリの排他律 Pauli’s Exclusion Principle の発見者でもある。 以上の、古典論とは異なる量子力学的な粒子の性質が、多粒子系の波動関数の表現にど のような影響を与えるかを見てみよう。 不弁別性と対称性 いま、N 個の同一粒子系を記述する波動関数(状態ベクトル)があるとする。N 個の中 のある特定の2つの粒子 i と j に着目して、波動関数を Ψ (ξ i , ξ j ) と省略して表記する。この 2 2つの粒子を入れ替えた波動関数 Ψ (ξ j , ξ i ) を想定する。後者の波動関数が物語る物理的な 状況は、最初の波動関数のそれとまったく同じでなければならない。その意味は、この状 態でのエネルギーその他の物理量を観測しても、最初の波動関数が与えるものと同じにな らねばならないということである。このことは、2つの波動関数はたかだか位相因子 eiα , (α は実数)だけしか違わないということを意味する。なでなら、物理量は波動関数と その共役複素関数との積から計算されるから、波動関数と物理的な状態とは1対1の関係 にはなく、位相因子だけの自由度があるからである。第2の波動関数における2つの粒子 をもう一度入れ替えると、最初の波動関数からの位相因子の違いは e 最初の波動関数と同じものにならねばならない。したがって、 e 2 iα 2 iα となるが、これは = 1, eiα = ± 1 となる。 すなわち、2つの粒子の交換は、波動関数の符号をそのままにするか、反対にする。この ことは、任意の2つの粒子の交換に関して言えることである。 このことから、一般に、N 個の量子力学的な同種粒子を記述する波動関数は、その中の 任意の2つの粒子の交換に関して、符号をかえないか、符号をかえるかのいずれかである と言える。前者の場合を対称 Symmetrical, 後者の場合を反対称 Antisymmetrical と呼ぶ。 さらに、同種粒子がフェルミ粒子である場合は、波動関数は反対称であり、ボース粒子の 場合は対称である。このことは複合粒子についても当てはまる。 粒子の互換、置換と波動関数の遇奇性 長さ n のある数列に関して、ある2つの数に注目して、それらを入れ替える操作を互換 という。すべての数を対象にした置き換えを置換という。可能な置換の操作は n!である。 任意の置換は、互換の組み合わせに分解できる。この時、互換の順序に関係なく、偶数回 の互換となるか、奇数回の互換の組み合わせになるかという、「偶奇性」は、置換によって 一意的に決まっている。これを置換の偶奇性(Parity)と定義する。数の互換の組み合わせ に分解される置換を偶置換と呼び、パリティを+あるいは1、奇数互換をーあるいはー1 に対応させる。 ある N 個の変数をもつ波動関数、 Ψ (ξ1 , ξ 2 ,Λ , ξ N ) の全粒子を対象とした置換を P とす れば、対称性および反対称性を備えた新しい N 個のための波動関数を以下によって、つく ることができる。 Symmetric ∑ Anti − symmetric ∑ P P P Ψ (ξ1 , ξ 2 ,Λ , ξ N ) ( PのParity ) × P Ψ (ξ1 , ξ 2 ,Λ , ξ N ) 3 ただし、これらの波動関数は規格化条件を満たしていない。最初の波動関数が規格化され ているとすれば、 N ! で割ればよい。 スピンと座標変数の分離 非相対性理論の量子力学のシュレディンガー方程式はスピンに関係しない。したがって、 スピン演算子に関する方程式は、座標に関るシュレディンガー方程式と分離できる。すな わち、座標を、 x1 , x2 , Λ , xN 、スピン変数を、 σ 1 ,σ 2 , Λ ,σ N とすれば、 Ψ (ξ1 , ξ 2 ,Λ , ξ N ) = Ψ ( x1 ,σ 1; x1 ,σ 1; Λ , xN ,σ N ) = χ (σ 1 ,σ 2 , Λ ,σ N )φ ( x1 , x2 , Λ , xN ) と波動関数を分離して扱うことができる。この場合の座標部分の関数を軌道波動関数 Orbital wave function とよぶ。 相互作用が無視できる場合の波動関数 相互作用が無視できるフェルミオン、あるいはボゾンの場合、単一粒子の固有関数 φ1 ,φ2 , Λ ,φN を用いて、 Symmetric ∑ P P φ1 , φ 2 , Λ , φ N Anti − symmetric ∑ P ( P の Parity ) × P φ1 , φ 2 , Λ , φ N によって、N 個の粒子系の近似解としての、対称性を備えた波動関数を構成できる。仮に これらの近似がよくない場合でも、これらの1体および多体の波動関数は、一般の波動関 数を記述する基底となりうる。 フェルミ粒子系の場合、上の構成関数は行列式そのものである。すなわち、 Ψ (ξ1 , ξ 2 ,Λ , ξ N ) = 1 N! φ1 (ξ1 ),φ1 (ξ 2 ), Λ ,φ1 (ξ N ) φ2 (ξ1 ),φ2 (ξ 2 ), Λ ,φ2 (ξ N ) Λ Λ Λ φN (ξ1 ),φN (ξ 2 ), Λ ,φN (ξ N ) ただし、上では規格化因子も付けている。これをスレーター行列 Slater determinant と呼 4 ぶ。 フェルミ粒子の1体系に関する固有値を求め、その最もエネルギーの低い順位に対応し た1体の波動関数を N 個選んで、上の行列をつくれば、N 個系の最もエネルギーの低い状 態(基底状態)に対応した波動関数の近似になる。 どんな系が計算の対象になるか 同種粒子の集まりとして、実際にどんな物理系が計算の対象となっているだろうか。あ るいは、どんな物理系なら計算できるのか。よく知られた教科書で扱われているのは、 (1)原子や分子の電子状態、Electron states in atoms and molecules (2)電子ガス Electron gas (3)核物質 Nuclear matter (4)量子化された電磁場 Quantized Electromagnetic fields (5)固体中の格子振動 Lattice vibration in a solid body 4 (6)液体ヘリウム He Liquid helium (7)金属の超伝導 Superconductivity in a metal (8)多スピン系 Multi-spin system 第1の例は、量子力学の黎明期に重要な役割を果たした水素原子モデルの路線の拡張で あり、オッペンハイマーやベーテのような物理学者によって計算されたが、後に物理学よ りはむしろ化学の分野で活発に研究されるようになった。とくに多数の電子系からなる分 子の波動関数を求め、反応性との関係を探ることは、今日の量子化学の主要課題となって いる。 第2の例は、金属の中を自由に運動している電子集団に関するモデルで、古典力学の完 全気体と同じようなイメージで、電子を気体分子と同じように、自由に運動する粒子とし て扱った。これは最初フェルミによって試みられ、フェルミ統計の発見の契機となった系 である。この系の特徴は、エネルギーが最も低い基底状態 Ground State においても。すべ ての粒子が1粒子系としての最も低い状態にいないということである。そのために、全体 系の基底状態における1粒子のエネルギー分布は、あるところから、急にゼロになるとい う特異が形状になる。この境界をフェルミ面と呼ぶ。電子系と扱いは似ているが、核力(す なわちポテンシャル関数)を異にする系が(3)の核物質である。核物質とは、陽子と中 性子から構成されている原子核を、フェルミオン粒子の気体とみなす近似である。これは、 最初、第2次大戦中戦死したハイセンベルクの若い弟子オイラーや当時ハイゼンベルクの 下にいた渡辺慧によって計算された系で、渡辺はこの計算において、核子の相互作用の程 度を今日の情報エントロピーで計量するというアイデアを発表している。この系は、その 後、ブルックナーK.A. Brueckner やベーテ H.A. Bethe によって発展させられた。 第4の例は、黒体輻射など初期の量子力学の建設に重要な役割を果たしたが、今日のよ うな量子力学は電子のような粒子の扱いで建設され、光すなわち電磁場という「場 Field」 5 をどのように量子化するかは、最初わからなかった。この壁を破ったのがディラックであ り、電磁場を量子化するとともに、そこから1個、2個と数えられるような粒子のイメー ジがでてくることを示した。そのために彼が創造した計算手法が「第2量子化」である。 電磁場が量子化されてでてくる粒子である「光子 Photon」は、ボース統計にしたがう、ボ ゾンである。 第5の例は、固体の比熱の計算モデルである。固定の比熱は格子結晶とみなしたときの、 格子の振動の様子で説明される。この振動はバネによる振動と基本的におなじである。つ まり、固体の熱容量は、格子振動の性質によって決定されるという近似モデルが、これで あり、デバイの仕事が有名である。 第6の例の液体ヘリウムは、ミクロ現象である量子力学の特徴が超流動というマクロの 現象として姿を現した例である。ヘリウムは大気圧のもと温度を下げていっても凝固した 3 4 い自然界で唯一の物質であるが、同じ液体ヘリウムでも、 He と He の性質はひどく違う。 4 すなわち、絶対温度でゼロに近い極低温において、液体ヘリウム He は超流動性を示す。 3 4 この違いは、 He がフェルミオンであり、 He がボゾンであることに由来する。 第7の例は、ある種の金属(あるいは合金)が極低温で電気抵抗がなくなり、電流が流 れ続ける現象を説明するモデルである。超流動と同じく超伝導という現象も、ミクロ現象 である量子力学の特徴がマクロの現象として姿を現した例である。この現象を説明するの は、2つの電子(フェルミオン)が対をなして運動するという、クーパー対 Cooper pair 仮説である。 第8は、磁性を説明するためのスピンを持ち、格子点に束縛されている多粒子系モデル である。 6.3 さまざまな近似法 多粒子系の問題は、厳密な意味では解けない。その意味は、前の章で見てきたような解 析的な解を求めることができないということである。その主な原因は、現実の物理系の粒 子間には相互作用があるからである。それらがないとし、また、1粒子の問題が解けたと すれば、多粒子系は、単に1粒子系を仮想的に集めたものと等しいことになる。しかし、 粒子間に相互作用があれば、1粒子の問題を他の粒子の影響を無視して解くことはできな い。つまり、粒子間に相互作用があると、1粒子の系としての問題も解けないことになる。 そのためにさまざまな近似解法が考え出された。 その出発点となるのは、 (1) 他の粒子の影響をうまく処理して、他の粒子に依存しない形の1粒子に関す る方程式を立てる (2) この方程式から、1粒子の(普通はエネルギーに関する)固有状態を求める (3) 任意に1粒子の状態を N 個選んで、それらに対応する1粒子の波動関数(状 態ベクトル)から N 粒子系の波動関数を作成する 6 (4) N 粒子系のある波動関数(状態べくとる)を N 個の1粒子系波動関数からつ くった N 粒子系の波動関数の重ね合わせとして表示する という方法である。この4つの過程を実行するには、それぞれの段階で工夫がいる。 摂動論(時間に依存しない場合) ハミルトニアンが、H 0 「無摂動 Unperturbed」と呼ばれる大きな値に対応した部分と、 それに対する小さな補正 correction, perturbed の部分からなっているとする。さらに、こ れらの演算子は、時間に依存しないと仮定する。 H = H0 + V さらに、無摂動のハミルトニアン H 0 に関してはシュレディンガー方程式が解けて、離散 的な(無摂動エネルギー) Ei に対応した離散的な解、ψ i が求まっているとする。すなわ 0 0 ち、 H 0 ψ i0 = Ei0 ψ i0 , i = 1, 2,Λ とする。ここで、解は縮退していない(同じエネルギー準位には、1つの状態しかない) と仮定する。この固有関数系は、完全系になるので、 H の固有値に対応した固有関数ψ を 展開することができる。いまその展開係数を cm とすれば、 ψ = ∑ cm ψ m0 m となる。ここで、摂動部分の行列要素を Vij = ∫ ψ i0 * Vψ k0 dx とすると、あるエネルギー準位における補正を En = En0 + En1 + En2 + Λ ψ n = ψ n0 +ψ n1 +ψ n2 + Λ のように大きさを対応させて書くと、 Vmn ψ m0 0 m ≠ n E − Em ψ n1 = ∑ En1 = Vnn = ∫ ψ n0 * Vψ n0 dx 、 7 0 n | Vmn |2 E =∑ 0 、 0 m ≠ n En − Em ψ n2 = 省略 2 n のようになる。ただし、2次近似の波動関数は、省略した(Landau-Lifshitz, p.132)。 なお、エネルギー準位置が縮退している時は、縮退に関する任意性を除去するために、 いわゆる永年方程式 Secular equtation を解かねばならなくなる。時間に依存した摂動論の 場合は、エネルギーや波動関数の補正を求めるよりも、状態間の遷移確率の見積もりの補 正に使われる。 変分原理 Variation Principle 物理学において、変分原理は振動方程式などの解を求める一般的な方法のひとつである。 これは関数の形を求める問題である。いま任意の波動関数 Ψ によってハミルトニアンの期 待値 〈 Ψ | H | Ψ 〉 を求めたとする。この時、 Ψ をわずかに変えてもこの期待値が変化しない δ 〈 Ψ | H | Ψ〉 = 0 とすれば、関数の変化に関して、期待値は局所的な最大または最小値をとっていることに なる。これをまったく任意の波動関数に適用するとシュレディンガー方程式が得られ、近 似法ならない。そこで、解がえられやすいように試す波動関数に制限を付ける。例えば、 ハミルトニアンが 1 体および2体の粒子の変数のみだと仮定し、試す波動関数を 1 粒子系 の基底関数 N 個の積とすれば、1粒子波動関数に関する N 個の連立方程式がえられる。こ れを Hatree と呼ぶ。 試す波動関数を行列型の N 粒子系の波動関数(スレター行列)と すると、2つの1粒子波動関数の成分を含んだ1粒子波動関数に関する連立方程式が得ら れる。これらを Hatree-Fock 方程式と呼ぶ。 変分法は、エネルギー値を求める近似法であるが、他の観測量に関しては使えない。 WKB 近似 この近似法は、1次元のシュレディンガー方程式で、エネルギー準位が高い場合の解を 求めるのに有効である。例えば、球対称ポテンシャルによる水素原子のエネルギー準位を 求める問題では、変数分離によって1次元の動径部分の方程式がえられる。この方程式の 解をエネルギーの高い場合に解く場合は、WKB 近似が有効である。 8 6.4 第2量子化と数の演算子 生成消滅演算子導入の必要性 これまで考察してきたのは、互いに弁別できない同種の粒子が集まった系であったが、 粒子の個数は例えば N 個と固定してきた。ところが、光量子や結晶格子点にある振動子な どは、容易に生成、消滅する。したがって量子化された粒子の数としては変動する。こう した粒子の生成消滅は、フェルミオンである電子や核子の場合、高いエネルギーでなけれ ば起きない。電子の生成消滅も起きる。よく知られているように電子が生成される時は、 負のエネルギーの空孔としての陽電子も一緒にされる。陽子や中性子も他の(素)粒子に 変換することによって、生成消滅する。このような物理現象を扱うには相対性理論を取り 入れた理論すなわち、相対性理論を取り入れた量子力学が必要になる。しかし、そうした 理論でなくとも、非相対論的な量子力学においても、(量子化された)粒子が生成消滅する ような理論が望まれる。それが生成消滅演算子を用いる方法である。 生成消滅演算子の意義をもっとも端的に表しているのが、 N = a+a + 関係であろう。ここで、 N は数の演算子 Number operator、 a は生成演算子 Creation operator あるいは上昇演算子 Raising operator、 a は消滅演算子 Anahilation ないし、 Destruction operator あるいは下降演算子 Lowering operator と呼ばれる。2つの演算子は 互いにエルミート共役の関係にあり、同時に粒子の統計性によって符号を異にするある種 の交換関係を満足する。数の演算子 N は、系がある状態にある時観測した期待値が、粒子 の数を与えるような観測量すなわち演算子である。例えばこれらの演算子が振動子のモー ドごと定義されているとすれば、数の演算子はそのモードにある粒子の個数を与える。粒 子間の相互作用がなければ、例えばモード、 ωi の粒子が N i ' 個(これは数の演算子の固有 値である)あれば、これらのモードにある粒子の運動量は、モードに対応した1粒子の運 動量の N i ' 倍になる。エネルギーに関しても、同様で、このモードにある 1 粒子のエネルギ ーが、ηωi であるなら、このモードをもつ粒子全体のエネルギーは N i ηωi であり、系の全体 のエネルギー E は、全モードを足し合わせた、 E = ∑ N 'i ηωi , i H = ∑ N i ηωi = ∑ ηωi a + a i i となる。第1式は普通の数の表記であり、第2の式は演算子でのハミルトニアンである。 最初の式は調和振動子のエネルギー表現として御馴染みの式である。 9 数の演算子の固有値が粒子の個数だとすれば、当然粒子が何もない状態がなければなら ない。これはゼロ粒子状態であり、 「真空」vacuum state 状態 | 0〉 と呼ばれる。これらの演 算子と、数の演算子 N の固有値 n 、固有状態 | n 〉 との関係は以下に要約される。 N | n〉 = a + a | n〉 = n | n〉 a + | n〉 = n +1 | n +1〉 a | n〉 = n | n − 1〉 a | 0〉 = 0 | n〉 = 1 (a + ) n | 0〉 n! + これらの式は演算子の相互の役割を示している。 a がなぜ生成演算子と呼ばれるかと言え ば、数の演算子の固有値が n の固有状態ベクトルに作用して、n+1 の状態ベクトルに変換 するからである。反対に、 a は同じ固有状態ベクトルに作用して、n-1 の状態ベクトルに変 換するからである。この意味では、消滅演算子より英語の destruction を直訳した「破壊演 算子」の方が作用素としての性格を表している。 + 上記の式はすべて a と a の間にある種の交換関係を仮定したことから導かれる。実際に Feynman の教科書では、このことを次のように述べている。 + + + 問題:ある演算子 a とそのエルミート共役な演算子 a とが、交換関係 a a − aa =1 を満た + す時、両者の積、 a a の固有値を求め、固有ベクトルとの関係を示せ。 もちろん、この問題は、量子力学の数学的な枠組みの中で定義された問題であるが、この 簡単な問題から、上で述べたことがらは導かれる。 生成消滅演算子をどう定義するか? それでは、こうした生成消滅演算子を実際にどうつくるのか。1次元の調和振動子を例 として、これを示してみよう。 H = p&2 mω 2 x 2 + , ただし、 ω = 2m 2 k/m ここで3章とは座標の記号を変えてあるが、同じ問題である。また、座標と運動量の交換 10 関係が、 [ x, p] ≡ xp − px = iη 満足されているとする。最初の括弧は(ディラックにしたがった)3章の括弧式とは、 iη だけ違っている。(この記法の方が普通に使われている)。ここで、 mω 1 ( x+i η 2 a= a+ = 1 p ). mωη mω 1 ( x−i η 2 1 p ). mωη 新しい a, a は演算子であり、 mω / η x, (1 / mω / η) p + も無次元であり、交換関係、 a + a − aa + =1 を満足する。もとの変数との関係は、 x= a + a+ . 2 η mω p = mωη a − a+ . i 2 で与えられる。また、ハミルトニアンは、 H = ηω + 1 (a a + aa + ) = ηω (a + a + ) 2 2 となる。この固有値は、上の議論から、 H | n〉 = (n + 1 ) ηω | n〉 。 2 したがってエネルギー準位は、 En = ( n + 1 ) ηω 2 11 が次元を持たないので、a, a + となる。座標表示で状態ベクトルを表せば、 〈 x | n〉 = η d n − ( mω / 2η) x 2 1 mω 14 mω n 2 ( ) ( ) (x − ) e n! πη 2η mω dx となる(Feynman, p.156).ここでは、微分演算を実行しないと具体的な関数の形にならな いが、この解が3章のシュレディンガー方程式を素直に解いた解、すなわち、エルミート 多項式と関係しているのは明らかだろう。 多粒子系の場合 数の演算子と生成消滅演算子の方法を N 個の粒子系に適用してみよう。1粒子に関する 状態ベクトル、 {| 1〉 , | 2〉 ,Λ } が規格化された完全系をなすとする。 | α 〉〈α | = 1 ∑ α 〈α | β 〉 = δ αβ ; この基底を組み合わせた N 個の粒子系の状態ベクトルを、 | α1 , α 2 , Λ , α N 〉 ≡ | α1 〉 | α 2 〉 Λ | α N 〉 , α1 ≤ α 2 ≤ Λ ≤ α N と構成する。これらは互いに直交するが、規格化はされていない。また、フェルミオンで は右の式は不等号だけとなる。これを規格化すると、 | α ,α 2 , Λ , α N 〉 n1!n2!Λ , ( α1 ≤ α 2 ≤ Λ ≤ α N ) 、 | α1 , α 2 , Λ , α N 〉 , ( α1 < α 2 < Λ < α N ) 、 ボース粒子の場合 フェルミ粒子の場合 ここで、 nα は、 α1 , α 2 , Λ , α N , (α1 ≤ α 2 ≤ Λ ≤ α N ) の中の、 α の出現回数である。 これらの状態ベクトルが完全系をなすことは、 1 n! Λ ∑ | α ,α ∑ α α 1 2 , Λ , α N 〉 〈 α1 , α 2 , Λ , α N | = 1 1 による。 12 ボース粒子系の場合 | n1 , n2 , Λ 〉 = | 1,1, Λ , 2,Λ ,2,Λ 〉 n1! n2 !Λ ここで、nα は、α1 , α 2 , Λ , α N , (α1 ≤ α 2 ≤ Λ ≤ α N ) の中の、α の出現回数であり、0, 1,2,… などに等しい。 aα+ | n1 n2 Λ nα Λ 〉 = nα + 1 | n1 n2 Λ nα + 1Λ 〉 aα | n1 n2 Λ nα Λ 〉 = nα | n1 n2 Λ nα −1Λ 〉 [aα , aβ ] = [aα+ , aα+ ] = 0 ; [aα , a + β ] = δ Nα = aα+ aα フェルミ粒子の場合 aα+ | α1 ,α 2 , Λ , α N 〉 = | α , α1 ,α 2 , Λ , α N 〉 | n1 , n2 , Λ 〉 = | α1 ,α 2 , Λ , α N 〉 [aα , aβ+ ] + = δαβ [aα , aβ ]+ = [aα+ , aα+ ] + = 0 ; となる。 占有数表示 上記の表示は、1粒子系のエネルギー準位 ε1 ≤ ε 2 ≤ Λ ≤ ε i Λ の各を占有している粒子の数、 13 αβ n1 , n2 , Λ , ni ,Λ によって、 N 粒子系の状態を指定することができる。ここでボゾンでは各準位の占 有数に制限はないが、フェルミオンにかんしては、ゼロか1である。 生成消滅演算子によるハミルトニアンの表示 いま、上記のボゾン系あるいはフェルミン系のハミルトニアンが、 H = T +V T = ∑ Ti i V = ∑Vij i< j の形をしているとする。ただし、 Ti は、1粒子のみに作用する演算子であり、 Vij は2粒子 のみに作用する演算子とする。すぐの節と上と同じ意味での生成消滅演算子を使うと、 T = ∑ Ti = ∑ ai+ 〈i | T | j 〉 a j i i, j V = ∑Vij = 1 2 V = ∑Vij = 1 2 i< j i< j ∑ ai+ a +j 〈i j |V | kl 〉 a k al 、 ボゾンの場合 ∑ ai+ a +j 〈i j |V | kl 〉 a k al 、 フェルミオンの場合 i , j , k ,l i , j , k ,l + 表せる。T に関しては、1粒子のハミルトニアンの行列要素に演算子 ai a j が掛かった形を している。 この形のハミルトニアンは、ファイマンダイアグラムでの計算をやりやすくする。 Brueckner と Gellman は、金属中の自由電子系に関して、クーロン力による電子間相互を 考慮したエネルギーの摂動計算を、生成消滅演算子とファイマンダイアグラムを用いて行 った(Feynman, p255)。 14 なぜ第2量子化と呼ぶのか? 第2量子化の方法を紹介している教科書は少なくないが、その方法のどこが第2量子化 なのか、またなぜそのように呼ばれるのか、数の演算子あるいは生成消滅演算子との関係 はどのような必然性にもとづいて導入されるのかを説明している本はほとんどない。 第2量子化とは、同種の多粒子系を計算するための近似法のひとつである。この手法を考 えついたのは、ディラックである。第2量子化に関するこうした疑問を、ディラックの最 初の発想に遡って答えているのが、朝永振一郎の「スピンはめぐる」の中の解説(第6話、 pp.147-175)である。非常に教育的な解説なので、以下それを要約する。ディラックが光 の場を量子力学的に扱おうとした 1927 年の論文で初めて発表された。この仕事はボゾンに 関するものであったが、翌年、フェルミオンに関する理論もつくられた。したがって、第 2量子化の方法はボゾン系かフェルミオン系かで、多少違うが本質的な話の筋は同じであ る。 この方法では、まずハミルトニアン Hを有する 1 粒子系を考え、 ϕ ( x, t ) をシュレディン ガー方程式、 iη ∂ϕ ( x, t ) = H ( x, p ) ϕ ( x , t ) ∂t 満足する固有関数とする。ここで、ある1つの観測量(例えば G )の固有関数で完全系を なすものを考える。そうすると他の任意の 1 粒子ベクトルは、 φn の線型の重ね合わせとし て表現できる。簡単のために、ここでは離散的な固有値 n = 1, 2, 3,Λ を想定する。この 1 粒 子系の基底関数によって、上のシュレディンガー方程式を満たす状態関数 ϕ は、 ϕ ( x, t ) = ∑ ai (t )φi ( x) i と 1 次線型結合として展開できる。ここで、展開係数に注目する。次に、こうした 1 粒子 系のコピー(Gibbs ensemble)が N 個ある系を考える。このコピー集団において、G を測 定しみると、その値は固有関数 N | ai | に対応したものになる。例えば φi に対応した固有値 2 を与える 1 粒子系の数の期待値は N i は、 N i = N | ai |2 = N ai*ai で与えられる。 ここで、ϕ の展開係数 ai は演算子ではなく、普通の(複素)数(c数)である。しかし、 15 ここでこの係数を改めてq数とみなして、これとその共役な複素量(q 数)との間に、座標 と運動量との間の交換関係と同じような関係が成り立つような、q 数(すなわち演算子) Ai , Ai* を定義することができる。例えば、 Ai = N ai , Ai* = N ai* とおく。その意味は、 N i = Ai* Ai から推察される。もちろん、 N = ∑ N i = ∑ Ai* Ai = N ∑ ai*ai = 1 i i i である。ただし、最後の等式は 1 粒子の固有関数が、したがって係数が規格化されている ことを使った。 すなわち、これは、状態 φi に対応する観測値を与える粒子の個数となる。 さらに、 π i = iηAi* によって導入し、 Ai と π i との間に、座標と運動量のような「カノニカル」な交換関係を 定義する。 この関係は定数だけ違うが展開係数 ai に関する交換関係とみなすことができる。これに よって、 Ai が、したがって ai が量子化され、q数(演算子)となったことになる。 これまでの話は、1 粒子系を頭の中で N 個コピーした仮想的な集団の話であったが、次 は、上記の 1 粒子を実際に N 個含む系多粒子系を考える。ただ、この N 多粒子系のハミ ルトニアンは、1 粒子系の単純な N 個の和になる。この大きな系に関して、 Ψ ( x) = ∑ Ai φi ( x) i Π ( x) = ∑ π i φi ( x) i を導入する。これらの間に交換関係が成り立つことは、 Ai と π i との間に交換関係が成り 立つことで証明できる。なお、 Ψ (x) は波動関数の記号を使ってはいるが演算子である。 この演算子は、「形式的に」、出発点となった 1 粒子系のシュレディンガー方程式と同じ形 をした方程式を満足する。 16 また、 N i = Ai+ Ai 演算子であり、その固有値は、 N i = 0,1, 2,Λ で与えられる。これは 1 粒子の i 番目の固有状態をいくつの粒子が占めているかをしらべる 演算子に対応している。 以上がディラックの議論であるが、この中で、最初にでてきた展開式 ϕ ( x, t ) = ∑ ai (t )φi ( x) i の中の本来普通の数(c数)である係数 ai (t ) を、交換関係を満たす演算子とみなすという ところが、この方法が第2量子化(再量子化)と呼ばれる理由である。つまり、この展開 式の中の ϕ ( x, t ) や φi (x) は、座標と運動量との間の交換関係を手掛かりに、つまり、量子 化によって、得られた方程式の解である。それなのに、再度の量子化を行っているという 意味である。 こうした方法の必然性は、うまく説明されていない。朝永振一郎の言葉を借りると、「結 果よければ、方法よし」というアクロバット的な論法である。 第2量子化が示す波動と粒子の2重性 第2量子化とは、何らかの場の方程式を量子化することを意味する。光が粒子の性質を もっているといっても、1個の光子を1個の電子と同じように考えて光子についてのシュ レディンガー方程式を書いて、これを解いて波動関数(状態ベクトル)を求め、その存在 の確率振幅を計算するという方法はうまくいかない。そこで何らかの類推で場の方程式を 仮定し、それを量子化し、そこから出てきた数の演算子の固有値から、n = 0, 1,2,…という ような粒子数を導く、というのが、代替案であった。その後、場の量子化は、相対論的な 量子力学の中心的な方法となった。 場の量子化の意味を更に具体的に探るために、調和振動子の例をみてみよう。古典論の 座標と運動量と生成消滅演算子とは、以下の式で結ばれている。 x= η ( a + a + ). 2 mω 17 p = −i mωη ( a − a + ). 2 η は、与えられた ω に関して、長さの次元を有する定数である。座標の変 2 mω + + 化は専ら a , a の変化が振幅に相当するのである。ところが、この変化は a , a 単独ではな ここで、 + く複素数の絶対値となる a a で与えられが、これが数に相当する実の演算子となる。この 固有値は、連続量ではなく、0,1,2,…などの不連続値しか許されず、このことから量子化さ れた場の粒子性がでてくる。 一方、波としての振動的な性格は、振動数 ω で指定される。運動量と波数(ベクトル) と(角)振動数とは、 p = ηk = 2mηω の関係にある。これらは座標 x が時間とともに変 化する時の位相部分に関係する。したがって、 場の粒子性 ⇒ 振幅の量子化、場の波動性 ⇒ 位相因子 と対応づけて考えることができる。 相互作用の扱いの難しさ 多粒子系の計算が難しいのは、粒子間の相互作用のせいである。そのためにさまざまな 近似法が開発されてきたが、出発点となるのは、粒子間に相関がないと仮定し、ただ同じ ような粒子が多数あるだけであるという近似的な扱いである。そうなるとまず、1粒子系 のシュレディンガー方程式を解いておかねばならない。1粒子問題にしても素直に解ける かわからない。そこで、直接解を求めることより、何らかの基底となる系を選び、その1 次結合として解を表して、展開係数を決めるという問題に変換されることが多い。こうし た1粒子系の解を組み合わせて N 粒子系の状態ベクトルを近似し、これがよい答えを与え るようなつじつまあわせ(Self-consistent method)をする。この結果得られた N 粒子系の 状態ベクトルはもちろん近似である。当然状態ベクトルは真のそれとずれてくる。したが って我々の対象に関する知識は、十分でない。しかし、この不十分さは量子力学の本来的 な確率性でもなく、また、統計力学で言う似たような(多粒子系)を沢山考えることから くる不確定性さでもない。言わば計算の困難さに由来する知識の不十分さということにな る。 第2量子化の有用性 第2量子化の方法論は場の量子論(相対論的な量子力学)や素粒子論以外の研究者にど 18 れだけ有用であろうか。このことは調和振動子を例にすると考えやすい。量子力学的な調 和振動子の問題は、生成消滅演算子を使わなくても解ける。しかし、生成消滅演算子を使 った代数的な解法は、解析的な方法よりも問題のある側面、この場合は場の粒子性をみや すくする。多体問題においても、代数的な方法にたよらない解法は可能であるが、代数的 な方法は、複雑な計算手順を見通しのよいものにしてくれる。これにはファイマンダイア グラムと同じような効用がある。実際に、多体問題の摂動論には、第2量子化とダイアグ ラム表現が使われる。多体問題を扱っていても、量子化学ではあまり第2量子化の方法を 使わないようであるが、第2量子化やファイマンダイアグラムの方法を使う手法も将来は 普及するかもしれない。 とくに生命に特有な現象の中で、超伝導や超流動のように、微視的世界の量子力学的な 性格が巨視的な世界に反映した現象を扱うためには、第2量子化あるいは場の量子論を使 った方が見通しがよくなるかもしれない。物理学ではすでにそうした巨視的な現象への適 用が成功を収めており、そうした事例は拡大している。この意味で章末の高橋康、および 武田暁は、よい参考書である。 19 6.5 密度行列 Density Matrix の一般論 量子力学における統計性 この章の最初で注意したように、量子力学には2つの確率と統計的な性格がある。ひと つは、量子力学の原理からの帰結である。それは、「系がどのような状態にあるかは、実際 に系を観測するまでは決定できない」、また、「観測によって得られる結果も確率的に解釈 しなければならない」、という統計性である。単一の粒子に関しても適用される量子力学の 原理的な確率的な性格、統計的な性格である。もうひとつは、日常感覚でいう統計性と同 じく、多数集まったことからくる統計性である。実はこの双方に関係した統計的な要請が ある。その一つは、同種の粒子は弁別できないことからくる統計的な要請であり、もう一 つは、量子力学の粒子がスピンをもっていることからくる統計性である。多粒子系を記述 する場合、これらの統計性は、波動関数の満たすべき性質、ボース粒子なら対称性、フェ ルミ粒子なら反対称性を満たすということに反映されている。最後に古典論に対応した「似 たような系が沢山集まった」ということだけに依存した統計性がある。 こうした統計性の扱いは、量子力学あるいは量子統計力学においても古典論のそれと基 本的に同じである。すなわち、 (1)ギブス集団 Gibbs Ensemble:ある系の記述を考えるのだが、統計性を扱うためにそ れを同じ(コピー)系を多数想定し、測定対象となる物理量の測定値もその集団の測定値 (平均値)を考えるという立場、もちろん仮想的な系同士の相互作用はない、 (2)ミクロカノニカル集団、カノニカル集団、グランドカノニカル集団:古典的な統計 力学と同じように、多数の必ずしも同種とは限らない粒子N個からなる系を考える。ギブ ス集団と異なり、これらの粒子は互いに物理的な相互作用をして、熱的な平衡状態に到達 したと考える。古典統計力学では、それらの集団の分布はボルツマン分布にしたがうこと が知られている、 などの統計性である。こうした統計性も古典論的な巨視的な統計性であり、量子(統計) 力学においても、古典論の扱いがそのまま引き継がれる。 当然のことながらこのような統計性は波動関数では記述されえない。多粒子系の波動関 数とは独立な概念を導入しなければならない。しかも、量子力学の枠の中に組み込まれる とすれば、この統計性を反映している何らかの観測可能な量は、演算子でなければならな い。この目的にかなった演算子が密度演算子である。 密度演算子 Density Operator は、統計作用素 Statistical Operator とも呼ばれる。後者 の呼び方の方が内容を表していると言えよう。ある表示をとれば、演算子は行列になるが、 密度演算子の行列は、密度行列と呼ばれる。ただ統計行列という呼び方はあまりされない。 密度演算子は、1粒子系に対しても、多体問題の N 粒子系でも、あるいは統計力学のグラ ンド・アンザンブルに関しても定義することができる。ただその働きは演算子として作用 20 する対象に当然制限される。密度演算子は、N 粒子系の中の部分系に関しても定義できる。 実際、宇宙を全体系にとれば、如何なる系もこうした部分系とみなせる。この意味であら ゆる物理系を記述する非常に統一的な方法である。そこで、最初にこれらのいろいろな密 度演算子に共通することがらを述べておく。 定義 密度演算子は、量子力学的な状態への射影演算子の1次結合であり、係数は負でない実 数であり、その和は1に等しい。個々の状態が規格化されたケットベクトル | m〉 であたえ られる離散的なものとし、状態 | m〉 への射影演算子の1次係数を Pm とすれば、密度演算子 ρ は、 ρ = ∑ | m〉 pm 〈 m | , ∑p m m =1 m ここでは、状態ベクトルが1粒子系のものなのか、多粒子系のものなのかなどは指定して いない。まず、 P[ m ] ≡ | m〉〈 m | は射影演算子としての性質を満たしており、その和は恒等演算子 I となる。 ∑P P[ m ] P[ m ] = P 2[ m ] = P[m ] , [m] =I m この演算子をある状態ベクトル | k 〉 に作用させることは、ユークリッド空間のベクトルの言 葉で言えば、ベクトル | k 〉 をベクトル | m〉 に射影することにあたる。 P[m ] の和が1であるこ とは、これらの係数がある事象が起きる確率に対応していることを示唆している。 ある表示による密度行列 密度演算子の射影演算子の基礎になっている状態ベクトルが定義されたのと同じ物理系 におけるある物理的な観測量(座標、運動量など)による基底ベクトルによる表示 | ξ 〉 を用 いて、密度演算子を密度行列で表現できる。 ρij ≡ 〈ξ i | ρ |ξ j 〉 ≡ ∑ 〈ξ i | m〉 pm 〈 m | ξ j 〉 m 一般に行列の対角要素の和を Trace、Spur などと呼び、Tr と表記する。これを使うと、 Tr{ρ } = ∑ ρii ≡ ∑ 〈ξ i | m〉 pm 〈 m |ξ i 〉 = ∑ pm 〈 m | ∑ | ξ i 〉〈ξ i | m〉 = i,m m i ∑p m m となる。一般に演算子に対応した行列の対角要素の和は、表示に依存しない。 密度行列は、密度行列の定義によっては、規格化条件 21 ∑p m =1 m を要求しない場合がある。その場合は、 Tr{ρ } で割ることによって規格化する。 対角成分和 Trace の性質 一般の行列 A, B に関して、Tr{AB} = Tr{BA}が成り立つ。 時間的な変化 密度演算子の時間的な変化は、次の方程式で表される。 iη ∂ρ = Hρ − ρH ≡ [ H , ρ ] ∂t ただし H は物理系のハミルトニアンである。これを量子的リユビル Liouville 方程式とい う。 密度行列の意義 密度行列は状態ベクトル(波動関数)という概念を基盤として定義されている。しかし ながら、物理系を記述する場合、波動関数としては扱えない統計性をもった系の状態を記 述することができる。もちろん波動関数が求まるような問題では、密度行列もそれから容 易に求められる。しかし、その逆は成り立たない。実際に、密度演算子が波動関数によっ て定義されていたとする。 ρ = |ψ , t 〉 〈ψ , t | この波動関数は、Schrödinger の方程式 iη d | ψ , t 〉 = H |ψ , t 〉 dt を満たすとする。そうであれば当然、双対(共役な)方程式も満たされている。 − iη d 〈ψ , t | = 〈ψ , t | H . dt これより、 iη dρ d d = iη[ ( | ψ , t 〉 ) 〈ψ , t | + | ψ , t 〉 ( 〈ψ , t |) dt dt dt = H | ψ , t 〉 〈ψ , t | − |ψ , t 〉 〈ψ , t | H = H ρ − ρ H = [H , ρ ] となり、Liouville の方程式が満足されることが証明される。 一般に、密度行列は波動関数より広い範囲の物理現象を扱えるという利点がある。すな わち、多体問題や量子統計学では、計算に便利な道具であり、観測問題や量子情報では、 概念を記述するための必須の概念ということになる。 22 6.6 量子力学から量子統計力学へ 純粋状態と混合状態 量子論でいう一つの状態ベクトルで記述される系は、古典論の力学系にあたる。古典的 な統計物理学と同じように、量子系も集団を大きくとると、さまざまな状態が混在してい る状態が現れる。そうした系はもはや1つの波動関数だけでは記述できない。系が1つの 波動関数で記述できる状態にあるときを純粋状態 Pure state, ある確率で複数の純粋状態 にまたがっている状態を混合状態、mixed state という。(厳密に言うと混合状態は量子力 学的な状態ではない。むしろさまざまな状態にある系が、古典的な意味である割合で共存 している状況を表していると解釈すればよい。 )混合状態を記述するには、波動関数よりも、 射影演算子である密度行列を使うのが便利である。すなわち、 | Ψ1〉,| Ψ2 〉,...,| Ψi 〉,.. . p p2, ... pi ... 1, に対して、 ρ = ∑ p i | Ψi 〉〈 Ψi | が密度作用素 Density Operator である。この混合状態に関する entropy は、 S ( ρ ) = − k Trρ logρ = −k ∑ ρi log ρi i ただし k はボルツマン定数、 ρi は、 ρ の固有値であり、この固有値に属する直交固有ベク トルを、 | ρ i 〉 とすれば、 ρ | ρi 〉 = ρi | ρi 〉 である。 ある純粋状態、 | Ψ 〉 に対しては、 ρ = | Ψ〉〈 Ψ | は単にその状態への射影演算子となり、その状態の出現確率は1だから、entropy はゼロに なる。 Gibbs 集団の密度演算子 23 量子力学の原理として一般に、「系の状態が | m〉 である時、ある観測量 ξ を測定した時の 観測値の期待値は 〈 m | ξ | m〉 である」と言える。したがって、こうした系のコピーを沢山( N G 個)想定し、もし系がある | m〉 に確定的に存在するのではなく、確率 pm でさまざまな | m〉 に分布していると仮定すれば、その期待値は、 ∑p m 〈 m | ξ | m〉 m となるであろう。ここである表示 | ς ' 〉 を導入して密度演算子の行列表示をとれば、 ∑p m m 〈 m | ξ | m〉 = ∑ pm 〈 m | {∑ | ς ' 〉〈ς ' |} | ξ | m〉 ς' m = ∑ 〈ς ' | ρξ | ς ' 〉 = m ∑ 〈ς ' | ξ ρ | ς ' 〉 m = Tr{ρ ξ } = Tr{ξ ρ } となる。 Gibbs 集団は、確率を考えるための仮想的な集団と考えることができる。 古典統計力学では、粒子数 N、体積 V、内部エネルギーU が一定の集団を、 Micro Canonical Ensemble、N と V と温度 T が一定な集団を Canonical Ensemble, 粒子数は変化するが化 学ポテンシャルと V と T が一定な集団を Grand Canonical Ensemble と呼んだ。量子力学 においてもこれらの概念が引き継がれている。 カノニカル集団とボルツマン分布則 Canonical Ensemble は熱的な平衡状態にあり、カノニカル密度演算子 ρ c = C exp [ − 1 H ( q, p ) ] kT で記述される。ここで、 C は定数、 H ( q, p ) はハミルトニアンである。 ρ c は、演算子とし ては H だけを含むから、もちろん H と可換である。 iη ∂ρ c = [H , ρ c ] = 0 ∂t ゆえに時間的に変化をしない。このことは、平衡状態を記述する条件を満たしていること を意味している。 24 次に、上記とは反対に、密度演算子からボルツマン分布を導くことを考える。 いま、ある密度演算子 ρ をもちいて次のスカラー量を定義する。 σ = − Tr ( ρ ln ρ ) 定義から σ は、密度演算子 ρ のある行列表現の対角成分 ρ kk によって、 σ = − ∑ ρ kk ln ρ kk k となる(Trace は表現によらない)。さらに、この密度演算子 ρ は、規格化条件 ∑ρ kk =1 k を満足しているものとする。そこで熱的に平衡な系を記述する密度演算子 ρ を求めること を考える(Sakurai, 184)。 密度演算子の時間的な変化は、次の量子的 Liouville 方程式 iη ∂ρ = Hρ − ρH ≡ [ H , ρ ] ∂t にしたがうが、平衡状態にあるということは、 ∂ρ = 0 であることを意味する。ゆえに ρ と ∂t H とは、可換であるから、両者を同時対角化できる表示が存在する。この表示における ρ kk ≡ pk は、あるエネルギー準位 Ek を占める系の数に対応する。 σ を最大(実際は停留値)ならしめる条件、 δσ = 0 ここで変分によって を求める。ただし、この変分をとるには束縛条件が伴う。ひとつは、 H の ρ で記述される 系の平均 H を統計的な集団を構成する系の内部エネルギーと見なすことからくる。すなわ ち、 H ≡ 〈 H 〉 ≡ Tr ( ρ H ) = U から導かれる δ ( H ) = ∑ δ ρ kk E k = 0 k 束縛条件である。もうひとつは、規格化条件 ∑ρ k δ ( Trρ ) = ∑ δ ρ kk = 0 k である。 25 kk = 1 であり、これから 最初の束縛条件に関するラグランジュの未定係数を β 、2番目のそれを γ とすれば、 δ σ = − δ (∑ ρ kk ln ρ kk ) = − ∑ (δ ρ kk ln ρ kk + ρ kk δ ln ρ kk ) k k = − ∑ (δ ρ kk ln ρ kk + ρ kk δ ln ρ kk δρ kk ) δρ kk = − ∑ (δ ρ kk ln ρ kk + ρ kk 1 k k ρ kk δρ kk ) = − ∑ δ ρ kk (ln ρ kk + 1) k であるから、 ∑δ ρ kk [(ln ρ kk + 1) + β Ek + γ ] = 0 k となる。これが任意の変分に対して成り立つためには、括弧の中がゼロなことが必要十分 条件である。よって、 (ln ρ kk + 1) + β Ek + γ = 0 すなわち、 ρ kk = exp( − βEk − γ − 1]) = exp( − γ − 1) exp( − βEk ) = Const × exp( − βEk ) をうる。定数 Const.を、規格化条件 ∑ρ kk = 1 から決定すれば、 k ρ kk = exp( − βEk ) ∑ exp( − βEi ) i をうる。これは、エネルギー準位 Ek を占めている状態数を与える。これは、カノニカル分 布に他ならない。 統計力学の記法を採用すれば、 Z≡ ∑ exp( − β E ) = Tr ( e i i また、 ρ= e − βH Z となる。 26 − βH ) エントロピーを最大にする分布 熱力学でも古典的な統計力学でも、熱的な平衡状態はエントロピーを最大にする分布に 一致していた。この性質は量子統計力学にも引き継がれている。上記の議論で、エネルギ ーに関する束縛条件をつけないと、 σ を最大ならしめる ρ kk は、集団の系の数を N とした 時、 ρ kk =1 / N で与えられる。これは、エネルギー値に関係なく、すべての状態を等しい数 の系が占めるという完全にランダムな状態である。エネルギーについての束縛があると、 こうした状況は起こらず Boltzmann 分布となるのである。ここで、 S = k σ , ただし、 k は Boltzmann 定数 とすれば、 S はエントロピーと解釈でき、ボルツマン分布はエントロピー最大ならしめる 分布ということになる。 熱浴による議論 量子統計力学における熱平衡における Boltzmann 分布の導出には熱浴と状態数を算定す る方法が使われる。この議論は、どの(量子)統計力学の教科書にもあるが、ユニークな 議論は、Feynman, Statistical Mechanics, p.1-6) 分配関数と熱力学関数 古典論である熱力学と統計力学では、統計力学で求めた分配関数によって熱力学の諸関 数が求まる。このことはそのまま量子統計力学に引き継がれる。いま、カノニカル集団に 属する系のハミルトニアンを H 、その固有値を E n 、その直交規格化された完全系である固 有状態を | n〉 とすると、 H | n〉 = En | n〉 、 ∑ | n〉 〈 n | = 1 . n となる。この場合(カノニカル集団)の密度行列は、 1 H ] | n 〉 〈n| kT n . 1 = C ∑ exp [ − En ] | n〉 〈 n | kT n ρc = C ∑ exp [ − であり分配関数は、 27 Z = Tr{exp [ − 1 H ]} kT で与えられる。ハミルトニアンを対角化するエネルギー表示では、 Z = ∑ exp [−E / kT ] n n となる。これは古典論の表示とまったく同じである。しかし、このエネルギーをどう計算 するかが異なる。この場合、密度演算子は、 ρc= e − βH Tr e − βH である。よって、エネルギーの平均値は、 E = Trρ c H で与えられる。同じように、熱力学的な諸量が分配関数から求められる。 カノニカル分布に対応する密度演算子は、各エネルギー準位が重み e − Ei kT で混合している 状況、 | 1〉, | 2〉, ..., | i〉,.. E E . E − i − kT1 − kT2 kT e , e , ..., e , ... に対応しているのである。高温の極限ではこの重みは等しくなり、すべての状態にある系 の数は等しくなる。 グランドカノニカル分布 量子力学的なグランドカノニカル分布は ρG = 1 exp [αN − βH N ] , β ≡ 1 / kT Ξ グランドカノニカルな分配関数は、 Ξ (α , β , V ) = ∞ ∑ Tr, N =0 N {exp [ αN − βH N ]} 28 これからさまざまな物理量の平均値が計算できる。この関数は、3つのパラメータ、α , β , V β の意味は容易に理解できる。体積 V への依存性は、トレー スをとる操作(実際には積分に移行する)に関係している。 α は古典論では、逃散能(あ に依存している。このうち α るいは逸散能)fugacity と呼ばれる無次元のパラメータ z と、 z = e の関係にある、これ も無次元のパラメータである。 実際の計算 以上、熱力学や統計力学の諸量が量子力学でどのように引き継がれるかの概略を述べた。 ここででてきた概念や方程式の意味は、実際の物理系の問題を計算することによってより 具体的に理解されるであろう。これは一般的な量子統計力学の問題である。次に、我々は 量子統計力学よりは多体問題と呼ばれる課題を情報学の視点から考察する。 29 N 体系の部分系 6.7 N 個のフェルミ粒子 Fermion のある純粋状態に対応する波動関数を Ψ とする。N 個の中 の s 個だけの部分系に関する密度作用素は、 ρ s (1,2,..., s ) = Tr( s +1,..., N ) | Ψ〉〈 Ψ |, s = 1,2,..., N で定義される。配位積分式表現では、 ρ s ( x1 ,...x s ; x ' ,..., x s' ) = ∫ Ψ * (x ' ,...x ' , x s +1 ,..., x N )Ψ ( x1 ,...x s , x s +1 ,..., x N )dx s +1 ...dx N 1 1 s あるいは、座標をまとめて形で、 ρ s ( x s ; x s ' ) = ∫ Ψ * (x s ' , x N − s )Ψ ( x s , x N − s )dx N − s と書く。 これは縮約された密度作用素 Reduced density operator とも呼ばれる。 (i) ρ s は、負にならない固有値を有する Hermitian operator である。 (ii) Ψ が正規化されていれば、 Tr(1, 2,..., s ) ρ s = 1 (iii) ρ s = ∑| R 〉r 〈R i s i s i s | 、ただし、これらの要素は固有値方程式を満たす。 i ρ s | Rsi 〉 = rsi | Rsi 〉 i i ここで、固有値、 rs は、すべて実であって負でない。すべての rs の和は1であり、ゼロ以 外に極限点(limit point)をもたない、という性質を満たす。 i ゆえに、 rs を、以下のようにならべることができる。 rs1 ≥ rs2 ≥ ... ≥ rsi ≥ ... S 個の部分系に対して、これと相補的な N-s 個の粒子からなる部分系が定義できる。ρ N − s は、 ρ s と相補的に定義できる。この ρ N − s の固有値は ρ s のそれと等しくなる。そして全体 系の波動関数は、ρ s の固有関数と ρ N − s の固有関数の積に共通の固有値の平方根を乗じた形 の和に展開される。 (iv) 部分系 s と、それと相補的な部分系 N − s に関する2つの密度演算子、ρ s と ρ N − s の 30 固有値をそれぞれ大きさ順にならべた時、 rsi = rNi − s , i= 1, 2,Λ となる。 (v) 上記の固有値に属する固有関数を、 Rti ( x t ) = 〈 x t | Rti 〉 , i= 1, 2, Λ , t = s or p とすれば、 R si ( x s ) = ( rsi ) − 1 / 2 ∫ Ψ ( x N − s , x s ) R Ni − s * ( x N − s ) dx N RNi − s ( x s ) = ( rNi − s ) −1 / 2 ∫ Ψ ( x s , x N − s ) RNi − s * ( x s ) dx s となる。また、全系の波動関数は、2つの相補的な部分系の密度演算子の固有関数の積 として、 Ψ ( x s , x N −s ) ~ ∑ (r ) i 1/ 2 s Rsi ( x s ) RNi − s ( x N − s ) i この収束は平均としてのそれであり、この展開は「途中で打ち切った場合にも同じ数の関 数による展開より悪くない」という意味で、誤りを最小とする展開である。この展開を、 量子化学では、Natural orbital expansion と呼ぶ。 (iii)により、 ρ s は、s個の粒子が混合状態 | rsi 〉, ..., | rsi 〉, ... r i , .... , r i , ..... s s にあることを表している。 第2量子化による縮約密度行列の表現 + 同じく、N粒子系において、系が波動関数 | Ψ 〉 の状態にあるとし、 ai , ai を1粒子状態 {φi ( x)} の生成、消滅演算子とする。この時、1体の密度行列を、数の演算子を規格化した、 (1 / N ) ai+ ai の期待値として定義する。 31 〈 j | ρ1 | i〉 = 1 〈 Ψ | ai+ a j | Ψ 〉 N 同じく、2体の密度行列を 〈 kl | ρ 2 | ij 〉 = 1 〈 Ψ | a i+ a +j a k a l | Ψ 〉 N 2 で定義する。 これらの行列を用いれば、1体あるいは2体のみに依存する演算子関数、 A(1) = ∑ Ai(1) = ∑ ai+ 〈i | A*(1) | j 〉 a j i i, j A( 2) = ∑ Ai(,2j ) = 1 2 i< j ∑ i , j ,k ,l ai+ a +j 〈i j | A*,*( 2 ) | kl 〉 ak al は、1体および2体の密度行列を用いて、 〈 Ψ | A(1) | Ψ 〉 = N ∑ 〈i | A (1) * | j 〉 〈 Ψ | ai+ a j | Ψ 〉 i, j = N Tr{ A*(1) ρ1} および、 〈 Ψ | A( 2) | Ψ 〉 = = = 1 2 1 2 1 2 ∑ i , j , k ,l ( 2) | kl 〉 ak al ai+ a +j 〈i j | A*,* ∑ 〈i j | A | kl 〉 〈 Ψ | ai+ a +j al ak | Ψ 〉 ∑ 〈i j | A N | kl 〉 〈 kl | ρ 2 | ij 〉 2 ( 2) *,* i , j , k ,l i , j , k ,l ( 2) *,* N ( 2) 〈i j | A*,* ρ 2 | ij 〉 2 1 N ( 2) Tr { A*,* = ρ2} 2 2 = 1 2 で与えられる。 32 6.8 渡辺慧の考察 量子力学における知識の不確定さ N 体系における1粒子系の entropy の定義 確率事象の組、 , , An A1 , A2 ・・・ A = , , pn p1 , p2 ・・・ は、この事象に関する我々の知識の不確定さを表わしているといってもよい。この事象の 組に関する情報 entropy は、そうした知識の不確定さの尺度(測る物差し)であると言え る。 以下の議論では、N 体系における1粒子系に着目する。このような1つの粒子を考え、 それがとれる状態が E1 , E2 ・・・ , , En とする。これは例えば、エネルギーであると仮定してよい。この粒子に関しては、そのう ちのどの状態にあるかはわからず、単にそれぞれの状態にいる確率だけを、 p1 , p2 ・・・ , , pn のように決定できるとする。 このとき、 n S = −∑ pi log pi i を量子力学的なと呼ぶ。 この量は、John von Neumann により量子力学の観測理論において導入された。ただし、 von Neumann は、この量を知識の不確定さと結び付けたわけではなかった。渡辺慧はそれ を発展させ、量子統計にしたがう多体粒子系においける粒子相関の強さを測る尺度として 用いた。すなわち microscopic entropy は1粒子に関する我々の知識の不確定さと結び付け られた。 粒子相関の強さの尺度 渡辺の議論を簡単にすると次のようになる。複数の同種の粒子の振る舞いが量子力学に 33 したがうとすると、それらは互いに区別がつかない。また、粒子は固有のスピンによって Bose 粒子か Fermi 粒子に大別される。電子や核子は Fermi 粒子である。いま N 個の Fermi 粒子を考え、その各は、Ei のエネルギーをとりうると仮定する。Fermi 粒子は同一の量子 状態に1つ以上入ることはできない。したがって、この系の基底状態(最もエネルギーの 低い状態)は、エネルギーの低い順に、1、・・、N までの状態が占有されたものとなる。 この場合、それぞれの粒子が具体的にどの順位にあるかは、量子力学の粒子の不弁別性か ら決定することはできない。そこで、それぞれの粒子の間に相関がないとすると (Hartree-Fock 近似)、1つの粒子は上の N 個の低いエネルギー準位に 1/N という等確率 で分布することになる。したがって、エントロピーは log N で与えられる。しかし、実際に は粒子の相関があると、全体の系は基底状態でも、1個の粒子は N 番め以上のエネルギー 準位をも何らかの確率で占有するようになる。高い準位の占有される確率は粒子間の相関 が強いほど大きいから、占有の状況はばらついてくる。このばらつきを microscopic entropy で計り、相関のない近似の時の entropy の値、log N を差し引けば、相関の強さ R の尺度になる。すなわち、 S − log N = R となる。 渡辺の仕事は 1939 年になされたが、その論文はドイツ語で核物理学の仕事に分類されて いた。その後神沼は渡辺の尺度をより広い立場から捉えなおし、核物質、電子ガス、分子 など幅広い対象に適用した。最近量子化学者は、情報エントロピーを利用して電子相関の 強さの尺度とするという方法を提案し始めている。これは、渡辺―神沼によって試みられ た方法である。 熱力学の第2法則と量子力学 渡辺が上記の考察は、microscopic entropy を我々の物理量に関する知識の不確定さを 計る尺度として用いたことによる。ここでの知識の不確定さの尺度は、核子の相関の強さ という物理量を評価するために尺度に対応ずけられているが、こうした考え自身、物理学 の枠を越えた情報学的な考察ということができる。 渡辺のこの仕事は、第2次大戦が始まる前のドイツのハイゼンベルクのところでなされ た。ただ、摂動論による1粒子状態の占有確率の計算は、同じハイセンベルク門下の若き 俊英オイラーに少し前に発表されたものと基本的に同じである。その意味では、 Euler-Watanabe の計算法と呼べるだろう。核子をガスのように扱ったこの計算法は、それ より約 20 年後になされた Gell-Mann と Brueckner らのファイマンダイアグラムを用いた 電子ガスの計算とも基本的に同じである。核子のこうしたガスモデルはその後、核物質 Nuclear Matter と呼ばれるようになった。 ハイセンベルクの下でのこの仕事の前、渡辺はドゥ・ブロイの下で、日本からの留学生 34 として学位論文に取り組んでいた。その課題は、熱力学第2法則の量子力学的な解釈であ った。この論文の中で、渡辺は、量子力学的な観測は、ヒルベルト空間の部分空間への射 影であるという考えに到達している。密度演算子は、本質的に射影演算子であり、観測に よってある状態を見出すことは、混沌としていた対象に関する知識が、ある状態に収束す ることに相当する。量子力学的な状態は観測をしない限り乱されず、定常的であり、密度 行列も、したがってその固有値で定義されるエントロピーも不変なはずである。それが観 測においては、どれかの状態に収束するから、エントロピーは観測によって決定的に減少 してしまうことになる。実際にそれによって、観測対象系のエントロピーが減少するなら、 それを補うエントロピー増大が観測者側の系に起きていなければならない。この変化は突 然起きることになっているが、実際には、ある時間の間におきている現象であろうと考え られている。エントロピー増大則はボルツマンのH定理とも関係している。その量子力学 への拡張の問題もある。古典論でボルツマンを悩ませた批判は、微視的な世界が時間対称 の(ニュートンの運動方程式)で記述されるのに、時間に関して一方向性をもったHの減 少が活論されることである。シュレディンガー方程式は時間に関して対称であるから、こ の批判は量子力学にも受け継がれることになる。 こうした問題はまだ決着がついているとは言えない。 35 6.9 おわりに 混合状態を記述する統計作用素 Statistical Operator、密度行列 Density Matrix、あるい は密度演算子 Density Operator は、射影演算子の1次結合の形をしている。射影演算子は、 量子力学的な純粋状態への射影であり、結合の係数はそれぞれの純粋状態に系を見出す確 率である。ただ後者の確率は、観測によってある状態に系が見出されるという、量子力学 の基本原理でいう確率ではなく、多数の集団を考えた時、平均して見出される事象の確率 という、日常的な意味での統計性に対応した確率である。すなわち、密度演算子のうち、 射影演算子は量子力学の原理的な統計性を具現し、1次係数の方は、日常的な統計性を反 映しているのである。 物理学では、この密度演算子を、統計力学における状態和のような、計算に便利な道具 であるとして使っている。しかし、情報学との関係を考えると、密度演算子はエントロピ ーという概念以上に「情報学的な概念」である。したがって、この量は単なる計算手段と してだけではなく、概念を掘り下げて研究してみるべき対象である。 この作用素を最初に量子力学に導入したのは、フォン・ノイマンだった。また、密度行 列を使ったのはランダウ L.D. Landau だった。統計物理学における普及はランダウらに負 っている。統計力学における計算の道具としての普及した密度行列は、グリーン関数や経 路積分のファイマン核などと関係づけられながら発展している。フォン・ノイマンは、観 測の理論や量子情報論との関係で今でも読まれている。我が国では、伏見康治が量子統計 力学において紹介している。物理学のミクロスコッピック・エントロピーを「知識の不確 定さの尺度」と明確に捉えた渡辺慧は、さまざまな物理学の概念を吟味しながら、情報学 を建設するパイオニアの一人となった。興味深いことに、湯川と朝永のように、伏見と渡 辺も高等学校、大学時代を通じての同級生である。 36 第6章の参考文献 藤田重次、統計熱物理学、掌華房、1989 年 藤田重次、量子統計物理学、掌華房、1990 年 河原林研、量子力学(岩波講座 現代の物理学 第3巻)、岩波書店、1993 岡崎誠、物質の量子力学、岩波書店、1995 年 吉川圭二、群と表現、岩波書店、1996 年 鈴木増男、統計力学(岩波講座 現代の物理学 第4巻)、岩波書店、1994 L.D. Landau and E.M. Lifshitz, Quantum Mechanics (2nd ed.), Pergamon,1965 L.D. Landau and E.M. Lifshitz, Statistical Physics, Pergamon, 1969 R. Feynman, Statistical Mechanics, Benjamin, 1972 N.H. March, W. H. Young, and S. Sampanthar, The Many-body Problem in Quantum Mechanics, 1969 H. A. Bethe and R. Jackiw, Intermediate Quantum Mechanics (2nd ed.), Benjamin, 1968 朝永振一郎、スピンはめぐる、中央公論社、1974 年 高橋康、古典場から量子場への道、講談社サイエンティフィック、1979 年 武田暁、場の理論、掌華房、1991 年 E. Lewars, Computational Chemistry, Kluwer Academic Publishers, 2003 伏見康治、確率論及統計論、河出書房、1942 年 伏見康治、量子統計力学、共立出版、1967 年 John von Neumann, Mathematische Grundlagen der Quantummechinics, Apringer, Berlin,1932 (英 語訳、R. T. Bayer, Mathematical Foundation of Quantum Mechanics, Princeton University Press, 1955; 井上健、広重徹、恒藤敏彦訳、量子力学の数学的基礎、みすず書房、1957 年)、この 中の5章、6章が観測の理論になっている。 渡辺慧/村上陽一郎訳、知識と推測 (I-IV)、東京図書 S. Watanabe, Knowing and Guessing, Wiley, 1969 H. Euler, Zeitschrift für Physik 105, 1937, pp.553-575. Satoshi Watanabe, Zeitschrift für Physik 113, 1939, p.482 M. Gell-Mann and K. A, Bureckner, Phys. Rev. 106, 1957, p. 364 T. Kaminuma, Informational entropy as measure of correlation of interacting fermions, 37 Ph.D. Thesis, University of Hawaii, 1970 量子化学者でシュミット分解理論に最初に気付いたのはLöwdinである。彼はそれをNatural Orbital Expansionと呼んだ。 P. O. Löwdin, Phys. Rev. Vol. 97, 1955, 1474 Löwdinは渡辺のような粒子相関の尺度としてのエントロピーは導入していなかったが、最 近、量子化学者たちの中で、渡辺ー神沼の仕事と同じアイデアの仕事がなされている。 P. Gersdorf et al, Correlation Entropy of the H Molecule,International Journal of Quantum Chemistry, Vol. 61, 1997, pp.935-941 P. Ziesche et al, The He isoelectronic series and the Hooke’s law model: Correlation measures and modifications of Collins’ conjecture, Journal of Chemical Physics, Vol. 110, NUMBER 13 1 APRIL 1999, N. L. Guevara, R. P. Sanger, R. O. Esquivel, Shannon-information entropy sum as a correlation measure in atomic systems, Phys. Rev. A67, 012507, 2003,1-6 38 第6章の補遺 シュミットの分解理論 はじめに シュミットの E. Schmidt は、ヒルベルトと同じ時代に積分方程式論の仕事をした数学者 である。ここで紹介するシュミットの分解理論とは、彼が、1907 年に Math. Annalen. (Vol. 63, pp.433-476)に発表した「線型および非線型の積分方程式」に関する理論である。この 理論は、統計学、パターン認識、通信理論、画像解析、量子力学、量子化学、さらに最近 は量子計算、量子情報、ゲノム・ワイドな遺伝子解析など広範な分野で知られるようにな ってきている。しかしこの理論は、それぞれの分野ごとに、幾度も再発見されたため、分 野を横断した広がりのある理論であるとは現在でも必ずしも認識されていない。以下では、 一般の線型空間によって、この理論をもっともわかりやすい形で紹介し、次に、いくつか の分野における応用理論を紹介する。 1. 非対称的な行列の分解 いま、 x , x ,Λ , x という m 個の計測対象があり、その各々に y1 , y 2 Λ , y n という n 個 1 2 m i の計測項目に関する計測を行ったとする。この時、 x に関し、 y j の計測によって得られた i 値を x j とする。全部を書くと、 y1 , y2 , Λ , yn ↓ ↓Λ ↓ x → x11 , x12 , Λ , x1n 1 x 2 → x12 , x22 , Λ , xn2 Λ Λ x m → x1m , x2m ,Λ , xnm となる。これはパターン認識や科学や社会科学で遭遇する最も普遍的な観測データである。 この測定結果は、 m × n の行列とみなされる。これを K と呼ぶ。 この K から、次のようにして、2つの対称正方行列、G と H を作成することができる(正 方行列の行、列の数は等しい)。 G は n × n 、と H は、 m × m の対称行列である。 m Gij = ∑ wk xik xkj / || xk ||2 k =1 1 n Hij = ∑ (wk wk )1/ 2 xki xkj /(|| xi ||⋅ || x j ||) k =1 ここで、 {wi } は、規格化されている正の数である。 m ∑ w = 1, i =1 i wi > 0 . 式の対称性をとるために、上の表そのものでなく、規格化した新たな行列 K を、 Kij = (wi )1/ 2 xij / || xi || によって改めて定義する。この K の転置行列を K とすると、 G と H は、 + G = K +K, H = KK + と書ける。 これらの行列に関して、次の定理が成り立つ。 定理1.2つの行列、 G と H とは、縮退も含めて、負でない実数の固有値をもつ。それら を大きさの順にならべることができる。すなわち、 λi , ( i = 1, 2,Λ ) を固有値とすれれば、 λ1 ≥ λ1 ≥ λ1 ≥Λ ≥ 0 と並べることができる。ここで、ゼロでない固有値は高々 min{m, n} 個だけである。 いま、 g と h 、をそれぞれ G と H の固有値 λi に属する規格化された固有ベクトルとす i i る。 定理2.これら2つのベクトルの組は互いに、次のような対称的な式で結ばれている。 gi = (1/ λi )1/ 2 K + hi , hi = (1/ λi )1/ 2 K gi , 定理3.行列 K は、以下のように、G と H の固有ベクトルのテンソル積によって展開され る。 2 K= max{m,n} ∑ (λi )1/ 2 gi ⊗ hi i −1 定理4.上記の展開は、途中で打ち切った時の誤差を最小にするものである。すなわち、 任意の、それぞれ k 個の2組のベクトル X , Y , i = 1, 2,Λ , k に対して、 i k i k Min || K − ∑ X ⊗Y || = || K − ∑(λi ) g ⊗ h || = { X i ,Y i K } i i i =1 1/ 2 i i i =1 max{m,n} ∑λ i i =k +1 ここで、 || || は行列のノルムを表す。 最初のデータ表あるいは、それを規格化した行列 K に対して、以下によってエントロピ ー S を導入する。 n m i =1 k =1 S = − ∑ ρ i log ρ i , ρ i = ∑ ( K ki ) 2 いま x , x ,Λ , x に、新しい座標系 {z }, i = 1, 2, Λ , n を導入して、座標変換をほどこして、 1 2 m i これによる表示をえたとすると、エントロピー S の値も変化する。そこで S をある座標系 {z i }, i = 1, 2, Λ , n に依存するように S ({z i }) と書くことにする。 定理5.エントロピーを最小にする座標系は、 G の規格化された固有ベクトル {g 座標系であり、その値は、 ρi i } の張る = λi を代入したもので与えられる。 n Min S ({z i }) = S ({g i }) = − ∑ λi log λi i} {z i =1 定理1-4は、1906 年 E. Schmidt によって積分方程式の非対称核に関する性質として証 明されたが、その後いろいろな分野で基本的に同じ内容の定理が再発見されている。定理 3の性質から、{g i } は、Karahunen-Loève 系と呼ばれ、その展開を Karahunen-Loève 展 開と呼ばれる。Schmidt の定理は、複素数の関数に関するものであり、上の表現はこれを ユークリッド空間のベクトルに簡単化したものである。したがって、複素数の行列あるい 3 は関数の場合、+は転置行列ではなく、エルミート行列となる。しかし、定理の本質な表 現は変わらない。 + + 例題。 次の2つの行列を上記の K として、K の転置行列 K から、G = K K ,と H = KK + を作成し、定理1-3に相当する関係が成り立っていることを、それぞれの固有値と(規 格化された)固有ベクトルを求めつつ、確かめよ。 K= 1 2 2 , 5 1 − 4 K= 1 1 − 1 2 1 1 2. 極分解と特異値分解 シュミットの分割理論の証明の基礎になるのは、線型代数の極分解 Polar decomposition と特異値分解 Singular value decomposition(固有値分解と呼ばれることもある濱裕光ら)。 ただし、これらの分割は一般の線型代数の教科書ではあまりふれられていない。 正定符号演算子 Positive operator:線型空間の演算子 α がゼロでない任意のベクトル u に対して、 (u , αu ) > 0 である時、α を正定符号演算子という。α に対応した行列を A とす れば、 A は正定符号行列となる。 極分解。 A を行列とすると、正定符号行列 J と K 、およびユニタリ行列 U によって、 A = U J = KU と表現できる。これを A の極分解という。第2式は、右極分解、第3式は、左極分解と呼 ばれる。 特異値分解。 A を正方行列とすると、ユニタリ行列 U と V 、および対角行列 D によって A = U DV と表現できる(対角行列とは、対角要素だけがゼロでない行列である)。これを A の特異値 分解という。 例題。次の行列の特異値分解を求めよ(斉藤、p.188) 4 1 − 1 1 1 − 1 , 0 2 , − 1 − 1 1 1 1 0 0 0 1 0 0 1 1 , 0 0 1 1 − 1 1 0 1 1 − 特異値分解は、1930 年代に、実対称行列のスペクトル分解(固有展開)を Autonne が複素 正方行列に拡張し、同じ頃 Eckart と Young が任意の矩形複素行列に一般化したものとさ れる。 実際に分解の行列を求めるためには、固有値方程式を解く必要がある。かって、固有値方 程式を解くことはコンピュータによっても簡単ではなかったが、現在では高速アルゴリズ ムが開発されている。 3. 統計学の主成分分析 Principal Component Analysis シュミットの理論は、統計学の主成分分析 Principal Component Analysis と基本的に同 じである。主成分分析は、相関係数で知られる統計学者ピアソン K. Pearson によって 1901 年の論文(Phil. Mag. Vol. 6, p.559-)発表されたものである。この場合、 G は、データを n-次元ベクトル空間の点と見た時の重心すなわちデータの平均を新たに原点にとった、 共分散行列となる。その最大の固有値の固有ベクトルを第1(主)成分と呼び、以下、第 2、第2と成分を重要度にしたがって考える。主成分は、 (超)平面までの距離の和が最小 となるような平面に相当する。この距離の和とは、平均2乗誤差である。3次元の場合こ うした固有ベクトルを求める問題は、力学における慣性モーメントの主軸を求める問題と 同じになる。 主成分分析は Principal Component Analysis の頭文字をとって PCA と略称される。 パターン認識の KL 系による特徴抽出理論 パターン認識の出発点は、コンピュータに人間のような認知、判断能力をもたせようと いう研究である。文字の読み取りはその最も象徴的な課題であるが、それ以外に、図形の 認識 Pattern Recognition、画像処理 Picture Processing、対象物の分類 Clustering、機械 による学習 Machine Learning、など幅が広い。それだけに目的ごとに用いられる手法が異 なり、統一的な理論に欠けるために、学問として体系だっていないという批判はある。し かし、実用面では多くの需要があり、いわゆる情報社会を支える基盤技術になっている。 文字読み取りに象徴されるように、パターン認識の目的は人間並みの認知能力を機械に もたせようということにあるが、この目標は当然、人間の認知能力を理解することにも通 ずる。ただし、鳥の飛翔の研究が航空機の発達を基盤ではなかったように、機械の認知能 力の進歩は、計算機の記憶や演算能力の発達に依存している。いずれにしても、双方の学 5 問が発達すればするほど、相互の関係が深まっていくと予想される。もちろん、前者は基 本的な工学の範疇に属し、後者は認知科学 Cognitive Science, 心理学、脳科学、行動科学 などにまたがっている。それゆえ、研究者の気質も、研究スタイルも、学会の風土も大き く違う。まさに学際領域である。それだけに、両者に共通するような統一的な認知理論が 求められている。 残念ながら現在まで、そうした統一性をもった理論はほとんど構築されていない。その 例外的な理論が情報エントロピーと関連した Karhunen-Loève (KL) 系による展開理論で ある。この理論は識別すべき対象(パターン)の特徴を把握するとう意味で特徴抽出論の 一部である。これは、専ら上記の定理5を基礎としている。すなわち、パターン集団の特 徴から決定される相関行列の固有値系(すなわちKL系)は、この集団の傾向を備えてい ると見なされる。主成分分析と同じく、その特徴への各座標の寄与は、固有値の大きさ比 例していると考えられる。パターン認識論ではさらに一歩を進め、任意の対象(パターン ベクトル)が与えられた時、それを KL 系の各座標に射影した成分によって、このベクトル を識別する量にしようという考えである。 このような理論は、我が国の(当時米国にいた)渡辺慧や、電総研の飯島泰蔵らによっ て発展させられた。ただし、ここではシュミット理論のもつ対称性、双対性は使われてい ない。これに気がついたのは渡辺の博士課程の学生だった神沼二眞であり、彼はその後、 画像解析にこの問題を応用した。シュミット分割の画像解析への応用は直感的にわかりや すく、独立に多くの研究者によって応用されている。実際の固有値や固有ベクトルを求め る高速アルゴリズムもこのような研究者によって開発されたようである。 多体問題における縮約された密度行列 N 個の粒子系のある純粋状態に対応する波動関数を Ψ とする。N 個の中の s 個だけの部 分系に関する密度作用素は、 ρ s (1,2,..., s ) = Tr( s +1,..., N ) | Ψ〉〈 Ψ |, s = 1,2,..., N で定義される。配位積分式表現では、 ρ s ( x1 ,...x s ; x ' ,..., x s' ) = ∫ Ψ * (x ' ,...x ' , x s +1 ,..., x N )Ψ ( x1 ,...x s , x s +1 ,..., x N )dx s +1 ...dx N 1 1 s あるいは、座標をまとめて形で、 ρ s ( x s ; x s ' ) = ∫ Ψ * (x s ' , x N − s )Ψ ( x s , x N − s )dx N − s と書く。 これと双対の N-s 個だけの部分系に関する密度作用素は、 6 ρ N − s (1,2,..., s) = Tr(1,..., s ) | Ψ〉〈 Ψ |, s = 1,2,..., N で定義される。配位積分式表現では、 ρ N −s ( xs+1 ,...xN ; xs' +1 ,..., xN' ) = ∫ Ψ * (xs' +1 ,...xN' , x1 ,..., xs )Ψ ( xs+1 ,...xN , x1 ,..., xs )dx1...dxs あるいは、座標をまとめて形で、 ρ N − s ( x N − s ; x N − s ' ) = ∫ Ψ * (x ( N − s )' , x s )Ψ ( x N − s , x s )dx s と書く。 すなわち、s-粒子系の密度演算子では、残りの N-s 系に関する積分によって平均化してお り、N-s 粒子系の密度演算子では、その逆の平均化を行っている。ここで、N粒子系の波動 関数が、上記のシュミット分割の最初のデータ表の K にあたり、双対の G と H がそれぞれ 縮約された密度演算子、 ρ s と ρ N − s にあたる。これらの演算子の固有値は負でなくかつ等し く、大きさの順に並べられる。したがって最初の波動関数は、これら2つの密度演算子の 固有関数(ベクトル)の外積和で展開される。第5章の表記では、 Ψ ( x s , x N −s ) ~ ∑ (r ) i 1/ 2 s Rsi ( x s ) RNi − s ( x N − s ) i しかもこの展開は途中で打ち切った時の誤差を最小にするものである。これが量子化学で いう自然軌道による展開 Natural orbital expansion に他ならない。 量子情報におけるエンタングルメント 密度演算子とシュミットの分割理論は、量子情報と量子計算ではとくに重要である。な ぜなら、これらの理論では複合系 Composite system とその部分系の関係、さらにそれらの 部分系の間の絡み合い Entanglement が重要な意味をもっているからである。いま、部分 系 A と B からなる複合系 AB の密度演算子を ρ AB とすれば、部分系の密度演算子は、それ ぞれ ρ A ≡ TrB { ρ AB } , ρ B ≡ TrA { ρ AB } で与えられる。ただし、部分 Trace は、 A の任意の2つのベクトル | a1 〉 , | a2 〉 と B の任意の 2つのベクトル | b1 〉 , | b2 〉 によって、 TrB {| a1 〉〈 a2 | ⊗ | b1 〉〈 b2 |} = | a1 〉〈 a2 | TrB {| b1 〉〈 b2 |} 7 と定義される。この複合系に関するシュミット分解は、N 粒子系における縮約された密度 演算子、 ρ s と ρ N − s による展開とまったく同じ形式になる。 量子情報、量子計算では部分系の密度演算子のゼロでない固有値の数をシュミット数 Schmidt number と呼んでいる。この数は、2つの部分系の絡み合い Entanglement の度 合いに対応している。ゆえに大変重要だと見なされている。 主語ー述語の双対性 シュミット分解の特徴は、計測対象と計測項目としてみた場合のデータ表 K に関する対 称性(双対性)にある。特徴抽出論の立場から言えば、対象を弁別するために記述項目間 の関連をしらべるのであるが、計測項目を考察の対象、計測対象をそれぞれの項目に対す る計測項目と入れ替えて見る立場も取りうる。ただし、実際のデータ処理においては、対 象ベクトルを規格化するので、どちらの立場を取るかで、計算は完全に対称にはならない。 しかし、考察の進め方は全く同等である。 計測対象と計測項目の関係は、「何々は、何々で特徴づけられる」という、我々の基本的 な認識の出発点となる主語―述語による記述法の特別な場合である。これが計量化された 場合、主語と述語の間に区別はなく、同じ方法で情報の特徴の抽出が行えることをシュミ ット分解は示している。この意味では、計量的な認識論における基本定理と言って過言で はないだろう。 情報縮約の理論 情報理論の真髄を一言で表せば、 「不必要な情報を捨て、分散した情報をより少ない役立 つ情報に集約すること、すなわち情報を縮約すること」であると言える。自然科学や経済 学の法則と言えるものは、まさに情報の縮約である。シュミットの分解は、物理的な実態 やその観測値であるデータの表現である K に含有されている構造を抽出し、それを重要度 にしたがって並べて見せることを可能ならしめると言ってもよい。特徴が把握されれば、 重要でない部分を捨てたり、重要な要素だけに着目したりして、新しいパターンを分類す ることができる。この意味で、複合系に関する密度演算子と非対称であるデータ表(行列) から生成される2つの対称行列とは形式だけでなく、その内容も見事に対応していると言 えよう。 8 参考文献 K. Pearson, Phil. Mag., Vol. 6, 1901, pp.559 E. Schmidt, Zur Theorie der linearen und nichitlinearen integralgleihungen, Math. Annalen.、Vol. 63, 1907, pp.433-476 C. Eckart and G. Young, The approximation of one matrix by another of lower rank, Psychometrika, Vol. 1., 1936, pp.211-218. M. Loève, Probability Theory, Van Nostrand., 1963 伊理正夫、一般線形代数、岩波書店、2003 年 斉藤正彦、線形代数演習、東京大学出版、1985 年 濱裕光、柳重堪、阮牧、シグナルとシステムの数学、森北出版、1997 年 大津展之、栗田多喜夫、関田巌、パターン認識、1996 年 A. Ben-Israel and T.N.E. Greville, Generalized Inverses, Willey, 1974 H.C. Andrew et al., Singular Value Decomposition of Digital Image Processing, IEEE Trans. On ASSP, Vol. 24, 1976 S. Watanabe, Knowing and Guessing, Wiley, 1969 飯島泰蔵、パターン認識、コロナ社、196x? T. Kaminuma, Informational entropy as measure of correlation of interacting fermions, Ph.D. Thesis, University of Hawaii, 1970 T. Kaminuma, S. Tomita, and S. Watanabe: Covariance Matrix Representation and Object-Predicate Symmetry, (in P.R. Krishnaiah and L.N. Kanal (eds.): Handbook or Statistics, Vol. 2, North-Holland, Amsterdam, 1982), pp. 699-720 M. Nielson and I. Chuang, Quantum computation and quantum information, Cambridge University Press, 2000 9 第7章 量子論理、量子情報、量子計算 7.1 はじめに 量子情報 Quantum Information と量子計算 Quantum Computation は、量子物理学、 数学、計算学 Computation などの学際に位置する新しい研究領域として急速に発展してい る。このうち量子計算の関心は、量子力学系をもちいた計算システムの実現にあり、量子 情報の関心は、同じく量子力学の原理を応用した通信にある。この双方を意味する時、我々 は量子情報計算という言葉を使うことにする。ここでは当然、量子力学と情報および計算 に関連した概念や課題が論じられる。しかし今のところこの分野は、量子力学の原理を具 現するような現象を利用して計算や通信を行うことを目標としており、情報や計算の概念 や物理的な過程に踏み込んだり、情報計算に関る学問と物理学との間にどのような関係が あるかを問題にしたりすることはない。この意味では情報や計算を物理学の枠組みの中で 論じようとする、マックスウエルのデモンをめぐる議論とは趣を異にする。しかし、現在 の計算機の進歩の基盤となっている半導体回路の微細加工技術が進歩すれば、記憶や演算 過程には個々の原子分子の振る舞いを考慮せざるをえなくなるだろうと予想されている。 そうなれば、かってカルノーが理想の熱機関の開発しようとして、熱力学の基本法則に到 達したように、理想の計算機づくりかた、新しい物理学にも関係した法則が浮かび上がっ てくる可能性もある。それは物理学と情報処理や計算過程と関係した法則になるだろう。 情報をうるにはエネルギーがいるとか、情報を消去するにはエネルギーがいる(後者はラ ンダウアーの原理と呼ばれている)というような法則はそうした法則の例であると言えよ う。 そこでこの章では、アインシュタインらの EPR やシュレディンガーの猫など今日の量子 情報計算の源流である量子力学の基礎をめぐる論争とその後の展開を紹介し、量子絡みあ い Quantum Entanglement 現象などに関する基礎理論の流れと、直接の応用事例としての 量子テレポーテーションを解説する。次に、マックスウエルのデモン論争と半導体微細加 工技術の先にある未来技術流れを紹介する。ここではファイマンの先駆的かつ啓蒙的な活 動にふれる。次に、量子計算の基本的な考え方や期待される応用課題を解説する。 7.2 量子力学における観測と解釈の問題 現在関心をもたれている量子情報計算の根源は古典的な系とは異なる量子力学の系に特 徴的な振る舞いをめぐる論争にある。量子力学独特の現象の中には、実験や結果の解釈に 関して研究者の間でも意見が分かれているものが含まれている。複合系における絡みあい entanglement はそうした現象の一つであり、アインシュタインらが、1935 年に発表した、 後に EPR と略称されるようになった論文で提示された仮想実験をめぐる論議でも中心的な 位置を占めている。また、量子力学の解釈の難しさに関する例としてよくもちだされるの 1 は、同じ年に発表されたシュレディンガーの論文の中の、後に「シュレディンガーの猫」 と呼ばれるようになった仮想実験である。最初に量子力学の創始者であるアインシュタイ ンやシュレディンガーの提起した問題とその影響を簡単に紹介する。 シュレディンガーの猫とその波紋 原論文 多世界論 この論文に刺激を受けた、エベレット H. Everett Ⅲは、観測に伴う複合系の状態を表す 波動関数の変化を考察して、波動関数の収縮という概念を排する「相対的な状態」と呼ぶ理 論を発表した。現在この理論は、多重世界論 Multi-world Theory と呼ばれている。多重世 界解釈を支持する量子情報計算の研究者も少なくない。 EPR 問題 光量子仮設や光の誘導放出理論などで、量子力学建設の立役者の一人でもあるアインシ ュタインは、量子力学の非決定論的な性格を嫌い、確率解釈をよしとするいわゆるコペン ハーゲン学派のボーアらと激しく対立していた。その彼が、提出した量子力学を疑った共 著論文が、 A. Einstein, B.Podolsky, and N. Rosen, Can quantum-mechanical description of physical reality be considered complete?, Physical Review, 47, 1935, pp.777-80 である。 わずか4頁ほどのこの短い論文は、その後多くの解説、批判、実験的考察に関する論文 が書かれた。この論文は、最初に複合系をなす2粒子の状態を考え、その後これらの粒子 がお互いに十分離れ、最早相互作用していない状態で、互いに非可換の関係にある(例え ば座標と運動量というような)状態量の一つを一方の粒子について観測する問題を論じて いる。この論文は、著者たちの名前をとって、EPR と呼ばれた(アインシュタインの PR と覚えると良い)。彼らの問題意識は、EPR パラドックスとも呼ばれる。アインシュタイン 2 の局所性 locality とも呼ばれる。 この問題を含め、量子力学の確率的な解釈をめぐっては、 「隠れた変数 Hidden variable」 の存在を仮定する議論など、さまざまなアイデアが出されている。こうした議論は続いて いるが、ERP が問題にしている局所性の有無を検証する実験が提唱され、実際に試みられ ている。この実験には、2状態の複合系を多数用意しておいて、それらの部分系に関して 非可換の関係にある2つの観測量を測定し、結果の出現確率(期待値)を求め、それらが 確率事象として見た時、妥当な関係になっているかどうかを検証することを目的にしてい る。その妥当性を検証する目的で考えられたのが、ベルの不等式 Bell’s inequality である。 実際にベルはこの不等式を論文で発表した訳ではないが、今日ではこの名前で呼ばれてい る。多くの実験結果は、量子力学の記述が正しい結果を与えること、したがってアインシ ュタインらが当初も目論んでいたような、量子力学の不完全さを導こうとした試みは成功 しなかったと今日では判定されている。 この問題は、entangle した2つの粒子(部分系)の記述法が関係しているが、こうした 複合系を共有することにより、1種の超高速通信が行えるのではないかという提案が量子 計算、量子情報の研究者(IBM のベネット C.H. Bennett ら)によってなされ、量子テレポ ーテーションと呼ばれ話題を呼んでいる。これらのことを2状態系である2粒子複合系の 記述という視点から簡単に紹介する。 EPR の論点 この論文では、”physical reality”というような非物理学的な用語が重要な役割を果たして いることもあって、論述は全体に大変わかり難い。その後の議論のことあるので、ここで は現在の視点から、内容を要約する。著者らが主張したかったことは、(1)ある物理学の 理論 physical theory が正しい correct か?、また、 (2)この理論による記述は完全 complete か?、を問う。この時彼らが念頭に置いている理論はもちろん量子力学である。それでは、 彼らのいう完全とはどういう意味なのか。彼らはそれには直接答えず、そうした理論は、 その帰結として、 「物理的な実在に関るすべての要素が問題にしている理論の中に対応する 要素を必ずもっている every element of the physical reality must have a counterpart in the physical theory」と説明する。そうなると、今度は「物理的な実在の要素 element of the physical reality」とはなんぞや、ということが問題になる。それは哲学的な考察によりア プリオリに与えられるものではなく、実験と測定の結果へのある appeal によって与えられ るべきものである、とする。ここでいう appeal とは実験結果をうまく解釈する提案という ような意味に使われているようである。さらに彼らは、「物理的な実在とは、具体的には、 「もし、ある系をどんな方法でも乱すことなしに、ある物理量の値を確定的に(すなわち 確率1で)予測できるならば、この物理量に対応した物理的な実在の要素が存在する If, without in any way disturbing a system, we can predict with certainty (i.e., with 3 probability equal to unity) the value of a physical quantity, then there exists an element of physical reality corresponding to this physical quantity. 」という意味であるとしても さしつかえない」、と述べる。 これが論述の枠組みである。これを前提として、彼らは具体的な考察の対象として、あ る仮想的な実験を考える。仮想実験による考察はアインシュタインの得意とするところで ある。この実験過程を考察して、彼らは 結論: (1) 「物理的な実在に関する、波動関数を用いた量子力学の記述は不完全である the quantum mechanical description of reality given by the wave functions is not complete」 と結論しようとする。 この結論導くための彼らの論拠は、 根拠: (1)か、あるいは次の (2)「問題とする2つの物理量に対応した演算子か可換でない時、2つの物理量は同時に は(物理的な実在)に対応するものをもちえない when the operators corresponding to two quantities do not commute the two quantities cannot have simultaneous reality」、 かのいずれかが正しいことが証明できるからである、というものである。 ここで、彼らの論拠の背景には、 Operator 演算子 ⇔ physical quantity physical reality/elements ⇔ 物理量 物理的実在 という見方がある。ここで演算子と物理量の対応は問題ないとする。しかし、物理量が対 応する物理的な実在をもつためには、彼らの要求基準「もし、ある系をどんな方法でも乱 すことなしに、ある物理量の値を確定的に(すなわち確率1で)予測できるならば、この 物理量に対応した物理的な実在の要素が存在する」を満たさなければならない。1つの演 算子を観測すれば、その値は決定できるので、この場合、物理量と彼らのいう物理的な実 在との対応は、問題ない。問題は2つ、あるはそれ以上の物理量が同時にこの条件を満た せるかである。だが、可換でない演算子に対応する物理量では、「同時には」この要求を満 たすことはできない。例えば(2状態系ではないが)1次元の自由粒子の位置と運動量を 同時に確率1の確からしさで決定できない。したがって、上記の(2)を否定することは 簡単である。 4 それでは、彼らの最終結論を導く補題にあたる上の根拠は、どのように「証明」される のであろうか。この根拠は波動関数を仮定して、2つの非可換な物理量を測定することを 考えることから得られる、と彼らは主張する。すなわち、例えば、運動量が一定の状態に 対応する平面波を波動関数とする系で座標を観測すれば、完全に不定となり、座標は物理 的な実在に対応できない。逆も真である。このことは不確定性関係そのものである。彼ら 不確定性関係から上の根拠が証明できる、と主張したのである。 EPR の原論文の論旨は以上のようなものであるが、後の議論においては、 「量子力学におけ る状態の重ね合わせによる記述にしたがうと、十分離れた時でも、一方の粒子に関して観 測を行うと、他方の粒子の観測結果を予測することができてしまう、という結論に到達す る。しかし、そうした瞬間の遠隔作用と言うべき影響を一方の粒子の観測が他方に及ぼす とは考えにくいので、量子力学は不完全な理論と言わざるをえない」 、というように解釈さ れるようになった。 これは2、3の例に過ぎないが、量子情報計算の研究は、量子力学が形成される過程に おいて議論されてきた観測と解釈に関する論議に新たな光をあてることになった。こうし た問題は一般に量子力学の基礎と呼ばれる研究領域である。どちらかと言えばこのような 研究は、正統派の物理学者たちから思弁的、哲学的な議論と見なされ、敬遠されてきた。 しかし、実験技術の進歩によって、かつての仮想実験は、実際に試みることが可能な実験 物理学の課題に変わってきた。これにより、EPR 論争も物理学の問題となってきた。ベル の不等式による検証問題はその一例である。 5 7.3 量子力学の Formalism 再考 直ぐ後で述べるように、現在の量子計算の研究は2状態系のユニタリ変換という特殊な 枠の中にあるが、量子情報は、熱力学的な系を含めて、もっと一般的な物理系を考察の対 象にしている。この意味では量子計算は、計算機のための量子力学、量子情報は物理学の 中の情報学的な概念の考察ということができよう。双方の定式化において基本となる概念 が、複合系の entanglement や密度演算子である。ただ、こうした理論展開は、現在のとこ ろ一般の物理学の研究者には馴染みにくいところがある。そこで彼らが量子情報計算で重 要な概念や手法に慣れるためには、これまでとは違う書きかたの量子力学教本が必要であ る。例えば、 A. Peres, Quantum Theory, Concepts and Methods, Kluwer Academic, Dordrecht, 1993 は、そのような目的には適した本である。いずれにしても、やがて量子情報計算と物理学 の研究とはより滑らかに接続されるようになるだろう。 射影演算子、密度行列、POMV 6 量子論理 線形代数をモデルにした量子力学においては、閉じた線形の部分空間(閉線形部分空間) とそれへの射影演算子は1対1の関係にある。また観測量は射影演算子に対応させられる。 つまりあるベクトルが対応する物理学的な系の状態において、ある観測を施すことはこの 観測に対応した射影演算子を状態ベクトルに作用させ、状態を(閉線形)部分空間へと射 影することを意味する。 系の状態 → 状態ベクトル 観測量 → 射影演算子 観測行為 → 状態ベクトルの固有部分空間への射影 したがって、観測後の系の状態は、射影演算子の固有ベクトルである、ある状態にある。 部分空間の間に and や or などの操作を定義できる。また部分空間の間には一方が他方を 含んでいるというような意味で順序を導入できる。したがって部分空間の集合はある束に なる。一方空間の連続した領域からなる集合の部分集合間にも、同じような関係が定義で き、それによって部分集合の全体は、束をなすとみなせる。この束はブール代数と同型に なる。ブール代数は日常でてくる集合と同じで、古典論理と同じと見なせるから、部分集 合の集合がつくる束は、古典論理に対応している。これに対して、部分空間あるいは射影 演算子がつくる束は、ブール代数と同じのブール束にはならない。それは分配律が成り立 たないことがあるからである。 こうした束を1種の論理とみなすことができる。これを量子論理と呼ぶ。このことは最 初、Birkhoff と von Neumann によって提唱された。量子力学の分かりにくさ原因の一は、 命題の真理値が真と偽だけに決定できないことである。このことは、シュレディンガーが 猫のパラドックスとして、「死んでいる状態と生きている状態の重ね合わせの状態」を想定 したことに対応しており、古典論理からすれば、異端となる認識論になる。ただ、この場 合も観測を行えば、いずれかに決定できるので、観測を射影演算に対応させる立場からは、 命題が真か偽かのいずれかになる、あるいは「否定の否定はもとの命題になる」という排 中律は成立している。 7 7.4 現代風の ERP 問題とベルの不等式 2電子による ERP 対 現代の EPR 問題では、原論文の論述で重要な役を果たしている、physical reality だと か、その elements だとかいう議論は全く重要視されていない。すなわち EPR 問題は複合 系の一方の部分系の観測が他方の状態の観測に及ぼす影響であり、それを検証するための 適切な実験を考案することに移っている。こうした複合系を EPR 対と呼ぶ。EPR 対は、普 通2状態系である同一粒子2つのからなる複合系とされる。実際には、2つの電子、偏光 している光子、陽子同士の散乱、2状態系の2粒子に崩壊する素粒子、2状態系の原子に 乖離する分子など、さまざまな例が実験対象として考案されている。以下ではその代表例 である、2電子複合系の場合を考える。 スピン 1/2 の2電子の複合系がスピン和が Singlet 状態にあるとする。 単一粒子が S z に関する基底状態 Sz | ± 〉 = ± 1 η | ±〉 2 記述されていれば、 | sin glet〉 = 1 ( | S z +; S z −〉 − | S z − ; S z +〉 ) 2 この状態は、 S x の基底状態でも記述できる | S x ;± 〉 = 1 1 | +〉 ± | −〉 2 2 | sin glet〉 = 1 ( | S x −; S x +〉 − | S x + ; S x −〉 ) 2 2量子ビット表現では、 |ψ 〉 = | 0 1〉 + | 1 0 〉 2 こうした EPR 対を多数用意し、ある点から2つの粒子をそれぞれ反対の方向に十分な距 離走らせ、その先の場所、A、B で複合系の一方粒子の S z ないし S x を繰り返し観測する。 A,Bでの2つのスピン成分の測定を Q = ±1, R = ±1 、および S = ±1, T = ±1 、それらの期 待値を E (QS ) などとすれば、通常の確率論的な解釈では、 E (QS ) + E ( RS ) + E ( RT ) − E (QT ) ≤ 2 8 という Bell の不等式をうる。 しかし、同じような測定を2つのスピン成分の組み合わせについて行うとした時の期待 値を、EPR 対を記述する波動関数から求めると、この不等式が成り立たなくなる。こうし たことから、EPR 論文の結論である量子力学が不完全であるという結論は、こうした系の 実験に関する限り、正しくないと考えられるようになった。 要点 1.ERP 対は entangle している。 2.1粒子の S z 、 S x 計測は、up+, down-かのいずれかである。 3.一方の計測結果がわかれば、他方を瞬時に推測できる。 量子テレポーテーション Teleportation 量子情報計算の研究では、Entangle した2粒子系 EPR 対を媒介として、与えられた量 子ビット(2状態系の波動関数)を遠隔地に瞬時に「出現させる」ポーテーションに関心 が寄せられている。この原理は、送り手は送る波動関数の内容を知ることなく、ただこの 波動関数と EPR 対を含めた3粒子複合系に関して、その2粒子部分系すなわち、出現させ たい波動関数に対応する系と EPR 対の最初の1粒子系からなる部分複合系に関する、4種 類の測定を行い、その結果を送り手に、古典的な通信路(例えばインターネット)で送信 する。信号の受け手は、この情報をもとに3粒子系が(送り手の観測で)縮約された1粒 子系に適当なユニタリ変換を行うことで、送信したかった量子ビット(状態関数)を出現 させる。この方式で注意すべきは、量子ビットは送信されるというより、一度複合系に埋 め込まれ、最後に変換によって出現させられることである。また、送り手は古典的な通信 路によって測定結果を送るので、情報を送るという観点から見ると、その速さは、光速を 越えるものにはならない。送り手が実施すべき測定や、再出現させる手間は、量子ビット がもつ情報が,波動関数の2つの係数ほどの自由度があることを考えれば、割に合うと考え られている。量子テレポーテーションをめざした基礎実験も行われている。 9 7.5 量子力学の観測に関係した数学的な定理 10 7.6 計算機進歩の限界への懸念 半導体微細加工技術の進歩 プログラムを内蔵した計算機の概念は、チューリング A. Turing によるチューリング・マ シンによって確立された。それは 1930 年代のことであるが、それからおよそ10年後に、 そうしたマシンが電子計算機として実際につくられた。それ以後、とくに真空管の代わり にトランジスターが使われるようになってから、電子計算機の記憶容量や演算能力は指数 関数的な増大を続けて今日に到っている。半導体回路が使われるようになってから、計算 機の進歩は 18 ヶ月で2倍という Moore の法則にしたがってきたが、さすがに 1980 年代に なると、計算の速さや効率が限界に近づいているのではないかと懸念されるようになり、 半導体微細加工技術に依存した方式を根本的に見直す論議が盛んになった。すなわち、半 導体集積回路の集積度がさらに上ってゆけば(回路の線幅が短くなってくれば) 、やがて回 路は個々の原子分子の振る舞いを問題にしなかえればならないほど微細になってくるであ ろう。その先にはどのような技術がありうるのか?そこには2つのそれまでの技術とは異 質の課題が見えてきた。ひとつは分子回路素子や生物素子の可能性であった。そしてもう ひとつが計算の物理学であった。 Feynman の洞察 これらの技術が脚光を浴びるより以前の 1957 年12月29日、 R. Feynman は Caltech における American Physical Society の会合で、“There is a plenty room at the bottom” と題する講演を行い、1/64 インチのモーター、微細なコンピュータなどの可能性について 話した。その後、彼の語ったような微微小モーターが実際に製作された。コンピュータを 小さくできるという見通しに関しては、ベネットらの計算過程の熱力学的な考察や可逆過 程による計算が彼の関心を惹いた。そして可逆的な回路で計算できる量子力学的な計算機 に関する考察を行った。彼は、198X 年に日本(学習院大学)で行った招待講演でも微細な 計算素子として、可逆的な回路や原子分子に1ビット記憶させる可能性を紹介している。 彼の考察は、 Richard P. Feynman (J.G. Hey and R.W. Allen eds.), Feynman Lecture on Computation, Addison Wesley, 1996(原康夫他訳、ファイマン計算機科学、岩波書店、1999 年) はわかりやすく述べられている。 分子回路素子、ナノテクノロジー 1980 年代の話題は、カーターF. Carter らの分子電子回路素子 Molecular Electronic 11 Devices, 単分子薄膜(ラングミュア・ブロジェット膜)、タンパク質などを利用した生物的 素子 Biochip、原子間力 Atomic Force Microscope やトンネル走査型 Scanning Tunneling の顕微鏡技術などである。また、原子分子の組み立て技術 Molecular Fabrication への関心 が高まった。これらの技術のいくつかは、計測装置などとして実用化したが、本来の目的 である新しいコンピュータ素子の開発にはつながらなかった。 同じ 1980 年代には、炭素の新しい分子、フラーレンやカーボンナノチューブが発見され、 新しい素材としてただちに応用される可能性が見えてきたことにより、1990 年代にはナノ テクノロジーへの関心が高まった。 マックスウエルのデモンをめぐる論争の再燃 マックスウエルのデモンは、分子の運動状態を観測し、制御はするが、物理的な仕事を したり、エネルギーを転換したりすることがない、抽象的な存在であった。こうした生物 に似た知的な存在による情報処理が物理学の法則(熱力学の第2法則)を破るかもしれな いという疑問である。このデモンを片付ける論法は、実際のデモンの仕事には観測、情報 の記録、計算などの過程が含まれる。これらの情報処理には、物理的なコストがかかる。 そうしたコストを計算に入れれば、熱力学の第2法則は保存されるという論法である。分 子の速さを計測し、何らかの操作をするデモンは、計測したり、記憶したり、計算したり、 記憶を消去したりする必要がある。そこでは当然、計算するコストを見積もる問題も発生 する。すなわち物理過程としての計算を研究する必要が生じてきた。 そうした計算の物理学的な基礎や量子計算に関する基盤となる多くの仕事は、ランダウ アーRolf Landauer やベネット C.H. Benett らによって、IBM の研究所でなされた。そこ での研究動機は、明らかに、より高速、大規模な計算を、より効率的に行う方法の開発で あったが、彼らの仕事にはマックスウエルのデモン問題の見直しも含まれている。彼らの 仕事は、理想的な熱機関を求めて熱力学の原理を完成したカルノーのそれを想起させる。 このことは、マックスウエルのデモンに象徴されるように、物理学の中で知的な存在や 情報処理を考えると、必然的に量子情報処理、量子計算の問題に行き着くことになったこ とを物語っている。マックスウエルのデモンの論争史から言えば、量子情報計算の台頭で 新しい光が当たってきたことになる。 12 7.7 量子計算 Quantum Computing 基本的な考え方 量子力学による記述を必要とする物理現象を利用して計算を行わせようというのが、現 在話題になっている量子計算の発想である。量子計算はまだアイデアの段階であり、研究 者は、そのイメージを描こうとしている状況にある。ただいくつかの基盤となる概念があ る。それは、2つの準位をもった量子系の複合系を考え、この系の状態にさまざまなユニ タリ変換を施すことを計算と見なすという考えである。 量子ビット Qubit この考えに沿って、基本となる2状態の量子力学系を量子ビット Quantum bit と呼ぶ。 いま、2つの準位に対応する基底となる量子状態をそれぞれ | 0〉 、 | 1〉 とすると、これらの 2つの状態の線形重ね合わせの状態 | ψ 〉 = α | 0〉 + β | 1〉 もまた量子状態となる。この状態は2次元ヒルベルト空間の1点に対応する。現在の情報 理論では、0と1が等確率で生起する確率事象が基本になる。この基本となる確率事象の (2を対数の底にした)エントロピーは、1ビットであるが、量子ビットはこの古典的な 計算や情報の基本単位に相当する量子計算、量子情報の単位である。 現在の情報理論では、実際の情報を複数の1と0の列で表現する。列の長さがnであれ ば、nビットである。同様に、量子情報では、2状態系n個からなる複合系の状態を考え n これを n-qubit と呼ぶ。これは、2次元空間のn個のテンソル積空間、すなわち 2 次元の ヒルベルト空間の球面上の点となる。 量子ビットの表現についてもう少し説明する。上記の | 0〉 、| 1〉 は計算の基底と呼ばれる。 ただ、量子計算では、通常の物理学と違い、パウリ行列に対応した作用に対し、 σ z | 0〉 = | 0〉, σ z | 1〉 = − | 1〉 と約束する。これは固有値が+1 である方を励起状態にとって いるからである。もちろん、 | 0〉 、 | 1〉 も |ψ 〉 も、規格化されている。それゆえ、係数は条 件 | α |2| + | β |2 = を満たしていなければならない。一般的な表現としては、 θ θ | ψ 〉 = e iγ (cos | 0〉 + e iϕ sin | 1〉 ) 2 2 13 あるいは、物理的に意味のない位相因子を省略して、 θ θ | ψ 〉 = cos | 0〉 + e iϕ sin | 1〉 2 2 と書くことが出来る。これは長さが1で、一組の θ , ϕ によって方向( θ は zー軸 、 ϕ はx − 軸 との角度)を指定されたベクトルである。このベクトルは単位球面上にある が、この球面をブロッホ球面 Bloch sphere と呼ぶ。 すでに見てきたように量子力学には電子スピンや偏光した光子を始めとして、よく実験 研究の対象ともなる2状態複合系が多数知られている。量子計算の基本となる系を2状態 系と仮定することは、実際にそうした系を実現する手段をいろいろと考えることができる ことを意味している。また、そうした系に関する理論であれば、実験家に馴染みがあるか ら、興味をもってもらえるという利点がある。 N-qubit 量子演算と回路 量子状態をヒルベルト空間 Hilbert Space の要素(元、ベクトル)と考えると、量子計算 における具体的な演算操作は、それらの要素に作用する作用素(演算子)Operator となる。 + + 量子計算が扱う作用素はとくに、ユニタリ性( AA = A A = I )を満たす作用素に限定さ れる。ユニタリ作用素による量子状態の変換をユニタリ変換という。したがって、量子計 算とは、ユニタリ変換に伴う量子状態遷移を意味する。ユニタリ変換は、その定義からベ クトルの内積(長さ)を変えない変換である。 量子状態に演算を施す操作は、量子回路 Quantum gate によって実行される。そうする と問題は、演算に対応する量子回路をデザインすることである。回路デザインの原理は、 「基本回路を組み合わせること」 である。現在の計算機であれば、AND,XOR, OR, NOT などが基本演算回路(ユニバーサル・ ゲート回路)であるが、種類を減らそうと考えるのなら NAND(あるいは半加算器)だけ でもよい。そこで現在の計算機の基礎になっている基本演算回路(AND,XOR, OR, NOT) 14 に対応した量子ゲート回路を構成できれば、現在の計算機の機能を実現できることになる。 効率を重視した古典的な可逆回路のための基本回路は、(Billiard Ball Computer の)フ レドキンートフォリ Fredokin-Toffoli 回路である。ドィチェ David Deutsh は、この古典回 路の量子計算版となるゲート回路、ドィチェ・ゲート回路を考案し、 「任意の2n次元ヒルベルト空間上のユニタリ作用素はドッチェ・ゲート回路で表現可能で ある」 ことを証明した。だがドィチェ・ゲート回路は古典可逆回路と同じ3入力―3出力回路で あるので、各入力が2状態系に対応した量子ビットの場合、ユニタリ作用素は、2x2x 2=8という8次元となり、その行列表現は、8x8行列となり、やっかいである。その 後、IBM のディビンセンゾーD. Di’Vincenzo が、 「任意の2n次元ヒルベルト空間上のユニタリ作用素は2入力の位相回転回路とコントロ ール NOT の組み合わせで表現可能である」 ことを証明した。すなわち位相回転回路とコントロール NOT とは、量子計算の基本演算回 路(ユニバーサル・ゲート回路)であることが証明された。もっとも簡単な位相回転回路 は、アダマール Hadamard 変換であり、その行列表現は、 UH = 1 2 1 1 1 − 1 である。また、2入力のコントロール NOT の行列表現は、 U CN 1 0 = 0 0 0 1 0 0 0 0 0 1 0 0 、 1 0 である。 15 注)古典的なコントロール NOT 回路と真理表は以下のようである。 A B A’ B’ 0 0 0 0 0 1 0 1 1 0 1 1 1 1 1 0 コントロール NOT 回路は、可逆の XOR 回路である。 量子計算のアルゴリズム 上記の準備によって、量子計算の問題は、どのような長さの量子ビットを対象として、 どのようなユニタリ変換を考えたらよいかという数学の問題に転換されることになる。こ の意味では、量子計算は、2n次元ヒルベルト空間上のユニタリ作用素という、量子力学の 枠組みを想定した演算の問題となる。これは物理学の問題というより、数学あるいは計算 (科)学の問題だと言えよう。 量子チューリング・マシン ドィチェは、確率的なチューリング・マシン Probabilistic Turing Machine(PTM)と似た 構造をもつ、量子チューリング・マシン Quantum Turing Machine(QTM)を考案した。 構造(イメージ)は似ているが、PTM と QTM とは、実現手段と計算能力において大きく 異なっている。ドィチェの構想が最初に発表されたのは、1985 年である。確率的なチュー リング・マシンの状態遷移は状態を逐次的に確認しながら進むが、量子チューリング・マ シンでは、状態遷移を並列に行うことができる。したがって、古典的なチューリング・マ シンより格段に少ないステップで計算を実行できると考えられている。このことから、量 子チューリング・マシンでは、超並列演算が可能だと考えられている。 量子計算機の物理的な実現手段 量子計算を実現するためには、実際にどのような物理系の量子状態を利用すればいかと いう大きな問題かは残されている。同じ計算を実行できるという意味で等価な物理系は沢 山存在するであろう。ただ実用性を考えると、まず現在の計算機と同じような計算操作が できるモデルを構成するのがよいであろう。この構成法に関しては、現在の計算機の数学 16 的なモデルである Turing Machine と同じようなマシンのモデルを構成しようというドィ チェらの試みと、それとは別に、より物理学的な問題である計算の可逆性、エネルギー消 費、状態の遷移時間など、物理学的な問題を考察しながらデザインを考えていこうとする 研究の流れもある。ベネットやランダウアーの研究は後者の流れの中にあり、Feynman は そうした研究に理解を示した物理学者の象徴的存在だった。 回路をつなぐ結線 高速な素子を開発しても、それらをつなぐ結線技術が進歩しなければ、全体としての性 能を向上させることは難しい。現実にはさらに回路を基板につめこむパッケージングの問 題がある。極微小であると予想される量子回路とバランスした結線を開発することは、難 しい課題である。 コーヒレンス問題 量子計算を実行するためには、位相が厳密に制御された多数の量子状態を維持する必要 がある。コーヒレンスは、レーザーなどの光学系ではよく研究されているが、多数の2状 態系からなる複合系である量子計算系のコーヒレンスを維持する問題は、量子計算実現に 立ちはだかる障害である。 誤り検出と訂正 量子計算過程においてはある確率で誤りが生ずることが避けられないと考えられている。 そのために、量子計算では必然的に誤りを検出し、訂正する操作を組み込んでおく必要が ある。誤り検出と訂正問題は、シャノンの情報理論においても主要な問題であり、理論的 な考察が行われている。 17 7.8 量子情報計算への期待 量子計算の応用 量子計算の応用はもちろん量子計算機の開発である。では量子計算機として実際にどの ような応用が期待されているのだろうか。量子計算機が原理的に計算できることは、現在 の計算機すなわち古典的なチューリング・マシンと変わらない。ゆえに、量子計算機の効 用は大きさ、速さ、エネルギー消費と実用性にある。 大きさについてのファイマンの最初のアイデアは、 「計算機を小さくすることには物理学 的な限界は存在せず、原子や電子あるいは素粒子1つに1ビットを記憶できるまでになる だろう」というものであった。実際に記憶や演算の回路がどのようなものになるかは定か でないが、現在の計算機より桁違いに小さくなるだろうと期待されている。 エネルギー消費も桁違いに少なくなると期待されている。 しかし最も基本的な効用は早さである。それによって何を計算するかと言う応用に関し て焦点となっているのが暗号である。RSA 方式に代表される現在の公開鍵という方式の核 心部分は、ある数を素数に分解することである。この数が大きくなると素数分解は急激に 困難となる。公開鍵方式の安全性はこれによって保証されているが、量子計算機が実現す ると、素数分解が容易になるため、公開鍵方式の安全性が保証されなくなると予想されて いる。 Grover のデータベース高速検索法 シモンの高速フーリエ変換法 因数分解 この問題に関心が集まったのは、ATT(当時、現在のルーセントテクノロジー)の Bell 研究所のシュア P.W. Shor が、 「量子チューリング・マシンを用いると因数分解と離散対数問題が非常に小さな誤り確率 で高速に解ける」、 ことを証明した 1994 年以後からである。因数分解問題 Factoring problem とは、ある整数 18 に対して、掛けるとこの数になるような素数の組を求める問題である。離散対数 Order-finding 問題とは、「素数 p と2つの整数 g と x (mod p )が与えられている時、 g r = x (mod p ) となる r を求めよ」という問題である。離散対数問題を高速に解くアルゴ リズムは因数分解問題も解くことができるという意味で、両者は同等の問題だと言える。 ショアの方法は、シモン D.R. Simon によって考案された(2段、離散)量子フーリエ変換 という方法を応用したものである。 計算の章でも述べたように、P, NP 完全など、現在の計算機で計算困難な問題は他にも沢山 ある。量子計算でも、組み合わせや探索など、多くの問題が研究されている。また量子チ ューリング・マシンは、任意の物理系を効率的にシミュレーションできることが示されて いる。 量子暗号 Quantum cryptography 量子計算機が期待どおり大きな数の素因数分解を実行できるとすれば、現在の公開鍵は 破られてしまうことになる。興味深いことに量子情報計算は、新しい暗号方式の可能性を も提示している。そのもとになったのは、ウィズナーStephen Wiesner の「量子のお金 Quantum Money」というアイデアである。彼は、水平、垂直、対角という3方向に偏光し た光子を連続して送信することで、ある種の暗号がつくれることを思いついた。彼はこの アイデアをベネットに話し、ベネットはこれをある長さの信号を、秘密鍵方式で送信する 方法に拡張した。この方式では、誰かが送信内容を傍受(盗み見ようと)すると、そのこ とが分かるようになっている。 量子テレポーテーション 量子テレポテーション Quantum Transportation とは、受信者が遠方にいる送信者に依 頼して、ある量子状態を瞬時に受信者側に送ってもらうことである。ただし、厳密に言え ばこれは「送信」するのではなく、送信したい(量子)状態を受けた側に「出現」させる方法 である。量子状態の瞬時の出現を可能にする仕組みは、送信者と受信者が、エンタングル メントしている粒子を共有していることである。エンタングルメント Entanglement とは、 複数の物理系の量子状態が絡み合っていることを意味する。一般に、2つの物理系が相互 作用して量子力学的な一体性が生じた時、それらが後に空間的に離れていてもその一体性 が保たれるという現象を EPR 現象(EPR Pair)と呼ぶこともあるが、これは量子の世界特 有の現象である。 量子テレポテーションはこの現象を利用するのであるが、送信者は、受け手が系の出現 を行う手掛かりとなる観測結果を通常の方法、例えばインターネットで送らねばならない。 したがって「瞬時に」、量子テレポテーションは、光速より早く何らかの情報を送付できる わけではない。 19 量子情報伝送 これまでは、量子計算に焦点を当ててきたが、量子情報研究としては、現在の情報通信 理論に対応した、情報伝送理論を量子情報に関してつくろうという動きもある。ここで問 題となるのは、通信路の容量、信頼性、効率などであり、問題意識としては、現在の(古 典的な)情報通信理論と共通するところが多い。 20 おわりに この章で採り上げた課題の多くは、単一の研究分野ではなく複数の研究領域にまたがっ ている。にもかかわらずそれぞれの課題の研究者はあまりそういうことを意識してこなか ったよう見受けられる。量子論理は、フォン・ノイマンとバーコフとう数学者によって提 示され、竹内外史のような一部の数学基礎論の研究者 Logician には関心をもたれてきたが、 物理学者の中ではあまり関心をもたれてこなかった。観測の理論も本来量子力学の問題で ありながら、本職の物理学の関心は高くなく、かえて哲学者などに関心をもたれてきた。 マックスウエルのデモンも特殊な話題であり、科学というより、科学に関係した思考の遊 びのような趣があった。これが実際の計算機開発の研究者の関心を惹くようになったのは、 天才物理学者ファインマンと IBM の研究者であるランダウアーとベネットの寄与が大きい。 量子情報への関心が高まったのは、なんと言っても実験技術が進歩したからである。ベル 不等式が成り立たないことの証明や、エンタングルメントを実際につくってみせることが 可能になったことが、思考実験をめぐる論争を実験科学に転換させた。この転換により、 研究者人口も一気に増大してきた。 現在、これらのさまざまな課題とそれに取り組む研究者は、研究領域としての融合を深 めている。この動きには、さらに、熱力学の見直し、ブラックホールの情報やエントロピ ーを論ずる宇宙論や量子重力理論の流れ、熱平衡にない現象までも扱う統計力学の発展、 カオスを生じる力学系などを含む複雑系 Complex System の理論の研究など、物理学の先 端的な動きが相関している。こうした物理学あるいは数学の潮流は、生物における情報計 算の研究とも関係している。その究極にあるのが、ヒトの脳の情報計算過程の研究である。 第7章の補遺 暗号方式 21 参考文献 歴史的な文献は、 Richard P. Feynman, There’s Plenty of Room at the Bottom, A Talk to American Physical Society on December 29, 1959 at Caltech, also in Richard P. Feynman (Jeffery Robbins ed.), The Pleasure of Finding Things Out, Perseus Pub., 1999, pp.117-139 K.E. Drexler, PRNS, 78, p.78, p.5275, 1981 K.E. Drexler, Engines of Creation, Anchor Books, 1986 (訳あり) F. Carter ed., Molecular Electronic Devices, Dekker, 1982(7)? K.M. Ulmer, Science, 224, p.1327, 1984 神沼二眞編著、生物化学素子とバイオコンピュータ、サイエンティスト社、1985? 神沼二眞,甘利俊一、松本元、三輪錠司編著、バイオコンピュータの研究戦略、サイエンテ ィスト社、1998? 新しい感覚で書かれた量子力学の入門書 清水明、量子論の基礎、サイエンス社、2003 年 量子論理に関する本 S. Watanabe, Knowing and Guessing, John Wiely, 1969 渡辺慧、知るということ、東京大学出版、1986 年 湯川秀樹、豊田利幸 編著、量子力学 II、岩波書店、19xx 竹内外史、数学的世界観、紀伊国屋書店、1982 年 竹内外史、線形代数と量子力学、掌華房、1983 年 P. Gibbins, Particles and Paradoxes The limit of Quantum Logic, Cambridge Univ. Press, 1987(P. ギビンズ/金子務、宇多村俊介訳、量子論理の限界、産業図書、1992 年). 次の本は量子論理や EPR 問題を解説した好著。訳文が分かり難いので原本を進める。 Chris J. Isham, Lectures on Quantum Theory, World Scientific Pub., 1995 (佐藤文隆、森川雅博訳、量子論、吉岡書店、2003) 有名な「シュレディンガーの猫」論争の源になる論文。 22 E. Schrödinger, Naturwissenschaften 23, p.807、1935 EPR 問題 いわゆる ERP 論争の源になった論文。 A. Einstein, B.Podolsky, and N. Rosen, Can quantum-mechanical deswcription of physical reality be considered complete?, Physical Review, 47, 1935, pp.777-80 J.J. Sakurai, Modern Quantum Mechanics (ed. revised ed.), 1994, pp.223-232 町田茂、基礎量子力学、丸善、1990 年 清水明、EPR パラドックスからベルの不等式へ、(日本物理学会(編)、アインシュタインと21 世紀の物理学、2005)、pp.135-158 フランコ・セレリ/櫻山義夫訳、量子力学論争、共立出版、1986 年 (Franco Selleri, Die Dibatte um die Quantenthorie, Friedr. Vieweg & Sohn Verlansgesellschat mbH., 1983) ヴィクター・ステンガー/青木薫訳、宇宙に心はあるか、講談社,1999 年 (Victor J. Stenger, The Unconscious Quantum, Prometheus Books, 1995) A. Peres, Quantum Theory: Concepts and Methods、Kluwer Academic Pub., 1993 A. ペレス/大場一郎、山中由也、中里弘道 訳、量子論の概念と手法、丸善、2001 年 M. Nielson and I. Chuang, Quantum computation and quantum information, Cambridge University Press, 2000(これは 700 頁近いが、基礎的なことがよく書いてある。) 広田修、量子情報科学、森北出版、2002 (3,600) 西野哲郎、量子コンピュータ入門、東京電機大学、1997 年 西野哲郎、量子コンピュータの理論、培風館、2002 年 細谷暁夫、量子コンピュータの基礎、サイエンス社、200X 年 林正人、量子情報理論入門、サイエンス社、2004 年 数理科学、量子情報科学の新時代、11月 2003 年;量子アルゴリズムの新地平線、6 月、 2004 年、 暗号問題 23 Sigh, The Code Book 24 第8章 情報計算と物理学 It from bit ! 8.1 物理学における情報計算の概念 ニュートン力学とマックスウエルの電磁気学を基礎とする古典的な物理学においても、 量子力学を基礎とする現代物理学においても、情報や計算という概念が正面から問題にさ れることはなかった。20世紀の始めまで、数学と物理学は極めて密接な関係にあり、こ の2つの分野に関っていた学者たちは自分が数学者なのか物理学者なのか気にしたことが なかったと言えるほどである。古典物理学には今日では数学者と見なされている研究者の 名前のついた方程式が沢山ある。この意味では、数学の中でも情報や計算の問題は、問題 とは物理学に関係した問題とは意識されていなかった。情報や計算が物理学および数学に おいて独立した分野として意識されて始めたのは、20世紀の中頃のことである。 数学における最初に関心をもたれたのは計算に関する概念である。計算と計算機が数学 の中の独立した研究領域になってきたのは、電子計算機が出現する少し前の A. Church の 計算可能性を帰納関数に関連させた仕事、A. Turing の Turing Machinemの提唱、 Automaton など計算機のモデルの提案などからである。もちろんそれ以前にも、バベッジ の微分機械、ブールの思考の規則などの仕事があるが、計算や計算する機械の効率、算法 (アルゴリズム)などが独立した研究の対象になってきたのは、電子計算機が開発されて からのことである。脳と計算機を比較したノイマンの著作は、このような分野の古典であ ると言えよう。 第2次世界大戦後の 1040 年代の後半になると、米国と英国で相次いで電子計算機が開発 されるとともに、C. A. Shannon の通信理論の数学理論(いわゆる情報理論)、N. Winner の Cybernetics が発表され、情報計算学が大いに関心を集めた。初期の電子計算機の開発に は多くの物理学者が参加した。彼らは計算機に魅せられ、事実上情報あるいは計算学の元 祖となった者も少なくない(我が国の高橋秀俊ら)。当時は脳や神経生理学者と電気工学者、 数学者などの交流も生まれた。情報を計量する単位としての bit ともそうした交流の中で生 まれた。 つまりその頃、1950 年頃までは、情報という概念も物理学で議論されることはなかった ということになる。その例外がマックスウエルのデモンをめぐる論争である。情報の操作 やそれを実行する知的な存在を仮定することが物理学にどんな問題を惹き起こすかを最初 に示したのが、マックスウエルのデモン Maxwell’s demon である。それは簡単に言うと、 観測とその結果を生かした操作が行える知的な存在を仮定すると、物理学の法則が破れる かもしれないという、可能性である。気体の運動論の付け足しとして、この問題を提出し 1 たのは、マックスウエルであり、彼が破られるかも知れないと考えたのは、熱力学の第2 法則である。それは 1871 年のことである。より正確に言うと、最初にマックスウエルが考 えたのは温度の平衡状態が破られるかもしれないということであったが、後に、孤立系の エントロピーは増大するという第2法則が破られると解釈されるようになった。この頃熱 力学においてクラウジウスがエントロピーという概念を導入したが、その概念はまだ広く は受け入れられていなかった。偉大なマックスウエルしかり、絶対温度の発見者ネルスト しかりである。その本質を見抜いたのがエントロピーを微視的な系のとりうる状態の数に 結びつけたボルツマンであった。ボルツマンはエントロピーを熱ではなく、物理系の統計 的な性質と結び付けて解釈した。彼は、今日の物理学と情報学の最初の結びつきに気が付 いた人ということができる。 マックスウエルの想像から半世紀ほどたってシラードは、デモンが情報をうるのにエネ ルギーを使わねばならないという説を出し、今日でいう1ビットの情報を獲得するのには、 kTln2 (ln2 は e を底とする2の対数)だけのエネルギーが必要だと見積もった(1929 年)。 これは情報とエネルギーを結びつけた最初の仕事であると認められている。シャノンの情 報エントロピーが発表されたのはそれから間もなく(1948 年)、その後、L. Brillouin(1951) は、熱力学と情報を直接的に結びつけ、D. Gabor(1964)はデモンが情報収集に光を使う場 合を分析し、やはりエネルギーを使うと結論した。これらの仕事によってマックスウエル のデモン問題が決着したわけではない。むしろ彼らの仕事以後も、多くの研究者がこの問 題に取り組んだ。 とくに IBM のランダウアー(R. Landauer)とベネット(C. H. Bennett)は、効率の良 い計算機を開発するというまったく新しい視点から、この問題を論じた。ランダウアーは、 デモンは情報をうることよりも、情報を消去する必要があり、そのためにエネルギーが必 要だと論じた。彼の結論は、1ビットの情報を消去するには、kTln2 のエネルギーが必要 だというものであった。この説はランダウアーの原理と呼ばれている。デモンはまだ完全 に退治されたわけではないが、ファイマンのような物理学者が情報と計算について考察し てみるきっかけを与えた。 ランダウアーやベネットの研究は、理想の熱機関をつくろうとして熱力学の基礎的な法 則を発見したカルノーの仕事を連想させる。理想の計算機を開発しようという願望は、情 報処理や計算の物理過程の研究を促し、そこから情報操作に必要な仕事量の算定など、計 算過程の物理学への関心が生まれてきた。 さらに量子情報、量子計算への関心が高まり、実験的な成果も増えてくるにしたがい、 物理学の中で情報や計算の概念を検討しようという気運が高まってきた。例えば、量子情 報の研究はレーザーが出現し、コーヒーレントな光通信の理論が研究されていた 1960 年頃 2 に遡れるという説もあるが、量子力学独特の現象である Entanglement に基礎を置いた研 究に関心が集まるようになってきたのは、かなり最近、1990 年代からである。 ここにもうひとつ宇宙論からの関心が加わる。この学派のドンは量子力学の観測の理論 に関心を抱き続けた J. A. Wheeler である。シュレディンガーの猫の論文から多世界解釈論 を提唱した H. Everett III は彼の大学院生である。Wheeler の”It from bit.”という言葉は、 いまや物理学者の情報への関心を示す象徴的な言葉になっている。 上記の流れとは違う流れもある。それは、物理学とくに量子力学や統計力学から情報計 算学の発想をえたり、前者の方法論を情報計算の分野に移転しようという試みである。そ のパイオニアは、縮約密度行列を核子の相関の強さの尺度に利用する方法を提案し、後に パターン認識の開拓者となった渡辺慧(1939 年)である。この系譜には、1980 年代の Neural Network ブームの震源となった J. Hopfield や現在の統計力学的な情報学の研究者がいる。 我々は、これまでの章で、そうした関心の基盤となっている概念や理論を見てきた。この 章では、いままで触れてこなかった話題も含めて、物理学と情報計算に関る話題をまとめ てみたい。 8.2 古典物理学の帰結 Laplace の demonn: 未来は予言できるか 宇宙は熱的な死に向かっているのか マックスウエルのデモン 時間の流れ 8.3 量子力学的な認識論 3 8.4 物理学の最先端領域 素粒子論: 基本粒子 量子色力学、超弦理論 統一理論 重力理論と宇宙論 量子重力 宇宙論の中の情報とエントロピー Penrose アインシュタインの一般相対性理論も、物理学の中で情報という概念を扱う必要性を喚 起した。この理論によると大きさ(半径)にくらべて重い星はブラックホールとなる。ブ ラックホール Black Hole では、あらゆる物質が星の外部に放出されない。光さえも放出さ れない。ブラックホールとなる前の星は、物質を放出しているし、物質を吸収もしている。 そうした痕跡は、ブラックホールができるとすべて消失してしまう。ブラックホールによ る情報の喪失というこの現象も、現代の宇宙論で議論されている問題のひとつとなってい る。 8.4 非平衡の統計力学 8.5 複雑系:カオスとフラクタル 力学系 E.N.ローレンツ(1963) 4 ロバート・メイ、ロジスティク写像(Nature, Vol. 261, 10 June 1976) ミッチェル・ファイゲンバウム、 カオスやフラクタルの研究は、複雑系の研究と総称される。複雑系の特徴が発揮されるの は非線形の現象である。簡単な非線形方程式でも解くことは難しい。また、仮に解けても その解は初期値の微妙な違いが途方もなく拡大されるという特徴がある。例えば、お互い に関係しあった3体系が解けないことは、天体力学を研究していた 19 世紀の(ポアンカレ のような)数学者たちによって知られている。20世紀においては、ローレンスによるカ オスが発見(196X 年頃)された。それ以来、複雑系への関心が急激に高まった。クォーク の提唱者である物理学者のゲルマン(M. Gell-Mann)らがつくった Santa Fe Institute は、 複雑系の研究を志向した研究所である。 R. Rosen, Dynamical System Theory in Biology (Vol.1), Wiely-Interscience, 1970 8.6 ネットワークモデル 8.6 情報処理あるいは計算問題に転用されうるその他の物理学の方法論 以上、量子力学完成以後の20世紀後半から21世紀にかけての物理学の発展と情報計 算との関係を考察したが、物理学と情報計算にはもうひとつ別の流れがある。それは、物 理学で育まれた理論や技法が、情報計算に影響を与える可能性である。 量子統計力学の密度行列を用いたエントロピーを、単なる物理量として扱うのではなく、 我々の知識の不確定さの尺度とみなす立場である。このような視点から密度行列から求め られるエントロピーを多粒子系(核子)の相互作用の強さを測る量として応用したのが渡 辺慧である(1939 年)。物理学的なエントロピーを知識の不確定性さの尺度に利用するとい う渡辺の発想は Shannon による情報エントロピーの提唱より早い。渡辺はその後、統計力 学や量子統計力学的な技法を使ってパターン認識や知識を扱う情報学を構築していく試み を展開した。渡辺は、そうした試みを認識論 Epistemology に範をとって、計量的な認識論 Epistemetry と呼んだ。渡辺の情報エントロピーの仕事は、神沼によって継承された(1970)。 5 神沼は、E. Schmidt の積分方程式の非対称核の理論(1907 年)に注目し、渡辺の理論を発 展させ、純粋の情報工学、例えば画像工学に応用した。E. Schmidt の理論はさまざまな分 野で再発見され、有用性が認識されている。例えば特異値分解 Singular decomposition も その一つである。最近、これは DNA チップデータ解析など、いわゆる Omics データの解 析に使われている。 我々はすでに物理学で生まれた概念や技法が情報学や計算技法として一般性をもっている という例を挙げてきた。エントロピーや Schmidt 分解はそうした例である。有用な理論や 計算法はこれ以外にも知られている。この章では、それらをいくつか紹介する。 なおこの他に、情報物理学と称する本が著されるようになった。ただし、こうした研究 は、スピングラス(Ising model)などの統計力学の方法論をパターン認識などある種の工 学的な問題の解法に応用しようという試みであり、「物理学の非物理学的な問題への応用」 という試みである。 統計力学とネットワーク Hopfield Model Boltzmann Machine スピングラス、Ising Model と連想 ランダム事象の扱い Simulation 技法 Monte Carlo Method Simulated Annealing 6 8.7 知性とその存在意義の解明 物理学において情報の概念を議論する最終目標は、知性の解明であろう。現代物理学は 還元主義的な方法を追求しながら成功を収めてきた。しかし生命のような熱的な平衡状態 とはほど遠い状態にある系を理解するには、これまでの物理学は不十分である。さらに、 ヒトの知性、知能、意識などは、そもそも還元的な方法では姿が見えなくなってしまう怖 れがある。そうした現象は、基本的な要素が相互に関係しあった複雑な系をあるスケール で全体として記述する方法によってしか理解できないであろう。それは複雑系に違いない が、これまで研究されてきた方法で十分だとは言えそうにない。 物理学と情報に関る根源的な問題は、物理学における観測者の存在と観測の対象となる 系の関係である。通信理論における情報を論ずる時には、情報の送り手と受け手の存在が 仮定されている。物理学において観測される系は、観測者に情報を提供するが、その立場 は「送り手」とは異なる。送り手を定めるのはあくまでも情報の受け手自身である。 物理学、あるいは科学は、人間の認識と思惟に依存している。物理学で常に問題になる のは、観測者と観測対象系との関係である。とくに観測が客観的な行為なのか、また、観 測という行為が観測対象を乱さずに行えるか否かが重要な点である。 古典物理学のニュートン力学の立場では、等速運動する座標系は、みな同じ立場にあり、 絶対的な存在としての座標系があるとは仮定されていない。ある座標系で書き下ろした運 動方程式は、適当な変換、すなわちガリレオ変換で、他の等速で動いている座標のそれに 変換できるというのが、ニュートン力学の思想である。ただし、時間は相対的な性質をも っていないと考えられていた。それが絶対時間の概念である。相対論はガリレオ変換の式 に補正を加えられた。すなわち、ガリレオ変換はローレンツ変換に置き換えられることに なった。同時に、絶対時間というような特別な時間あるいは時計を仮定する必要性も葬り 去られた。それは、等速で動いているすべての座標系において、測定された光の速さは同 じになるという特殊相対論の要請からの結論である。絶対的な時間をもった観測者という 存在はいなくなった。 量子力学においては、マクロな世界の存在としての観測者とミクロな世界の観測系の境 界をどう設定するか、両者の観測行為をどのように接続するかが問題になる。 7 科学の大きな役割は予言である。しかし自由な意志をもった知的な存在がいる系の将来 を予言することは、原理的に不可能である可能性がある。このことは宇宙の未来にも当て はまる。宇宙の誕生においては、知的な存在は影響を与えていないと考えられている。し かし、宇宙の終わりにおいては、知的な存在による影響を無視できるだろうか。この点を 論じたのが、ダイソンである。天体の運行を予言することは、科学の大きな仕事であった が、知的な存在を無視してそうした予言をすることが無意味になる時代が来ないとは言え ない。 地球が誕生した時、生命の発生を予測するのは難しかったろう。生命が発生した時は、 知的な存在の誕生を予測できなかったろう。情報計算の象徴である知的な存在抜きに、自 然法則や宇宙を語ることは、不十分ではないか。物理学を基盤とする現在の自然科学の体 系は、自然科学としても決して自己完結した体系ではないのではないかということになる。 それと相補的な立場にあるのが、情報計算である。 繰り返しになるが、物理学において情報さらには計算の概念そのものに関心が高まって きたのは、比較的最近のことである。上で述べたようにそうした関心が生まれてきた背景 はさまざまであるが、物理学はより直接的に情報や計算を研究対象とするようになるだろ う。この意味で、今後の展開の基礎になると思われる物理学の分野は、熱力学の第2法則 とエントロピーの概念、統計力学の方法論、量子力学の基礎理論などであろう。しかし、 そうした研究の題材は伝統的な物理学よりも、むしろ生物学に多く見出される可能性が高 い。なぜなら、生物を無機物から区分する大きな特徴が情報への依存性にあるからである。 そこで、生物の情報への依存性の物質的な基礎をしらべることが、物理学あるいは化学の 課題にもなってくるだろうと思われる。結局、そうした問題の究極にあるのが脳と意識の 問題なのである。 参考文献 時間の矢、生命の矢 篠本滋、情報の統計力学、丸善、1992 年 豊田正、情報の物理学、講談社サイエンティフィック、1997 年 8 西森秀稔、スピングラス理論と情報統計力学、岩波書店、1999 年 H. Nishimori, Statistical Physics of Spin Glasses and Information Proce 西森秀稔、スピングラスと連想記憶、岩波書店、2003 年 Neural Network の文献集。 J. A. Anderson and E. Rosenfeld (eds.), Neurocomputing, MIT, 1988 桜井邦明、物理学の統計的みかた、朝倉書店、2000 年 James Gleick, Chaos, 1988 ローテンツ(杉山勝・杉山智子訳)、カオスのエッセンス、共立出版、1997 複雑な世界、単純な法則 高橋康(監修)、保江邦夫、量子脳理論入門、X 9 第11章 生命とは何か 地球型生命の特徴 米国の宇宙探査計画 NASA の目標は、地球外の生命探査であるという。人間 が生存しているのは、地球のそれも表面領域に限られている。生命もそこに存 在している。生命に関する知識はこの領域と月面の一部、火星の表面の探査で えられた経験に依存している。人間がこれまで見たり探査したりしてきた領域 においても、あるいはそれ以外の領域でも、生命あるいはそれに類似した存在 が新たに発見されるという可能性は否定できない。ゆえに、我々の生命に関す る現在の認識は、極めて限定的なものであるが、こうした限定的な条件の下で 明らかにされてきた生命(生物)には、以下のような特徴が見られる。 (1)すべての独立した生命は、細胞あるいはその集合体からできている。細 胞は膜あるいは壁によって周囲と隔絶した内部環境を維持している。しかし、 同時に外界から絶えず物質や(太陽の)光を取り込み、外界に不要となった物 質を放出している。ウイルスは、生命の部品を有するが、独立した生命系とは 見なされない。 (2)生命系は、自分自身と同じ個体を生成する能力を有する。ただし、次の 世代は親はと多少違う性質をもっている(変異している)ことがある。この変異は、 生存に影響することがある。 (3)すべての生命およびそれを構成するすべての細胞は、上記(2)の能力 によって、あるものから他のものがつくられたという関係を介した、類縁関係 にある。 (4)生命を構成する主要成分物質は水である。我々がよく知っている生命体 の水成分は、およそ 70%にもなる。その他の物質を構成する元素は、炭素、酸 素、窒素、リン、硫黄であり、その他にカルシウム、カリウム、ナトリウム、 塩素があり、さらに鉄、銅、マグネシウム、マンガンなどの微量金属が含まれ ている。これらの元素構成は、海水中のそれに類似している。 (5)分子としてみた生命は、4つの大きな分子から構成されている。それら は、DNA や RNA などの核酸 Nucleotids、タンパク質 Proteins、糖 Sugars, 脂 質 Lipids である。このうち核酸は5種類の塩基を基本単位とする鎖状の分子 Polymer であり、タンパク質も20種類のアミノ酸を基本単位とする鎖状の分 1 子 Polymer である。糖も数種類の単糖が鎖状に連結したものがさらに分枝をつ くって結合した構造をもっている。脂質も、トリグリセリドに代表されるよう に、グリセリン Glycerol と炭素が連なった鎖状の分子である脂肪酸が(3 本)結合 した複合構造をもっている。 (6)すべての細胞は、少なくともそれらが生成された最初の段階では、ひと つあるいは複数の親細胞から受け継いだ DNA をもっている。この DNA は情報 テープのような役割をする。すなわち、DNA の(連続しているとは限らない)あ る領域の塩基の並び方が鋳型となって、(m)RNA が生成され、この RNA が鋳型 となって、アミノ酸の鎖であるタンパク質が生成される。 (7)細胞の中では複雑な化学工場群のように、さまざまな物質が分解、生成 されているが、その操業を担っている主役はタンパク質である。タンパク質は、 人為的な化学反応では考えられないほどの効率で、反応を進めている。 上記(1)の特徴は、生命が独立した存在でありながら同時に外に開かれた 系でもあることを意味している。また、 (1)と(2)には、新しい世代が生存 するかどうかは、その世代と環境との関係で決まるという、適応進化の機構が 含まれている。地球上の生命は過去何度も大小の規模の絶滅に遭遇している。 今日の生物界はその産物である。ゆえに、生物を生み出しているのは、生物に 内在している仕組みだけでなく、それが生存している環境でもある。人工的に 生命を設計しようとする時、生命のこの歴史を思い出すことが重要である。な ぜなら、生命の内部機構は定義できても、環境はなかなか定義できにくいから である。 ものとしての生命観 生命と物理学 生命は疑いもなくものの集りであり、存在形態である。それでは「もの」す なわち物質的な存在に関する構成要素と法則を発見する科学として発展してき た物理学は、生命をどう捉えているのだろうか。ものの法則に関する物理学の 到達点は、量子力学である。それゆえ、量子力学の立場からは、生命はどのよ うに捉えられるのだろうか。この疑問を少し歴史的に考えてみよう。 量子力学がそのかたちを整えたのは、P. Dirac による相対論的電子論が発表さ れた 1928 年頃である。その頃までに知られていた物質の構成要素は、光、電子、 陽子あったが、そのすぐ後の 1932 年には中性子と陽電子が、さらに翌年には 2 Neutrino が発見された。こうした発見から物質の構成要素は素粒子と呼ばれる 時代となり、そこから多数の素粒子のもとになる基本粒子クォーク仮説が生ま れ、そうした粒子間に働く力を説明する理論として量子色力学が生まれた。自 然界の力(相互作用)としては、このこれ以外に弱い相互作用や電磁気力が知 られているが、これらさまざまな力を統一的に説明する「統一理論」を構築す る試みがなされている。基本粒子が関与する現象はエネルギーが高い過程であ るため、実験には巨大な加速器を使うか、宇宙から飛んでくる高エネルギー粒 子を捉える方法が使われる。こうした高エネルギー現象を例外とすれば、量子 力学が物質の性質をしらべる理論としてもっとも確かな理論になっている。 それでは、我々の世界は量子力学とその他の物理学の法則だけで説明できる のだろうか。すなわち、物質に関る法則はこれですべてと言ってよいのであろ うか。この疑問に対する答えが肯定的なものであれば、生物や人間の精神など も物理学の法則で説明できるのではないかという考えがでてくる。もし答えが 否定的であれば、一体どのような現象を研究すれば物理学にとって新しい法則 を見つけられる可能性があるのか、という疑問がでてくる。 このような疑問が科学の世界で影響力の大きな研究者たちを惹きつけたのは、 量子力学が構築されつつあった 1920 年頃から、現代的な生物学の基礎というべ き分子生物学が誕生した 1950 年代であった。そしてこうした疑問を取り上げた 著作として最もよく知られているのが、1944 年に出版されたシュレディンガー の What is life? である。量子力学の前身である量子論の提唱者であるボーア N. Bohr も生物学に関心を示し、量子論の考え方(相補性)を生物の理解に役 立てられないか論じ、若手の物理学者が生物に関心をもつことを進めていた。 Pullman らは、発癌物質(化学発癌を起こす化合物)の性質を量子力学でしら べることを始めた。当時、量子力学はまだ未完成の理論と考えられており、そ の解釈をめぐって激しい論争が交わされていた。それゆえ生物を研究すること によって物理学を前進させられるような新しい理論や着想が得られるのではな いかという期待が、ボーアのような人にはあったと思われる。こうした時代精 神の下で、実際に何人かの物理学者が生物学に転向した。彼らの中には、分子 生物学の誕生に貢献した者もいる。シュレディンガーの本も多くの読者を獲得 し、今日まで継続出版されている。この本に影響を受けたという著名な生物学 者も少なくない。 今日の視点でいうなら、上記の時代精神は期待と誤解の産物である(Box )。 物理学者が期待していたような「未知の(物理学の)法則」は、生物学研究か らは生まれてこなかった。また、シュレディンガーの本が多くの読者を魅了し た「生物は負のエントロピーを摂取することで秩序を維持している」という考 えも、負のエントロピーの代わりに自由エネルギーという言葉を使う方が適切 3 であるとされるようになった。ゆえに今日の教科書では、自由エネルギーによ る説明はあっても、 「負のエントロピー」という用語はでてこない。分子生物学 が解明した生命の秘密は、生命が驚くほど機械的にできているという事実であ る。しかもこの機械は、計算機のような情報装置の性格も有していることがわ かってきた。それらは確かに巧妙にできているが、法則としてみた時、物理学 や化学以外の法則に支配されているとは考えにくいことが明らかになってきて いる。 生物の物理学と量子化学 遺伝の担い手であるDNAの2重ラセン構造モデルの発表は、1954 年であり、それから 遺伝コードが整理され、 分子生物学が急速に世に求められるようになった 1960 年代の初め、 我が国でも生物物理学 Biophysics の学会が旗揚げした。生物物理学は物理学的な視点から 生物を研究する学問であるが、ペルツも指摘しているように、生物の物質的な基礎はやは り化学によって説明されるところが大である。その化学の基礎も物理学によって与えられ る。とくに化学反応を担う電子の働きは、量子力学(量子化学)によって原理的に明らか にされると考え、生命を構成する分子や生命現象に見られる(生)化学反応を量子力学か ら研究することなされるようになった。ただ、量子力学を電子の数が多くなる生命現象へ 適用することは、計算方法と計算機の性能の制約があって、いまだ十分なされていない。 複雑系の理論 量子力学の建設期以後の生命理解に関する理論面からの進歩から言えば、簡 単な法則に支配された系でもその将来を予測することが困難なことがあること が認識されたことがあげられよう。カオス理論は、その一例である。また、2 0世紀前半の物理学が扱っていたような平衡状態から離れた非平衡状態を扱う 理論への関心も高まった。これらはより一般には、複雑系 Complex System と 呼ばれる研究領域である。分子生物学が長足の進歩を遂げ、ヒト・ゲノムの全 塩基配列が決定された現在においては、 「生物は分子情報機械である」 、 「生物は 複雑系である」という認識は支配的になったと言える。 現在の関心 現在計測技術さらに進歩を続けている。それによって生体のさまざまな現象 を分子や原子のレベルで精密に観測することを可能になってきた。そこで、こ れまで生物学者が対象としてきた系を物理学の視点からしらべてみられる可能 性はますます拡大してきた。それにともなって生物学に関心をもつ物理学者が 増えている。例えば、米国の Physical Society の中の Biological physics 部門の 会員数は、この数年、年 10%以上増加している。とくに、実験的な手法だけで 4 なく理論計算の立場から生物物理学の問題に取り組む研究者が増えてきている。 生命に物理学者が本格的に挑む時代となったと言える。 しかしかつての、物理学の閉塞状況の打破を生物学に期待した時代精神が、 完全に消滅したわけではない。生物学には未知の領域が残されている。その代 表はヒトの精神活動や心の問題である。また、簡単な法則に支配された系から、 どのように複雑な存在が出現してくるかということもまだ十分理解されていな い。高温超伝導やフラーレンの発見は、こうした例である。このような意味で、 物理学が理解できれば生物学も理解できると考える単純な還元論が正しくない ことは明らかである。現在、物理学者の間で、生物学への関心が再び高まって いる。生物学は物理学の単なる応用問題ではなく、まだ魅力に富んだ理論が生 まれてくる可能性に富んだ領域なのである。 歴史的なエピソード:Schrödinger の考察とその今日的な意義 第2次大戦中の 1944 年に出版されたシュレディンガーの小冊子 What is life?は、本職の 生物学者だけでなく物理学者、あるいはもっと一般の読者に大きな影響を与えた。この本 は今日でも出版され続けている。この本が人を惹き付けた大きな理由は、「生物は負のエン トロピーを食べている」という主張であろう。これはまた物理学者から見た生物の不思議 さの要点でもある。しかし、裏の事情を知る者による評価はかなり厳しい。そうした評者 の一人は同じオーストリアからイギリスの亡命したペルツである。ペルツは、シュレディ ンガーの本は、明らかに N.W. Timoféeff-Ressovky, K.G. Zimmer, Max Delbrück らの N.W. Timoféeff-Ressovky, K.G. Zimmer, and M. Delbrück, Nachrichten aus der Biologie der Desellschaft der Wissenschaften Göttingen, Vol.1, 1935, pp.189-245 に載った、「遺伝学的突然変異および遺伝子の構造」と題する論文、に触発されて書かれた と指摘している。この論文を、当時ダブリンの高等研究所にいたシュレディンガーに見せ たのは、もう一人のドイツ人の理論家であった。三人の執筆者のうち最初の二人は遺伝者 であったが、最後の著者であるデルブリックは、当時、原子核の崩壊実験をしていたゲッ チンゲンのオットーハーンとリーゼマイトナーの研究助手であり、生物学の研究は趣味と した片手間でやっていた。デルブリックは、1932 年にコペンハーゲンで行われたニールス・ ボーアの「光と生命」という講演を聴いて生物学に興味をもったという。この論文を書い たことで彼はロックフェラーの奨学金をえて、パサディナにわたり、そこでL。ポーリン グに会い、共同で論文を執筆している。後には S.ルリアらとともにバクテリオ・ファージ の遺伝学を開拓し、いわゆるファージ学派を開いた。 5 ペルツの第2の指摘は、有名な負のエントロピーは、大して重要な量でなく、本質的な ものではない。もっと重要なのは、自由エネルギーであるが、それをシュレディンガーは 理解していなかったようだ。さらに、当時の常識にしたがって遺伝子はタンパク質分子の ようなものであるとシュレディンガーは言及しているが、彼の本が出版されたのと同じ年 の1月には、すでに遺伝の担い手がDNAであることは、エブリーO. Avery ら肺炎双球菌 を使った実験によって決定的に証明されていた。 O.T. Avery, C.M. McLeod, and M. McCarty, J. Exp. Med., Vol. 79, 1944, pp.137-58. ペルツが言いたかったことは、シュレディンガーが言及しなかった物理学の統計的な法則 では説明できない生命の性質を説明するのは化学である、ということであった。だが、シ ュレディンガーの結論、 「生命は物理学の法則を逃れられないが、そこにはまだ物理学者に 知られていない法則があるかもしれない」は、若手物理学者を大いに刺激した。シュレデ ィンガーの誤解あるいは無知の産物ではあるが、魅力的な言い回しによって書かれた文章 が多くの研究者に生物学への道を選ばせたという可能性はある。 ポーリングはもっと辛らつである。波動方程式があるから、現代の生物学があるという のは正しいが、この方程式を発見したこと以外にシュレディンガーは生物学に何ら貢献し ていない、とまでポーリングは言っている。 シュレディンガーは 1906 年にウィーン大学に入学している。この年ボルツマンは自殺し ている。しかし、シュレディンガーはボルツマンの弟子たちに物理学を教わっている。 6 機械としての生命 生命の中の分子機械 Allosteric 酵素による制御 酵素タンパク質には、基質 Substrate を認識する活性部位 Active site と以外 に、第2(あるいは第3、第4、 ・・・など)の分子認識部位がある。後者に認 識分子が結合するとタンパク質が構造変化を起こし、触媒機能が変化すること がある。それゆえ第2の部位は調節部位と呼ばれる。調節部位をもつタンパク 質は Allosteric 酵素と呼ばれる。 (Allosteric という言葉は Allostery から来て いる。Allo はギリシャ語の「他の」を意味し、同じく stere は、「固い」、 「かた ち」を意味する。) Allosteric 酵素の調節部位における結合は、非共有結合であり、容易に乖離が 起きる。調節部位への分子の結合により反応は促進さたり阻害されたりする。 この型の酵素が最初に発見されたのは、バクテリアの threonine を isoleucine に変換する多段階過程の最初の段階を触媒する threonine dehydratase である。 この反応にはいくつかの中間産物が関与しているが、最終産物である isoleucine が、最初の反応過程を触媒する酵素タンパク質である threonine dehydratase の調節部位に非共有的に結合することで、このタンパク質の構造が変化し、触 媒機能が変わり、多段階反応はその最初の段階で阻害され、全体の反応が停止 する。これは Feedback 制御の典型的な例である。L234.Es173. 細胞を単位とする発展系としての生物 現実の生命で興味深いことは、それが細胞という基本単位の集合体であることである。 言わば超並列分散型の分子チューリング・マシンのような構成になっていることである。 これが海から誕生した地球型生命の特徴なのか、すべての生命の特徴なのかは興味がある ところである。 多細胞生物は、藻類のような光合成能力をもつ単細胞生物が繁殖して、酸素を大量に発 生させ、還元的だった原始的な地球の大気を酸素を含むものに変えた約11億年ぐらい前 に出現したと考えられている。多細胞生物を構成する各細胞には、ミトコンドリアや(植 物では)葉緑体のようなエネルギー変換装置が備わっている。 7 多細胞生物は、最初の細胞が分裂と分化、消滅(細胞死)を繰り返して、複雑な構造に 発展する。こうした集合体としての自己構築は、単に自己のコピーをつくり出すという、 自己増殖とは違った、さらに高次の秩序と構造の形成過程である。生物学では、この過程 を発生 Development、形態形成 Morphogenesis と呼んでいる。問題は、この過程が遺伝子 だけで決定されているかである。ゲノム解読計画が世間に知られるようになった時、これ を「生命の設計図の解読」に例えて、その意義を説明することがよく行われた。たしかに 遺伝子は、タンパク質という生命の主要部品の設計図だとは言える。しかし設計図という 言葉から想像されるような、生命全体の組み立て方の詳細が記述された書類のような情報 ではない。 このことは、発生学、とくに生物のかたちがどうできてくるか(形態形成)の研究から 明らかにされている。生物の空間構造を決定する一部の要因は、明らかに受精卵の空間的 な構造に関係している。例えばショウジョウバエの頭と尻尾の軸と方向は、ある物質 (mRNA)の濃度勾配によって決される。こうした構造決定に関与する物資を一般に形態 形成因子 Morphogen と呼ぶ。形態形成因子は遺伝子で決まるが、その存在様式は遺伝子だ けでは、決定されえない。例えば、神経の配線なども、遺伝子によって決定される要素も あるが、大部分はそうではないと考えられている。(神経回路の配線の可能性は、遺伝子の 数に較べて大きい。)また、がんになるというような疾患現象も、遺伝的な素因の影響は認 められるものの、その引き金になると思われる DNA に生じる変異(例えばメチル化)など は、遺伝的なプログラムの結果ではないと考えられている。発生に関わるこうした遺伝情 報に支配されない現象は、後生(こうせい)Epigenesis と呼ばれる。 発生や形態形成のメカニズムをモデル化することは、理論生物学の最も魅力的な課題だ った。だがこれまでは、実験的な研究が進んでおらず、実際の現象を説明するような、実 験家にも一目置かれるような理論は、ほとんどなかった。しかし現在この状況は急激に変 化している。とくにウニ、ショウジョウバエ、線虫(C.エレガンス)などを用いた研究に よって、単一の細胞が分裂しながら、複雑な構造になっていく、発生の初期のメカニズム が分子と細胞レベルで詳細に分析され始めた。さらに、こうした仕事は、実験家とコンピ ュータ(Bioinformatics)の専門家の協力の下に進められるようになった。この分野は、コ ンピュータの概念形成に大きな貢献をしたチューリングやフォン・ノイマンが関心を示し、 モデルづくりを試みた分野でもある。 自己増殖系としての生命 生命とコンピュータのより深い関係を示すのは、フォン・ノイマンの自己増殖する機械 に関する考察であろう。自己増殖機械のモデル的な考察したファン・ノイマンは、自己増 殖系を構成するには、万能の組み立て機械とプログラムを書き込んだテープとのセットが 必要であることを示した。すなわち、そうした機械は必然的にプログラムを内蔵していな ければならないのである。このことは自己複製、自己増殖するという生命の基本的な特徴 8 が、「生命はプログラムを内蔵した情報機械でなければならない」ことを要請していること を意味している。フォン・ノイマンが想像した機械は、それからしばらくして、分子生物 学のパイオニア達があきらかにした、DNAの複製機構と概念的に非常によく似ているこ とが判明した。生命のテープの情報は、個々の分子(塩基やアミノ酸)に担われている。 工学者から見れば、生命は、自己複製し、発展的に自己を構築する、分子情報機械なの である。しかもその構成において、生命現象の基盤なるは、2つの分子的なチューリング・ マシンを組み合わせた複合分子チューリング・マシンと見なすことができる。 実際に熱力学的に無駄の少ない可逆的なコンピュータを考察した C.H. Bennett は、DNA からmRNA が合成される過程を、ブランウン Brown 運動型の分子コンピュータのモデル なる、分子コピーマシンだと考察している。彼のモデルでは、コピーされる情報の基本単 位にあたるのが DNA 各塩基であり、これを鋳型として RNA の基本塩基が対となったり、 対から分離したりする可能性を、ブランウン運動に例え、前進と後退を確率的に繰り返す 可逆的な過程であると見なした。 C.H. Bennett, Thermodynamics of Computation- a Review, Int. J. Theor. Phys. Vol. 21, 1982, pp.905-940. 開放系である生物は、孤立系に適用されるエントロピーの増大法則にしばられないが、 自己の構造を生成、維持するには何らかの生命力を必要とする。 生体における物質代謝とエネルギー 生命は細胞から構成されるが各細胞は多様な化学工場群を有する都市のごと く、外の世界とは別の自律性をもった活動をしている。そこでは絶えず物質が 運びこまれ、それらが分解されたり、より大きな分子が新規に組み立てられた りしている。こうした物質の分解と合成過程にはエネルギーがいる。 生体が取り込む外部物質は、植物の場合と動物の場合では大きくことなる。 植物は土壌の窒素、大気の2酸化炭素、水から酸素や水素、太陽から光を吸収 する。無機物に依存しているため、他の生物に依存しないで生存していける。 これに対して動物は水、大気、太陽の光の他に、他の生物つまり植物や動物を 摂取する。多くの細菌やカビなども植物のように無機物を摂取して生存してい 9 るように見えるが必ずしもそうではない。 そこで生物学者は、外部から摂取する物質の中でも炭素に注目して生物を分 類している。すなわち、大気中の2酸化炭素だけを唯一の炭素源とする生物を Autotrophic(自立あるいは無機栄養) 、それ以外の生物を Heterotrophic(従属 あるいは有機栄養)と区別している。Heterotrophic は炭素源を Autotrophic な生物が合成した炭素を含む大きな分子に依存している。Autotrophic 生物の例 は、光合成細菌や緑葉植物であり、ヒトなどの高等動物やほとんどの微生物は Heterotrophic である。多くの自立栄養生物は、太陽の光を利用した光合成を主 要なエネルギー源としている。これに対し、従属栄養生物は、摂取した自立栄 養生物の部品すなわち食物 Foods あるいは栄養 Nutrients を分解することでエ ネルギー源となる分子を生成している。自立栄養生物は大気中の2酸化炭素を 吸収し、酸素を排出する。従属栄養生物は、自立栄養生物の部品を摂取し、2 酸化炭素を排出する。従属栄養生物は、大気から酸素を摂取して外部から取り 込んだ有機栄養物を酸化するもの Aerobes と、無酸素で栄養物を分解するもの Anaerobes が含まれている。 1 代謝と 2 次代謝 これが外部から見た生体の物質の出入りである。生体の内部においては外部 から取り込んだ栄養の分解や、自分自身の部品の生産など複雑多様な化学反応 が同時併行的に進行している。こうした物質の分解と合成は、多数の酵素が介 在した、相互に関係し合った効率的な反応であるが、代謝 Metabolism と総称さ れる。代謝には、生体の主要構成成分である 4 種類(核酸、タンパク質、糖、 脂質)の大きな分子やその集合を、アンモニアなどの窒素化合物、水、2酸化 炭素などの小さな分子に分解する同化作用 Catabolism という過程と、小さな分 子を組み合わせての生体の主要構成成分である 4 種類の大きな分子を合成して いく異化作用 Anabolism という過程がある。 同化作用の対象となる大きな分子には、栄養として外部から取り込んだ他の 生物の部品と用済みとなった自分自身のそれとが含まれている。外部から取り 込んだ他の生物の部品である大きな生体分子がそのまま、取り込んだ生物の中 の生体分子として機能することはない。それらはバラバラにされて、再度組み 立てられなければ目的の機能を発揮しない。ヒトが動物の肉を食べても、その タンパク質がそのままヒトのタンパク質として働くことはない。 同化においては、多数の複雑な大きな分子が少数の簡単な分子に分解され、 異化においては、少数の小さな分子から多数の大きな分子がつくられる。また、 同化の過程では、ATP やエネルギー源として働く分子が生成される。つまり栄 養分が分解されることで、エネルギー源として働く分子が生成される。異化過 10 程はエネルギーを必要とする反応であり、同化で生成されたエネルギー源分子 が反応を駆動することに動員される。 生体の主要な部品である 4 種の分子の分解や生成過程は1代謝 Primary metabolism あるいは Central metabolism と呼ばれる。生体の 4 種類の主要分 子は、あらゆる生物に共通である。それゆえ、1 次代謝の機構も共通性がある。 代謝経路網 Metabolic Pathway/Network 生体内の化学反応の効率のよさは、多数の酵素が関与した多段階反応である ことと、複数の反応が連結 Coupling していることである。そのために、代謝 反応の全体は複雑な経路網になっている。こうした経路網は、分子生物学の誕 生以前から生化学的な方法で詳しくしらべられ、図的に表現されていた。こう した図は代謝 Map とも呼ばれる。代謝 Map として昔からよく知られていたの は、ドイツの Boeheringer 社のそれだった。現在は、データベースをもち、線 図を生成するコンピュータシステムが開発され、いくつかはインターネットで 閲覧できる。 生体内の化学反応と制御 生体内の化学反応の多くは、多段階である。すなわち、物質 A から物質Bが 生成される場合、A→Bではなく、A→A’→A’’ → ・・・→Bというように いくつかの中間物の生成を経由する。その各段階は対応する触媒作用をする酵 素によって進められる。こうした反応の連鎖は、分枝をもつことがあり、他の 反応と干渉しあうこと Cross talk もある。ほとんどの場合酵素はタンパク質で ある。 こうした多段階かつ分枝をもつ経路網は、3つのレベルで制御されている。 L346. エネルギー源となる分子 Activated Carrier Molecules 生体内の代謝に関る化学反応を駆動したり、信号を伝達したり、情報をコピ ーしたり、運動したり(筋肉を収縮させたり)するのに必要なエネルギーは、 ATP、GTP、NADH, NADPH、FADH2、Acetyle CoA など、いくつかのエネル ギー供給分子によって賄われる。よくエネルギーを「生み出す」とか、 「消費す る」という表現がなされるが、厳密に言えば、エネルギーは生成も消滅もしな 11 い。ただ変換されるだけである。エネルギーを供給分子は、さまざまな電気製 品に使われる電池のようなもので、他にエネルギーを供給すると自らは、より エネルギーの低い状態に遷移していくのである。エネルギーを供給分子がより 低いエネルギー状態に遷移するとは、例えば、その分子内部の共有結合が切れ て、2つの分子に分解される過程を意味する。ATP が ADP と無機リンと呼ばれ る Pi に分解される過程はその代表的なものである。GTP と GDP も同様な関係 にある。Acetyle CoA の場合は、アセチルグループと CoA を結ぶ、C-S の結合 が切れ、アセチルグループが分離される。NADH, NADPH、FADH2 の場合は、 裸の水素原子(陽子)と 2 個の電子(Hydoride ion)を供給する。エネルギー 供給分子はこの他にも存在するが、その仕組みは似ている。 12 生命における信号と情報 機械装置としての生命の時計 競争と共生の機構:免疫機能 13 生命情報工学の意義 現在ゲノム解析プロジェクトでコンピュータが大活躍しているという事実は、生命がコ ンピュータと同じ情報機械であり、その基本プログラムが線型の記号的な塩基配列で表現 されるという事実と表裏をなしている。生物の遺伝の物質的基礎である核酸の塩基配列は、 4種類の塩基に対応する C,G,A,T という4文字で書かれた設計仕様書に例えられる。この 鎖状の記号列は、生物を複雑な分子情報機械と考えたとき、基本的なプログラムと見なす ことができる。この全塩基配列を決定し、その意味するところを解読しようというゲノム 解析計画は、生命のコンピュータ的な性格をあまねく明らかにしようとする試みと見るこ ともできる。 その第1段階にあたる、3x109 と見積もられているヒトのゲノム(全遺伝情報)の塩基 配列を決定するための仕事には、コンピュータで制御され、高度に自動化された生化学的 な実験装置が使われた。また、それらから産生された膨大な実験データは、コンピューの 専門家の全面的に支援の下で、超高速コンピュータで解析され、コンピュータの中に編集 蓄積され、インターネットで公開されている。塩基配列が決定された現在、次の仕事は、 膨大な遺伝情報の意味を解読することである。この仕事は、他人が書いた極度に複雑なコ ンピュータ・プログラムを、解きほぐしながら解読していく仕事にも似た困難な作業であ る。こうした作業を通して、生命を「もの」として理解するだけでなく、「こと」つまり機 能や営みとして理解することが可能になる。すなわち、生命のコンピュータ的な性質が見 えてくることであろう。 これまでの生命科学の進歩のペースを考えると、生命の本質的な現象の原理的な解明は あと20年か30年もすれば終わりそうな勢いである。そうなると生命科学の研究対象も 自然に存在する生物から、それを改変する研究や、生命のような系の合成に拡大していく ものと予想される。仮にそのような時代がくるとすれば、生命科学とコンピュータ研究の 違いは、シリコン半導体を用いたドライなコンピュータを研究するか、核酸やタンパク質 などで構成されるウエットなコンピュータを研究するかの違になる。もちろん機械として の目的は両者で違うから、これは冗談めかした話であるが、いずれにしても生命科学とコ ンピュータ研究とは、根底において深い繋がりがある。このことは、次第に顕在化してき ている。 現在の生命情報工学 Bioinformatics は、コンピュータの生物学への応用のための学問で あり、言わばサービスの学問であるという見方がある。しかし、生命とコンピュータの本 質的な類似性と深い関係を考えると、生命情報工学には情報から見た生命の研究、生命の コンピュータ的な特徴の研究という独自のテーマが考えられる。こうした研究は、かつて はチューリングやフォン・ノイマンのような天才を必要とした。しかし近い将来には、そ うした世紀の天才だけが意味のある仕事ができる分野ではなくなり、もっと親しみやすい、 少なくとも現在の自然科学のような研究人口の多い研究分野になるであろう。 14 知的な生命が自然の法則を乱す可能性 マックスウエルのデモンは、観測を行い、それから得られた情報を利用して開閉装置を 動かして、分子の速度分布を熱力学の第2法則に反するように操作するある種の知的存在 として登場した。このデモンが存在しえない説明が幾度か提唱され、この意味で悪魔祓い は幾度か成功したかに見えた。しかし、それはいつのまにか復活し、物理学者を挑発し続 けた。現在は、このデモンの仕事の正体が最終的に物理学者によって暴かれたと言える状 況にある。マックスウエルのデモンをめぐる論争には、さまざまな意義がある。その一つ は、「知的な生物の振舞までを含めると自然の法則が変わってくる可能性がある」、のでは ないかという疑問を具体的に提示したことである。 知的な生物ではなく、ごく簡単な原始的な藻類のような生物でも自然環境には大きな変 化を及ぼす。ニュートンの力学から始まる近代科学が整備されるにしたがい、自然法則を 知れば、自然世界の未来を予言できるという思想が芽生えてきた。この思想の極限に位置 するのが、宇宙の現在の状態を知れば、未来を予測できるという思想である。そういうこ とが実行できる存在は、ラプラスのデモンと呼ばれる。仮に、現在の状態を知らなくても、 孤立系のエントロピーは増大するという熱力学の第2法則は、宇宙の熱的な死を予言して いると受け取られた。それから逃れる可能性は、第2法則が不完全か、宇宙には適用でき ないか、である。 もう少し身近な予言の問題もある。例えば、地球の大気の動きや太陽系の運動を予測す ることである。大気の動きにしても、「南米の蝶の羽ばたきが、その後の北半球の気候に影 響を及ぼす」と言われるように、非線形の不安定な要素を含んでいるが、生物の活動を考 慮すると一層難しくなる。現在の大気中の酸素は原始的な藻類の光合成活動の結果だと考 えられている。生物の活動は惑星の大気や風土を大幅に変えてしまう可能性がある。 とくにその生物が人間のような知的な存在であれば、他の生物群を送り込んで惑星の環 境を変えてしまうとか、何らかの制御手段で、惑星の軌道を変えてしまうとか、光を反射 する宇宙船を沢山つくって、星の輻射をある空間領域に閉じ込めるとか、ついには、宇宙 の死に方にまで影響を及ぼすというような想像をめぐらせることも可能である。 つきつめれば、ヒトのような知的な存在が、自由意志にしたがって未来の選択を行える ような、ある種の自由度をもっているのか否かということである。仮に、そうした自由度 をもっているのなら、そうした存在は、知識と技術を駆使して、周囲の環境も、またやが て宇宙字体をも、そのような存在がいないと仮定した場合とは、全く違った姿にしてしま う可能性があるということである。 人間の数が少なく、道具が限られており、制御できるエネルギー量が少なく、知識が十 分でなく、共同作業のための通信手段が貧弱で、知的な活動を補う情報計算技術もそう高 度でなかった時代は、人間活動が周辺の環境や自然に与える影響は自然から見ると無視で きるものであった。しかし人間の活動は急激な増大を続けている。それにより、人間活動 15 と無関係な客観的な自然という概念もだんだんゆらぐようになってきている。 現象を理解し、予測できるというのが、科学の魅力である。そこには、予測対象は客観 的な存在であり、予測する研究者とは独立した存在であるという思想がある。しかし、予 測すべき現象にも知的な存在としての要素を認めると、これまでのような知的な要素を対 象に含めて考えないという立場は、修正を迫られることになる。 そうなると知的な存在を知的ならしめている仕組みを理解するとともに、そうした存在を 含めた対象の振る舞いを理解し、記述し、予測する科学を自然科学の中でもつくっていか ねばならないことになる。「知的な存在を知的ならしめている仕組み」の研究は、脳神経系 という言わばハードウエアの研究から、認知科学のようなソフトウエアよりの研究、さら に人工知能といわれるような工学的な研究まで幅が広く展開している。脳神経系のような 生物学そのものの研究は別にして、 「知的な存在を知的ならしめている仕組み」の研究の基 盤になっているのが、情報と計算に関する学問である。情報と計算に関する研究は、これ まで数学的か、あるいは工学的かによって行われてきた。情報と計算に関る本は多いが、 そのほとんどは、このいずれかの視点、あるいはその双方の視点から書かれている。しか し、これからは物理学もこうした学問との交流を深めていくのではないかと予想される。 16 D’Arcy Thompson, On Growth and Form (I, II), Cambridge University Press, 1942 *Ian Stewart, Life’s Other Secret-The New Mathematics of the Living World, Penguin Books Ltd., London, 1998 *Eric Davidson, Genomic Regulatory Systems: Development and Evolution, 2001, Academic Press *J. M. Slack, From Egg to Embryo (2nd ed.), Cambridge University Press, 1991 中田力、脳の方程式、いち・たす・いち、紀伊国屋書店、2001 中田力、脳の方程式、ぷらす・あるふぁ、紀伊国屋書店、2002 17 「量子情報科学」講義(Q301810) 参考文献05年 (05 年 4 月11日版) I.文献の分類 本講義の参考文献は、以下のように分類される。 (1)昨年の講義録(http://www.qulis.org/)これを「量子情報科学04」と呼ぶ (2)基本的な文献 (3)選択的な参考文献 基本的な文献とは、講義の準備で参考にした文献、あるいはその課題に関しての標準的な教科 書を意味する。選択的な参考文献とは、各自の興味も応じて、講義で取り上げた話題をさらにしら べるための参考文献である。 なお講義ノートでは、それぞれの課題ごとに、これらの文献を紹介してある。 II.文献の入手法 広島大学の図書館を利用すること。論文や講義録に関しては、Google Scholar, Google などで入 手する。海外の文献は、Amazon.com あるい Used Book で入手できる。 III.基本的な文献 物理学関連 2.Richard P. Feynman (J.G. Hey and R.W. Allen eds.), Feynman Lecture on Computation, Addison Wesley, 1996(原康夫他訳、ファイマン計算機科学、岩波書店、1999 年) 3.Philip Nelson, Biological Physics-Energy, Information, Life, Freeman, NY, 2004. 4.H.S. Leff and A.F. Rex (eds), Maxwell Demon 2: Entropy, Classical and Quantum Information, Computing, Institute of Physics Pub., 2003 5. A. Peres, Quantum Theory: Concepts and Methods, Kluwer Academic, 1993 (大場一郎、山中由也、中里弘道 共訳:量子論の概念と手法、丸善、2001 年 6 . M. Nielson and I. Chuang, Quantum computation and quantum information, Cambridge University Press, 2000(これは 700 頁近いが、基礎的なことがよく書いてある。) Michael D. Fayer, Elements of Quantum Mechanics, Oxford 化学 Linus Pauling and Peter Pauling, Chemistry, Freeman, 1975 Donald A. McQuarrie, John D. Simon, Physical Chemistry – A Molecular Approach, 1997.(訳書、マ ッカリー・サイモン、物理化学(上・下)、東京化学同人、1999) 1 Peter. W. Atkins and Julio de Paula, Physical Chemistry (7 th ed.), Oxford, 2004(訳書あり) Attila Szabo and Neil S. Ostland, Modern Quantum Chemistry, Macmillan, 1988 (大野公男、坂井 建男、望月祐志訳、新しい量化学、東大出版、1987) 生物学 B. Alberts et al.、Essential Cell Biology, Garland, 1998 B. Alberts et al.、Molecular Biology of the Cell, Garland, 200X John McMurry and Mary E. Castellion, Fundamentals of Organic and Biological Chemistry, Prentice Hall, 1999 John McMurry, Mary E. Castellion and Mary E. Castellion, Fundamentals of General, Organic and Biological Chemistry, Prentice Hall, 2002 D. Voet (Foundamental?) Biochemistry, T.A. Brown, Genomes (2nd ed.), Oxford, 2002 J. Clayton and Carina Dennis (eds), 50 Years of DNA, Nature Pub., 2003 Elaine J. Mange and Arthur P. Mange, Basic Human Genetics (2 ed.), Sinauer, 1999 木村資生、生物進化を考える、岩波書店、1988 年 2 IV. 課題ごとの参考文献 この講義に関連した課題を以下に分類し、それぞれの参考文献を記す。 1.科学技術の発展史 2.熱力学第2法則をめぐる話題 3.統計力学の基礎的研究 4.量子力学基礎論 5.量子化学、情報計算化学 6.情報計算生物学 7.計算機の開発 8.情報学と計算学 1.科学技術の発展 アインシュタインの業績に関しては、 P.A.Schilpp ed., Albert Einstein: Philosopher-Scientist Vol 1, Tudor Publishing, 1949 日本物理学会(編)、アインシュタインと21世紀の物理学、2005 宇宙論 時間、空間論関する20世紀前半までの歴史に関する古典。 Edmund Whittaker, From Euclid to Eddington, Dover, 1958 最近の宇宙論については、 Hawking, Roger Penrose, The Emperor’s New Mind-Concerning Computers, Minds, and Laws of Physics, Oxford Univ. Press/Penguin Books, 1989 Roger Penrose, Shadows of the Mind, Oxford Univ. Press, 1994 佐藤文隆、宇宙論への招待、岩波新書、1988 年、第9章 熱学に関する歴史的な考察 山本義隆、熱学思想の史的展開、現代数学社、1987 年 山本義隆、磁力と重力の発見(全 3 巻)、みすず書、2003 年 高林武彦、熱学史、日本科学社、1948 年(第2版、海鳴社、1999 年) 朝永振一郎、物理学とは何だろうか(上、下)、岩波新書、1979 年 朝永振一郎、スピンはめぐる、中央公論社、1974 年 S. Watanabe, Knowing and Guessing, John Wiley, 1969 渡辺慧、時間の歴史、東京図書、1973 年 渡辺慧、時、河出書房新社、1974 年 渡辺慧・渡辺ドロテア、時間と人間、1979 年 3 渡辺慧、知るということ、東京大学出版、1986 年 古典物理学から量子力学への転換を数学的な道具とともに解説した名著 Edmund Whittaker, A History of The Theory of Aether and Electricity, Volume I The Classical Theories, Harper, 1960 (Originally Thomas Nelson and Sons, 1910) Edmund Whittaker, A History of The Theory of Aether and Electricity, Volume II The Modern Theories, Harper, 1960 (Originally Thomas Nelson and Sons, 1953) A. d’Abro, THE RISE OF THE NEW PHYSICS (Two volumes), D. Van Nostrand, 1939 (Dover edition, 1951) 量子論が誕生した頃の数学界の状況に関しては、 C.リード/いやなが健一訳、ヒルベルト、岩波書店、1972 年(C. Reid, Hilbert, Springer, 1970) 20世紀の物理学に関しては エミリオ・セグレ/久保亮五、矢崎裕二訳、X 線からクォークまで、みすず書房、1982 年(イタリア語 の原著、1976 年;英訳版、1980 年) 量子電磁力学(場の理論)の発展史 S.S. Schweber, QED and the Men Who Made It, Princeton University Press., 1994 20世紀の重要な方程式 Graham Farmelo, It must be Beautiful: Great Equations of Modern Science, Granta Books, 2002 (グレアム・ファーメロ/藤井昭彦、斉藤高央訳、美しくなければならない、紀伊国屋書店、2003 年) 科学の未解決も問題に関しては、Nature の編集長を長く務めていた R. Maddox の次の本が一読 に値する。 John Maddox, What Remains To Be Discovered, Macmillan, London, 1998 (矢野創、小谷野菜峰子、並木則行訳、未解決のサイエンス、ニュートン、2000 年) IT の発展に関るよい文献 William Aspry, John von Neumann and The Origins of Modern Computing, MIT, 1990 Thierry Barandini, Bootstrapping, Stanford, 2000 Thomas P. Hughes, Rescuing Prometheus, Random House, 1998 (IT の発展に関わった Internet を含む米国の国家的プロジェクトの話) 近未来技術を考える M.C. Roco and W.S. Bainbridge, Converging Technologies for Improving Human Performance Nanotechnology, Biotechnology, Information Tecnology, and Cognitive Science, NSF/DOC-sponsored Report (wtec.org/ConvergingTechnologies/Report/NBIC_report.pdf) 神沼二眞の著作:「ハイテクと日本の未来」、ローズ「原爆の誕生(上・下)」、「水爆の誕生(上・ 下)」、共訳、いずれも紀伊国屋書店。 4 2.熱力学第2法則をめぐる話題 熱力学の第2法則と時間の向きのパズル、熱力学第法則を量子力学の視点からどう定式化す るか、マックスウエルのデモンのさらなる解釈などに関しては、 渡辺慧、時間の歴史、東京図書、1973 年 渡辺慧、時、河出書房新社、1974 年 渡辺慧・渡辺ドロテア、時間と人間、1979 年 S. Watanabe, Knowing and Guessing, Wiley, 1969 伏見康治、確率論及統計論、河出書房、1942 年 伏見康治、量子統計力学、共立出版、1967 年 マックスウエルのデモンに関する本 Leo Szilard, On the decrease of entropy in a thermodynamic system by the intervention of intelligent system, Behavior Science, 9, pp.301-310, 1964 (この論文は、L. Szilard, Über die Entropieverminderung in einem thermodynamischen System bei Eigengriffen intelligenter Wisen,Zeitschrift für Phsik, Vol.53, pp.40-856, 1929 の A. Rapoport, M. Knoller による英文訳) マックスウエルのデモンに関する最も詳しい文献集 H.S. Leff and A.F. Rex (eds.), Maxwell Demon 2: Entropy, Classical and Quantum Information, Computing, Institute of Physics Publishing, 2003 3.量子力学基礎論 量子力学の基礎論、とくに量子力学の観測問題、量子論理、さらに最近の量子計算、量子情報 の研究に関しては、 John von Neumann, Mathematische Grundlagen der Quantummechinics, Apringer, Berlin,1932 (英 語訳、R. T. Bayer, Mathematical Foundation of Quantum Mechinics, Princeton University Press, 1955; 井上健、広重徹、恒藤敏彦訳、量子力学の数学的基礎、みすず書房、1957 年)、この中の 5章、6章が観測の理論になっている。 P.M.A. Dirac, The Principles of Quantum Mechanics (4th ed.), Oxford Univ. Press, 1963 有名な「シュレディンガーの猫」論争の源になる論文。 E. Schrödinger, Naturwissenschaften 23, p.807、1935 いわゆる ERP 論争の源になった論文。 A. Einstein, B.Podolsky, and N. Rosen, Can quantum-mechanical deswcription of physical reality be considered complete?, Physical Review, 47, 1935, pp.777-80 5 Hugh Everett III, “RELATIVE STATE” FORMULATION OF QUNTUM MECHANICS, Reviews of Modern Physics, Vol. 29, 1957, pp. 454-62 量子力学と観測問題の原著論文集。この中に、Szilard 論文の英訳, EPR 論文, Schrödinger の猫 の論文英訳、Everett III の論文が収録されている。 J. A. Wheeler and W. H. Zurek (eds.), Quantum Theory and Measurement, Princeton University Press, 1983 量子論理に関する本 竹内外史、線形代数と量子力学、掌華房、1983 年 湯川秀樹、豊田利幸 編著、量子力学 II、岩波書店、19xx *Roger Penrose, The Emperor’s New Mind-Concerning Computers, Minds, and Laws of Physics, Oxford Univ. Press/Penguin Books, 1989 *Roger Penrose, Shadows of the Mind, Oxford Univ. Press, 1994 Quantum Computer 関係の文献としては、例えば Richard P. Feynman (J.G. Hey and R.W. Allen eds.), Feynman Lecture on Computation, Addison Wesley, 1996(原康夫他訳、ファイマン計算機科学、岩波書店、1999 年) M. Nielson and I. Chuang, Quantum computation and quantum information, Cambridge University Press, 2000(これは 700 頁近いが、基礎的なことがよく書いてある。) 広田修、量子情報科学、森北出版、2002 (3,600) 4.統計力学の基礎的研究 量子統計力学における密度演算子による実際問題の計算とくに摂動論、非平衡理論 R. Feynman, Statistical Mechanics, Benjamin, 1972 情報的エントロピーの拡張 梅垣壽春、情報数理の基礎、サイエンス社、1993 年 大矢雅則、小嶋泉 編、量子情報と進化の力学、牧野書店、1996 年 5.量子化学、情報計算化学 量子化学に関しては、専門外であるが、縮約された密度演算子法を Green 関数や摂動法とファ イマンダイアグラムによる計算法を組み合わせた計算は量子統計力学でよく使われるようになっ てきているが、量子化学への応用が考えられないか。また、縮約された密度演算子法で定義され 6 た、多フェルミ粒子系におけるミクロ的な情報エントロピーは、量子化学における電子相関の評価 法に使えるのではないか。また多粒子系の波動関数をその部分系の密度演算子の固有関数で 展開するシュミット分解は、量子化学における近似法と評価法の開発に役立つ可能性がある。 E. Lewars, Computational Chemistry Introduction to the Theory and Application of Molecular and Quantum Mechanics, Kluwer, 2003 A. Szabo, N. S. Ostlund、Modern Quantum Chemistry―Introduction to Advanced Electronic Structure Theory(大野公男、阪井健男、望月祐志 訳、新しい量子化学 電子構造の理論入門 (上下)、東京大学出版会) R. McWeeny、Methods of Molecular Quantum Mechanics (Second Edition)、 Academic Press 可逆的な古典力学から非可逆な現象が生じる過程のコンピュータシミュレーション W. G. Hoover, 田中 實 監訳、フーヴァー 分子動力学入門(共立出版、1998) W. G. Hoover, 小竹 進 監訳、志田晃一郎 訳、計算統計力学(森北出版、1999) W. G. Hoover, 志田晃一郎 訳、時間の矢 コンピュータシミュレーション,カオス (森北出版、2002) 6.情報計算生物学 生物学の教科書は、いまでに猛烈な勢いで書き改められている。これが物理学や(理論)化学 との大きな相違点である。シュレディンガーの本は、「物理学の視点から生命を見る」という立場か ら書かれているので、いまだに人気がある。化学は昔から生物学の基礎と考えられていたが、こ の視点から言えば、DNA と酵素タンパク質の働きを理解することが、中心である。それは、DNA の2重ラセンモデルの提唱から、ゲノム解読計画、ベルツによるX線によるヘモグロビンの構造解 析から、今日の軌道放射光 SOR による膜タンパク質の構造解析まで、発展を続けている。発生と 進化は、物理や化学の視点を超えた生物らしさが出てくる生命の最も本質的な現象であるが、数 理遺伝学を越えた理論や計算からの取り組みが始まったのは、ごく最近のことである。これとは別 に、Bioinformatics と呼ばれる情報と計算の技法の応用がある。この分野の研究者人口も急増し た。さらに、こうした流れとは別に、複雑系と呼ばれる数理的な方法論の視点から、生物、生命現 象を考えようという研究も盛んになっている。また、生物の情報、計算処理としての脳・神経系の 働きの解明は、大きな課題になっている。ただし、こうした分野で「量子力学」がどれだけ役に立つ かは疑問である。ここでは、情報や計算の理論や技法の方がいまのところでは、関係が深いよう である。したがって、この分野の幅は広く、面白い読み物は多い。ただし、必読書として推薦すべ きものは少ない。 Erwin Schrödinger, What is Life, Cambridge Univ. Press, 1944 J. D. Watson and F.H. Crick, Molecular Structure of Nucleic Acids, Nature, Vol.171, April 25, 1953, pp. 737-738 (The double helix-50years, Nature, 23 January 2003, pp.395-453) A. Turing, The Chemical Basis of Morphogenesis, Phil. Trans. R. Soc. London B 237 pp 37-72 (1952) (http://www.swintons.net/jonathan/Turing/turbox.htm) 7 F. Jacob and J. Monod, Genetic Regulatory Mechanism in the Synthesis of Protein, J. Mol. Biology, Vol.3, pp.318-356, 1961 M. Perutz, Protein Structure, W.H.Freeman and Company, NY,1992 Murray Gell-Mann, The Quarks and the Jaguar-Adventures in the Simple and the Complex, Little, Brown and Company, London, 1994 *Stuart Kauffman, AT HOME IN THE UNIVERSE-The Search for the Lawsof Self-Organization and Complexity, Oxford Univ., 1995 Peter Coveney and Roger Highfield, Frontiers of Complexity-The Search for Order in a Chaotic World, Random House, NY, 1995 Levin Kelly, Out of Control-The New Biology of Machines, Fourth Estate Limited, London, 1994 *John H. Holland, Hidden Order-How Adaptation Builds Complexity, Addison-Wesley, 1995 D’Arcy Thompson, On Growth and Form (I, II), Cambridge University Press, 1942 *Ian Stewart, Life’s Other Secret-The New Mathematics of the Living World, Penguin Books Ltd., London, 1998 Eric Davidson et al, Genomic Regulatory Network for Development, Science, Vol. 295, 1 March, 2002, pp. 1669-1678 (関連文献:Eric Davidson, Genomic Regulatory Systems: Development and Evolution, 2001, Academic Press. Ian Stewart, Networking Opportunity, Nature, Vol. 427, pp.601-604, 2004 *J. M. Slack, From Egg to Embryo (2nd ed.), Cambridge University Press, 1991 中田力、脳の方程式、いち・たす・いち、紀伊国屋書店、2001 中田力、脳の方程式、ぷらす・あるふぁ、紀伊国屋書店、2002 *Richard Dawkins, The Selfish Gene (new edition), Oxford Univ. Press, NY, 1989 (First edition in 1976) Richard Dawkins, the extended phenotype-The long reach of the gene, Oxford Univ. Press, 1982 *Richard Dawkins, The Blind Watchmaker-Why the evidence of evolution reveals a universe without design, Norton, 1987 Christopher Wills, The Wisdom of the Genes-A New Pathway to Evolution, HarperCollins, 1989 8 Robert J. Richards, The Meaning of Evolution, University of Chicago Press, 1992 George C. Williams, Natural Selection-Domains, Levels, and Challenges, Oxford Univ. Press, 1992 Stephen Jay Gould, Wonderful Life-The Burgess Shale and the Nature of History, Norton, NY, 1989 Stephen Jay Gould, Life’s Grandeur-The Spread of Excellence from Plato to Darwin, Random House, 1997 Simon Conway Morris, the Crucible Creation-The Burgess Shale and the Rise of Animals, Oxford Univ. Press, 1998 大野乾、生命の誕生と進化、東京大学出版、1988 7.計算機の開発 計算機の進歩は、半導体の微細加工技術の進歩に依存してきた。後者の技術がいずれ限界 に達するだろう言われている。この壁をどう破るかが、そろそろ現実的な課題になってきた。1980 年代の生物化学素子への期待、現在のナノテクノロジーへの期待は実現するか、さらに先にある 技術として考えられている量子計算機研究の現状などに関しては、通俗的な話は多いが、専門的 な解説書は少ない。 Richard P. Feynman (J.G. Hey and R.W. Allen eds.), Feynman Lecture on Computation, Addison Wesley, 1996(原康夫他訳、ファイマン計算機科学、岩波書店、1999 年) は出色と言える。 歴史的な文献は、 Richard P. Feynman, There’s Plenty of Room at the Bottom, A Talk to American Physical Society on December 29, 1959 at Caltech, also in Richard P. Feynman (Jeffery Robbins ed.), The Pleasure of Finding Things Out, Perseus Pub., 1999, pp.117-139 William Aspry, John von Neumann and The Origins of Modern Computing, MIT, 1990 Thierry Barandini, Bootstrapping, Stanford, 2000 Thomas P. Hughes, Rescuing Prometheus, Random House, 1998 (IT の発展に関わった Internet を含む米国の国家的プロジェクトの話) ナノマシン、ナノバイオの元祖的な著作 K.E. Drexler, PRNS, 78, p.78, p.5275, 1981 K.E. Drexler, Engines of Creation, Anchor Books, 1986 (訳あり) F. Carter ed., Molecular Electronic Devices, Dekker, 1982(7)? 9 K.M. Ulmer, Science, 224, p.1327, 1984 神沼二眞編著、生物化学素子とバイオコンピュータ、サイエンティスト社、1985? 神沼二眞,甘利俊一、松本元、三輪錠司編著、バイオコンピュータの研究戦略、サイエンティスト社、 1998? ナノテクノロジーは間違いなく未来の計算機(ハードウエア)開発に大きな寄与をするだろう。量子 計算機の開発は、まだ本当の基礎段階である。これらについてはウエブ上に豊富に情報が置か れている。 8.情報学と計算学 情報社会、情報時代と言いながら、情報と計算に関する一般的な理論は少ない。この意味では、 「情報科学」は存在しない。計算機と計算機を使うための計算機工学、プログラミングを含む情報 工学の文献は沢山あるが、あまりにも目的志向であり、ここにリストすることができない。このこと は明らかに情報計算分野への参入障壁の低さにつながっている。 この講義では、計量的な認識論、学習(知識獲得)の基礎理論を視野に入れているが、これに ついてもほとんどの本は、一般性に乏しいか、実用上の価値がほとんどないものが多い。アルゴ リズムに関しては、時々分野ごとに流行する。Simulated Annealing、遺伝アルゴリズム Genetic Algorithm、ニューラルネットワーク Neural Network、隠れマルコフ Hidden Markov モデルなどは、 その例である。これらのアルゴリズムの特徴は、ある程度複雑な問題に応用できるが、最適性が 保障されていないことである。「遺伝」アルゴリズムと「ニューラルネット」ワークは、その名前によっ て実際以上の夢と期待を振りまいた。これはかってのエキスパート・システムと似ている。また、現 在はシステム生物学と似ている。下記の King らの論文も、生物科学の仮説を自動生成できるよう なことを言っているが一般性に乏しい。ただ、こうした試みへの挑戦は続くだろう。 C. Shannon and W. Weaver, The Mathematical Theory of Communication, Univ. of Illinois, 1949 N. Wiener, Cybernetics, or Control and Communication in the Animal and the Machine, The Technology Press and John Wiely, 1948 (日本語訳、サイバネティクス、岩波書店、1962 年) N. Winner, I am a Mathematician, Doubleday、1956(鎮目恭夫訳、 サイバネティクスはいかにして 生まれたか、みすず書房、1951) John von Neumann, The Computer and the Brain, Yale Univ., New Haven, 1958 William Aspry, John von Neumann and The Origins of Modern Computing, MIT, 1990 高橋秀俊、情報科学の歩み、岩波書店、1983 S. Watanabe, Knowing and Guessing, Wiley, 1969 渡辺慧/村上陽一郎訳、知識と推測 (I-IV)、東京図書 豊田正、情報の物理学、講談社サイエンティフィック、1997 年 10 R. D. King, et. al., Functional genomic hypothesis generation and experimentation by a robot scientist, Vol. 427, pp.247-252, 2004/04/06 11
© Copyright 2025 Paperzz