身につく ベイズ統計学 (ファーストブックSTEP)

【最新 – ベイズ統計学を学ぶためのおすすめ本 – 入門から応用まで】も確認する

ベイズ統計学を丁寧に解説

本書は、ベイズの理論をわかりやすく解説することを目指した入門書です。応用的な内容も含まれており、しっかり学びたい方にもある程度対応できるようにしています。高度な数学は避けて、グラフを多く使うことで、視覚的に理解できるようにしています。

涌井 良幸 (著), 涌井 貞美 (著)
出版社 : 技術評論社 (2016/4/13)、出典:出版社HP

はじめに

本書はベイズの理論についての標準的な入門テキストになることを意図して作成されました。
ベイズの理論に関して、「わかりにくい」、「複雑だ」といった話をよく耳にします。確かに、ベイズの理論に関する文献をひも解くと、たくさんの数学記号が紙面を埋めていたり、著者の研究分野に偏った内容に主眼が置かれたりしていて、けっして易しいという印象は受けません。統計や数理科学に長けている研究者は別かもしれませんが、これからベイズ理論を学ぼうとする人には、とっつきにくい内容になっています。

ところで、この10年、ベイズの理論は幅広い分野で活用されるようになりました。例えば、ホームページの検索で有名なグーグルでは、効率の良い検索ができる論理としてベイズの理論が利用されています。また、電子メールの迷惑メールの振り分けに、この考え方が活かされています。「感情が経済を動かしている」と主張する行動経済学などの分野でも、盛んに利用されるようになってきました。したがって、ベイズの理論について、「難しい」といって逃げることができない時代に突入しているのです。
本書は、このような時代の中で企画されたベイズ理論の入門書・応用書です。できるだけ高度の数学は回避し、直観的な記述を採用しています。また、グラフを多用し、視覚的な理解が得やすいように構成されています。また、冗長という批判を恐れず、記述をできるだけパターン化して繰り返し、原理が記憶に残るようにしました。

近年、マスコミ界ではAI(人工知能)の研究やビッグデータ、IoT(モノのインターネット)など、情報理論の言葉が日常的に飛び交っています。その最新の世界にもベイズの理論は活躍の場を広げています。このように脚光を浴びるペイズの理論の普及に本書が少しでも役立つことを希望します。

最後になりましたが、技術評論社の渡邊悦司氏に本書作成のすべての過程で丁寧なご指導を仰ぎました。この場をお借りして、お礼を述べさせていただきます。

2016年春 著者

涌井 良幸 (著), 涌井 貞美 (著)
出版社 : 技術評論社 (2016/4/13)、出典:出版社HP

contents

序章 ベイズの理論の考え方
参考 ベイズの理論の歴史

第1章 ベイズ理論のための確率・統計の基本
1.1 確率の定義と公理
1.2 条件付き確率と乗法定理
1.3 試行の独立と反復試行の確率の定理
1.4 確率変数と確率分布
1.5 尤度関数と最尤推定法
1.6 同時分布と周辺確率、周辺分布

第2章 ベイズの定理とその応用
2.1 ベイズの定理
2.2 ベイズの定理の変形とペイズの基本公式
2.3 事前確率の大切さ
2.4 理由不十分の原則とベイズ更新
2.5 ナイーブベイズ分類
2.6 パターン認識とMAP推定
参考 最尤推定法とMAP推定法の違い

第3章 ベイジアンネットワーク
3.1 ベイジアンネットワークとは
3.2 簡単なベイジアンネットワークの計算法
3.3 ベイジアンネットワークの実際の計算

第4章 ベイズ統計学の基本
4.1 ベイズ統計学の基本公式
4.2 ベイズ統計学の簡単な例(1)
…離散的な母数の場合
4.3 ベイズ統計学の簡単な例(2)
…コインの表裏の出方
4.4 ペイズ統計学の簡単な例(3)
…缶ビールの内容量
参考 正規分布の形の積分公式

第5章 ベイズ統計学の応用
5.1 ベルヌーイ分布とベイズ統計学
5.2 二項分布とベイズ統計学
5.3 正規母集団の母平均とベイズ統計学
5.4 頻度論の推定とベイズ統計学
5.5 MAP推定法とペイズ統計学
5.6 モデルの評価とベイズ因子
5.7 回帰分析とベイズ統計学

第6章 自然な共役事前分布
6.1 ベイズ統計学と自然な共役事前分布
6.2 ベルヌーイ分布、二項分布の自然な共役事前分布
6.3 二項分布と自然な共役事前分布の有名な応用例
6.4 正規分布の自然な共役事前分布
(母分散既知の場合)
6.5 正規分布の自然な共役事前分布
(母分散未知の場合)
6.6 ポアソン分布の自然な共役事前分布

第7章 階層ベイズ法とMCMC法
7.1 古典的統計モデルと最尤推定法
7.2 階層ベイズ法の考え方
7.3 階層ベイズ法の具体例
7.4 階層ベイズ法をMCMC法により計算

付録A 7章の§7.1、7.3の例題のデータ
付録B ベイズ統計で利用されるExcel関数
付録C 一般的な線形回帰モデルの事後分布の算出
付録D 正規母集団の標本平均の扱い方(母分散既知のとき)
付録E 逆ガンマ分布とガンマ分布の関係
付録F 正規母集団の標本平均の扱い方(母分散未知のとき)
付録G MCMC法のしくみ
付録H 階層ベイズ法の問題をMCMC法で計算

●索引

■利用上の注意

・本章はベイズ統計学の基本と応用をわかりやすく解説したものです。わかりやすさを優先しているので、表現において数学的に多少ゆるい箇所がありますがお許し下さい。
・データという言葉には多様な定義があります。本書では確率現象から得られた値やその集まりを単純にデータと呼んでいます。ちなみに、データ(data)はdatumの複数形ですが、「1つのデータ」という表現もお許しください。
・「正規分布に従うデータDが得られた」などという簡略表現を利用しています。正式には「正規分布に従う確率変数Xの値としてデータDが得られた」などと表現しなければならないのですが、冗長になるので簡略表現で代用しています。
・資料やデータは、注記のない限り、仮想的なものです。そこで、数値処理において、有効桁について厳密には扱っていません。
・数値の丸めのために、小数の最後の位で計算結果が一致しないことがあります。
・計算にはマイクロソフトExcelを用いています。なお、わかりやすさを優先したため、計算処理の高速化は考えていません。(本書に掲載したExcelのバージョンはExcel2013です。)

涌井 良幸 (著), 涌井 貞美 (著)
出版社 : 技術評論社 (2016/4/13)、出典:出版社HP

序章 ベイズ理論の考え方

簡単な例を通して、ペイズの理論の考え方とその特徴を調べることにします。ベイズ統計学のイントロとして軽くお目通しください。

細かい話しは後に回すことにして、この章では大まかなベイズの理論の考え方を紹介します。その理論の面白さの一端が垣間見えるでしょう。

いろいろな確率の考え方

一つの事例を考えます。X氏が通勤途上の宝くじ売り場Aで宝くじを1枚買ったところ、1万円の当たりくじとなりました。幾日かおいて、その売り場Aで再度1枚買ったところ、また1万円の当たりくじとなりました。また数日置いて、X氏はその売り場Aの前で足を止めました。そして、次の3つの考え方にぶつかり、悩むことになりました。
①「2度あることは3度ある」という格言から、3回目もこの宝くじ売り場Aで購入すると、当たる確率は高い。
②「いいことは何度も続かない」の格言から、3回目にその宝くじ売り場Aで購入すると、当たる確率は低い。
③「明日は明日の風が吹く」の格言があるように確率現象は気まぐれであり、3回目はどこで買っても当たる確率は同じ。
これら3つの考え方のどれを採用するのが正しいでしょうか?

日本の宝くじは「公正」に運営されています。したがって、この事例の場合には正しい考え方は③です。どこで売られた宝くじでも、その1本の当選確率は等しいのです。
しかし、人の感性はそうではありません。多くの人は①の考え方を採用します。宝くじ売り場に掲げられた「当店から1億円当選者続出」などの宣伝文句が説得性を持つのはそのためです。では、多くの人は誤った感性を持っているのでしょうか?「2度あることは3度ある」という格言は間違いなのでしょうか?
周知のように、一つの論理の正否は依って立つ仮定の成否にかかっています。宝くじの場合に③が正しいのは「日本の宝くじは『公正』に運営されている」という仮定が成立するからです。もしその仮定が疑われるならば③が正しい保障はありません。いかがわしい団体が運営する「くじ」については、③が正しいとは限らないのです。
仮定の成否によって、確率は色々な風に解釈できます。確率論は一つではないのです。そして、ペイズの理論は色々ある確率論の中の一つです。「2度あることはきっと3度ある」と考える人を正当化する確率論なのです。

頻度論

宝くじの例では「③が正しい」とされます。くじは「公正」と仮定しているので、くじを引く前にそのくじの「当たる確率」は「ある値」に確定していると考えるからです。このように、「予め確率は一定値」と考える確率論は、中学校や高等学校で教える確率論です。
この考え方を見るには中学の教科書に必ず載っている「サイコロ」の例が最適でしょう。1個のサイコロを投げるとき、「1の目の出る確率は1/6である」ことが仮定されます。どの目も同じ確からしさで現れるという公正さが仮定されているからです。
また、その教科書に必ず載っている「コイン」の例もしかりです。1枚のコインを投げるとき、「表の出る確率は1/2である」ことが仮定されます。表も裏も同じような確からしさで現れるという公正さが前提とされているからです。

ところで、サイコロやコインの場合、「予め確率は一定値」とされることの正しさはどのように確かめられるでしょうか。それは実験を繰り返し行うことで確かめられます。例えばコインの場合には、そのコインを何回も投げ、結果として表裏が半々出れば「表裏の出る確率は各々1/2」といえることになります。サイコロもしかりです。
このように、何回も実験して確かめられることを前提とする確率論を頻度論と呼びます。中学校や高等学校で扱う確率論はこの頻度論です。20世紀までの確率・統計学の主流の論理です。現代を支える生産管理や疫学、実験計画などで大いに活躍しています。

頻度論で扱えない確率

いま述べたように、頻度論の基底にあるのは「何度も試行を繰り返せる」という仮定ですが、それが不可能の場合にはどうすればよいでしょうか。実際、この仮定が満たされない場合が多々あります。例えば、次のような日常の例を考えてみましょう。
(例1)A君のB大学合格確率は50%
(例2)明日の株価が上昇する確率は80%
(例3)僕が彼女の愛を射止める確率10%
(例4)新開発の抗癌薬Cが末期患者に効く確率は50%
日常会話で用いる限り、これらの例文は何の違和感もないでしょう。しかし、「頻度論」的な立場で見直すと問題が生じます。
(例1)の「大学合格確率」50%を確かめるには、頻度論的にはA君は何回もB大学を受験しなければなりません。しかし、大学入試の機会はそれほど多くはありません。すると、この合格確率50%は何を意味するのでしょうか?(例2)、(例3)も同様です。明日の株価は1回限りのものですし、人の愛を射止めるかどうかも繰り返せるものではありません。(例4)の新薬についても、命に直接関わる薬の場合には多くの人にその効能をテストすることは出来ないでしょう。
このように、日常的に用いられる「確率」概念は、学校で教えられる類度論とは相容れない場合があります。これらを取り込める新しい理論が求められます。その代表がベイズの理論です。

ベイズの理論の考え方

ベイズの理論の考え方を見るために、1枚のコインを1回投げ、「表」が出る事象の確率(略して「表の出る確率」)を考えてみましょう。
繰り返しますが、頻度論では「表の出る確率」は例えば1/2と固定して考えます。それに対してベイズの理論では、「表の出る確率」を変数(すなわち確率変数)と捉えます。そして、例えば「表」が出たというデータを得て始めて確率変数の様子(すなわち確率分布)が解明されると考えるのです。

頻度論とベイズの理論では、この例からわかるように、出発点が異なります。頻度論は「固定した確率」からデータが生まれ、ベイズの理論ではデータから確率分布が得られると考えるのです。

ベイズの理論は様々な確率概念を包含

「データから確率分布が得られる」というペイズの理論の考え方は、頻度論よりも拡張性に富みます。頻度論は仮定した確率値が正しいかを確かめるために、試行を何回も繰り返す必要があります。それに対してベイズの理論では、たった1個のデータからも妥当な結論を引き出すことが出来るのです。この性質のお陰で、先の(例1)〜(例4)などの確率現象を十分に分析対象とすることが出来ます。人間の信念や確信、理解度など、更に抽象的な内容についてもベイズの理論は研究対象にすることが可能なのです。現代においてAI(人工知能)や経済学、心理学でベイズの理論が多用される理由はここにあります。

「とりあえず」を認めるベイズ統計

いくらベイズの理論が様々な確率現象の分析に柔軟に対応できるからといっても、当然それを適用する際には仮定が必要です。ベイズの理論は「データが得られるたびに確率分布が変化する」という考え方をとるのですが、データを得る前の確率分布の初期値に仮定が必要です。データを得る前の確率分布を事前分布といいます。具体的なデータがないときにも、それを適当にセットしなければならないのです。
事前分布は先見的に決定できるものではありません。ある意味、いい加減に仮定するのです。この「いい加減さ」「曖昧さ」がベイズの理論が忌み嫌われてきた最大の理由でした。ところが最近では、この「暖味さ」が「魅力」に変化しました。そこに人間の経験やカンを取り入れる余地があるからです。「とりあえず経験やカンで事前分布を決める」というこの発想は、数学的に受け入れられないかもしれませんが、複雑なデータに果敢に対応できる自由度として認められるようになったのです。事前分布を自在に操ることで、ベイズの理論は魔法の剣になるのです。

多様化の時代に応えるベイズ統計学

頻度論の統計学の出発点は農業データの分析です。どんな肥料が何に効くか、どんな環境が飼育に適しているか、などに応えるための統計学です。この統計学は、分析の対象があまり強い個性を持つことが嫌われます。例えば麦の栽培テストをするときに、その麦の種が個性豊かなものでは良いデータが得られず、分析は困難になるでしょう。
データの「均一性」というこの条件は、工場生産のための品質管理(QC)には有効です。一様な品質を工場生産は前提とするからです。そこで、類度論を土台にしたQCは大量生産時代には大きな成果を挙げることになります。日本の製品の品質が良くなったのも、この成果のおかげと言われています。
しかし、現代は多様化と個性化の時代です。例えば、消費の世界において、「均一性」の条件などは期待できません。麦などを対象にした従来の統計学は、個性豊かな人間の消費行動には対応しづらいのです。個性あるデータに対してもっと自由度の高い統計学が現代のマーケッティングの分析に必要なのです。そこにベイズ統計学が活かされます。
既に述べたように、ベイズ統計学は「事前分布」というアイデアを導入します。この事前確率の導入によって個々の分析対象を汎用の部分と個性の部分に分け、個性の部分をその事前分布で統率するということが可能になります。「階層ベイズ法」と呼ばれる技法ですが、こうして個性豊かなデータ集団に対して、統計分析が可能になるのです。

涌井 良幸 (著), 涌井 貞美 (著)
出版社 : 技術評論社 (2016/4/13)、出典:出版社HP