完全独習 ベイズ統計学入門

【最新 – ベイズ統計学を学ぶためのおすすめ本 – 入門から応用まで】も確認する

四則計算だけでベイズ統計学を理解する

本書は、ベイズ統計学の初心者向けの本です。予備知識がなくても理解できるようになっており、初心者が意欲を削がれる要因になる難しい表記や計算は除いています。面積図と四則計算を使った解説により、視覚的、直感的にベイズ統計学の考え方に触れることができます。

小島 寛之 (著)
出版社 : ダイヤモンド社 (2015/11/20)、出典:出版社HP

第0講 四則計算だけで理解するベイズ統計学
本書の特長

0-1 予備知識ゼロから実用レベルに到達できる

本書は、「ベイズ統計学」と呼ばれる統計手法の超入門書です。「超」とはどういう意味か、というと、

●予備知識ゼロからのスタート
●難しい記号や計算なしに、ベイズ統計が使えるようになる
●“お話”だけでごまかすのではなく、免許皆伝レベルを達成する

ということです。
ベイズ統計は、多くの社会人が関心を持っているにもかかわらず、これまでの教科書は、導入部は平易なものの、途中から急に難しくなって、たいていの読者が挫折を余儀なくされます。それは、読者がベイズ統計の本質を感覚的に把握できる前の時点で、確率記号が乱舞する世界に巻き込まれ、理解が追いつかなくなってしまうからです。
本書では、その轍を踏まないように、いくつかの工夫をしました。以下、その工夫について説明していきます。

0-2 使うのは面積図と算数だけ

ベイズ統計は、「ペイズの公式」という確率公式を下敷きに展開します。これは、「条件付確率」という確率の発展事項に立脚しています。「ベイズの公式」は一応高校数学で習うものなのですが、とてもわかりにくい概念です。なぜわかりにくいか、というと、理由は2つあります。第一は、公式が複雑な形をしていて直観的でないこと、第二は、そもそも条件付確率というのが、ある意味では「うさん臭い」概念で、慎重にものを考える人は「なんか変な感じがする」と疑問を持ってしまうこと、です。

実は、この第二の点は、ベイズ統計にとってとても大切です。その「うさん臭さ」こそが、ベイズ統計の本質であり、利便性とつながっているからです。あとで詳しく解説しますが、その「うさん臭さ」が批判を浴び、ベイズ統計は20世紀初頭に、いったん統計学から葬り去られてしまうことになりました。しかし、ベイズ統計の「うさん臭さ」と「利便性」とは表裏一体の関係にあり、「うさん臭いからこそ使える」のです。その「利便性」のほうに注目した学者たちによって、ベイズ統計は、20世紀後半に復権することとなりました。21世紀現在、ベイズ統計は逆に統計学の主流派と成り代わりました。

そこで、本書では、この2つの点を考慮し、次のような工夫をしました。

工夫その1 ごく一部を除き「ベイズの公式」は表に出さない方針を貫いた

代わりに、「面積図で図解する」という方針をとりました。本質的にはベイズの公式と同じことをしているのですが、多くの読者にとって、図解のほうが直観に訴え、理解が簡単になると考えたからです。さらには、「面積図」を使うことで、「ペイズの公式」のどこがどううさん臭いか、どこがどう利便性に富んでいるか、それらもはっきりするのです。

工夫その2 計算は算数レベルで済ませる

つまり、すべてが四則計算だけで済みます。ルートや文字式計算さえ不要です。その四則計算も、手計算が不得意な人は、電卓を使えば苦労せず実行できます。

もちろん、本書でも最後のほうに、「ベータ分布」や「正規分布」などの高度な概念が登場します。ここまで到達しないと「免許皆伝」とは言えないので仕方ありません。これらの概念については、完璧に解説しようとすると大学レベルの微分積分が必要になってしまいます。それは、読者の多くに非常に大きな負担を強いることになります。そこで本書ではやむなく、これらの解説は「簡易的」に済ませることにしました。

つまり、四則計算だけで実行できる公式を天下り的に与える方針としました。これも、本書の工夫の1つです。そういう意味で本書は、「自己充足的(self-contained)ではない」です。しかし、そういう「完全理解」を欲する人も、本書を読んでから専門書に挑戦したほうが得策だと思います。本書では、高度な数学を削除しているため、かえって、「ベイズ統計の背景にある本質」が浮き彫りになっているからです。

0-3 ビル・ゲイツも注目!ビジネスに使えるベイズ統計

ベイズ統計は、インターネットの普及とシンクロする形でビジネスに使われるようになりました。インターネットでは、顧客の購買行動や検索行動が自動的に履歴として収集されますが、そこから顧客の「タイプ」を推定するには、スタンダードな統計学よりもベイズ統計のほうが圧倒的に優れているからです。

現在、多くのネット系企業が実際にベイズ統計を利用しています。中でもマイクロソフトは、早くからベイズ統計をビジネス利用していることで有名です。ウィンドウズのOSのヘルプ機能には、ベイズ統計が導入されています。また、ウェブ上でユーザーが「子供の病気の症状」などを検索したとき、有望な指針を優先して表示するソフトウェアなども開発しました。マイクロソフトの元代表ビル・ゲイツ氏は、1996年に、自社が競争上優位にあるのはベイズ統計によることを新聞で宣言しました。また、2001年の基調講演でも、21世紀のマイクロソフトの戦略はベイズ統計であること、また、すでに世界中からベイズ統計の研究者を多数ヘッドハントしたことを公言したのは有名です。

一方、グーグルも、自社の検索エンジンの自動翻訳システムにおいて、ベイズ統計の技術を活かしていることが知られています。
もちろん、ベイズ統計の技術は、IT企業以外でもさまざまな分野で応用されています。例えば、ファクシミリでは送られた画像のノイズを修正して、正しい画像に近づけるのに、ベイズ統計を使っています。また、医療分野でも「自動診断システム」などにベイズ統計が使われています。

本書を読んでいけばわかることですが、ベイズ統計の強みは、「データが少なくても推測でき、データが多くなるほど正確になる」という性質と、「入ってくる情報に瞬時に反応して、自動的に推測をアップデートする」という学習機能にあります。これを知れば誰もが、先端のビジネスに最適、と納得することでしょう。
したがって、今世紀のビジネスに従事する人は、ベイズ統計を使いこなせるようになると最強でしょう。本書は、そういうビジネスパーソンの実用に役立つような例・解説を心がけました。

0-4 ベイズ統計は、人間の心理に依存する

「ベイズ統計には、ある種のうさん臭さがある」ということを0-2節に書きました。これはどういうことでしょうか。それは、ベイズ統計が扱う確率が「主観的」だ、ということです。つまり、ベイズ統計で導かれる確率は、客観的な数値ではなく、「人間の心理」に依存する主観的な数値だ、ということなのです。そういう意味で、ベイズ統計は「思想的」な面を備えています。このため、客観性を重んじる科学界から、ベイズ統計は「まがいもの」という烙印を押され、いったんは葬り去られることとなったのです。

たいていのベイズ統計の本には、残念ながら、このことが書かれていません。著者たちがこのことを「表沙汰にしたくない」と思っているからなのか、あるいは、彼らに単に知識がないからかわかりませんが、とにかく、このことを正面から解説している教科書は滅多にありません。でも、このベイズ統計の「主観性」「思想性」は、ベイズ統計の本質であり利便性の源泉です。だから、このことに目をつぶって解説をするならば、ベイズ統計の本質は絶対に読者に伝わらないでしょう。

そこで本書では、ベイズ統計の「主観性」「思想性」を包み隠さず、むしろ、白日の下にさらして、解説を進めることにしました。とりわけ、スタンダードな統計学とどこがどう違うのか、について丁寧に解説しました。きっと多くの読者が、「ベイズ統計ってスゴイ!面白い!」と拍手してくれるのではないか、と期待しています。

0-5 穴埋め式の簡単な練習問題があるので独習に最適

本書でも、前作『完全独習統計学入門』(ダイヤモンド社)の書き方を踏襲して、言葉を尽くして説明し、各講に簡単な穴埋め式の練習問題をつけました。数学的な技術を習得するには、自力で解ける簡単な練習問題をやってみるのが一番です。収録した練習問題は、応用的なものではなく、講義した内容の確認的なものなので、是非とも利用して理解を深めていただければ、と思います。

読み終わったあなたは、きっと、こう思うに違いありません。
「あれ、登山のトレーニングなんか一切しなかったのに、いつのまにか山頂に立ってるぞ!」
それでは、山頂を目指して、出発するとしましょう。

小島 寛之 (著)
出版社 : ダイヤモンド社 (2015/11/20)、出典:出版社HP

目次

第0講 四則計算だけで理解するベイズ統計学
本書の特長
0-1 予備知識ゼロから実用レベルに到達できる
0-2 使うのは面積図と算数だけ
0-3 ビル・ゲイツも注目!ビジネスに使えるベイズ統計
0-4 ベイズ統計は、人間の心理に依存する
0-5 穴埋め式の簡単な練習問題があるので独習に最適

第1部
速習!ベイズ統計学のエッセンスを理解する

第1講
情報を得ると確率が変わる
「ベイズ推定」の基本的な使い方
第1講のまとめ
練習問題

第2講
ベイズ推定はときに直感に大きく反する①
客観的なデータを使うときの注意点
第2講のまとめ
練習問題

第3講
主観的な数字でも推定ができる
困ったときの「理由不十分の原理」
第3講のまとめ
練習問題

第4講
「確率の確率」を使って推定の幅を広げる
第4講のまとめ
練習問題
column>ベイズはどんな人だったか

第5講
推論のプロセスから浮き彫りになる
ベイズ推定の特徴
第5講のまとめ
練習問題

第6講
明快で厳格だが、使いどころが限られる
ネイマン・ピアソン式推定
第6講のまとめ
練習問題

第7講
ベイズ推定は少ない情報で
もっともらしい結論を出す
ネイマン・ピアソン式推定との違い
第7講のまとめ
練習問題

第8講
ベイズ推定は「最尤原理」にもとづいている
ベイズ統計学とネイマン・ピアソン統計学の接点
第8講のまとめ
練習問題

第9講
ベイズ推定はときに直感に大きく反する②
モンティ・ホール問題と3囚人の間題
第9講のまとめ
練習問題
column▶︎「ツキ」についての2つの法則

第10講
複数の情報を得た場合の推定①
「独立試行の確率の乗法公式」を使う
第10講のまとめ
練習問題

朝11講
複数の情報を得た場合の推定②
迷惑メールフィルターの例
第11講のまとめ
練習問題

第12講
ベイズ推定では
情報を順繰りに使うことができる
「逐次合理性」
第12講のまとめ
練習問題

第13講
ベイズ推定は情報を得るたびに正確になる
第13講のまとめ
練習問題
column▶︎ベイズを復権させた学者たち

第2部
完全独習!「確率論」から第2部「正規分布による推定」まで

第14講
「確率」は「面積」と同じ性質を持っている
確率論の基本
第14講のまとめ
練習問題

第15講
情報が得られた下での確率の表し方
「条件付確率」の基本的な性質
第15請のまとめ
練習問題

第16講
より汎用的な推定をするための「確率分布図」
第16講のまとめ
練習問題

第17講
2つの数字で性格が決まる「ベータ分布」
第17講のまとめ
練習問題

第18講
確率分布図の性格を決める「期待値」
第18講のまとめ
練習問題
column▶︎主観確率とは、どんな確率か

第19講
確率分布図を使った高度な推定①
「ベータ分布」の場合
第19講のまとめ
練習問題

第20講
コイン投げや天体観測で観察される
「正規分布」
第20講のまとめ
練習問題

第21講
確率分布図を使った高度な推定②
「正規分布」の場合
第21講のまとめ
練習問題
補講▶︎ベータ分布の積の計算

おわりに
もっと学びたい人へ
練習問題解答
索引

小島 寛之 (著)
出版社 : ダイヤモンド社 (2015/11/20)、出典:出版社HP