ようこそ「多変量解析」クラブへ 何をどう計算するのか (ブルーバックス)

【最新 多変量解析について学ぶためのおすすめ本 – 統計の基本から実務に使える応用まで】も確認する

多変量解析の本質が分かる

難関といわれる多変量解析において、どの統計手法を選べばいいのか、どのデータから分析すればいいのかなどが分かります。計算のプロセスに沿って、数学的な本質を理解することができます。初心者の方にとっては難しめですが、確実に実践的な知識が身に付く1冊です。

小野田 博一 (著)
出版社 : 講談社 (2014/11/21)、出典:出版社HP

かつては研究者用の道具だった多変量解析(multivariate analysis)は、パソコンの性能向上と普及により、データを客観的に分析する道具として、今では一般社会で広く「容易に(?)」使われるようになりました。
しかし一般人には(じつは研究者の多くにも)、多変量解析は難解です。なぜなら、理論を学ばなければ、多変量解析を読者は十分理解することができず、また、「理論を分かりやすく読者に伝える」のは、本の執筆者にとって至難の業だからです。
それで多くの人々は、「多変量解析を十分理解してはいなくて、それを人には隠しつつ、統計パッケージに入っている計算ソフトをこわごわと使っている」ように私には思えます。
そんな「こわごわと使っていることを他の人に悟られまいとしている人」のために

本文イラスト/長谷垣なるみ
もくじ・本文デザイン/WORKS(丸田早智子)
本文図版/さくら工芸社

まえがき

「この本の著者はどんな人だろう?」と思った人は、このまえがきを見るかもしれませんので、それについて少しだけ述べておきます(というよりも、以下はなつかしい思い出話のようなものですが)。
私の大学院は疫学教室で、私が大学院でしていたのは多変量解析だけでした。
当時はパソコンが非常に高価なものしかない時代で、計算には大型計算センターのコンピューターを使っていました。SPSSの因子分析のメニューにはまだ直交回転しかなく、斜交回転を行なうためには自分でプログラムを書いていました。
あるとき柳井晴夫先生(「多変量解析法」「多変量解析ハンドブック」等の著者である統計学者)に、いまどんなことをしているかを訊かれて、「斜交回転の勉強をしています」と答え(いま思うと大学院生としてはずいぶん幼稚な答えですが)、柳井先生が「直交回転ばかりのこの時代にずいぶん風変わりなことをするね」というような興味深そうな表情をなさっていたことを、まるで昨日のことのように覚えています。
—本書を書いたのは、このような著者です。さて、ここで、本書がどのような本であるかを紹介しておきましょう。
本書は「多変量解析入門」の本ではありません。「多変量解析入門」を楽に読めるように、その前に読んでおくための本―あるいは、入門書を読んだけれどほとんど理解できなかった人のための本です。

多変量解析をしたことがある人ならわかっているでしょうが、多くの人は多変量解析の理論を理解していない状態で(叙述的な説明を読んで理論をわかった気になって、でも具体的な計算方法をまったく知らずに)、統計パッケージを使って分析をしています。とくに因子分析ではそうです。「因子分析の数学的な理論を本当にわかって使っている人は,非常に少ないのです」(松尾太加志・中村知靖『誰も教えてくれなかった因子分析」、北大路書房、2002年)。
因子分析では、計算方法が数学的な理論そのものです。計算方法を知らなかったら、理論をわかり得ません。と書くと、多くの人はギョッとするでしょうが、じつは理論は単純で、そのことは、行列例を使って書くとよくわかります《が、例を使わない式の形(昔の入門書の多くはこの形式)で書くと、理論は非常に難解なものに見え、人はその見かけに圧倒されて理解しようとする気をそがれます。因子分析の数学的な理論を本当にわかって使っている人が非常に少ない理由はここにあるのでしょう。
多変量解析の計算は、だいたいは単純な行列計算だけで(固有値計算以外は)、基本的には四則計算だけですから、中学1年生でも行なえますが、足したり掛けたりする計算量が多いので、それを手計算で行なうのは単に時間の無駄です。それで行列計算はパソコンにまかせたほうがいいのですが、何をどう計算させるのかは単純な内容なので知っておくべきです――第一、それを知らなかったなら、多変量解析を理解できませんから。
そういうわけで、単純な行列計算で読者が「多変量解析を具体的に理解」できるように、と出来上がったのが本書で具体例であなた自身が実際に計算してみれば、多変量解析は容易にわかります。それを行なうのが本書です。
多変量解析は楽しいものです。その楽しさを本書で十分伝えることができていることを願っています。
2014年10月小野田博一

★おそらく、多くの読者は、因子分析に強い関心があるでしょうから、まずその部分から読みたいのではないかと思います。が、いきなり因子分析のページから読み始めずに、できれば本のページの順に読んでいくことをおすすめいたします。なぜなら、素朴な「多次元尺度構成法と主成分分析」をあらかじめ理解していれば、因子分析の理解は非常に容易になるはずですから。
★多変量解析では、扱うデータに誤差が多分に含まれているので、たいていの場合、結果数値の有効数字は2ケタで十分でしょう(したがって、計算途中では有効数字4ケタ程度の計算で十分です)。
★なお、本書を理解するためには、読者は行列の基本的な計算ができることが必要です。ごく簡単なことは194ページに書いてありますが、行列計算についてまったく何も知らない人は、高校の旧課程の数学参考書や、199ページに挙げた参考書などを一読してください。

小野田 博一 (著)
出版社 : 講談社 (2014/11/21)、出典:出版社HP

もくじ

まえがき
(第1部)多次元尺度構成法と主成分分析
1.文化祭!!——多変量解析は謎解き
2.因子分析はちょっとあとで
3.多次元尺度構成法――データを視覚的に分析するために
4.犬たちのデータを使って
5.色を平面プロットしてみると
6.巡回セールスマン問題
7.固有値と固有ベクトルの不思議
8.主成分分析——角度をかえてデータを見る
9.「数学」を1本の軸にできるさらに角度をかえて見る
10.共分散行列の使い道——中心を通る直線を探そう
11.個人を平面プロットあなたは理系?文系?

(第2部)因子分析
12.因子分析――「自在」なので要注意!
13.因子分析のゴールはどこ?
14.独自性を図示
15.共通性の値は分析者自身が決めること
16.因子数の問題
17.軸の回転で解は無限に
18.正規バリマックス回転——雑魚を重視
19.斜交回転
20.プロクルーステース型の回転――お気に召すままの回転
21.5科目のデータを使って――実際のデータで分析してみよう
22.因子分析のプランの立て方

(第3報)回帰分析と判別分析
23.回帰分析——占いもできる分析法?
24.ある惑星の重力――非線形回帰分析・1
25.リサジュー曲線へのあてはめ――非線形回帰分析・2
26.「傾いた放物線」にあてはめる――非線形回帰分析・3
27.身長と体重に相関はある?――線形回帰分析
28.見かけ上だけの関係――相関回帰についての分析を行なうときの注意
29.対数螺旋(ベルヌーイの螺旋)へのあてはめ――非線形回帰分析・4
30.ロジスティック曲線へのあてはめ一非線形回帰分析・5
31.ロジスティック曲線の上限値を予測——非線形回帰分析・6
32.サイン曲線へのあてはめ――非線形回帰分析・7
33.フィリップス曲線へのあてはめ――非線形回帰分析・8
34.判別分析――このデータはどのグループに入る?
35.楕円を使った判別——非線形判別分析・1
36.完全な円へのあてはめ――非線形判別分析・2
37.霧の中の探索——回帰分析の応用
38.傾いている楕円軌道

(第4部)文化祭の準備
39.ジャカード係数と多次元尺度構成法――類似度を使って分析する
40.多次元尺度構成法と主成分分析(と因子分析)
41.数量化III類——結果の解釈の仕方
42.因子分析で占い?
43.最尤法――もっとも、もっともらしい方法とは?
44.文化祭の準備
45.文化祭

巻末付録
参考文献
さくいん

登場人物

紫(ゆかり)
高2。おっとり型。数学クラブの部長。小説好き。髪に花や蝶のピンをいつもしている(種類は日替わり)。

早紀(さき)
高2。数学クラブのメンバー。紫の親友。いつも考え事をしている。速読の鬼。

鈴(すず)
高1。数学クラブのメンバー。数学の成績は平均的。クラブ・オリエンテーションで紫に憧れて入部。

小野田 博一 (著)
出版社 : 講談社 (2014/11/21)、出典:出版社HP