【最新】多変量解析について学ぶためのおすすめ本 – 統計の基本から実務に使える応用まで

多変量解析とは?何に使える?

多変量解析とは、様々な分析方法を用いて、多くのデータからの結果予測やデータ間の相互関係を分析できる統計手法の総称です。データを解析し活用するこの技法は、医療や社会科学などあらゆる学術分野に役立つ知識です。ここでは、プログラミングや数学を用いて多変量解析について学べる本をご紹介します。

ランキングも確認する
出典:出版社HP

わかりやすい数学モデルによる多変量解析入門

多変量解析の基本から

統計解析の手法の一つである多変量解析の数学モデルを用いて、スポーツ・芸能・政治などの様々な分野のデータの解析例が紹介されています。初めて多変量解析を理解するのにおすすめの1冊です。さらに応用の内容も多く扱っているため、確実に実践的な知識が身に付きます。

木下 栄蔵 (著)
出版社 : 近代科学社; 第2版 (2009/5/1)、出典:出版社HP

読者の皆さまへ

小社の出版物をご愛読くださいまして、まことに有り難うございます。おかげさまで,近代科学社は1959年の創立以来,2009年をもって50周年を迎えることができました。これも、ひとえに皆さまの温かいご支援の賜物と存じ、心より御礼申し上げます。
この機に小社では、全出版物に対してUD(ユニバーサル・デザイン)を基本コンセプトに掲げ、そのユーザビリティ性の追究を徹底してまいる所存でおります。
本書を通じまして何かお気づきの事柄がございましたら、ぜひ以下の「お問合せ先」までご一報くださいますようお願いいたします。
お問合せ先:reader@kindaikagaku.co.jp
なお,本書の制作には,以下が各プロセスに関与いたしました:
・制作:大日本法令印刷
・組版:電算写植/大日本法令印刷
・印刷:大日本法令印刷
・製本:大日本法令印刷
・資材管理:田村洋紙店,三新大日本法令印刷
・カバー・表紙デザイン:川崎デザインスタジオ
・広報宣伝・営業:森田忠,山口幸治,富高塚磨

・本書の複製権・翻訳権・譲渡権は株式会社近代科学社が保有します。
・JCLS<(株)日本著作出版権管理システム委託出版物>
本書の無断複写は著作権法上での例外を除き禁じられています。
複写される場合は、そのつど事前に(株)日本著作出版権管理システム(電話03-3817-5670,FAX03-3815-8199)の許諾を得てください。

まえがき

21世紀に入りますます混迷を深める現代において、「意思決定」という言葉が非常に重要なキーワードとなっている。近未来の政治,経済,経営の問題,あるいは,個々人の進路選択などの問題に対して、さまざまな条件が錯綜するなかで最も重要な戦略的目標を達成するために最適な選択を効率よく行う必要が高まっているからである。

このような意思決定問題のすべてにおいて、私たちは多くの代替案のなかから、いくつかの評価基準に基づいて、1つあるいは複数の代替案を選ぶという場合が多いのである。このように考えると、人間が生きるということは、選択行動の積み重ねであり、一種の意思決定の集合であるということができる。
一方、混迷を深める現代社会においては,「情報社会」,「IT革命」などの要因により、ビジネス世界だけでなく、身の回りの生活まで、情報化の時代へ突き進もうとしている。そのため従来の考え方では時々刻々と変わりゆく時代の流れ(たとえばドッグイヤー)についていけず、国際化の波に乗り遅れることは必至である。いままさにパラダイム・シフトが必要になってきているのである。それは1990年からの「失われた15年」を総括し、それ以前のパラダイムから新しいパラダイムを創造することを意味している。すなわち、一言でいえば、オペレーションマネジメント(選択された道を上手に走る戦略論)への変更である。1990年以前の日本は「あれもこれもの時代」だったが、これからの時代は、「これだけはの時代」になるからである。

したがって、21世紀は、意思決定論が重要な課題を解くキーワードとなるであろう、このようときに用いる数学的な分析手法として「多変最解析」がある。
本書は、多変量解析等の数学モデルを勉強している学生や、実際の業務で数理解析に従事している人たち、さらに直接仕事に関係なくても教養として数学を身につけたいビジネスマンのために多変量解析等の数学モデルをわかりやすくまとめたものである。とりわけ本書では,著者がこれまで行ってきた研究や,数学モデルの実務ならびに教育の経験をもとにしているので、読者のみなさんにとって実用的で理解しやすい本になったものと信じている。また適用例は,日常的でわかりやすく楽しい話題を選んでいるので興味深く読んでいただけるはずである。
なお、本書を執筆するにあたり、先輩諸氏の著書を多数参考にさせていただいた。これらの諸氏に御礼申しあげる.
最後に、本書の企画から出版に関わる実務にいたるまでお世話になった株近代科学社の小山透氏と高山哲司氏に厚く感謝したい。

2009年1月
木下栄蔵

木下 栄蔵 (著)
出版社 : 近代科学社; 第2版 (2009/5/1)、出典:出版社HP

目次

まえがき
第1章はじめに

第2章OERAモデルとDERAモデル
2.1はじめに
2.2 OERAモデル
2.3 DERAモデル
2.4 2008年度プロ野球での計算例
2.5イチローの生涯打者成績

第3章回帰分析法
3.1回帰分析法とは
3.2直線回帰分析(単回帰分析)
3.3指数回帰分析
3.4重回帰分析
3.5重回帰分析の適用例(学校の成績,打者の評価)

第4章数量化理論1類
4.1数量化理論1類とは
4.2数量化理論1類の適用例:その1(学校の成績)
4.3数量化理論1類の適用例:その2(打者の成績)

第5章判別分析法
5.1判別分析法とは
5.2判別分析法の適用例:その1(学校の身体測定)
5.3判別分析法の適用例:その2(打者の成績)

第6章数量化理論2類
6.1数量化理論2類とは
6.2数量化理論2類の適用例:その1(学校の成績)
6.3数量化理論2類の適用例:その2(打者の成績)

第7章クラスター分析
7.1クラスター分析の概要と計算手順
7.2クラスター分析の方法
7.3クラスター分析の適用例(打者の成績)

第8章数量化理論3類
8.1数量化理論3類とは
8.2数量化理論3類の適用例:その1(レジャーの過ごし方)
8.3数量化理論3類の適用例:その2(食事のメニューの選び方)

第9章数量化理論4類
9.1数量化理論4類とは
9.2数量化理論4類の適用例:その1(アイドルタレントの分析)
9.3数量化理論4類の適用例:その2(タレントの分析)

第10章主成分分析法
10.1主成分分析法とは
10.2主成分分析法の適用例:その1(学校の身体測定)
10.3主成分分析法の適用例その2(投手の成績)

第11章因子分析法
11.1因子分析法とは
11.2因子分析法の適用例:その1(野球人の好み)
11.3因子分析法の適用例:その2(タレントの好み)
11.4因子分析法の適用例:その3(政治家の好み)

第12章AHPモデル
12.1AHPモデルとは
12.2階層分析法AHPの概要
12.3AHPの数学的背景
12.4AHPモデルの適用例(企業選定,住宅の選定,番組の選定)

第13章ISMモデル
13.1システム分析(ISMモデル)
13.2ISMモデルとは
13.3ISMモデルの適用例:その1(住宅の選定)
13.4ISMモデルの適用例:その2(交通経路選択)

参考文献
索引

木下 栄蔵 (著)
出版社 : 近代科学社; 第2版 (2009/5/1)、出典:出版社HP

はじめに

2008年は激動の一年間であった。米国発サブプライムローン問題に端を発し、2008年9月15日の米国証券会社リーマンブラザースの破綻で一挙に世界同時株安へと突入した。1930年代の世界大恐慌の再来を思わせる経済状態である。そして、急激な円高が進み、日本の輸出産業は軒並み赤字決算に陥った。
一方、スポーツ界に目を転ずれば、プロ野球において阪神タイガースが独走しており、誰もがセ・リーグの覇者になると信じて疑わなかった。しかし、結果は巨人の奇跡的逆転優勝でセ・リーグは幕を閉じた。そして、日本シリーズでは、パ・リーグの覇者西武が巨人を倒し、日本一に輝いたのであった。

野球をはじめあらゆるスポーツにおいて、勝負の分かれ目は、一元的な指標では決まらない、その背後にある多元的な要因が複雑にからみあって決まるものであるまたスポーツだけでなく,政治・経済の世界、芸能界、入学試験や入社試験における人物評価等々において,その内部状況を分析してみると複雑である場合が多い。このように社会現象は,複雑な要因の組み合わせで成り立っているが,これらを一元的にとらえるのではなく多元的にとらえることにより複雑な構造が単純化されてくることがある。このような複雑な構造を分析するときに用いる数学的手法が「多変量解析」と呼ばれるものである.したがって、多変量解析は,複雑な社会現象や人間関係の仕組みを把握するのに使える手法の集まりともいえる。その内容は,種々の現象がいくつかの変量によって決まるとき、その変最間の相関関係を解析し,これらの変量の総合化をいくつかの視点から行い、多元的に考察するものといえる。
さて、本書では、この多変量解析を中心に説明していくのであるが,以下,本書の構成と各章の内容について述べる.

●第2章OERAモデルとDERAモデル
OERAモデルはアメリカのコウバーとケイラーが提案した打者貢献度指数モデルである。すなわち,野球における打者の公平かつ正確な評価を行うためのモデルといえる.一方,DERAモデルは日本の木下(著者)が提案した投手貢献度指数モデルである.すなわち、野球における投手の公平かつ正確な評価を行うためのモデルである。
多変量解析の手法は第3章から第11章までに説明してある。その中で第3章から第6章までが外的基準がある場合の多変量解析の手法で,第7章から第11章までが外的基準がない場合の多変量解析の手法である.外的基準とは,予測あるいは,判別すべき測定対象のもつ性質のことである.たとえば入学試験における総合得点や合否と考えてもらえればよい.
さて、この外的基準とこれを説明する要因がどのようなデータであるか(量的であるか質的であるか)によって4つの手法に分かれる。ただし量的データとは、たとえばテストの点が何点といったものであり,質的データとは,成績が優とか良あるいは合格とか不合格といったものである.そこで,外的基準のある多変量解析の手法を章単位で説明する.
●第3章回帰分析法
量的な要因に基づいて量的に与えられた外的基準を説明するための手法である。
●第4章数量化理論1類
質的な要因に基づいて量的に与えられた外的基準を説明するための手法である。
●第5章判別分析法
量的な要因に基づいて質的に与えられた外的基準を説明するための手法である。すなわち、判別分析法は,回帰分析法において外的基準が質的データで与えられている場合に相当する.
●第6章数量化理論2類
質的な要因に基づいて,質的に与えられた外的基準を説明するための手法である。すなわち,数量化理論2類とは、判別分析法において各要因が質的データで与えられている場合に相当する。

一方,外的基準のない多変量解析のうち分類を目的としている手法は第7章から第9章までであり,以下それらを章単位で説明する.
●第7章クラスター分析
種々の異なった性質のものがまざり合っている対象の中で、互いに似たものどうしを集めてクラスターを作り,それらを直接分類しようとする手法である。
●第8章数量化理論3類
個体の様々なカテゴリーへの反応の型に基づいて,個体とカテゴリーの両方を数量化する.そして,この数量により各個体やカテゴリーを分類し,その分類をもたらした原因は何であるかを探りだす手法である。
●第9章数量化理論4類
対象間の比較を手掛りにして数量化を行い,多くの対象を似たものどうしに分類する手法である。
さらに,外的基準のない多変量解析の手法は,第10章,第11章にもあり,以下それらを章単位で説明する。
●第10章主成分分析法
多くの変数の値を1つまたは少数個の合成変量(主成分)で表す手法である。つまり,この手法は多くの変量をまとめ、現象を要約する1つの有効な方法といえる。
●第11章因子分析法
多くの変数の値をいくつかの因子によって説明する手法である。つまり,この手法は現象の背後にある事実を明らかにするためのもので,その説明因子の解釈に重きをおく方法といえる。

最後に,ユニークなモデルを2つ紹介する。1つは,複雑なあるいはあいまいな状況の下での意思決定手法AHPモデルであり,もう1つは問題をより客観的に明確にとらえるための階層構造化手法ISMモデルである。これらの手法は,第12章,第13章にあり,以下それらを章単位で説明する.
●第12章AHPモデル
Thomas.L.Saatyが提唱した不確定な状況や多様な評価基準における意思決定手法であるこの手法は,問題の分析において主観的判断とシステムアプローチをうまくミックスした問題解決型意思決定手法の1つといえる。
●第13章ISMモデル
J.N,Warfieldが提唱した階層構造化手法の1つである。この手法は,問題をより客観的な方法で最適な階層構造に明示化する際の有効な方法といえる。

木下 栄蔵 (著)
出版社 : 近代科学社; 第2版 (2009/5/1)、出典:出版社HP

本当に使えるようになる多変量解析超入門 (知識ゼロでもわかる統計学)

Rで直感的に理解する

膨大なデータを扱う上で、特徴や関係性を見出す必要があります。本書ではフリーソフトであるRを使って分析を進めていくので、実際に手を動かすことで理解し、知識を身につけることができます。初心者におすすめの1冊です。

加藤 剛 (著)
出版社 : 技術評論社 (2013/4/12)、出典:出版社HP

ご利用の前に必ずお読みください

本書は紙書籍『知識ゼロでもわかる統計学本当に使えるようになる多変量解析超入門」(ISBN978-4-77415630-9)を元に製作した電子書籍です。紙書籍とは一部レイアウトが異なります。
本書に記載された内容は、情報の提供のみを目的としています。したがって、本書を用いた運用は、必ずお客様自身の責任と判断によっておこなってください。これらの情報の運用の結果について、技術評論社および著者はいかなる責任も負いません。
本書記載の情報は、特に断りのない限り、2013年5月のものを掲載しております。ご利用時には変更されている場合もあります。特に、ソフトウェアはパージョンアップされる場合があり、本書での説明とは機能内容や画面図などが異なってしまうこともありえます。
以上の注意事項をご承諾いただいた上で、本書をご利用願います。これらの注意事項をお読みいただかずに、お問い合わせいただいても、技術評論社および著者は対処しかねます。あらかじめ、ご承知おきください。
本文中に記載されている製品の名称は、すべて関係各組織、各社の商標または登録商標です。

読者の皆様へ(Rのインストールのお願い)

1.本書では、Rとよばれる無料の統計ソフトウェア、特に、原則としてマウスクリックだけで操作できるRコマンダーというRのオプション機能を利用して、世の中に実際あるデータの分析をしながら多変量解析の基礎を学んでいきます。そのため、皆様にはインターネット上からRをダウンロードし、ご自身のパソコンにインストールしていただく必要があります。インターネットに接続できるパソコンをご用意ください。
2.Rのダウンロード方法、および、RとRコマンダーのインストール方法は、本書のサポートページに詳しい説明書が用意されています。次のようにして、本書のサポートページにアクセスしてください。
(1)YahooやGoogleなど、普段お使いの検索用ホームページを開いて、次の2つの語句を組にして検索を行ってください。
技術評論社サポートページ多変量解析超入門
(2)検索結果の上位(検索結果の1ページ目)に、次のような表現のリンクが見つかります。
サポートページ書籍サポート:本当に使えるようになる多変量解析超入門
このリンクをクリックすると、次のページにある図の表示を含むウェッブサイトにつながります。これが、技術評論社のホームページの中に設けられた本書のサポートページです。
【注意】下図はサポートページの試行版です。みなさんがご覧になるときは、デザインが若干変更されているかもしれません。
3.まず、Web版付録の「1.Rのダウンロードとインストール」にある3つのOSの選択肢から、ご使用になっているOSの上をクリックしてください(Windows7またはWindowsVista,Windows8,WindowsXP)。それぞれのOSのもとでのRのダウンロード方法を記した説明書(Web版付録1)が、閲覧およびダウンロードできます。その説明にしたがって、Rをダウンロードし、ご自身のパソコンにインストールしてください。
【参考】Rには、Windows版に加えて、MacOS版とLinux版もあります。MacOSやLinuxをお使いの方はコンピュータについてある程度の知識をお持ちだと思いますので、「Windows7またはWindowsVista」の説明を参考にして、Rのダウンロードとインストールを行ってください。
4.Rのインストールが終了したら、サポートページのWeb版付録「2.Rコマンダーのインストール」の上をクリックしてください。RにRコマンダーという機能(オプションパッケージ)を追加する方法を記した説明書(Web版付録2)が、閲覧およびダウンロードできます。その説明にしたがって、R上にRコマンダーの機能を組み込んでください。
5.RおよびRコマンダーの起動方法と終了方法についての説明書(Web版付録3)は、サポートページのWeb版付録「3.Rコマンダーの起動と終了」の上をクリックすると、閲覧およびダウンロードできます。

本書のサポートページ
ダウンロード
設定変更用ファイル
多変量解析デーカット

Web版付録の表示がリンクになっています。
1.Rのダウンロードとインストール
WindowsVista
・Windows7
・Windows8
・WindowsXP
2.Rコマンダーのインストール
3.Rコマンダーの起動と終了
4.データセットのダウンロード
WindowsVistaまたはWindows7
・Windows8
・WindowsXP
5.データの読み込みと呼び出し
5-1外部データファイルの読み込み
・Windows7またはWindowsVisa
・Windows8
・WindowsXP
5-2内部データの呼び出し
5-3保存したデータの呼び出し

はじめに

本書の目的は、心理、金融、経営、医療など、実社会の幅広い分野で利用されている多変量解析の初等的な方法の一部を、現実にあるデータの分析を実習形式で行いながら読者のみなさんに学んでいただくことにあります。
多変量解析の各種の分析方法は多くのデータ解析用ソフトウェアに組み込まれ、データを処理して何らかの結果を出すことは、かなり容易になりました。けれども、分析方法の仕組みに立ち入ると、途端に敷居が高くなります。理由は、線形代数、特に行列の性質が活用されていることにあります。線形代数を学ぶ機会をもたない、あるいは、もたなかった方々に対し、多変量解析のために行列の理論を一から学んでくださいと言うことは、正論ではあっても、現実問題としては酷なことです。

そこで、本書では、マウスクリックだけでほぼすべての操作ができるソフトウェアの助けを借りて、出力される図や数字の情報を極力活用し、分析方法の概略を数学に頼らないで説明することを意図しています。厳密な理論はひとまず脇においたとしても、何回か反復練習を行うことによって、「この分析方法でしていることは、およそこんな感じ」という感覚をつかむことができれば、分析方法に対する理解度や分析結果の解釈の仕方は変わってきます。読者の皆様にとって、本書が多変量解析のからくりを直感的に理解する一助になれば幸いです。
最後に、遅筆を重ねる筆者の入稿を辛抱強く待ち、的確な修正意見をくださった技術評論社の成田恭実さんに、厚く御礼申し上げます。また、本書と同じシリーズの著者である一橋大学大学院の横内大介先生と帝京大学の実吉綾子先生からは、ファイナンスと心理学のそれぞれの分野における多変量解析の実例の提供をいただきました。多変量解析の具体例についてのコラムを本書に付け加えることができたのは、両先生のおかげです。心より感謝申し上げます。

2013年4月
加藤剛(かとうたけし)

加藤 剛 (著)
出版社 : 技術評論社 (2013/4/12)、出典:出版社HP

目次

読者の皆様へ
はじめに
キャラクター紹介
第1章似たもの同士でデータを分類
1-1クラスタ分析
1-2樹形図ができるまで
1-3数字で見るクラスタ分析

第2章視点を変えてデータを観察
2-13次元散布図
2-2主成分分析
2-3主成分分析の仕組み

第3章原因と結果の関係を簡潔に表現
3-1相関関係と因果関係
3-2線形単回帰分析
3-3線形重回帰分析
3-4モデルのあてはめ

付録1データセットのダウンロード
付録2外部データの取り込み方
付録3内部データの呼び出し方
付録4 n個の変数を使った主成分分析の理論的背景

参考文献
索引
著者プロフィール

キャラクター紹介

アリマ先生
アルマジロ。哺乳類。
統計学のことならなんでも知っていて、統計学の生き字引と言われている。
データを変幻自在に操り、統計学の質問にならなんでもこたえてくれるので、慕われている。ときどきおっちょこちょいなところも見せる。

ねこすけ
ねこ。
最近新聞やテレビを見るようになり、数字、データ、統計に関心を持ち始め、いろいろなことに興味津々。
アリマ先生を慕い、弟子入りする。

アーミー
ミーアキャット。
ねこすけの友達。ねこすけに連れられ、アリマ先生のところに顔を出すもののいまいち統計にはなじめることができていない。しばらく長旅に出ていたようで、今回身なりも言葉づかいもすっかりかわって登場。いったい何があったか!?

加藤 剛 (著)
出版社 : 技術評論社 (2013/4/12)、出典:出版社HP

ようこそ「多変量解析」クラブへ 何をどう計算するのか (ブルーバックス)

多変量解析の本質が分かる

難関といわれる多変量解析において、どの統計手法を選べばいいのか、どのデータから分析すればいいのかなどが分かります。計算のプロセスに沿って、数学的な本質を理解することができます。初心者の方にとっては難しめですが、確実に実践的な知識が身に付く1冊です。

小野田 博一 (著)
出版社 : 講談社 (2014/11/21)、出典:出版社HP

かつては研究者用の道具だった多変量解析(multivariate analysis)は、パソコンの性能向上と普及により、データを客観的に分析する道具として、今では一般社会で広く「容易に(?)」使われるようになりました。
しかし一般人には(じつは研究者の多くにも)、多変量解析は難解です。なぜなら、理論を学ばなければ、多変量解析を読者は十分理解することができず、また、「理論を分かりやすく読者に伝える」のは、本の執筆者にとって至難の業だからです。
それで多くの人々は、「多変量解析を十分理解してはいなくて、それを人には隠しつつ、統計パッケージに入っている計算ソフトをこわごわと使っている」ように私には思えます。
そんな「こわごわと使っていることを他の人に悟られまいとしている人」のために

本文イラスト/長谷垣なるみ
もくじ・本文デザイン/WORKS(丸田早智子)
本文図版/さくら工芸社

まえがき

「この本の著者はどんな人だろう?」と思った人は、このまえがきを見るかもしれませんので、それについて少しだけ述べておきます(というよりも、以下はなつかしい思い出話のようなものですが)。
私の大学院は疫学教室で、私が大学院でしていたのは多変量解析だけでした。
当時はパソコンが非常に高価なものしかない時代で、計算には大型計算センターのコンピューターを使っていました。SPSSの因子分析のメニューにはまだ直交回転しかなく、斜交回転を行なうためには自分でプログラムを書いていました。
あるとき柳井晴夫先生(「多変量解析法」「多変量解析ハンドブック」等の著者である統計学者)に、いまどんなことをしているかを訊かれて、「斜交回転の勉強をしています」と答え(いま思うと大学院生としてはずいぶん幼稚な答えですが)、柳井先生が「直交回転ばかりのこの時代にずいぶん風変わりなことをするね」というような興味深そうな表情をなさっていたことを、まるで昨日のことのように覚えています。
—本書を書いたのは、このような著者です。さて、ここで、本書がどのような本であるかを紹介しておきましょう。
本書は「多変量解析入門」の本ではありません。「多変量解析入門」を楽に読めるように、その前に読んでおくための本―あるいは、入門書を読んだけれどほとんど理解できなかった人のための本です。

多変量解析をしたことがある人ならわかっているでしょうが、多くの人は多変量解析の理論を理解していない状態で(叙述的な説明を読んで理論をわかった気になって、でも具体的な計算方法をまったく知らずに)、統計パッケージを使って分析をしています。とくに因子分析ではそうです。「因子分析の数学的な理論を本当にわかって使っている人は,非常に少ないのです」(松尾太加志・中村知靖『誰も教えてくれなかった因子分析」、北大路書房、2002年)。
因子分析では、計算方法が数学的な理論そのものです。計算方法を知らなかったら、理論をわかり得ません。と書くと、多くの人はギョッとするでしょうが、じつは理論は単純で、そのことは、行列例を使って書くとよくわかります《が、例を使わない式の形(昔の入門書の多くはこの形式)で書くと、理論は非常に難解なものに見え、人はその見かけに圧倒されて理解しようとする気をそがれます。因子分析の数学的な理論を本当にわかって使っている人が非常に少ない理由はここにあるのでしょう。
多変量解析の計算は、だいたいは単純な行列計算だけで(固有値計算以外は)、基本的には四則計算だけですから、中学1年生でも行なえますが、足したり掛けたりする計算量が多いので、それを手計算で行なうのは単に時間の無駄です。それで行列計算はパソコンにまかせたほうがいいのですが、何をどう計算させるのかは単純な内容なので知っておくべきです――第一、それを知らなかったなら、多変量解析を理解できませんから。
そういうわけで、単純な行列計算で読者が「多変量解析を具体的に理解」できるように、と出来上がったのが本書で具体例であなた自身が実際に計算してみれば、多変量解析は容易にわかります。それを行なうのが本書です。
多変量解析は楽しいものです。その楽しさを本書で十分伝えることができていることを願っています。
2014年10月小野田博一

★おそらく、多くの読者は、因子分析に強い関心があるでしょうから、まずその部分から読みたいのではないかと思います。が、いきなり因子分析のページから読み始めずに、できれば本のページの順に読んでいくことをおすすめいたします。なぜなら、素朴な「多次元尺度構成法と主成分分析」をあらかじめ理解していれば、因子分析の理解は非常に容易になるはずですから。
★多変量解析では、扱うデータに誤差が多分に含まれているので、たいていの場合、結果数値の有効数字は2ケタで十分でしょう(したがって、計算途中では有効数字4ケタ程度の計算で十分です)。
★なお、本書を理解するためには、読者は行列の基本的な計算ができることが必要です。ごく簡単なことは194ページに書いてありますが、行列計算についてまったく何も知らない人は、高校の旧課程の数学参考書や、199ページに挙げた参考書などを一読してください。

小野田 博一 (著)
出版社 : 講談社 (2014/11/21)、出典:出版社HP

もくじ

まえがき
(第1部)多次元尺度構成法と主成分分析
1.文化祭!!——多変量解析は謎解き
2.因子分析はちょっとあとで
3.多次元尺度構成法――データを視覚的に分析するために
4.犬たちのデータを使って
5.色を平面プロットしてみると
6.巡回セールスマン問題
7.固有値と固有ベクトルの不思議
8.主成分分析——角度をかえてデータを見る
9.「数学」を1本の軸にできるさらに角度をかえて見る
10.共分散行列の使い道——中心を通る直線を探そう
11.個人を平面プロットあなたは理系?文系?

(第2部)因子分析
12.因子分析――「自在」なので要注意!
13.因子分析のゴールはどこ?
14.独自性を図示
15.共通性の値は分析者自身が決めること
16.因子数の問題
17.軸の回転で解は無限に
18.正規バリマックス回転——雑魚を重視
19.斜交回転
20.プロクルーステース型の回転――お気に召すままの回転
21.5科目のデータを使って――実際のデータで分析してみよう
22.因子分析のプランの立て方

(第3報)回帰分析と判別分析
23.回帰分析——占いもできる分析法?
24.ある惑星の重力――非線形回帰分析・1
25.リサジュー曲線へのあてはめ――非線形回帰分析・2
26.「傾いた放物線」にあてはめる――非線形回帰分析・3
27.身長と体重に相関はある?――線形回帰分析
28.見かけ上だけの関係――相関回帰についての分析を行なうときの注意
29.対数螺旋(ベルヌーイの螺旋)へのあてはめ――非線形回帰分析・4
30.ロジスティック曲線へのあてはめ一非線形回帰分析・5
31.ロジスティック曲線の上限値を予測——非線形回帰分析・6
32.サイン曲線へのあてはめ――非線形回帰分析・7
33.フィリップス曲線へのあてはめ――非線形回帰分析・8
34.判別分析――このデータはどのグループに入る?
35.楕円を使った判別——非線形判別分析・1
36.完全な円へのあてはめ――非線形判別分析・2
37.霧の中の探索——回帰分析の応用
38.傾いている楕円軌道

(第4部)文化祭の準備
39.ジャカード係数と多次元尺度構成法――類似度を使って分析する
40.多次元尺度構成法と主成分分析(と因子分析)
41.数量化III類——結果の解釈の仕方
42.因子分析で占い?
43.最尤法――もっとも、もっともらしい方法とは?
44.文化祭の準備
45.文化祭

巻末付録
参考文献
さくいん

登場人物

紫(ゆかり)
高2。おっとり型。数学クラブの部長。小説好き。髪に花や蝶のピンをいつもしている(種類は日替わり)。

早紀(さき)
高2。数学クラブのメンバー。紫の親友。いつも考え事をしている。速読の鬼。

鈴(すず)
高1。数学クラブのメンバー。数学の成績は平均的。クラブ・オリエンテーションで紫に憧れて入部。

小野田 博一 (著)
出版社 : 講談社 (2014/11/21)、出典:出版社HP

入門 多変量解析の実際 (ちくま学芸文庫)

実務に活用できる

多変量解析を実務で活用するためのコツがわかりやすく解説されています。多変量解析のさまざまな分析法をどのように使いこなせばいいのかよくわかります。実際にマーケティングの例を多く扱っており、実務家必読の入門書です。

朝野 熙彦 (著)
出版社 : 筑摩書房 (2018/5/10)、出典:出版社HP

これは「サンプル版」です。

製品版の一部を抜粋しています。
製品版とは異なることがあります。

第2版にあたって

本書の初版は多変量解析の初心者が,この道具を上手に使いこなすための早わかりを狙って1996年5月に上梓された、料理にたとえていえば、包丁の製造法の本ではなく,包丁の使い方のガイドブックを意図したものである.読者としては、マーケティングに携わる実務家を想定した。具体的にはR&D,生産,流通,販売,広告に携わるマーケターやプランナーを念頭において本書をまとめたもちろん,経済学や経営学を勉強中の学生にも参考になると思われる。執筆方針は次の3つとした。

①できるだけ数式を避け絵と言葉で多変量解析のイメージを伝える,②よく利用されている方法だけを取り上げる,③アウトプットの意味がわかるようにする.
幸い本書は市場のニーズに合致していたらしく好評をもって迎えられ、版を重ねることができた。今回第2版を出版できることになったのは、読者諸兄のご支援の賜物であり深く感謝したい、この間多数の書評を頂戴したが特に,中央大学理工学部の加藤俊一先生からは「多変量解析の入門書,解説書は数多く出版されている.その中にあって本書は,それぞれの手法の限界や誤った利用法を避ける(すなわち,分析者自身が統計にだまされないためのアドバイスが出色である。」(西尾章治郎・加藤俊一ほか「マルチメディア情報学8情報の構造化と検索』岩波書店,第4章283ページ)という書評を頂戴した。厚くお礼申し上げたい。
多変量解析の類書の中で,本書の独自性uniquenessは「ユーザーによるユーザーのためのガイド」であると考えている、メーカーにあたる専門家が実務家の苦労をわかった気になって書いている解説書は珍しくない。しかし、本当に利用者の視点にたって使い方を述べた本は少ないのではないだろうか、「メーカーばかりしゃべっていないで、ユーザーにも一言いわせてもらいたい」これが本書のキーコンセプトである。おおげさにいえば,多変量解析の世界における消費者運動の試みとご理解いただければ幸いである。

第2版の執筆方針は初版と変わりない.しかし,上記の趣旨に賛同してくださった諸先生から初版の誤りや記述の不備を多々ご指摘いただいた。正直にいえば,それらのバグフィックスが今回改訂版を出さざるを得なくなった理由である。特に日経リサーチの鈴木督久氏には3章の主成分分析の計算の誤りをご指摘いただいた。また10章の統計プログラム・パッケージの資料は同氏より提供されたものである。香川大学の堀啓造先生には6章のマルチコ対策のその5をメーリングリストを通じてお教えいただいた。女子栄養大学の真柳麻誉美先生には9章の時系列比較につきご示唆を頂き,また旧版の全体にわたって記述の不備をご指摘いただいた。立教大学の村瀬洋一先生,大阪大学大学院生の村上あかね氏にも貴重なコメントを頂戴した。その他、ご叱正を通じて第2版の改訂にご貢献いただいたすべての皆様にお礼申し上げたい.
最後になったが多変量解析の世界に朝野を導いて下さった大学入試センターの柳井晴夫教授に最大の感謝を捧げたい。また、講談社サイエンティフィクの瀬戸さんは、いつもながらの熱心な督促によって本書を世に送り出してくださった。心からお礼申し上げる次第である.

2000年10月
朝野熙彦

朝野 熙彦 (著)
出版社 : 筑摩書房 (2018/5/10)、出典:出版社HP

目次

第2版にあたって
第1章ウォーミングアップ一下準備と本書のパノラマ
1.1はじめの言葉と終わりの言葉
1.2基礎的な概念と道具
1.3そのほかの用語の説明
1.4本書のパノラマ

第2章コレスポンデンス分析と数量化理論II類——製品やブランドをポジショニングする
2.1バターン分類の思想
2.2数量化理論III類による都市イメージの分析
2.3数量化理論II類によるテレビ番組降好の分析
2.4コレスポンデンス分析を用いたシャンプーのポジショニング分析
2.5パターン分類を使いこなすコツ

第3章主成分分析——情報を集約する
3.1主成分分析とは何か
3.2スキー・ブランドのマップ
3.3主成分分析はこう使う
3.4カテゴリー・データの処理
付記

第4章因子分析——隠された構造を可視化する
4.1イメージを測定する
4.2因子分析はこう読む
4.3SD法の顛末
4.4主成分分析との区別
4.5因子分析の泥沼

第5章クラスター分析——新しいセグメントを発見する
5.1クラスター分析はこう使う
5.2OLのセグメンテーションの事例
5.3人気企業の時系列変化を追う
5.4クラスター分析の迷路

第6章重回帰分析と数量化理論I類——市場性を予測する
6.1重回帰分析早わかり
6.2広告注目率の予測
6.3重回帰分析で困ること

第7章正準相関分析と判別分析——多変量解析の総本山に迫る
7,1孫悟空の世界
7.2正準相関分析のイメージ
7.3数量化理論II類によるチャネルの分析
7.4判別分析におけるマルチコ対策

第8章コンジョイント分析——新製品のコンセプトを開発する
8.1コンジョイント分析の思想
8.2コンジョイント分析はこう進める。
8.3コンセプト・ジェネレーション
8.4パソコン・ソフト
8.5応用の動向
8.6シミュレーション
8.7まとめ

第9章トラブル・シューティング
9.1多変量解析で本当に「予測」できるのか
9.2時系列比較が難しい
9.3多変量解析で母集団推計をどうするか
9.4消費者行動は線型か
9.5データそのものの問題

第10章ユーザーのための多変量解析
10.1多変量解析のソフトと関連書籍
10.2ユーザーがメーカーに望むこと
10.3多変量解析を使いこなす5つの秘訣

引用文献
付録
文庫版あとがき
索引

入門 多変量解析の実際

朝野 熙彦 (著)
出版社 : 筑摩書房 (2018/5/10)、出典:出版社HP

まずはこの一冊から意味がわかる多変量解析 (BERET SCIENCE)

多変量解析の意味がよくわかる

科学、ビジネス、学問など様々な分野においてデータをデジタルで扱うようになり、統計学の重要性が急速に再認識され始めています。そこで必要となる基本知識が“多変量解析”です。本書では多変量解析の基本や概略を、図を用いて丁寧に解説しています。

石井 俊全 (著)
出版社 : ベレ出版 (2014/6/23)、出典:出版社HP

はじめに

この本は、次のような人たちを読者として想定しています。
想定している読者
①数学が苦手だが多変量解析の概略を手っ取り早くつかみたい人。
②手元にデータがあるが、どう分析したらよいかわからない人。
分析して何が得られるかわからない人。
③多変量解析のソフトを使ったことがあるが、中身で何をしているかがわからないので知りたい人。多変量解析の原理を確認したい人。
この本の構成を紹介しつつ、上の1~3のそれぞれのタイプの読者にとって、本書がいかに有用であるかを説明していきましょう。

本書の章立て

第1章多変量解析のマップ
第2章統計・確率の準備
第3章相関分析
第4章回帰分析
第5章判別分析
第6章主成分分析
第7章因子分析
第8章数量化分析
第9章数学的準備

①数学が苦手だが多変量解析の概略を手っ取り早くつかみたい人。
本書を手に取って、パラパラっと見ると数式が多いので敬遠している人もいらっしゃるかもしれませんが、この本は数式が苦手な方でも読むことができます。
というのは、数式で書かれていないところを読むだけでも多変量解析のエッセンスをつかむことができるよう工夫して書いてあるからです。
数式を使わないで多変量解析を理解できるのか、と訝しがる方もいらっしゃるかもしれません。実際、そのようなことをうたった本を読んだことがあるけれど、多変量解析の仕組みまではわからなかったという経験をお持ちの方もいらっしゃるでしょう。
しかしこの本では、数式での説明をする前に、多変量解析の仕組みを図に置き換えて説明しています。ですから、数式にアレルギーがある数学が苦手な人でも、多変量解析の手法について理解することが可能なのです。
「数式を使わない多変量解析」というような本を読んで、結局のところソフトの使い方しかわからなかったという苦い経験をお持ちの方にも、この本なら満足していただけると考えています。
この本は、数式が書かれていないところを読むだけでも、十分にお釣りがきます。

多変量解析と一口にいいましても、多変量解析には資料の種類と分析の目的によって多くの分析法が用意されています。
「第1章多変量解析のマップ」では、これらの手法について簡単な例とともに難しい数式を用いずに解説しています。気軽に多変量解析の俯瞰図を得ることができるでしょう。
第3章からは、多変量解析の各分析法について解説しています。
解説の仕方は、おおよそ、

・分析法の概略(A)
・グラフ・図形による原理の説明(A)
・具体例による実践(B)
・結果の数学的な意味(B)
・数式による裏付け(C)
という順序で説明していきます。ここでA、B、Cは内容の難易度を表しています、Aから順に難易度が上がります。数字にアレルギーがある人はAランクの解説までを読めば、その分析が何をしているのかのおよそのイメージがつかめます。それだけでも、単に数字の結果を眺めていたときよりは、格段に分析法についての理解が深まるでしょう。数式にアレルギーがある方は、各分析法のはじめの方の数式で書かれていないところの解説だけを読めばよいのです。

②手元にデータがあるが、どう分析したらよいかわからない人。
分析して何が得られるかわからない人。
私は大人のための数学教室「和」で教えていますが、ここにはデータ分析すべき資料を持っているにもかかわらず、どう分析してよいかわからないという方が多く尋ねてこられます。「統計駆け込み寺」のような状態で、スタッフは大忙しです。統計ソフトは持っているけれど、どの分析法を用いてデータを解析すればよいかわからないという人は意外と多いのです。
このタイプの方にまず読んでほしいのが第1章です。
第1章は、この本の概略をつかむためのマップになっています。本書で扱われるすべての分析法が簡潔な説明で紹介されています。
分析の目的とデータの種類によって分類されていますから、手元に解析すべきデータがあるがどうしたらよいかわからないという人にとっては大きな指針を得ることができるでしょう。そのうえで第3章以降の章のはじめを読むとよいでしょう。

③多変量解析のソフトを使ったことがあるが、中身で何をしているかがわからないので知りたい人。多変量解析の原理を確認したい人。
原理を確認したいと思って多変量解析の本を読んだけれど、難しくて途中で挫折したという人もいるでしょう。この本は多変量解析の原理が書いてある本の中では一番わかりやすい解説が書かれていると思います。
3のタイプの方は、まず第2章で基本事項を確認してください。
第2章では、1変数の統計量と確率変数の公式を簡単に紹介します。
1変数の統計量についての知識は、第3章以下の多変量についての解説を読むために必要な統計学の基本的知識です。この本だけで内容がわかるように充足的に書きましたが、たっぷりとした説明を読みたい人は拙著『意味がわかる統計学』(ベレ出版)を参照してください。
確率変数については、読者が知らないことを前提に、はじめから丁寧に書きました。他の本では確率変数を実感できなかった人でも、確率変数がどういったものであるかがわかるようになるでしょう。
次に、第3章以降の各分析法の「具体例による実践(B)」「結果の数学的な意味(B)」「数式による裏付け(C)」の部分まで読み込んでください。
具体例は、手計算で計算を追いかけることができるように簡単な例を作って解説しています。具体的な数の四則演算を用いた説明ですから、中学数学を学んだ人なら追いかけていくことができるはずです。統計分析ソフトがブラックボックスであると感じていた人でも、分析結果に親しみが持てるようになるでしょう。
分析の数学的な裏付けが知りたい方は、ぜひCランクまで読んでください。しかし、Cランクの記述であっても、読者が高校の文系数学修了者(高校の数IIBまでの微積は修了)であることを想定して解説しています。
高校数学を超える部分についてわからない概念・用語があれば、その都度第9章の数学的準備を参照しながら読み進めてください。
ベクトル、行列、微積分といった大学で習う数学については第9章で補足してあります。他の本を引用することなく、この本だけで最低限は理解できるようにしてあるところがこの本の特徴です。この第9章は、大学数学から多変量解析に必要な数学だけを抜き出して書いてありますから、コストパフォーマンスもよいでしょう。
多変量解析で一番有名なのが回帰分析でしょう。Excelにもパッケージとして組み込まれています。ですから、回帰分析については、このExcelの結果が原理的にさかのぼって完全に理解できるように解説しました。回帰分析について掘り下げて理解することで、他の分析法の統計的理解も深まります。
この本の特徴をまとめておくと次のようになります。

この本の特徴

①数式を使わなくても分析法のエッセンスがつかめる。
②多変量解析についての俯瞰図を得ることができる。
③多変量解析に必要な大学で習う数学はすべてこの本の中で解説してある。
④Excelの回帰分析について、操作法がわかり、その結果の意味が原理にさかのぼって理解できるようになる。

石井 俊全 (著)
出版社 : ベレ出版 (2014/6/23)、出典:出版社HP

目次

はじめに
第1章多変量解析のマップ
1データの分類と分析の目的
相関分析
予測(数値を予想)
単回帰分析
重回帰分析
数量化I類
4判別(カテゴリーを予測)
判別分析
数量化III類
5データの要約外的規準のない分析
量的データのとき
質的データのとき

第2章統計・確率の準備
1 1変量の統計用語
2確率変数の公式
確率変数と期待値
確率変数の和、積

第3章相関分析
1ピアソンの積率相関係数
量的データどうしの関連性を測る
1相関係数は単位によらず一定
2相関係数は直線の傾きとは関係ない
3 2次の関係は見落としてしまう66
4相関係数と因果関係
2相関比—量的データと質的データの関連性を測る
3クラメールの連関係数―質的データと質的データの場合
クラメールの連関係数が1になる場合
4スピアマンの順位相関係数—順序尺度と順序尺度の場合

第4章回帰分析
1単回帰分析―説明変数が1個の場合
2回帰分析の精度を測る―決定係数
3回帰直線の精度を測る―分散分析
検定の考え方
4回帰係数、切片、予測値の推定
予測値の区間推定
a,b,yiの区間推定の理論的背景
5重回帰分析―説明変数が2個以上の場合
多重共線性

第5章判別分析
1線形判別分析
2マハラノビスの距離
Columnロジスティック分析

第6章主成分分析
1 2変量の主成分分析
高校数学の範囲で
線形代数を用いて
2 3変量の主成分分析

第7章因子分析
1因子分析と主成分分析の違い
2 1因子モデル
3 2因子モデル
4主因子法
5因子の回転

第8章数量化分析
1数量化I類
2数量化Ⅱ類
3数量化Ⅲ類

第9章数学的準備
1ベクトル
ベクトルの1次結合と斜交座標
ベクトルの内積
内積と新座標の目盛
2微積分
偏微分
ラグランジュの未定乗数法
3線形代数、
行列
行列の計算
行列の積
対称行列と転置行列
逆行列と行列式
回転の行列と直交行列
固有値・固有ベクトル
対称行列と対角化
多変数関数の微分

おわりに

石井 俊全 (著)
出版社 : ベレ出版 (2014/6/23)、出典:出版社HP