エンジニアなら知っておきたいAIのキホン 機械学習・統計学・アルゴリズムをやさしく解説

【最新 – AI・人工知能について学ぶためのおすすめ本 – 基礎知識からビジネスでの活用まで】も確認する

AIの情報をキャッチアップする

人工知能(AI)は急速に発展しており,様々な産業での活用が期待されています。しかし、AIを正しく理解していない人が意外に多いことも事実です。そこで、本書は、AIのことをあまり知らない方に向けて、人工知能を支える技術を理解し,大まかな全体像を把握できるように書かれています。

はじめに

ここ数年の人工知能(Artificial Intelligence)の進化と活用はすさまじく、今、AIを理解して活用しようと踏み出さないことは、3年後、5年後のビジネスにおいて大きなリスクと言えるでしょう。
ここらで一度、本気でAIについて理解し、積極的に関わってみませんか。え、「今さら遅いよ」ですって? いやいや、まだ大丈夫です。AIの進化は著しく、昨日までの知識は瞬く間に古くなってしまうので、今からでも十分にキャッチアップできます。
急速な発展を遂げつつある分、AIの情報は断片的に散らばっており、かつ同じような内容があちこちで流用されています。また、数式の説明に終始して、一般の人たちがAIを理解・活用するには役立たない情報も氾濫しています(それが悪いわけではないのですが、あくまでも一般の人には無用な情報です)。
セミナーに参加したり本を読んだりしても、AIが本質的にどういうものなのか、AIの得意なこと苦手なこと、ビジネスに活かすイメージなど、一番重要なところまでの説明がありません。結果、AIは難しいものと尻込みしたり、逆になんでもできそうだと過度に期待したり、AIの進化をむやみに恐れたり、AIでないものもAIと呼んだりと、かなりごちゃごちゃになっています。

本書は「AIのことをなんとなくしか知らなかった人が、パッと全体像を把握できて、ベースとなっている技術も一通り理解して、今何が起きていて、これからどうなりそうかイメージできる」ことを目指して書いています。
分かりやすく「ドクターX」ライクでお伝えすると次のような感じです。

第1次ブームからのAIの歴史についての物語を語る…「いたしません!」
AIの仕組みについて数式や統計学を徹底的に解説する…「いたしません!」
AIライブラリの仕組みや使い方を解説する…「いたしません!」
ベンダ発信のデータを元に、どちらが優れているか比較する…「いたしません!」
AIが人間の仕事を奪って不幸をもたらすかの道義的論争…「いたしません!」

でも、こうなると「じゃあ、何を書くんだよ!」と言われてしまいそうですね。本書で取り上げる主な内容は、次のようなことがらです。

・近年のディープラーニングの劇的発展から現在までの状況を把握する
・現在提供されているAIサービスを知ることで、今後の進化を思い描く
・機械学習アルゴリズムとディープラーニングの本質的な違いを理解する
・最新のAI技術を知り、今後の社会における活用イメージを持つ
・AI技術が3~5年後のビジネスでどのように活用されるかを想像する

本書は、基本的には「これからAIに取り組むエンジニア」もしくは「既にAIに取り組んでいるエンジニア」向けに、AI技術の基礎知識を理解し、AIを大局的に捉えられるように書いていますが、もっと幅広く「一般の方でもAIについて理解できるように」という思いから、全体を3部構成としました。
第1部では人工知能の基礎を理解します。第2部で技術的なところを少し掘り下げ、第3部でビジネスに活用するためのAIを学びます。数式を使って局所的な技術を説明するのは避け、難しいところは例え話で解説しています。

なお、AI(人工知能)に機械学習が含まれ、機械学習の一部が深層学習(ディープラーニング)なのですが、これらの言葉の一般的な定義の説明は省いています。その代わりに言葉の持つ本当の意味や違いに関して掘り下げて書いていますので、どうか上っ面ではなく本質的なところを理解してください。

また、せっかくなので楽しく学んでいただきたいと思い、麻里ちゃんというキャラクターにも登場してもらいました。麻里ちゃんが、だんだんAIについて詳しくなってゆくのに負けないように、みなさんも頑張ってください。みなさんのAIに関する理解が深まることに役立っていただければとても嬉しく思います。

2018年12月
梅田弘之

contents

はじめに

第1部 人工知能の基礎を理解する
第1章 人工知能の全体像
人工知能の全体像(Overview)/ディープラーニングの歩み
[麻里ちゃんのAI奮闘記] AIやるのに、高等数学や統計学の勉強はMustか?

第2章 AIチップとライブラリー
ムーアの法則の終焉/AIチップ/エッジコンピューティング/機械学習ライブラリ/オープンソースライセンス(OSS)/主な機械学習ライブラリ
[麻里ちゃんのAI奮闘記] 量子コンピュータってどんな状況なの?

第3章 AIプラットフォーム
AIプラットフォームとは/Google Cloud Machine LearningとMicrosoft Cognitive Services [麻里ちゃんのAI奮闘記] りんな

第4章 機械学習とディープラーニングの違い
機械学習とは/ミニバッチ学習法/ホールドアウト法/正解率と再現率と精度/過学習と汎化誤差/バリアンスとバイアス/アクティブラーニング/機械学習とディープラーニングの違い/ニューラルネットワークとは/シグモイドニューロン/シグモイドニューロンの階層/誤差逆伝搬(Back propagation)/機械学習アルゴリズムとディープラーニングの違い
[麻里ちゃんのAI奮闘記] ニューラルネットワークは階層構造

第5章 機械学習の学習データー
学習データはどれくらいの量が必要か/データクレンジング/データクレンジングの自動化/学習データを用意する方法/ImageNetとILSVRC/学習済みモデル(Pre-trained models)
[麻里ちゃんのAI奮闘記] 学習データの品質とは?

第6章 転移学習と過学習
少ないデータで学習する方法/水増し(Data Augmentation)/水増しの注意点/転移学習(Transfer learning)/転移学習の方法/過学習を防ぐ技術/正則化(Regularization)/ドロップアウト(Dropout)/K分割交差検証/(K-fold cross-validation)
[麻里ちゃんのAI奮闘記] 正則化と回帰の違い

第2部 機械学習のアルゴリズムを学ぶ
第7章 機械学習のアルゴリズム
機械学習法と統計学/3つの学習方法/回帰(Regression)/分類(Classification)/クラスタリング(Clustering)/強化学習/バンディットアルゴリズムとABテスト/Optimism in face of uncertainty/モンテカルロ法
[麻里ちゃんのAI奮闘記] 分類とクラスター分析の違い

第8章 Q-Learning
Q-LearningのQとは/P値(P-Value)とは/多重検定とFWER/FDR/Benjamini-Hochberg(BH法)/Q値(Q-Value)とは/Q-Learningと海戦ゲーム/Q-Learningとは/Qボードへの情報書込みルール/エピソード1/エピソード2/エピソード2の続き/エピソードn/強化学習の構成/強化学習のアルゴリズム/状態行動空間の爆発
[麻里ちゃんのAI奮闘記] 強化学習は試行錯誤

第9章 教師あり学習(回帰と分類)
統計学とアルゴリズム/回帰(Regression)/分類(Classification)
[麻里ちゃんのAI奮闘記] 尤度とシグモイド

第10章 教師なし学習(クラスタリング)
クラスタリング(Clustering)/次元の呪い/次元削減/主成分分析(PCA: Principal Component Analysis)
[麻里ちゃんのAI奮闘記] 次元の呪いと上野の麻辣大学のゴマ団子

第11章 畳み込みニューラルネットワーク(CNN)
畳み込みニューラルネットワーク(CNN)とは/入力層(Input Layer)/畳み込み層(Convolutional layer)/プーリング層(Pooling layer)/全結合層(Fully Connected layer)/出力層(Output layer)
[麻里ちゃんのAI奮闘記] 畳み込みってなに?

第12章 リカレントニューラルネットワーク(RNNとLSTM)
畳み込みニューラルネットワークのおさらい/リカレントニューラルネットワーク/リカレントニューラルネットワークの展開図/リカレントニューラルネットワークが使われる技術分野/長・短期記憶ユニット(LSTM)/単純RNNの長期依存性問題/RNNの構造/LSTMの構造
[麻里ちゃんのAI奮闘記] 人生はリカレントでない方がいい場合もある

第13章 敵対的生成ネットワーク(GAN)
GANとは/GANの現在の実力/潜在変数とノイズ/DCGAN/GANの学習/アップサンプリング/GANの用途
[麻里ちゃんのAI奮闘記] GANの学習は切磋琢磨

第14章 半教師あり学習とオートエンコーダー
半教師あり学習とは/半教師あり学習のモデル/分類器に基づく手法…ブートストラップ法(Bootstrapping)/データに基づく手法…グラフベースアルゴリズム/オートエンコーダー(Auto Encoder)/オートエンコーダーの利用例/VAE(Variational Autoencoder)/半教師ありVAE/Conditional GAN CENGAN)VAEGA
[麻里ちゃんのAI奮闘記] 生成モデルと識別モデルの違い

第3部 ビジネスに活用するための人工知能を学ぶ
第15章 AIをビジネスに活用する際に押えておくべきポイント
非構造化データ(Unstructured data)を処理する目的/人工知能に何を期待するか/人工知能の得意なことと活用分野/ビジネスにAIを活用する分野と脅かされる職業
[麻里ちゃんのAI奮闘記] ERPを取り巻くAI活用

第16章 AIのビジネス活用を業界別に状況把握する
産業別の人工知能活用状況/慈善事業(For Good)/農業(Agriculture)/法曹界(Legal)/ガス・石油業界(Oil&Gas)/医療・ヘルスケア(Medical/Healthcare)/製造業(Manufacture)/EC・小売業(Retail/Commerce)/B to Bセールス&マーケティング(B2B Sales&Marketing)
[麻里ちゃんのAI奮闘記] スマホがビッグデータの鍵となる時代

第17章 RPA(Robotic Process Automation)
RPAの仕組み/RPAに必要な機能/RPAの利用用途/RPAの3つのクラス/RPAの弱点/RPA製品の違い/RPAの今後
[麻里ちゃんのAI奮闘記] RPA導入で失敗するケース