【機会学習とは】3種類の学習方法や使い分け、5つのアルゴリズムにも注目!

Apple製品の代名詞と言えば、やはり「iPhone(アイフォン)」ですよね。
このiPhoneですが、「Siri(シリ)」による音声コントロールに始まり、顔認証技術の「Face ID(フェイスアイディー)」や、指紋認証システムの「Touch ID(タッチアイディー)」など、実はAiの技術を結晶した製品だということをご存知でしょうか。
今回は、Aiにおける基礎知識として「機械学習」にスポットをあてて、その種類やそれぞれの学習アルゴリズムなどについてをわかりやすく解説し、Siriが私たちの顔や声を正確に認識できる謎に迫っていきましょう。
目次
機械学習とは
Aiは、入力された膨大なデータを瞬時に学習・分析することで、それらのデータ群に内在する共通項や規則性を発見し、最適な回答を見つけ出したり、カテゴリ別に分けることなどを得意としています。
こうしたAiによる一連の学習活動を「機械学習」と呼び、この機械学習には、入力するデータのタイプや環境状況に応じて、主に3つの種類が存在します。
機械学習の3つの種類
①教師あり学習
教師と言うと学校の先生などをイメージするかもしれませんが、Aiの分野における教師とは「正しいデータ(=以下、正解データ)」を意味する言葉となります。
コンピュータに対して大量のデータと一緒に正解データを入力することで、コンピュータは入力データと正解データそれぞれのデータの特徴を読み取ります。
この学習を繰り返すことで、コンピュータは入力されたデータのうち「どのデータが誤りで、どのデータが正しいか」を正確に判断できるようになるのです。
②教師なし学習
教師なし学習とは、先ほどの教師あり学習とは異なり、膨大な正解データの分析を必要としない入力データのみの学習パターンになります。
正解データを学習しない代わりに、膨大な入力データそれぞれが持つ構造や特徴を分析し、カテゴリ別にグループ分けを行ったり、要素の簡略化を行ったりします。
入力されたデータに対してコンピュータ自身がそれぞれのデータの共通項や規則性を見つけ出し、カテゴリ別に分けていく学習パターンです。
③強化学習
強化学習とは、簡単に言うと「コンピュータがとる行動の方針を最適化する仕組み」を学ぶという、トライ&エラー型の学習手法になります。
コンピュータが良い行動をとると高い報酬を、逆に悪い行動をとると低い報酬を与えるよう行動の結果ごとに報酬の値を設定し、その報酬を「最大化」するように機械は試行錯誤を行ってくれるため、コンピュータ自身が自分の学習を強化していくことで精度を上げていくという仕組みになります。
さらに現在では、この強化学習と「ディープラーニング(深層学習)」という学習手法を組み合わせた「深層強化学習(DQN)」が、強化学習の中でも主流となっています。
囲碁の世界チャンピオンを倒した囲碁Ai「AlphaGO(アルファゴー)」にも、この深層強化学習が活用されています。
機械学習における『教師あり学習』と『教師なし学習』の使い分け
教師あり学習は、入力データと正解データをセットで読み込ませるため、ある特定の画像やテキストなどを判別する際に役立ちます。
例えば、がん患者の大小さまざまな細胞画像を正解データとすることで、受診者の細胞を正確に判別することが可能になるため、がんの早期発見や早期治療に役立ちます。
対して教師なし学習は、正解となるデータが存在しないため、膨大な数のデータをそれぞれの共通項に分類したり、規則性に沿ってカテゴライズする際に重宝します。
これは、企業の保持している顧客データなどのビッグデータに応用することで、顧客のニーズやユーザー行動の分析が可能になるため生産性の向上に繋げることができます。
このように、教師あり学習と教師なし学習それぞれにメリットとデメリットが存在するため、導入の際にはAiの利用用途を吟味した上で検討しましょう。
機械学習で利用されるアルゴリズム
上述した3種類の機械学習手法ですが、その中でもさらに細かいアルゴリズムによる分類が存在します。
ここからは、機械学習の際に用いられる、主なアルゴリズム5つを確認していきましょう。
分類(=教師あり学習)
教師あり学習の一つで、「分析したい入力データが属するカテゴリーやクラスが何なのか」を判定する手法。
回帰(=教師あり学習)
教師あり学習の一つで、「売り上げや成長率といった数量を扱う場合の学習方法」で、過去の顧客データから新規顧客が今後どのくらい訪れるのかなどを予測することができます。
クラスタリング(=教師なし学習)
教師なし学習の一つで、「類似するデータ同士を機能やカテゴリごとに分けて集める」という、回帰の教師なしバージョンのような学習手法です。
次元削減(=教師なし学習)
教師なし学習の一つで、機械学習でも特徴量が不必要に多すぎると、いわゆる「次元の呪い」という現象が起こり、精度が悪くなることがあることから、データの次元(特徴量の数)を減らす手法になります。
異常検知
機械の故障やデータ分析の外れ値などのコンピュータ数値における異常を検知・推測する際に利用する手法です。
■まとめ
一口に機械学習とは言っても、Aiの利用目的や導入先の環境などによって適切な学習方法や採用すべきアルゴリズムは異なります。
Aiの導入を検討されている場合、まずは導入の前に、自身のAi活用の目的をしっかりと確認することが重要です。
そもそもAiには「何ができて何ができないのか」を深く理解することで、導入による無駄な工数の発生やリスクを回避することにも繋がるでしょう。