機械学習の予測モデルとは？予測モデルの種類・作り方・事例紹介

総合情報サイト / AI活用事例・AI導入事例 / 機械学習の予測モデルとは？予測モデルの種類・作り方・事例紹介

機械学習の予測モデルとは？予測モデルの種類・作り方・事例紹介

ここ数年で急激に浸透したAI。私たちが知っているサービス以外にも、ビジネスの様々な分野で活用が進んでいます。 AIをビジネスに活用するメリットの1つとして、「予測」が挙げられます。需要や売上の予測など、AIを使うことであらゆる予測が可能です。本記事では、AIの機械学習でどのような予測ができるのか、予測の導入事例をご紹介します。

機械学習の予測は2種類

機械学習の予測について解説する前に、簡単にAIと機械学習についておさらいしましょう。

機械学習とは、AIがデータを分析する方法の1つです。
機械学習を行うことで、AIはデータの中から法則性や類似性を見つけ出します。これら学習結果を元に、与えられたデータに対して一定のアウトプットを出すという仕組みで動いています。

与えるデータの種類によって、機械学習は大きく3つに分類されます。
1つ目が「教師あり学習」、2つ目が「教師なし学習」、3つ目が「強化学習」です。

「教師あり学習」は、入力されたデータに対して予測を行う手法です。
予測の種類によって、教師あり学習はさらに「分類」と「回帰」に分けられます。それぞれどのような予測が可能なのか、詳しくまとめました。

分類

分類とは、あるデータがどちらのクラスに属するのか予測するモデルのことです。
例えば、様々な犬の画像を犬グループ、猫の画像を猫グループとしてAIに機械学習させます。このAIに犬の画像を入力すれば、犬グループなのか猫グループなのか、予測・分類できるというわけです。

ビジネスにおいては、新商品の購入予測に活用できます。
新商品がどれくらい売れるか予測したい場合、AIに様々な顧客の購入履歴のデータを機械学習させます。
このAIに新商品のデータを入力すれば、どれくらいの顧客が「購入グループ」に属するのか予測が可能です。

回帰

回帰とは、数値を予測するモデルのことです。正確には、連続する数に対して次の値を予測する仕組みになっています。
例えば、過去の気温データを機械学習すると、未来の気温を予測することが可能です。ビジネスでは、過去の売上から未来の売上を予測するといった活用方法があげられます。

同じ機械学習を使った予測でも、モデルによって予測できる対象は大きく違います。
分類は振り分けるもの、回帰は数値を予測するものと考えるとわかりやすいでしょう。
機械学習の予測モデル

機械学習を使った予測には、予測の種類によって「分類」と「回帰」の2つがあると解説しました。
実は、分類と回帰にもいくつかの分析手法があります。ここからは、分類型と回帰型の2つに分けて予測モデルをご紹介していきます。

【分類型】ロジスティック回帰分析

ロジスティック回帰分析とは、いくつかの変数から、対象が2つのグループのどちらに属するのか予測する手法のことです。
「変数＝対象が持つ特徴」と考えるとわかりやすいかもしれません。

例えば、ある学生がA大学に合格する確率を予測するとします。
この場合、合否に関係する変数は「1日の勉強時間」や「部活の有無」、「1日のスマホの利用時間」などになります。

AIには、A大学に合格した学生と、不合格になった学生の変数を機械学習させます。
このAIにある学生の変数を入力すると、学習した法則性を元に合格率を予測することが可能です。

【分類型】決定木（デシジョン・ツリー）

データを使って樹形図を自動的に作成するのが、決定木（デシジョン・ツリー）です。
樹形図とは、樹木のように枝分かれした形の図のことをいいます。順列や組み合わせといった、起こりうる全てのパターンを数える際に活用できる図です。

例えば、ある店舗でアイスクリームが購入される確率を予測したいとします。
購入確率を予測するため、AIには「平日か休日か」「晴れか雨か」といったデータを与えます。決定木ではこれらのデータを樹形図で整理し、それぞれの分岐での購入確率を予測することが可能です。

【分岐ごとの購入確率】
・平日で晴れの場合：17.6%
・平日で雨の場合：7.1%
・休日で晴れの場合：66.6%
・休日で雨の場合：25%

休日で晴れの場合が最も購入確率が高く、平日で雨の場合最も低くなることがわかりました。
このように、様々な組み合わせの結果を予測するときに役立つ手法です。

【分類型】ランダムフォレスト

ランダムフォレストは、決定木を応用したような機械学習モデルです。
決定木は、起こりうる全ての組み合わせを自動で予測するモデルでした。ランダムフォレストでは決定木をたくさん集めて統合し、より精度の高い予測を出します。
それぞれの決定木の予測結果を集め、最終的に最も予測が多かった結果を予測として出す、多数決のような仕組みです。
決定木は単体だと予測精度があまり高くないため、複数の決定木を組み合わせて精度を上げています。

【分類型】サポートベクターマシン（SVM）

サポートベクターマシンとは、グラフ上でデータを2つのグループに分割する境界線を見つけるための手法です。

例えば、体の特徴から鳥の種類をA種とB種の2つのグループに分類するとします。
サポートベクターマシンでは、まずX軸とY軸のグラフでデータを分類します。X軸を「体の大きさ」、Y軸を「羽の大きさ」として分類してグラフを作ります。
このグラフにおいて、どこがA種とB種の境界線になっているのかを見つけるのがサポートベクターマシンです。
体の大きさが境界線になっている場合は垂直な直線になりますし、羽の大きさと体の大きさが境界線になっている場合は斜めの直線や曲線になります。
この境目となる直線や曲線のことを「決定境界」と呼びます。サポートベクターとは、決定境界に最も近いデータ点のことです。
サポートベクターまでの距離が近すぎると誤判定を招くおそれがあります。そのため、2つのグループを正確に分けられる上、決定境界とサポートベクターが最も遠い必要があります。
サポートベクターまでの距離が遠くなるように決定境界を決める手法が、サポートベクターマシンです。
決定境界が決まれば、後は分類したいデータが直線のどちら側にあるかによって振り分けできるというわけです。

【回帰型】単回帰分析・重回帰分析

回帰分析とは、ある要素が結果に対してどれくらい影響しているのかを予測する機械学習モデルのことです。
予測したいデータのことを「目的変数」、その結果を起こす原因のことを「説明変数」と呼びます。
例えば、広告宣伝費をかけて商品Aの売上が伸びるかどうか予測したい場合、商品Aの売上が「目的変数」、広告宣伝費が「説明変数」になります。

説明変数が1つのモデルを単回帰分析、複数の説明変数で1つの目的変数を予測するモデルを重回帰分析と呼びます。
先ほどの例だと、広告宣伝費や商品価格、販売経路などから商品Aの売上を予測するのが重回帰分析です。
機械学習で予測するメリット

AIを利用せずとも、過去のデータや経験から予測することは可能です。
AIを使って予測するメリットはどこにあるのでしょうか。AIを使った予測をビジネスに活用するメリットをまとめました。

将来収益が予測できる

機械学習を使った予測のメリット1つ目は、将来収益の予測ができる点です。
AIを使えば商品の需要を予測したり、新商品の購入確率を予測することができます。
月額制のサービスであれば解約率を元に、数ヶ月後の売上予測を立てることも可能です。
売上予測に応じた人員配置や、解約抑止のための戦略を練るなど、新しいアクションもとれます。
もちろん、過去のデータを使えばAIなしでも大まかな将来収益は予測できます。
ですが、AIならあらゆるデータを組み合わせ、最も確率の高い予測を算出することが可能です。
小売業であれば、市場規模や競合の販促スケジュール、季節トレンドなど、自社のデータ以外を組みわせて算出できます。

営業の優先順位が決められる

機械学習の予測メリット2つ目は、営業の優先順位が決められる点です。
アウトバウンド営業において、どの見込み顧客に時間をかけるべきか、優先順位の見極めを課題に感じたことはないでしょうか。
限られた時間を使って営業をかける以上、より購入につながりやすい顧客にアプローチしたいと考えるのは自然です。
こうした営業の課題は経験を積むしかないとされてきましたが、AIの予測を使えば解決できます。
AIには、営業先企業の従業員数や業種、契約にいたった顧客情報、営業の活動結果といったデータを機械学習させます。
そこから商材ごとの購買確率を予測し、見込み客ごとの営業優先順位を算出するのです。
少ない工数で費用対効果を最大限に高められる他、売上予測を元に採用を行うなどの活用方法もあります。

社内のリソース管理ができる

機械学習の予測メリット3つ目は、社内リソースの管理がしやすい点です。
少子化が進む日本において、人手があり余っている企業は珍しいでしょう。
限られた人数で業務を円滑に遂行するためには、いつどのくらい人手が必要なのか、先回りすることが欠かせません。
AIを使えばイベントの集客人数を予測したり、機械の故障を予測したりすることができます。
曜日別や時間帯別に必要な人数を把握することで、その日・その時間帯だけ近隣店舗から応援を呼ぶといった対応も可能です。
最小限の人数で最大の成果を出すためにも、機械学習を使った予測が重要といえます。
機械学習の予測手順

さまざまなメリットがあるAIの予測。
具体的には、どのような手順でAIは予測を行っているのでしょうか。AIを導入するまでの流れや、予測を算出する方法を簡単にまとめました。

1.課題を要件定義する

AIを動かす前に決めなければならないのは、AIを使って解決したい課題の定義です。
必要な機能や要求を事前に決めておくことは、一般的に要件定義と呼ばれます。
要件定義をせずに始めるとあれもこれもと要望が増え、当初の目的から外れた機能を実装してしまったり、コストが膨らんでしまいます。
こうした問題を防ぐためには、AIで解決したい課題を明確にしておくことが重要です。

2.データの準備・前処理をする

要件定義ができたら、AIに学習させるデータを準備します。
AIはデータを機械学習することで、データの法則性や予測の算出ロジックを学びます。そのため、予測に必要なデータをあらかじめ用意しておく必要があります。
過去の売上データや気象データなど、予測したい内容によって必要なデータは変わってきます。
また、集めたデータがそのまま使えるケースは稀です。データの形式がバラバラであったり、データ内の数値に欠けがある場合がほとんどです。
これら不揃いなデータは、AIに学習させる前に手直ししておく必要があります。この手直しの工程を「前処理」と呼びます。
データの前処理は作業工程の8割を占めるともいわれるほど、重要な工程です。詳しいデータの前処理方法については、こちらの記事で解説しています。

チュートリアル記事を読む
 MatrixFlowの詳細を見る

3.予測モデルを構築する

データの前処理が完了したら、いよいよAIの予測モデルをつくっていきます。
学習したデータからどのように予測を算出するのか、アルゴリズムと呼ばれる仕組みをつくる工程です。
前述のように、AIにもさまざまな予測モデルがあります。どの予測モデルを使うのか、複数のモデルを組み合わせるのかなど、用途に合わせて予測モデルを構築していきます。

4.予測モデルを評価・検証する

予測モデルが構築できたら、テストデータを使って検証を行います。
条件を変えて複数回検証を行い、求める数値が出てきたら現場に導入するという流れです。
多くの場合、現場導入後も最新のデータを学習させて予測精度を高めるなど、予測モデルの改良が進められます。
機械学習の予測事例5選

機械学習を使った予測事例を5つご紹介します。

・インフルエンザの流行予測
・ペットの病気発症予測
・タクシーの需要予測
・囲碁やチェスの対局予測
・検索意図の予測

インフルエンザの流行予測

機械学習を使った、インフルエンザの流行予測サービスをご存知でしょうか。
インフルエンザは毎年約1,000万人が罹患している病気で、経済損失は6,600億円とも言われています。
一度羅漢すると完治まで大人で1週間程度、免疫の低い子供の場合はそれ以上の時間がかかります。
それまで学校や仕事を休まなくてはならないとなると、生活にも支障が出てしまいますよね。
こうしたインフルエンザにまつわる課題を解決すべく、大手電機メーカーと損害保険会社が共同開発したのがインフルエンザの流行予測です。天気予報と同じように、インフルエンザの流行も予測できればという思いから開発されました。
AIには、全国4,000カ所以上の医療機関からインフルエンザの患者数のデータを機械学習させます。そこから患者の発生パターンを割り出し、どこでどのくらいインフルエンザが流行するのか4週間先まで予測します。
4週間先までわかれば、事前に予防することも可能です。
予防接種を受けた場合、体内に免疫ができるまで約2週間といわれています。インフルエンザの流行予測があれば、予防接種を受けて流行に備えられます。
医療機関においては、流行予測を元にシフトを変更したり、必要な機材を事前に用意しておくことが可能です。
また、ドラッグストアや薬局では、流行のピーク前にマスクや消毒液、薬の仕入れ量を増やすといった活用もできます。

ペットの病気発症予測

犬は人間の約6倍〜7倍の早さで年をとるといわれています。
少しでも長く生きてもらうには病気の早期発見が大切ですが、言葉を話せない分、病気に気付かず手遅れになってしまうこともあります。
愛犬が病気にかかるリスクや可能性を事前に予測できればと、一度は考えたことがあるのではないでしょうか。
実は、AIを使えばペットの病気を予測することができるのです。
大手ペット保険会社が開発したAIは、ペットの顔写真から1年以内に病気にかかる可能性を予測することができます。
AIにはまず、同社のペット保険に加入後保険金請求があった犬の顔写真と、請求がなかった犬の顔写真を学習させます。ここから、病気を発症した犬と発症しなかった犬の特徴を学ぶのです。
顔写真だけでなぜ病気にかかるとわかるのか、不思議に感じる方も多いかもしれません。
犬は人に比べ、遺伝が原因で発症する病気が多くあります。病気を引き起こす遺伝的な特徴は目や耳といった外見にも現れるため、顔写真から病気の予測ができるというわけです。
実際に、トイプードルの顔写真を病気の発症有無でAIに分類させたところ、約70%の精度で病気の発症確率を予測することができました。

タクシーの需要予測

あるタクシー会社は、大手通信会社と共同でAIを使ったタクシー配車の需要予測を行いました。
タクシーは、天気や曜日、時間帯などあらゆる環境要因で需要が変化します。
タクシー全体として空車があっても、時間帯や場所で予約が重なると配車待ちが発生し、機会損失を招いてしまいます。
加えて、経験豊富なベテランドライバーは利用者が多いエリアにあたりをつけられますが、経験の浅いドライバーにはそうした知見がありません。
そこで、エリアや天候、曜日、イベントの有無によって30分後の配車を予測するAIが開発されました。
タクシードライバーはタブレットAIの配車予測を確認し、予測に応じて配車を実施します。
配車までの待ち時間が短縮され、利用者にとっても満足度が高まるサービスとなっています。

囲碁やチェスの対局予測

ビジネスだけでなく、囲碁やチェスといったゲームの世界にもAIは進出しています。
これまで、ボードゲームは複雑な戦略的思考を必要とするため、AIが人間に勝つのは難しいといわれていました。
特に囲碁は、ボードゲームの中でも局面数が多いのが特徴です。その局面数はチェスの3倍、オセロの6倍ともいわれており、はるかに多くの可能性を考えなければならないことがわかります。
ですが、大手検索エンジンサービスが開発したAIは、世界最強と呼ばれるプロ棋士に連勝しました。
複数のプロ棋士と対戦しても結果は変わらず、AIを囲碁の世界から引退させたほどです。
AIがプロ棋士に勝利した理由は、過去の棋譜データを機械学習したこと、AIが自分自身と数千万回にわたって対戦を繰り返したことが挙げられます。
あらゆるパターンをすさまじいスピードで検証することで、どの局面においても勝利できるパターンを学習することができます。
また、AI自身が統計的に勝つ確率の高い一手を予測し、戦況をさらに有利に運びます。
同社はプロ棋士に勝利したAIの進化版も作成しており、わずか数時間の学習で将棋・チェス・囲碁で世界一になったとのことです。

検索意図の予測

わたしたちが毎日使っている検索エンジンにも、機械学習の予測が使われています。
検索エンジンはわたしたちが知りたいであろう情報を予測し、それらを検索結果としてかえしています。
例えば、わたしたちが間違った漢字やスペルで検索した場合、正しい表記の検索結果が表示された経験はないでしょうか。
これは間違った表記で検索した後、ユーザーが検索し直した結果をAIが学習しているからです。
また、サジェストキーワードと呼ばれる、検索窓の下の検索候補にもAIが利用されています。
AIがあるキーワードを入力した後によく検索される言葉を学習し、予測として表示するという仕組みです。
なお、これらは検索エンジンだけでなく、サイト内でのキーワード表示にも活用されています。
大手ECショップでは、検索されたキーワードに関連するキーワードを検索窓の下に表示しています。
例えばアウターと検索した場合、ジャケットやコートといったカテゴリや、ロングコートやダウンコートといった細かい種類を表示します。
関連するキーワードを表示することで、ユーザーが探している商品を見つけやすくし、売上につなげる狙いです。
AIが手軽に導入できる「MatrixFlow」

AIを導入するにあたって気になるのは、コストと導入までの手間ではないでしょうか。
いくらメリットが多くても、導入に数千万円かかったり、導入まで数年かかるとなっては諦めざるを得ません。
AIにも様々な種類がありますが、AIを手軽に導入できるサービスとして「MatrixFlow」をご紹介します。
MatrixFlowの特徴は、AI導入までのコストと手間を最小限に抑えられる点です。

一般的にAIを構築するには、プログラミングスキルが必須になります。
どのような予測モデルを使って結果を算出するのか、プログラミングによってAIのアルゴリズムを組むからです。
ですが、MatrixFlowではこのプログラミング工程を省くことができます。
正確には、画面上での操作がプログラミングと連動しており、MatrixFlow側がプログラミングをしてくれているのです。

さらに、MatrixFlow内には解決したい課題に応じたAIのテンプレートが用意されています。
一からAIを構築しなくても、自社の課題に近いものをカスタマイズして時間を短縮することが可能です。
このように、AI構築までにかかる時間を大幅に削減することができ、導入から実装まで最短で行えます。
MatrixFlowについては、こちらのお問い合わせフォームからご連絡ください。

チュートリアル記事を読む
 MatrixFlowの詳細を見る