ディープラーニング(深層学習)とは？AI・機械学習との違いを簡単に解説

総合情報サイト / AI活用事例・AI導入事例 / ディープラーニング(深層学習)とは？AI・機械学習との違いを簡単に解説

ディープラーニング(深層学習)とは？AI・機械学習との違いを簡単に解説

ディープラーニング、AI、機械学習。誰しも、テレビや本で一度は耳にしたことがあると思います。ですがこれらが何を指しているのか、なぜ注目を集めているのか知っている方は少ないのではないでしょうか。本記事ではAIを学んだことがない方向けに、ディープラーニングとは何なのかを簡単に解説します。ディープラーニングと機械学習の違いがわからない方や、ディープラーニングの活用事例を知りたい方も必見です。

ディープラーニングとは？機械学習との違い

ディープラーニングと共によく聞く言葉として、「機械学習」や「AI」などが挙げられます。
AIがどんなものかはなんとなく知っていても、機械学習とディープラーニングの違いを説明できる人は少ないのではないでしょうか。
ここでは、AI・ディープラーニング・機械学習の3つの違いを簡単にわかりやすく解説していきます。

AI・機械学習との違い

AI・機械学習・ディープラーニングの違いを理解するには、まず3つの関係性を知るのが手っ取り早いです。図で表現すると、AI（人工知能）の中に機械学習、その中にディープラーニングが含まれているという関係になります。

AI（人工知能）は、人間の脳の仕組みを再現したシステムのことです。学習したり、情報の中から法則性を見つけ出したりといった脳の動きを、機械を使って再現しようとする技術や取り組みのことをいいます。

AI（人工知能）が人間の脳と同じ動きをするために学習することを、「機械学習」と呼びます。
機械学習では、データの中から特徴をつかんで法則化します。例えば、大量の犬の画像をAIに機械学習させた場合、画像の中から犬の特徴をつかんで法則化するのです。犬の特徴を機械学習したAIは、新しい画像を学習した際、法則にのっとって画像が犬かどうか判断できるようになります。これが機械学習です。

一口に機械学習といっても法則性を導き出す方法はいくつもあり、機械学習の中にも様々な手法があります。ディープラーニングは、機械学習の学習手法の内の1つです。ディープラーニングがどのような学習手法なのか、仕組みを見ていきましょう。

ディープラーニングの仕組み

ディープラーニングとは、ニューロンと呼ばれる脳の神経細胞の構造をモデルにした学習方法のことをいいます。このニューロン（脳の神経細胞）の構造を、ニューラル・ネットワークと呼びます。
ニューラル・ネットワークでは、ニューロン（脳の神経細胞）同士が電気信号を使って情報を伝達します。情報は、入力層→中間層→出力層という順番で処理されています。

他の機械学習とディープラーニングが違う点は、機械学習で必須となる「特徴量」をAI自身が見つけ出せる点です。
特徴量とは、AIが物事を認識・判断するための特徴のことをいいます。
先述の犬の例でいえば、犬を犬として認識するため、耳の有無や鼻の形を特徴量として指定する必要があります。犬の中でも犬種を判別したい場合は、耳の有無や鼻の形ではなく、体の大きさや毛の色を特徴量にするかもしれません。

こうした特徴量の指定を必要とせず、AI自身がどの特徴量を参考にすればいいのか判断できるのがディープラーニングです。特徴量の指定という作業が不要になるため、人の作業負担を減らせるメリットがあります。
ディープラーニングの代表アルゴリズム

ディープラーニングには、いくつものアルゴリズムが存在します。
アルゴリズムとは、「どのようなパターンや特徴を発見して学習するか」という計算方法・やり方のことです。代表的な7つのアルゴリズムをご紹介します。

畳み込みニューラルネットワーク（CNN）

畳み込みニューラルネットワーク（CNN）は、画像の中から特徴を見つけ出すのに特化したアルゴリズムです。人間の視覚を元に考案されたため、神経細胞の動きを真似して対象を認識するようになっています。畳み込みニューラルネットワークでは、「畳み込み層」と「プーリング層」といった層を使って学習を進めます。

「畳み込み層」は画像を特徴ごとに分け、その特徴を強調する層のことです。画像の中から、対象を認識するために必要な特徴ごとに切り分けます。「プーリング層」はダウンサンプリングとも呼ばれ、特徴量を圧縮して不要な計算を減らす層のことです。この2つの処理を繰り返し、AIは画像認識を行っています。

再帰型ニューラルネットワーク（RNN）

再帰型ニューラルネットワーク（RNN）は、時系列データを扱えるようにした機械学習モデルのことです。時系列データとは、時間の経過とともに値が変化するデータをいいます。店舗の売上やWebサイトのアクセス数などが代表例です。

ディープラーニングの他の学習モデルと同じように、再帰型ニューラルネットワークでも入力層・中間層・出力層の3つの層を通して学習を進めます。通常、学習の流れは入力層→中間層→出力層の順に行われます。ですが再帰型ニューラルネットワークでは、入力層→中間層→出力層の順に演算結果を伝えるだけでなく、演算結果を自分自身（中間層）にも入力して再演算を行う特徴があります。

LSTM（Long Short Term Memory）

再帰型ニューラルネットワーク（RNN）には、時系列データが長くなると演算結果がうまく伝達できない弱点があります。この弱点を克服すべく生まれたのが、LSTMです。LSTMは「入力ゲート」「出力ゲート」「忘却ゲート」という3つのゲートを使って学習を進めます。各ゲートが情報量の制御を行うことで、LSTMではある程度長い時系列データも処理できるようになっています。

敵対的生成ネットワーク（GAN）

敵対的生成ネットワーク（GAN）はデータから特徴を抽出して学習し、実在しないデータを生成できる学習モデルです。話題になった、実在しない人物の顔写真を作成できるサイトや、写真を有名画家の画風に似せた絵に変換できるサービスにも利用されています。敵対的生成ネットワーク（GAN）は、「Generator」と「Discriminator」という2つの層で構成されています。この2つは、「紙幣の偽造者」と「警官」の役割に例えるとわかりやすいかもしれません。「紙幣の偽造者（Generator）」は紙幣の特徴を学習し、本物に近い偽札を作ります。一方の「警官（Discriminator）」は偽札を偽物であると見抜き、それによって「紙幣の偽造者（Generator）」はさらに精巧な偽札を作り出します。これを繰り返し行い、敵対的生成ネットワーク（GAN）はより本物に近い偽物（実在しないデータ）を作り出せるという仕組みです。

Dropout

Dropoutとは、ニューラル・ネットワークの「過学習」を防ぐ手法のことです。
過学習とは、ニューラル・ネットワークの構造が複雑化し、汎用性の低い学習モデルを作ってしまうことをいいます。簡単に言うと、情報を丸暗記して出力するような状態が過学習です。
当たり前ですが、丸暗記では同じ問題には正解できても、違った問題が出された時に対応できなくなってしまいます。この過学習の状態を解決するための手法がDropoutです。
Dropoutでは、一定の確率でランダムにニューロンを無視して学習を進めます。
これにより、抜けたニューロンの穴を埋めるようにAIが学習を進め、丸暗記ではない法則性を持った特徴を導き出せるようになります。
ディープラーニングでできること

ディープラーニングを使うと、具体的にはどのようなことができるのでしょうか。
ディープラーニングを活用した最新のAI技術をご紹介します。

画像認識

画像認識とは、画像の中から対象人物や文字を認識する技術のことです。
対象を認識・抽出できるようになれば、Aを含む画像・含まない画像といった振り分けをしたり、Aと似た商品を画像の中から探すこともできます。

画像認識はAIに大量の画像を学習させ、特徴を学ぶという流れで行われます。
例えば、AIに犬の画像を判別させたい場合、AIに大量の犬の画像を学習させます。
ディープラーニング以外の機械学習の場合、人間が犬の特徴を入力した上で学習させるという手間があります。一方ディープラーニングでは、AI自身が特徴を学習するため、特徴を入力する必要がありません。
画像認識は、画像検索や自動運転、工場での製品検査などに活用されています。

音声認識

音声認識とは、人が話した言葉をAIが聞き取って理解する技術のことです。AIは、4つの過程を経て音声を認識します。

（1）音響分析
（2）音響モデル
（3）発音辞書
（4）言語モデル

音響分析とは、音の強弱や周波数などから音の特徴量を抽出し、コンピュータが認識しやすいデータに変換することをいいます。特徴量とは、対象の特徴が数値化されたもののことです。

次に音響モデルでは、音響分析で抽出された特徴量を元にどの音に近いか一致率を計算します。
「ありがとう」と言った場合、「A/R/I/G/A/T/O/U」というように音声を文字とマッチングしていきます。音の最小単位である「音素」に分解するともいいます。

音響モデルで音素に分解したら、データベースから音の組み合わせを「単語化」して音声モデルと言語モデルを結びつけます。

最後に言語モデルで、データベースから単語のつながりを予測し、正確な文章を組み立てます。以上が、音声認識の仕組みです。

自然言語処理

自然言語処理とは、コンピューターを使って人の言葉（テキストデータ）を分析する技術のことをいいます。
言葉は文脈でニュアンスが変わったり、語順によって文章の意味が変わるため、複雑な分析を得意とするディープラーニングの技術が使われているのです。自然言語処理では、文を品詞に要素分解したり、要素をもとに単語同士の関係性を判断するといった手法がとられています。大きく4つの流れに分類できます。

（1）形態素解析＝文を動詞や名詞などの品詞に分解する。
（2）構文解析＝文を主語・述語・目的語にカテゴライズする。
（3）意味解析＝（2）構文解析をもとに、単語同士の関係性を判断する。
（4）文脈解析＝前後の文章においても（1）形態素解析や（3）意味解析を行う。

AIがテキストデータを理解することで、翻訳や文字起こしなど従来の機械学習では難しかった分野でもAIの活用が進んでいます。
ディープラーニングの活用事例

画像・音声認識、自然言語処理、システム最適化、異常検知の4つの分野からディープラーニングの活用事例を集めました。身近なサービスから意外なサービスまで、ディープラーニングの事例をまとめています。

【画像認識】画像検索

画像認識の最たる活用事例といえば、検索エンジンの画像検索ではないでしょうか。

自分が持っている画像と似た画像を検索したい場合、画像検索はとても便利です。
AIが画像を認識することで、同じ画像が使われているサイトや、似た画像を掲載しているサイトなどを検索できる仕組みになっています。
類似画像を探すだけでなく、自分の画像が盗作されていないか確認するといった使い方も可能です。
最近では、撮影した写真をその場で検索できる機能が搭載されたスマートフォンも販売されています。
目の前の植物の名前を調べたり、人が着ている洋服のブランドを調べたり、あらゆる使い方が可能です。

また、検索エンジン以外にも、画像認識はオンラインショップで利用されています。
例えば洋服を見ていた場合、見ていた服と似たような形や色の商品をサイト内で探し、表示してくれるのです。
この機能があれば、検索結果から似た商品を探す手間が省けます。
店舗に行かずに比較すべき商品をその場で提案してくれるので、ユーザーにとっては便利な機能です。
オンラインショップにとってもユーザーの離脱を防止し、より商品購入につなげやすいというメリットがあります。

【画像認識】自動運転

ここ数年テレビCMでも取り上げられている車の自動運転。自動運転にも、ディープラーニングの技術が利用されています。

自動運転に使われているのは、「物体検知」と「動体検知」という2つの画像認識技術です。
「物体検知」は歩行者や対向車の検知をすること、「動体検知」は何かが動いていることを認識するための技術です。静止画ではなく、動画版の画像認識ともいえます。対象が動いていることを認識するため、パラパラ漫画のように動画を1枚1枚の静止画で分析し、その差分を比較して人や物が動いていると認識します。動体検知の精度を上げるため、左右に搭載されたカメラで物体を捉えるなどの工夫がされています。

また、自動運転には、0から5まで6段階のレベルが定められています。

　0：運転自動化なし
　1：運転支援
　2：部分運転自動化
　3：条件付運転自動化
　4：高度運転自動化

　5：完全運転自動化

レベル0〜2は、運転者が一部もしくは全ての運転を行う状態です。運転するための物体認識・予測・操縦は運転者が行います。レベル3〜5は、一部から全ての運転が自動化されている状態です。

日本では自動運転レベル3、世界ではレベル4まで実現しています。
アメリカの自動運転開発企業では、アプリで自動運転タクシーを呼べるサービスをリリースしました。リリース当初は補助員が乗車するという条件付きでしたが、現在は完全な無人状態です。日本で普及している配車アプリ同様、アプリで乗車位置や目的地を指定するとタクシーが配車されるという流れです。
完全無人の自動運転タクシーにより、配車する時間帯の制限がなくなり、24時間タクシーを呼べるようになりました。これにより、緊急の場合や車通りが少ない地方でも移動しやすくなるのは間違いないでしょう。

【画像認識】来客数のデータ蓄積

大手商業施設では、ディープラーニングの画像認識を使って人の流れを解析するシステムを導入しています。
同施設内には、各テナント区画ごとに専用のカメラが設置されています。人数計測用のカメラや、年齢・性別を識別するカメラを設置し、来客数や来客属性のデータを取得しているのです。

収集したデータはリアルタイムに各店舗の端末へ送信されます。
各店舗は1日の来客推移や過去の来客数を元に、休憩時間の調整やアルバイトシフトの作成に利用できます。
時間帯や曜日によって来客数の増減や属性変化の法則性がわかれば、商品の構成やディスプレイを最適化するといった活用が可能です。
全てのデータが収集できるオンラインショップと違い、リアル店舗はこうしたマーケティングデータの収集が難しいとされてきました。
ですがこのAIシステムがあれば、オンラインショップと同じようにデータを元にしたマーケティング施策の実行が可能です。
こうしたマーケティングデータは店舗単位の改善だけでなく、施設全体のテナント配置やテナント選定の最適化も期待されています。

【音声認識】スマートスピーカー

ここ数年で家庭に普及しつつあるスマートスピーカーにも、ディープラーニングの技術が使われています。
スマートスピーカーとは、音声で指示した内容を実行できる製品のことです。
例えば、スマートスピーカーに「電気をつけて」と指示すれば、照明のスイッチを押さずに電気をつけられます。これができるのは、スマートスピーカーに「音声認識」と「自然言語処理」の技術が搭載されているからです。

「音声認識」は、音声データをテキストデータに変換する技術のことです。「自然言語処理」は、人の言葉を機械で処理することをいいます。「音声認識」で聞き取った声をテキストデータに変換し、「自然言語処理」でテキストの意味を理解するといった流れです。

とても高性能な製品に感じますが、音声の認識から意味の理解、命令の実行までをスマートスピーカー単体で行っているわけではありません。スマートスピーカーは、クラウドサービス（AIアシスタントとも呼ばれる）と連携して動いています。大まかな流れは以下の通りです。

（1）スマートスピーカーが聞き取った音声をテキストデータに変換する（音声認識）
（2）テキストデータをクラウド（AIアシスタント）に送る
（3）AIがデータを理解する（自然言語処理）
（4）クラウド（AIアシスタント）からの返答を音声で出力する

スマートスピーカーの仕組みを活用すれば、IoT家電の操作や音楽の再生などができます。
IoT家電とは、インターネットにつながった家電のことです。インターネットを通して操作ができるため、スマートスピーカーを使えば電源のオンオフや具体的な操作を指示できます。
また、音楽再生もスマートスピーカーを使った代表的な操作の1つです。アーティスト名や曲名を指定して音楽をかけるのはもちろん、「ゆったりした音楽をかけて」「流行りの曲を流して」など、曖昧な指示もできます。まだまだ操作できるものは少ないですが、今後IoT製品が増えてくれば各家庭の必需品となるかもしれません。

【音声認識】コールセンター

人手不足が叫ばれるコールセンターでも、ディープラーニングを使ったAIの活用が進んでいます。
コールセンターでは応対品質のバラつきや、会話データの利用ができていないなど様々な課題が潜んでいます。こうした課題を解決する方法として、「自動応答（IVR）」や「AIチャットボット」に注目が集まっています。

自動応答（IVR）とは、あらかじめ用意した音声案内を流し、問い合わせを窓口に振り分ける仕組みのことです。荷物の再配達など、音声ガイダンスを聞いて数字を入力した経験のある方も多いでしょう。

この自動応答（IVR）とAIを組み合わせることで、AIがオペレーターをつとめる「バーチャルオペレーター」を実現できます。
バーチャルオペレーターでは、問い合わせの音声をAIが認識し、適切な窓口へ振り分けたり、問い合わせに対して回答が可能です。
よくある問い合わせ内容ならバーチャルオペレーターがそのまま回答し、確認が必要なもの・回答にないものはオペレーターにつなぐといった具合です。
バーチャルオペレーターを活用することで、応対時間の短縮・削減につながり、オペレーターの業務負荷を減らすことができます。

【自然言語処理】自動翻訳

Google翻訳をはじめ、翻訳はインターネット上で簡単にできるようになりました。
ですが、翻訳機能を使ったら不自然な日本語に訳された経験を持つ方も多いのではないでしょうか。

ディープラーニングを活用した自動翻訳では、より自然な言葉に翻訳できます。
ドイツに本拠地を置く企業では、ディープラーニングを使った高度な翻訳サービスを提供しています。
同社の翻訳サービスでは、微妙なニュアンスや口語表現、方言にも対応した精度の高い翻訳と高い評価を受けています。

もちろんプロの翻訳家の翻訳には及ばないものの、AI翻訳と人の翻訳を組み合わせることでかなりの時間短縮が可能です。例えば、普段の業務に翻訳作業がある場合、大まかな翻訳はAI翻訳に任せ、最後のチェックだけ人が目を通すといった工夫ができます。
AI翻訳サービスを使えば、翻訳にかかる作業とコストを劇的に減らし、より高度な業務に社員のリソースを充てることが可能になります。

【自然言語処理】校閲・校正支援

出版業界や広告業界では、AIを使った校閲・校正支援サービスが注目されています。
これまでも校閲・校正支援ツールは存在していましたが、ディープラーニングによって正確で細かなチェックもできるようになりました。

漢字の変換ミスや「てにをは」の誤りといった正しい日本語のチェックだけでなく、会社独自のレギュレーション・ルール違反の確認も可能です。さらに、業界や企業特有の表記や専門用語を学習し、企業ごとの基準に合わせた文章の校閲・校正もできます。

大量の原稿・制作物を確認する企業にとっては、校閲・校正業務が減るだけでかなりの時間削減が可能です。AIが校閲を行うことでヒューマンエラーの防止になる他、ダブルチェックも最小限に減り、人手不足解消にもつながります。AIがベテラン校正者の校閲文章を学習することで、校閲の特徴を法則化し、誰でも高水準な校正作業を行えるようになる点もメリットです。

【システム最適化】商品のレコメンド

オンラインでお買い物をする際、閲覧している商品の下に「あなたにおすすめの商品」が表示されていた経験はないでしょうか。今やオンラインショッピングでは当たり前の光景ですが、商品のレコメンドにもディープラーニングの技術が応用されています。

大手ECサイトでは、高品質かつ素早いレコメンド機能を持っています。
従来のレコメンドといえば、季節や商品の販売進捗によって企業側が販売促進したい商品を提案する場合が大半でした。ですが大手ECサイトでは、AIを使ってユーザーの特性を把握し、ユーザーそれぞれに合った商品をレコメンドしています。

商品Aを見ている人の属性を推定し、よく似たユーザーの購入履歴を元に商品を提案するといった具合です。レコメンドの精度が高いだけでなく、サイト内でのユーザーの行動をリアルタイムにレコメンドの反映できる他、サイトへの訪問や購入が少ないユーザーにも最適な商品を提案できます。

これらのレコメンド機能は商品の提案だけでなく、動画見放題サービスのおすすめ動画の提案にも活用されています。

【異常感知】外観検査

工場や倉庫では、日々部品・商品の検査が行われています。
機械を使って自動検査を行っている企業もありますが、製品の特性によっては人による目視確認が必要なこともあります。
AIのディープラーニングの技術を使って、製品の検査工数を大幅に削減した事例があります。

大手工業製品メーカーでは、従来検査員が全ての製品を目視確認していました。その結果、膨大な作業工数が発生しただけでなく、検査員によって検査品質にバラつきが発生してしまったのです。

これら課題を解決すべく、同社はAIを使った検査システムを導入しました。
AIのディープラーニングを使った検査の場合、検知すべき欠陥を明確に細かく指定する必要がありません。AI自ら学習して新しいルール定義に適応していくことができます。

その結果、AIが欠陥と判断した製品に対してのみの目視検査を実施することで、大幅な作業効率化を実現しました。工数削減、検査品質が平準化しただけでなく、欠陥状態を画像で蓄積できるようになった点もメリットです。
ディープラーニングの導入方法

ディープラーニングを活用すれば、今まで人力に頼っていた作業も高い精度で自動化できます。
とはいえ、AIを自社に導入するのは「ハードルが高い」と感じるのではないでしょうか。
新規でAIを開発・導入するとなると、開発できる人材や知見が必要になりますし、開発してから導入までの時間も考慮しなければなりません。
「そこまでしてAIを導入すべきか…」と悩んでいる方に、おすすめの導入方法があります。
それは、AIプラットフォーム「MatrixFlow」を使った導入方法です。

MatrixFlowは、プログラミングせずに簡単にAIを開発できるプラットフォームです。
AIの開発には通常プログラミングが必須ですが、用意されたテンプレートを使ったり、画面上で視覚的に操作するだけでAIを手軽に開発できます。

AI開発後の機械学習やテストもMatrixFlow内でできるため、AIに関する知見がなくても、画面上で操作するだけで開発から導入まで一貫して行えます。
詳しいMatrixflowのサービス内容については、こちらからお気軽にお問い合わせください。

チュートリアル記事を読む
 MatrixFlowの詳細を見る
ディープラーニングまとめ

・ディープラーニングはAIの機械学習方法の1つ
・ディープラーニングを使うことでより高度な学習が可能
・ディープラーニングの代表例は画像認識・音声認識・自然言語処理
・画像・音声・言葉を認識し、意味や違いを理解できる
・ディープラーニングを導入するならMatrixFlowがおすすめ

ディープラーニングとは何なのか、AIや機械学習との違いから具体的な活用方法を解説しました。

ディープラーニングは、AI（人工知能）の学習方法の1つです。
AIはデータを機械学習することで、データの中の法則性や特徴を学びます。機械学習にはいくつもの学習手法がありますが、その中でもより高度な学習を行えるのがディープラーニングです。

ディープラーニングの活用事例としては、画像認識・音声認識・自然言語処理が挙げられます。
画像認識・音声認識は、文字通り画像の中の物体を認識したり、音声を聞き取って意味を理解する機能のことです。検索エンジンの画像検索や車の自動運転、スマートスピーカーなどに利用されています。

自然言語処理は、文字を理解する機能のことです。AIが自然言語処理をすることで、自動翻訳や文章の校閲・校正ができるようになります。

これら様々な業界・サービスでの活用が期待されるディープラーニング。
導入したいけれどコストや手間が気になるという方には、MatrixFlowを使った導入がおすすめです。
MatrixFlowはプログラミングやAIの知識がない方でも、パソコンの画面上でボタンを操作するだけでAIが作れます。AIの作成、機械学習、アウトプットまでMatrixFlow内で完結できるため、複数人での作業や引継ぎも簡単です。

ディープラーニングに興味がある、AIでこんなことができないか気になる方は、ぜひMatrixFlowに問い合わせください。