総合情報サイト / マニュアル / (旧)学習 / 要因説明機能

要因説明機能について、
ご説明します。

要因説明機能はそれぞれの属性データが目的変数にどれ位の影響を与えたかを可視化する機能です。
下の画像は、学習後に学習とテストに使用したデータを使って「寄与の大きさを表す」内容です。

以下の学習は「タイタニック生存者_AI学習用」のデモデータで行っています。

要因説明機能1.png

1.学習に使った値(訓練データ)が表示されます。

2.寄与(学習の影響度)の大きさを表しています。

 

上図は寄与の大きさを表した図で、データ毎の寄与度が出せます。
学習データとテストデータを合わせ、データの寄与度を平均して寄与度が高い順に並べています。
ここで重要なのは相対的な大きさであり、横の値の大きさを気にする必要はありません。

次の画像は、
学習後に学習とテストに使用したデータを使って「正と負のどちらの寄与かの詳細を表す」内容です。

画像の学習も「タイタニック生存者_AI学習用」のデモデータで行っています。

要因説明機能2.png

1.学習に使った値(訓練データ)が表示されます。

2.正と負の寄与の詳細、判断内容を表しています。

下記画像にて、正と負の寄与の表示についてご説明します。

要因説明機能3-a.png

1.性別カラムの0は女性を表しています。(女性を前処理で0に設定したため)

2.性別カラムの1は男性を表しています。(男性を前処理で1に設定したため)

3.0~+Xは生存を表しています。(プラスに行くほど生存の判定となる)

4.-X~0は死亡を表しています。(マイナスに行くほど死亡の判定となる)

このことから「0(女性)ほどプラス(生存)」である事がわかり、
「1(男性)ほどマイナス(死亡)」である事がわかります。

それでは、性別の隣にあるチケットクラスの要因説明を見てみましょう。

・1stクラスは数値1を設定している
・2ndクラスは数値2を設定している
・3rdクラスは数値3を設定している

・生存は0~+X
・死亡は-X~0

チケットクラスの要因説明の正解は、
・1stクラスの生存率が高い
・2ndクラスの生存率は比較的高いが、1stクラスに比べると死亡率が上がる
・3rdクラスの生存率は極めて低い

との要因説明となります。