このセクションの他の記事
要因説明機能について、
ご説明します。
要因説明機能はそれぞれの属性データが目的変数にどれ位の影響を与えたかを可視化する機能です。
下の画像は、学習後に学習とテストに使用したデータを使って「寄与の大きさを表す」内容です。
以下の学習は「タイタニック生存者_AI学習用」のデモデータで行っています。

1.学習に使った値(訓練データ)が表示されます。
2.寄与(学習の影響度)の大きさを表しています。
上図は寄与の大きさを表した図で、データ毎の寄与度が出せます。
学習データとテストデータを合わせ、データの寄与度を平均して寄与度が高い順に並べています。
ここで重要なのは相対的な大きさであり、横の値の大きさを気にする必要はありません。
次の画像は、
学習後に学習とテストに使用したデータを使って「正と負のどちらの寄与かの詳細を表す」内容です。
画像の学習も「タイタニック生存者_AI学習用」のデモデータで行っています。

1.学習に使った値(訓練データ)が表示されます。
2.正と負の寄与の詳細、判断内容を表しています。
下記画像にて、正と負の寄与の表示についてご説明します。

1.性別カラムの0は女性を表しています。(女性を前処理で0に設定したため)
2.性別カラムの1は男性を表しています。(男性を前処理で1に設定したため)
3.0~+Xは生存を表しています。(プラスに行くほど生存の判定となる)
4.-X~0は死亡を表しています。(マイナスに行くほど死亡の判定となる)
このことから「0(女性)ほどプラス(生存)」である事がわかり、
「1(男性)ほどマイナス(死亡)」である事がわかります。
それでは、性別の隣にあるチケットクラスの要因説明を見てみましょう。
・1stクラスは数値1を設定している
・2ndクラスは数値2を設定している
・3rdクラスは数値3を設定している
・生存は0~+X
・死亡は-X~0
チケットクラスの要因説明の正解は、
・1stクラスの生存率が高い
・2ndクラスの生存率は比較的高いが、1stクラスに比べると死亡率が上がる
・3rdクラスの生存率は極めて低い
との要因説明となります。