特定列への処理とは

特定列の処理_1.png

特定列への処理は、特定の列とその他の列の流れる方向を仕分けするレシピブロックです。
主に、テキスト(自然言語)と数値が混同するCSVのデータセットなどで使用されます。
特定の列に対して、「対象の列」エッジの方向に流れを変更する事ができます。
「その他の列」エッジは対象となっていない列が流れる方向になります。

特定列の処理_2.png

1.特定列への処理
  特定列への処理には、対象に「テキスト」をセットする事ができます。
  対象となる最小文字数は、
  対象となる列に存在する文字数より少ない(1ならば0文字)場合に、
  テキストとして扱わないようにします。
2.対象の列
  特定列への処理で設定された列が流れる方向です。
  この場合、「1文字以上」の「テキストの列」が流れる方向になります。
3.その他の列
  その他の列は、特定列への処理で設定された以外の使用する列が流れる方向です。
  例えば、数値データは「その他の列」の方向に流れます。

特定列の処理_3.png

<処理の例>

1.学習に使用する値に
  「テキスト文章の列(以降、テキストの列)」と、
  「数値データの列(以降、数値の列)」を設定した場合、
  特定の列への処理に「テキストの列」と「数値の列」がそれぞれ流れてきます。
2.特定列への処理から「テキストの列」が対象の列方向に流れます。
  一方「数値の列」は、その他の列方向に流れます。
3.「テキストの列」は日本語トークナイザーにより分かち書きされ、
  Word2Vecによって学習に使用できる形に変換されます。
4.列結合で合流し、その後の処理(分類のアルゴリズム)によって分類学習に利用されAIが作られます。