MatrixFlowMatrixFlowマニュアル

総合情報サイト / マニュアル / データセット設定 / データの形式について

データの形式について

MatrixFlowで利用出来るデータの形式は下記の通りです。
・CSV(数値データ)
・画像データのZIP
・テキストデータのZIP

■CSV形式データセットの作成例

データの形式について_1.png

1.EXCEL等の表計算ソフトで数値データを入力します。
 ※列と行の種類が一致する様にして下さい。
  (列の方が多くなったり、行の方が多くなったりしない事を推奨しています)
 ※画像では[予測に使う値=赤][学習に使う値=紫][学習に使わない値=灰色]に、
  色付けしています。
  実際に文字に色付けを行う必要はありません。

データの形式について_2.png

2.CSVのデータセットとしてダウンロードします。

データの形式について_3.png

3.これで、CSVのデータセット(数値データセット)が完成します。

■ZIP形式データセットの作成例
 ZIP形式のデータセットは、フォルダ構造やフォルダ名にルールが決められています。
 構造や名前の間違い等に注意をして下さい。

画像_学習用フォルダの構造.png

▼画像のZIPデータセットの場合
<フォルダ構造>
フォルダ/imagesフォルダ/列(ラベル)フォルダ/画像データ

1.一番上に位置するフォルダです。
  任意のフォルダ名を付けて下さい。(例:学習用)
2.1の配下のフォルダです。
  ルールに沿ったフォルダ名を付けて下さい。
 ・画像の場合 images とする事
3.imagesフォルダの配下のフォルダです。
  任意のフォルダ名を付けて下さい。これが列名(ラベル)となります。
  その中に列名(ラベル)に沿った画像を入れましょう。
  例:Bのフォルダ名を猫にして、
    そのフォルダに猫の画像を投入する事でAIが画像を猫として学習します。
    猫のフォルダに犬の画像を入れてしまうと、犬の画像を猫と判断してしまうAIになります。
4.1のフォルダをZIP形式に圧縮します。
  ZIP形式のデータにすることで、データセットとして使用する事が出来ます。

テキスト_学習用フォルダの構造.png

▼テキストのZIPデータセットの場合
<フォルダ構造>
フォルダ/textsフォルダ/列(ラベル)フォルダ/テキストデータ

1.一番上に位置するフォルダです。
  任意のフォルダ名を付けて下さい。(例:学習用)
2.1の配下のフォルダです。
  ルールに沿ったフォルダ名を付けて下さい。
 ・テキストの場合 texts とする事
3.textsフォルダの配下のフォルダです。
  任意のフォルダ名を付けて下さい。これが列名(ラベル)となります。
  その中に列名(ラベル)に沿ったテキストを入れましょう。
  例:Bのフォルダ名をB新聞社にして、
    そのフォルダにB新聞社の記事を投入する事で、
    AIがB新聞社のニュース(テキスト)をB新聞社のテキストとして学習します。
    B新聞社のフォルダにA新聞社のニュース(テキスト)を入れてしまうと、
    A新聞社のニュース(テキスト)をB新聞社のテキストと判断してしまうAIになります。
4.1のフォルダをZIP形式に圧縮します。
  ZIP形式のデータにすることで、データセットとして使用する事が出来ます。