総合情報サイト / マニュアル / (旧)データ管理 / テキストZIPファイルの構造(labels有り版)

テキストZIPフォルダの作成例を、ご説明します。

本ページは「labels有り版」です。
テキストZIPフォルダの作成は、label無し版をオススメしています。

ZIPフォルダの構造を間違えてしまうと、MatrixFlowは正常に動作をする事が出来ません。

MatrixFlowを正常に動作させるためのテキストZIPフォルダのデータ構造について、
以下の注意点をご確認下さい。

t-zip-b1.png

1.フォルダの構造を変えない事。
上の画像の構造にならって下さい。

2.フォルダの名称は下記に統一して下さい。
 ・フォルダ:半角英数字(※1)(※2)
  -テキスト用フォルダ:texts
  -CSV用フォルダ:labels
 ・ZIPファイル:半角英数字(※1)(※2)
※1:利用可能な文字列(a-z,A-Z,0-9, _ )
※2:特殊文字や全角は利用しない様にして下さい( _ を除く)

3.CSVファイルの名称は下記に統一して下さい。
 -CSVファイル:labels.csv

4.labels.csvにヘッダは不要です。

textsフォルダと、
labelsフォルダの関係をご説明します。

「textsフォルダにあるテキストのファイル名」は、
必ず「labels.csv内のデータに記載されている」必要があります。

t-zip-b2

1.
[テキストファイル名:smax-6559799.txt]ならば[ labels.csv:smax-6559799.txt,分類名称]を記載します。

2.[分類名称]は、分類の名称です。任意の名称を決められます。
 ・文章がA社なら:xxx.txt,A社
 ・文章がB社なら:xxx.txt,B社
 ・文章がC社なら:xxx.txt,C社
などの様なイメージです。