TM_MSOM CA(カテゴリー付き・テキストマイニング)の操作解説

TM_MSOM CA(カテゴリー付き・テキストマイニング)の操作解説
「TM_MSOM CA」の基本操作は、
「TM_MSOM」とほとんど同じですので、
「TM_MSOM」の解説書や解説ビ
デオを見てください。以下、操作の異なる点を中心に留意点を説明します。
システムをダウンロードし「tmca.zip」ファ
イルを解凍し、任意の場所に「tmca」フォルダ
ーをおきます。インストラーはありません。不
要になった場合は、フォルダーごと削除すれ
ば、システムは削除されます。
「tmca」フォルダーの「tmca.exe」ファイル
をクリックするとシステムは起動します。
システムの「データフォルダ」をクリックし
て、フォルダーを開きます
このフォルダーに分析する文章データ
(data.txt)をおきます。さらに、
「idata.txt」
という名前のテキストファイルを作成して、こ
のフォルダーにおきます。その作成は次のよう
に行います。
「data.txt」の分析対象の文章は、1文章1行
になっていると思います。その行に対応するよ
うにその文章のカテゴリー番号のデータを作
ります。カテゴリーは最大5までで、カテゴリ
ー番号は 1 から 5 までの数字で示してくださ
い。
このテキストデータは、メモ帳などで作成
し、ファイル名を「idata.txt」としてください。
「データフォルダ」をクリックし、このファイ
ルをそこに貼り付けてください。予めからのデ
こ の デ ー タ を 作 成 し
「idata.txt」として保存する。
ータファイルがありますので、上書きしてくだ
さい。
TM_MSOM では、一つのセ
ルにいくつかの文章が入った
場合は、色が変わっていまし
たが、TM_MSOM CA では、
同じカテゴリーの文章が複数
入っても、そのカテゴリーの
色のままです。異なるカテゴ
リーの文章が一つのセルに入
った場合は■の色になりま
カテゴリーごとにセルの
色がこの色になります
す。したがって、■の色のとこ
ろは、どのカテゴリーか、セル
をクリックして、文章の前に
示された文章番号で判断して
ください。文章番号は、
「data.txt」のテキストに収め
られた順番についています。したがって、予めカテゴリーごとに、文章を順番に並べておくと、何番
から何番まではカテゴリー1というように判断しやすいため、
順番に並べておくとよいと思われます。