NTech Predict FAQ

高機能AIデータ分析ツール NTech Predict(エヌテック プレディクト)

予測と結果は過去のデータをどのくらい用意すれば、将来をどこまで予測できるか?(例~年先まで)

観測データの解像度(単位時間)で異なります。
データ行(時間方向が行)とした場合(1行分が1単位時間=1ステップ)100ステップ先まで先の予測であれば10倍~20倍程度が必要になります。

データの素性によって変わります。

概ね10~30ステップ先までは高い精度で予測可能です。その先も予測は可能ですが、精度が悪化していきます。

1ステップが1ミリ秒のデータから1年先予測は現実性がありません。

因果探索に必要なデータ数は?

一般的に 25×因子の数の2乗 と言われております。
 本製品では、最低1000行程度のデータ数が必要となります。

因果探索を行えるデータの上限数は?

変数:100ヶ 行数:100000行

データフォーマットについて

時系列データの形式について

時間フォーマットは、下記の形式が対象となっています。

エクセルで開くとファイル上はYYYY-MM-DDですが、YYYY/MM/DD形式で表示される場合があるので注意してください。

変数・カラム名・列名・特徴量について

使う場面によって呼び方が変わったりします。業界としても統一されていないので混乱が生じる場合がありますがどれも同じ事を指しています。
データシート(CSVファイル)ではカラム名や列名等が使われますし、CSVをデータ分析として見ている時(データフレームと言います)は変数と言いますが、近年では特微量という言い方も多用されるようになってきています。

注意!!
カラム名には以下の制限があります。

  • カラム名が指定されていないとき、「no_name_N」という名称で自動的に付与します(Nは1からの連番)。
  • カラム名の先頭が数字の場合、頭に「x」を付加します。
  • カラム名に記号などの特定の文字が使用されている場合、「_」(アンダースコア)に置き換えます。
    一例としては、
    空白「」(空白)、記号「!"$%&'()=-^~¥|@`{[+;*:}]<,>.?/{}「」【】『』〈〉[]()≪≫《》〔〕<>」
    上記は一例に過ぎないため、他にも使用できない文字はアンダースコアに置き換えます。

説明変数・目的変数について

犯罪発生数を予測したい場合、この「犯罪発生数」列が予測ターゲットになりますが、これを「目的変数」と呼ぶ場合があります。また、「犯罪発生数」列を予測する場合にどの値(列)から予測すべきがを指定する場合に選ばれた変数(列名)を「説明変数」と呼びます。

NTech Predictについての
お問い合わせ