データマイニングについて色々まとめ
移転しました。
随時更新
以下の機能があると、データマイニングツールとしては良い
データマイニングの宝箱から以下引用
汎用データマイニングツールの定義は難しいのですが、 ・メモリに乗っかるだけのデータ量(つまり大量データ)をとりあつかえる ・データのクレンジング(クリーニング)機能が充実している ・ニューラルネットワークのモジュール有り ・人工知能の機械学習(決定木)のモジュール有り ・統計学・多変量解析手法といった解析モジュール有り ・解析手順を自由に設計できる ・結果のビジュアル化ある(さらに工夫されている) あたりがあると良い。
サイト
ツール
以下のようなツールがある。
データマイニングの宝箱から以下引用
ニューラルネットワーク系分析ツール Trajan(バックプロパゲーションからSOMまで色々:デモ版有り) SOMine(自己組織化マップ:体験版有り) 決定木系分析ツール Weka(C4.5手法のjava仕様:フリー) 統計解析系分析ツール S-Plus(プロ仕様の統計解析、グラフ処理+α) Statistica(インターフェースが充実した統計解析+α) kyplot(フリーの統計解析ツール) 可視化ツール The Graph(様々なグラフ表示) Excel(もっともシンプル) 顔グラフ(多次元要素の理解) その他OLAPツール。