データマイニングについて色々まとめ

移転しました。

随時更新

以下の機能があると、データマイニングツールとしては良い

データマイニングの宝箱から以下引用

汎用データマイニングツールの定義は難しいのですが、
  ・メモリに乗っかるだけのデータ量(つまり大量データ)をとりあつかえる
  ・データのクレンジング(クリーニング)機能が充実している
  ・ニューラルネットワークのモジュール有り
  ・人工知能の機械学習(決定木)のモジュール有り
  ・統計学・多変量解析手法といった解析モジュール有り
  ・解析手順を自由に設計できる
  ・結果のビジュアル化ある(さらに工夫されている)
あたりがあると良い。

ツール

以下のようなツールがある。
データマイニングの宝箱から以下引用

  ニューラルネットワーク系分析ツール
    Trajan(バックプロパゲーションからSOMまで色々:デモ版有り)
    SOMine(自己組織化マップ:体験版有り)

  決定木系分析ツール
    Weka(C4.5手法のjava仕様:フリー)

  統計解析系分析ツール
    S-Plus(プロ仕様の統計解析、グラフ処理+α) 
    Statistica(インターフェースが充実した統計解析+α) 
    kyplot(フリーの統計解析ツール) 

  可視化ツール
    The Graph(様々なグラフ表示) 
    Excel(もっともシンプル) 
    顔グラフ(多次元要素の理解)
    その他OLAPツール。
Weka

Javaで書かれたデータマイニングツール.小規模問題ならいろいろなアルゴリズムが使える. 特徴選択手法とかもメニューから選ぶだけ
参考URL