[book][集合知] データマイニング入門 自己組織化マップ

 
前回からの続き。

データマイニング入門
豊田 秀樹
東京図書
売り上げランキング: 5094
おすすめ度の平均: 5.0
5 ベイジアンネットが良い

今日は自己組織化マップについてまとめる。

自己組織化マップ

■概要

以下Wikipediaから引用。

大脳皮質の視覚野をモデル化したニューラルネットの一種である。
教師なし学習によるクラスタリングの手法の一つである。
次元削減による可視化の手法の一つである。

人工ニューロンを格子状に配置し、(入力層からの)シナプス結合の重みを学習すべき入力ベクトルの集合(トレーニングセット)と適合するように変化させる。

■実務では

以下本より抜粋。P113

        • -

マーケティング分野ではポジショニングという考え方がある。ポジショニングとは、興味の対象となるブランドが競合ブランドと比較されたときの位置づけである。明確な、独自の、望ましい印象を、消費者に想起させなくてはいけない。そのブランドを心理的に有利な場所に印象づけないと、すぐに淘汰され、市場から撤退させられてしまうからである。そうならないように、ブランド郡のマップを描き、販売しやすい、他社と戦いやすいコンセプトを探すことを、マーケティングの分野ではポジショニングという。

        • -

「自己組織化マップは複雑な多次元情報から観測対象のポジショニングマップのを描くためのデータマイニング手法である」とのこと。

■使用例

■動物をマッピングする
13個の特徴より、動物を平面上にマッピングする。距離が近い=似ている、距離が遠い=似ていない、のような事がわかる。
・入力
  9個の動物の特徴変数(かわいらしい、くさそうとか)
・出力
  動物の特徴マップ
・取り込むCSV
----------------------------
,賢い,くさそうな,好きな,かわいらしい,大きな,危険な,素早い,美味しそうな,珍しい
ライオン,0,1,0,0,1,1,1,0,1
ぞう,0,1,0,0,1,1,0,0,1
うし,0,1,0,0,0,0,0,1,0
しまうま,0,1,0,0,0,0,1,0,1
  :
  :
----------------------------
 

■Rでの画像

f:id:shohu33:20090126134634j:image
f:id:shohu33:20090126134633j:image

連関規則

■概要

以下参考ページより抜粋。

「連関規則」(association rule。「連想規則」や「相関規則」とも訳されるらしい)とは、「Aが起こると、Bが発生する」(「A→B」)という規則のこと。Aの方を「ルールヘッド」、Bの方を「ルールボディ」と呼ぶ。有名な例として、「風が吹けば桶屋が儲かる」ということわざが挙げられる。

またAとBを確率事象とみなして、膨大なトランザクションの記録の中から有用な連関規則を見つけることをバスケット分析という。

■実務では

以下のような事例を連関規則を使って見つけ出す。

以下本より抜粋。P148

        • -

ネクタイを買いに来た客がついでに上着も買う確率より、上着を買いに来た客がついでにネクタイも買う確率のほうが高い。
店内を歩いている一般客より、1本目のズボンを買った客のほうが、2本目のズボンを買ってくれる確率が高い。などなど

        • -

■使用例

■天気の分析
昔の東京地方の天気のデータを元に、明日の天気の予測をする
・入力
  10年間分の東京地方の天気データ
・出力
  天気予報の連関規則
・取り込むCSV
----------------------------
年月日,月,当日天気,前日天気,前々日天気,三日前天気,一週前天気
961231,12,晴,晴,晴,晴,晴
961230,12,晴,晴,晴,晴,晴
961229,12,晴,晴,晴,晴,晴
961228,12,晴,晴,晴,晴,晴
961227,12,晴,晴,晴,晴,晴
  :
  :
----------------------------
・Rで出力した連関規則

以下は信頼性(confidence)について並べ替えたもの。
12月に2日晴れが続いたら、翌日も88%晴れという確率であることがわかる。
これは興味深い。簡単にこんな推測もできるのか。
-----------------------------------------------------------------------
   lhs                rhs           support confidence lhs.support lift
1  {月=12,                                                             
    前日天気=晴,                                                       
    前々日天気=晴} => {当日天気=晴}   0.051       0.88       0.057  1.6
2  {月=12,                                                             
    前日天気=晴}   => {当日天気=晴}   0.058       0.86       0.068  1.6
3  {月=12,                                                             
    前々日天気=晴} => {当日天気=晴}   0.056       0.84       0.067  1.6
4  {月=12,                                                             
    三日前天気=晴} => {当日天気=晴}   0.054       0.83       0.066  1.5
5  {月=12,                                                             
    一週前天気=晴} => {当日天気=晴}   0.054       0.81       0.066  1.5
6  {月=12}         => {当日天気=晴}   0.068       0.80       0.085  1.5
7  {前日天気=晴,                                                       
    前々日天気=晴,                                                     
    三日前天気=晴,                                                     
    一週前天気=晴} => {当日天気=晴}   0.127       0.76       0.167  1.4
8  {前日天気=晴,                                                       
    三日前天気=晴,                                                     
    一週前天気=晴} => {当日天気=晴}   0.154       0.74       0.207  1.4
9  {前日天気=晴,                                                       
    前々日天気=晴,                                                     
    三日前天気=晴} => {当日天気=晴}   0.193       0.74       0.261  1.4
10 {前日天気=晴,                                                       
    前々日天気=晴,                                                     
    一週前天気=晴} => {当日天気=晴}   0.163       0.73       0.222  1.4