[ubuntu] slicehostでpython-mecabとかの インストール

移転しました。

slicehostのubuntu8 でインストールしたのでその手順を記載しておく。

何はともあれアップデート

まずはapt-getの設定
http://www.debian.or.jp/using/mirror.html|ここを参考に

$ sudo vi /etc/apt/sources.list
-----
以下をコメント化
変なホストを見に行きapt-getが止まる事があるので、以下を行う。
#deb http://204.152.191.7/debian/ unstable main contrib non-free
#deb-src http://204.152.191.7/debian/ unstable main contrib non-free
以下を追加。最新のパッケージを落とせるようになる。
deb ftp://ftp.dti.ad.jp/pub/Linux/debian/ stable main
deb-src ftp://ftp.dti.ad.jp/pub/Linux/debian/ stable main
deb http://cran.md.tsukuba.ac.jp/bin/linux/ubuntu hardy/
-----
$ gpg --keyserver subkeys.pgp.net --recv A70DAF536070D3A1
$ gpg --export --armor A70DAF536070D3A1 | sudo apt-key add 
$ gpg --keyserver subkeys.pgp.net --recv 2EBC26B60C5A2783
$ gpg --export --armor 2EBC26B60C5A2783 | sudo apt-key add 
$ gpg --keyserver subkeys.pgp.net --recv-key E2A11821
$ gpg -a --export E2A11821 | sudo apt-key add -
$ gpg --keyserver subkeys.pgp.net --recv 4D270D06F42584E6
$ gpg --export --armor 4D270D06F42584E6 | sudo apt-key add -
$ apt-get update

subversion

ソフトをチェックアウトする場合に使用するためインスコ

$ sudo apt-get install subversion

python-twitter インストール

pythonからtwitterを扱うためのライブラリ

simplejsonをあらかじめ入れておく。
$ svn checkout http://python-twitter.googlecode.com/svn/trunk/ python-twitter
$ cd python-twitter
$ python setup.py build
$ sudo python setup.py install
$ python setup.py test

MeCab インストール

twitterのコメントを形態素分解するために、MeCabをインストールする

MeCab&辞書インストール

参考URL

$ wget http://downloads.sourceforge.net/mecab/mecab-0.97.tar.gz?use_mirror=jaist
$ tar xvzf mecab-0.97.tar.gz
$ cd mecab-0.97
$ ./configure
$ make
$ su
$ sudo make install
$ sudo ldconfig
$ wget wget http://downloads.sourceforge.net/mecab/mecab-ipadic-2.7.0-20070801.tar.gz?use_mirror=jaist
$ tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install
$ mecab 
すもももももももものうち
python-mecabインストール

このあたりからhttp://sourceforge.net/project/showfiles.php?group_id=177856|ダウンロード

mecab-python0.97だとエラーになるので、0.96をインストール。

※MacPortからインストールされるMeCabは096なため

$ sudo apt-get install python-dev
$ tar zxvf mecab-python-0.97.tar.gz
$ cd mecab-python-0.97
$ python setup.py build
$ sudo python setup.py install
$ python
>>> import MeCab
 ↑ これでエラーでなければ、インストールされている
Rのインストール

参考ページより抜粋

(1) /etc/apt/sources.list ファイルをルート権限で編集
  (ルートパスワードの入力が求められます)
 ここでは既定のエディター gedit を使います。 
 
 $ sudo gedit /etc/apt/sources.list  

(2) 使用中の Ubuntu のバージョンに応じてつぎのような一行を付け加える。
    (筑波大学のミラーを使う)

 deb http://cran.md.tsukuba.ac.jp/bin/linux/ubuntu hardy/
 deb http://cran.md.tsukuba.ac.jp/bin/linux/ubuntu gutsy/
 deb http://cran.md.tsukuba.ac.jp/bin/linux/ubuntu feisty/
 deb http://cran.md.tsukuba.ac.jp/bin/linux/ubuntu dapper/

(3) Ubuntu レポジトリの公開鍵を入手

 $ gpg --keyserver subkeys.pgp.net --recv-key E2A11821
 $ gpg -a --export E2A11821 | sudo apt-key add -
 
(4) R 本体と Ubuntu に用意されているパッケージのインストール
   (システムにインストールするためやはりルート権限で実行)
   (r-base-dev をインストールするとCやFortranがインストールされます)
 $ sudo apt-get update
 $ sudo apt-get install r-base
 $ sudo apt-get install r-base-dev
 $ sudo apt-get install r-cran-*

(5) Ubuntu に用意されていないパッケージ xxx はCRANからxxx.tar.gz ファイルを
    ダウンロードし以下の命令を端末で実行
 $ sudo R CMD INSTALL xxx.tar.gz
rpy2インストール

Rとpythonを連携するためのモジュールをインストール

$ wget http://downloads.sourceforge.net/rpy/rpy2-2.0.3.tar.gz?modtime=1234726107&big_mirror=0
$ tar zxvf rpy2-2.0.3.tar.gz
$ cd rpy2-2.0.3
$ sudo python setup.py install
pygoogleインストール

pythonでgoogleの検索結果等を取得するためのモジュールをインストール

$ wget http://downloads.sourceforge.net/pygoogle/pygoogle-0.6.tar.gz?use_mirror=jaist
$ tar zxvf pygoogle-0.6.tar.gz
$ cd pygoogle-0.6
$ sudo python setup.py install
feedparserインストール

pythonでRSS解析をするためのモジュールをインストール

$ wget http://feedparser.googlecode.com/files/feedparser-4.1.zip
$ mkdir feedparser-4.1.zip feedparser
$ cd feedparser
$ sudo python setup.py install
tritonn インストール

全文検索用のMySQLDBを入れる。
以下参考にされたい。
http://d.hatena.ne.jp/shohu33/20080525