[Python] lxml をちょっとだけ使う

移転しました。

HTMLファイル読込んで、tdタグにclass属性を追加して出力

参考URL
http://d.hatena.ne.jp/Voluntas/20070530

#!/usr/bin/env python
# -*- coding: utf-8 -*-
from lxml import etree

parser = etree.HTMLParser()
tree = etree.parse('hoge.html', parser)
items = tree.findall('.//td')
cnt = 1 
for item in items:
    if cnt % 2 != 0:
        item.set('class','odd')
    else:
        item.set('class','even')
    cnt += 1
print etree.tostring(tree.getroot(), 'utf-8', pretty_print=True)