2009-06-05から1日間の記事一覧
おい俺、いつにもまして熱心に Python, BeautifulSoup していると思ったら、読み出す HTML の表ってこれなのかよ!? 動機がダメすぎるだろ。 # coding: utf-8 import sys import urllib2 from BeautifulSoup import BeautifulSoup from beautifulsouphelper…
HTML 文章を情報源としてデータを構築するときのお供に、 BeautifulSoup 。やはり便利。 テキストに変換 HTML 文章を強引にプレーンテキストに直してみる。 soup2string 呼び出し可能オブジェクト。 >>> from BeautifulSoup import BeautifulSoup >>> html =…