めも帖

「めも帖」代わりにダラダラと書いていったり、めもしたりしているだけです。

TumblrのTumblarityの中身を抜き出すRubyスクリプト

Tumblrには、APIがあっていろいろ出来るそうなのですが、ちょっと足りないのもあるらしいです。Tumblarityというのがありまして、そこには色々と数字が眠っています。それを知りたくて、Rubyで抜き出してみる事にしました。
試してみて分かったんですが、mechanizeってすごいね。これは、便利なライブラリ(だけど、複雑)。
あと、これをDBに入れたら定期的に数字を計測できそうですね(RubyでDBに...といえば、あいつか)

ソース

  • mechanizeが必要
  • MacOS X 10.5で試しました
#! /usr/bin/env ruby
require 'rubygems'
require 'mechanize'
require 'kconv'

# agent config
agent = WWW::Mechanize.new
agent.user_agent_alias = 'Windows IE 7'

# ログイン
agent.get('http://www.tumblr.com/')
form = agent.page.forms[1]
form_user_email  = form.field_with(:name => 'user[email]').value    = 'email'
form_user_passwd = form.field_with(:name => 'user[password]').value = 'password'
# form.click_button
res = agent.submit(form)
# p res

# activity
agent.get('http://www.tumblr.com/activity')
agent.page.search('span.ticker').each do |item|
	puts item.inner_text
end

Tumblarity

Tumblarityに見えるtumblrの思想と業の深さ:[mi]みたいもん!」を読んでみる事として、私は、0でした

Rubyの本

初めてのRuby

初めてのRuby