jsports_scraper.pl
#! /usr/bin/perl use strict; use warnings; use Web::Scraper; use URI; use YAML; use Encode; use Data::Dumper; my $uri = shift; my $jsports = scraper { process "tr", "programs[]" => scraper { process "td.bSchedule", date => 'TEXT'; process "td.bContent dl dd.DETAIL", match => 'TEXT'; process "td.bChannel img", ch => '@alt'; }; result 'programs'; }->scrape( URI->new($uri) ); print Encode::encode('utf-8', Dump($jsports));
で、プレミアリーグの放送予定をスクレイピングしてみる。
http://www.jsports.co.jp/search/sys/kensaku.cgi?Genre2=020101
--- - {} - ch: J sports 2 date: '09月22日 (土) 06:00 - 07:00' match: '07/08 プレミアリーグ ハイライト #5 ' - ch: J sports 2 date: '09月22日 (土) 21:00 - 21:30' match: '07/08 プレミアリーグ プレビューショー 第6週 ' - ch: J sports PLUS date: '09月22日 (土) 22:55 - 25:30' match: '07/08 プレミアリーグ 第6週-3 ミドルズブラ vs. サンダーランド ' - ch: J sports 2 date: '09月22日 (土) 22:55 - 25:30' match: '07/08 プレミアリーグ 第6週-1 アーセナル vs. ダービー ' (以下省略)
最初の中括弧は何だ??
全然使いこなせてないけど、すごい楽しいよこれ!
この結果をGoogleカレンダーにぶちこめば中継を忘れることもなくなりそうだ〜。