RubyGems - xmltv - Versions diffs - 0.8.1 - Mend

xmltv 0.8.1

Files changed (18) hide show

data/History.txt +5 -0
data/Manifest.txt +17 -0
data/README.txt +123 -0
data/Rakefile +18 -0
data/bin/xmltv +13 -0
data/lib/xmltv/sample/dumpids.rb +15 -0
data/lib/xmltv/sample/mythtv_chns.yaml +183 -0
data/lib/xmltv/sample/sample_output +73 -0
data/lib/xmltv/sample/tvcat_spoolfiles.rb +29 -0
data/lib/xmltv/sites/film1.rb +100 -0
data/lib/xmltv/sites/rt.rb +133 -0
data/lib/xmltv/sites/trivial.rb +33 -0
data/lib/xmltv/sites/tvgids.rb +224 -0
data/lib/xmltv/sites/tvtoday.rb +185 -0
data/lib/xmltv/sites/upc.rb +157 -0
data/lib/xmltv/sites/vpro.rb +122 -0
data/lib/xmltv/xmltv.rb +737 -0
metadata +89 -0

data/lib/xmltv/sites/upc.rb ADDED Viewed

@@ -0,0 +1,157 @@
+#!/usr/bin/ruby -w
+autoload :XMLTV, 'xmltv/xmltv'
+require 'date'
+#require 'uri'
+class Date
+  Vandaag = Date.today
+  def self.upcdate(string)
+    if string == 'today'
+      return Vandaag
+    end
+    rsl = dutch(string)
+    rsl += 7 if rsl == Vandaag
+    rsl
+  end
+end
+module XMLTV
+  class UpcGrabber < Grabber
+    Days_to_grab = %w{ today } + Date::DAYNAMES.map{|x| x.downcase}
+    Cattrans = { 'drama'		  => 'Drama',
+	           'educatie'         => 'Educational',
+                   'erotiek'          => 'Adult',
+                   'kids/jeugd'       => 'Children',
+                   'kunst/cultuur'    => 'Arts/Culture',
+                   'nieuws'		  => 'News',
+	           'show/spelshow'	  => 'Game',
+                   'speelfilm'        => 'Movies',
+                   'sport'            => 'Sports',
+	           'vrijetijd'	  => 'Educational' }
+    def base_url
+      'http://www.upclive.nl'
+    end
+    def fetch_all_channels
+      channels = Hash.new
+      catch(:ready) do
+        1.upto 200 do |pagenr|
+          www = "#{base_url}/Televisie/TV_gids/Zenders/?channels=All&theme=All&page=#{pagenr}"
+          STDERR.puts(www) if XmltvOptions.verbose
+          page = fetch(www)
+  #        cont = page.at('div.epg_listings_bar4c_container')
+          chns = page.search('div.epg_listings_bar4c') + page.search('div.epg_listings_bar4cend')
+          chns.each do |chn|
+            if chn.at('h5 a').nil?
+                throw :ready
+            end
+            url = REXML::Text.read_with_substitution(chn.at('h5 a')['href']).gsub('nowandnext','')
+            name = URI.unescape(url[/channels=(.*)&/, 1])
+            tekst = chn.at('div.right')
+            zender = tekst.inner_text[/Zendernummer\s+([0-9]+)/, 1]
+            packet = tekst.at('a.epg_underline').inner_text.split[-1]
+            packet = '' if packet == 'Pack'
+            channels[zender] = [name, packet, url]
+          end
+        end
+      end
+      save_object(channels, channel_list)
+      channels
+    end
+    def clean_cache(cache)
+      count = 0
+      cache.delete_if do |dt, en|
+        rsl = (Date.parse(dt) < Vandaag)
+        count += 1 if rsl
+        rsl
+      end
+      count
+    end
+    def channel_display(chan_id)
+      all_channels[chan_id][0]
+    end
+    def day_url(chan_id, day)
+      "#{base_url}#{all_channels[chan_id][2]}#{day}_all"
+    end
+    def grab_channel(chan_id)
+      @all_days = load_cachefile(chan_id)
+      @all_days.delete(Date.today.to_s)  ## Always fetch today to calibrate calendars
+      progs = 0
+      Days_to_grab.each_with_index do |day, dchan_id|
+        date = Date.upcdate(dchan_id == 0 ? day : Date::Dagen[dchan_id - 1])
+        next if @all_days.has_key?(date.to_s)
+        url = day_url(chan_id, day)
+        page = fetch(url)
+        begin
+          datum = Date.dutch(page.at('//div.epg_listings_bar1//span').inner_text)
+        rescue NoMethodError
+          save(url, page)
+          raise
+        end
+        if day == 'today' && datum != Date.today
+  #        @all_days = Hash.new    ## Invalidate cache
+          raise "#{day} #{datum} Upc is gek geworden"
+        end
+        noshift = nil
+        programs = Array.new
+        page.at('div.ch_ci2_epg_center').search('/div').each do |programme|
+          case programme['class']
+            when 'epg_header_4'
+              noshift = ( programme.inner_text.strip.downcase == 'ochtend')
+            when 'listing_visible'
+              programs << (program = Hash.new)
+              program['noshift'] = noshift
+              program['title'] = programme.at('div.col7').inner_text.strip
+              program['times'] = programme.at('div.col8').inner_text.gsub(/\s/,'')
+              program['category'] = programme.at('div.col9').inner_text.strip
+              desc = ''
+              programme.at('div.info_color').each_child do |node|
+                break if node.class != Hpricot::Text
+                desc << node.to_s.strip
+              end
+              program['desc'] = desc
+          end
+        end
+        @all_days[datum.to_s] = programs
+        progs += programs.size
+      end
+      save_object( @all_days , cachefile(chan_id))
+      progs
+    end
+    def transform(chan_id)
+  #    @all_days = load_cachefile(chan_id)
+      progdata_array = Array.new
+      @all_days.each_pair do |datum, programs|
+        jaar, maand, dag = datum.split('-').map{|x| x.to_i}
+        programs.each do |entry|
+          progdata = proghash(entry, chan_id)
+  #        pp progdata, '==='
+  #        pp entry
+          startuur, startmin, stopuur, stopmin = entry['times'].scan(/\d+/).map{|x| x.to_i}
+          shift = startuur < 8 && entry['noshift'] == false ? Dag : 0
+          progdata['start'] = start = Time.local(jaar, maand, dag, startuur, startmin) + shift
+          progdata['stop'] = stop = Time.local(jaar, maand, dag, stopuur, stopmin)
+          if stop < start &&  stopuur <= 10
+            progdata['stop'] += Dag
+          end
+          date_stats(chan_id, progdata['start'])
+          if progdata['stop'] < progdata['start']
+            reject(myname, day_url(chan_id, 'today'), entry, progdata)
+            next
+          end
+          date_stats(chan_id, progdata['start'])
+          progdata['category'] = Cattrans[entry['category'].gsub(/\s+/,'').downcase] || 'onbekend'
+          progdata_array << progdata
+  #        pp progdata
+          end
+        end
+      progdata_array
+    end
+  end
+end
+XMLTV::UpcGrabber.new.run

data/lib/xmltv/sites/vpro.rb ADDED Viewed

@@ -0,0 +1,122 @@
+#!/usr/bin/ruby -w
+autoload :XMLTV, 'xmltv/xmltv'
+require 'cgi'
+module XMLTV
+  class VproGrabber < Grabber
+    def initialize
+      super
+      @cookie = nil
+      @zenders = config['channels'].map{|x| "zendersTV[]=#{x}"}.join('&')
+    end
+    def base_url
+      'http://gids.vpro.nl'
+    end
+    def fetch_all_channels
+      page = fetch(base_url)
+      channels = Hash.new
+#      puts page
+      page.search('ul#selZendersTV//a').each do |a|
+        begin
+          channels[a['id'].to_utf] = a.inner_text.to_utf
+        rescue NoMethodError
+          STDERR.puts a, '===='
+        end
+      end
+      save_object(channels, channel_list)
+      channels
+    end
+    # Ruby standard lib cookie parsing is seriously broken
+    # This is kind of a kludge, which works for vpro.nl
+    def self.cookie_parse(cookie)
+      ourcookie = Array.new
+      cookie.split(/, (?=[A-Z])/).map{|x| x.split('=', 2)}.each do |pair|
+        cook, val = pair
+        val.gsub!(/;.*/, '')
+        unless val == 'deleted'
+          ourcookie << "#{cook}=#{val}"
+        end
+      end
+      ourcookie.join('; ')
+    end
+    def grab_detail(info)
+      program = Hash.new
+      begin
+        t = info.at('div.tijd').inner_text.strip
+        program['times'] = t
+        unless @avond
+          @avond = true if t.to_i > 17
+        end
+        program['avond'] = @avond
+        program['title'] = info.at('div.uitzending').inner_text.to_utf.strip.split("\n")[0]
+        detail = info.parent.at('div.detail')
+        program['category'] = detail.at('//p').inner_text.strip.split("\n")[-1]
+        program['desc'] = detail.at('//p.summary').inner_text.to_utf.strip rescue ''
+      rescue NoMethodError => exc
+        STDERR.puts info, detail
+        raise
+      end
+      program
+    end
+    def clean_cache(cache)
+      0
+    end
+    def grab_channel(chan_id)
+      if @cookie.nil?
+        a = open('http://gids.vpro.nl')
+        @cookie = VproGrabber.cookie_parse(a.meta['set-cookie'])
+      end
+      url = "/index.php/gids"
+      datasrc = [ 'medium=TV', @zenders, 'layout=zender', "lZenCode=#{chan_id}"]
+      data = URI.escape(datasrc.join('&'))
+      http = Net::HTTP.new( 'gids.vpro.nl')
+      cook = @cookie
+      response = http.request_post(url, data,
+           { 'Cookie' => cook, 'Content-Type' => 'application/x-www-form-urlencoded'  } )
+   #   puts response.body
+      @channel_info = Array.new
+      %w{ vandaag morgen overmorgen }.each do |dag|
+        response = http.request_get("#{url}?medium=TV&dag=#{dag}",  { 'Cookie' => cook } )
+        page = Hpricot(response.body)
+        vandaag = page.at('div#vandaag').inner_text
+        @avond = false
+        page.search('div.infoRow').each do |info|
+          @channel_info << grab_detail(info)
+          @channel_info[-1]['datum'] = vandaag
+        end
+      end
+      save_object(@channel_info, cachefile(chan_id))
+      @channel_info.size
+    end
+    def transform(chan_id)
+#      @channel_info = YAML.load_file(cachefile(chan_id))
+      progdata_array = Array.new
+      @channel_info.each do | entry|
+        begin
+          progdata_array << ( progdata = proghash(entry, chan_id))
+          date = Date.dutch(entry['datum'])
+          startuur, startmin, stopuur, stopmin = entry['times'].split(/[^0-9]+/).map {|x| x.to_i }
+          shift = entry['avond'] && startuur < 9 ? Dag : 0
+          progdata['start'] = start = Time.local(date.year, date.month, date.day, startuur, startmin) + shift
+          progdata['stop']  = stop = Time.local(date.year, date.month, date.day, stopuur, stopmin) + shift
+          date_stats(chan_id, progdata['start'])
+          if stop < start
+            progdata['stop'] += Dag
+          end
+#          dump progdata
+        rescue Exception => exc
+          STDERR.puts exc, exc.message, exc.backtrace
+          raise
+        end
+      end
+      progdata_array
+    end
+  end
+end
+XMLTV::VproGrabber.new.run