RubyGems - roo - Versions diffs - 1.10.1 → 1.10.2 - Mend

roo 1.10.1 → 1.10.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (136) hide show

data/.gitignore +2 -0
data/Gemfile +4 -0
data/Gemfile.lock +38 -0
data/History.txt +4 -4
data/License.txt +20 -0
data/Manifest.txt +68 -0
data/README.markdown +109 -0
data/Rakefile +5 -4
data/bin/roo +0 -0
data/examples/roo_soap_client.rb +53 -0
data/examples/roo_soap_server.rb +29 -0
data/examples/write_me.rb +33 -0
data/lib/roo.rb +20 -61
data/lib/roo/csv.rb +13 -11
data/lib/roo/excel.rb +108 -219
data/lib/roo/excel2003xml.rb +312 -0
data/lib/roo/excelx.rb +205 -341
data/lib/roo/generic_spreadsheet.rb +371 -268
data/lib/roo/google.rb +64 -54
data/lib/roo/openoffice.rb +101 -156
data/lib/roo/roo_rails_helper.rb +5 -5
data/lib/roo/worksheet.rb +18 -0
data/roo.gemspec +43 -0
data/scripts/txt2html +67 -0
data/test/all_ss.rb +8 -10
data/test/{1900_base.xls → files/1900_base.xls} +0 -0
data/test/{1904_base.xls → files/1904_base.xls} +0 -0
data/test/{Bibelbund.csv → files/Bibelbund.csv} +0 -0
data/test/{Bibelbund.ods → files/Bibelbund.ods} +0 -0
data/test/{Bibelbund.xls → files/Bibelbund.xls} +0 -0
data/test/{Bibelbund.xlsx → files/Bibelbund.xlsx} +0 -0
data/test/files/Bibelbund.xml +62518 -0
data/test/{Bibelbund1.ods → files/Bibelbund1.ods} +0 -0
data/test/{Pfand_from_windows_phone.xlsx → files/Pfand_from_windows_phone.xlsx} +0 -0
data/test/files/bad_excel_date.xls +0 -0
data/test/{bbu.ods → files/bbu.ods} +0 -0
data/test/{bbu.xls → files/bbu.xls} +0 -0
data/test/{bbu.xlsx → files/bbu.xlsx} +0 -0
data/test/files/bbu.xml +152 -0
data/test/{bode-v1.ods.zip → files/bode-v1.ods.zip} +0 -0
data/test/{bode-v1.xls.zip → files/bode-v1.xls.zip} +0 -0
data/test/{boolean.ods → files/boolean.ods} +0 -0
data/test/{boolean.xls → files/boolean.xls} +0 -0
data/test/{boolean.xlsx → files/boolean.xlsx} +0 -0
data/test/files/boolean.xml +112 -0
data/test/{borders.ods → files/borders.ods} +0 -0
data/test/{borders.xls → files/borders.xls} +0 -0
data/test/{borders.xlsx → files/borders.xlsx} +0 -0
data/test/files/borders.xml +144 -0
data/test/{bug-row-column-fixnum-float.xls → files/bug-row-column-fixnum-float.xls} +0 -0
data/test/files/bug-row-column-fixnum-float.xml +127 -0
data/test/{comments.ods → files/comments.ods} +0 -0
data/test/{comments.xls → files/comments.xls} +0 -0
data/test/{comments.xlsx → files/comments.xlsx} +0 -0
data/test/{csvtypes.csv → files/csvtypes.csv} +0 -0
data/test/{datetime.ods → files/datetime.ods} +0 -0
data/test/{datetime.xls → files/datetime.xls} +0 -0
data/test/{datetime.xlsx → files/datetime.xlsx} +0 -0
data/test/files/datetime.xml +142 -0
data/test/{datetime_floatconv.xls → files/datetime_floatconv.xls} +0 -0
data/test/files/datetime_floatconv.xml +148 -0
data/test/{dreimalvier.ods → files/dreimalvier.ods} +0 -0
data/test/{emptysheets.ods → files/emptysheets.ods} +0 -0
data/test/{emptysheets.xls → files/emptysheets.xls} +0 -0
data/test/{emptysheets.xlsx → files/emptysheets.xlsx} +0 -0
data/test/files/emptysheets.xml +105 -0
data/test/files/excel2003.xml +21140 -0
data/test/{false_encoding.xls → files/false_encoding.xls} +0 -0
data/test/files/false_encoding.xml +132 -0
data/test/{formula.ods → files/formula.ods} +0 -0
data/test/{formula.xls → files/formula.xls} +0 -0
data/test/{formula.xlsx → files/formula.xlsx} +0 -0
data/test/files/formula.xml +134 -0
data/test/files/formula_parse_error.xls +0 -0
data/test/files/formula_parse_error.xml +1833 -0
data/test/{formula_string_error.xlsx → files/formula_string_error.xlsx} +0 -0
data/test/{html-escape.ods → files/html-escape.ods} +0 -0
data/test/{matrix.ods → files/matrix.ods} +0 -0
data/test/{matrix.xls → files/matrix.xls} +0 -0
data/test/{named_cells.ods → files/named_cells.ods} +0 -0
data/test/{named_cells.xls → files/named_cells.xls} +0 -0
data/test/{named_cells.xlsx → files/named_cells.xlsx} +0 -0
data/test/{no_spreadsheet_file.txt → files/no_spreadsheet_file.txt} +0 -0
data/test/{numbers1.csv → files/numbers1.csv} +0 -0
data/test/{numbers1.ods → files/numbers1.ods} +0 -0
data/test/{numbers1.xls → files/numbers1.xls} +0 -0
data/test/{numbers1.xlsx → files/numbers1.xlsx} +0 -0
data/test/files/numbers1.xml +312 -0
data/test/{only_one_sheet.ods → files/only_one_sheet.ods} +0 -0
data/test/{only_one_sheet.xls → files/only_one_sheet.xls} +0 -0
data/test/{only_one_sheet.xlsx → files/only_one_sheet.xlsx} +0 -0
data/test/files/only_one_sheet.xml +67 -0
data/test/{paragraph.ods → files/paragraph.ods} +0 -0
data/test/{paragraph.xls → files/paragraph.xls} +0 -0
data/test/{paragraph.xlsx → files/paragraph.xlsx} +0 -0
data/test/files/paragraph.xml +127 -0
data/test/{prova.xls → files/prova.xls} +0 -0
data/test/{ric.ods → files/ric.ods} +0 -0
data/test/{simple_spreadsheet.ods → files/simple_spreadsheet.ods} +0 -0
data/test/{simple_spreadsheet.xls → files/simple_spreadsheet.xls} +0 -0
data/test/{simple_spreadsheet.xlsx → files/simple_spreadsheet.xlsx} +0 -0
data/test/files/simple_spreadsheet.xml +225 -0
data/test/{simple_spreadsheet_from_italo.ods → files/simple_spreadsheet_from_italo.ods} +0 -0
data/test/{simple_spreadsheet_from_italo.xls → files/simple_spreadsheet_from_italo.xls} +0 -0
data/test/files/simple_spreadsheet_from_italo.xml +242 -0
data/test/{so_datetime.csv → files/so_datetime.csv} +0 -0
data/test/{style.ods → files/style.ods} +0 -0
data/test/{style.xls → files/style.xls} +0 -0
data/test/{style.xlsx → files/style.xlsx} +0 -0
data/test/files/style.xml +154 -0
data/test/{time-test.csv → files/time-test.csv} +0 -0
data/test/{time-test.ods → files/time-test.ods} +0 -0
data/test/{time-test.xls → files/time-test.xls} +0 -0
data/test/{time-test.xlsx → files/time-test.xlsx} +0 -0
data/test/files/time-test.xml +131 -0
data/test/{type_excel.ods → files/type_excel.ods} +0 -0
data/test/{type_excel.xlsx → files/type_excel.xlsx} +0 -0
data/test/{type_excelx.ods → files/type_excelx.ods} +0 -0
data/test/{type_excelx.xls → files/type_excelx.xls} +0 -0
data/test/{type_openoffice.xls → files/type_openoffice.xls} +0 -0
data/test/{type_openoffice.xlsx → files/type_openoffice.xlsx} +0 -0
data/test/{whitespace.ods → files/whitespace.ods} +0 -0
data/test/{whitespace.xls → files/whitespace.xls} +0 -0
data/test/{whitespace.xlsx → files/whitespace.xlsx} +0 -0
data/test/files/whitespace.xml +184 -0
data/test/test_generic_spreadsheet.rb +257 -0
data/test/test_helper.rb +167 -27
data/test/test_roo.rb +1178 -930
data/website/index.html +385 -0
data/website/index.txt +423 -0
data/website/javascripts/rounded_corners_lite.inc.js +285 -0
data/website/stylesheets/screen.css +130 -0
data/website/template.rhtml +48 -0
metadata +151 -121
data/README.txt +0 -110
data/lib/roo/.csv.rb.swp +0 -0

data/lib/roo/generic_spreadsheet.rb CHANGED Viewed

@@ -1,39 +1,23 @@
 # encoding: utf-8
-require 'matrix'
+require 'tmpdir'
+require 'stringio'
 # Base class for all other types of spreadsheets
-class GenericSpreadsheet
+class Roo::GenericSpreadsheet
+  include Enumerable
+  TEMP_PREFIX = "oo_"
-  attr_reader :default_sheet
+  attr_reader :default_sheet, :headers
   # sets the line with attribute names (default: 1)
   attr_accessor :header_line
   protected
-  # Helper function for development
-  def fremdrechner? #nodoc
-    eigener = [
-      'C:\Users\thopre',
-      'c:/Users/thopre',
-      '/c/Users/thopre',
-      '/home/tp',
-    ].include? ENV['HOME']
-    #  if eigener
-    #	  puts "fremdrechner? ==> false"
-    #  else
-    #	  puts "fremdrechner? ==> true"
-    #  end
-    ! eigener
-  end
-  def self.next_tmpdir
-    tmpdir = "oo_"+$$.to_s+"_"+sprintf("%010d",rand(10_000_000_000))
-    tmpdir
-  end
   def self.split_coordinate(str)
-    letter,number = GenericSpreadsheet.split_coord(str)
+    letter,number = Roo::GenericSpreadsheet.split_coord(str)
     x = letter_to_number(letter)
     y = number
     return y, x
@@ -52,41 +36,47 @@ class GenericSpreadsheet
   public
+  def initialize(filename, packed=nil, file_warning=:error, tmpdir=nil)
+    @cell = Hash.new{|h,k| h[k] = {}}
+    @cell_type = Hash.new{|h,k| h[k] = {}}
+    @cells_read = {}
+    @first_row = {}
+    @last_row = {}
+    @first_column = {}
+    @last_column = {}
+    @style = {}
+    @style_defaults = Hash.new { |h,k| h[k] = [] }
+    @style_definitions = {}
+    @default_sheet = self.sheets.first
+    @formula = {}
+    @header_line = 1
+  end
   # sets the working sheet in the document
   # 'sheet' can be a number (1 = first sheet) or the name of a sheet.
   def default_sheet=(sheet)
-    if sheet.kind_of? Fixnum
-      if sheet > 0 and sheet <= sheets.length
-        sheet = self.sheets[sheet-1]
-      else
-        raise RangeError
-      end
-    elsif sheet.kind_of?(String)
-      raise RangeError if ! self.sheets.include?(sheet)
-    else
-      raise TypeError, "what are you trying to set as default sheet?"
-    end
+    validate_sheet!(sheet)
     @default_sheet = sheet
-    check_default_sheet
     @first_row[sheet] = @last_row[sheet] = @first_column[sheet] = @last_column[sheet] = nil
     @cells_read[sheet] = false
   end
   # first non-empty column as a letter
   def first_column_as_letter(sheet=nil)
-    GenericSpreadsheet.number_to_letter(first_column(sheet))
+    Roo::GenericSpreadsheet.number_to_letter(first_column(sheet))
   end
   # last non-empty column as a letter
   def last_column_as_letter(sheet=nil)
-    GenericSpreadsheet.number_to_letter(last_column(sheet))
+    Roo::GenericSpreadsheet.number_to_letter(last_column(sheet))
   end
   # returns the number of the first non-empty row
   def first_row(sheet=nil)
-    if sheet == nil
-      sheet = @default_sheet
-    end
+    sheet ||= @default_sheet
     read_cells(sheet) unless @cells_read[sheet]
     if @first_row[sheet]
       return @first_row[sheet]
@@ -94,8 +84,7 @@ class GenericSpreadsheet
     impossible_value = 999_999 # more than a spreadsheet can hold
     result = impossible_value
     @cell[sheet].each_pair {|key,value|
-      y,x = key # _to_string(key).split(',')
-      y = y.to_i
+      y = key.first.to_i # _to_string(key).split(',')
       result = [result, y].min if value
     } if @cell[sheet]
     result = nil if result == impossible_value
@@ -105,7 +94,7 @@ class GenericSpreadsheet
   # returns the number of the last non-empty row
   def last_row(sheet=nil)
-    sheet = @default_sheet unless sheet
+    sheet ||= @default_sheet
     read_cells(sheet) unless @cells_read[sheet]
     if @last_row[sheet]
       return @last_row[sheet]
@@ -113,8 +102,7 @@ class GenericSpreadsheet
     impossible_value = 0
     result = impossible_value
     @cell[sheet].each_pair {|key,value|
-      y,x = key # _to_string(key).split(',')
-      y = y.to_i
+      y = key.first.to_i # _to_string(key).split(',')
       result = [result, y].max if value
     } if @cell[sheet]
     result = nil if result == impossible_value
@@ -124,9 +112,7 @@ class GenericSpreadsheet
   # returns the number of the first non-empty column
   def first_column(sheet=nil)
-    if sheet == nil
-      sheet = @default_sheet
-    end
+    sheet ||= @default_sheet
     read_cells(sheet) unless @cells_read[sheet]
     if @first_column[sheet]
       return @first_column[sheet]
@@ -134,8 +120,7 @@ class GenericSpreadsheet
     impossible_value = 999_999 # more than a spreadsheet can hold
     result = impossible_value
     @cell[sheet].each_pair {|key,value|
-      y,x = key # _to_string(key).split(',')
-      x = x # .to_i
+      x = key.last.to_i # _to_string(key).split(',')
       result = [result, x].min if value
     } if @cell[sheet]
     result = nil if result == impossible_value
@@ -145,7 +130,7 @@ class GenericSpreadsheet
   # returns the number of the last non-empty column
   def last_column(sheet=nil)
-    sheet = @default_sheet unless sheet
+    sheet ||= @default_sheet
     read_cells(sheet) unless @cells_read[sheet]
     if @last_column[sheet]
       return @last_column[sheet]
@@ -153,8 +138,7 @@ class GenericSpreadsheet
     impossible_value = 0
     result = impossible_value
     @cell[sheet].each_pair {|key,value|
-      y,x = key # _to_string(key).split(',')
-      x = x.to_i
+      x = key.last.to_i # _to_string(key).split(',')
       result = [result, x].max if value
     } if @cell[sheet]
     result = nil if result == impossible_value
@@ -166,7 +150,7 @@ class GenericSpreadsheet
   # you can add additional attributes with the prefix parameter like:
   # oo.to_yaml({"file"=>"flightdata_2007-06-26", "sheet" => "1"})
   def to_yaml(prefix={}, from_row=nil, from_column=nil, to_row=nil, to_column=nil,sheet=nil)
-    sheet = @default_sheet unless sheet
+    sheet ||= @default_sheet
     result = "--- \n"
     return '' unless first_row # empty result if there is no first_row in a sheet
@@ -181,7 +165,7 @@ class GenericSpreadsheet
           result << "  col: #{col} \n"
           result << "  celltype: #{self.celltype(row,col,sheet)} \n"
           if self.celltype(row,col,sheet) == :time
-            result << "  value: #{GenericSpreadsheet.integer_to_timestring( self.cell(row,col,sheet))} \n"
+            result << "  value: #{Roo::GenericSpreadsheet.integer_to_timestring( self.cell(row,col,sheet))} \n"
           else
             result << "  value: #{self.cell(row,col,sheet)} \n"
           end
@@ -193,152 +177,117 @@ class GenericSpreadsheet
   # write the current spreadsheet to stdout or into a file
   def to_csv(filename=nil,sheet=nil)
-    sheet = @default_sheet unless sheet
+    sheet ||= @default_sheet
     if filename
-      file = File.open(filename,"w") # do |file|
-      write_csv_content(file,sheet)
-      file.close
+      File.open(filename,"w") do |file|
+        write_csv_content(file,sheet)
+      end
+      return true
     else
-      write_csv_content(STDOUT,sheet)
+      sio = StringIO.new
+      write_csv_content(sio,sheet)
+      sio.rewind
+      return sio.read
     end
-    true
   end
   # returns a matrix object from the whole sheet or a rectangular area of a sheet
   def to_matrix(from_row=nil, from_column=nil, to_row=nil, to_column=nil,sheet=nil)
-    sheet = @default_sheet unless sheet
-    arr = []
-    pos = 0
-    return Matrix.rows([]) unless first_row
+    require 'matrix'
-    (from_row||first_row(sheet)).upto(to_row||last_row(sheet)) do |row|
-      line = []
-      (from_column||first_column(sheet)).upto(to_column||last_column(sheet)) do |col|
+    sheet ||= @default_sheet
+    return Matrix.empty unless first_row
-        line << cell(row,col)
+    Matrix.rows((from_row||first_row(sheet)).upto(to_row||last_row(sheet)).map do |row|
+      (from_column||first_column(sheet)).upto(to_column||last_column(sheet)).map do |col|
+        cell(row,col)
       end
-      arr[pos] = line
-      pos += 1
-    end
-    Matrix.rows(arr)
+    end)
   end
   # find a row either by row number or a condition
   # Caution: this works only within the default sheet -> set default_sheet before you call this method
   # (experimental. see examples in the test_roo.rb file)
   def find(*args) # :nodoc
-    result_array = false
-    args.each {|arg,val|
-      if arg.class == Hash
-        arg.each { |hkey,hval|
-          if hkey == :array and hval == true
-            result_array = true
-          end
-        }
-      end
-    }
-    column_with = {}
-    1.upto(last_column) do |col|
-      column_with[cell(@header_line,col)] = col
-    end
-    result = Array.new
+    options = (args.last.is_a?(Hash) ? args.pop : {})
+    result_array = options[:array]
+    header_for = Hash[1.upto(last_column).map do |col|
+      [col, cell(@header_line,col)]
+    end]
     #-- id
     if args[0].class == Fixnum
       rownum = args[0]
       if @header_line
-        tmp = {}
+        [Hash[1.upto(self.row().size).map {|j|
+          [header_for.fetch(j), cell(rownum,j)]
+        }]]
       else
-        tmp = []
-      end
-      1.upto(self.row(rownum).size) {|j|
-        x = ''
-        column_with.each { |key,val|
-          if val == j
-            x = key
-          end
+        self.row(rownum).size.times.map {|j|
+          cell(rownum,j + 1)
         }
-        if @header_line
-          tmp[x] = cell(rownum,j)
-        else
-          tmp[j-1] = cell(rownum,j)
-        end
-      }
-      if @header_line
-        result = [ tmp ]
-      else
-        result = tmp
       end
-      #-- :all
+    #-- :all
     elsif args[0] == :all
-      if args[1].class == Hash
-        args[1].each {|key,val|
-          if key == :conditions
-            column_with = {}
-            1.upto(last_column) do |col|
-              column_with[cell(@header_line,col)] = col
-            end
-            conditions = val
-            first_row.upto(last_row) do |i|
-              # are all conditions met?
-              found = 1
-              conditions.each { |key,val|
-                if cell(i,column_with[key]) == val
-                  found *= 1
-                else
-                  found *= 0
-                end
-              }
-              if found > 0
-                tmp = {}
-                1.upto(self.row(i).size) {|j|
-                  x = ''
-                  column_with.each { |key,val|
-                    if val == j
-                      x = key
-                    end
-                  }
-                  tmp[x] = cell(i,j)
-                }
-                if result_array
-                  result << self.row(i)
-                else
-                  result << tmp
-                end
-              end
-            end
-          end # :conditions
-        }
+      rows = first_row.upto(last_row)
+      # are all conditions met?
+      if (conditions = options[:conditions]) && !conditions.empty?
+        column_with = header_for.invert
+        rows = rows.select do |i|
+          conditions.all? { |key,val| cell(i,column_with[key]) == val }
+        end
+      end
+      rows.map do |i|
+        if result_array
+          self.row(i)
+        else
+          Hash[1.upto(self.row(i).size).map do |j|
+            [header_for.fetch(j), cell(i,j)]
+          end]
+        end
       end
     end
-    result
   end
   # returns all values in this row as an array
   # row numbers are 1,2,3,... like in the spreadsheet
   def row(rownumber,sheet=nil)
-    sheet = @default_sheet unless sheet
+    sheet ||= @default_sheet
     read_cells(sheet) unless @cells_read[sheet]
-    result = []
-    first_column(sheet).upto(last_column(sheet)) do |col|
-      result << cell(rownumber,col,sheet)
+    first_column(sheet).upto(last_column(sheet)).map do |col|
+      cell(rownumber,col,sheet)
     end
-    result
   end
   # returns all values in this column as an array
   # column numbers are 1,2,3,... like in the spreadsheet
   def column(columnnumber,sheet=nil)
     if columnnumber.class == String
-      columnnumber = Excel.letter_to_number(columnnumber)
+      columnnumber = Roo::Excel.letter_to_number(columnnumber)
     end
-    sheet = @default_sheet unless sheet
+    sheet ||= @default_sheet
     read_cells(sheet) unless @cells_read[sheet]
-    result = []
-    first_row(sheet).upto(last_row(sheet)) do |row|
-      result << cell(row,columnnumber,sheet)
+    first_row(sheet).upto(last_row(sheet)).map do |row|
+      cell(row,columnnumber,sheet)
     end
-    result
+  end
+  # set a cell to a certain value
+  # (this will not be saved back to the spreadsheet file!)
+  def set(row,col,value,sheet=nil) #:nodoc:
+    sheet ||= @default_sheet
+    read_cells(sheet) unless @cells_read[sheet]
+    row, col = normalize(row,col)
+    cell_type = case value
+                when Fixnum then :float
+                when String, Float then :string
+                else
+                  raise ArgumentError, "Type for #{value} not set"
+                end
+    set_value(row,col,value,sheet)
+    set_type(row,col,cell_type,sheet)
   end
   # reopens and read a spreadsheet document
@@ -356,21 +305,12 @@ class GenericSpreadsheet
   # true if cell is empty
   def empty?(row, col, sheet=nil)
-    sheet = @default_sheet unless sheet
-    read_cells(sheet) unless @cells_read[sheet] or self.class == Excel
+    sheet ||= @default_sheet
+    read_cells(sheet) unless @cells_read[sheet] or self.class == Roo::Excel
     row,col = normalize(row,col)
-    return true unless cell(row, col, sheet)
-    return true if celltype(row, col, sheet) == :string && cell(row, col, sheet).empty?
-    return true if row < first_row(sheet) || row > last_row(sheet) || col < first_column(sheet) || col > last_column(sheet)
-    false
-  end
-  # recursively removes the current temporary directory
-  # this is only needed if you work with zipped files or files via the web
-  def remove_tmp
-    if File.exists?(@tmpdir)
-      FileUtils::rm_r(@tmpdir)
-    end
+    contents = cell(row, col, sheet)
+    !contents || (celltype(row, col, sheet) == :string && contents.empty?) \
+      || (row < first_row(sheet) || row > last_row(sheet) || col < first_column(sheet) || col > last_column(sheet))
   end
   # returns information of the spreadsheet document and all sheets within
@@ -388,8 +328,8 @@ class GenericSpreadsheet
       else
         result << "  First row: #{first_row}\n"
         result << "  Last row: #{last_row}\n"
-        result << "  First column: #{GenericSpreadsheet.number_to_letter(first_column)}\n"
-        result << "  Last column: #{GenericSpreadsheet.number_to_letter(last_column)}"
+        result << "  First column: #{Roo::GenericSpreadsheet.number_to_letter(first_column)}\n"
+        result << "  Last column: #{Roo::GenericSpreadsheet.number_to_letter(last_column)}"
       end
       result << "\n" if sheet != sheets.last
       n += 1
@@ -399,7 +339,7 @@ class GenericSpreadsheet
   # returns an XML representation of all sheets of a spreadsheet file
   def to_xml
-    builder = Nokogiri::XML::Builder.new do |xml|
+    Nokogiri::XML::Builder.new do |xml|
       xml.spreadsheet {
         self.sheets.each do |sheet|
           self.default_sheet = sheet
@@ -420,8 +360,7 @@ class GenericSpreadsheet
           }
         end
       }
-    end
-    return builder.to_xml
+    end.to_xml
   end
   # when a method like spreadsheet.a42 is called
@@ -430,12 +369,12 @@ class GenericSpreadsheet
     # #aa42 => #cell('aa',42)
     # #aa42('Sheet1')  => #cell('aa',42,'Sheet1')
     if m =~ /^([a-z]+)(\d)$/
-      col = GenericSpreadsheet.letter_to_number($1)
+      col = Roo::GenericSpreadsheet.letter_to_number($1)
       row = $2.to_i
-      if args.size > 0
-        return cell(row,col,args[0])
+      if args.empty?
+        cell(row,col)
       else
-        return cell(row,col)
+        cell(row,col,args.first)
       end
     else
       super
@@ -448,7 +387,7 @@ class GenericSpreadsheet
   # [row, col, formula]
   def formulas(sheet=nil)
     theformulas = Array.new
-    sheet = @default_sheet unless sheet
+    sheet ||= @default_sheet
     read_cells(sheet) unless @cells_read[sheet]
     return theformulas unless first_row(sheet) # if there is no first row then
     # there can't be formulas
@@ -463,14 +402,127 @@ class GenericSpreadsheet
   end
 =end
+    # FestivalBobcats fork changes begin here
+    # access different worksheets by calling spreadsheet.sheet(1)
+    # or spreadsheet.sheet('SHEETNAME')
+    def sheet(index,name=false)
+      @default_sheet = String === index ? index : self.sheets[index]
+      name ? [@default_sheet,self] : self
+    end
+    # iterate through all worksheets of a document
+    def each_with_pagename
+      self.sheets.each do |s|
+        yield sheet(s,true)
+      end
+    end
+    # by passing in headers as options, this method returns
+    # specific columns from your header assignment
+    # for example:
+    # xls.sheet('New Prices').parse(:upc => 'UPC', :price => 'Price') would return:
+    # [{:upc => 123456789012, :price => 35.42},..]
+    # the queries are matched with regex, so regex options can be passed in
+    # such as :price => '^(Cost|Price)'
+    # case insensitive by default
+    # by using the :header_search option, you can query for headers
+    # and return a hash of every row with the keys set to the header result
+    # for example:
+    # xls.sheet('New Prices').parse(:header_search => ['UPC*SKU','^Price*\sCost\s'])
+    # that example searches for a column titled either UPC or SKU and another
+    # column titled either Price or Cost (regex characters allowed)
+    # * is the wildcard character
+    # you can also pass in a :clean => true option to strip the sheet of
+    # odd unicode characters and white spaces around columns
+    def each(options={})
+      if options.empty?
+        1.upto(last_row) do |line|
+          yield row(line)
+        end
+      else
+        if options[:clean]
+          options.delete(:clean)
+          @cleaned ||= {}
+          @cleaned[@default_sheet] || clean_sheet(@default_sheet)
+        end
+        if options[:header_search]
+          @headers = nil
+          @header_line = row_with(options[:header_search])
+        elsif [:first_row,true].include?(options[:headers])
+          @headers = []
+          row(first_row).each_with_index {|x,i| @headers << [x,i + 1]}
+        else
+          set_headers(options)
+        end
+        headers = @headers ||
+          Hash[(first_column..last_column).map do |col|
+            [cell(@header_line,col), col]
+          end]
+        @header_line.upto(last_row) do |line|
+          yield(Hash[headers.map {|k,v| [k,cell(line,v)]}])
+        end
+      end
+    end
+    def parse(options={})
+      ary = []
+      if block_given?
+        each(options) {|row| ary << yield(row)}
+      else
+        each(options) {|row| ary << row}
+      end
+      ary
+    end
+    def row_with(query,return_headers=false)
+      query.map! {|x| Array(x.split('*'))}
+      line_no = 0
+      each do |row|
+        line_no += 1
+        # makes sure headers is the first part of wildcard search for priority
+        # ex. if UPC and SKU exist for UPC*SKU search, UPC takes the cake
+        headers = query.map do |q|
+          q.map {|i| row.grep(/#{i}/i)[0]}.compact[0]
+        end.compact
+        if headers.length == query.length
+          @header_line = line_no
+          return return_headers ? headers : line_no
+        elsif line_no > 100
+          raise "Couldn't find header row."
+        end
+      end
+    end
+    # this method lets you find the worksheet with the most data
+    def longest_sheet
+      sheet(@workbook.worksheets.inject {|m,o|
+        o.row_count > m.row_count ? o : m
+      }.name)
+    end
   protected
-  def file_type_check(filename, ext, name, packed=nil)
+  def file_type_check(filename, ext, name, warning_level, packed=nil)
     new_expression = {
-      '.ods' => 'Openoffice.new',
-      '.xls' => 'Excel.new',
-      '.xlsx' => 'Excelx.new',
-      '.csv' => 'Csv.new',
+      '.ods' => 'Roo::Openoffice.new',
+      '.xls' => 'Roo::Excel.new',
+      '.xlsx' => 'Roo::Excelx.new',
+      '.csv' => 'Roo::Csv.new',
     }
     if packed == :zip
 	    # lalala.ods.zip => lalala.ods
@@ -480,12 +532,12 @@ class GenericSpreadsheet
     end
     case ext
     when '.ods', '.xls', '.xlsx', '.csv'
-      correct_class = "use #{new_expression[ext]} to handle #{ext} spreadsheet files"
+      correct_class = "use #{new_expression[ext]} to handle #{ext} spreadsheet files. This has #{File.extname(filename).downcase}"
     else
       raise "unknown file type: #{ext}"
     end
     if File.extname(filename).downcase != ext
-      case @file_warning
+      case warning_level
       when :error
         warn correct_class
         raise TypeError, "#{filename} is not #{name} file"
@@ -495,7 +547,7 @@ class GenericSpreadsheet
       when :ignore
         # ignore
       else
-        raise "#{@file_warning} illegal state of file_warning"
+        raise "#{warning_level} illegal state of file_warning"
       end
     end
   end
@@ -506,9 +558,7 @@ class GenericSpreadsheet
   # Zugriff mit numerischen Keys schneller ist.
   def key_to_num(str)
     r,c = str.split(',')
-    r = r.to_i
-    c = c.to_i
-    [r,c]
+    [r.to_i,c.to_i]
   end
   # see: key_to_num
@@ -518,6 +568,47 @@ class GenericSpreadsheet
   private
+  def make_tmpdir(tmp_root = nil)
+    Dir.mktmpdir(TEMP_PREFIX, tmp_root || ENV['ROO_TMP']) do |tmpdir|
+      yield tmpdir
+    end
+  end
+  def clean_sheet(sheet)
+    read_cells(sheet) unless @cells_read[sheet]
+    @cell[sheet].each_pair do |coord,value|
+      if String === value
+        @cell[sheet][coord] = sanitize_value(value)
+      end
+    end
+    @cleaned[sheet] = true
+  end
+  def sanitize_value(v)
+    v.strip.unpack('U*').select {|b| b < 127}.pack('U*')
+  end
+  def set_headers(hash={})
+    # try to find header row with all values or give an error
+    # then create new hash by indexing strings and keeping integers for header array
+    @headers = row_with(hash.values,true)
+    @headers = Hash[hash.keys.zip(@headers.map {|x| header_index(x)})]
+  end
+  def header_index(query)
+    row(@header_line).index(query) + first_column
+  end
+  def set_value(row,col,value,sheet=nil)
+    sheet ||= @default_sheet
+    @cell[sheet][[row,col]] = value
+  end
+  def set_type(row,col,type,sheet=nil)
+    sheet ||= @default_sheet
+    @cell_type[sheet][[row,col]] = type
+  end
   # converts cell coordinate to numeric values of row,col
   def normalize(row,col)
     if row.class == String
@@ -530,43 +621,57 @@ class GenericSpreadsheet
       end
     end
     if col.class == String
-      col = GenericSpreadsheet.letter_to_number(col)
+      col = Roo::GenericSpreadsheet.letter_to_number(col)
     end
     return row,col
   end
-  def open_from_uri(uri)
+  def uri?(filename)
+    filename.start_with?("http://", "https://")
+  end
+  def open_from_uri(uri, tmpdir)
     require 'open-uri'
     response = ''
     begin
       open(uri, "User-Agent" => "Ruby/#{RUBY_VERSION}") { |net|
         response = net.read
-        tempfilename = File.join(@tmpdir, File.basename(uri))
-        f = File.open(tempfilename,"wb")
-        f.write(response)
-        f.close
+        tempfilename = File.join(tmpdir, File.basename(uri))
+        File.open(tempfilename,"wb") do |file|
+          file.write(response)
+        end
       }
     rescue OpenURI::HTTPError
       raise "could not open #{uri}"
     end
-    File.join(@tmpdir, File.basename(uri))
+    File.join(tmpdir, File.basename(uri))
   end
-  def open_from_stream(stream)
-    tempfilename = File.join(@tmpdir, "spreadsheet")
-    f = File.open(tempfilename,"wb")
-    f.write(stream[7..-1])
-    f.close
-    File.join(@tmpdir, "spreadsheet")
+  def open_from_stream(stream, tmpdir)
+    tempfilename = File.join(tmpdir, "spreadsheet")
+    File.open(tempfilename,"wb") do |file|
+      file.write(stream[7..-1])
+    end
+    File.join(tmpdir, "spreadsheet")
   end
+  LETTERS = %w{A B C D E F G H I J K L M N O P Q R S T U V W X Y Z}
   # convert a number to something like 'AB' (1 => 'A', 2 => 'B', ...)
   def self.number_to_letter(n)
     letters=""
-    while n > 0
-      num = n%26
-      letters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"[num-1,1] + letters
-      n = n.div(26)
+    if n > 26
+      while n % 26 == 0 && n != 0
+        letters << 'Z'
+        n = (n - 26) / 26
+      end
+      while n > 0
+        num = n%26
+        letters = LETTERS[num-1] + letters
+        n = (n / 26)
+      end
+    else
+      letters = LETTERS[n-1]
     end
     letters
   end
@@ -576,7 +681,7 @@ class GenericSpreadsheet
     result = 0
     while letters && letters.length > 0
       character = letters[0,1].upcase
-      num = "ABCDEFGHIJKLMNOPQRSTUVWXYZ".index(character)
+      num = LETTERS.index(character)
       raise ArgumentError, "invalid column character '#{letters[0,1]}'" if num == nil
       num += 1
       result = result * 26 + num
@@ -585,106 +690,105 @@ class GenericSpreadsheet
     result
   end
-  def unzip(filename)
-    ret = nil
+  def unzip(filename, tmpdir)
     Zip::ZipFile.open(filename) do |zip|
-      ret = process_zipfile_packed zip
+      process_zipfile_packed(zip, tmpdir)
     end
-    ret
   end
   # check if default_sheet was set and exists in sheets-array
-  def check_default_sheet
-    sheet_found = false
-    raise ArgumentError, "Error: default_sheet not set" if @default_sheet == nil
-    if sheets.index(@default_sheet)
-      sheet_found = true
-    end
-    if ! sheet_found
-      raise RangeError, "sheet '#{@default_sheet}' not found"
+  def validate_sheet!(sheet)
+    case sheet
+    when nil
+      raise ArgumentError, "Error: sheet 'nil' not valid"
+    when Fixnum
+      self.sheets.fetch(sheet-1) do
+        raise RangeError, "sheet index #{sheet} not found"
+      end
+    when String
+      if !sheets.include? sheet
+        raise RangeError, "sheet '#{sheet}' not found"
+      end
+    else
+      raise TypeError, "not a valid sheet type: #{sheet.inspect}"
     end
   end
-  def process_zipfile_packed(zip, path='')
-    ret=nil
+  def process_zipfile_packed(zip, tmpdir, path='')
     if zip.file.file? path
       # extract and return filename
-      file = File.open(File.join(@tmpdir, path),"wb")
-      file.write(zip.read(path))
-      file.close
-      return File.join(@tmpdir, path)
-    else
-      unless path.empty?
-        path += '/'
+      File.open(File.join(tmpdir, path),"wb") do |file|
+        file.write(zip.read(path))
       end
+      File.join(tmpdir, path)
+    else
+      ret=nil
+      path += '/' unless path.empty?
       zip.dir.foreach(path) do |filename|
-        ret = process_zipfile_packed(zip, path + filename)
+        ret = process_zipfile_packed(zip, tmpdir, path + filename)
       end
+      ret
     end
-    ret
   end
   # Write all cells to the csv file. File can be a filename or nil. If the this
   # parameter is nil the output goes to STDOUT
   def write_csv_content(file=nil,sheet=nil)
-    file = STDOUT unless file
+    file ||= STDOUT
     if first_row(sheet) # sheet is not empty
       1.upto(last_row(sheet)) do |row|
         1.upto(last_column(sheet)) do |col|
           file.print(",") if col > 1
-          onecell = cell(row,col,sheet)
-          onecelltype = celltype(row,col,sheet)
-          file.print one_cell_output(onecelltype,onecell,empty?(row,col,sheet))
+          file.print cell_to_csv(row,col,sheet)
         end
         file.print("\n")
       end # sheet not empty
     end
   end
-  # The content of a cell in the csv output
-  def one_cell_output(onecelltype, onecell, empty)
-    str = ""
-    if empty
-      str += ''
+  # The content of a cell in the csv output
+  def cell_to_csv(row, col, sheet)
+    if empty?(row,col,sheet)
+      ''
     else
-      case onecelltype
+      onecell = cell(row,col,sheet)
+      case celltype(row,col,sheet)
       when :string
         unless onecell.empty?
-          one = onecell.gsub(/"/,'""')
-          str << ('"'+one+'"')
+          %{"#{onecell.gsub(/"/,'""')}"}
         end
       when :float, :percentage
         if onecell == onecell.to_i
-          str << onecell.to_i.to_s
+          onecell.to_i.to_s
         else
-          str << onecell.to_s
+          onecell.to_s
         end
       when :formula
-        if onecell.class == String
+        case onecell
+        when String
           unless onecell.empty?
-            one = onecell.gsub(/"/,'""')
-            str << '"'+one+'"'
+            %{"#{onecell.gsub(/"/,'""')}"}
           end
-        elsif onecell.class == Float
+        when Float
           if onecell == onecell.to_i
-            str << onecell.to_i.to_s
+            onecell.to_i.to_s
           else
-            str << onecell.to_s
+            onecell.to_s
           end
+        when DateTime
+          onecell.to_s
         else
-          raise "unhandled onecell-class "+onecell.class.to_s
+          raise "unhandled onecell-class #{onecell.class}"
         end
-      when :date
-        str << onecell.to_s
+      when :date, :datetime
+        onecell.to_s
       when :time
-        str << GenericSpreadsheet.integer_to_timestring(onecell)
-      when :datetime
-        str << onecell.to_s
+        Roo::GenericSpreadsheet.integer_to_timestring(onecell)
       else
-        raise "unhandled celltype "+onecelltype.to_s
-      end
+        raise "unhandled celltype #{celltype(row,col,sheet)}"
+      end || ""
     end
-    str
   end
   # converts an integer value to a time string like '02:05:06'
@@ -696,5 +800,4 @@ class GenericSpreadsheet
     s = content
     sprintf("%02d:%02d:%02d",h,m,s)
   end
 end