RubyGems - statsample - Versions diffs - 1.5.0 → 2.0.0 - Mend

statsample 1.5.0 → 2.0.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (114) hide show

checksums.yaml +4 -4
data/.build.sh +15 -0
data/.gitignore +1 -0
data/.travis.yml +19 -7
data/CONTRIBUTING.md +33 -0
data/History.txt +5 -0
data/README.md +41 -53
data/benchmarks/correlation_matrix_15_variables.rb +6 -5
data/benchmarks/correlation_matrix_5_variables.rb +6 -5
data/benchmarks/correlation_matrix_methods/correlation_matrix.rb +23 -26
data/examples/boxplot.rb +17 -5
data/examples/correlation_matrix.rb +36 -7
data/examples/dataset.rb +25 -5
data/examples/dominance_analysis.rb +8 -7
data/examples/dominance_analysis_bootstrap.rb +16 -11
data/examples/histogram.rb +16 -2
data/examples/icc.rb +5 -6
data/examples/levene.rb +17 -3
data/examples/multiple_regression.rb +6 -3
data/examples/parallel_analysis.rb +11 -6
data/examples/polychoric.rb +26 -13
data/examples/principal_axis.rb +8 -4
data/examples/reliability.rb +10 -10
data/examples/scatterplot.rb +8 -0
data/examples/t_test.rb +7 -0
data/examples/u_test.rb +10 -2
data/examples/vector.rb +9 -6
data/examples/velicer_map_test.rb +12 -8
data/lib/statsample.rb +13 -47
data/lib/statsample/analysis/suite.rb +1 -1
data/lib/statsample/anova/oneway.rb +6 -6
data/lib/statsample/anova/twoway.rb +26 -24
data/lib/statsample/bivariate.rb +78 -61
data/lib/statsample/bivariate/pearson.rb +2 -2
data/lib/statsample/codification.rb +45 -32
data/lib/statsample/converter/csv.rb +15 -53
data/lib/statsample/converter/spss.rb +6 -5
data/lib/statsample/converters.rb +50 -211
data/lib/statsample/crosstab.rb +26 -25
data/lib/statsample/daru.rb +117 -0
data/lib/statsample/dataset.rb +70 -942
data/lib/statsample/dominanceanalysis.rb +16 -17
data/lib/statsample/dominanceanalysis/bootstrap.rb +26 -28
data/lib/statsample/factor/parallelanalysis.rb +17 -19
data/lib/statsample/factor/pca.rb +21 -20
data/lib/statsample/factor/principalaxis.rb +3 -3
data/lib/statsample/graph/boxplot.rb +8 -16
data/lib/statsample/graph/histogram.rb +4 -4
data/lib/statsample/graph/scatterplot.rb +8 -7
data/lib/statsample/histogram.rb +128 -119
data/lib/statsample/matrix.rb +20 -16
data/lib/statsample/multiset.rb +39 -38
data/lib/statsample/regression.rb +3 -3
data/lib/statsample/regression/multiple.rb +8 -10
data/lib/statsample/regression/multiple/alglibengine.rb +96 -89
data/lib/statsample/regression/multiple/baseengine.rb +32 -32
data/lib/statsample/regression/multiple/gslengine.rb +33 -36
data/lib/statsample/regression/multiple/matrixengine.rb +7 -9
data/lib/statsample/regression/multiple/rubyengine.rb +39 -41
data/lib/statsample/reliability.rb +23 -25
data/lib/statsample/reliability/icc.rb +8 -7
data/lib/statsample/reliability/multiscaleanalysis.rb +14 -12
data/lib/statsample/reliability/scaleanalysis.rb +58 -60
data/lib/statsample/reliability/skillscaleanalysis.rb +34 -29
data/lib/statsample/resample.rb +1 -1
data/lib/statsample/shorthand.rb +29 -25
data/lib/statsample/test/kolmogorovsmirnov.rb +5 -3
data/lib/statsample/test/levene.rb +28 -27
data/lib/statsample/test/t.rb +7 -9
data/lib/statsample/test/umannwhitney.rb +28 -28
data/lib/statsample/test/wilcoxonsignedrank.rb +45 -43
data/lib/statsample/vector.rb +70 -1013
data/lib/statsample/version.rb +1 -1
data/statsample.gemspec +12 -16
data/test/helpers_tests.rb +1 -1
data/test/test_analysis.rb +17 -17
data/test/test_anova_contrast.rb +6 -6
data/test/test_anovatwowaywithdataset.rb +8 -8
data/test/test_anovawithvectors.rb +8 -8
data/test/test_awesome_print_bug.rb +1 -1
data/test/test_bartlettsphericity.rb +4 -4
data/test/test_bivariate.rb +48 -43
data/test/test_codification.rb +33 -33
data/test/test_crosstab.rb +9 -9
data/test/test_dataset.rb +28 -458
data/test/test_factor.rb +46 -38
data/test/test_factor_pa.rb +22 -13
data/test/test_ggobi.rb +4 -4
data/test/test_gsl.rb +4 -4
data/test/test_histogram.rb +3 -3
data/test/test_matrix.rb +13 -13
data/test/test_multiset.rb +103 -91
data/test/test_regression.rb +57 -52
data/test/test_reliability.rb +55 -45
data/test/test_reliability_icc.rb +8 -8
data/test/test_reliability_skillscale.rb +26 -24
data/test/test_resample.rb +1 -1
data/test/test_statistics.rb +3 -13
data/test/test_stest.rb +9 -9
data/test/test_stratified.rb +3 -3
data/test/test_test_t.rb +12 -12
data/test/test_umannwhitney.rb +2 -2
data/test/test_vector.rb +76 -613
data/test/test_wilcoxonsignedrank.rb +4 -4
metadata +57 -28
data/lib/statsample/rserve_extension.rb +0 -20
data/lib/statsample/vector/gsl.rb +0 -106
data/test/fixtures/repeated_fields.csv +0 -7
data/test/fixtures/scientific_notation.csv +0 -4
data/test/fixtures/test_csv.csv +0 -7
data/test/fixtures/test_xls.xls +0 -0
data/test/test_csv.rb +0 -63
data/test/test_rserve_extension.rb +0 -42
data/test/test_xls.rb +0 -52

data/lib/statsample/bivariate/pearson.rb CHANGED

@@ -7,8 +7,8 @@ module Statsample
     # variables.
     #
     # == Usage
-    #   a = [1,2,3,4,5,6].to_numeric
-    #   b = [2,3,4,5,6,7].to_numeric
+    #   a = Daru::Vector.new([1,2,3,4,5,6])
+    #   b = Daru::Vector.new([2,3,4,5,6,7])
     #   pearson = Statsample::Bivariate::Pearson.new(a,b)
     #   puts pearson.r
     #   puts pearson.t

data/lib/statsample/codification.rb CHANGED

@@ -34,24 +34,33 @@ module Statsample
       # will be hashes, with keys = values, for recodification
       def create_hash(dataset, vectors, sep=Statsample::SPLIT_TOKEN)
         raise ArgumentError,"Array should't be empty" if vectors.size==0
-        pro_hash=vectors.inject({}){|h,v_name|
-          raise Exception, "Vector #{v_name} doesn't exists on Dataset" if !dataset.fields.include? v_name
-          v=dataset[v_name]
-          split_data=v.splitted(sep).flatten.collect {|c| c.to_s}.find_all {|c| !c.nil?}
+        pro_hash = vectors.inject({}) do |h,v_name|
+          v_name = v_name.is_a?(Numeric) ? v_name : v_name.to_sym
+          raise Exception, "Vector #{v_name} doesn't exists on Dataset" if
+            !dataset.vectors.include?(v_name)
+          v = dataset[v_name]
+          split_data = v.splitted(sep)
+                        .flatten
+                        .collect { |c| c.to_s  }
+                        .find_all{ |c| !c.nil? }
-          factors=split_data.uniq.compact.sort.inject({}) {|ac,val| ac[val]=val;ac }
-          h[v_name]=factors
+          factors   = split_data.uniq
+                                .compact
+                                .sort
+                                .inject({}) { |ac,val| ac[val] = val; ac }
+          h[v_name] = factors
           h
-        }
+        end
         pro_hash
       end
       # Create a yaml to create a dictionary, based on vectors
       # The keys will be vectors name on dataset and the values
       # will be hashes, with keys = values, for recodification
       #
-      #   v1=%w{a,b b,c d}.to_vector
-      #   ds={"v1"=>v1}.to_dataset
-      #   Statsample::Codification.create_yaml(ds,['v1'])
+      #   v1 = Daru::Vector.new(%w{a,b b,c d})
+      #   ds = Daru::DataFrame.new({:v1 => v1})
+      #   Statsample::Codification.create_yaml(ds,[:v1])
       #   => "--- \nv1: \n  a: a\n  b: b\n  c: c\n  d: d\n"
       def create_yaml(dataset, vectors, io=nil, sep=Statsample::SPLIT_TOKEN)
         pro_hash=create_hash(dataset, vectors, sep)
@@ -69,16 +78,17 @@ module Statsample
         if File.exist?(filename)
           raise "Exists a file named #{filename}. Delete ir before overwrite."
         end
-        book = Spreadsheet::Workbook.new
+        book  = Spreadsheet::Workbook.new
         sheet = book.create_worksheet
-        sheet.row(0).concat(%w{field original recoded})
-        i=1
+        sheet.row(0).concat(%w(field original recoded))
+        i = 1
         create_hash(dataset, vectors, sep).sort.each do |field, inner_hash|
           inner_hash.sort.each do |k,v|
-            sheet.row(i).concat([field.dup,k.dup,v.dup])
-            i+=1
+            sheet.row(i).concat([field.to_s,k.to_s,v.to_s])
+            i += 1
           end
         end
         book.write(filename)
       end
       # From a excel generates a dictionary hash
@@ -91,10 +101,11 @@ module Statsample
         sheet= book.worksheet 0
         row_i=0
         sheet.each do |row|
-          row_i+=1
-          next if row_i==1 or row[0].nil? or row[1].nil? or row[2].nil?
-          h[row[0]]={} if h[row[0]].nil?
-          h[row[0]][row[1]]=row[2]
+          row_i += 1
+          next if row_i == 1 or row[0].nil? or row[1].nil? or row[2].nil?
+          key = row[0].to_sym
+          h[key] ||= {}
+          h[key][row[1]] = row[2]
         end
         h
       end
@@ -110,12 +121,12 @@ module Statsample
       end
       def dictionary(h, sep=Statsample::SPLIT_TOKEN)
-        h.inject({}) {|a,v| a[v[0]]=v[1].split(sep); a }
+        h.inject({}) { |a,v| a[v[0]]=v[1].split(sep); a }
       end
       def recode_vector(v,h,sep=Statsample::SPLIT_TOKEN)
-        dict=dictionary(h,sep)
-        new_data=v.splitted(sep)
+        dict     = dictionary(h,sep)
+        new_data = v.splitted(sep)
         new_data.collect do |c|
           if c.nil?
             nil
@@ -134,20 +145,22 @@ module Statsample
       def _recode_dataset(dataset, h , sep=Statsample::SPLIT_TOKEN, split=false)
         v_names||=h.keys
         v_names.each do |v_name|
-          raise Exception, "Vector #{v_name} doesn't exists on Dataset" if !dataset.fields.include? v_name
-          recoded=recode_vector(dataset[v_name], h[v_name],sep).collect { |c|
-            if c.nil?
-              nil
-            else
-              c.join(sep)
+          raise Exception, "Vector #{v_name} doesn't exists on Dataset" if !dataset.vectors.include? v_name
+          recoded = Daru::Vector.new(
+            recode_vector(dataset[v_name], h[v_name],sep).collect do |c|
+              if c.nil?
+                nil
+              else
+                c.join(sep)
+              end
             end
-          }.to_vector
-          if(split)
+          )
+          if split
             recoded.split_by_separator(sep).each {|k,v|
-              dataset[v_name+"_"+k]=v
+              dataset[(v_name.to_s + "_" + k).to_sym] = v
             }
           else
-            dataset[v_name+"_recoded"]=recoded
+            dataset[(v_name.to_s + "_recoded").to_sym] = recoded
           end
         end
       end

data/lib/statsample/converter/csv.rb CHANGED

@@ -1,65 +1,27 @@
-require 'csv'
+# This module will be removed in the next release.
+# Please shift to using Daru::DataFrame.from_csv and #write_csv for CSV
+# related operations.
 module Statsample
-  class CSV < SpreadsheetBase
-    # Default options for processing CSV files. Accept the same options as
-    # Ruby's `CSV#new`.
-    DEFAULT_OPTIONS = {
-      converters: [:numeric]
-    }
+  class CSV
     class << self
-      # Return a Dataset created from a csv file.
+      # Return a DataFrom created from a csv file.
       #
-      # USE:
-      #     ds = Statsample::CSV.read('test_csv.csv')
+      # == NOTE
+      #
+      # This method has been DEPRECATED in favour of Daru::DataFrame.from_csv.
+      # Please switch to using that.
       def read(filename, empty = [''], ignore_lines = 0, opts = {})
-        first_row = true
-        fields = []
-        ds = nil
-        line_number = 0
-        options = DEFAULT_OPTIONS.merge(opts)
-        csv = ::CSV.open(filename, 'rb', options)
-        csv.each do |row|
-          line_number += 1
-          if (line_number <= ignore_lines)
-            next
-          end
-          if first_row
-            fields = extract_fields(row)
-            ds = Statsample::Dataset.new(fields)
-            first_row = false
-          else
-            rowa = process_row(row, empty)
-            ds.add_case(rowa, false)
-          end
-        end
-        convert_to_numeric_and_date(ds, fields)
-        ds.update_valid_data
-        ds
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame.from_csv instead."
       end
       # Save a Dataset on a csv file.
       #
-      # USE:
-      #     Statsample::CSV.write(ds, 'test_csv.csv')
+      # == NOTE
+      #
+      # This method has BEEN DEPRECATED in favor of Daru::DataFrame#write_csv.
+      # Please use that instead.
       def write(dataset, filename, convert_comma = false, opts = {})
-        options = DEFAULT_OPTIONS.merge(opts)
-        writer = ::CSV.open(filename, 'w', options)
-        writer << dataset.fields
-        dataset.each_array do |row|
-          row.collect! { |v| v.to_s.gsub('.', ',') } if convert_comma
-          writer << row
-        end
-        writer.close
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame#write_csv instead."
       end
     end
   end

data/lib/statsample/converter/spss.rb CHANGED

@@ -4,26 +4,27 @@ module Statsample
       # Export a SPSS Matrix with tetrachoric correlations .
       #
       # Use:
-      #   ds=Statsample::Excel.read("my_data.xls")
+      #   ds=Daru::DataFrame.from_excel("my_data.xls")
       #   puts Statsample::SPSS.tetrachoric_correlation_matrix(ds)
       def tetrachoric_correlation_matrix(ds)
         dsv=ds.dup_only_valid
         # Delete all vectors doesn't have variation
-        dsv.fields.each{|f|
+        dsv.vectors.each { |f|
           if dsv[f].factors.size==1
             dsv.delete_vector(f)
           else
             dsv[f]=dsv[f].dichotomize
           end
         }
         tcm=Statsample::Bivariate.tetrachoric_correlation_matrix(dsv)
-        n=dsv.fields.collect {|f|
+        n=dsv.vectors.to_a.collect {|f|
           sprintf("%d",dsv[f].size)
         }
-        meanlist=dsv.fields.collect{|f|
+        meanlist=dsv.vectors.to_a.collect{|f|
           sprintf("%0.3f", dsv[f].mean)
         }
-        stddevlist=dsv.fields.collect{|f|
+        stddevlist=dsv.vectors.to_a.collect{|f|
           sprintf("%0.3f", dsv[f].sd)
         }
         out=<<-HEREDOC

data/lib/statsample/converters.rb CHANGED

@@ -1,63 +1,36 @@
 require 'statsample/converter/spss'
 module Statsample
-    # Create and dumps Datasets on a database
+  # Create and dumps Datasets on a database
+  #
+  # == NOTE
+  #
+  # Deprecated. Use Daru::DataFrame.from_sql and Daru::DataFrame#write_sql
   module Database
     class << self
       # Read a database query and returns a Dataset
       #
-      # USE:
-      #
-      #  dbh = DBI.connect("DBI:Mysql:database:localhost", "user", "password")
-      #  Statsample.read(dbh, "SELECT * FROM test")
-      #
+      # == NOTE
+      #
+      # Deprecated. Use Daru::DataFrame.from_sql instead.
       def read(dbh,query)
-        require 'dbi'
-        sth=dbh.execute(query)
-        vectors={}
-        fields=[]
-        sth.column_info.each {|c|
-            vectors[c['name']]=Statsample::Vector.new([])
-            vectors[c['name']].name=c['name']
-            vectors[c['name']].type= (c['type_name']=='INTEGER' or c['type_name']=='DOUBLE') ? :numeric : :object
-            fields.push(c['name'])
-        }
-        ds=Statsample::Dataset.new(vectors,fields)
-        sth.fetch do |row|
-            ds.add_case(row.to_a, false )
-        end
-        ds.update_valid_data
-        ds
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame.from_sql instead."
       end
       # Insert each case of the Dataset on the selected table
       #
-      # USE:
-      #
-      #  ds={'id'=>[1,2,3].to_vector, 'name'=>["a","b","c"].to_vector}.to_dataset
-      #  dbh = DBI.connect("DBI:Mysql:database:localhost", "user", "password")
-      #  Statsample::Database.insert(ds,dbh,"test")
-      #
+      # == NOTE
+      #
+      # Deprecated. Use Daru::DataFrame#write_sql instead
       def insert(ds, dbh, table)
-        require 'dbi'
-        query="INSERT INTO #{table} ("+ds.fields.join(",")+") VALUES ("+((["?"]*ds.fields.size).join(","))+")"
-        sth=dbh.prepare(query)
-        ds.each_array{|c| sth.execute(*c) }
-        return true
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame#write_sql instead."
       end
       # Create a sql, basen on a given Dataset
       #
-      # USE:
-      #
-      #  ds={'id'=>[1,2,3,4,5].to_vector,'name'=>%w{Alex Peter Susan Mary John}.to_vector}.to_dataset
-      #  Statsample::Database.create_sql(ds,'names')
-      #   ==>"CREATE TABLE names (id INTEGER,\n name VARCHAR (255)) CHARACTER SET=UTF8;"
-      #
+      # == NOTE
+      #
+      # Deprecated. Use Daru::DataFrame#create_sql instead.
       def create_sql(ds,table,charset="UTF8")
-        sql="CREATE TABLE #{table} ("
-        fields=ds.fields.collect{|f|
-            v=ds[f]
-            f+" "+v.db_type
-        }
-        sql+fields.join(",\n ")+") CHARACTER SET=#{charset};"
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame#create_sql instead."
       end
     end
   end
@@ -65,182 +38,49 @@ module Statsample
     class << self
       def write(dataset,filename)
         File.open(filename,"wb") do |fp|
-          fp.puts dataset.fields.join("\t")
-          dataset.each_array_with_nils do |row|
-            row2=row.collect{|v| v.nil? ? "NA" : v.to_s.gsub(/\s+/,"_") }
+          fp.puts dataset.vectors.to_a.join("\t")
+          dataset.each_row do |row|
+            row2 = row.map { |v| v.nil? ? "NA" : v.to_s.gsub(/\s+/,"_") }
             fp.puts row2.join("\t")
           end
         end
       end
     end
   end
-  class SpreadsheetBase
-    class << self
-      def extract_fields(row)
-        i=0;
-        fields=row.to_a.collect{|c|
-          if c.nil?
-            i+=1
-            "var%05d" % i
-          else
-            c.to_s.downcase
-          end
-        }
-        fields.recode_repeated
-      end
-      def process_row(row,empty)
-        row.to_a.map do |c|
-          if empty.include?(c)
-              nil
-          else
-            if c.is_a? String and c.is_number?
-              if c=~/^\d+$/
-                c.to_i
-              else
-                c.gsub(",",".").to_f
-              end
-            else
-              c
-            end
-          end
-        end
-      end
-      def convert_to_numeric_and_date(ds,fields)
-        fields.each do |f|
-          if ds[f].can_be_numeric?
-            ds[f].type=:numeric
-          elsif ds[f].can_be_date?
-            ds[f].type=:date
-          end
-        end
+  class PlainText
+    class << self
+      def read(filename, fields)
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame.from_plaintext instead."
       end
     end
   end
-    class PlainText < SpreadsheetBase
-      class << self
-        def read(filename, fields)
-          ds=Statsample::Dataset.new(fields)
-          fp=File.open(filename,"r")
-          fp.each_line do |line|
-            row=process_row(line.strip.split(/\s+/),[""])
-            next if row==["\x1A"]
-            ds.add_case_array(row)
-          end
-          convert_to_numeric_and_date(ds,fields)
-          ds.update_valid_data
-          fields.each {|f|
-            ds[f].name=f
-          }
-          ds
-        end
-      end
-    end
-  class Excel < SpreadsheetBase
+  # This class has been DEPRECATED. Use Daru::DataFrame::from_excel
+  # Daru::DataFrame#write_excel for XLS file operations.
+  class Excel
     class << self
       # Write a Excel spreadsheet based on a dataset
       # * TODO: Format nicely date values
+      #
+      # == NOTE
+      #
+      # Deprecated. Use Daru::DataFrame#write_csv.
       def write(dataset,filename)
-        require 'spreadsheet'
-        book = Spreadsheet::Workbook.new
-        sheet = book.create_worksheet
-        format = Spreadsheet::Format.new :color => :blue,
-                           :weight => :bold
-        sheet.row(0).concat(dataset.fields.map {|i| i.dup}) # Unfreeze strings
-        sheet.row(0).default_format = format
-        i=1
-        dataset.each_array{|row|
-          sheet.row(i).concat(row)
-          i+=1
-        }
-        book.write(filename)
-      end
-      # This should be fixed.
-      # If we have a Formula, should be resolver first
-      def preprocess_row(row, dates)
-        i=-1
-        row.collect!{|c|
-          i+=1
-          if c.is_a? Spreadsheet::Formula
-            if(c.value.is_a? Spreadsheet::Excel::Error)
-              nil
-            else
-              c.value
-            end
-          elsif dates.include? i and !c.nil? and c.is_a? Numeric
-              row.date(i)
-          else
-              c
-          end
-        }
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame#write_excel instead."
       end
-      private :process_row, :preprocess_row
       # Returns a dataset based on a xls file
-      # USE:
-      #     ds = Statsample::Excel.read("test.xls")
-      #
+      #
+      # == NOTE
+      #
+      # Deprecated. Use Daru::DataFrame.from_excel instead.
       def read(filename, opts=Hash.new)
-        require 'spreadsheet'
-        raise "options should be Hash" unless opts.is_a? Hash
-        opts_default={
-          :worksheet_id=>0,
-          :ignore_lines=>0,
-          :empty=>['']
-        }
-        opts=opts_default.merge opts
-        worksheet_id=opts[:worksheet_id]
-        ignore_lines=opts[:ignore_lines]
-        empty=opts[:empty]
-        first_row=true
-        fields=[]
-        ds=nil
-        line_number=0
-        book = Spreadsheet.open filename
-        sheet= book.worksheet worksheet_id
-        sheet.each do |row|
-          begin
-            dates=[]
-            row.formats.each_index{|i|
-              if !row.formats[i].nil? and row.formats[i].number_format=="DD/MM/YYYY"
-                dates.push(i)
-              end
-            }
-            line_number+=1
-            next if(line_number<=ignore_lines)
-            preprocess_row(row,dates)
-            if first_row
-              fields=extract_fields(row)
-              ds=Statsample::Dataset.new(fields)
-              first_row=false
-            else
-              rowa=process_row(row,empty)
-              (fields.size - rowa.size).times {
-                rowa << nil
-              }
-              ds.add_case(rowa,false)
-            end
-          rescue => e
-            error="#{e.to_s}\nError on Line # #{line_number}:#{row.join(",")}"
-            raise
-          end
-        end
-        convert_to_numeric_and_date(ds, fields)
-        ds.update_valid_data
-        fields.each {|f|
-          ds[f].name=f
-        }
-        ds.name=filename
-        ds
+        raise NoMethodError, "Deprecated. Use Daru::DataFrame.from_excel instead."
       end
     end
   end
   module Mx
     class << self
       def write(dataset,filename,type=:covariance)
@@ -249,12 +89,12 @@ module Statsample
           fp.puts "! #{filename}"
           fp.puts "! Output generated by Statsample"
           fp.puts "Data Ninput=#{dataset.fields.size} Nobservations=#{dataset.cases}"
-          fp.puts "Labels "+dataset.fields.join(" ")
+          fp.puts "Labels " + dataset.vectors.to_a.join(" ")
           case type
             when :raw
             fp.puts "Rectangular"
             dataset.each do |row|
-              out=dataset.fields.collect do |f|
+              out=dataset.vectors.to_a.collect do |f|
                 if dataset[f].is_valid? row[f]
                   row[f]
                 else
@@ -292,18 +132,18 @@ module Statsample
 				carrier=OpenStruct.new
 				carrier.categorials=[]
 				carrier.conversions={}
-				variables_def=dataset.fields.collect{|k|
+				variables_def=dataset.vectors.to_a.collect{|k|
 					variable_definition(carrier,dataset[k],k)
 				}.join("\n")
 				indexes=carrier.categorials.inject({}) {|s,c|
-					s[dataset.fields.index(c)]=c
+					s[dataset.vectors.to_a.index(c)]=c
 					s
 				}
 				records=""
-				dataset.each_array {|c|
-					indexes.each{|ik,iv|
-						c[ik]=carrier.conversions[iv][c[ik]]
+				dataset.each_row {|c|
+					indexes.each { |ik,iv|
+						c[ik] = carrier.conversions[iv][c[ik]]
 					}
 					records << "<record>#{values_definition(c, default_opt[:missing])}</record>\n"
 				}
@@ -345,7 +185,7 @@ out
 			# nickname = nickname
 			def variable_definition(carrier,v,name,nickname=nil)
 				nickname = (nickname.nil? ? "" : "nickname=\"#{nickname}\"" )
-				if v.type==:object or v.data.find {|d|  d.is_a? String }
+				if v.type==:object or v.to_a.find {|d|  d.is_a? String }
 					carrier.categorials.push(name)
 					carrier.conversions[name]={}
 					factors=v.factors
@@ -353,17 +193,16 @@ out
 					out << "<levels count=\"#{factors.size}\">\n"
 					out << (1..factors.size).to_a.collect{|i|
 						carrier.conversions[name][factors[i-1]]=i
-						"<level value=\"#{i}\">#{v.labeling(factors[i-1])}</level>"
+						"<level value=\"#{i}\">#{(v.labels[factors[i-1]] || factors[i-1])}</level>"
 					}.join("\n")
 					out << "</levels>\n</categoricalvariable>\n"
 					out
-				elsif v.data.find {|d| d.is_a? Float}
+				elsif v.to_a.find {|d| d.is_a? Float}
 					"<realvariable name=\"#{name}\" #{nickname} />"
 				else
 					"<integervariable name=\"#{name}\" #{nickname} />"
 				end
 			end
 		end
 	end
 end