RubyGems - statsample - Versions diffs - 0.6.3 → 0.6.4 - Mend

statsample 0.6.3 → 0.6.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (28) hide show

data/History.txt +6 -0
data/Manifest.txt +4 -0
data/README.txt +5 -5
data/demo/dominance_analysis_bootstrap.rb +9 -3
data/demo/dominanceanalysis.rb +23 -7
data/demo/multivariate_correlation.rb +26 -0
data/lib/statsample.rb +1 -1
data/lib/statsample/bivariate.rb +24 -4
data/lib/statsample/bivariate/polychoric.rb +15 -14
data/lib/statsample/converters.rb +27 -23
data/lib/statsample/crosstab.rb +1 -44
data/lib/statsample/dominanceanalysis.rb +158 -64
data/lib/statsample/dominanceanalysis/bootstrap.rb +16 -7
data/lib/statsample/matrix.rb +145 -13
data/lib/statsample/multiset.rb +248 -265
data/lib/statsample/regression.rb +3 -0
data/lib/statsample/regression/multiple.rb +65 -23
data/lib/statsample/regression/multiple/baseengine.rb +19 -20
data/lib/statsample/regression/multiple/matrixengine.rb +187 -0
data/lib/statsample/regression/multiple/rubyengine.rb +58 -98
data/test/test_bivariate.rb +1 -0
data/test/test_crosstab.rb +0 -3
data/test/test_dataset.rb +379 -379
data/test/test_dominance_analysis.rb +43 -0
data/test/test_matrix.rb +52 -0
data/test/test_regression.rb +174 -129
data/test/test_svg_graph.rb +51 -51
metadata +29 -3

data/History.txt CHANGED Viewed

@@ -1,6 +1,12 @@
+=== 0.6.4 / 2010-02-19
+* Dominance Analysis and Dominance Analysis Bootstrap allows multivariate dependent analysis.
+* Test suite for Dominance Analysis, using Azen and Budescu papers as references
+* X^2 for polychoric correlation
 === 0.6.3 / 2010-02-15
 * Statsample::Bivariate::Polychoric have joint estimation.
 * Some extra documentation and bug fixs
 === 0.6.2 / 2010-02-11
 * New Statsample::Bivariate::Polychoric. For implement: X2 and G2
 * New matrix.rb, for faster development of Contingence Tables and Correlation Matrix

data/Manifest.txt CHANGED Viewed

@@ -13,6 +13,7 @@ demo/correlation_matrix.rb
 demo/dominance_analysis_bootstrap.rb
 demo/dominanceanalysis.rb
 demo/multiple_regression.rb
+demo/multivariate_correlation.rb
 demo/polychoric.rb
 demo/tetrachoric.rb
 lib/distribution.rb
@@ -63,6 +64,7 @@ lib/statsample/regression/multiple.rb
 lib/statsample/regression/multiple/alglibengine.rb
 lib/statsample/regression/multiple/baseengine.rb
 lib/statsample/regression/multiple/gslengine.rb
+lib/statsample/regression/multiple/matrixengine.rb
 lib/statsample/regression/multiple/rubyengine.rb
 lib/statsample/regression/simple.rb
 lib/statsample/reliability.rb
@@ -83,11 +85,13 @@ test/test_csv.csv
 test/test_csv.rb
 test/test_dataset.rb
 test/test_distribution.rb
+test/test_dominance_analysis.rb
 test/test_factor.rb
 test/test_ggobi.rb
 test/test_gsl.rb
 test/test_histogram.rb
 test/test_logit.rb
+test/test_matrix.rb
 test/test_mle.rb
 test/test_multiset.rb
 test/test_permutation.rb

data/README.txt CHANGED Viewed

@@ -11,16 +11,16 @@ A suite for basic and advanced statistics. Includes:
 * Correlations: Pearson (r), Rho, Tetrachoric, Polychoric
 * Regression: Simple, Multiple, Probit and Logit
 * Factorial Analysis: Extraction (PCA and Principal Axis) and Rotation (Varimax and relatives)
-* Dominance Analysis (Azen & Budescu)
+* Dominance Analysis, with multivariate dependent and bootstrap (Azen & Budescu)
 * Sample calculation related formulas
 == DETAILED FEATURES:
 * Factorial Analysis. Principal Component Analysis and Principal Axis extraction, with orthogonal rotations (Varimax, Equimax, Quartimax)
-* Multiple Regression. Listwise analysis optimized with use of Alglib library. Pairwise analysis is executed on pure ruby and reports same values as SPSS
+* Multiple Regression. Listwise analysis optimized with use of Alglib library. Pairwise analysis is executed on pure ruby with matrixes and reports same values as SPSS
 * Module Bivariate provides covariance and pearson, spearman, point biserial, tau a, tau b, gamma, tetrachoric and polychoric correlation correlations. Include methods to create correlation (pearson and tetrachoric) and covariance matrices
 * Regression module provides linear regression methods
-* Dominance Analysis. Based on Budescu and Azen papers, <strong>DominanceAnalysis</strong> class can report dominance analysis for a sample and <strong>DominanceAnalysisBootstrap</strong> can execute bootstrap analysis to determine dominance stability, as recomended by  Azen & Budescu (2003) link[http://psycnet.apa.org/journals/met/8/2/129/].
+* Dominance Analysis. Based on Budescu and Azen papers, <strong>DominanceAnalysis</strong> class can report dominance analysis for a sample, using uni or multivariate dependent variables and <strong>DominanceAnalysisBootstrap</strong> can execute bootstrap analysis to determine dominance stability, as recomended by  Azen & Budescu (2003) link[http://psycnet.apa.org/journals/met/8/2/129/].
 * Classes for Vector, Datasets (set of Vectors) and Multisets (multiple datasets with same fields and type of vectors), and multiple methods to manipulate them
 * Module Codification, to help to codify open questions
 * Converters to and from database and csv files, and to output Mx and GGobi files
@@ -66,7 +66,7 @@ A suite for basic and advanced statistics. Includes:
 Optional:
 * Plotting: gnuplot and rbgnuplot, SVG::Graph
-* Factorial analysis and polychorical correlation: gsl and rb-gsl (http://rb-gsl.rubyforge.org/)
+* Factorial analysis and polychorical correlation: gsl library and rb-gsl (http://rb-gsl.rubyforge.org/). You should install it using <tt>gem install gsl</tt>
 == DOWNLOAD
 * Gems and bugs report: http://rubyforge.org/projects/ruby-statsample/
@@ -78,7 +78,7 @@ Optional:
 For optimization on *nix env
-  sudo gem install ruby-statsample-optimization
+  sudo gem install gsl ruby-statsample-optimization
 Available setup.rb file

data/demo/dominance_analysis_bootstrap.rb CHANGED Viewed

@@ -10,7 +10,13 @@ d=100.times.collect {rand}.to_scale
 ds={'a'=>a,'b'=>b,'c'=>c,'d'=>d}.to_dataset
-ds['y']=ds.collect{|row| row['a']*5+row['b']*2+row['c']*2+row['d']*2+10*rand()}
-dab=Statsample::DominanceAnalysis::Bootstrap.new(ds, 'y')
-dab.bootstrap(100,nil,true)
+ds['y1']=ds.collect{|row| row['a']*5+row['b']*2+row['c']*2+row['d']*2+10*rand()}
+ds['y2']=ds.collect{|row| row['a']*10+rand()}
+dab=Statsample::DominanceAnalysis::Bootstrap.new(ds, ['y1','y2'], :debug=>true)
+dab.bootstrap(100,nil)
+puts dab.summary
+ds2=ds['a'..'y1']
+dab=Statsample::DominanceAnalysis::Bootstrap.new(ds2, 'y1', :debug=>true)
+dab.bootstrap(100,nil)
 puts dab.summary

data/demo/dominanceanalysis.rb CHANGED Viewed

@@ -2,10 +2,26 @@
 $:.unshift(File.dirname(__FILE__)+'/../lib/')
 require 'statsample'
-a=1000.times.collect {rand}.to_scale
-b=1000.times.collect {rand}.to_scale
-c=1000.times.collect {rand}.to_scale
-ds={'a'=>a,'b'=>b,'c'=>c}.to_dataset
-ds['y']=ds.collect{|row| row['a']*5+row['b']*3+row['c']*2+rand()}
-da=Statsample::DominanceAnalysis.new(ds,'y')
-puts da.summary
+sample=200
+a=sample.times.collect {rand}.to_scale
+b=sample.times.collect {rand}.to_scale
+c=sample.times.collect {rand}.to_scale
+d=sample.times.collect {rand}.to_scale
+ds={'a'=>a,'b'=>b,'c'=>c,'d'=>d}.to_dataset
+ds['y']=ds.collect{|row| row['a']*5+row['b']*3+row['c']*2+row['d']+rand()}
+rb=ReportBuilder.new("Dominance Analysis")
+cm=Statsample::Bivariate.correlation_matrix(ds)
+rb.add(cm)
+lr=Statsample::Regression::Multiple::RubyEngine.new(ds,'y')
+rb.add(lr)
+#da=Statsample::DominanceAnalysis.new(ds,'y')
+#rb.add(da)
+da=Statsample::DominanceAnalysis.new(ds,'y',:name=>"Dominance Analysis using group of predictors", :predictors=>['a', 'b', %w{c d}])
+rb.add(da)
+puts rb.to_text

data/demo/multivariate_correlation.rb ADDED Viewed

@@ -0,0 +1,26 @@
+#!/usr/bin/ruby
+$:.unshift(File.dirname(__FILE__)+'/../lib/')
+require 'statsample'
+require 'mathn'
+  complete=Matrix[
+  [1,0.53,0.62,0.19,-0.09,0.08,0.02,-0.12,0.08],
+  [0.53,1,0.61,0.23,0.1,0.18,0.02,-0.1,0.15],
+  [0.62,0.61,1,0.03,0.1,0.12,0.03,-0.06,0.12],
+  [0.19,0.23,0.03,1,-0.02,0.02,0,-0.02,-0.02],
+  [-0.09,0.1,0.1,-0.02,1,0.05,0.06,0.18,0.02],
+  [0.08,0.18,0.12,0.02,0.05,1,0.22,-0.07,0.36],
+  [0.02,0.02,0.03,0,0.06,0.22,1,-0.01,-0.05],
+  [-0.12,-0.1,-0.06,-0.02,0.18,-0.07,-0.01,1,-0.03],
+  [0.08,0.15,0.12,-0.02,0.02,0.36,-0.05,-0.03,1]]
+  complete.extend Statsample::CovariateMatrix
+  complete.fields=%w{adhd cd odd sex age monly mwork mage poverty}
+  lr=Statsample::Regression::Multiple::MultipleDependent.new(complete, %w{adhd cd odd})
+  puts "R^2_yx #{lr.r2yx}"
+  puts "P^2_yx #{lr.p2yx}"

data/lib/statsample.rb CHANGED Viewed

@@ -109,7 +109,7 @@ end
 # * Dataset: An union of vectors.
 #
 module Statsample
-  VERSION = '0.6.3'
+  VERSION = '0.6.4'
   SPLIT_TOKEN = ","
   autoload(:Database, 'statsample/converters')
   autoload(:Anova, 'statsample/anova')

data/lib/statsample/bivariate.rb CHANGED Viewed

@@ -120,13 +120,18 @@ module Statsample
       # Order of rows and columns depends on Dataset#fields order
       def covariance_matrix(ds)
-        ds.collect_matrix do |row,col|
+        matrix=ds.collect_matrix do |row,col|
           if (ds[row].type!=:scale or ds[col].type!=:scale)
             nil
+          elsif row==col
+            ds[row].variance
           else
-            covariance(ds[row],ds[col])
+            covariance(ds[row], ds[col])
           end
         end
+        matrix.extend CovariateMatrix
+        matrix.fields=ds.fields
+        matrix
       end
       # Correlation matrix.
@@ -142,8 +147,8 @@ module Statsample
             pearson(ds[row],ds[col])
           end
         end
-        cm.extend(Statsample::CorrelationMatrix)
-        cm.labels=ds.fields
+        cm.extend(Statsample::CovariateMatrix)
+        cm.fields=ds.fields
         cm
       end
@@ -282,6 +287,21 @@ module Statsample
         }
         sum-((v1a.sum*v2a.sum) / v1a.size.to_f)
       end
+      # Report the minimum number of cases valid of a covariate matrix
+      # based on a dataset
+      def min_n_valid(ds)
+        min=ds.cases
+        m=n_valid_matrix(ds)
+        for x in 0...m.row_size
+          for y in 0...m.column_size
+            min=m[x,y] if m[x,y] < min
+          end
+        end
+        min
+      end
     end
   end
 end

data/lib/statsample/bivariate/polychoric.rb CHANGED Viewed

@@ -48,21 +48,21 @@ module Statsample
       attr_accessor :max_iterations
       # Debug algorithm (See iterations, for example)
       attr_accessor :debug
-      # Minimizer type. Default GSL::Min::FMinimizer::BRENT
+      # Minimizer type for two step. Default "brent"
       # See http://rb-gsl.rubyforge.org/min.html for reference.
       attr_accessor :minimizer_type_two_step
-      # Minimizer type. Default GSL::Min::FMinimizer::BRENT
+      # Minimizer type for joint estimate. Default "nmsimplex"
       # See http://rb-gsl.rubyforge.org/min.html for reference.
       attr_accessor :minimizer_type_joint
       # Method of calculation of polychoric series.
       #
-      # :two_step:: two-step ML, based on code by Gegenfurtner(1992)
+      # :two_step:: two-step ML, based on code by Gegenfurtner(1992).
       # :polychoric_series:: polychoric series estimate, using
-      #                      algorithm AS87 by Martinson and Hamdan (1975)
-      # :joint:              one-step ML, based on R package 'polycor'
+      #                      algorithm AS87 by Martinson and Hamdan (1975).
+      # :joint::             one-step ML, based on R package 'polycor'
       #                      by J.Fox.
       attr_accessor :method
       # Absolute error for iteration.
@@ -73,7 +73,9 @@ module Statsample
       # Log of algorithm
       attr_reader :log
-      attr_reader :loglike
+      attr_reader :loglike_model
       METHOD=:two_step
       MAX_ITERATIONS=300
@@ -162,16 +164,15 @@ module Statsample
       def loglike_data
         loglike=0
-        @nr.times { |i|
-          @nc.times { |j|
+        @nr.times do |i|
+          @nc.times do |j|
             res=@matrix[i,j].quo(@total)
             if (res==0)
-           #    puts "Correccion"
-            res=1e-16
-          end
+              res=1e-16
+            end
           loglike+= @matrix[i,j]  * Math::log(res )
-          }
-        }
+          end
+        end
         loglike
       end
       def chi_square
@@ -346,7 +347,7 @@ module Statsample
           end
           message+=sprintf("f() = %7.3f size = %.3f\n", minimizer.fval, minimizer.size)+"\n";
         end while status == GSL::CONTINUE and iter < @max_iterations
-        @iteration=@iter
+        @iteration=iter
         @log+=message
         puts message if @debug
         @r=minimizer.x[0]

data/lib/statsample/converters.rb CHANGED Viewed

@@ -155,6 +155,28 @@ raise "Should'nt be empty headers: [#{row.to_a.join(",")}]" if row.to_a.find_all
         }
         book.write(filename)
       end
+      # This should be fixed.
+      # If we have a Formula, should be resolver first
+      def preprocess_row(row, dates)
+        i=-1
+        row.collect!{|c|
+          i+=1
+          if c.is_a? Spreadsheet::Formula
+            if(c.value.is_a? Spreadsheet::Excel::Error)
+              nil
+            else
+              c.value
+            end
+          elsif dates.include? i and !c.nil? and c.is_a? Numeric
+              row.date(i)
+          else
+              c
+          end
+        }
+      end
+      private :process_row
       # Returns a dataset based on a xls file
       # USE:
       #     ds = Statsample::Excel.read("test.xls")
@@ -177,27 +199,9 @@ raise "Should'nt be empty headers: [#{row.to_a.join(",")}]" if row.to_a.find_all
               end
             }
             line_number+=1
-            if(line_number<=ignore_lines)
-            #puts "Skip line #{line_number}:#{row.to_s}"
-                next
-            end
-            # This should be fixed.
-            # If we have a Formula, should be resolver first
-            i=-1
-            row.collect!{|c|
-                i+=1
-                if c.is_a? Spreadsheet::Formula
-                  if(c.value.is_a? Spreadsheet::Excel::Error)
-                    nil
-                  else
-                    c.value
-                  end
-                elsif dates.include? i and !c.nil? and c.is_a? Numeric
-                    row.date(i)
-                else
-                    c
-                end
-            }
+            next if(line_number<=ignore_lines)
+            preprocess_row(row,dates)
             if first_row
               fields=extract_fields(row)
               ds=Statsample::Dataset.new(fields)
@@ -210,8 +214,8 @@ raise "Should'nt be empty headers: [#{row.to_a.join(",")}]" if row.to_a.find_all
               ds.add_case(rowa,false)
             end
           rescue => e
-              error="#{e.to_s}\nError on Line # #{line_number}:#{row.join(",")}"
-              raise
+            error="#{e.to_s}\nError on Line # #{line_number}:#{row.join(",")}"
+            raise
           end
         end
         convert_to_scale_and_date(ds, fields)

data/lib/statsample/crosstab.rb CHANGED Viewed

@@ -8,7 +8,7 @@ module Statsample
     bindtextdomain("statsample")
     attr_reader :v_rows, :v_cols
     attr_accessor :row_label, :column_label, :name, :percentage_row, :percentage_column, :percentage_total
-    def initialize(v1,v2,opts=Hash.new)
+    def initialize(v1, v2, opts=Hash.new)
     raise ArgumentError, "Both arguments should be Vectors" unless v1.is_a? Statsample::Vector and v2.is_a? Statsample::Vector
     raise ArgumentError, "Vectors should be the same size" unless v1.size==v2.size
     @v_rows, @v_cols=Statsample.only_valid(v1,v2)
@@ -191,48 +191,5 @@ module Statsample
       t.add_row(t_row)
       generator.parse_element(t)
     end
-    def to_s
-      fq=frequencies
-      rn=rows_names
-      cn=cols_names
-      total=0
-      total_cols=cols_empty_hash
-      max_row_size = rn.inject(0) {|s,x| sl=@v_rows.labeling(x).size; sl>s ? sl : s}
-      max_row_size=max_row_size<6 ? 6 : max_row_size
-      max_col_size = cn.inject(0) {|s,x| sl=@v_cols.labeling(x).size; sl>s ? sl : s}
-      max_col_size = frequencies.inject(max_col_size) {|s,x| x[1].to_s.size>s ? x[1].to_s.size : s}
-      out=""
-      out << " " * (max_row_size+2) << "|" << cn.collect{|c| name=@v_cols.labeling(c); " "+name+(" "*(max_col_size-name.size))+" "}.join("|") << "| Total\n"
-      linea="-" * (max_row_size+2) << "|" << ("-"*(max_col_size+2) +"|")*cn.size << "-"*7 << "\n"
-      out << linea
-      rn.each{|row|
-          total_row=0;
-          name=@v_rows.labeling(row)
-          out << " " +name  << " "*(max_row_size-name.size) << " | "
-          cn.each{|col|
-              data=fq[[row,col]].to_s
-              total_row+=fq[[row,col]]
-              total+=fq[[row,col]]
-              total_cols[col]+=fq[[row,col]]
-              out << " " << data << " "*(max_col_size-data.size) << "| "
-          }
-          out << " " << total_row.to_s
-      out << "\n"
-      }
-      out << linea
-      out << " Total " << " "*(max_row_size-5) << "| "
-      cn.each{|v|
-          data=total_cols[v].to_s
-          out << " " << data << " "*(max_col_size-data.size) << "| "
-      }
-      out << " " << total.to_s
-      out
-    end
   end
 end

data/lib/statsample/dominanceanalysis.rb CHANGED Viewed

@@ -4,7 +4,8 @@ module Statsample
   # for all possible subset models, to identify the relevance of one or more
   # predictors in the prediction of criterium.
   #
-  # See Budescu(1993) and Azen & Budescu (2003) for more information.
+  #
+  # See Budescu(1993), Azen & Budescu (2003, 2006) for more information.
   #
   # Example:
   #
@@ -53,39 +54,127 @@ module Statsample
   #
   # == References:
-  # * Budescu, D. V. (1993). Dominance analysis: a new approach to the problem of relative importance of predictors in multiple regression. _Psychological Bulletin, 114_, 542-551.
-  # * Azen, R. & Budescu, D.V. (2003). The dominance analysis approach for comparing predictors in multiple regression. _Psychological Methods, 8_(2), 129-148.
+  # * Budescu, D. V. (1993). Dominance analysis: a new approach to the problem of relative importance of predictors in multiple regression. <em>Psychological Bulletin, 114</em>, 542-551.
+  # * Azen, R. & Budescu, D.V. (2003). The dominance analysis approach for comparing predictors in multiple regression. <em>Psychological Methods, 8</em>(2), 129-148.
+  # * Azen, R. & Budescu, D.V. (2006). Comparing predictors in Multivariate Regression Models: An extension of Dominance Analysis. <em>Journal of Educational and Behavioral Statistics, 31</em>(2), 157-180.
   class DominanceAnalysis
     include GetText
     bindtextdomain("statsample")
-    # Class to generate the regressions. Default to Statsample::Regression::Multiple::RubyEngine
+    # Class to generate the regressions. Default to Statsample::Regression::Multiple::MatrixEngine
     attr_accessor :regression_class
     # Name of analysis
     attr_accessor :name
+    # Set to true if you want to build from dataset, not correlation matrix
+    attr_accessor :build_from_dataset
+    #  Array with independent variables. You could create subarrays,
+    #  to test groups of predictors as blocks
+    attr_accessor  :predictors
+    # If you provide a matrix as input, you should set
+    # the number of cases to define significance of R^2
+    attr_accessor  :cases
+    # Method of :regression_class used to measure association.
+    #
+    # Only necessary to change if you have multivariate dependent.
+    # * :r2yx (R^2_yx), the default option, is the  option when distinction
+    #   between independent and dependents variable is arbitrary
+    # * :p2yx is the option when the distinction between independent and dependents variables is real.
+    #
+    attr_accessor  :method_association
+    attr_reader :dependent
+    UNIVARIATE_REGRESSION_CLASS=Statsample::Regression::Multiple::MatrixEngine
+    MULTIVARIATE_REGRESSION_CLASS=Statsample::Regression::Multiple::MultipleDependent
+    def self.predictor_name(variable)
+      if variable.is_a? Array
+        sprintf("(%s)", variable.join(","))
+      else
+        variable
+      end
+    end
     # Creates a new DominanceAnalysis object
-    # Params:
-    # * ds: A Dataset object
-    # * y_var: Name of dependent variable
-    # * opts: Any other attribute of the class
-    #
-    def initialize(ds,y_var, opts=Hash.new)
-      @y_var=y_var
-      @dy=ds[@y_var]
-      @ds=ds
-      @ds_indep=ds.dup(ds.fields-[y_var])
-      @fields=@ds_indep.fields
-      @regression_class=Statsample::Regression::Multiple::RubyEngine
-      @name=_("Dominance Analysis:  %s over %s") % [ ds.fields.join(",") , @y_var]
+    # Parameters:
+    # * input:    A Matrix or Dataset object
+    # * dependent: Name of dependent variable. Could be an array, if you want to
+    #             do an Multivariate Regression Analysis. If nil, set to all
+    #             fields on input, except criteria
+    def initialize(input, dependent, opts=Hash.new)
+      @build_from_dataset=false
+      if dependent.is_a? Array
+        @regression_class= MULTIVARIATE_REGRESSION_CLASS
+        @method_association=:r2yx
+      else
+        @regression_class= UNIVARIATE_REGRESSION_CLASS
+        @method_association=:r2
+      end
       opts.each{|k,v|
         self.send("#{k}=",v) if self.respond_to? k
       }
+      @dependent=dependent
+      @dependent=[@dependent] unless @dependent.is_a? Array
+      @predictors ||= input.fields-@dependent
+      @name=_("Dominance Analysis:  %s over %s") % [ @predictors.flatten.join(",") , @dependent.join(",")] if @name.nil?
+      if input.is_a? Statsample::Dataset
+        @ds=input
+        @matrix=Statsample::Bivariate.correlation_matrix(input)
+        @cases=Statsample::Bivariate.min_n_valid(input)
+      elsif input.is_a? ::Matrix
+        @ds=nil
+        @matrix=input
+      else
+        raise ArgumentError.new("You should use a Matrix or a Dataset")
+      end
+      @models=nil
+    end
+    # Compute models.
+    def compute
       create_models
       fill_models
     end
+    def models
+      if @models.nil?
+        compute
+      end
+      @models
+    end
+    def models_data
+      if @models_data.nil?
+        compute
+      end
+      @models_data
+    end
+    def create_models
+      @models=[]
+      @models_data={}
+      for i in 1..@predictors.size
+        c=Statsample::Combination.new(i,@predictors.size)
+        c.each  do |data|
+          independent=data.collect {|i1| @predictors[i1] }
+          @models.push(independent)
+          if (@build_from_dataset)
+            data=@ds.dup(independent.flatten+@dependent)
+          else
+            data=@matrix.submatrix(independent.flatten+@dependent)
+          end
+          modeldata=ModelData.new(independent, data, self)
+          models_data[independent.sort {|a,b| a.to_s<=>b.to_s}]=modeldata
+        end
+      end
+    end
     def fill_models
       @models.each do |m|
-        @fields.each do |f|
+        @predictors.each do |f|
           next if m.include? f
           base_model=md(m)
           comp_model=md(m+[f])
@@ -93,6 +182,8 @@ module Statsample
         end
       end
     end
+    private :create_models, :fill_models
     def dominance_for_nil_model(i,j)
       if md([i]).r2>md([j]).r2
         1
@@ -107,7 +198,7 @@ module Statsample
       dm=dominance_for_nil_model(i,j)
       return 0.5 if dm==0.5
       dominances=[dm]
-      @models_data.each do |k,m|
+      models_data.each do |k,m|
         if !m.contributions[i].nil? and !m.contributions[j].nil?
           if m.contributions[i]>m.contributions[j]
               dominances.push(1)
@@ -128,7 +219,7 @@ module Statsample
       dm=dominance_for_nil_model(i,j)
       return 0.5 if dm==0.5
       dominances=[dm]
-      for k in 1...@fields.size
+      for k in 1...@predictors.size
         a=average_k(k)
         if a[i]>a[j]
             dominances.push(1)
@@ -154,7 +245,7 @@ module Statsample
       end
     end
     def pairs
-      @models.find_all{|m| m.size==2}
+      models.find_all{|m| m.size==2}
     end
     def total_dominance
       pairs.inject({}){|a,pair| a[pair]=total_dominance_pairwise(pair[0], pair[1])
@@ -162,20 +253,18 @@ module Statsample
       }
     end
     def conditional_dominance
-      pairs.inject({}){|a,pair|
-      a[pair]=conditional_dominance_pairwise(pair[0], pair[1])
+      pairs.inject({}){|a,pair| a[pair]=conditional_dominance_pairwise(pair[0], pair[1])
       a
       }
     end
     def general_dominance
-      pairs.inject({}){|a,pair|
-      a[pair]=general_dominance_pairwise(pair[0], pair[1])
+      pairs.inject({}){|a,pair| a[pair]=general_dominance_pairwise(pair[0], pair[1])
       a
       }
     end
     def md(m)
-      @models_data[m.sort]
+      models_data[m.sort {|a,b| a.to_s<=>b.to_s}]
     end
     # Get all model of size k
     def md_k(k)
@@ -195,11 +284,11 @@ module Statsample
     end
     # Hash with average for each k size model.
     def average_k(k)
-      return nil if k==@fields.size
+      return nil if k==@predictors.size
       models=md_k(k)
-      averages=@fields.inject({}) {|a,v| a[v]=[];a}
+      averages=@predictors.inject({}) {|a,v| a[v]=[];a}
       models.each do |m|
-        @fields.each do |f|
+        @predictors.each do |f|
           averages[f].push(m.contributions[f]) unless m.contributions[f].nil?
         end
       end
@@ -207,10 +296,10 @@ module Statsample
     end
     def general_averages
       if @general_averages.nil?
-        averages=@fields.inject({}) {|a,v| a[v]=[md([v]).r2];a}
-        for k in 1...@fields.size
+        averages=@predictors.inject({}) {|a,v| a[v]=[md([v]).r2];a}
+        for k in 1...@predictors.size
           ak=average_k(k)
-          @fields.each do |f|
+          @predictors.each do |f|
             averages[f].push(ak[f])
           end
         end
@@ -218,36 +307,25 @@ module Statsample
       end
       @general_averages
     end
-    def create_models
-      @models=[]
-      @models_data={}
-      for i in 1..@fields.size
-      c=Statsample::Combination.new(i,@fields.size)
-      c.each  do |data|
-        convert=data.collect {|i1| @fields[i1] }
-        @models.push(convert)
-        ds_prev=@ds.dup(convert+[@y_var])
-        modeldata=ModelData.new(convert,ds_prev, @y_var, @fields, @regression_class)
-        @models_data[convert.sort]=modeldata
-      end
-      end
-    end
     def summary
       rp=ReportBuilder.new()
       rp.add(self)
       rp.to_text
     end
     def to_reportbuilder(generator)
+      compute if @models.nil?
       anchor=generator.add_toc_entry(_("DA: ")+@name)
       generator.add_html "<div class='dominance-analysis'>#{@name}<a name='#{anchor}'></a>"
       t=ReportBuilder::Table.new(:name=>_("Dominance Analysis result"))
-      t.header=["","r2",_("sign")]+@fields
-      row=[_("Model 0"),"",""]+@fields.collect{|f|
+      t.header=["","r2",_("sign")]+@predictors.collect {|c| DominanceAnalysis.predictor_name(c) }
+      row=[_("Model 0"),"",""]+@predictors.collect{|f|
         sprintf("%0.3f", md([f]).r2)
       }
       t.add_row(row)
       t.add_horizontal_line
-      for i in 1..@fields.size
+      for i in 1..@predictors.size
         mk=md_k(i)
         mk.each{|m|
           t.add_row(m.add_table_row)
@@ -256,7 +334,7 @@ module Statsample
         a=average_k(i)
         if !a.nil?
             t.add_horizontal_line
-            row=[_("k=%d Average") % i,"",""] + @fields.collect{|f|
+            row=[_("k=%d Average") % i,"",""] + @predictors.collect{|f|
                 sprintf("%0.3f",a[f])
             }
             t.add_row(row)
@@ -269,7 +347,7 @@ module Statsample
       g=general_averages
       t.add_horizontal_line
-      row=[_("Overall averages"),"",""]+@fields.collect{|f|
+      row=[_("Overall averages"),"",""]+@predictors.collect{|f|
                 sprintf("%0.3f",g[f])
       }
       t.add_row(row)
@@ -289,26 +367,42 @@ module Statsample
     end
     class ModelData
       attr_reader :contributions
-      def initialize(name,ds,y_var,fields,r_class)
-        @name=name
-        @fields=fields
-        @contributions=@fields.inject({}){|a,v| a[v]=nil;a}
-        r_class=Regression::Multiple::RubyEngine if r_class.nil?
-        @lr=r_class.new(ds,y_var)
+      def initialize(independent, data, da)
+        @independent=independent
+        @data=data
+        @predictors=da.predictors
+        @dependent=da.dependent
+        @cases=da.cases
+        @method=da.method_association
+        @contributions=@independent.inject({}){|a,v| a[v]=nil;a}
+        r_class=da.regression_class
+        if @dependent.size==1
+          @lr=r_class.new(data, @dependent[0], :cases=>@cases)
+        else
+          @lr=r_class.new(data, @dependent, :cases=>@cases)
+        end
       end
-      def add_contribution(f,v)
+      def add_contribution(f, v)
         @contributions[f]=v-r2
       end
       def r2
-        @lr.r2
+        @lr.send(@method)
+      end
+      def name
+        @independent.collect {|variable|
+          DominanceAnalysis.predictor_name(variable)
+        }.join("*")
       end
       def add_table_row
         begin
-        sign=sprintf("%0.3f", @lr.significance)
+          sign=sprintf("%0.3f", @lr.significance)
         rescue RuntimeError
-            sign="???"
+          sign="???"
         end
-        [@name.join("*"), sprintf("%0.3f",r2), sign] + @fields.collect{|k|
+        [name, sprintf("%0.3f",r2), sign] + @predictors.collect{|k|
           v=@contributions[k]
           if v.nil?
               "--"
@@ -318,8 +412,8 @@ module Statsample
         }
       end
       def summary
-        out=sprintf("%s: r2=%0.3f(p=%0.2f)\n",@name.join("*"),r2,@lr.significance,@lr.sst)
-        out << @fields.collect{|k|
+        out=sprintf("%s: r2=%0.3f(p=%0.2f)\n",name, r2, @lr.significance, @lr.sst)
+        out << @predictors.collect{|k|
           v=@contributions[k]
           if v.nil?
               "--"