RubyGems - statsample - Versions diffs - 0.18.0 → 1.0.0 - Mend

statsample 0.18.0 → 1.0.0

Files changed (121) hide show

data.tar.gz.sig +0 -0
data/History.txt +23 -0
data/Manifest.txt +28 -17
data/Rakefile +3 -2
data/benchmarks/correlation_matrix_15_variables.rb +31 -0
data/benchmarks/correlation_matrix_5_variables.rb +32 -0
data/benchmarks/correlation_matrix_methods/correlation_matrix.ds +0 -0
data/benchmarks/correlation_matrix_methods/correlation_matrix.html +93 -0
data/benchmarks/correlation_matrix_methods/correlation_matrix.rb +75 -0
data/benchmarks/correlation_matrix_methods/correlation_matrix.xls +0 -0
data/benchmarks/correlation_matrix_methods/correlation_matrix_gsl_ruby.ods +0 -0
data/benchmarks/correlation_matrix_methods/correlation_matrix_with_graphics.ods +0 -0
data/benchmarks/correlation_matrix_methods/results.ds +0 -0
data/benchmarks/factor_map.rb +37 -0
data/benchmarks/helpers_benchmark.rb +5 -0
data/examples/boxplot.rb +13 -14
data/examples/correlation_matrix.rb +16 -8
data/examples/dataset.rb +13 -4
data/examples/dominance_analysis.rb +23 -17
data/examples/dominance_analysis_bootstrap.rb +28 -22
data/examples/histogram.rb +8 -9
data/examples/icc.rb +20 -21
data/examples/levene.rb +10 -4
data/examples/multiple_regression.rb +9 -28
data/examples/multivariate_correlation.rb +9 -3
data/examples/parallel_analysis.rb +20 -16
data/examples/polychoric.rb +15 -9
data/examples/principal_axis.rb +18 -6
data/examples/reliability.rb +26 -13
data/examples/scatterplot.rb +10 -6
data/examples/t_test.rb +15 -6
data/examples/tetrachoric.rb +9 -2
data/examples/u_test.rb +12 -4
data/examples/vector.rb +13 -2
data/examples/velicer_map_test.rb +33 -26
data/lib/statsample.rb +32 -12
data/lib/statsample/analysis.rb +79 -0
data/lib/statsample/analysis/suite.rb +72 -0
data/lib/statsample/analysis/suitereportbuilder.rb +38 -0
data/lib/statsample/bivariate.rb +70 -16
data/lib/statsample/dataset.rb +25 -19
data/lib/statsample/dominanceanalysis.rb +2 -2
data/lib/statsample/factor.rb +2 -0
data/lib/statsample/factor/map.rb +16 -10
data/lib/statsample/factor/parallelanalysis.rb +9 -3
data/lib/statsample/factor/pca.rb +28 -32
data/lib/statsample/factor/rotation.rb +15 -8
data/lib/statsample/graph/boxplot.rb +3 -4
data/lib/statsample/graph/histogram.rb +2 -1
data/lib/statsample/graph/scatterplot.rb +1 -0
data/lib/statsample/matrix.rb +106 -16
data/lib/statsample/regression.rb +4 -1
data/lib/statsample/regression/binomial.rb +1 -1
data/lib/statsample/regression/multiple/baseengine.rb +19 -9
data/lib/statsample/regression/multiple/gslengine.rb +127 -126
data/lib/statsample/regression/multiple/matrixengine.rb +8 -5
data/lib/statsample/regression/multiple/rubyengine.rb +1 -1
data/lib/statsample/regression/simple.rb +31 -6
data/lib/statsample/reliability.rb +11 -3
data/lib/statsample/reliability/scaleanalysis.rb +4 -4
data/lib/statsample/shorthand.rb +81 -0
data/lib/statsample/test/chisquare.rb +1 -1
data/lib/statsample/vector.rb +163 -163
data/lib/statsample/vector/gsl.rb +106 -0
data/references.txt +2 -2
data/{data → test/fixtures}/crime.txt +0 -0
data/{data → test/fixtures}/hartman_23.matrix +0 -0
data/{data → test/fixtures}/repeated_fields.csv +0 -0
data/{data → test/fixtures}/test_binomial.csv +0 -0
data/test/{test_csv.csv → fixtures/test_csv.csv} +0 -0
data/test/{test_xls.xls → fixtures/test_xls.xls} +0 -0
data/{data → test/fixtures}/tetmat_matrix.txt +0 -0
data/{data → test/fixtures}/tetmat_test.txt +0 -0
data/test/helpers_tests.rb +18 -2
data/test/test_analysis.rb +118 -0
data/test/test_anovatwoway.rb +1 -1
data/test/test_anovatwowaywithdataset.rb +1 -1
data/test/test_anovawithvectors.rb +1 -2
data/test/test_bartlettsphericity.rb +1 -2
data/test/test_bivariate.rb +64 -22
data/test/test_codification.rb +1 -2
data/test/test_crosstab.rb +1 -2
data/test/test_csv.rb +3 -4
data/test/test_dataset.rb +24 -3
data/test/test_dominance_analysis.rb +1 -2
data/test/test_factor.rb +8 -69
data/test/test_factor_map.rb +43 -0
data/test/test_factor_pa.rb +54 -0
data/test/test_ggobi.rb +1 -1
data/test/test_gsl.rb +12 -18
data/test/test_histogram.rb +1 -2
data/test/test_logit.rb +62 -18
data/test/test_matrix.rb +4 -5
data/test/test_mle.rb +3 -4
data/test/test_regression.rb +21 -2
data/test/test_reliability.rb +3 -3
data/test/test_reliability_icc.rb +1 -1
data/test/test_reliability_skillscale.rb +20 -4
data/test/test_resample.rb +1 -2
data/test/test_rserve_extension.rb +1 -2
data/test/test_srs.rb +1 -2
data/test/test_statistics.rb +1 -2
data/test/test_stest.rb +1 -2
data/test/test_stratified.rb +1 -2
data/test/test_test_f.rb +1 -2
data/test/test_test_t.rb +1 -2
data/test/test_umannwhitney.rb +1 -2
data/test/test_vector.rb +117 -18
data/test/test_xls.rb +2 -3
data/web/Rakefile +39 -0
metadata +109 -29
metadata.gz.sig +0 -0
data/examples/parallel_analysis_tetrachoric.rb +0 -31
data/lib/distribution.rb +0 -25
data/lib/distribution/chisquare.rb +0 -23
data/lib/distribution/f.rb +0 -35
data/lib/distribution/normal.rb +0 -60
data/lib/distribution/normalbivariate.rb +0 -284
data/lib/distribution/normalmultivariate.rb +0 -73
data/lib/distribution/t.rb +0 -55
data/test/test_distribution.rb +0 -73

data.tar.gz.sig CHANGED Viewed

Binary file

data/History.txt CHANGED Viewed

@@ -1,3 +1,26 @@
+=== 1.0.0 / 2011-01-27
+* Added Statsample::Analysis, a beautiful DSL to perform fast statistical analysis using statsample. See directory /examples
+* Created benchmarks directory
+* Removed Distribution module from statsample and moved to a gem. Changes on code to reflect new API
+* Optimized simple regression.  Better library detection
+* New 'should_with_gsl' to test methods with gsl. Refactored Factor::MAP
+* Almost complete GSL cleanup on Vector
+* Updated some doc on Vector
+* Used GSL::Matrix on Factor classes when available
+* SkillScaleAnalysis doesn't crash with one or more vectors with 0 variance
+* Modified examples using Statsample::Analysis
+* Simplified eigen calculations
+* Updated some examples. Added correlation matrix speed suite
+* Correlation matrix optimized. Better specs
+* Optimized correlation matrix. Use gsl matrix algebra or pairwise correlations depending on empiric calculated equations. See benchmarks/correlation_matrix.rb to see implementation of calculation
+* Moved tests fixtures from data to test/fixtures
+* Fixed some errors on tests
+* Bug fix: constant_se on binomial regression have an error
+* All test should work on ruby 1.9.3
+* New Vector.[] and Vector.new_scale
+* Detect linearly dependent predictors on OLS.
 === 0.18.0 / 2011-01-07
 * New Statsample.load_excel
 * New Statsample.load_csv

data/Manifest.txt CHANGED Viewed

@@ -3,14 +3,19 @@ LICENSE.txt
 Manifest.txt
 README.txt
 Rakefile
+benchmarks/correlation_matrix_15_variables.rb
+benchmarks/correlation_matrix_5_variables.rb
+benchmarks/correlation_matrix_methods/correlation_matrix.ds
+benchmarks/correlation_matrix_methods/correlation_matrix.html
+benchmarks/correlation_matrix_methods/correlation_matrix.rb
+benchmarks/correlation_matrix_methods/correlation_matrix.xls
+benchmarks/correlation_matrix_methods/correlation_matrix_gsl_ruby.ods
+benchmarks/correlation_matrix_methods/correlation_matrix_with_graphics.ods
+benchmarks/correlation_matrix_methods/results.ds
+benchmarks/factor_map.rb
+benchmarks/helpers_benchmark.rb
 bin/statsample
-data/crime.txt
-data/hartman_23.matrix
 data/locale/es/LC_MESSAGES/statsample.mo
-data/repeated_fields.csv
-data/test_binomial.csv
-data/tetmat_matrix.txt
-data/tetmat_test.txt
 doc_latex/manual/equations.tex
 examples/boxplot.rb
 examples/correlation_matrix.rb
@@ -23,7 +28,6 @@ examples/levene.rb
 examples/multiple_regression.rb
 examples/multivariate_correlation.rb
 examples/parallel_analysis.rb
-examples/parallel_analysis_tetrachoric.rb
 examples/polychoric.rb
 examples/principal_axis.rb
 examples/reliability.rb
@@ -34,15 +38,11 @@ examples/u_test.rb
 examples/vector.rb
 examples/velicer_map_test.rb
 grab_references.rb
-lib/distribution.rb
-lib/distribution/chisquare.rb
-lib/distribution/f.rb
-lib/distribution/normal.rb
-lib/distribution/normalbivariate.rb
-lib/distribution/normalmultivariate.rb
-lib/distribution/t.rb
 lib/spss.rb
 lib/statsample.rb
+lib/statsample/analysis.rb
+lib/statsample/analysis/suite.rb
+lib/statsample/analysis/suitereportbuilder.rb
 lib/statsample/anova.rb
 lib/statsample/anova/oneway.rb
 lib/statsample/anova/twoway.rb
@@ -91,6 +91,7 @@ lib/statsample/reliability/scaleanalysis.rb
 lib/statsample/reliability/skillscaleanalysis.rb
 lib/statsample/resample.rb
 lib/statsample/rserve_extension.rb
+lib/statsample/shorthand.rb
 lib/statsample/srs.rb
 lib/statsample/test.rb
 lib/statsample/test/bartlettsphericity.rb
@@ -100,6 +101,7 @@ lib/statsample/test/levene.rb
 lib/statsample/test/t.rb
 lib/statsample/test/umannwhitney.rb
 lib/statsample/vector.rb
+lib/statsample/vector/gsl.rb
 po/es/statsample.mo
 po/es/statsample.po
 po/statsample.pot
@@ -107,7 +109,16 @@ references.txt
 setup.rb
 test/fixtures/bank2.dat
 test/fixtures/correlation_matrix.rb
+test/fixtures/crime.txt
+test/fixtures/hartman_23.matrix
+test/fixtures/repeated_fields.csv
+test/fixtures/test_binomial.csv
+test/fixtures/test_csv.csv
+test/fixtures/test_xls.xls
+test/fixtures/tetmat_matrix.txt
+test/fixtures/tetmat_test.txt
 test/helpers_tests.rb
+test/test_analysis.rb
 test/test_anovaoneway.rb
 test/test_anovatwoway.rb
 test/test_anovatwowaywithdataset.rb
@@ -116,12 +127,12 @@ test/test_bartlettsphericity.rb
 test/test_bivariate.rb
 test/test_codification.rb
 test/test_crosstab.rb
-test/test_csv.csv
 test/test_csv.rb
 test/test_dataset.rb
-test/test_distribution.rb
 test/test_dominance_analysis.rb
 test/test_factor.rb
+test/test_factor_map.rb
+test/test_factor_pa.rb
 test/test_ggobi.rb
 test/test_gsl.rb
 test/test_histogram.rb
@@ -144,4 +155,4 @@ test/test_test_t.rb
 test/test_umannwhitney.rb
 test/test_vector.rb
 test/test_xls.rb
-test/test_xls.xls
+web/Rakefile

data/Rakefile CHANGED Viewed

@@ -40,9 +40,10 @@ h=Hoe.spec('statsample') do
   #self.testlib=:minitest
 	self.rubyforge_name = "ruby-statsample"
 	self.developer('Claudio Bustos', 'clbustos@gmail.com')
-	self.extra_deps << ["spreadsheet","~>0.6.5"] <<  ["reportbuilder", "~>1.4"] << ["minimization", "~>0.2.0"] << ["fastercsv", ">0"] << ["dirty-memoize", "~>0.0"] << ["extendmatrix","~>0.3.1"] << ["statsample-bivariate-extension", ">0"] << ["rserve-client", "~>0.2.5"] << ["rubyvis", "~>0.4.0"]
+	self.extra_deps << ["spreadsheet","~>0.6.5"] <<  ["reportbuilder", "~>1.4"] << ["minimization", "~>0.2.0"] << ["fastercsv", ">0"] << ["dirty-memoize", "~>0.0"] << ["extendmatrix","~>0.3.1"] << ["statsample-bivariate-extension", ">0"] << ["rserve-client", "~>0.2.5"] << ["rubyvis", "~>0.4.0"] << ["distribution", "~>0.2.0"]
+	self.extra_dev_deps << ["hoe","~>0"] << ["shoulda","~>0"] << ["minitest", "~>2.0"] << ["rserve-client", "~>0"] << ["gettext", "~>0"] << ["mocha", "~>0"] << ["hoe-git", "~>0"]
-	self.extra_dev_deps << ["hoe","~>0"] << ["shoulda","~>0"] << ["minitest", "~>2.0"]
   self.clean_globs << "test/images/*" << "demo/item_analysis/*" << "demo/Regression"
   self.post_install_message = <<-EOF
 ***************************************************

data/benchmarks/correlation_matrix_15_variables.rb ADDED Viewed

@@ -0,0 +1,31 @@
+require(File.expand_path(File.dirname(__FILE__)+'/helpers_benchmark.rb'))
+extend BenchPress
+cases=250
+vars=20
+name "gsl matrix based vs. manual ruby correlation matrix (#{vars} vars, #{cases} cases)"
+author 'Clbustos'
+date '2011-01-18'
+summary "
+A correlation matrix could be constructed using matrix algebra or
+mannualy, calculating covariances, means and sd for each pair of vectors.
+In this test, we test the calculation using #{vars} variables with
+#{cases} cases on each vector
+"
+reps 200 #number of repetitions
+ds=vars.times.inject({}) {|ac,v|
+ac["x#{v}"]=Statsample::Vector.new_scale(cases) {rand()}
+ac
+}.to_dataset
+measure "Statsample::Bivariate.correlation_matrix_optimized" do
+  Statsample::Bivariate.correlation_matrix_optimized(ds)
+end
+measure "Statsample::Bivariate.correlation_matrix_pairwise" do
+  Statsample::Bivariate.correlation_matrix_pairwise(ds)
+end

data/benchmarks/correlation_matrix_5_variables.rb ADDED Viewed

@@ -0,0 +1,32 @@
+require(File.expand_path(File.dirname(__FILE__)+'/helpers_benchmark.rb'))
+extend BenchPress
+cases=500
+vars=5
+name "gsl matrix based vs. manual ruby correlation matrix (#{vars} vars, #{cases} cases)"
+author 'Clbustos'
+date '2011-01-18'
+summary "
+A correlation matrix could be constructed using matrix algebra or
+mannualy, calculating covariances, means and sd for each pair of vectors.
+In this test, we test the calculation using #{vars} variables with
+#{cases} cases on each vector
+"
+reps 200 #number of repetitions
+ds=vars.times.inject({}) {|ac,v|
+ac["x#{v}"]=Statsample::Vector.new_scale(cases) {rand()}
+ac
+}.to_dataset
+measure "Statsample::Bivariate.correlation_matrix_optimized" do
+  Statsample::Bivariate.correlation_matrix_optimized(ds)
+end
+measure "Statsample::Bivariate.correlation_matrix_pairwise" do
+  Statsample::Bivariate.correlation_matrix_pairwise(ds)
+end

data/benchmarks/correlation_matrix_methods/correlation_matrix.ds ADDED Viewed

Binary file

data/benchmarks/correlation_matrix_methods/correlation_matrix.html ADDED Viewed

@@ -0,0 +1,93 @@
+<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
+<html>
+<head>
+<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >
+<title>Correlation matrix analysis</title>
+        <style>
+        body {
+          margin:0;
+          padding:1em;
+        }
+        table {
+          border-collapse: collapse;
+        }
+        table td {
+          border: 1px solid black;
+        }
+        .section {
+          margin:0.5em;
+        }
+        </style>
+</head><body>
+<h1>Correlation matrix analysis</h1><div id='toc'><div class='title'>List of contents</div>
+<ul>
+<li><a href='#toc_1'>Multiple reggresion of cases,vars,c_v on time_optimized</a></li>
+<ul>
+<li><a href='#toc_2'>ANOVA</a></li>
+</ul>
+<li><a href='#toc_3'>Multiple reggresion of cases,vars,c_v on time_pairwise</a></li>
+<ul>
+<li><a href='#toc_4'>ANOVA</a></li>
+</ul>
+</ul>
+</div>
+<div class='tot'><div class='title'>List of tables</div><ul><li><a href='#table_1'>ANOVA Table</a></li><li><a href='#table_2'>Beta coefficients</a></li><li><a href='#table_3'>ANOVA Table</a></li><li><a href='#table_4'>Beta coefficients</a></li></ul></div>
+  <div class='section'><h2>Multiple reggresion of cases,vars,c_v on time_optimized</h2><a name='toc_1'></a>
+    <p>Engine: Statsample::Regression::Multiple::RubyEngine</p>
+    <p>Cases(listwise)=63(63)</p>
+    <p>R=0.978844</p>
+    <p>R^2=0.958137</p>
+    <p>R^2 Adj=0.956008</p>
+    <p>Std.Error R=3.092024</p>
+    <p>Equation=4.031667 + 0.018039cases + 0.244790vars + 0.001197c_v</p>
+    <div class='section'><h3>ANOVA</h3><a name='toc_2'></a>
+      <a name='table_1'></a><table><caption>ANOVA Table</caption><thead><th>source</th><th>ss</th><th>df</th><th>ms</th><th>f</th><th>p</th></thead>
+<tbody>
+<tr><td>Regression</td><td>12910.098</td><td>3</td><td>4303.366</td><td>450.114</td><td>0.000</td></tr>
+<tr><td>Error</td><td>564.076</td><td>59</td><td>9.561</td><td></td><td></td></tr>
+<tr><td>Total</td><td>13474.174</td><td>62</td><td>4312.927</td><td></td><td></td></tr>
+</tbody>
+</table>
+    </div>
+    <a name='table_2'></a><table><caption>Beta coefficients</caption><thead><th>coeff</th><th>b</th><th>beta</th><th>se</th><th>t</th></thead>
+<tbody>
+<tr><td>Constant</td><td>4.031667</td><td>-</td><td>0.752604</td><td>5.356953</td></tr>
+<tr><td>cases</td><td>0.018039</td><td>0.381587</td><td>0.001961</td><td>9.200093</td></tr>
+<tr><td>vars</td><td>0.244790</td><td>0.224390</td><td>0.036055</td><td>6.789335</td></tr>
+<tr><td>c_v</td><td>0.001197</td><td>0.584174</td><td>0.000094</td><td>12.738410</td></tr>
+</tbody>
+</table>
+  </div>
+  <div class='section'><h2>Multiple reggresion of cases,vars,c_v on time_pairwise</h2><a name='toc_3'></a>
+    <p>Engine: Statsample::Regression::Multiple::RubyEngine</p>
+    <p>Cases(listwise)=63(63)</p>
+    <p>R=0.999637</p>
+    <p>R^2=0.999275</p>
+    <p>R^2 Adj=0.999238</p>
+    <p>Std.Error R=0.538365</p>
+    <p>Equation=-0.520303 + -0.000708cases + 1.234451vars + 0.000735c_v</p>
+    <div class='section'><h3>ANOVA</h3><a name='toc_4'></a>
+      <a name='table_3'></a><table><caption>ANOVA Table</caption><thead><th>source</th><th>ss</th><th>df</th><th>ms</th><th>f</th><th>p</th></thead>
+<tbody>
+<tr><td>Regression</td><td>23554.271</td><td>3</td><td>7851.424</td><td>27089.134</td><td>0.000</td></tr>
+<tr><td>Error</td><td>17.100</td><td>59</td><td>0.290</td><td></td><td></td></tr>
+<tr><td>Total</td><td>23571.372</td><td>62</td><td>7851.714</td><td></td><td></td></tr>
+</tbody>
+</table>
+    </div>
+    <a name='table_4'></a><table><caption>Beta coefficients</caption><thead><th>coeff</th><th>b</th><th>beta</th><th>se</th><th>t</th></thead>
+<tbody>
+<tr><td>Constant</td><td>-0.520303</td><td>-</td><td>0.131039</td><td>-3.970594</td></tr>
+<tr><td>cases</td><td>-0.000708</td><td>-0.011324</td><td>0.000341</td><td>-2.074007</td></tr>
+<tr><td>vars</td><td>1.234451</td><td>0.855546</td><td>0.006278</td><td>196.641087</td></tr>
+<tr><td>c_v</td><td>0.000735</td><td>0.271138</td><td>0.000016</td><td>44.912972</td></tr>
+</tbody>
+</table>
+  </div>
+</body></html>

data/benchmarks/correlation_matrix_methods/correlation_matrix.rb ADDED Viewed

@@ -0,0 +1,75 @@
+# This test create a database to adjust the best algorithm
+# to use on correlation matrix
+require(File.expand_path(File.dirname(__FILE__)+'/../helpers_benchmark.rb'))
+require 'statsample'
+require 'benchmark'
+def create_dataset(vars,cases)
+  ran=Distribution::Normal.rng
+  ds=vars.times.inject({}) {|ac,v|
+    ac["x#{v}"]=Statsample::Vector.new_scale(cases) {ran.call}
+  ac
+  }.to_dataset
+end
+def prediction_pairwise(vars,cases)
+	Statsample::Bivariate.prediction_pairwise(vars,cases) / 10
+end
+def prediction_optimized(vars,cases)
+	Statsample::Bivariate.prediction_optimized(vars,cases) / 10
+end
+if !File.exists?("correlation_matrix.ds") or File.mtime(__FILE__) > File.mtime("correlation_matrix.ds")
+reps=100 #number of repetitions
+ds_sizes=[5,10,30,50,100,150,200,500,1000]
+ds_vars=[3,4,5,10,20,30,40]
+#ds_sizes=[5,10]
+#ds_vars=[3,5,20]
+rs=Statsample::Dataset.new(%w{cases vars time_optimized time_pairwise})
+ds_sizes.each do |cases|
+  ds_vars.each do |vars|
+      ds=create_dataset(vars,cases)
+      time_optimized= Benchmark.realtime do
+        reps.times {
+        Statsample::Bivariate.correlation_matrix_optimized(ds)
+        ds.clear_gsl
+        }
+      end
+      time_pairwise= Benchmark.realtime do
+        reps.times {
+        Statsample::Bivariate.correlation_matrix_pairwise(ds)
+        }
+      end
+      puts "Cases:#{cases}, vars:#{vars} -> opt:%0.3f (%0.3f) | pair: %0.3f (%0.3f)" % [time_optimized, prediction_optimized(vars,cases), time_pairwise, prediction_pairwise(vars,cases)]
+      rs.add_case({'cases'=>cases,'vars'=>vars,'time_optimized'=>Math.sqrt(time_optimized*1000),'time_pairwise'=>Math.sqrt(time_pairwise*1000)})
+    end
+  end
+else
+  rs=Statsample.load("correlation_matrix.ds")
+end
+rs.fields.each {|f| rs[f].type=:scale}
+rs['c_v']=rs.collect {|row| row['cases']*row['vars']}
+rs.update_valid_data
+rs.save("correlation_matrix.ds")
+Statsample::Excel.write(rs,"correlation_matrix.xls")
+rb=ReportBuilder.new(:name=>"Correlation matrix analysis")
+rb.add(Statsample::Regression.multiple(rs[['cases','vars','time_optimized','c_v']],'time_optimized', :digits=>6))
+rb.add(Statsample::Regression.multiple(rs[['cases','vars','time_pairwise','c_v']],'time_pairwise', :digits=>6))
+rb.save_html("correlation_matrix.html")

data/benchmarks/correlation_matrix_methods/correlation_matrix.xls ADDED Viewed

Binary file

data/benchmarks/correlation_matrix_methods/correlation_matrix_gsl_ruby.ods ADDED Viewed

Binary file

data/benchmarks/correlation_matrix_methods/correlation_matrix_with_graphics.ods ADDED Viewed

Binary file

data/benchmarks/correlation_matrix_methods/results.ds ADDED Viewed

Binary file

data/benchmarks/factor_map.rb ADDED Viewed

@@ -0,0 +1,37 @@
+require(File.expand_path(File.dirname(__FILE__)+'/helpers_benchmark.rb'))
+extend BenchPress
+name "Statsample::Factor::Map with and without GSL"
+author 'Clbustos'
+date '2011-01-18'
+summary "Velicer's MAP uses a lot of Matrix algebra. How much we can improve the timing using GSL?
+"
+reps 20 #number of repetitions
+m=Matrix[
+        [ 1, 0.846, 0.805, 0.859, 0.473, 0.398, 0.301, 0.382],
+        [ 0.846, 1, 0.881, 0.826, 0.376, 0.326, 0.277, 0.415],
+        [ 0.805, 0.881, 1, 0.801, 0.38, 0.319, 0.237, 0.345],
+        [ 0.859, 0.826, 0.801, 1, 0.436, 0.329, 0.327, 0.365],
+        [ 0.473, 0.376, 0.38, 0.436, 1, 0.762, 0.73, 0.629],
+        [ 0.398, 0.326, 0.319, 0.329, 0.762, 1, 0.583, 0.577],
+        [ 0.301, 0.277, 0.237, 0.327, 0.73, 0.583, 1, 0.539],
+        [ 0.382, 0.415, 0.345, 0.365, 0.629, 0.577, 0.539, 1]
+  ]
+map=Statsample::Factor::MAP.new(m)
+measure "Statsample::Factor::MAP without GSL" do
+  map.use_gsl=false
+  map.compute
+end
+measure "Statsample::Factor::MAP with GSL" do
+  map.use_gsl=true
+  map.compute
+end

data/benchmarks/helpers_benchmark.rb ADDED Viewed

@@ -0,0 +1,5 @@
+$:.unshift(File.expand_path(File.dirname(__FILE__)+'/../lib/'))
+$:.unshift(File.expand_path(File.dirname(__FILE__)+'/'))
+require 'statsample'
+require 'bench_press'

data/examples/boxplot.rb CHANGED Viewed

@@ -1,17 +1,16 @@
 #!/usr/bin/ruby
 $:.unshift(File.dirname(__FILE__)+'/../lib/')
-$:.unshift('/home/cdx/dev/reportbuilder/lib/')
-require 'benchmark'
 require 'statsample'
-n=100
-a=(n-1).times.map {|i| rand()*20+50}
-b=n.times.map {|i| rand()*10+50}.to_scale
-c=n.times.map {|i| rand()*5+50}.to_scale
-a.push(30)
-a=a.to_scale
-sp=Statsample::Graph::Boxplot.new(:vectors=>[a,b,c],:width=>300, :height=>300, :groups=>%w{first first second}, :minimum=>0)
-rb=ReportBuilder.new
-rb.add(sp)
-puts rb.to_text
+Statsample::Analysis.store(Statsample::Graph::Boxplot) do
+  n=30
+  a=rnorm(n-1,50,10)
+  b=rnorm(n, 30,5)
+  c=rnorm(n,5,1)
+  a.push(2)
+  boxplot(:vectors=>[a,b,c],:width=>300, :height=>300, :groups=>%w{first first second}, :minimum=>0)
+end
+if __FILE__==$0
+  Statsample::Analysis.run
+end