RubyGems - statsample - Versions diffs - 0.6.5 → 0.6.7 - Mend

statsample 0.6.5 → 0.6.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (61) hide show

data/History.txt +15 -0
data/Manifest.txt +6 -0
data/README.txt +30 -12
data/Rakefile +91 -0
data/demo/levene.rb +9 -0
data/demo/multiple_regression.rb +1 -7
data/demo/polychoric.rb +1 -0
data/demo/principal_axis.rb +8 -0
data/lib/distribution/f.rb +22 -22
data/lib/spss.rb +99 -99
data/lib/statsample/bivariate/polychoric.rb +32 -22
data/lib/statsample/bivariate/tetrachoric.rb +212 -207
data/lib/statsample/bivariate.rb +6 -6
data/lib/statsample/codification.rb +65 -65
data/lib/statsample/combination.rb +60 -59
data/lib/statsample/converter/csv19.rb +12 -12
data/lib/statsample/converters.rb +1 -1
data/lib/statsample/dataset.rb +93 -36
data/lib/statsample/dominanceanalysis/bootstrap.rb +66 -3
data/lib/statsample/dominanceanalysis.rb +5 -6
data/lib/statsample/factor/pca.rb +41 -11
data/lib/statsample/factor/principalaxis.rb +105 -29
data/lib/statsample/factor/rotation.rb +20 -3
data/lib/statsample/factor.rb +1 -1
data/lib/statsample/graph/gdchart.rb +13 -13
data/lib/statsample/graph/svggraph.rb +166 -167
data/lib/statsample/matrix.rb +22 -12
data/lib/statsample/mle/logit.rb +3 -2
data/lib/statsample/mle/probit.rb +7 -5
data/lib/statsample/mle.rb +4 -2
data/lib/statsample/multiset.rb +125 -124
data/lib/statsample/permutation.rb +2 -1
data/lib/statsample/regression/binomial/logit.rb +4 -3
data/lib/statsample/regression/binomial/probit.rb +2 -1
data/lib/statsample/regression/binomial.rb +62 -81
data/lib/statsample/regression/multiple/baseengine.rb +1 -1
data/lib/statsample/regression/multiple/gslengine.rb +1 -1
data/lib/statsample/regression/multiple/matrixengine.rb +12 -6
data/lib/statsample/regression/multiple.rb +15 -42
data/lib/statsample/regression/simple.rb +93 -78
data/lib/statsample/regression.rb +74 -2
data/lib/statsample/reliability.rb +117 -120
data/lib/statsample/srs.rb +156 -153
data/lib/statsample/test/levene.rb +90 -0
data/lib/statsample/test/umannwhitney.rb +25 -9
data/lib/statsample/test.rb +2 -0
data/lib/statsample/vector.rb +388 -413
data/lib/statsample.rb +74 -30
data/po/es/statsample.mo +0 -0
data/test/test_bivariate.rb +5 -4
data/test/test_combination.rb +1 -1
data/test/test_dataset.rb +2 -2
data/test/test_factor.rb +53 -6
data/test/test_gsl.rb +1 -1
data/test/test_mle.rb +1 -1
data/test/test_regression.rb +18 -33
data/test/test_statistics.rb +15 -33
data/test/test_stest.rb +35 -0
data/test/test_svg_graph.rb +2 -2
data/test/test_vector.rb +331 -333
metadata +38 -11

data/lib/statsample/bivariate/tetrachoric.rb CHANGED Viewed

@@ -5,7 +5,7 @@ module Statsample
       tc=Tetrachoric.new_with_vectors(v1,v2)
       tc.r
     end
     # Tetrachoric correlation matrix.
     # Order of rows and columns depends on Dataset#fields order
     def self.tetrachoric_correlation_matrix(ds)
@@ -21,20 +21,20 @@ module Statsample
         end
       end
     end
-    #
     # Compute tetrachoric correlation.
-    #
-    # See http://www.john-uebersax.com/stat/tetra.htm for extensive
-    # documentation about tetrachoric correlation.
+    #
+    # The <em>tetrachoric</em> correlation is a measure of
+    # bivariate association arising when both observed variates
+    # are  categorical variables that result from dichotomizing
+    # the two undelying continuous variables (Drasgow, 2006).
+    # The tetrachoric correlation is a good way to measure rater agreement  (Uebersax, 2006)
     #
     # This class uses Brown (1977) algorithm. You can see FORTRAN code on http://lib.stat.cmu.edu/apstat/116
-    #
-    # == References:
-    # * Brown, MB. (1977) Algorithm AS 116: the tetrachoric correlation and its standard error. _Applied Statistics, 26_, 343-351.
     #
-    # <b>Usage</b>.
+    #
+    # == Usage
     # With two variables x and y on a crosstab like this:
-    #
+    #
     #         -------------
     #         | y=0 | y=1 |
     #         -------------
@@ -43,20 +43,25 @@ module Statsample
     #   x = 1 |  c  |  d  |
     #         -------------
     #
-    # Use:
+    # The code will be
     #   tc=Statsample::Bivariate::Tetrachoric.new(a,b,c,d)
     #   tc.r # correlation
     #   tc.se # standard error
     #   tc.threshold_y # threshold for y variable
     #   tc.threshold_x # threshold for x variable
+    #
+    # == References:
+    #
+    # * Brown, MB. (1977) Algorithm AS 116: the tetrachoric correlation and its standard error. <em>Applied Statistics, 26</em>, 343-351.
+    # * Drasgow F. (2006). Polychoric and polyserial correlations. In Kotz L, Johnson NL (Eds.), Encyclopedia of statistical sciences. Vol. 7 (pp. 69-74). New York: Wiley.
+    # * Uebersax, J.S. (2006). The tetrachoric and polychoric correlation coefficients. Statistical Methods for Rater Agreement web site. 2006. Available at: http://john-uebersax.com/stat/tetra.htm . Accessed February, 11, 2010
     class Tetrachoric
       include GetText
       bindtextdomain("statsample")
       attr_reader :r
       attr_accessor :name
       TWOPI=Math::PI*2
       SQT2PI= 2.50662827
       RLIMIT = 0.9999
@@ -113,7 +118,7 @@ module Statsample
         rp.add(self)
         rp.to_text
       end
       def to_reportbuilder(generator) # :nodoc:
         section=ReportBuilder::Section.new(:name=>@name)
         t=ReportBuilder::Table.new(:name=>_("Contingence Table"),:header=>["","Y=0","Y=1", "T"])
@@ -129,211 +134,211 @@ module Statsample
         section.add(_("Threshold Y: %0.3f ") % [threshold_y] )
         generator.parse_element(section)
       end
-      # Creates a new tetrachoric object for analysis
+      # Creates a new tetrachoric object for analysis
       def initialize(a,b,c,d)
         @a,@b,@c,@d=a,b,c,d
         @name=_("Tetrachoric correlation")
         #
         #       CHECK IF ANY CELL FREQUENCY IS NEGATIVE
         #
-        raise "All frequencies should be positive" if  (@a < 0 or @b < 0 or @c < 0  or @d < 0)
+        raise "All frequencies should be positive" if  (@a < 0 or @b < 0 or @c < 0  or @d < 0)
         compute
       end
       # Compute the tetrachoric correlation.
       # Called on object creation.
       #
       def compute
-      #
-      # INITIALIZATION
-      #
-      @r = 0
-      sdzero = 0
-      @sdr = 0
-      @itype = 0
-      @ifault = 0
-      #
-      #       CHECK IF ANY FREQUENCY IS 0.0 AND SET kdelta
-      #
-      @kdelta = 1
-      delta  = 0
-      @kdelta  = 2 if (@a == 0 or @d == 0)
-      @kdelta += 2 if (@b == 0 or @c == 0)
-      #
-      #        kdelta=4 MEANS TABLE HAS 0.0 ROW OR COLUMN, RUN IS TERMINATED
-      #
-      raise "Rows and columns should have more than 0 items" if @kdelta==4
+        #
+        # INITIALIZATION
+        #
+        @r = 0
+        sdzero = 0
+        @sdr = 0
+        @itype = 0
+        @ifault = 0
-      #      GOTO (4, 1, 2 , 92), kdelta
-      #
-      #        delta IS 0.0, 0.5 OR -0.5 ACCORDING TO WHICH CELL IS 0.0
-      #
-      if(@kdelta==2)
-        # 1
-        delta=0.5
-        @r=-1 if (@a==0 and @d==0)
-      elsif(@kdelta==3)
-        # 2
-        delta=-0.5
-        @r=1 if (@b==0 and @c==0)
-      end
-      # 4
-      if @r!=0
-        @itype=3
-      end
+        #
+        #       CHECK IF ANY FREQUENCY IS 0.0 AND SET kdelta
+        #
+        @kdelta = 1
+        delta  = 0
+        @kdelta  = 2 if (@a == 0 or @d == 0)
+        @kdelta += 2 if (@b == 0 or @c == 0)
+        #
+        #        kdelta=4 MEANS TABLE HAS 0.0 ROW OR COLUMN, RUN IS TERMINATED
+        #
-      #
-      #        STORE FREQUENCIES IN  AA, BB, CC AND DD
-      #
-      @aa = @a + delta
-      @bb = @b - delta
-      @cc = @c - delta
-      @dd = @d + delta
-      @tot = @aa+@bb+@cc+@dd
-      #
-      #        CHECK IF CORRELATION IS NEGATIVE, 0.0, POSITIVE
-      #        IF (AA * DD - BB * CC) 7, 5, 6
+        raise "Rows and columns should have more than 0 items" if @kdelta==4
-      corr_dir=@aa * @dd - @bb * @cc
-      if(corr_dir < 0)
-      # 7
-        @probaa = @bb.quo(@tot)
-        @probac = (@bb + @dd).quo(@tot)
-        @ksign = 2
-        # ->  8
-      else
-        if (corr_dir==0)
-          # 5
-          @itype=4
+        #      GOTO (4, 1, 2 , 92), kdelta
+        #
+        #        delta IS 0.0, 0.5 OR -0.5 ACCORDING TO WHICH CELL IS 0.0
+        #
+        if(@kdelta==2)
+          # 1
+          delta=0.5
+          @r=-1 if (@a==0 and @d==0)
+        elsif(@kdelta==3)
+          # 2
+          delta=-0.5
+          @r=1 if (@b==0 and @c==0)
+        end
+        # 4
+        if @r!=0
+          @itype=3
         end
-        # 6
         #
-        #        COMPUTE PROBABILITIES OF QUADRANT AND OF MARGINALS
-        #        PROBAA AND PROBAC CHOSEN SO THAT CORRELATION IS POSITIVE.
-        #        KSIGN INDICATES WHETHER QUADRANTS HAVE BEEN SWITCHED
+        #        STORE FREQUENCIES IN  AA, BB, CC AND DD
         #
-        @probaa = @aa.quo(@tot)
-        @probac = (@aa+@cc).quo(@tot)
-        @ksign=1
-      end
-      # 8
-      @probab = (@aa+@bb).quo(@tot)
-      #
-      #        COMPUTE NORMAL DEVIATES FOR THE MARGINAL FREQUENCIES
-      #        SINCE NO MARGINAL CAN BE 0.0, IE IS NOT CHECKED
-      #
-      @zac = Distribution::Normal.p_value(@probac)
-      @zab = Distribution::Normal.p_value(@probab)
-      @ss = Math::exp(-0.5 * (@zac ** 2 + @zab ** 2)).quo(TWOPI)
-      #
-      #        WHEN R IS 0.0, 1.0 OR -1.0, TRANSFER TO COMPUTE SDZERO
-      #
-      if (@r != 0 or @itype > 0)
-        compute_sdzero
-        return true
-      end
-      #
-      #        WHEN MARGINALS ARE EQUAL, COSINE EVALUATION IS USED
-      #
-      if (@a == @b and @b == @c)
-        calculate_cosine
-        return true
-      end
-      #
-      #        INITIAL ESTIMATE OF CORRELATION IS YULES Y
-      #
-      @rr = ((Math::sqrt(@aa * @dd) - Math::sqrt(@bb * @cc)) ** 2)  / (@aa * @dd - @bb * @cc).abs
-      @iter = 0
-      begin
+        @aa = @a + delta
+        @bb = @b - delta
+        @cc = @c - delta
+        @dd = @d + delta
+        @tot = @aa+@bb+@cc+@dd
         #
-        #        IF RR EXCEEDS RCUT, GAUSSIAN QUADRATURE IS USED
+        #        CHECK IF CORRELATION IS NEGATIVE, 0.0, POSITIVE
+        #        IF (AA * DD - BB * CC) 7, 5, 6
+        corr_dir=@aa * @dd - @bb * @cc
+        if(corr_dir < 0)
+          # 7
+          @probaa = @bb.quo(@tot)
+          @probac = (@bb + @dd).quo(@tot)
+          @ksign = 2
+          # ->  8
+        else
+          if (corr_dir==0)
+            # 5
+            @itype=4
+          end
+          # 6
+          #
+          #        COMPUTE PROBABILITIES OF QUADRANT AND OF MARGINALS
+          #        PROBAA AND PROBAC CHOSEN SO THAT CORRELATION IS POSITIVE.
+          #        KSIGN INDICATES WHETHER QUADRANTS HAVE BEEN SWITCHED
+          #
+          @probaa = @aa.quo(@tot)
+          @probac = (@aa+@cc).quo(@tot)
+          @ksign=1
+        end
+        # 8
+        @probab = (@aa+@bb).quo(@tot)
+        #
+        #        COMPUTE NORMAL DEVIATES FOR THE MARGINAL FREQUENCIES
+        #        SINCE NO MARGINAL CAN BE 0.0, IE IS NOT CHECKED
         #
-        #10
-        if @rr>RCUT
-          gaussian_quadrature
+        @zac = Distribution::Normal.p_value(@probac)
+        @zab = Distribution::Normal.p_value(@probab)
+        @ss = Math::exp(-0.5 * (@zac ** 2 + @zab ** 2)).quo(TWOPI)
+        #
+        #        WHEN R IS 0.0, 1.0 OR -1.0, TRANSFER TO COMPUTE SDZERO
+        #
+        if (@r != 0 or @itype > 0)
+          compute_sdzero
           return true
         end
         #
-        #        TETRACHORIC SERIES IS COMPUTED
+        #        WHEN MARGINALS ARE EQUAL, COSINE EVALUATION IS USED
+        #
+        if (@a == @b and @b == @c)
+          calculate_cosine
+          return true
+        end
         #
-        #        INITIALIZATION
+        #        INITIAL ESTIMATE OF CORRELATION IS YULES Y
         #
-        va=1.0
-        vb=@zac.to_f
-        wa=1.0
-        wb=@zab.to_f
-        term = 1.0
-        iterm = 0.0
-        @sum = @probab * @probac
-        deriv = 0.0
-        sr = @ss
-        #15
+        @rr = ((Math::sqrt(@aa * @dd) - Math::sqrt(@bb * @cc)) ** 2)  / (@aa * @dd - @bb * @cc).abs
+        @iter = 0
         begin
-          if(sr.abs<=CONST)
+          #
+          #        IF RR EXCEEDS RCUT, GAUSSIAN QUADRATURE IS USED
+          #
+          #10
+          if @rr>RCUT
+            gaussian_quadrature
+            return true
+          end
+          #
+          #        TETRACHORIC SERIES IS COMPUTED
+          #
+          #        INITIALIZATION
+          #
+          va=1.0
+          vb=@zac.to_f
+          wa=1.0
+          wb=@zab.to_f
+          term = 1.0
+          iterm = 0.0
+          @sum = @probab * @probac
+          deriv = 0.0
+          sr = @ss
+          #15
+          begin
+            if(sr.abs<=CONST)
+              #
+              #        RESCALE TERMS TO AVOID OVERFLOWS AND UNDERFLOWS
+              #
+              sr = sr  / CONST
+              va = va * CHALF
+              vb = vb * CHALF
+              wa = wa * CHALF
+              wb = wb * CHALF
+            end
+            #
+            #        FORM SUM AND DERIVATIVE OF SERIES
+            #
+            #  20
+            dr = sr * va * wa
+            sr = sr * @rr / term
+            cof = sr * va * wa
             #
-            #        RESCALE TERMS TO AVOID OVERFLOWS AND UNDERFLOWS
+            #        ITERM COUNTS NO. OF CONSECUTIVE TERMS  <  CONV
             #
-            sr = sr  / CONST
-            va = va * CHALF
-            vb = vb * CHALF
-            wa = wa * CHALF
-            wb = wb * CHALF
+            iterm+=  1
+            iterm=0 if (cof.abs > CONV)
+            @sum = @sum + cof
+            deriv += dr
+            vaa = va
+            waa = wa
+            va = vb
+            wa = wb
+            vb = @zac * va - term * vaa
+            wb = @zab * wa - term * waa
+            term += 1
+          end while (iterm < 2 or term < 6)
+          #
+          #        CHECK IF ITERATION CONVERGED
+          #
+          if((@sum-@probaa).abs <= CITER)
+            @itype=term
+            calculate_sdr
+            return true
           end
           #
-          #        FORM SUM AND DERIVATIVE OF SERIES
+          #        CALCULATE NEXT ESTIMATE OF CORRELATION
           #
-          #  20
-          dr = sr * va * wa
-          sr = sr * @rr / term
-          cof = sr * va * wa
+          #25
+          @iter += 1
           #
-          #        ITERM COUNTS NO. OF CONSECUTIVE TERMS  <  CONV
+          #        IF TOO MANY ITERATlONS, RUN IS TERMINATED
           #
-          iterm+=  1
-          iterm=0 if (cof.abs > CONV)
-          @sum = @sum + cof
-          deriv += dr
-          vaa = va
-          waa = wa
-          va = vb
-          wa = wb
-          vb = @zac * va - term * vaa
-          wb = @zab * wa - term * waa
-          term += 1
-        end while (iterm < 2 or term < 6)
-        #
-        #        CHECK IF ITERATION CONVERGED
-        #
-        if((@sum-@probaa).abs <= CITER)
-          @itype=term
-          calculate_sdr
-          return true
-        end
-        #
-        #        CALCULATE NEXT ESTIMATE OF CORRELATION
-        #
-        #25
-        @iter += 1
-        #
-        #        IF TOO MANY ITERATlONS, RUN IS TERMINATED
-        #
-        delta = (@sum - @probaa) /  deriv
-        @rrprev = @rr
-        @rr = @rr - delta
-        @rr += 0.5 * delta if(@iter == 1)
-        @rr= RLIMIT if (@rr > RLIMIT)
-        @rr =0 if (@rr  <  0.0)
-      end while @iter < NITER
-      raise "Too many iteration"
-    #  GOTO 10
-    end
+          delta = (@sum - @probaa) /  deriv
+          @rrprev = @rr
+          @rr = @rr - delta
+          @rr += 0.5 * delta if(@iter == 1)
+          @rr= RLIMIT if (@rr > RLIMIT)
+          @rr =0 if (@rr  <  0.0)
+        end while @iter < NITER
+        raise "Too many iteration"
+        #  GOTO 10
+      end
       # GAUSSIAN QUADRATURE
       # 40
       def gaussian_quadrature
@@ -342,8 +347,8 @@ module Statsample
           @sum=@probab*@probac
           @rrprev=0
         end
-        # 41
+        # 41
         sumprv = @probab - @sum
         @prob = @bb.quo(@tot)
         @prob = @aa.quo(@tot) if (@ksign == 2)
@@ -353,7 +358,7 @@ module Statsample
         #  COMPUTATION OF INTEGRAL (SUM) BY QUADRATURE
         #
         # 42
         begin
           rrsq = Math::sqrt(1 - @rr ** 2)
           amid = 0.5 * (UPLIM + @zac)
@@ -362,8 +367,8 @@ module Statsample
           (1..16).each do |iquad|
             xla = amid + X[iquad] * xlen
             xlb = amid - X[iquad] * xlen
             #
             #       TO AVOID UNDERFLOWS, TEMPA AND TEMPB ARE USED
             #
@@ -372,7 +377,7 @@ module Statsample
               @sum = @sum + W[iquad] * Math::exp(-0.5  * xla ** 2) * Distribution::Normal.cdf(tempa)
             end
             tempb = (@zab - @rr * xlb) / rrsq
             if (tempb >= -6.0)
               @sum = @sum + W[iquad] * Math::exp(-0.5 * xlb ** 2) * Distribution::Normal.cdf(tempb)
             end
@@ -380,29 +385,29 @@ module Statsample
           @sum=@sum*xlen / SQT2PI
           #
           # CHECK IF ITERATION HAS CONVERGED
-          #
-          if ((@prob - @sum).abs <= CITER)
+          #
+          if ((@prob - @sum).abs <= CITER)
             calculate_sdr
             return true
           end
           # ESTIMATE CORRELATION FOR NEXT ITERATION BY LINEAR INTERPOLATION
           rrest = ((@prob -  @sum) * @rrprev - (@prob - sumprv) * @rr) / (sumprv - @sum)
-          rrest = RLIMIT if (rrest > RLIMIT)
-          rrest = 0 if (rrest < 0)
+          rrest = RLIMIT if (rrest > RLIMIT)
+          rrest = 0 if (rrest < 0)
           @rrprev = @rr
           @rr = rrest
           sumprv = @sum
           #
           #        if estimate has same value on two iterations, stop iteration
           #
-          if @rr == @rrprev
+          if @rr == @rrprev
             calculate_sdr
             return true
           end
-        end while @iter < NITER
+        end while @iter < NITER
         raise "Too many iterations"
         # ir a 42
       end
@@ -414,16 +419,16 @@ module Statsample
         @itype = 2
         calculate_sdr
       end
       def calculate_sdr # :nodoc:
         #
         # COMPUTE SDR
         #
         @r = @rr
-        rrsq = Math::sqrt(1.0 - @r ** 2)
+        rrsq = Math::sqrt(1.0 - @r ** 2)
         @itype = -@itype if (@kdelta > 1)
-        if (@ksign != 1)
+        if (@ksign != 1)
           @r = -@r
           @zac = -@zac
         end
@@ -431,13 +436,13 @@ module Statsample
         pdf = Math::exp(-0.5 * (@zac ** 2 - 2 * @r * @zac * @zab + @zab ** 2)  / rrsq ** 2) / (TWOPI * rrsq)
         @pac = Distribution::Normal.cdf((@zac - @r * @zab) / rrsq) - 0.5
         @pab = Distribution::Normal.cdf((@zab - @r * @zac) / rrsq) - 0.5
         @sdr = ((@aa+@dd) * (@bb + @cc)).quo(4) + @pab ** 2 * (@aa + @cc) * (@bb + @dd) + @pac ** 2 * (@aa + @bb) * (@cc + @dd) + 2.0 * @pab * @pac * (@aa * @dd - @bb * @cc) - @pab * (@aa * @bb - @cc * @dd) - @pac * (@aa * @cc - @bb * @dd)
         @sdr=0 if (@sdr<0)
         @sdr= Math::sqrt(@sdr) / (@tot * pdf * Math::sqrt(@tot))
         compute_sdzero
       end
       # 85
       #
       #        COMPUTE SDZERO

data/lib/statsample/bivariate.rb CHANGED Viewed

@@ -1,14 +1,14 @@
 require 'statsample/bivariate/tetrachoric'
 require 'statsample/bivariate/polychoric'
 module Statsample
-  # Diverse correlation methods
+  # Diverse bivariate methods, including #covariance, #pearson correlation (r), #spearman ranked correlation (rho), #tetrachoric correlation and #polychoric correlation.
   module Bivariate
     class << self
       # Covariance between two vectors
       def covariance(v1,v2)
         v1a,v2a=Statsample.only_valid(v1,v2)
         return nil if v1a.size==0
-        if HAS_GSL
+        if Statsample.has_gsl?
           GSL::Stats::covariance(v1a.gsl, v2a.gsl)
         else
           covariance_slow(v1a,v2a)
@@ -31,11 +31,12 @@ module Statsample
         (0...v1a.size).each {|i| t+=((v1a[i]-m1)*(v2a[i]-m2)) }
         t.to_f / (v1a.size-1)
       end
-      # Calculate Pearson correlation coefficient between 2 vectors
+      # Calculate Pearson correlation coefficient (r) between 2 vectors
       def pearson(v1,v2)
         v1a,v2a=Statsample.only_valid(v1,v2)
         return nil if v1a.size ==0
-        if HAS_GSL
+        if Statsample.has_gsl?
           GSL::Stats::correlation(v1a.gsl, v2a.gsl)
         else
           pearson_slow(v1a,v2a)
@@ -177,7 +178,7 @@ module Statsample
         Matrix.rows(rows)
       end
-      # Spearman ranked correlation coefficient between 2 vectors
+      # Spearman ranked correlation coefficient (rho) between 2 vectors
       def spearman(v1,v2)
         v1a,v2a=Statsample.only_valid(v1,v2)
         v1r,v2r=v1a.ranked(:scale),v2a.ranked(:scale)
@@ -195,7 +196,6 @@ module Statsample
         ((m1.mean-m0.mean).to_f / ds['c'].sdp) * Math::sqrt(m0.size*m1.size.to_f / ds.cases**2)
       end
       # Kendall Rank Correlation Coefficient.
-      #
       # Based on Hervé Adbi article
       def tau_a(v1,v2)
         v1a,v2a=Statsample.only_valid(v1,v2)