RubyGems - kmeans-clusterer - Versions diffs - 0.5.3 → 0.6.0 - Mend

kmeans-clusterer 0.5.3 → 0.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (3) hide show

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA1:
-  metadata.gz: 18cbb4fb26dfd4c1648b73de2f6dafed580dbcd0
-  data.tar.gz: 1b163ae96a584ab74117f00d589f56e33ccaee96
+  metadata.gz: cf47337db7688eba2c31a5117e2f8c071415759a
+  data.tar.gz: 844c11b63adf3d1e5a554bebcdbde8f251c45d96
 SHA512:
-  metadata.gz: 48ebbf8b36bdfaa27900f1f2fcfdf2475bea0e2a0211f55cbbd2517906724bc16bd5952f25cd62b13fa5eb3ba9dfe2c3dd561102a8a1e3ceeae60070cfddebf6
-  data.tar.gz: ce40602935d7f9ad81ddad2cabfebb87a30c06a8a05df4f7c303910761463724bab887118c3f5671177f5c1c453c1401ca0806675cd12af6aa6be9222c38acc0
+  metadata.gz: 78750f92bd336135d5118c061dea3e6d56cce8500642f18aa8b4dd0c5dd2953eda2c47691348685ff591d5c33b795aff93c52fd6869d53701cc3c46b661b9eee
+  data.tar.gz: 70470a45c59ad789a08f3f73a189de3958e6202b4c4fc5459eae967d2cd3ea4653ac20fc1dc2f343fe795829307f845680975fbaeeb35e5b62335ffc3006fd76

data/lib/kmeans-clusterer.rb CHANGED Viewed

@@ -1,6 +1,8 @@
 require 'narray'
 class KMeansClusterer
+  TYPECODE = { double: NArray::DFLOAT, single: NArray::SFLOAT }
   module Scaler
     def self.mean data
       data.mean(1)
@@ -12,8 +14,8 @@ class KMeansClusterer
       std
     end
-    def self.scale data, mean = nil, std = nil
-      data = NArray.cast(data, NArray::DFLOAT)
+    def self.scale data, mean = nil, std = nil, typecode = nil
+      data = NArray.cast(data, typecode)
       mean ||= self.mean(data)
       std ||= self.std(data)
       data = (data - mean) / std
@@ -64,27 +66,24 @@ class KMeansClusterer
       point.cluster = self
       @points << point
     end
-    def points_narray
-      NArray.cast @points.map(&:data)
-    end
   end
-  DEFAULT_OPTS = { scale_data: false, runs: 10, log: false, init: :kmpp}
+  DEFAULT_OPTS = { scale_data: false, runs: 10, log: false, init: :kmpp, float_precision: :double }
   def self.run k, data, opts = {}
     opts = DEFAULT_OPTS.merge(opts)
     opts[:k] = k
+    opts[:typecode] = TYPECODE[opts[:float_precision]]
     if opts[:scale_data]
-      data, mean, std = Scaler.scale(data)
+      data, mean, std = Scaler.scale(data, nil, nil, opts[:typecode])
       opts[:mean] = mean
       opts[:std] = std
     end
-    opts[:points_matrix] = NMatrix.cast(data, NArray::DFLOAT)
+    opts[:points_matrix] = NMatrix.cast(data, opts[:typecode])
     opts[:row_norms] = opts[:points_matrix].map {|v| v**2}.sum(0)
     bestrun = nil
@@ -119,6 +118,7 @@ class KMeansClusterer
     @mean = opts[:mean]
     @std = opts[:std]
     @scale_data = opts[:scale_data]
+    @typecode = opts[:typecode]
     init_centroids
   end
@@ -144,7 +144,7 @@ class KMeansClusterer
       updated_centroids = []
       @k.times do |i|
-        centroid = NArray.cast(@centroids[true, i].flatten)
+        centroid = NArray.cast(@centroids[true, i].flatten, @typecode)
         point_ids = @cluster_point_ids[i]
         if point_ids.empty?
@@ -159,7 +159,7 @@ class KMeansClusterer
         updated_centroids << newcenter
       end
-      @centroids = NMatrix.cast updated_centroids
+      @centroids = NMatrix.cast updated_centroids, @typecode
       break if moves.max < 0.001 # i.e., no movement
       break if @iterations >= 300
@@ -179,8 +179,8 @@ class KMeansClusterer
   end
   def predict data
-    data, _m, _s = Scaler.scale(data, @mean, @std) if @scale_data
-    data = NMatrix.cast(data, NArray::DFLOAT)
+    data, _m, _s = Scaler.scale(data, @mean, @std, @typecode) if @scale_data
+    data = NMatrix.cast(data, @typecode)
     distances = distance(@centroids, data, nil)
     data.shape[1].times.map do |i|
       distances[i, true].sort_index[0] # index of closest cluster
@@ -223,7 +223,7 @@ class KMeansClusterer
   private
     def wrap_point point
       return point if point.is_a?(Point)
-      Point.new(0, NArray.to_na(point).to_f)
+      Point.new(0, NArray.cast(point, @typecode))
     end
     def dissimilarity points, point
@@ -259,7 +259,7 @@ class KMeansClusterer
           d2 << min_distance**2
         end
-        d2 = NArray.to_na d2
+        d2 = NArray.cast(d2, @typecode)
         probs = d2 / d2.sum
         cumprobs = probs.cumsum
         r = rand
@@ -271,7 +271,7 @@ class KMeansClusterer
     end
     def custom_centroid_init
-      @centroids = NMatrix.cast @init
+      @centroids = NMatrix.cast @init, @typecode
       @k = @init.length
     end
@@ -289,14 +289,14 @@ class KMeansClusterer
     def set_points
       @points = @points_count.times.map do |i|
-        data = NArray.cast @points_matrix[true, i].flatten
+        data = NArray.cast @points_matrix[true, i].flatten, @typecode
         Point.new(i, data, @labels[i])
       end
     end
     def set_clusters
       @clusters = @k.times.map do |i|
-        centroid = NArray.cast @centroids[true, i].flatten
+        centroid = NArray.cast @centroids[true, i].flatten, @typecode
         c = Cluster.new i, Point.new(-i, centroid)
         @cluster_point_ids[i].each do |p|
           c << @points[p]
@@ -322,17 +322,17 @@ class KMeansClusterer
     end
     def get_point i
-      NArray.cast @points_matrix[true, i].flatten
+      NArray.cast @points_matrix[true, i].flatten, @typecode
     end
     def get_centroid i
-      NArray.cast(@centroids[true, i].flatten)
+      NArray.cast(@centroids[true, i].flatten, @typecode)
     end
     def get_points_for_centroid i
       point_ids = @cluster_point_ids[i]
       points = @points_matrix[true, point_ids]
-      points.empty? ? NArray.dfloat(0) : NArray.cast(points)
+      points.empty? ? NArray.sfloat(0) : NArray.cast(points, @typecode)
     end
     def distance x, y, yy = @row_norms

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: kmeans-clusterer
 version: !ruby/object:Gem::Version
-  version: 0.5.3
+  version: 0.6.0
 platform: ruby
 authors:
 - Geoff Buesing