RubyGems - ruby-dnn - Versions diffs - 0.12.4 → 0.13.0 - Mend

ruby-dnn 0.12.4 → 0.13.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (34) hide show

checksums.yaml +4 -4
data/examples/cifar100_example.rb +1 -1
data/examples/cifar10_example.rb +1 -1
data/examples/dcgan/dcgan.rb +7 -3
data/examples/dcgan/imgen.rb +1 -1
data/examples/dcgan/train.rb +5 -2
data/examples/iris_example.rb +1 -1
data/examples/mnist_conv2d_example.rb +1 -1
data/examples/mnist_define_by_run.rb +1 -1
data/examples/mnist_example.rb +1 -1
data/examples/mnist_lstm_example.rb +1 -1
data/lib/dnn.rb +2 -0
data/lib/dnn/core/embedding.rb +1 -2
data/lib/dnn/core/error.rb +2 -0
data/lib/dnn/core/global.rb +9 -0
data/lib/dnn/core/initializers.rb +1 -1
data/lib/dnn/core/iterator.rb +11 -3
data/lib/dnn/core/layers.rb +13 -15
data/lib/dnn/core/link.rb +11 -0
data/lib/dnn/core/losses.rb +52 -63
data/lib/dnn/core/merge_layers.rb +3 -3
data/lib/dnn/core/models.rb +130 -140
data/lib/dnn/core/normalizations.rb +2 -10
data/lib/dnn/core/optimizers.rb +62 -57
data/lib/dnn/core/param.rb +2 -0
data/lib/dnn/core/savers.rb +138 -0
data/lib/dnn/{cifar10.rb → datasets/cifar10.rb} +1 -1
data/lib/dnn/{cifar100.rb → datasets/cifar100.rb} +1 -1
data/lib/dnn/{downloader.rb → datasets/downloader.rb} +0 -0
data/lib/dnn/{fashion-mnist.rb → datasets/fashion-mnist.rb} +1 -1
data/lib/dnn/{iris.rb → datasets/iris.rb} +0 -0
data/lib/dnn/{mnist.rb → datasets/mnist.rb} +1 -1
data/lib/dnn/version.rb +1 -1
metadata +10 -8

data/lib/dnn/core/optimizers.rb CHANGED Viewed

@@ -3,8 +3,19 @@ module DNN
     # Super class of all optimizer classes.
     class Optimizer
+      attr_reader :status
       attr_accessor :clip_norm
+      def self.load(dumped)
+        opt = Utils.hash_to_obj(dumped[:hash])
+        dumped[:status].each do |key, state|
+          state = state.clone
+          opt.status[key] = state
+          opt.instance_variable_set("@#{key}", state)
+        end
+        opt
+      end
       # @param [Float | NilClass] clip_norm Gradient clip norm.
       def initialize(clip_norm: nil)
         @clip_norm = clip_norm
@@ -22,6 +33,10 @@ module DNN
         end
       end
+      def dump
+        { hash: to_hash, status: @status }
+      end
       def to_hash(merge_hash = nil)
         hash = { class: self.class.name, clip_norm: @clip_norm }
         hash.merge!(merge_hash) if merge_hash
@@ -59,6 +74,7 @@ module DNN
         @lr = lr
         @momentum = momentum
         @v = {}
+        @status = { v: @v }
       end
       def to_hash
@@ -69,9 +85,9 @@ module DNN
         params.each do |param|
           amount = param.grad * @lr
           if @momentum > 0
-            @v[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-            amount += @momentum * @v[param]
-            @v[param] = amount
+            @v[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+            amount += @momentum * @v[param.name]
+            @v[param.name] = amount
           end
           param.data -= amount
         end
@@ -79,33 +95,17 @@ module DNN
     end
-    class Nesterov < Optimizer
-      attr_accessor :lr
-      attr_accessor :momentum
-      def self.from_hash(hash)
-        self.new(hash[:lr], momentum: hash[:momentum], clip_norm: hash[:clip_norm])
-      end
-      # @param [Float] lr Learning rate.
-      # @param [Float] momentum Momentum coefficient.
+    class Nesterov < SGD
       def initialize(lr = 0.01, momentum: 0.9, clip_norm: nil)
-        super(clip_norm: clip_norm)
-        @lr = lr
-        @momentum = momentum
-        @v = {}
-      end
-      def to_hash
-        super(lr: @lr, momentum: @momentum)
+        super(lr, momentum: momentum, clip_norm: clip_norm)
       end
       private def update_params(params)
         params.each do |param|
-          @v[param] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @v[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
           amount = param.grad * @lr
-          @v[param] = @v[param] * @momentum - amount
-          param.data = (param.data + @momentum ** 2 * @v[param]) - (1 + @momentum) * amount
+          @v[param.name] = @v[param.name] * @momentum - amount
+          param.data = (param.data + @momentum ** 2 * @v[param.name]) - (1 + @momentum) * amount
         end
       end
     end
@@ -126,13 +126,14 @@ module DNN
         @lr = lr
         @eps = eps
         @g = {}
+        @status = { g: @g }
       end
       private def update_params(params)
         params.each do |param|
-          @g[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @g[param] += param.grad ** 2
-          param.data -= (@lr / Xumo::NMath.sqrt(@g[param] + @eps)) * param.grad
+          @g[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @g[param.name] += param.grad ** 2
+          param.data -= (@lr / Xumo::NMath.sqrt(@g[param.name] + @eps)) * param.grad
         end
       end
@@ -160,6 +161,7 @@ module DNN
         @alpha = alpha
         @eps = eps
         @g = {}
+        @status = { g: @g }
       end
       def to_hash
@@ -168,9 +170,9 @@ module DNN
       private def update_params(params)
         params.each do |param|
-          @g[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @g[param] = @alpha * @g[param] + (1 - @alpha) * param.grad ** 2
-          param.data -= (@lr / Xumo::NMath.sqrt(@g[param] + @eps)) * param.grad
+          @g[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @g[param.name] = @alpha * @g[param.name] + (1 - @alpha) * param.grad ** 2
+          param.data -= (@lr / Xumo::NMath.sqrt(@g[param.name] + @eps)) * param.grad
         end
       end
     end
@@ -192,6 +194,7 @@ module DNN
         @eps = eps
         @h = {}
         @s = {}
+        @status = { h: @h, s: @s }
       end
       def to_hash
@@ -200,11 +203,11 @@ module DNN
       private def update_params(params)
         params.each do |param|
-          @h[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @s[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @h[param] = @rho * @h[param] + (1 - @rho) * param.grad ** 2
-          v = (Xumo::NMath.sqrt(@s[param] + @eps) / Xumo::NMath.sqrt(@h[param] + @eps)) * param.grad
-          @s[param] = @rho * @s[param] + (1 - @rho) * v ** 2
+          @h[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @s[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @h[param.name] = @rho * @h[param.name] + (1 - @rho) * param.grad ** 2
+          v = (Xumo::NMath.sqrt(@s[param.name] + @eps) / Xumo::NMath.sqrt(@h[param.name] + @eps)) * param.grad
+          @s[param.name] = @rho * @s[param.name] + (1 - @rho) * v ** 2
           param.data -= v
         end
       end
@@ -230,6 +233,7 @@ module DNN
         @eps = eps
         @m = {}
         @v = {}
+        @status = { m: @m, v: @v }
       end
       def to_hash
@@ -238,11 +242,11 @@ module DNN
       private def update_params(params)
         params.each do |param|
-          @m[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @v[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @m[param] = @alpha * @m[param] + (1 - @alpha) * param.grad
-          @v[param] = @alpha * @v[param] + (1 - @alpha) * param.grad ** 2
-          param.data -= (@lr / Xumo::NMath.sqrt(@v[param] - @m[param] ** 2 + @eps)) * param.grad
+          @m[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @v[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @m[param.name] = @alpha * @m[param.name] + (1 - @alpha) * param.grad
+          @v[param.name] = @alpha * @v[param.name] + (1 - @alpha) * param.grad ** 2
+          param.data -= (@lr / Xumo::NMath.sqrt(@v[param.name] - @m[param.name] ** 2 + @eps)) * param.grad
         end
       end
     end
@@ -275,7 +279,8 @@ module DNN
         @t = 0
         @m = {}
         @v = {}
-        @s = {} if amsgrad
+        @s = amsgrad ? {} : nil
+        @status = { t: @t, m: @m, v: @v, s: @s }
       end
       def to_hash
@@ -289,16 +294,16 @@ module DNN
         @t += 1
         lr = @alpha * Math.sqrt(1 - @beta2 ** @t) / (1 - @beta1 ** @t)
         params.each do |param|
-          @m[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @v[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @m[param] += (1 - @beta1) * (param.grad - @m[param])
-          @v[param] += (1 - @beta2) * (param.grad ** 2 - @v[param])
+          @m[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @v[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @m[param.name] += (1 - @beta1) * (param.grad - @m[param.name])
+          @v[param.name] += (1 - @beta2) * (param.grad ** 2 - @v[param.name])
           if @amsgrad
-            @s[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-            @s[param] = Xumo::SFloat.maximum(@s[param], @v[param])
-            param.data -= lr * @m[param] / Xumo::NMath.sqrt(@s[param] + @eps)
+            @s[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+            @s[param.name] = Xumo::SFloat.maximum(@s[param.name], @v[param.name])
+            param.data -= lr * @m[param.name] / Xumo::NMath.sqrt(@s[param.name] + @eps)
           else
-            param.data -= lr * @m[param] / Xumo::NMath.sqrt(@v[param] + @eps)
+            param.data -= lr * @m[param.name] / Xumo::NMath.sqrt(@v[param.name] + @eps)
           end
         end
       end
@@ -336,16 +341,16 @@ module DNN
         lower_bound = final_lr * (1 - 1 / (@gamma * @t + 1))
         upper_bound = final_lr * (1 + 1 / (@gamma * @t))
         params.each do |param|
-          @m[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @v[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-          @m[param] += (1 - @beta1) * (param.grad - @m[param])
-          @v[param] += (1 - @beta2) * (param.grad ** 2 - @v[param])
+          @m[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @v[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+          @m[param.name] += (1 - @beta1) * (param.grad - @m[param.name])
+          @v[param.name] += (1 - @beta2) * (param.grad ** 2 - @v[param.name])
           if @amsgrad
-            @s[param] ||= Xumo::SFloat.zeros(*param.data.shape)
-            @s[param] = Xumo::SFloat.maximum(@s[param], @v[param])
-            param.data -= clip_lr(lr / (Xumo::NMath.sqrt(@s[param]) + @eps), lower_bound, upper_bound) * @m[param]
+            @s[param.name] ||= Xumo::SFloat.zeros(*param.data.shape)
+            @s[param.name] = Xumo::SFloat.maximum(@s[param.name], @v[param.name])
+            param.data -= clip_lr(lr / (Xumo::NMath.sqrt(@s[param.name]) + @eps), lower_bound, upper_bound) * @m[param.name]
           else
-            param.data -= clip_lr(lr / (Xumo::NMath.sqrt(@v[param]) + @eps), lower_bound, upper_bound) * @m[param]
+            param.data -= clip_lr(lr / (Xumo::NMath.sqrt(@v[param.name]) + @eps), lower_bound, upper_bound) * @m[param.name]
           end
         end
       end

data/lib/dnn/core/param.rb CHANGED Viewed

@@ -1,11 +1,13 @@
 module DNN
   class Param
+    attr_accessor :name
     attr_accessor :data
     attr_accessor :grad
     def initialize(data = nil, grad = nil)
       @data = data
       @grad = grad
+      @name = nil
     end
   end
 end

data/lib/dnn/core/savers.rb ADDED Viewed

@@ -0,0 +1,138 @@
+require "zlib"
+require "json"
+require "base64"
+module DNN
+  module Loaders
+    class Loader
+      def initialize(model)
+        @model = model
+      end
+      def load(file_name)
+        load_bin(File.binread(file_name))
+      end
+      private
+      def load_bin(bin)
+        raise NotImplementedError.new("Class '#{self.class.name}' has implement method 'load_bin'")
+      end
+      def set_all_params_data(params_data)
+        all_params = @model.has_param_layers.uniq.map { |layer|
+          layer.get_params.values
+        }.flatten
+        all_params.each do |param|
+          param.data = params_data[param.name]
+        end
+      end
+    end
+    class MarshalLoader < Loader
+      private def load_bin(bin)
+        data = Marshal.load(Zlib::Inflate.inflate(bin))
+        opt = Optimizers::Optimizer.load(data[:optimizer])
+        loss_func = Utils.hash_to_obj(data[:loss_func])
+        @model.setup(opt, loss_func)
+        @model.predict1(Xumo::SFloat.zeros(*data[:input_shape]))
+        set_all_params_data(data[:params])
+      end
+    end
+    class JSONLoader < Loader
+      private
+      def load_bin(bin)
+        data = JSON.parse(bin, symbolize_names: true)
+        opt = Utils.hash_to_obj(data[:optimizer])
+        loss_func = Utils.hash_to_obj(data[:loss_func])
+        @model.setup(opt, loss_func)
+        @model.predict1(Xumo::SFloat.zeros(*data[:input_shape]))
+        base64_to_params_data(data[:params])
+      end
+      def base64_to_params_data(base64_params_data)
+        params_data = base64_params_data.map { |key, (shape, base64_data)|
+          bin = Base64.decode64(base64_data)
+          [key, Xumo::SFloat.from_binary(bin).reshape(*shape)]
+        }.to_h
+        set_all_params_data(params_data)
+      end
+    end
+  end
+  module Savers
+    class Saver
+      def initialize(model)
+        @model = model
+      end
+      def save(file_name)
+        bin = dump_bin
+        begin
+          File.binwrite(file_name, bin)
+        rescue Errno::ENOENT
+          dir_name = file_name.match(%r`(.*)/.+$`)[1]
+          Dir.mkdir(dir_name)
+          File.binwrite(file_name, bin)
+        end
+      end
+      private
+      def dump_bin
+        raise NotImplementedError.new("Class '#{self.class.name}' has implement method 'dump_bin'")
+      end
+      def get_all_params_data
+        all_params = @model.has_param_layers.uniq.map { |layer|
+          layer.get_params.values
+        }.flatten
+        all_params.map { |param| [param.name, param.data] }.to_h
+      end
+    end
+    class MarshalSaver < Saver
+      def initialize(model, include_optimizer: true)
+        super(model)
+        @include_optimizer = include_optimizer
+      end
+      private def dump_bin
+        opt = @include_optimizer ? @model.optimizer.dump : @model.optimizer.class.new.dump
+        data = {
+          version: VERSION, class: @model.class.name, input_shape: @model.layers.first.input_shape, params: get_all_params_data,
+          optimizer: opt, loss_func: @model.loss_func.to_hash
+        }
+        Zlib::Deflate.deflate(Marshal.dump(data))
+      end
+    end
+    class JSONSaver < Saver
+      private
+      def dump_bin
+        data = {
+          version: VERSION, class: @model.class.name, input_shape: @model.layers.first.input_shape, params: params_data_to_base64,
+          optimizer: @model.optimizer.to_hash, loss_func: @model.loss_func.to_hash
+        }
+        JSON.dump(data)
+      end
+      def params_data_to_base64
+        get_all_params_data.map { |key, data|
+          base64_data = Base64.encode64(data.to_binary)
+          [key, [data.shape, base64_data]]
+        }.to_h
+      end
+    end
+  end
+end

data/lib/dnn/{cifar10.rb → datasets/cifar10.rb} RENAMED Viewed

@@ -1,6 +1,6 @@
 require "zlib"
 require "archive/tar/minitar"
-require_relative "../../ext/cifar_loader/cifar_loader"
+require_relative "../../../ext/cifar_loader/cifar_loader"
 require_relative "downloader"
 URL_CIFAR10 = "https://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz"

data/lib/dnn/{cifar100.rb → datasets/cifar100.rb} RENAMED Viewed

@@ -1,6 +1,6 @@
 require "zlib"
 require "archive/tar/minitar"
-require_relative "../../ext/cifar_loader/cifar_loader"
+require_relative "../../../ext/cifar_loader/cifar_loader"
 require_relative "downloader"
 URL_CIFAR100 = "https://www.cs.toronto.edu/~kriz/cifar-100-binary.tar.gz"

data/lib/dnn/{downloader.rb → datasets/downloader.rb} RENAMED Viewed

File without changes

data/lib/dnn/{fashion-mnist.rb → datasets/fashion-mnist.rb} RENAMED Viewed

@@ -1,5 +1,5 @@
 require "zlib"
-require_relative "core/error"
+require_relative "../core/error"
 require_relative "downloader"
 require_relative "mnist"

data/lib/dnn/{iris.rb → datasets/iris.rb} RENAMED Viewed

File without changes

data/lib/dnn/{mnist.rb → datasets/mnist.rb} RENAMED Viewed

@@ -1,5 +1,5 @@
 require "zlib"
-require_relative "core/error"
+require_relative "../core/error"
 require_relative "downloader"
 module DNN

data/lib/dnn/version.rb CHANGED Viewed

@@ -1,3 +1,3 @@
 module DNN
-  VERSION = "0.12.4"
+  VERSION = "0.13.0"
 end

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: ruby-dnn
 version: !ruby/object:Gem::Version
-  version: 0.12.4
+  version: 0.13.0
 platform: ruby
 authors:
 - unagiootoro
 autorequire:
 bindir: exe
 cert_chain: []
-date: 2019-09-08 00:00:00.000000000 Z
+date: 2019-09-15 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: numo-narray
@@ -114,12 +114,11 @@ files:
 - ext/rb_stb_image/extconf.rb
 - ext/rb_stb_image/rb_stb_image.c
 - lib/dnn.rb
-- lib/dnn/cifar10.rb
-- lib/dnn/cifar100.rb
 - lib/dnn/core/activations.rb
 - lib/dnn/core/cnn_layers.rb
 - lib/dnn/core/embedding.rb
 - lib/dnn/core/error.rb
+- lib/dnn/core/global.rb
 - lib/dnn/core/initializers.rb
 - lib/dnn/core/iterator.rb
 - lib/dnn/core/layers.rb
@@ -132,12 +131,15 @@ files:
 - lib/dnn/core/param.rb
 - lib/dnn/core/regularizers.rb
 - lib/dnn/core/rnn_layers.rb
+- lib/dnn/core/savers.rb
 - lib/dnn/core/utils.rb
-- lib/dnn/downloader.rb
-- lib/dnn/fashion-mnist.rb
+- lib/dnn/datasets/cifar10.rb
+- lib/dnn/datasets/cifar100.rb
+- lib/dnn/datasets/downloader.rb
+- lib/dnn/datasets/fashion-mnist.rb
+- lib/dnn/datasets/iris.rb
+- lib/dnn/datasets/mnist.rb
 - lib/dnn/image.rb
-- lib/dnn/iris.rb
-- lib/dnn/mnist.rb
 - lib/dnn/version.rb
 - ruby-dnn.gemspec
 - third_party/stb_image.h