RubyGems - transformers-rb - Versions diffs - 0.1.0 - Mend

transformers-rb 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (65) hide show

checksums.yaml +7 -0
data/CHANGELOG.md +3 -0
data/LICENSE.txt +203 -0
data/README.md +163 -0
data/lib/transformers/activations.rb +57 -0
data/lib/transformers/configuration_utils.rb +285 -0
data/lib/transformers/convert_slow_tokenizer.rb +90 -0
data/lib/transformers/data/processors/squad.rb +115 -0
data/lib/transformers/dynamic_module_utils.rb +25 -0
data/lib/transformers/feature_extraction_utils.rb +110 -0
data/lib/transformers/hf_hub/constants.rb +71 -0
data/lib/transformers/hf_hub/errors.rb +11 -0
data/lib/transformers/hf_hub/file_download.rb +764 -0
data/lib/transformers/hf_hub/utils/_errors.rb +94 -0
data/lib/transformers/hf_hub/utils/_headers.rb +109 -0
data/lib/transformers/image_processing_base.rb +169 -0
data/lib/transformers/image_processing_utils.rb +63 -0
data/lib/transformers/image_transforms.rb +208 -0
data/lib/transformers/image_utils.rb +165 -0
data/lib/transformers/modeling_outputs.rb +81 -0
data/lib/transformers/modeling_utils.rb +888 -0
data/lib/transformers/models/auto/auto_factory.rb +138 -0
data/lib/transformers/models/auto/configuration_auto.rb +61 -0
data/lib/transformers/models/auto/feature_extraction_auto.rb +20 -0
data/lib/transformers/models/auto/image_processing_auto.rb +104 -0
data/lib/transformers/models/auto/modeling_auto.rb +80 -0
data/lib/transformers/models/auto/tokenization_auto.rb +160 -0
data/lib/transformers/models/bert/configuration_bert.rb +65 -0
data/lib/transformers/models/bert/modeling_bert.rb +836 -0
data/lib/transformers/models/bert/tokenization_bert.rb +115 -0
data/lib/transformers/models/bert/tokenization_bert_fast.rb +52 -0
data/lib/transformers/models/distilbert/configuration_distilbert.rb +63 -0
data/lib/transformers/models/distilbert/modeling_distilbert.rb +616 -0
data/lib/transformers/models/distilbert/tokenization_distilbert.rb +114 -0
data/lib/transformers/models/distilbert/tokenization_distilbert_fast.rb +71 -0
data/lib/transformers/models/vit/configuration_vit.rb +60 -0
data/lib/transformers/models/vit/image_processing_vit.rb +170 -0
data/lib/transformers/models/vit/modeling_vit.rb +506 -0
data/lib/transformers/pipelines/_init.rb +348 -0
data/lib/transformers/pipelines/base.rb +301 -0
data/lib/transformers/pipelines/feature_extraction.rb +47 -0
data/lib/transformers/pipelines/image_classification.rb +110 -0
data/lib/transformers/pipelines/image_feature_extraction.rb +56 -0
data/lib/transformers/pipelines/pt_utils.rb +53 -0
data/lib/transformers/pipelines/question_answering.rb +508 -0
data/lib/transformers/pipelines/text_classification.rb +123 -0
data/lib/transformers/pipelines/token_classification.rb +282 -0
data/lib/transformers/ruby_utils.rb +33 -0
data/lib/transformers/sentence_transformer.rb +37 -0
data/lib/transformers/tokenization_utils.rb +152 -0
data/lib/transformers/tokenization_utils_base.rb +937 -0
data/lib/transformers/tokenization_utils_fast.rb +386 -0
data/lib/transformers/torch_utils.rb +25 -0
data/lib/transformers/utils/_init.rb +31 -0
data/lib/transformers/utils/generic.rb +107 -0
data/lib/transformers/utils/hub.rb +209 -0
data/lib/transformers/utils/import_utils.rb +45 -0
data/lib/transformers/utils/logging.rb +52 -0
data/lib/transformers/version.rb +3 -0
data/lib/transformers-rb.rb +1 -0
data/lib/transformers.rb +100 -0
data/licenses/LICENSE-huggingface-hub.txt +201 -0
data/licenses/LICENSE-sentence-transformers.txt +201 -0
data/licenses/NOTICE-sentence-transformers.txt +5 -0
metadata +161 -0

data/lib/transformers/pipelines/image_classification.rb ADDED Viewed

@@ -0,0 +1,110 @@
+module Transformers
+  class ClassificationFunction < ExplicitEnum
+    SIGMOID = "sigmoid"
+    SOFTMAX = "softmax"
+    NONE = "none"
+  end
+  class ImageClassificationPipeline < Pipeline
+    extend ClassAttribute
+    class_attribute :function_to_apply, ClassificationFunction::NONE
+    def initialize(*args, **kwargs)
+      super(*args, **kwargs)
+      Utils.requires_backends(self, "vision")
+      check_model_type(MODEL_FOR_IMAGE_CLASSIFICATION_MAPPING_NAMES)
+    end
+    def _sanitize_parameters(top_k: nil, function_to_apply: nil, timeout: nil)
+      preprocess_params = {}
+      if !timeout.nil?
+        preprocess_params[:timeout] = timeout
+      end
+      postprocess_params = {}
+      if !top_k.nil?
+        postprocess_params[:top_k] = top_k
+      end
+      if function_to_apply.is_a?(String)
+        function_to_apply = ClassificationFunction.new(function_to_apply.downcase).to_s
+      end
+      if !function_to_apply.nil?
+        postprocess_params[:function_to_apply] = function_to_apply
+      end
+      [preprocess_params, {}, postprocess_params]
+    end
+    def preprocess(image, timeout: nil)
+      image = ImageUtils.load_image(image, timeout: timeout)
+      model_inputs = @image_processor.(image, return_tensors: @framework)
+      if @framework == "pt"
+        # TODO
+        # model_inputs = model_inputs.to(torch_dtype)
+      end
+      model_inputs
+    end
+    def _forward(model_inputs)
+      model_outputs = @model.(**model_inputs.to_h)
+      model_outputs
+    end
+    def postprocess(model_outputs, function_to_apply: nil, top_k: 5)
+      if function_to_apply.nil?
+        if @model.config.problem_type == "multi_label_classification" || @model.config.num_labels == 1
+          function_to_apply = ClassificationFunction::SIGMOID
+        elsif @model.config.problem_type == "single_label_classification" || @model.config.num_labels > 1
+          function_to_apply = ClassificationFunction::SOFTMAX
+        elsif @model.config.instance_variable_defined?(:@function_to_apply) && function_to_apply.nil?
+          function_to_apply = @model.config.function_to_apply
+        else
+          function_to_apply = ClassificationFunction::NONE
+        end
+      end
+      if top_k > @model.config.num_labels
+        top_k = @model.config.num_labels
+      end
+      outputs = model_outputs[:logits][0]
+      if @framework == "pt" && [Torch.bfloat16, Torch.float16].include?(outputs.dtype)
+        outputs = outputs.to(Torch.float32).numo
+      else
+        outputs = outputs.numo
+      end
+      if function_to_apply == ClassificationFunction::SIGMOID
+        scores = sigmoid(outputs)
+      elsif function_to_apply == ClassificationFunction::SOFTMAX
+        scores = softmax(outputs)
+      elsif function_to_apply == ClassificationFunction::NONE
+        scores = outputs
+      else
+        raise ArgumentError, "Unrecognized `function_to_apply` argument: #{function_to_apply}"
+      end
+      dict_scores =
+        scores.to_a.map.with_index do |score, i|
+          {label: @model.config.id2label[i], score: score}
+        end
+      dict_scores.sort_by! { |x| -x[:score] }
+      if !top_k.nil?
+        dict_scores = dict_scores[...top_k]
+      end
+      dict_scores
+    end
+    private
+    def sigmoid(_outputs)
+      1.0 / (1.0 + Numo::NMath.exp(-_outputs))
+    end
+    def softmax(_outputs)
+      maxes = _outputs.max(axis: -1, keepdims: true)
+      shifted_exp = Numo::NMath.exp(_outputs - maxes)
+      shifted_exp / shifted_exp.sum(axis: -1, keepdims: true)
+    end
+  end
+end

data/lib/transformers/pipelines/image_feature_extraction.rb ADDED Viewed

@@ -0,0 +1,56 @@
+module Transformers
+  class ImageFeatureExtractionPipeline < Pipeline
+    def _sanitize_parameters(image_processor_kwargs: nil, return_tensors: nil, pool: nil, **kwargs)
+      preprocess_params = image_processor_kwargs.nil? ? {} : image_processor_kwargs
+      postprocess_params = {}
+      if !pool.nil?
+        postprocess_params[:pool] = pool
+      end
+      if !return_tensors.nil?
+        postprocess_params[:return_tensors] = return_tensors
+      end
+      if kwargs.include?(:timeout)
+        preprocess_params[:timeout] = kwargs[:timeout]
+      end
+      [preprocess_params, {}, postprocess_params]
+    end
+    def preprocess(image, timeout: nil, **image_processor_kwargs)
+      image = ImageUtils.load_image(image, timeout: timeout)
+      model_inputs = @image_processor.(image, return_tensors: @framework, **image_processor_kwargs)
+      if @framework == "pt"
+        # TODO
+        # model_inputs = model_inputs.to(torch_dtype)
+      end
+      model_inputs
+    end
+    def _forward(model_inputs)
+      model_outputs = @model.(**model_inputs.to_h)
+      model_outputs
+    end
+    def postprocess(model_outputs, pool: nil, return_tensors: false)
+      pool = !pool.nil? ? pool : false
+      if pool
+        raise Todo
+      else
+        # [0] is the first available tensor, logits or last_hidden_state.
+        outputs = model_outputs[0]
+      end
+      if return_tensors
+        return outputs
+      end
+      if @framework == "pt"
+        outputs.to_a
+      else
+        raise Todo
+      end
+    end
+  end
+end

data/lib/transformers/pipelines/pt_utils.rb ADDED Viewed

@@ -0,0 +1,53 @@
+module Transformers
+  class PipelineDataset < Torch::Utils::Data::Dataset
+    def initialize(dataset, process, params)
+      @dataset = dataset
+      @process = process
+      @params = params
+    end
+    def size
+      @dataset.size
+    end
+    def [](i)
+      item = @dataset[i]
+      processed = @process.(item, **@params)
+      processed
+    end
+  end
+  class PipelineIterator < Torch::Utils::Data::IterableDataset
+    def initialize(loader, infer, params, loader_batch_size: nil)
+      @loader = loader
+      @infer = infer
+      @params = params
+      if loader_batch_size == 1
+        # Let's spare some time by deactivating altogether
+        loader_batch_size = nil
+      end
+      @loader_batch_size = loader_batch_size
+      # Internal bookkeeping
+      @loader_batch_index = nil
+      @loader_batch_data = nil
+    end
+    def size
+      @loader.size
+    end
+    def [](i)
+      @infer.(@loader[i], **@params)
+    end
+    def each
+      @iterator = @loader
+      @iterator.each do |item|
+        processed = @infer.(item, **@params)
+        yield processed
+      end
+    end
+  end
+end