RubyGems - transformers-rb - Versions diffs - 0.1.2 → 0.1.3 - Mend

transformers-rb 0.1.2 → 0.1.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (23) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +7 -0
data/README.md +61 -3
data/lib/transformers/configuration_utils.rb +32 -4
data/lib/transformers/modeling_utils.rb +10 -3
data/lib/transformers/models/auto/auto_factory.rb +1 -1
data/lib/transformers/models/auto/configuration_auto.rb +5 -2
data/lib/transformers/models/auto/modeling_auto.rb +9 -3
data/lib/transformers/models/auto/tokenization_auto.rb +5 -2
data/lib/transformers/models/deberta_v2/configuration_deberta_v2.rb +80 -0
data/lib/transformers/models/deberta_v2/modeling_deberta_v2.rb +1210 -0
data/lib/transformers/models/deberta_v2/tokenization_deberta_v2_fast.rb +78 -0
data/lib/transformers/models/mpnet/configuration_mpnet.rb +61 -0
data/lib/transformers/models/mpnet/modeling_mpnet.rb +792 -0
data/lib/transformers/models/mpnet/tokenization_mpnet_fast.rb +106 -0
data/lib/transformers/models/xlm_roberta/configuration_xlm_roberta.rb +68 -0
data/lib/transformers/models/xlm_roberta/modeling_xlm_roberta.rb +1216 -0
data/lib/transformers/models/xlm_roberta/tokenization_xlm_roberta_fast.rb +68 -0
data/lib/transformers/pipelines/_init.rb +10 -0
data/lib/transformers/pipelines/reranking.rb +33 -0
data/lib/transformers/version.rb +1 -1
data/lib/transformers.rb +16 -0
metadata +14 -4

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 3f29055705824ba101cba238960d4f10825c75bc7867b9eb0b611cda6a547612
-  data.tar.gz: d0967f7742f7b2d6194376eb040a3be81e77a9ded94302aeb934de678959e434
+  metadata.gz: 3f070b9828c5c5ad71c75f46ca9daf1387a5ec3848cb406aac9e5f1bbc1d4531
+  data.tar.gz: 31b28a5a87c58db6fc3146e390e8a4a7bf1ffc34ede6d3cd6fcd7f3aa3df2d28
 SHA512:
-  metadata.gz: 38b9ed4fd654ca593e3d6e7c7f20eb3c6b68ecfa5f86099fbc8d160f9093617cc79a571c331a0ec0c70a6770c8d9460194ba75e61d534f9e15931f22e5ae60c3
-  data.tar.gz: 00ce437ce8fe419fafddd59b7f9f61050d2ddf5817816b53beb1c43badbced9fe77ea28b26f2d607e87a9be855a19c4b254bc50df2881b4126f2def5c6875c3d
+  metadata.gz: aa2055e44b9071a425ebfb59d6b2edbedce1f3cf97e0baa55d1280451c1c1db097a52b0b9615a188b1d96f0854e557fb4cb769b05cb3af4db229cd3fcdf8fb95
+  data.tar.gz: 1af002f238e9189a2e2a6b5f1aafc9201cfd5bc5f8afe4a80b81757b5d9f5d4fa52bc61a57b4fdd6920bd3692f704398aa58c7cc4fd797bd881ab9887c9c77f9

data/CHANGELOG.md CHANGED Viewed

@@ -1,3 +1,10 @@
+## 0.1.3 (2024-09-17)
+- Added `reranking` pipeline
+- Added DeBERTa-v2
+- Added MPNet
+- Added XLM-RoBERTa
 ## 0.1.2 (2024-09-10)
 - Fixed default revision for pipelines

data/README.md CHANGED Viewed

@@ -32,11 +32,17 @@ Embedding
 - [intfloat/e5-base-v2](#intfloate5-base-v2)
 - [BAAI/bge-base-en-v1.5](#baaibge-base-en-v15)
 - [Snowflake/snowflake-arctic-embed-m-v1.5](#snowflakesnowflake-arctic-embed-m-v15)
+- [sentence-transformers/all-mpnet-base-v2](#sentence-transformersall-mpnet-base-v2)
 Sparse embedding
 - [opensearch-project/opensearch-neural-sparse-encoding-v1](#opensearch-projectopensearch-neural-sparse-encoding-v1)
+Reranking
+- [mixedbread-ai/mxbai-rerank-base-v1](#mixedbread-aimxbai-rerank-base-v1)
+- [BAAI/bge-reranker-base](#baaibge-reranker-base)
 ### sentence-transformers/all-MiniLM-L6-v2
 [Docs](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2)
@@ -142,6 +148,17 @@ model = Transformers.pipeline("embedding", "Snowflake/snowflake-arctic-embed-m-v
 embeddings = model.(input, pooling: "cls")
 ```
+### sentence-transformers/all-mpnet-base-v2
+[Docs](https://huggingface.co/sentence-transformers/all-mpnet-base-v2)
+```ruby
+sentences = ["This is an example sentence", "Each sentence is converted"]
+model = Transformers.pipeline("embedding", "sentence-transformers/all-mpnet-base-v2")
+embeddings = model.(sentences)
+```
 ### opensearch-project/opensearch-neural-sparse-encoding-v1
 [Docs](https://huggingface.co/opensearch-project/opensearch-neural-sparse-encoding-v1)
@@ -163,8 +180,37 @@ values[0.., special_token_ids] = 0
 embeddings = values.to_a
 ```
+### mixedbread-ai/mxbai-rerank-base-v1
+[Docs](https://huggingface.co/mixedbread-ai/mxbai-rerank-base-v1)
+```ruby
+query = "How many people live in London?"
+docs = ["Around 9 Million people live in London", "London is known for its financial district"]
+model = Transformers.pipeline("reranking", "mixedbread-ai/mxbai-rerank-base-v1")
+result = model.(query, docs)
+```
+### BAAI/bge-reranker-base
+[Docs](https://huggingface.co/BAAI/bge-reranker-base)
+```ruby
+query = "How many people live in London?"
+docs = ["Around 9 Million people live in London", "London is known for its financial district"]
+model = Transformers.pipeline("reranking", "BAAI/bge-reranker-base")
+result = model.(query, docs)
+```
 ## Pipelines
+- [Text](#text)
+- [Vision](#vision)
+### Text
 Embedding
 ```ruby
@@ -172,6 +218,13 @@ embed = Transformers.pipeline("embedding")
 embed.("We are very happy to show you the 🤗 Transformers library.")
 ```
+Reranking
+```ruby
+rerank = Informers.pipeline("reranking")
+rerank.("Who created Ruby?", ["Matz created Ruby", "Another doc"])
+```
 Named-entity recognition
 ```ruby
@@ -200,27 +253,32 @@ extractor = Transformers.pipeline("feature-extraction")
 extractor.("We are very happy to show you the 🤗 Transformers library.")
 ```
+### Vision
 Image classification
 ```ruby
 classifier = Transformers.pipeline("image-classification")
-classifier.(URI("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"))
+classifier.("image.jpg")
 ```
 Image feature extraction
 ```ruby
 extractor = Transformers.pipeline("image-feature-extraction")
-extractor.(URI("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"))
+extractor.("image.jpg")
 ```
 ## API
-This library follows the [Transformers Python API](https://huggingface.co/docs/transformers/index). Only a few model architectures are currently supported:
+This library follows the [Transformers Python API](https://huggingface.co/docs/transformers/index). The following model architectures are currently supported:
 - BERT
+- DeBERTa-v2
 - DistilBERT
+- MPNet
 - ViT
+- XLM-RoBERTa
 ## History

data/lib/transformers/configuration_utils.rb CHANGED Viewed

@@ -91,10 +91,24 @@ module Transformers
       # Config hash
       @commit_hash = kwargs.delete(:_commit_hash)
-      # TODO set kwargs
-      @gradient_checkpointing = kwargs[:gradient_checkpointing]
-      @output_past = kwargs[:output_past]
-      @tie_weights_ = kwargs[:tie_weights_]
+      # Attention implementation to use, if relevant.
+      @attn_implementation_internal = kwargs.delete(:attn_implementation)
+      # Drop the transformers version info
+      @transformers_version = kwargs.delete(:transformers_version)
+      # Deal with gradient checkpointing
+      # if kwargs[:gradient_checkpointing] == false
+      #   warn(
+      #     "Passing `gradient_checkpointing` to a config initialization is deprecated and will be removed in v5 " +
+      #     "Transformers. Using `model.gradient_checkpointing_enable()` instead, or if you are using the " +
+      #     "`Trainer` API, pass `gradient_checkpointing: true` in your `TrainingArguments`."
+      #   )
+      # end
+      kwargs.each do |k, v|
+        instance_variable_set("@#{k}", v)
+      end
     end
     def name_or_path
@@ -182,6 +196,20 @@ module Transformers
       JSON.pretty_generate(config_dict.sort_by { |k, _| k }.to_h) + "\n"
     end
+    def getattr(key, default)
+      if respond_to?(key)
+        public_send(key)
+      elsif instance_variable_defined?("@#{key}")
+        instance_variable_get("@#{key}")
+      else
+        default
+      end
+    end
+    def hasattr(key)
+      respond_to?(key) || instance_variable_defined?("@#{key}")
+    end
     class << self
       def from_pretrained(
         pretrained_model_name_or_path,

data/lib/transformers/modeling_utils.rb CHANGED Viewed

@@ -207,7 +207,7 @@ module Transformers
     def init_weights
       # Prune heads if needed
-      if @config.pruned_heads
+      if @config.pruned_heads.any?
         prune_heads(@config.pruned_heads)
       end
@@ -803,11 +803,18 @@ module Transformers
           raise Todo
         end
+        model_class_name = model.class.name.split("::").last
         if error_msgs.length > 0
-          raise Todo
+          error_msg = error_msgs.join("\n\t")
+          if error_msg.include?("size mismatch")
+            error_msg += (
+              "\n\tYou may consider adding `ignore_mismatched_sizes: true` in the model `from_pretrained` method."
+            )
+          end
+          raise RuntimeError, "Error(s) in loading state_dict for #{model_class_name}:\n\t#{error_msg}"
         end
-        model_class_name = model.class.name.split("::").last
         if unexpected_keys.length > 0
           archs = model.config.architectures.nil? ? [] : model.config.architectures
           warner = archs.include?(model_class_name) ? Transformers.logger.method(:warn) : Transformers.logger.method(:info)

data/lib/transformers/models/auto/auto_factory.rb CHANGED Viewed

@@ -116,7 +116,7 @@ module Transformers
     def _load_attr_from_module(model_type, attr)
       module_name = model_type_to_module_name(model_type)
       if !@modules.include?(module_name)
-        @modules[module_name] = Transformers.const_get(module_name.capitalize)
+        @modules[module_name] = Transformers.const_get(module_name.split("-").map(&:capitalize).join)
       end
       getattribute_from_module(@modules[module_name], attr)
     end

data/lib/transformers/models/auto/configuration_auto.rb CHANGED Viewed

@@ -15,8 +15,11 @@
 module Transformers
   CONFIG_MAPPING_NAMES = {
     "bert" => "BertConfig",
+    "deberta-v2" => "DebertaV2Config",
     "distilbert" => "DistilBertConfig",
-    "vit" => "ViTConfig"
+    "mpnet" => "MPNetConfig",
+    "vit" => "ViTConfig",
+    "xlm-roberta" => "XLMRobertaConfig"
   }
   class LazyConfigMapping
@@ -30,7 +33,7 @@ module Transformers
       value = @mapping.fetch(key)
       module_name = model_type_to_module_name(key)
       if !@modules.include?(module_name)
-        @modules[module_name] = Transformers.const_get(module_name.capitalize)
+        @modules[module_name] = Transformers.const_get(module_name.split("-").map(&:capitalize).join)
       end
       @modules[module_name].const_get(value)
     end

data/lib/transformers/models/auto/modeling_auto.rb CHANGED Viewed

@@ -15,16 +15,22 @@
 module Transformers
   MODEL_MAPPING_NAMES = {
     "bert" => "BertModel",
+    "deberta-v2" => "DebertaV2Model",
     "distilbert" => "DistilBertModel",
-    "vit" => "ViTModel"
+    "mpnet" => "MPNetModel",
+    "vit" => "ViTModel",
+    "xlm-roberta" => "XLMRobertaModel"
   }
   MODEL_FOR_MASKED_LM_MAPPING_NAMES = {
-    "bert" => "BertForMaskedLM"
+    "bert" => "BertForMaskedLM",
+    "mpnet" => "MPNetForMaskedLM"
   }
   MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING_NAMES = {
-    "distilbert" => "DistilBertForSequenceClassification"
+    "deberta-v2" => "DebertaV2ForSequenceClassification",
+    "distilbert" => "DistilBertForSequenceClassification",
+    "xlm-roberta" => "XLMRobertaForSequenceClassification"
   }
   MODEL_FOR_QUESTION_ANSWERING_MAPPING_NAMES = {

data/lib/transformers/models/auto/tokenization_auto.rb CHANGED Viewed

@@ -15,7 +15,10 @@
 module Transformers
   TOKENIZER_MAPPING_NAMES = {
     "bert" => ["BertTokenizer", "BertTokenizerFast"],
-    "distilbert" => ["DistilBertTokenizer", "DistilBertTokenizerFast"]
+    "deberta-v2" => ["DebertaV2TokenizerFast"],
+    "distilbert" => ["DistilBertTokenizer", "DistilBertTokenizerFast"],
+    "mpnet" => ["MPNetTokenizerFast"],
+    "xlm-roberta" => ["XLMRobertaTokenizerFast"]
   }
   TOKENIZER_MAPPING = LazyAutoMapping.new(CONFIG_MAPPING_NAMES, TOKENIZER_MAPPING_NAMES)
@@ -98,7 +101,7 @@ module Transformers
         TOKENIZER_MAPPING_NAMES.each do |module_name, tokenizers|
           if tokenizers.include?(class_name)
-            cls = Transformers.const_get(module_name.capitalize).const_get(class_name)
+            cls = Transformers.const_get(module_name.split("-").map(&:capitalize).join).const_get(class_name)
             raise Error, "Invalid tokenizer class: #{class_name}" unless cls < PreTrainedTokenizer || cls < PreTrainedTokenizerFast
             return cls
           end

data/lib/transformers/models/deberta_v2/configuration_deberta_v2.rb ADDED Viewed

@@ -0,0 +1,80 @@
+# Copyright 2020, Microsoft and the HuggingFace Inc. team.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+module Transformers
+  module DebertaV2
+    class DebertaV2Config < PretrainedConfig
+      self.model_type = "deberta-v2"
+      attr_reader :vocab_size, :hidden_size, :num_hidden_layers, :num_attention_heads,
+        :intermediate_size, :hidden_act, :hidden_dropout_prob, :attention_probs_dropout_prob,
+        :max_position_embeddings, :type_vocab_size, :initializer_range, :layer_norm_eps,
+        :relative_attention, :max_relative_positions, :pad_token_id, :position_biased_input,
+        :pos_att_type, :pooler_dropout, :pooler_hidden_act, :pooler_hidden_size
+      def initialize(
+        vocab_size: 128100,
+        hidden_size: 1536,
+        num_hidden_layers: 24,
+        num_attention_heads: 24,
+        intermediate_size: 6144,
+        hidden_act: "gelu",
+        hidden_dropout_prob: 0.1,
+        attention_probs_dropout_prob: 0.1,
+        max_position_embeddings: 512,
+        type_vocab_size: 0,
+        initializer_range: 0.02,
+        layer_norm_eps: 1e-07,
+        relative_attention: false,
+        max_relative_positions: -1,
+        pad_token_id: 0,
+        position_biased_input: true,
+        pos_att_type: nil,
+        pooler_dropout: 0,
+        pooler_hidden_act: "gelu",
+        **kwargs
+      )
+        super(**kwargs)
+        @hidden_size = hidden_size
+        @num_hidden_layers = num_hidden_layers
+        @num_attention_heads = num_attention_heads
+        @intermediate_size = intermediate_size
+        @hidden_act = hidden_act
+        @hidden_dropout_prob = hidden_dropout_prob
+        @attention_probs_dropout_prob = attention_probs_dropout_prob
+        @max_position_embeddings = max_position_embeddings
+        @type_vocab_size = type_vocab_size
+        @initializer_range = initializer_range
+        @relative_attention = relative_attention
+        @max_relative_positions = max_relative_positions
+        @pad_token_id = pad_token_id
+        @position_biased_input = position_biased_input
+        # Backwards compatibility
+        if pos_att_type.is_a?(String)
+          pos_att_type = pos_att_type.downcase.split("|").map { |x| x.strip }
+        end
+        @pos_att_type = pos_att_type
+        @vocab_size = vocab_size
+        @layer_norm_eps = layer_norm_eps
+        @pooler_hidden_size = kwargs[:pooler_hidden_size] || hidden_size
+        @pooler_dropout = pooler_dropout
+        @pooler_hidden_act = pooler_hidden_act
+      end
+    end
+  end
+end