PyPI - ai-edge-torch-nightly - Versions diffs - 0.3.0.dev20240925__py3-none-any.whl → 0.3.0.dev20240927__py3-none-any.whl - Mend

ai-edge-torch-nightly 0.3.0.dev20240925py3-none-any.whl → 0.3.0.dev20240927py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (25) hide show

ai_edge_torch/generative/examples/openelm/verify.py CHANGED Viewed

@@ -15,28 +15,33 @@
 """Verifies the reauthored OpenELM-3B model."""
+import logging
 import pathlib
 from absl import app
 from absl import flags
 from ai_edge_torch.generative.examples.openelm import openelm
+from ai_edge_torch.generative.utilities import transformers_verifier
 from ai_edge_torch.generative.utilities import verifier
 import transformers
 _PROMPTS = flags.DEFINE_multi_string(
     "prompts",
     "What is the meaning of life?",
     "The input prompts to generate answers.",
 )
+_MAX_NEW_TOKENS = flags.DEFINE_integer(
+    "max_new_tokens",
+    30,
+    "The maximum size of the generated tokens.",
+)
 def main(_):
   checkpoint = "apple/OpenELM-3B"
-  verifier.log_msg("Loading the original model from", checkpoint)
-  wrapper_model = verifier.ModelWrapper(
-      model=transformers.AutoModelForCausalLM.from_pretrained(
-          checkpoint, trust_remote_code=True
-      ),
+  logging.info("Loading the original model from: %s", checkpoint)
+  original_model = transformers.AutoModelForCausalLM.from_pretrained(
+      checkpoint, trust_remote_code=True
   )
   # Locate the cached dir.
@@ -44,18 +49,21 @@ def main(_):
       checkpoint, transformers.utils.CONFIG_NAME
   )
   reauthored_checkpoint = pathlib.Path(cached_config_file).parent
-  verifier.log_msg("Building the reauthored model from", reauthored_checkpoint)
+  logging.info("Building the reauthored model from: %s", reauthored_checkpoint)
   reauthored_model = openelm.build_model(reauthored_checkpoint)
   tokenizer_checkpoint = "meta-llama/Llama-2-7b-hf"
-  verifier.log_msg("Loading the tokenizer from", tokenizer_checkpoint)
+  logging.info("Loading the tokenizer from: %s", tokenizer_checkpoint)
   tokenizer = transformers.AutoTokenizer.from_pretrained(tokenizer_checkpoint)
   verifier.verify_reauthored_model(
-      original_model=wrapper_model,
-      reauthored_model=reauthored_model,
-      tokenizer=tokenizer,
+      original_model=transformers_verifier.TransformersModelWrapper(
+          original_model
+      ),
+      reauthored_model=verifier.ReauthoredModelWrapper(reauthored_model),
+      tokenizer=verifier.TokenizerWrapper(tokenizer),
       generate_prompts=_PROMPTS.value,
+      max_new_tokens=_MAX_NEW_TOKENS.value,
   )

ai_edge_torch/generative/examples/phi/phi3.py CHANGED Viewed

@@ -97,15 +97,15 @@ ROPE_SHORT_FACTOR = [
 ]
-def build_rope_cache(
+def _build_rope_cache(
     size: int,
     dim: int,
-    base: int = 10000,
-    condense_ratio: int = 1,
-    dtype: torch.dtype = torch.float32,
-    device: torch.device = None,
-    theta_factors: torch.Tensor = None,
-    scale: float = 1.0,
+    base: int,
+    condense_ratio: int,
+    dtype: torch.dtype,
+    device: torch.device,
+    theta_factors: torch.Tensor,
+    scale: float,
 ) -> Tuple[torch.Tensor, torch.Tensor]:
   """Precomputes Rotary Positional Embeddings for Phi-3.5 model.
@@ -116,26 +116,20 @@ def build_rope_cache(
   Args:
       size (int): The size of the built cache.
       dim (int): Each sequence's dimmension.
-      base (int, optional): Rope base value. Defaults to 10000.
+      base (int, optional): Rope base value.
       condense_ratio (int, optional): The ratio by which sequence indicies are
-        condensed. Defaults to 1.
-      dtype (torch.dtype, optional): Output tensor's data type. Defaults to
-        torch.float32.
-      device (torch.device, optional): Output tensor's data type. Defaults to
-        None in which case "cpu" is used.
+        condensed.
+      dtype (torch.dtype, optional): Output tensor's data type.
+      device (torch.device, optional): Output tensor's data type.
       theta_factors (torch.Tensor, optional): A tensor of shape (dim,) used to
-        scale the theta values. Defaults to None.
-      scale (float, optional): A float used to scale the rope values. Defaults
-        to 1.0.
+        scale the theta values.
+      scale (float, optional): A float used to scale the rope values.
   Returns:
       Tuple[torch.Tensor, torch.Tensor]: Rope's Cosine and Sine waves.
   """
-  if device is None:
-    device = torch.device('cpu')
   theta = 1.0 / (base ** (torch.arange(0, dim, 2).float() / dim))
-  if theta_factors is not None:
-    theta = theta / theta_factors
+  theta = theta / theta_factors
   seq_idx = torch.arange(size) / condense_ratio
   idx_theta = torch.outer(seq_idx, theta)
   cos = torch.cos(idx_theta).to(dtype=dtype, device=device) * scale
@@ -167,7 +161,7 @@ class Phi3_5Mini(nn.Module):
         config.final_norm_config,
     )
     attn_config = block_config.attn_config
-    self.rope_cache = build_rope_cache(
+    self.rope_cache = _build_rope_cache(
         size=config.kv_cache_max,
         dim=int(attn_config.rotary_percentage * attn_config.head_dim),
         base=10_000,

ai_edge_torch/generative/examples/phi/verify.py CHANGED Viewed

@@ -14,14 +14,17 @@
 # ==============================================================================
 """Verifies the reauthored Phi-2 model."""
+import logging
 from absl import app
 from absl import flags
 from ai_edge_torch.generative.examples.phi import phi2
+from ai_edge_torch.generative.utilities import transformers_verifier
 from ai_edge_torch.generative.utilities import verifier
 import kagglehub
 import transformers
 _PROMPTS = flags.DEFINE_multi_string(
     "prompts",
     "Instruct: Write an email about the weather Output:",
@@ -36,25 +39,23 @@ _MAX_NEW_TOKENS = flags.DEFINE_integer(
 def main(_):
   checkpoint = kagglehub.model_download("Microsoft/phi/transformers/2")
-  verifier.log_msg("Loading the original model from", checkpoint)
-  generation_config = transformers.GenerationConfig.from_pretrained(checkpoint)
-  generation_config.max_new_tokens = _MAX_NEW_TOKENS.value
-  wrapper_model = verifier.ModelWrapper(
-      model=transformers.AutoModelForCausalLM.from_pretrained(checkpoint),
-      hf_generation_config=generation_config,
-  )
+  logging.info("Loading the original model from: %s", checkpoint)
+  original_model = transformers.AutoModelForCausalLM.from_pretrained(checkpoint)
-  verifier.log_msg("Building the reauthored model from", checkpoint)
+  logging.info("Building the reauthored model from: %s", checkpoint)
   reauthored_model = phi2.build_model(checkpoint)
-  verifier.log_msg("Loading the tokenizer from", checkpoint)
+  logging.info("Loading the tokenizer from: %s", checkpoint)
   tokenizer = transformers.AutoTokenizer.from_pretrained(checkpoint)
   verifier.verify_reauthored_model(
-      original_model=wrapper_model,
-      reauthored_model=reauthored_model,
-      tokenizer=tokenizer,
+      original_model=transformers_verifier.TransformersModelWrapper(
+          original_model
+      ),
+      reauthored_model=verifier.ReauthoredModelWrapper(reauthored_model),
+      tokenizer=verifier.TokenizerWrapper(tokenizer),
       generate_prompts=_PROMPTS.value,
+      max_new_tokens=_MAX_NEW_TOKENS.value,
       atol=1e-03,
   )

ai_edge_torch/generative/examples/phi/verify_phi3.py CHANGED Viewed

@@ -15,14 +15,17 @@
 """Verifies the reauthored Phi-3.5 model."""
+import logging
 import pathlib
 from absl import app
 from absl import flags
 from ai_edge_torch.generative.examples.phi import phi3
+from ai_edge_torch.generative.utilities import transformers_verifier
 from ai_edge_torch.generative.utilities import verifier
 import transformers
 _PROMPTS = flags.DEFINE_multi_string(
     "prompts",
     "Instruct: Write an email about the weather Output:",
@@ -37,30 +40,28 @@ _MAX_NEW_TOKENS = flags.DEFINE_integer(
 def main(_):
   checkpoint = "microsoft/Phi-3.5-mini-instruct"
-  verifier.log_msg("Loading the original model from", checkpoint)
-  generation_config = transformers.GenerationConfig.from_pretrained(checkpoint)
-  generation_config.max_new_tokens = _MAX_NEW_TOKENS.value
-  wrapper_model = verifier.ModelWrapper(
-      model=transformers.AutoModelForCausalLM.from_pretrained(checkpoint),
-      hf_generation_config=generation_config,
-  )
+  logging.info("Loading the original model from: %s", checkpoint)
+  original_model = transformers.AutoModelForCausalLM.from_pretrained(checkpoint)
   # Locate the cached dir.
   cached_config_file = transformers.utils.cached_file(
       checkpoint, transformers.utils.CONFIG_NAME
   )
   reauthored_checkpoint = pathlib.Path(cached_config_file).parent
-  verifier.log_msg("Building the reauthored model from", reauthored_checkpoint)
+  logging.info("Building the reauthored model from: %s", reauthored_checkpoint)
   reauthored_model = phi3.build_model(reauthored_checkpoint)
-  verifier.log_msg("Loading the tokenizer from", checkpoint)
+  logging.info("Loading the tokenizer from: %s", checkpoint)
   tokenizer = transformers.AutoTokenizer.from_pretrained(checkpoint)
   verifier.verify_reauthored_model(
-      original_model=wrapper_model,
-      reauthored_model=reauthored_model,
-      tokenizer=tokenizer,
+      original_model=transformers_verifier.TransformersModelWrapper(
+          original_model
+      ),
+      reauthored_model=verifier.ReauthoredModelWrapper(reauthored_model),
+      tokenizer=verifier.TokenizerWrapper(tokenizer),
       generate_prompts=_PROMPTS.value,
+      max_new_tokens=_MAX_NEW_TOKENS.value,
   )

ai_edge_torch/generative/examples/smollm/verify.py CHANGED Viewed

@@ -15,43 +15,53 @@
 """Verifies the reauthored SmolLM-135M model."""
+import logging
 import pathlib
 from absl import app
 from absl import flags
 from ai_edge_torch.generative.examples.smollm import smollm
+from ai_edge_torch.generative.utilities import transformers_verifier
 from ai_edge_torch.generative.utilities import verifier
 import transformers
 _PROMPTS = flags.DEFINE_multi_string(
     "prompts",
     "What is the meaning of life?",
     "The input prompts to generate answers.",
 )
+_MAX_NEW_TOKENS = flags.DEFINE_integer(
+    "max_new_tokens",
+    30,
+    "The maximum size of the generated tokens.",
+)
 def main(_):
   checkpoint = "HuggingFaceTB/SmolLM-135M"
-  verifier.log_msg("Loading the original model from", checkpoint)
-  wrapper_model = verifier.ModelWrapper(
-      model=transformers.AutoModelForCausalLM.from_pretrained(checkpoint),
-  )
+  logging.info("Loading the original model from: %s", checkpoint)
+  original_model = transformers.AutoModelForCausalLM.from_pretrained(checkpoint)
   # Locate the cached dir.
   cached_config_file = transformers.utils.cached_file(
       checkpoint, transformers.utils.CONFIG_NAME
   )
   reauthored_checkpoint = pathlib.Path(cached_config_file).parent
-  verifier.log_msg("Building the reauthored model from", reauthored_checkpoint)
+  logging.info("Building the reauthored model from: %s", reauthored_checkpoint)
   reauthored_model = smollm.build_model(reauthored_checkpoint)
-  verifier.log_msg("Loading the tokenizer from", checkpoint)
+  logging.info("Loading the tokenizer from: %s", checkpoint)
   tokenizer = transformers.AutoTokenizer.from_pretrained(checkpoint)
   verifier.verify_reauthored_model(
-      original_model=wrapper_model,
-      reauthored_model=reauthored_model,
-      tokenizer=tokenizer,
+      original_model=transformers_verifier.TransformersModelWrapper(
+          original_model
+      ),
+      reauthored_model=verifier.ReauthoredModelWrapper(reauthored_model),
+      tokenizer=verifier.TokenizerWrapper(tokenizer),
       generate_prompts=_PROMPTS.value,
+      max_new_tokens=_MAX_NEW_TOKENS.value,
       atol=1e-04,
   )

ai_edge_torch/generative/examples/tiny_llama/verify.py CHANGED Viewed

@@ -15,45 +15,55 @@
 """Verifies the reauthored TinyLlama-1.1B model."""
+import logging
 import pathlib
 from absl import app
 from absl import flags
 from ai_edge_torch.generative.examples.tiny_llama import tiny_llama
+from ai_edge_torch.generative.utilities import transformers_verifier
 from ai_edge_torch.generative.utilities import verifier
 import transformers
 _PROMPTS = flags.DEFINE_multi_string(
     "prompts",
     "Show me the program to add 2 and 3.",
     "The input prompts to generate answers.",
 )
+_MAX_NEW_TOKENS = flags.DEFINE_integer(
+    "max_new_tokens",
+    30,
+    "The maximum size of the generated tokens.",
+)
 def main(_):
   checkpoint = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
-  verifier.log_msg("Loading the original model from", checkpoint)
-  wrapper_model = verifier.ModelWrapper(
-      model=transformers.AutoModelForCausalLM.from_pretrained(
-          checkpoint, trust_remote_code=True
-      ),
+  logging.info("Loading the original model from: %s", checkpoint)
+  original_model = transformers.AutoModelForCausalLM.from_pretrained(
+      checkpoint, trust_remote_code=True
   )
   # Locate the cached dir.
   cached_config_file = transformers.utils.cached_file(
       checkpoint, transformers.utils.CONFIG_NAME
   )
   reauthored_checkpoint = pathlib.Path(cached_config_file).parent
-  verifier.log_msg("Building the reauthored model from", reauthored_checkpoint)
+  logging.info("Building the reauthored model from: %s", reauthored_checkpoint)
   reauthored_model = tiny_llama.build_model(reauthored_checkpoint)
-  verifier.log_msg("Loading the tokenizer from", checkpoint)
+  logging.info("Loading the tokenizer from: %s", checkpoint)
   tokenizer = transformers.AutoTokenizer.from_pretrained(checkpoint)
   verifier.verify_reauthored_model(
-      original_model=wrapper_model,
-      reauthored_model=reauthored_model,
-      tokenizer=tokenizer,
+      original_model=transformers_verifier.TransformersModelWrapper(
+          original_model
+      ),
+      reauthored_model=verifier.ReauthoredModelWrapper(reauthored_model),
+      tokenizer=verifier.TokenizerWrapper(tokenizer),
       generate_prompts=_PROMPTS.value,
+      max_new_tokens=_MAX_NEW_TOKENS.value,
       atol=1e-04,
   )

ai_edge_torch/generative/test/test_model_conversion_large.py CHANGED Viewed

@@ -19,6 +19,7 @@ import ai_edge_torch
 from ai_edge_torch import config as ai_edge_config
 from ai_edge_torch.generative.examples.gemma import gemma1
 from ai_edge_torch.generative.examples.gemma import gemma2
+from ai_edge_torch.generative.examples.llama import llama
 from ai_edge_torch.generative.examples.openelm import openelm
 from ai_edge_torch.generative.examples.phi import phi2
 from ai_edge_torch.generative.examples.phi import phi3
@@ -102,6 +103,15 @@ class TestModelConversion(googletest.TestCase):
     pytorch_model = gemma2.Gemma2(config).eval()
     self._test_model(config, pytorch_model, "prefill", atol=1e-4, rtol=1e-5)
+  @googletest.skipIf(
+      ai_edge_config.Config.use_torch_xla,
+      reason="tests with custom ops are not supported on oss",
+  )
+  def test_llama(self):
+    config = llama.get_fake_model_config()
+    pytorch_model = llama.Llama(config).eval()
+    self._test_model(config, pytorch_model, "prefill", atol=1e-3, rtol=1e-5)
   @googletest.skipIf(
       ai_edge_config.Config.use_torch_xla,
       reason="tests with custom ops are not supported on oss",

ai_edge_torch/generative/utilities/transformers_verifier.py ADDED Viewed

@@ -0,0 +1,42 @@
+# Copyright 2024 The AI Edge Torch Authors.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ==============================================================================
+"""Utilities for the models predefined in HuggingFace transformers."""
+from typing import cast
+from ai_edge_torch.generative.utilities import verifier
+import torch
+import transformers
+class TransformersModelWrapper(verifier.ModelWrapper):
+  """A wrapper for the model predefined in HuggingFace transformers.
+  Verifier expects forward() to return logits while Transformers models return
+  an object with `logits` field.
+  Transformers models get `max_new_tokens` settings for generate() via
+  GenerationConfig.
+  """
+  def forward(self, tokens: torch.Tensor) -> torch.Tensor:
+    return self.model.forward(tokens).logits
+  def generate(
+      self, inputs: torch.Tensor, max_new_tokens: int
+  ) -> torch.IntTensor:
+    gen_config = transformers.GenerationConfig(max_new_tokens=max_new_tokens)
+    return self.model.generate(inputs=inputs, generation_config=gen_config)

ai-edge-torch-nightly 0.3.0.dev20240925__py3-none-any.whl → 0.3.0.dev20240927__py3-none-any.whl

ai-edge-torch-nightly 0.3.0.dev20240925py3-none-any.whl → 0.3.0.dev20240927py3-none-any.whl