PyPI - clarifai - Versions diffs - 10.8.2__py3-none-any.whl → 10.8.3__py3-none-any.whl - Mend

clarifai 10.8.2py3-none-any.whl → 10.8.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

clarifai/__init__.py +1 -1
clarifai/client/app.py +3 -4
clarifai/client/model.py +1 -2
clarifai/models/model_serving/repo_build/static_files/base_test.py +4 -4
clarifai/runners/__init__.py +14 -0
clarifai/runners/dockerfile_template/Dockerfile.cpu.template +31 -0
clarifai/runners/dockerfile_template/Dockerfile.cuda.template +129 -0
clarifai/runners/models/__init__.py +0 -0
clarifai/runners/models/base_typed_model.py +235 -0
clarifai/runners/models/model_class.py +41 -0
clarifai/runners/models/model_runner.py +175 -0
clarifai/runners/models/model_servicer.py +79 -0
clarifai/runners/models/model_upload.py +315 -0
clarifai/runners/server.py +130 -0
clarifai/runners/utils/__init__.py +0 -0
clarifai/runners/utils/data_handler.py +244 -0
clarifai/runners/utils/data_utils.py +15 -0
clarifai/runners/utils/loader.py +70 -0
clarifai/runners/utils/logging.py +6 -0
clarifai/runners/utils/url_fetcher.py +42 -0
clarifai/utils/logging.py +212 -6
{clarifai-10.8.2.dist-info → clarifai-10.8.3.dist-info}/METADATA +3 -2
{clarifai-10.8.2.dist-info → clarifai-10.8.3.dist-info}/RECORD +27 -11
{clarifai-10.8.2.dist-info → clarifai-10.8.3.dist-info}/LICENSE +0 -0
{clarifai-10.8.2.dist-info → clarifai-10.8.3.dist-info}/WHEEL +0 -0
{clarifai-10.8.2.dist-info → clarifai-10.8.3.dist-info}/entry_points.txt +0 -0
{clarifai-10.8.2.dist-info → clarifai-10.8.3.dist-info}/top_level.txt +0 -0

clarifai/runners/models/model_servicer.py ADDED Viewed

@@ -0,0 +1,79 @@
+from itertools import tee
+from typing import Iterator
+from clarifai_grpc.grpc.api import service_pb2, service_pb2_grpc
+from clarifai_grpc.grpc.api.status import status_code_pb2, status_pb2
+from ..utils.url_fetcher import ensure_urls_downloaded
+class ModelServicer(service_pb2_grpc.V2Servicer):
+  """
+  This is the servicer that will handle the gRPC requests from either the dev server or runner loop.
+  """
+  def __init__(self, model_class):
+    self.model_class = model_class
+  def PostModelOutputs(self, request: service_pb2.PostModelOutputsRequest,
+                       context=None) -> service_pb2.MultiOutputResponse:
+    """
+    This is the method that will be called when the servicer is run. It takes in an input and
+    returns an output.
+    """
+    # Download any urls that are not already bytes.
+    ensure_urls_downloaded(self.url_fetcher, request)
+    try:
+      return self.model_class.predict(request)
+    except Exception as e:
+      return service_pb2.MultiOutputResponse(status=status_pb2.Status(
+          code=status_code_pb2.MODEL_PREDICTION_FAILED,
+          description="Failed",
+          details="",
+          internal_details=str(e),
+      ))
+  def GenerateModelOutputs(self, request: service_pb2.PostModelOutputsRequest,
+                           context=None) -> Iterator[service_pb2.MultiOutputResponse]:
+    """
+    This is the method that will be called when the servicer is run. It takes in an input and
+    returns an output.
+    """
+    # Download any urls that are not already bytes.
+    ensure_urls_downloaded(self.url_fetcher, request)
+    try:
+      return self.model_class.generate(request)
+    except Exception as e:
+      yield service_pb2.MultiOutputResponse(status=status_pb2.Status(
+          code=status_code_pb2.MODEL_PREDICTION_FAILED,
+          description="Failed",
+          details="",
+          internal_details=str(e),
+      ))
+  def StreamModelOutputs(self,
+                         request: Iterator[service_pb2.PostModelOutputsRequest],
+                         context=None) -> Iterator[service_pb2.MultiOutputResponse]:
+    """
+    This is the method that will be called when the servicer is run. It takes in an input and
+    returns an output.
+    """
+    # Duplicate the iterator
+    request, request_copy = tee(request)
+    # Download any urls that are not already bytes.
+    for req in request:
+      ensure_urls_downloaded(self.url_fetcher, req)
+    try:
+      return self.model_class.stream(request_copy)
+    except Exception as e:
+      yield service_pb2.MultiOutputResponse(status=status_pb2.Status(
+          code=status_code_pb2.MODEL_PREDICTION_FAILED,
+          description="Failed",
+          details="",
+          internal_details=str(e),
+      ))

clarifai/runners/models/model_upload.py ADDED Viewed

@@ -0,0 +1,315 @@
+import argparse
+import os
+import time
+from string import Template
+import yaml
+from clarifai_grpc.grpc.api import resources_pb2, service_pb2
+from clarifai_grpc.grpc.api.status import status_code_pb2
+from google.protobuf import json_format
+from rich import print
+from clarifai.client import BaseClient
+from clarifai.runners.utils.loader import HuggingFaceLoarder
+def _clear_line(n: int = 1) -> None:
+  LINE_UP = '\033[1A'  # Move cursor up one line
+  LINE_CLEAR = '\x1b[2K'  # Clear the entire line
+  for _ in range(n):
+    print(LINE_UP, end=LINE_CLEAR, flush=True)
+class ModelUploader:
+  DEFAULT_PYTHON_VERSION = 3.11
+  CONCEPTS_REQUIRED_MODEL_TYPE = [
+      'visual-classifier', 'visual-detector', 'visual-segmenter', 'text-classifier'
+  ]
+  def __init__(self, folder: str):
+    self.folder = self._validate_folder(folder)
+    self.config = self._load_config(os.path.join(self.folder, 'config.yaml'))
+    self.initialize_client()
+    self.model_proto = self._get_model_proto()
+    self.model_id = self.model_proto.id
+    self.user_app_id = self.client.user_app_id
+    self.inference_compute_info = self._get_inference_compute_info()
+    self.is_v3 = True  # Do model build for v3
+  @staticmethod
+  def _validate_folder(folder):
+    if not folder.startswith("/"):
+      folder = os.path.join(os.getcwd(), folder)
+    print(f"Validating folder: {folder}")
+    files = os.listdir(folder)
+    assert "requirements.txt" in files, "requirements.txt not found in the folder"
+    assert "config.yaml" in files, "config.yaml not found in the folder"
+    assert "1" in files, "Subfolder '1' not found in the folder"
+    subfolder_files = os.listdir(os.path.join(folder, '1'))
+    assert 'model.py' in subfolder_files, "model.py not found in the folder"
+    return folder
+  @staticmethod
+  def _load_config(config_file: str):
+    with open(config_file, 'r') as file:
+      config = yaml.safe_load(file)
+    return config
+  def initialize_client(self):
+    assert "model" in self.config, "model info not found in the config file"
+    model = self.config.get('model')
+    assert "user_id" in model, "user_id not found in the config file"
+    assert "app_id" in model, "app_id not found in the config file"
+    user_id = model.get('user_id')
+    app_id = model.get('app_id')
+    base = os.environ.get('CLARIFAI_API_BASE', 'https://api-dev.clarifai.com')
+    self.client = BaseClient(user_id=user_id, app_id=app_id, base=base)
+    print(f"Client initialized for user {user_id} and app {app_id}")
+  def _get_model_proto(self):
+    assert "model" in self.config, "model info not found in the config file"
+    model = self.config.get('model')
+    assert "model_type_id" in model, "model_type_id not found in the config file"
+    assert "id" in model, "model_id not found in the config file"
+    assert "user_id" in model, "user_id not found in the config file"
+    assert "app_id" in model, "app_id not found in the config file"
+    model_proto = json_format.ParseDict(model, resources_pb2.Model())
+    assert model_proto.id == model_proto.id.lower(), "Model ID must be lowercase"
+    assert model_proto.user_id == model_proto.user_id.lower(), "User ID must be lowercase"
+    assert model_proto.app_id == model_proto.app_id.lower(), "App ID must be lowercase"
+    return model_proto
+  def _get_inference_compute_info(self):
+    assert ("inference_compute_info" in self.config
+           ), "inference_compute_info not found in the config file"
+    inference_compute_info = self.config.get('inference_compute_info')
+    return json_format.ParseDict(inference_compute_info, resources_pb2.ComputeInfo())
+  def maybe_create_model(self):
+    resp = self.client.STUB.GetModel(
+        service_pb2.GetModelRequest(
+            user_app_id=self.client.user_app_id, model_id=self.model_proto.id))
+    if resp.status.code == status_code_pb2.SUCCESS:
+      print(
+          f"Model '{self.client.user_app_id.user_id}/{self.client.user_app_id.app_id}/models/{self.model_proto.id}' already exists, "
+          f"will create a new version for it.")
+      return resp
+    request = service_pb2.PostModelsRequest(
+        user_app_id=self.client.user_app_id,
+        models=[self.model_proto],
+    )
+    return self.client.STUB.PostModels(request)
+  def create_dockerfile(self):
+    num_accelerators = self.inference_compute_info.num_accelerators
+    if num_accelerators:
+      dockerfile_template = os.path.join(
+          os.path.dirname(os.path.dirname(__file__)),
+          'dockerfile_template',
+          'Dockerfile.cuda.template',
+      )
+    else:
+      dockerfile_template = os.path.join(
+          os.path.dirname(os.path.dirname(__file__)), 'dockerfile_template',
+          'Dockerfile.cpu.template')
+    with open(dockerfile_template, 'r') as template_file:
+      dockerfile_template = template_file.read()
+    dockerfile_template = Template(dockerfile_template)
+    # Get the Python version from the config file
+    build_info = self.config.get('build_info', {})
+    python_version = build_info.get('python_version', self.DEFAULT_PYTHON_VERSION)
+    # Replace placeholders with actual values
+    dockerfile_content = dockerfile_template.safe_substitute(
+        PYTHON_VERSION=python_version,
+        name='main',
+    )
+    # Write Dockerfile
+    with open(os.path.join(self.folder, 'Dockerfile'), 'w') as dockerfile:
+      dockerfile.write(dockerfile_content)
+  def download_checkpoints(self):
+    if not self.config.get("checkpoints"):
+      print("No checkpoints specified in the config file")
+      return
+    assert "type" in self.config.get("checkpoints"), "No loader type specified in the config file"
+    loader_type = self.config.get("checkpoints").get("type")
+    if not loader_type:
+      print("No loader type specified in the config file for checkpoints")
+    assert loader_type == "huggingface", "Only huggingface loader supported for now"
+    if loader_type == "huggingface":
+      assert "repo_id" in self.config.get("checkpoints"), "No repo_id specified in the config file"
+      repo_id = self.config.get("checkpoints").get("repo_id")
+      hf_token = self.config.get("checkpoints").get("hf_token", None)
+      loader = HuggingFaceLoarder(repo_id=repo_id, token=hf_token)
+      checkpoint_path = os.path.join(self.folder, '1', 'checkpoints')
+      loader.download_checkpoints(checkpoint_path)
+      print(f"Downloaded checkpoints for model {repo_id}")
+  def _concepts_protos_from_concepts(self, concepts):
+    concept_protos = []
+    for concept in concepts:
+      concept_protos.append(resources_pb2.Concept(
+          id=str(concept[0]),
+          name=concept[1],
+      ))
+    return concept_protos
+  def hf_labels_to_config(self, labels, config_file):
+    with open(config_file, 'r') as file:
+      config = yaml.safe_load(file)
+    model = config.get('model')
+    model_type_id = model.get('model_type_id')
+    assert model_type_id in self.CONCEPTS_REQUIRED_MODEL_TYPE, f"Model type {model_type_id} not supported for concepts"
+    concept_protos = self._concepts_protos_from_concepts(labels)
+    config['concepts'] = [{'id': concept.id, 'name': concept.name} for concept in concept_protos]
+    with open(config_file, 'w') as file:
+      yaml.dump(config, file, sort_keys=False)
+    concepts = config.get('concepts')
+    print(f"Updated config.yaml with {len(concepts)} concepts.")
+  def _get_model_version_proto(self):
+    model_version = resources_pb2.ModelVersion(
+        pretrained_model_config=resources_pb2.PretrainedModelConfig(),
+        inference_compute_info=self.inference_compute_info,
+    )
+    model_type_id = self.config.get('model').get('model_type_id')
+    if model_type_id in self.CONCEPTS_REQUIRED_MODEL_TYPE:
+      loader = HuggingFaceLoarder()
+      checkpoint_path = os.path.join(self.folder, '1', 'checkpoints')
+      labels = loader.fetch_labels(checkpoint_path)
+      # sort the concepts by id and then update the config file
+      labels = sorted(labels.items(), key=lambda x: int(x[0]))
+      config_file = os.path.join(self.folder, 'config.yaml')
+      self.hf_labels_to_config(labels, config_file)
+      model_version.output_info.data.concepts.extend(self._concepts_protos_from_concepts(labels))
+    return model_version
+  def upload_model_version(self):
+    file_path = f"{self.folder}.tar.gz"
+    print(f"Will tar it into file: {file_path}")
+    # Tar the folder
+    os.system(f"tar --exclude=*~ -czvf {self.folder}.tar.gz -C {self.folder} .")
+    print("Tarring complete, about to start upload.")
+    model_version = self._get_model_version_proto()
+    response = self.maybe_create_model()
+    for response in self.client.STUB.PostModelVersionsUpload(
+        self.model_version_stream_upload_iterator(model_version, file_path),):
+      percent_completed = 0
+      if response.status.code == status_code_pb2.UPLOAD_IN_PROGRESS:
+        percent_completed = response.status.percent_completed
+      details = response.status.details
+      _clear_line()
+      print(
+          f"Status: {response.status.description}, "
+          f"Progress: {percent_completed}% - {details} ",
+          end='\r',
+          flush=True)
+    print()
+    if response.status.code != status_code_pb2.MODEL_BUILDING:
+      print(f"Failed to upload model version: {response.status.description}")
+      return
+    model_version_id = response.model_version_id
+    print(f"Created Model Version ID: {model_version_id}")
+    self.monitor_model_build(model_version_id)
+  def model_version_stream_upload_iterator(self, model_version, file_path):
+    yield self.init_upload_model_version(model_version, file_path)
+    with open(file_path, "rb") as f:
+      file_size = os.path.getsize(file_path)
+      chunk_size = int(127 * 1024 * 1024)  # 127MB chunk size
+      num_chunks = (file_size // chunk_size) + 1
+      read_so_far = 0
+      for part_id in range(num_chunks):
+        chunk = f.read(chunk_size)
+        read_so_far += len(chunk)
+        yield service_pb2.PostModelVersionsUploadRequest(
+            content_part=resources_pb2.UploadContentPart(
+                data=chunk,
+                part_number=part_id + 1,
+                range_start=read_so_far,
+            ))
+    print("\nUpload complete!, waiting for model build...")
+  def init_upload_model_version(self, model_version, file_path):
+    file_size = os.path.getsize(file_path)
+    print(
+        f"Uploading model version '{model_version.id}' with file '{os.path.basename(file_path)}' of size {file_size} bytes..."
+    )
+    return service_pb2.PostModelVersionsUploadRequest(
+        upload_config=service_pb2.PostModelVersionsUploadConfig(
+            user_app_id=self.client.user_app_id,
+            model_id=self.model_proto.id,
+            model_version=model_version,
+            total_size=file_size,
+            is_v3=self.is_v3,
+        ))
+  def monitor_model_build(self, model_version_id):
+    st = time.time()
+    while True:
+      resp = self.client.STUB.GetModelVersion(
+          service_pb2.GetModelVersionRequest(
+              user_app_id=self.client.user_app_id,
+              model_id=self.model_proto.id,
+              version_id=model_version_id,
+          ))
+      status_code = resp.model_version.status.code
+      if status_code == status_code_pb2.MODEL_BUILDING:
+        print(f"Model is building... (elapsed {time.time() - st:.1f}s)", end='\r', flush=True)
+        time.sleep(1)
+      elif status_code == status_code_pb2.MODEL_TRAINED:
+        print("\nModel build complete!")
+        print(
+            f"Check out the model at https://clarifai.com/{self.user_app_id.user_id}/apps/{self.user_app_id.app_id}/models/{self.model_id}/versions/{model_version_id}"
+        )
+        break
+      else:
+        print(f"\nModel build failed with status: {resp.model_version.status}")
+        break
+def main(folder):
+  uploader = ModelUploader(folder)
+  uploader.download_checkpoints()
+  uploader.create_dockerfile()
+  input("Press Enter to continue...")
+  uploader.upload_model_version()
+if __name__ == "__main__":
+  parser = argparse.ArgumentParser()
+  parser.add_argument(
+      '--model_path', type=str, help='Path of the model folder to upload', required=True)
+  args = parser.parse_args()
+  main(args.model_path)

clarifai/runners/server.py ADDED Viewed

@@ -0,0 +1,130 @@
+"""
+This is simply the main file for the server that imports ModelRunner implementation
+and starts the server.
+"""
+import argparse
+import importlib.util
+import inspect
+import os
+import sys
+from concurrent import futures
+from clarifai_grpc.grpc.api import service_pb2_grpc
+from clarifai_protocol import BaseRunner
+from clarifai_protocol.utils.grpc_server import GRPCServer
+from clarifai.runners.models.model_servicer import ModelServicer
+from clarifai.runners.utils.logging import logger
+def main():
+  parser = argparse.ArgumentParser()
+  parser.add_argument(
+      '--port',
+      type=int,
+      default=8000,
+      help="The port to host the gRPC server at.",
+      choices=range(1024, 65535),
+  )
+  parser.add_argument(
+      '--pool_size',
+      type=int,
+      default=32,
+      help="The number of threads to use for the gRPC server.",
+      choices=range(1, 129),
+  )  # pylint: disable=range-builtin-not-iterating
+  parser.add_argument(
+      '--max_queue_size',
+      type=int,
+      default=10,
+      help='Max queue size of requests before we begin to reject requests (default: 10).',
+      choices=range(1, 21),
+  )  # pylint: disable=range-builtin-not-iterating
+  parser.add_argument(
+      '--max_msg_length',
+      type=int,
+      default=1024 * 1024 * 1024,
+      help='Max message length of grpc requests (default: 1 GB).',
+  )
+  parser.add_argument(
+      '--enable_tls',
+      action='store_true',
+      default=False,
+      help=
+      'Set to true to enable TLS (default: False) since this server is meant for local development only.',
+  )
+  parser.add_argument(
+      '--start_dev_server',
+      action='store_true',
+      default=False,
+      help=
+      'Set to true to start the gRPC server (default: False). If set to false, the server will not start and only the runner loop will start to fetch work from the API.',
+  )
+  parser.add_argument(
+      '--model_path',
+      type=str,
+      required=True,
+      help='The path to the model directory that contains implemention of the model.',
+  )
+  parsed_args = parser.parse_args()
+  # import the runner class that to be implement by the user
+  runner_path = os.path.join(parsed_args.model_path, "1", "model.py")
+  # arbitrary name given to the module to be imported
+  module = "runner_module"
+  spec = importlib.util.spec_from_file_location(module, runner_path)
+  runner_module = importlib.util.module_from_spec(spec)
+  sys.modules[module] = runner_module
+  spec.loader.exec_module(runner_module)
+  # Find all classes in the model.py file that are subclasses of BaseRunner
+  classes = [
+      cls for _, cls in inspect.getmembers(runner_module, inspect.isclass)
+      if issubclass(cls, BaseRunner) and cls.__module__ == runner_module.__name__
+  ]
+  #  Ensure there is exactly one subclass of BaseRunner in the model.py file
+  if len(classes) != 1:
+    raise Exception("Expected exactly one subclass of BaseRunner, found: {}".format(len(classes)))
+  MyRunner = classes[0]
+  # initialize the Runner class. This is what the user implements.
+  # (Note) do we want to set runner_id, nodepool_id, compute_cluster_id, base_url, num_parallel_polls as env vars? or as args?
+  runner = MyRunner(
+      runner_id=os.environ["CLARIFAI_RUNNER_ID"],
+      nodepool_id=os.environ["CLARIFAI_NODEPOOL_ID"],
+      compute_cluster_id=os.environ["CLARIFAI_COMPUTE_CLUSTER_ID"],
+      base_url=os.environ["CLARIFAI_API_BASE"],
+      num_parallel_polls=int(os.environ.get("CLARIFAI_NUM_THREADS", 1)),
+  )
+  # initialize the servicer
+  servicer = ModelServicer(runner)
+  # Setup the grpc server for local development.
+  if parsed_args.start_dev_server:
+    server = GRPCServer(
+        futures.ThreadPoolExecutor(
+            max_workers=parsed_args.pool_size,
+            thread_name_prefix="ServeCalls",
+        ),
+        parsed_args.max_msg_length,
+        parsed_args.max_queue_size,
+    )
+    server.add_port_to_server('[::]:%s' % parsed_args.port, parsed_args.enable_tls)
+    service_pb2_grpc.add_V2Servicer_to_server(servicer, server)
+    server.start()
+    logger.info("Started server on port %s", parsed_args.port)
+    # server.wait_for_termination() # won't get here currently.
+  runner.start()  # start the runner loop to fetch work from the API.
+if __name__ == '__main__':
+  main()

clarifai/runners/utils/__init__.py ADDED Viewed

File without changes

clarifai 10.8.2__py3-none-any.whl → 10.8.3__py3-none-any.whl

clarifai 10.8.2py3-none-any.whl → 10.8.3py3-none-any.whl