PyPI - vec-inf - Versions diffs - 0.7.1__py3-none-any.whl → 0.7.2__py3-none-any.whl - Mend

vec-inf 0.7.1py3-none-any.whl → 0.7.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

vec_inf/cli/_cli.py +15 -1
vec_inf/cli/_helper.py +44 -19
vec_inf/client/_helper.py +66 -26
vec_inf/client/_slurm_script_generator.py +36 -19
vec_inf/client/_slurm_templates.py +20 -3
vec_inf/client/_utils.py +54 -5
vec_inf/client/api.py +8 -2
vec_inf/client/models.py +6 -0
vec_inf/config/models.yaml +48 -99
{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/METADATA +4 -3
{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/RECORD +14 -14
{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/WHEEL +0 -0
{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/entry_points.txt +0 -0
{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/licenses/LICENSE +0 -0

vec_inf/cli/_cli.py CHANGED Viewed

@@ -69,6 +69,16 @@ def cli() -> None:
     type=int,
     help="Number of GPUs/node to use, default to suggested resource allocation for model",
 )
+@click.option(
+    "--cpus-per-task",
+    type=int,
+    help="Number of CPU cores per task",
+)
+@click.option(
+    "--mem-per-node",
+    type=str,
+    help="Memory allocation per node in GB format (e.g., '32G')",
+)
 @click.option(
     "--account",
     "-A",
@@ -165,6 +175,10 @@ def launch(
             Number of nodes to use
         - gpus_per_node : int, optional
             Number of GPUs per node
+        - cpus_per_task : int, optional
+            Number of CPU cores per task
+        - mem_per_node : str, optional
+            Memory allocation per node in GB format (e.g., '32G')
         - account : str, optional
             Charge resources used by this job to specified account
         - work_dir : str, optional
@@ -447,7 +461,7 @@ def metrics(slurm_job_id: str) -> None:
                     metrics_formatter.format_metrics()
                 live.update(metrics_formatter.table)
-                time.sleep(2)
+                time.sleep(1)
     except click.ClickException as e:
         raise e
     except Exception as e:

vec_inf/cli/_helper.py CHANGED Viewed

@@ -36,6 +36,43 @@ class LaunchResponseFormatter:
         self.model_name = model_name
         self.params = params
+    def _add_resource_allocation_details(self, table: Table) -> None:
+        """Add resource allocation details to the table."""
+        optional_fields = [
+            ("account", "Account"),
+            ("work_dir", "Working Directory"),
+            ("resource_type", "Resource Type"),
+            ("partition", "Partition"),
+            ("qos", "QoS"),
+        ]
+        for key, label in optional_fields:
+            if self.params.get(key):
+                table.add_row(label, self.params[key])
+    def _add_vllm_config(self, table: Table) -> None:
+        """Add vLLM configuration details to the table."""
+        if self.params.get("vllm_args"):
+            table.add_row("vLLM Arguments:", style="magenta")
+            for arg, value in self.params["vllm_args"].items():
+                table.add_row(f"  {arg}:", str(value))
+    def _add_env_vars(self, table: Table) -> None:
+        """Add environment variable configuration details to the table."""
+        if self.params.get("env"):
+            table.add_row("Environment Variables", style="magenta")
+            for arg, value in self.params["env"].items():
+                table.add_row(f"  {arg}:", str(value))
+    def _add_bind_paths(self, table: Table) -> None:
+        """Add bind path configuration details to the table."""
+        if self.params.get("bind"):
+            table.add_row("Bind Paths", style="magenta")
+            for path in self.params["bind"].split(","):
+                host = target = path
+                if ":" in path:
+                    host, target = path.split(":")
+                table.add_row(f"  {host}:", target)
     def format_table_output(self) -> Table:
         """Format output as rich Table.
@@ -59,16 +96,7 @@ class LaunchResponseFormatter:
         table.add_row("Vocabulary Size", self.params["vocab_size"])
         # Add resource allocation details
-        if self.params.get("account"):
-            table.add_row("Account", self.params["account"])
-        if self.params.get("work_dir"):
-            table.add_row("Working Directory", self.params["work_dir"])
-        if self.params.get("resource_type"):
-            table.add_row("Resource Type", self.params["resource_type"])
-        if self.params.get("partition"):
-            table.add_row("Partition", self.params["partition"])
-        if self.params.get("qos"):
-            table.add_row("QoS", self.params["qos"])
+        self._add_resource_allocation_details(table)
         table.add_row("Time Limit", self.params["time"])
         table.add_row("Num Nodes", self.params["num_nodes"])
         table.add_row("GPUs/Node", self.params["gpus_per_node"])
@@ -76,21 +104,18 @@ class LaunchResponseFormatter:
         table.add_row("Memory/Node", self.params["mem_per_node"])
         # Add job config details
+        if self.params.get("venv"):
+            table.add_row("Virtual Environment", self.params["venv"])
         table.add_row(
             "Model Weights Directory",
             str(Path(self.params["model_weights_parent_dir"], self.model_name)),
         )
         table.add_row("Log Directory", self.params["log_dir"])
-        # Add vLLM configuration details
-        table.add_row("vLLM Arguments:", style="magenta")
-        for arg, value in self.params["vllm_args"].items():
-            table.add_row(f"  {arg}:", str(value))
-        # Add Environment Variable Configuration Details
-        table.add_row("Environment Variables", style="magenta")
-        for arg, value in self.params["env"].items():
-            table.add_row(f"  {arg}:", str(value))
+        # Add configuration details
+        self._add_vllm_config(table)
+        self._add_env_vars(table)
+        self._add_bind_paths(table)
         return table

vec_inf/client/_helper.py CHANGED Viewed

@@ -31,6 +31,7 @@ from vec_inf.client._slurm_script_generator import (
     BatchSlurmScriptGenerator,
     SlurmScriptGenerator,
 )
+from vec_inf.client._slurm_vars import CONTAINER_MODULE_NAME, IMAGE_PATH
 from vec_inf.client.config import ModelConfig
 from vec_inf.client.models import (
     BatchLaunchResponse,
@@ -195,23 +196,14 @@ class ModelLauncher:
                         print(f"WARNING: Could not parse env var: {line}")
         return env_vars
-    def _get_launch_params(self) -> dict[str, Any]:
-        """Prepare launch parameters, set log dir, and validate required fields.
-        Returns
-        -------
-        dict[str, Any]
-            Dictionary of prepared launch parameters
+    def _apply_cli_overrides(self, params: dict[str, Any]) -> None:
+        """Apply CLI argument overrides to params.
-        Raises
-        ------
-        MissingRequiredFieldsError
-            If required fields are missing or tensor parallel size is not specified
-            when using multiple GPUs
+        Parameters
+        ----------
+        params : dict[str, Any]
+            Dictionary of launch parameters to override
         """
-        params = self.model_config.model_dump(exclude_none=True)
-        # Override config defaults with CLI arguments
         if self.kwargs.get("vllm_args"):
             vllm_args = self._process_vllm_args(self.kwargs["vllm_args"])
             for key, value in vllm_args.items():
@@ -224,13 +216,29 @@ class ModelLauncher:
                 params["env"][key] = str(value)
             del self.kwargs["env"]
+        if self.kwargs.get("bind") and params.get("bind"):
+            params["bind"] = f"{params['bind']},{self.kwargs['bind']}"
+            del self.kwargs["bind"]
         for key, value in self.kwargs.items():
             params[key] = value
-        # Check for required fields without default vals, will raise an error if missing
-        utils.check_required_fields(params)
+    def _validate_resource_allocation(self, params: dict[str, Any]) -> None:
+        """Validate resource allocation and parallelization settings.
-        # Validate resource allocation and parallelization settings
+        Parameters
+        ----------
+        params : dict[str, Any]
+            Dictionary of launch parameters to validate
+        Raises
+        ------
+        MissingRequiredFieldsError
+            If tensor parallel size is not specified when using multiple GPUs
+        ValueError
+            If total # of GPUs requested is not a power of two
+            If mismatch between total # of GPUs requested and parallelization settings
+        """
         if (
             int(params["gpus_per_node"]) > 1
             and params["vllm_args"].get("--tensor-parallel-size") is None
@@ -251,19 +259,18 @@ class ModelLauncher:
                 "Mismatch between total number of GPUs requested and parallelization settings"
             )
-        # Convert gpus_per_node and resource_type to gres
-        resource_type = params.get("resource_type")
-        if resource_type:
-            params["gres"] = f"gpu:{resource_type}:{params['gpus_per_node']}"
-        else:
-            params["gres"] = f"gpu:{params['gpus_per_node']}"
+    def _setup_log_files(self, params: dict[str, Any]) -> None:
+        """Set up log directory and file paths.
-        # Create log directory
+        Parameters
+        ----------
+        params : dict[str, Any]
+            Dictionary of launch parameters to set up log files
+        """
         params["log_dir"] = Path(params["log_dir"], params["model_family"]).expanduser()
         params["log_dir"].mkdir(parents=True, exist_ok=True)
         params["src_dir"] = SRC_DIR
-        # Construct slurm log file paths
         params["out_file"] = (
             f"{params['log_dir']}/{self.model_name}.%j/{self.model_name}.%j.out"
         )
@@ -274,6 +281,35 @@ class ModelLauncher:
             f"{params['log_dir']}/{self.model_name}.$SLURM_JOB_ID/{self.model_name}.$SLURM_JOB_ID.json"
         )
+    def _get_launch_params(self) -> dict[str, Any]:
+        """Prepare launch parameters, set log dir, and validate required fields.
+        Returns
+        -------
+        dict[str, Any]
+            Dictionary of prepared launch parameters
+        """
+        params = self.model_config.model_dump(exclude_none=True)
+        # Override config defaults with CLI arguments
+        self._apply_cli_overrides(params)
+        # Check for required fields without default vals, will raise an error if missing
+        utils.check_required_fields(params)
+        # Validate resource allocation and parallelization settings
+        self._validate_resource_allocation(params)
+        # Convert gpus_per_node and resource_type to gres
+        resource_type = params.get("resource_type")
+        if resource_type:
+            params["gres"] = f"gpu:{resource_type}:{params['gpus_per_node']}"
+        else:
+            params["gres"] = f"gpu:{params['gpus_per_node']}"
+        # Setup log files
+        self._setup_log_files(params)
         # Convert path to string for JSON serialization
         for field in params:
             if field in ["vllm_args", "env"]:
@@ -332,6 +368,10 @@ class ModelLauncher:
             job_log_dir / f"{self.model_name}.{self.slurm_job_id}.sbatch"
         )
+        # Replace venv with image path if using container
+        if self.params["venv"] == CONTAINER_MODULE_NAME:
+            self.params["venv"] = IMAGE_PATH
         with job_json.open("w") as file:
             json.dump(self.params, file, indent=4)

vec_inf/client/_slurm_script_generator.py CHANGED Viewed

@@ -14,6 +14,7 @@ from vec_inf.client._slurm_templates import (
     BATCH_SLURM_SCRIPT_TEMPLATE,
     SLURM_SCRIPT_TEMPLATE,
 )
+from vec_inf.client._slurm_vars import CONTAINER_MODULE_NAME
 class SlurmScriptGenerator:
@@ -32,24 +33,35 @@ class SlurmScriptGenerator:
     def __init__(self, params: dict[str, Any]):
         self.params = params
         self.is_multinode = int(self.params["num_nodes"]) > 1
-        self.use_container = (
-            self.params["venv"] == "singularity" or self.params["venv"] == "apptainer"
-        )
+        self.use_container = self.params["venv"] == CONTAINER_MODULE_NAME
         self.additional_binds = self.params.get("bind", "")
         if self.additional_binds:
             self.additional_binds = f" --bind {self.additional_binds}"
         self.model_weights_path = str(
             Path(self.params["model_weights_parent_dir"], self.params["model_name"])
         )
+        self.env_str = self._generate_env_str()
+    def _generate_env_str(self) -> str:
+        """Generate the environment variables string for the Slurm script.
+        Returns
+        -------
+        str
+            Formatted env vars string for container or shell export commands.
+        """
         env_dict: dict[str, str] = self.params.get("env", {})
-        # Create string of environment variables
-        self.env_str = ""
-        for key, val in env_dict.items():
-            if len(self.env_str) == 0:
-                self.env_str = "--env "
-            else:
-                self.env_str += ","
-            self.env_str += key + "=" + val
+        if not env_dict:
+            return ""
+        if self.use_container:
+            # Format for container: --env KEY1=VAL1,KEY2=VAL2
+            env_pairs = [f"{key}={val}" for key, val in env_dict.items()]
+            return f"--env {','.join(env_pairs)}"
+        # Format for shell: export KEY1=VAL1\nexport KEY2=VAL2
+        export_lines = [f"export {key}={val}" for key, val in env_dict.items()]
+        return "\n".join(export_lines)
     def _generate_script_content(self) -> str:
         """Generate the complete Slurm script content.
@@ -95,7 +107,12 @@ class SlurmScriptGenerator:
         server_script = ["\n"]
         if self.use_container:
             server_script.append("\n".join(SLURM_SCRIPT_TEMPLATE["container_setup"]))
-        server_script.append("\n".join(SLURM_SCRIPT_TEMPLATE["env_vars"]))
+            server_script.append("\n".join(SLURM_SCRIPT_TEMPLATE["container_env_vars"]))
+        else:
+            server_script.append(
+                SLURM_SCRIPT_TEMPLATE["activate_venv"].format(venv=self.params["venv"])
+            )
+            server_script.append(self.env_str)
         server_script.append(
             SLURM_SCRIPT_TEMPLATE["imports"].format(src_dir=self.params["src_dir"])
         )
@@ -112,6 +129,11 @@ class SlurmScriptGenerator:
                         env_str=self.env_str,
                     ),
                 )
+            else:
+                server_setup_str = server_setup_str.replace(
+                    "CONTAINER_PLACEHOLDER",
+                    "\\",
+                )
         else:
             server_setup_str = "\n".join(
                 SLURM_SCRIPT_TEMPLATE["server_setup"]["single_node"]
@@ -145,10 +167,7 @@ class SlurmScriptGenerator:
                     env_str=self.env_str,
                 )
             )
-        else:
-            launcher_script.append(
-                SLURM_SCRIPT_TEMPLATE["activate_venv"].format(venv=self.params["venv"])
-            )
         launcher_script.append(
             "\n".join(SLURM_SCRIPT_TEMPLATE["launch_cmd"]).format(
                 model_weights_path=self.model_weights_path,
@@ -194,9 +213,7 @@ class BatchSlurmScriptGenerator:
     def __init__(self, params: dict[str, Any]):
         self.params = params
         self.script_paths: list[Path] = []
-        self.use_container = (
-            self.params["venv"] == "singularity" or self.params["venv"] == "apptainer"
-        )
+        self.use_container = self.params["venv"] == CONTAINER_MODULE_NAME
         for model_name in self.params["models"]:
             self.params["models"][model_name]["additional_binds"] = ""
             if self.params["models"][model_name].get("bind"):

vec_inf/client/_slurm_templates.py CHANGED Viewed

@@ -74,7 +74,7 @@ class SlurmScriptTemplate(TypedDict):
     shebang: ShebangConfig
     container_setup: list[str]
     imports: str
-    env_vars: list[str]
+    container_env_vars: list[str]
     container_command: str
     activate_venv: str
     server_setup: ServerSetupConfig
@@ -96,8 +96,8 @@ SLURM_SCRIPT_TEMPLATE: SlurmScriptTemplate = {
         f"{CONTAINER_MODULE_NAME} exec {IMAGE_PATH} ray stop",
     ],
     "imports": "source {src_dir}/find_port.sh",
-    "env_vars": [
-        f"export {CONTAINER_MODULE_NAME}_BINDPATH=${CONTAINER_MODULE_NAME}_BINDPATH,$(echo /dev/infiniband* | sed -e 's/ /,/g')"
+    "container_env_vars": [
+        f"export {CONTAINER_MODULE_NAME.upper()}_BINDPATH=${CONTAINER_MODULE_NAME.upper()}_BINDPATH,/dev,/tmp"
     ],
     "container_command": f"{CONTAINER_MODULE_NAME} exec --nv {{env_str}} --bind {{model_weights_path}}{{additional_binds}} --containall {IMAGE_PATH} \\",
     "activate_venv": "source {venv}/bin/activate",
@@ -112,6 +112,23 @@ SLURM_SCRIPT_TEMPLATE: SlurmScriptTemplate = {
             "nodes_array=($nodes)",
             "head_node=${{nodes_array[0]}}",
             'head_node_ip=$(srun --nodes=1 --ntasks=1 -w "$head_node" hostname --ip-address)',
+            "\n# Check for RDMA devices and set environment variable accordingly",
+            "if ! command -v ibv_devices >/dev/null 2>&1; then",
+            '   echo "ibv_devices not found; forcing TCP. (No RDMA userland on host?)"',
+            "   export NCCL_IB_DISABLE=1",
+            '   export NCCL_ENV_ARG="--env NCCL_IB_DISABLE=1"',
+            "else",
+            "   # Pick GID index based on link layer (IB vs RoCE)",
+            '   if ibv_devinfo 2>/dev/null | grep -q "link_layer:.*Ethernet"; then',
+            "       # RoCEv2 typically needs a nonzero GID index; 3 is common, try 2 if your fabric uses it",
+            "       export NCCL_IB_GID_INDEX={{NCCL_IB_GID_INDEX:-3}}",
+            '       export NCCL_ENV_ARG="--env NCCL_IB_GID_INDEX={{NCCL_IB_GID_INDEX:-3}}"',
+            "   else",
+            "       # Native InfiniBand => GID 0",
+            "       export NCCL_IB_GID_INDEX={{NCCL_IB_GID_INDEX:-0}}",
+            '       export NCCL_ENV_ARG="--env NCCL_IB_GID_INDEX={{NCCL_IB_GID_INDEX:-0}}"',
+            "   fi",
+            "fi",
             "\n# Start Ray head node",
             "head_node_port=$(find_available_port $head_node_ip 8080 65535)",
             "ray_head=$head_node_ip:$head_node_port",

vec_inf/client/_utils.py CHANGED Viewed

@@ -108,15 +108,64 @@ def is_server_running(
     if isinstance(log_content, str):
         return log_content
-    status: Union[str, tuple[ModelStatus, str]] = ModelStatus.LAUNCHING
+    # Patterns that indicate fatal errors (not just warnings)
+    fatal_error_patterns = [
+        "traceback",
+        "exception",
+        "fatal error",
+        "critical error",
+        "failed to",
+        "could not",
+        "unable to",
+        "error:",
+    ]
+    # Patterns to ignore (non-fatal warnings/info messages)
+    ignore_patterns = [
+        "deprecated",
+        "futurewarning",
+        "userwarning",
+        "deprecationwarning",
+        "slurmstepd: error:",  # SLURM cancellation messages (often after server started)
+    ]
+    ready_signature_found = False
+    fatal_error_line = None
     for line in log_content:
-        if "error" in line.lower():
-            status = (ModelStatus.FAILED, line.strip("\n"))
+        line_lower = line.lower()
+        # Check for ready signature first - if found, server is running
         if MODEL_READY_SIGNATURE in line:
-            status = "RUNNING"
+            ready_signature_found = True
+            # Continue checking to see if there are errors after startup
+        # Check for fatal errors (only if we haven't seen ready signature yet)
+        if not ready_signature_found:
+            # Skip lines that match ignore patterns
+            if any(ignore_pattern in line_lower for ignore_pattern in ignore_patterns):
+                continue
-    return status
+            # Check for fatal error patterns
+            for pattern in fatal_error_patterns:
+                if pattern in line_lower:
+                    # Additional check: skip if it's part of a warning message
+                    # (warnings often contain "error:" but aren't fatal)
+                    if "warning" in line_lower and "error:" in line_lower:
+                        continue
+                    fatal_error_line = line.strip("\n")
+                    break
+    # If we found a fatal error, mark as failed
+    if fatal_error_line:
+        return (ModelStatus.FAILED, fatal_error_line)
+    # If ready signature was found and no fatal errors, server is running
+    if ready_signature_found:
+        return "RUNNING"
+    # Otherwise, still launching
+    return ModelStatus.LAUNCHING
 def get_base_url(slurm_job_name: str, slurm_job_id: str, log_dir: str) -> str:

vec_inf/client/api.py CHANGED Viewed

@@ -81,7 +81,7 @@ class VecInfClient:
     def __init__(self) -> None:
         """Initialize the Vector Inference client."""
-        pass
+        self._metrics_collectors: dict[str, PerformanceMetricsCollector] = {}
     def list_models(self) -> list[ModelInfo]:
         """List all available models.
@@ -218,7 +218,13 @@ class VecInfClient:
             - Performance metrics or error message
             - Timestamp of collection
         """
-        performance_metrics_collector = PerformanceMetricsCollector(slurm_job_id)
+        # Use cached collector to preserve state between calls to compute throughput
+        if slurm_job_id not in self._metrics_collectors:
+            self._metrics_collectors[slurm_job_id] = PerformanceMetricsCollector(
+                slurm_job_id
+            )
+        performance_metrics_collector = self._metrics_collectors[slurm_job_id]
         metrics: Union[dict[str, float], str]
         if not performance_metrics_collector.metrics_url.startswith("http"):

vec_inf/client/models.py CHANGED Viewed

@@ -194,6 +194,10 @@ class LaunchOptions:
         Number of nodes to allocate
     gpus_per_node : int, optional
         Number of GPUs per node
+    cpus_per_task : int, optional
+        Number of CPUs per task
+    mem_per_node : str, optional
+        Memory per node
     account : str, optional
         Account name for job scheduling
     work_dir : str, optional
@@ -232,6 +236,8 @@ class LaunchOptions:
     resource_type: Optional[str] = None
     num_nodes: Optional[int] = None
     gpus_per_node: Optional[int] = None
+    cpus_per_task: Optional[int] = None
+    mem_per_node: Optional[str] = None
     account: Optional[str] = None
     work_dir: Optional[str] = None
     qos: Optional[str] = None

vec_inf/config/models.yaml CHANGED Viewed

@@ -12,7 +12,6 @@ models:
       --pipeline-parallel-size: 2
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   c4ai-command-r-08-2024:
     model_family: c4ai-command-r
     model_variant: 08-2024
@@ -25,7 +24,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 32768
-      --max-num-seqs: 256
   CodeLlama-7b-hf:
     model_family: CodeLlama
     model_variant: 7b-hf
@@ -37,7 +35,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 16384
-      --max-num-seqs: 256
   CodeLlama-7b-Instruct-hf:
     model_family: CodeLlama
     model_variant: 7b-Instruct-hf
@@ -49,7 +46,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 16384
-      --max-num-seqs: 256
   CodeLlama-13b-hf:
     model_family: CodeLlama
     model_variant: 13b-hf
@@ -61,7 +57,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 16384
-      --max-num-seqs: 256
   CodeLlama-13b-Instruct-hf:
     model_family: CodeLlama
     model_variant: 13b-Instruct-hf
@@ -73,7 +68,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 16384
-      --max-num-seqs: 256
   CodeLlama-34b-hf:
     model_family: CodeLlama
     model_variant: 34b-hf
@@ -86,7 +80,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 16384
-      --max-num-seqs: 256
   CodeLlama-34b-Instruct-hf:
     model_family: CodeLlama
     model_variant: 34b-Instruct-hf
@@ -99,7 +92,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 16384
-      --max-num-seqs: 256
   CodeLlama-70b-hf:
     model_family: CodeLlama
     model_variant: 70b-hf
@@ -112,7 +104,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 4096
-      --max-num-seqs: 256
   CodeLlama-70b-Instruct-hf:
     model_family: CodeLlama
     model_variant: 70b-Instruct-hf
@@ -125,7 +116,17 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 4096
-      --max-num-seqs: 256
+  gemma-2-2b-it:
+    model_family: gemma-2
+    model_variant: 2b-it
+    model_type: LLM
+    gpus_per_node: 1
+    num_nodes: 1
+    vocab_size: 256000
+    time: 08:00:00
+    resource_type: l40s
+    vllm_args:
+      --max-model-len: 4096
   gemma-2-9b:
     model_family: gemma-2
     model_variant: 9b
@@ -137,7 +138,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   gemma-2-9b-it:
     model_family: gemma-2
     model_variant: 9b-it
@@ -149,7 +149,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   gemma-2-27b:
     model_family: gemma-2
     model_variant: 27b
@@ -162,7 +161,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 4096
-      --max-num-seqs: 256
   gemma-2-27b-it:
     model_family: gemma-2
     model_variant: 27b-it
@@ -175,7 +173,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 4096
-      --max-num-seqs: 256
   Llama-2-7b-hf:
     model_family: Llama-2
     model_variant: 7b-hf
@@ -187,7 +184,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   Llama-2-7b-chat-hf:
     model_family: Llama-2
     model_variant: 7b-chat-hf
@@ -199,7 +195,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   Llama-2-13b-hf:
     model_family: Llama-2
     model_variant: 13b-hf
@@ -211,7 +206,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   Llama-2-13b-chat-hf:
     model_family: Llama-2
     model_variant: 13b-chat-hf
@@ -223,7 +217,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   Llama-2-70b-hf:
     model_family: Llama-2
     model_variant: 70b-hf
@@ -236,7 +229,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 4096
-      --max-num-seqs: 256
   Llama-2-70b-chat-hf:
     model_family: Llama-2
     model_variant: 70b-chat-hf
@@ -249,7 +241,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 4096
-      --max-num-seqs: 256
   llava-1.5-7b-hf:
     model_family: llava-1.5
     model_variant: 7b-hf
@@ -261,7 +252,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   llava-1.5-13b-hf:
     model_family: llava-1.5
     model_variant: 13b-hf
@@ -273,7 +263,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   llava-v1.6-mistral-7b-hf:
     model_family: llava-v1.6
     model_variant: mistral-7b-hf
@@ -285,7 +274,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   llava-v1.6-34b-hf:
     model_family: llava-v1.6
     model_variant: 34b-hf
@@ -298,7 +286,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 4096
-      --max-num-seqs: 256
   Meta-Llama-3-8B:
     model_family: Meta-Llama-3
     model_variant: 8B
@@ -310,7 +297,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 8192
-      --max-num-seqs: 256
   Meta-Llama-3-8B-Instruct:
     model_family: Meta-Llama-3
     model_variant: 8B-Instruct
@@ -322,7 +308,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 8192
-      --max-num-seqs: 256
   Meta-Llama-3-70B:
     model_family: Meta-Llama-3
     model_variant: 70B
@@ -335,7 +320,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 8192
-      --max-num-seqs: 256
   Meta-Llama-3-70B-Instruct:
     model_family: Meta-Llama-3
     model_variant: 70B-Instruct
@@ -348,7 +332,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 8192
-      --max-num-seqs: 256
   Meta-Llama-3.1-8B:
     model_family: Meta-Llama-3.1
     model_variant: 8B
@@ -360,7 +343,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   Meta-Llama-3.1-8B-Instruct:
     model_family: Meta-Llama-3.1
     model_variant: 8B-Instruct
@@ -372,7 +354,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   Meta-Llama-3.1-70B:
     model_family: Meta-Llama-3.1
     model_variant: 70B
@@ -385,7 +366,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   Meta-Llama-3.1-70B-Instruct:
     model_family: Meta-Llama-3.1
     model_variant: 70B-Instruct
@@ -398,7 +378,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   Meta-Llama-3.1-405B-Instruct:
     model_family: Meta-Llama-3.1
     model_variant: 405B-Instruct
@@ -406,14 +385,12 @@ models:
     gpus_per_node: 4
     num_nodes: 8
     vocab_size: 128256
-    qos: m4
-    time: 02:00:00
+    time: 08:00:00
     resource_type: l40s
     vllm_args:
       --pipeline-parallel-size: 8
       --tensor-parallel-size: 4
       --max-model-len: 16384
-      --max-num-seqs: 256
   Mistral-7B-Instruct-v0.1:
     model_family: Mistral
     model_variant: 7B-Instruct-v0.1
@@ -425,7 +402,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Mistral-7B-Instruct-v0.2:
     model_family: Mistral
     model_variant: 7B-Instruct-v0.2
@@ -437,7 +413,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Mistral-7B-v0.3:
     model_family: Mistral
     model_variant: 7B-v0.3
@@ -449,7 +424,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Mistral-7B-Instruct-v0.3:
     model_family: Mistral
     model_variant: 7B-Instruct-v0.3
@@ -461,7 +435,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Mistral-Large-Instruct-2407:
     model_family: Mistral
     model_variant: Large-Instruct-2407
@@ -475,7 +448,6 @@ models:
       --pipeline-parallel-size: 2
       --tensor-parallel-size: 4
       --max-model-len: 32768
-      --max-num-seqs: 256
   Mistral-Large-Instruct-2411:
     model_family: Mistral
     model_variant: Large-Instruct-2411
@@ -489,7 +461,6 @@ models:
       --pipeline-parallel-size: 2
       --tensor-parallel-size: 4
       --max-model-len: 32768
-      --max-num-seqs: 256
   Mixtral-8x7B-Instruct-v0.1:
     model_family: Mixtral
     model_variant: 8x7B-Instruct-v0.1
@@ -502,7 +473,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 32768
-      --max-num-seqs: 256
   Mixtral-8x22B-v0.1:
     model_family: Mixtral
     model_variant: 8x22B-v0.1
@@ -516,7 +486,6 @@ models:
       --pipeline-parallel-size: 2
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   Mixtral-8x22B-Instruct-v0.1:
     model_family: Mixtral
     model_variant: 8x22B-Instruct-v0.1
@@ -530,7 +499,6 @@ models:
       --pipeline-parallel-size: 2
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   Phi-3-medium-128k-instruct:
     model_family: Phi-3
     model_variant: medium-128k-instruct
@@ -543,7 +511,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 131072
-      --max-num-seqs: 256
   Phi-3-vision-128k-instruct:
     model_family: Phi-3-vision
     model_variant: 128k-instruct
@@ -556,20 +523,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 65536
-      --max-num-seqs: 256
-  Llama3-OpenBioLLM-70B:
-    model_family: Llama3-OpenBioLLM
-    model_variant: 70B
-    model_type: LLM
-    gpus_per_node: 4
-    num_nodes: 1
-    vocab_size: 128256
-    time: 08:00:00
-    resource_type: l40s
-    vllm_args:
-      --tensor-parallel-size: 4
-      --max-model-len: 8192
-      --max-num-seqs: 256
   Llama-3.1-Nemotron-70B-Instruct-HF:
     model_family: Llama-3.1-Nemotron
     model_variant: 70B-Instruct-HF
@@ -582,7 +535,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   Llama-3.2-1B:
     model_family: Llama-3.2
     model_variant: 1B
@@ -594,7 +546,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   Llama-3.2-1B-Instruct:
     model_family: Llama-3.2
     model_variant: 1B-Instruct
@@ -606,7 +557,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   Llama-3.2-3B:
     model_family: Llama-3.2
     model_variant: 3B
@@ -618,7 +568,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   Llama-3.2-3B-Instruct:
     model_family: Llama-3.2
     model_variant: 3B-Instruct
@@ -630,7 +579,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   Llama-3.2-11B-Vision:
     model_family: Llama-3.2
     model_variant: 11B-Vision
@@ -698,7 +646,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Qwen2.5-1.5B-Instruct:
     model_family: Qwen2.5
     model_variant: 1.5B-Instruct
@@ -710,7 +657,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Qwen2.5-3B-Instruct:
     model_family: Qwen2.5
     model_variant: 3B-Instruct
@@ -722,7 +668,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Qwen2.5-7B-Instruct:
     model_family: Qwen2.5
     model_variant: 7B-Instruct
@@ -734,7 +679,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Qwen2.5-14B-Instruct:
     model_family: Qwen2.5
     model_variant: 14B-Instruct
@@ -746,7 +690,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Qwen2.5-32B-Instruct:
     model_family: Qwen2.5
     model_variant: 32B-Instruct
@@ -759,7 +702,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 32768
-      --max-num-seqs: 256
   Qwen2.5-72B-Instruct:
     model_family: Qwen2.5
     model_variant: 72B-Instruct
@@ -772,7 +714,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 16384
-      --max-num-seqs: 256
   Qwen2.5-Math-1.5B-Instruct:
     model_family: Qwen2.5
     model_variant: Math-1.5B-Instruct
@@ -784,7 +725,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   Qwen2.5-Math-7B-Instruct:
     model_family: Qwen2.5
     model_variant: Math-7B-Instruct
@@ -796,7 +736,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   Qwen2.5-Math-72B-Instruct:
     model_family: Qwen2.5
     model_variant: Math-72B-Instruct
@@ -809,7 +748,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 4096
-      --max-num-seqs: 256
   Qwen2.5-Coder-7B-Instruct:
     model_family: Qwen2.5
     model_variant: Coder-7B-Instruct
@@ -821,7 +759,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   Qwen2.5-Math-RM-72B:
     model_family: Qwen2.5
     model_variant: Math-RM-72B
@@ -834,7 +771,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 4096
-      --max-num-seqs: 256
   Qwen2.5-Math-PRM-7B:
     model_family: Qwen2.5
     model_variant: Math-PRM-7B
@@ -846,7 +782,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   QwQ-32B:
     model_family: QwQ
     model_variant: 32B
@@ -859,7 +794,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 32768
-      --max-num-seqs: 256
   Pixtral-12B-2409:
     model_family: Pixtral
     model_variant: 12B-2409
@@ -871,7 +805,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 8192
-      --max-num-seqs: 256
   e5-mistral-7b-instruct:
     model_family: e5
     model_variant: mistral-7b-instruct
@@ -883,7 +816,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   bge-base-en-v1.5:
     model_family: bge
     model_variant: base-en-v1.5
@@ -895,7 +827,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 512
-      --max-num-seqs: 256
   all-MiniLM-L6-v2:
     model_family: all-MiniLM
     model_variant: L6-v2
@@ -907,7 +838,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 512
-      --max-num-seqs: 256
   Llama-3.3-70B-Instruct:
     model_family: Llama-3.3
     model_variant: 70B-Instruct
@@ -920,7 +850,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   InternVL2_5-26B:
     model_family: InternVL2_5
     model_variant: 26B
@@ -933,7 +862,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 32768
-      --max-num-seqs: 256
   InternVL2_5-38B:
     model_family: InternVL2_5
     model_variant: 38B
@@ -946,7 +874,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 32768
-      --max-num-seqs: 256
   Aya-Expanse-32B:
     model_family: Aya-Expanse
     model_variant: 32B
@@ -959,7 +886,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 8192
-      --max-num-seqs: 256
   DeepSeek-R1-Distill-Llama-70B:
     model_family: DeepSeek-R1
     model_variant: Distill-Llama-70B
@@ -972,7 +898,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 4
       --max-model-len: 65536
-      --max-num-seqs: 256
   DeepSeek-R1-Distill-Llama-8B:
     model_family: DeepSeek-R1
     model_variant: Distill-Llama-8B
@@ -984,7 +909,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   DeepSeek-R1-Distill-Qwen-32B:
     model_family: DeepSeek-R1
     model_variant: Distill-Qwen-32B
@@ -997,7 +921,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 65536
-      --max-num-seqs: 256
   DeepSeek-R1-Distill-Qwen-14B:
     model_family: DeepSeek-R1
     model_variant: Distill-Qwen-14B
@@ -1009,7 +932,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 65536
-      --max-num-seqs: 256
   DeepSeek-R1-Distill-Qwen-7B:
     model_family: DeepSeek-R1
     model_variant: Distill-Qwen-7B
@@ -1021,7 +943,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   DeepSeek-R1-Distill-Qwen-1.5B:
     model_family: DeepSeek-R1
     model_variant: Distill-Qwen-1.5B
@@ -1033,7 +954,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 131072
-      --max-num-seqs: 256
   Phi-3.5-vision-instruct:
     model_family: Phi-3.5-vision
     model_variant: instruct
@@ -1046,7 +966,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 65536
-      --max-num-seqs: 256
   InternVL2_5-8B:
     model_family: InternVL2_5
     model_variant: 8B
@@ -1058,7 +977,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 32768
-      --max-num-seqs: 256
   glm-4v-9b:
     model_family: glm-4v
     model_variant: 9b
@@ -1070,7 +988,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 8192
-      --max-num-seqs: 256
   Molmo-7B-D-0924:
     model_family: Molmo
     model_variant: 7B-D-0924
@@ -1082,7 +999,6 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
   deepseek-vl2:
     model_family: deepseek-vl2
     model_type: VLM
@@ -1094,7 +1010,6 @@ models:
     vllm_args:
       --tensor-parallel-size: 2
       --max-model-len: 4096
-      --max-num-seqs: 256
   deepseek-vl2-small:
     model_family: deepseek-vl2
     model_variant: small
@@ -1106,7 +1021,17 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 4096
-      --max-num-seqs: 256
+  Qwen3-8B:
+    model_family: Qwen3
+    model_variant: 8B
+    model_type: LLM
+    gpus_per_node: 1
+    num_nodes: 1
+    vocab_size: 151936
+    time: 08:00:00
+    resource_type: l40s
+    vllm_args:
+      --max-model-len: 40960
   Qwen3-14B:
     model_family: Qwen3
     model_variant: 14B
@@ -1118,4 +1043,28 @@ models:
     resource_type: l40s
     vllm_args:
       --max-model-len: 40960
-      --max-num-seqs: 256
+  Qwen3-32B:
+    model_family: Qwen3
+    model_variant: 32B
+    model_type: LLM
+    gpus_per_node: 2
+    num_nodes: 1
+    vocab_size: 151936
+    time: 08:00:00
+    resource_type: l40s
+    vllm_args:
+      --tensor-parallel-size: 2
+      --max-model-len: 40960
+  gpt-oss-120b:
+    model_family: gpt-oss
+    model_variant: 120b
+    model_type: LLM
+    gpus_per_node: 4
+    num_nodes: 2
+    vocab_size: 201088
+    time: 08:00:00
+    resource_type: l40s
+    vllm_args:
+      --tensor-parallel-size: 4
+      --pipeline-parallel-size: 2
+      --max-model-len: 40960

{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: vec-inf
-Version: 0.7.1
+Version: 0.7.2
 Summary: Efficient LLM inference on Slurm clusters using vLLM.
 Author-email: Marshall Wang <marshall.wang@vectorinstitute.ai>
 License-Expression: MIT
@@ -13,9 +13,10 @@ Requires-Dist: requests>=2.31.0
 Requires-Dist: rich>=13.7.0
 Provides-Extra: dev
 Requires-Dist: cupy-cuda12x==12.1.0; extra == 'dev'
-Requires-Dist: ray>=2.40.0; extra == 'dev'
+Requires-Dist: flashinfer-python>=0.4.0; extra == 'dev'
+Requires-Dist: ray[default]>=2.50.0; extra == 'dev'
+Requires-Dist: sglang>=0.5.0; extra == 'dev'
 Requires-Dist: torch>=2.7.0; extra == 'dev'
-Requires-Dist: vllm-nccl-cu12<2.19,>=2.18; extra == 'dev'
 Requires-Dist: vllm>=0.10.0; extra == 'dev'
 Requires-Dist: xgrammar>=0.1.11; extra == 'dev'
 Description-Content-Type: text/markdown

{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/RECORD RENAMED Viewed

@@ -2,26 +2,26 @@ vec_inf/README.md,sha256=WyvjbSs5Eh5fp8u66bgOaO3FQKP2U7m_HbLgqTHs_ng,1322
 vec_inf/__init__.py,sha256=bHwSIz9lebYuxIemni-lP0h3gwJHVbJnwExQKGJWw_Q,23
 vec_inf/find_port.sh,sha256=bGQ6LYSFVSsfDIGatrSg5YvddbZfaPL0R-Bjo4KYD6I,1088
 vec_inf/cli/__init__.py,sha256=5XIvGQCOnaGl73XMkwetjC-Ul3xuXGrWDXdYJ3aUzvU,27
-vec_inf/cli/_cli.py,sha256=xrYce8iP2Wo5dNflvUO2gIfkyjA4V_V8mpiaxnMDwkk,15813
-vec_inf/cli/_helper.py,sha256=Jr9NnMhGflkx3YEfYCN1rMHQgUzMAAwlSx_BLH92tVM,16511
+vec_inf/cli/_cli.py,sha256=0YfxtPT_Nq5gvIol9eWmw5yW9AT1ghf_E49R9pD7UG4,16213
+vec_inf/cli/_helper.py,sha256=0_onclvxxpDTp33ODYc19RbZ2aIhXuMTC9v19q8ZhIo,17473
 vec_inf/cli/_utils.py,sha256=23vSbmvNOWY1-W1aOAwYqNDkDDmx-5UVlCiXAtxUZ8A,1057
 vec_inf/cli/_vars.py,sha256=V6DrJs_BuUa4yNcbBSSnMwpcyXwEBsizy3D0ubIg2fA,777
 vec_inf/client/__init__.py,sha256=OLlUJ4kL1R-Kh-nXNbvKlAZ3mtHcnozHprVufkVCNWk,739
 vec_inf/client/_client_vars.py,sha256=1D-bX9dS0-pFImLvgWt2hUnwJiz-VaxuLb2HIfPML8I,2408
 vec_inf/client/_exceptions.py,sha256=94Nx_5k1SriJNXzbdnwyXFZolyMutydU08Gsikawzzo,749
-vec_inf/client/_helper.py,sha256=P8A9JHRMzxJRl0dgTuv9xfOluEV3BthUM1KzQlWkR7E,35752
-vec_inf/client/_slurm_script_generator.py,sha256=d2NowdKMQR1lsVI_hw9ObKC3uSk8YJr75ZYRMkvp0RA,13354
-vec_inf/client/_slurm_templates.py,sha256=TAH-wQV4gP2CCwxP3BmShebohtSmlMstlJT9QK6n4Dc,8277
+vec_inf/client/_helper.py,sha256=hb6m5TLwcGE0grCu5-UCUkWbByV-G5h8gA87Yzct6rk,37170
+vec_inf/client/_slurm_script_generator.py,sha256=L6tqn71kNJ2I0xYipFh_ZxIAG8znpXhTpUxTU8LJIa4,13988
+vec_inf/client/_slurm_templates.py,sha256=GxVNClkgggoJN2pT1AjK7CQCAErfKRMIs97Vlhxs9u8,9349
 vec_inf/client/_slurm_vars.py,sha256=sgP__XhpE1K7pvOzVFmotUXmINYPcOuFP-zGaePT5Iw,2910
-vec_inf/client/_utils.py,sha256=XamAz8-AJELgkXHrR082ptTsbHSiWI47SY6MlXA44rU,12593
-vec_inf/client/api.py,sha256=pkgNE37r7LzYBDjRGAKAh7rhOUMKHGwghJh6Hfb45TI,11681
+vec_inf/client/_utils.py,sha256=_ZBmic0XvJ4vpdIuXDi6KO5iL2rbhIpFQT01EWGItN4,14296
+vec_inf/client/api.py,sha256=lkVWCme-HmMJMqp8JbtjkBVL_MSPsCC_IBL9FBw3Um8,12011
 vec_inf/client/config.py,sha256=VU4h2iqL0rxYAqGw2HBF_l6QvvSDJy5M79IgX5G2PW4,5830
-vec_inf/client/models.py,sha256=qxLxsVoEhxNkuCmtABqs8In5erkwTZDK0wih7U2_U38,7296
+vec_inf/client/models.py,sha256=jGNPOj1uPPBV7xdGy3HFv2ZwpJOGCsU8qm7pE2Rnnes,7498
 vec_inf/config/README.md,sha256=TvZOqZyTUaAFr71hC7GVgg6QUw80AXREyq8wS4D-F30,528
 vec_inf/config/environment.yaml,sha256=oEDp85hUERJO9NNn4wYhcgunnmkln50GNHDzG_3isMw,678
-vec_inf/config/models.yaml,sha256=vzAOqEu6M_lXput83MAhNzj-aNGSBzjbC6LydOmNqxk,26248
-vec_inf-0.7.1.dist-info/METADATA,sha256=CJEnzc3VLXxJ_00I1ubtwNNZQjvafddxlJyoi_bSwpo,10047
-vec_inf-0.7.1.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-vec_inf-0.7.1.dist-info/entry_points.txt,sha256=uNRXjCuJSR2nveEqD3IeMznI9oVI9YLZh5a24cZg6B0,49
-vec_inf-0.7.1.dist-info/licenses/LICENSE,sha256=mq8zeqpvVSF1EsxmydeXcokt8XnEIfSofYn66S2-cJI,1073
-vec_inf-0.7.1.dist-info/RECORD,,
+vec_inf/config/models.yaml,sha256=PSDR29zI8xld32Vm6dhgCIRHPEkBhwQx7-d_uFlEAM8,24764
+vec_inf-0.7.2.dist-info/METADATA,sha256=ljs9hao8q4igLERrjGL5u1vZ_n7DMrr8XnBHzybPE2Y,10099
+vec_inf-0.7.2.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+vec_inf-0.7.2.dist-info/entry_points.txt,sha256=uNRXjCuJSR2nveEqD3IeMznI9oVI9YLZh5a24cZg6B0,49
+vec_inf-0.7.2.dist-info/licenses/LICENSE,sha256=mq8zeqpvVSF1EsxmydeXcokt8XnEIfSofYn66S2-cJI,1073
+vec_inf-0.7.2.dist-info/RECORD,,

{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/WHEEL RENAMED Viewed

File without changes

{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{vec_inf-0.7.1.dist-info → vec_inf-0.7.2.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

vec-inf 0.7.1__py3-none-any.whl → 0.7.2__py3-none-any.whl

vec-inf 0.7.1py3-none-any.whl → 0.7.2py3-none-any.whl