PyPI - triton-model-analyzer - Versions diffs - 1.48.0__py3-none-any.whl - Mend

triton-model-analyzer 1.48.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (204) hide show

model_analyzer/__init__.py +15 -0
model_analyzer/analyzer.py +448 -0
model_analyzer/cli/__init__.py +15 -0
model_analyzer/cli/cli.py +193 -0
model_analyzer/config/__init__.py +15 -0
model_analyzer/config/generate/__init__.py +15 -0
model_analyzer/config/generate/automatic_model_config_generator.py +164 -0
model_analyzer/config/generate/base_model_config_generator.py +352 -0
model_analyzer/config/generate/brute_plus_binary_parameter_search_run_config_generator.py +164 -0
model_analyzer/config/generate/brute_run_config_generator.py +154 -0
model_analyzer/config/generate/concurrency_sweeper.py +75 -0
model_analyzer/config/generate/config_generator_interface.py +52 -0
model_analyzer/config/generate/coordinate.py +143 -0
model_analyzer/config/generate/coordinate_data.py +86 -0
model_analyzer/config/generate/generator_utils.py +116 -0
model_analyzer/config/generate/manual_model_config_generator.py +187 -0
model_analyzer/config/generate/model_config_generator_factory.py +92 -0
model_analyzer/config/generate/model_profile_spec.py +74 -0
model_analyzer/config/generate/model_run_config_generator.py +154 -0
model_analyzer/config/generate/model_variant_name_manager.py +150 -0
model_analyzer/config/generate/neighborhood.py +536 -0
model_analyzer/config/generate/optuna_plus_concurrency_sweep_run_config_generator.py +141 -0
model_analyzer/config/generate/optuna_run_config_generator.py +838 -0
model_analyzer/config/generate/perf_analyzer_config_generator.py +312 -0
model_analyzer/config/generate/quick_plus_concurrency_sweep_run_config_generator.py +130 -0
model_analyzer/config/generate/quick_run_config_generator.py +753 -0
model_analyzer/config/generate/run_config_generator_factory.py +329 -0
model_analyzer/config/generate/search_config.py +112 -0
model_analyzer/config/generate/search_dimension.py +73 -0
model_analyzer/config/generate/search_dimensions.py +85 -0
model_analyzer/config/generate/search_parameter.py +49 -0
model_analyzer/config/generate/search_parameters.py +388 -0
model_analyzer/config/input/__init__.py +15 -0
model_analyzer/config/input/config_command.py +483 -0
model_analyzer/config/input/config_command_profile.py +1747 -0
model_analyzer/config/input/config_command_report.py +267 -0
model_analyzer/config/input/config_defaults.py +236 -0
model_analyzer/config/input/config_enum.py +83 -0
model_analyzer/config/input/config_field.py +216 -0
model_analyzer/config/input/config_list_generic.py +112 -0
model_analyzer/config/input/config_list_numeric.py +151 -0
model_analyzer/config/input/config_list_string.py +111 -0
model_analyzer/config/input/config_none.py +71 -0
model_analyzer/config/input/config_object.py +129 -0
model_analyzer/config/input/config_primitive.py +81 -0
model_analyzer/config/input/config_status.py +75 -0
model_analyzer/config/input/config_sweep.py +83 -0
model_analyzer/config/input/config_union.py +113 -0
model_analyzer/config/input/config_utils.py +128 -0
model_analyzer/config/input/config_value.py +243 -0
model_analyzer/config/input/objects/__init__.py +15 -0
model_analyzer/config/input/objects/config_model_profile_spec.py +325 -0
model_analyzer/config/input/objects/config_model_report_spec.py +173 -0
model_analyzer/config/input/objects/config_plot.py +198 -0
model_analyzer/config/input/objects/config_protobuf_utils.py +101 -0
model_analyzer/config/input/yaml_config_validator.py +82 -0
model_analyzer/config/run/__init__.py +15 -0
model_analyzer/config/run/model_run_config.py +313 -0
model_analyzer/config/run/run_config.py +168 -0
model_analyzer/constants.py +76 -0
model_analyzer/device/__init__.py +15 -0
model_analyzer/device/device.py +24 -0
model_analyzer/device/gpu_device.py +87 -0
model_analyzer/device/gpu_device_factory.py +248 -0
model_analyzer/entrypoint.py +307 -0
model_analyzer/log_formatter.py +65 -0
model_analyzer/model_analyzer_exceptions.py +24 -0
model_analyzer/model_manager.py +255 -0
model_analyzer/monitor/__init__.py +15 -0
model_analyzer/monitor/cpu_monitor.py +69 -0
model_analyzer/monitor/dcgm/DcgmDiag.py +191 -0
model_analyzer/monitor/dcgm/DcgmFieldGroup.py +83 -0
model_analyzer/monitor/dcgm/DcgmGroup.py +815 -0
model_analyzer/monitor/dcgm/DcgmHandle.py +141 -0
model_analyzer/monitor/dcgm/DcgmJsonReader.py +69 -0
model_analyzer/monitor/dcgm/DcgmReader.py +623 -0
model_analyzer/monitor/dcgm/DcgmStatus.py +57 -0
model_analyzer/monitor/dcgm/DcgmSystem.py +412 -0
model_analyzer/monitor/dcgm/__init__.py +15 -0
model_analyzer/monitor/dcgm/common/__init__.py +13 -0
model_analyzer/monitor/dcgm/common/dcgm_client_cli_parser.py +194 -0
model_analyzer/monitor/dcgm/common/dcgm_client_main.py +86 -0
model_analyzer/monitor/dcgm/dcgm_agent.py +887 -0
model_analyzer/monitor/dcgm/dcgm_collectd_plugin.py +369 -0
model_analyzer/monitor/dcgm/dcgm_errors.py +395 -0
model_analyzer/monitor/dcgm/dcgm_field_helpers.py +546 -0
model_analyzer/monitor/dcgm/dcgm_fields.py +815 -0
model_analyzer/monitor/dcgm/dcgm_fields_collectd.py +671 -0
model_analyzer/monitor/dcgm/dcgm_fields_internal.py +29 -0
model_analyzer/monitor/dcgm/dcgm_fluentd.py +45 -0
model_analyzer/monitor/dcgm/dcgm_monitor.py +138 -0
model_analyzer/monitor/dcgm/dcgm_prometheus.py +326 -0
model_analyzer/monitor/dcgm/dcgm_structs.py +2357 -0
model_analyzer/monitor/dcgm/dcgm_telegraf.py +65 -0
model_analyzer/monitor/dcgm/dcgm_value.py +151 -0
model_analyzer/monitor/dcgm/dcgmvalue.py +155 -0
model_analyzer/monitor/dcgm/denylist_recommendations.py +573 -0
model_analyzer/monitor/dcgm/pydcgm.py +47 -0
model_analyzer/monitor/monitor.py +143 -0
model_analyzer/monitor/remote_monitor.py +137 -0
model_analyzer/output/__init__.py +15 -0
model_analyzer/output/file_writer.py +63 -0
model_analyzer/output/output_writer.py +42 -0
model_analyzer/perf_analyzer/__init__.py +15 -0
model_analyzer/perf_analyzer/genai_perf_config.py +206 -0
model_analyzer/perf_analyzer/perf_analyzer.py +882 -0
model_analyzer/perf_analyzer/perf_config.py +479 -0
model_analyzer/plots/__init__.py +15 -0
model_analyzer/plots/detailed_plot.py +266 -0
model_analyzer/plots/plot_manager.py +224 -0
model_analyzer/plots/simple_plot.py +213 -0
model_analyzer/record/__init__.py +15 -0
model_analyzer/record/gpu_record.py +68 -0
model_analyzer/record/metrics_manager.py +887 -0
model_analyzer/record/record.py +280 -0
model_analyzer/record/record_aggregator.py +256 -0
model_analyzer/record/types/__init__.py +15 -0
model_analyzer/record/types/cpu_available_ram.py +93 -0
model_analyzer/record/types/cpu_used_ram.py +93 -0
model_analyzer/record/types/gpu_free_memory.py +96 -0
model_analyzer/record/types/gpu_power_usage.py +107 -0
model_analyzer/record/types/gpu_total_memory.py +96 -0
model_analyzer/record/types/gpu_used_memory.py +96 -0
model_analyzer/record/types/gpu_utilization.py +108 -0
model_analyzer/record/types/inter_token_latency_avg.py +60 -0
model_analyzer/record/types/inter_token_latency_base.py +74 -0
model_analyzer/record/types/inter_token_latency_max.py +60 -0
model_analyzer/record/types/inter_token_latency_min.py +60 -0
model_analyzer/record/types/inter_token_latency_p25.py +60 -0
model_analyzer/record/types/inter_token_latency_p50.py +60 -0
model_analyzer/record/types/inter_token_latency_p75.py +60 -0
model_analyzer/record/types/inter_token_latency_p90.py +60 -0
model_analyzer/record/types/inter_token_latency_p95.py +60 -0
model_analyzer/record/types/inter_token_latency_p99.py +60 -0
model_analyzer/record/types/output_token_throughput.py +105 -0
model_analyzer/record/types/perf_client_response_wait.py +97 -0
model_analyzer/record/types/perf_client_send_recv.py +97 -0
model_analyzer/record/types/perf_latency.py +111 -0
model_analyzer/record/types/perf_latency_avg.py +60 -0
model_analyzer/record/types/perf_latency_base.py +74 -0
model_analyzer/record/types/perf_latency_p90.py +60 -0
model_analyzer/record/types/perf_latency_p95.py +60 -0
model_analyzer/record/types/perf_latency_p99.py +60 -0
model_analyzer/record/types/perf_server_compute_infer.py +97 -0
model_analyzer/record/types/perf_server_compute_input.py +97 -0
model_analyzer/record/types/perf_server_compute_output.py +97 -0
model_analyzer/record/types/perf_server_queue.py +97 -0
model_analyzer/record/types/perf_throughput.py +105 -0
model_analyzer/record/types/time_to_first_token_avg.py +60 -0
model_analyzer/record/types/time_to_first_token_base.py +74 -0
model_analyzer/record/types/time_to_first_token_max.py +60 -0
model_analyzer/record/types/time_to_first_token_min.py +60 -0
model_analyzer/record/types/time_to_first_token_p25.py +60 -0
model_analyzer/record/types/time_to_first_token_p50.py +60 -0
model_analyzer/record/types/time_to_first_token_p75.py +60 -0
model_analyzer/record/types/time_to_first_token_p90.py +60 -0
model_analyzer/record/types/time_to_first_token_p95.py +60 -0
model_analyzer/record/types/time_to_first_token_p99.py +60 -0
model_analyzer/reports/__init__.py +15 -0
model_analyzer/reports/html_report.py +195 -0
model_analyzer/reports/pdf_report.py +50 -0
model_analyzer/reports/report.py +86 -0
model_analyzer/reports/report_factory.py +62 -0
model_analyzer/reports/report_manager.py +1376 -0
model_analyzer/reports/report_utils.py +42 -0
model_analyzer/result/__init__.py +15 -0
model_analyzer/result/constraint_manager.py +150 -0
model_analyzer/result/model_config_measurement.py +354 -0
model_analyzer/result/model_constraints.py +105 -0
model_analyzer/result/parameter_search.py +246 -0
model_analyzer/result/result_manager.py +430 -0
model_analyzer/result/result_statistics.py +159 -0
model_analyzer/result/result_table.py +217 -0
model_analyzer/result/result_table_manager.py +646 -0
model_analyzer/result/result_utils.py +42 -0
model_analyzer/result/results.py +277 -0
model_analyzer/result/run_config_measurement.py +658 -0
model_analyzer/result/run_config_result.py +210 -0
model_analyzer/result/run_config_result_comparator.py +110 -0
model_analyzer/result/sorted_results.py +151 -0
model_analyzer/state/__init__.py +15 -0
model_analyzer/state/analyzer_state.py +76 -0
model_analyzer/state/analyzer_state_manager.py +215 -0
model_analyzer/triton/__init__.py +15 -0
model_analyzer/triton/client/__init__.py +15 -0
model_analyzer/triton/client/client.py +234 -0
model_analyzer/triton/client/client_factory.py +57 -0
model_analyzer/triton/client/grpc_client.py +104 -0
model_analyzer/triton/client/http_client.py +107 -0
model_analyzer/triton/model/__init__.py +15 -0
model_analyzer/triton/model/model_config.py +556 -0
model_analyzer/triton/model/model_config_variant.py +29 -0
model_analyzer/triton/server/__init__.py +15 -0
model_analyzer/triton/server/server.py +76 -0
model_analyzer/triton/server/server_config.py +269 -0
model_analyzer/triton/server/server_docker.py +229 -0
model_analyzer/triton/server/server_factory.py +306 -0
model_analyzer/triton/server/server_local.py +158 -0
triton_model_analyzer-1.48.0.dist-info/METADATA +52 -0
triton_model_analyzer-1.48.0.dist-info/RECORD +204 -0
triton_model_analyzer-1.48.0.dist-info/WHEEL +5 -0
triton_model_analyzer-1.48.0.dist-info/entry_points.txt +2 -0
triton_model_analyzer-1.48.0.dist-info/licenses/LICENSE +67 -0
triton_model_analyzer-1.48.0.dist-info/top_level.txt +1 -0

model_analyzer/__init__.py ADDED Viewed

@@ -0,0 +1,15 @@
+#!/usr/bin/env python3
+# Copyright 2020-2023, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.

model_analyzer/analyzer.py ADDED Viewed

@@ -0,0 +1,448 @@
+#!/usr/bin/env python3
+# Copyright 2021-2023, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import logging
+import sys
+from copy import deepcopy
+from typing import Dict, List, Optional, Union
+from model_analyzer.cli.cli import CLI
+from model_analyzer.config.generate.base_model_config_generator import (
+    BaseModelConfigGenerator,
+)
+from model_analyzer.config.generate.model_profile_spec import ModelProfileSpec
+from model_analyzer.config.generate.search_parameters import SearchParameters
+from model_analyzer.constants import LOGGER_NAME, PA_ERROR_LOG_FILENAME
+from model_analyzer.state.analyzer_state_manager import AnalyzerStateManager
+from model_analyzer.triton.server.server import TritonServer
+from .config.input.config_command_profile import ConfigCommandProfile
+from .config.input.config_command_report import ConfigCommandReport
+from .config.input.config_defaults import DEFAULT_CHECKPOINT_DIRECTORY
+from .device.gpu_device import GPUDevice
+from .model_analyzer_exceptions import TritonModelAnalyzerException
+from .model_manager import ModelManager
+from .record.metrics_manager import MetricsManager
+from .reports.report_manager import ReportManager
+from .result.constraint_manager import ConstraintManager
+from .result.result_manager import ResultManager
+from .result.result_table_manager import ResultTableManager
+from .triton.client.client import TritonClient
+logger = logging.getLogger(LOGGER_NAME)
+class Analyzer:
+    """
+    A class responsible for coordinating the various components of the
+    model_analyzer. Configured with metrics to monitor, exposes profiling and
+    result writing methods.
+    """
+    def __init__(
+        self,
+        config: Union[ConfigCommandProfile, ConfigCommandReport],
+        server: TritonServer,
+        state_manager: AnalyzerStateManager,
+        checkpoint_required: bool,
+    ):
+        """
+        Parameters
+        ----------
+        config : ConfigCommandProfile or ConfigCommandReport
+            Model Analyzer config
+        server : TritonServer
+            Server handle
+        state_manager: AnalyzerStateManager
+            The object that maintains Model Analyzer State
+        checkpoint_required : bool
+            If true, an existing checkpoint is required to run MA
+        """
+        self._config = config
+        self._server = server
+        self._state_manager = state_manager
+        state_manager.load_checkpoint(checkpoint_required)
+        self._constraint_manager = ConstraintManager(self._config)
+        self._result_manager = ResultManager(
+            config=config,
+            state_manager=self._state_manager,
+            constraint_manager=self._constraint_manager,
+        )
+        self._search_parameters: Dict[str, SearchParameters] = {}
+        self._composing_search_parameters: Dict[str, SearchParameters] = {}
+    def profile(
+        self, client: TritonClient, gpus: List[GPUDevice], mode: str, verbose: bool
+    ) -> None:
+        """
+        Subcommand: PROFILE
+        Creates a RunConfigGenerator to generate RunConfigs, and then
+        profiles each RunConfig on Perf Analyzer and gathers the resulting
+        measurements.
+        Each RunConfig contains one or more (in the case of concurrent multi-model)
+        ModelRunConfigs, each of which contain a ModelConfig and a PerfAnalyzerConfig
+        Parameters
+        ----------
+        client : TritonClient
+            Instance used to load/unload models
+        gpus: List of GPUDevices
+            The gpus being used to profile
+        Raises
+        ------
+        TritonModelAnalyzerException
+        """
+        if not isinstance(self._config, ConfigCommandProfile):
+            raise TritonModelAnalyzerException(
+                f"Expected config of type {ConfigCommandProfile},"
+                " got {type(self._config)}."
+            )
+        self._create_metrics_manager(client, gpus)
+        self._create_model_manager(client, gpus)
+        self._populate_search_parameters(client, gpus)
+        self._populate_composing_search_parameters(client, gpus)
+        if self._config.triton_launch_mode == "remote":
+            self._warn_if_other_models_loaded_on_remote_server(client)
+        if self._config.model_repository or self._config.triton_launch_mode == "remote":
+            self._get_server_only_metrics(client, gpus)
+            self._profile_models()
+            # The message is in interrupt_handler(), so we can just exit
+            if self._state_manager.exiting():
+                sys.exit(1)
+            logger.info(self._get_profile_complete_string())
+            logger.info("")
+        elif self._state_manager.starting_fresh_run():
+            raise TritonModelAnalyzerException(
+                "No model repository specified and no checkpoint found. Please either specify a model repository (-m) or load a checkpoint (--checkpoint-directory)."
+            )
+        if not self._config.skip_summary_reports:
+            self._create_summary_tables(verbose)
+            self._create_summary_reports(mode)
+            self._create_detailed_reports(mode)
+        self._check_for_perf_analyzer_errors()
+    def report(self, mode: str) -> None:
+        """
+        Subcommand: REPORT
+        Generates detailed information on
+        one or more model configs
+        Parameters
+        ----------
+        mode : str
+            Global mode that the analyzer is running on
+        """
+        if not isinstance(self._config, ConfigCommandReport):
+            raise TritonModelAnalyzerException(
+                f"Expected config of type {ConfigCommandReport}, got {type(self._config)}."
+            )
+        gpu_info = self._state_manager.get_state_variable("MetricsManager.gpus")
+        if not gpu_info:
+            gpu_info = {}
+        self._report_manager = ReportManager(
+            mode=mode,
+            config=self._config,
+            result_manager=self._result_manager,
+            gpu_info=gpu_info,
+            constraint_manager=self._constraint_manager,
+        )
+        if self._multiple_models_in_report_model_config():
+            raise TritonModelAnalyzerException(
+                "Model Analyzer does not support detailed reporting for multi-model runs.\n"
+                "If you are trying to generate detailed reports for different sequentially profiled models you must run "
+                "the report command for each model separately."
+            )
+        self._report_manager.create_detailed_reports()
+        self._report_manager.export_detailed_reports()
+    def _create_metrics_manager(self, client, gpus):
+        self._metrics_manager = MetricsManager(
+            config=self._config,
+            client=client,
+            server=self._server,
+            gpus=gpus,
+            result_manager=self._result_manager,
+            state_manager=self._state_manager,
+        )
+    def _create_model_manager(self, client, gpus):
+        self._model_manager = ModelManager(
+            config=self._config,
+            gpus=gpus,
+            client=client,
+            server=self._server,
+            result_manager=self._result_manager,
+            metrics_manager=self._metrics_manager,
+            state_manager=self._state_manager,
+            constraint_manager=self._constraint_manager,
+            search_parameters=self._search_parameters,
+            composing_search_parameters=self._composing_search_parameters,
+        )
+    def _get_server_only_metrics(self, client, gpus):
+        if self._config.triton_launch_mode != "c_api":
+            if not self._state_manager._starting_fresh_run:
+                if self._config.dcgm_disable:
+                    logger.info(
+                        "DCGM is disabled - cannot verify that GPU devices match checkpoint"
+                    )
+                elif self._do_checkpoint_gpus_match(gpus):
+                    logger.info(
+                        "GPU devices match checkpoint - skipping server metric acquisition"
+                    )
+                    return
+                elif gpus is not None:
+                    raise TritonModelAnalyzerException(
+                        "GPU devices do not match checkpoint - Remove checkpoint file and rerun profile"
+                    )
+            logger.info("Profiling server only metrics...")
+            self._server.start()
+            client.wait_for_server_ready(
+                num_retries=self._config.client_max_retries,
+                log_file=self._server.log_file(),
+            )
+            self._metrics_manager.profile_server()
+            self._server.stop()
+    def _profile_models(self):
+        models = self._config.profile_models
+        if self._should_profile_multiple_models_concurrently():
+            # Profile all models concurrently
+            try:
+                self._model_manager.run_models(models=models)
+            finally:
+                self._state_manager.save_checkpoint()
+        else:
+            # Profile each model, save state after each
+            for model in models:
+                if self._state_manager.exiting():
+                    break
+                try:
+                    self._model_manager.run_models(models=[model])
+                finally:
+                    self._state_manager.save_checkpoint()
+    def _create_summary_tables(self, verbose: bool) -> None:
+        self._result_table_manager = ResultTableManager(
+            self._config, self._result_manager
+        )
+        self._result_table_manager.create_tables()
+        self._result_table_manager.tabulate_results()
+        self._result_table_manager.export_results()
+        if verbose:
+            self._result_table_manager.write_results()
+    def _create_summary_reports(self, mode: str) -> None:
+        gpu_info = self._state_manager.get_state_variable("MetricsManager.gpus")
+        if not gpu_info:
+            gpu_info = {}
+        self._report_manager = ReportManager(
+            mode=mode,
+            config=self._config,
+            gpu_info=gpu_info,
+            result_manager=self._result_manager,
+            constraint_manager=self._constraint_manager,
+        )
+        self._report_manager.create_summaries()
+        self._report_manager.export_summaries()
+    def _should_profile_multiple_models_concurrently(self):
+        return (
+            self._config.run_config_profile_models_concurrently_enable
+            and len(self._config.profile_models) > 1
+        )
+    def _get_profile_complete_string(self):
+        profiled_model_list = self._state_manager.get_state_variable(
+            "ResultManager.results"
+        ).get_list_of_models()
+        num_profiled_configs = self._get_num_profiled_configs()
+        return (
+            f"Profile complete. Profiled {num_profiled_configs} "
+            f"configurations for models: {profiled_model_list}"
+        )
+    def _get_num_profiled_configs(self):
+        return sum(
+            [
+                len(x)
+                for x in self._state_manager.get_state_variable(
+                    "ResultManager.results"
+                ).get_list_of_model_config_measurement_tuples()
+            ]
+        )
+    def _get_report_command_help_string(self, model_name: str) -> str:
+        top_n_model_config_names = self._get_top_n_model_config_names(
+            n=self._config.num_configs_per_model, model_name=model_name
+        )
+        return (
+            f"To generate detailed reports for the "
+            f"{len(top_n_model_config_names)} best {model_name} configurations, run "
+            f"`{self._get_report_command_string(top_n_model_config_names)}`"
+        )
+    def _run_report_command(self, model_name: str, mode: str) -> None:
+        top_n_model_config_names = self._get_top_n_model_config_names(
+            n=self._config.num_configs_per_model, model_name=model_name
+        )
+        top_n_string = ",".join(top_n_model_config_names)
+        logger.info(
+            f"Generating detailed reports for the best configurations {top_n_string}:"
+        )
+        # [1:] removes 'model-analyzer' from the args
+        args = self._get_report_command_string(top_n_model_config_names).split(" ")[1:]
+        original_profile_config = deepcopy(self._config)
+        self._config = self._create_report_config(args)
+        self.report(mode)
+        self._config = original_profile_config
+    def _get_report_command_string(self, top_n_model_config_names: List[str]) -> str:
+        report_command_string = (
+            f"model-analyzer report "
+            f"--report-model-configs "
+            f'{",".join(top_n_model_config_names)}'
+        )
+        if self._config.export_path is not None:
+            report_command_string += f" --export-path " f"{self._config.export_path}"
+        if self._config.config_file is not None:
+            report_command_string += f" --config-file " f"{self._config.config_file}"
+        if self._config.checkpoint_directory != DEFAULT_CHECKPOINT_DIRECTORY:
+            report_command_string += (
+                f" --checkpoint-directory " f"{self._config.checkpoint_directory}"
+            )
+        return report_command_string
+    def _get_top_n_model_config_names(
+        self, n: int = -1, model_name: Optional[str] = None
+    ) -> List[str]:
+        return [
+            x.run_config().model_variants_name()
+            for x in self._result_manager.top_n_results(n=n, model_name=model_name)
+        ]
+    def _do_checkpoint_gpus_match(self, gpus: dict) -> bool:
+        ckpt_data = self._result_manager.get_server_only_data()
+        ckpt_uuids = [ckpt_uuid for ckpt_uuid in ckpt_data.keys()]
+        gpu_uuids = [gpu._device_uuid for gpu in gpus]
+        return sorted(ckpt_uuids) == sorted(gpu_uuids)
+    def _multiple_models_in_report_model_config(self) -> bool:
+        model_config_names = [
+            report_model_config.model_config_name()
+            for report_model_config in self._config.report_model_configs
+        ]
+        model_names = [
+            BaseModelConfigGenerator.extract_model_name_from_variant_name(
+                model_config_name
+            )
+            for model_config_name in model_config_names
+        ]
+        return len(set(model_names)) > 1
+    def _check_for_perf_analyzer_errors(self) -> None:
+        if self._metrics_manager.encountered_perf_analyzer_error():
+            logger.warning(
+                f"Perf Analyzer encountered an error when profiling one or more configurations. "
+                f"See {self._config.export_path}/{PA_ERROR_LOG_FILENAME} for further details.\n"
+            )
+    def _create_detailed_reports(self, mode: str) -> None:
+        # TODO-TMA-650: Detailed reporting not supported for multi-model
+        if not self._config.run_config_profile_models_concurrently_enable:
+            for model in self._config.profile_models:
+                if not self._config.skip_detailed_reports:
+                    self._run_report_command(model.model_name(), mode)
+                else:
+                    logger.info(
+                        self._get_report_command_help_string(model.model_name())
+                    )
+    def _create_report_config(self, args: list) -> ConfigCommandReport:
+        config = ConfigCommandReport()
+        cli = CLI()
+        cli.add_subcommand(cmd="report", help="", config=config)
+        cli.parse(args)
+        return config
+    def _warn_if_other_models_loaded_on_remote_server(self, client):
+        repository_index = client.get_model_repository_index()
+        profile_model_names = [pm.model_name() for pm in self._config.profile_models]
+        model_names_loaded_on_server = []
+        for repository_item in repository_index:
+            if client.is_model_ready(repository_item["name"]):
+                model_names_loaded_on_server.append(repository_item["name"])
+        for model_name in model_names_loaded_on_server:
+            if model_name not in profile_model_names:
+                logger.warning(
+                    f"A model not being profiled ({model_name}) is loaded on the remote Tritonserver. "
+                    "This could impact the profile results."
+                )
+    def _populate_search_parameters(self, client, gpus):
+        for model in self._config.profile_models:
+            model_profile_spec = ModelProfileSpec(model, self._config, client, gpus)
+            self._search_parameters[model.model_name()] = SearchParameters(
+                config=self._config,
+                model=model_profile_spec,
+                is_bls_model=bool(self._config.bls_composing_models),
+                is_ensemble_model=model_profile_spec.is_ensemble(),
+            )
+    def _populate_composing_search_parameters(self, client, gpus):
+        for model in self._config.bls_composing_models:
+            model_profile_spec = ModelProfileSpec(model, self._config, client, gpus)
+            self._composing_search_parameters[model.model_name()] = SearchParameters(
+                config=self._config,
+                model=model_profile_spec,
+                is_composing_model=True,
+            )

model_analyzer/cli/__init__.py ADDED Viewed

@@ -0,0 +1,15 @@
+#!/usr/bin/env python3
+# Copyright 2020-2023, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.

model_analyzer/cli/cli.py ADDED Viewed

@@ -0,0 +1,193 @@
+#!/usr/bin/env python3
+# Copyright 2020-2023, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+import logging
+import sys
+from argparse import SUPPRESS, ArgumentParser, Namespace
+from typing import List, Optional, Tuple, Union
+import importlib_metadata
+from model_analyzer.config.input.config_command_profile import ConfigCommandProfile
+from model_analyzer.config.input.config_command_report import ConfigCommandReport
+from model_analyzer.constants import LOGGER_NAME, PACKAGE_NAME
+from model_analyzer.model_analyzer_exceptions import TritonModelAnalyzerException
+logger = logging.getLogger(LOGGER_NAME)
+class CLI:
+    """
+    CLI class to parse the command line arguments
+    """
+    def __init__(self):
+        self._parser = ArgumentParser()
+        self._add_global_options()
+        self._subparsers = self._parser.add_subparsers(
+            help="Subcommands under Model Analyzer", dest="subcommand"
+        )
+        # Store subcommands, and their configs
+        self._subcommand_configs = {}
+    def _add_global_options(self):
+        """
+        Adds the Model Analyzer's global options
+        to the parser
+        """
+        self._parser.add_argument(
+            "-m",
+            "--mode",
+            type=str,
+            default="online",
+            choices=["online", "offline"],
+            help="Choose a preset configuration mode.",
+        )
+        self._parser.add_argument(
+            "--version", action="store_true", help="Show the Model Analyzer version."
+        )
+    def _add_global_options_to_subparser(self, subparser):
+        """
+        Adds global options to a subparser so they can be
+        used after the subcommand (e.g., 'model-analyzer profile -v')
+        """
+        subparser.add_argument(
+            "-q",
+            "--quiet",
+            action="store_true",
+            help="Suppress all output except for error messages.",
+        )
+        subparser.add_argument(
+            "-v",
+            "--verbose",
+            action="store_true",
+            help="Show detailed logs, messages and status.",
+        )
+    def add_subcommand(self, cmd, help, config=None):
+        """
+        Adds a subparser to the main parser representing
+        a command. Also adds the passed in config to
+        the subcommands dict to set its values upon parse.
+        Parameters
+        ----------
+        cmd : str
+            subcommand name
+        help: str
+            help string or description for the subcommand
+        config: Config
+            The config containing the arguments that are required
+            to be parsed for this subcommand.
+        """
+        subparser = self._subparsers.add_parser(cmd, help=help)
+        self._add_global_options_to_subparser(subparser)
+        if config:
+            self._add_config_arguments(subparser, config)
+            self._subcommand_configs[cmd] = config
+    def _add_config_arguments(self, subparser, config):
+        """
+        Add the CLI arguments from the config
+        Parameters
+        ----------
+        config : Config
+            Model Analyzer config object.
+        """
+        # configs is dictionary of config_fields objects from config_command_*
+        configs = config.get_config()
+        for config_field in configs.values():
+            parser_args = config_field.parser_args()
+            # Skip the non-CLI flags
+            if config_field.flags() is None:
+                continue
+            # 'store_true' and 'store_false' does not
+            # allow 'type' or 'choices' parameters
+            if "action" in parser_args and (
+                parser_args["action"] == "store_true"
+                or parser_args["action"] == "store_false"
+            ):
+                subparser.add_argument(
+                    *config_field.flags(),
+                    default=SUPPRESS,
+                    help=config_field.description(),
+                    **config_field.parser_args(),
+                )
+            else:
+                subparser.add_argument(
+                    *config_field.flags(),
+                    default=SUPPRESS,
+                    choices=config_field.choices(),
+                    help=config_field.description(),
+                    type=config_field.cli_type(),
+                    **config_field.parser_args(),
+                )
+    def _show_model_analyzer_version(self):
+        """
+        Displays the current version of Model Analyzer and exits.
+        """
+        try:
+            version = importlib_metadata.version(PACKAGE_NAME)
+            print(version)
+            sys.exit(0)
+        except importlib_metadata.PackageNotFoundError:
+            raise TritonModelAnalyzerException(f"Version information is not available")
+    def parse(
+        self, input_args: Optional[List] = None
+    ) -> Tuple[Namespace, Union[ConfigCommandProfile, ConfigCommandReport]]:
+        """
+        Parse CLI options using ArgumentParsers
+        and set config values.
+        Parameters
+        ----------
+        input_args: List
+            The list of arguments to be parsed
+            (if None then command line arguments will be used)
+        Returns
+        -------
+        args : Namespace
+            Object that contains the parse CLI commands
+            Used for the global options
+        config: CommandConfig
+            The config corresponding to the command being run,
+            already filled in with values from CLI or YAML.
+        """
+        args = self._parser.parse_args(input_args)
+        if args.version:
+            self._show_model_analyzer_version()
+        if args.subcommand is None:
+            self._parser.print_help()
+            self._parser.exit()
+        config = self._subcommand_configs[args.subcommand]
+        config.set_config_values(args)
+        return args, config

model_analyzer/config/__init__.py ADDED Viewed

@@ -0,0 +1,15 @@
+#!/usr/bin/env python3
+# Copyright 2021-2023, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.