llama-stack 0.3.3__tar.gz → 0.3.5__tar.gz
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- {llama_stack-0.3.3/llama_stack.egg-info → llama_stack-0.3.5}/PKG-INFO +4 -80
- {llama_stack-0.3.3 → llama_stack-0.3.5}/README.md +0 -77
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/resolver.py +3 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routers/inference.py +34 -1
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/agents.py +1 -1
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/tool_runtime.py +1 -1
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/watsonx/watsonx.py +2 -6
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/inference_store.py +5 -13
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/responses/responses_store.py +2 -18
- {llama_stack-0.3.3 → llama_stack-0.3.5/llama_stack.egg-info}/PKG-INFO +4 -80
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack.egg-info/requires.txt +3 -2
- {llama_stack-0.3.3 → llama_stack-0.3.5}/pyproject.toml +4 -3
- {llama_stack-0.3.3 → llama_stack-0.3.5}/LICENSE +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/MANIFEST.in +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/agents/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/agents/agents.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/agents/openai_responses.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/batches/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/batches/batches.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/benchmarks/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/benchmarks/benchmarks.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/common/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/common/content_types.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/common/errors.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/common/job_types.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/common/responses.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/common/training_types.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/common/type_system.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/conversations/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/conversations/conversations.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/datasetio/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/datasetio/datasetio.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/datasets/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/datasets/datasets.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/datatypes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/eval/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/eval/eval.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/files/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/files/files.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/inference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/inference/event_logger.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/inference/inference.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/inspect/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/inspect/inspect.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/models/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/models/models.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/post_training/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/post_training/post_training.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/prompts/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/prompts/prompts.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/providers/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/providers/providers.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/resource.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/safety/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/safety/safety.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/scoring/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/scoring/scoring.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/scoring_functions/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/scoring_functions/scoring_functions.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/shields/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/shields/shields.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/synthetic_data_generation/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/synthetic_data_generation/synthetic_data_generation.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/telemetry/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/telemetry/telemetry.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/tools/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/tools/rag_tool.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/tools/tools.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/vector_io/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/vector_io/vector_io.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/vector_stores/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/vector_stores/vector_stores.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/apis/version.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/llama.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/scripts/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/scripts/install-wheel-from-presigned.sh +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/scripts/run.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/_list_deps.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/list_apis.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/list_deps.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/list_providers.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/list_stacks.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/remove.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/run.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/stack.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/stack/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/subcommand.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/table.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/cli/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/access_control/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/access_control/access_control.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/access_control/conditions.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/access_control/datatypes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/build.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/client.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/common.sh +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/configure.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/conversations/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/conversations/conversations.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/datatypes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/distribution.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/external.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/id_generation.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/inspect.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/library_client.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/prompts/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/prompts/prompts.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/providers.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/request_headers.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routers/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routers/datasets.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routers/eval_scoring.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routers/safety.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routers/tool_runtime.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routers/vector_io.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/benchmarks.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/common.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/datasets.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/models.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/scoring_functions.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/shields.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/toolgroups.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/routing_tables/vector_stores.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/server/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/server/auth.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/server/auth_providers.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/server/quota.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/server/routes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/server/server.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/server/tracing.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/stack.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/start_stack.sh +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/storage/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/storage/datatypes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/store/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/store/registry.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/testing_context.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/app.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/modules/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/modules/api.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/modules/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/datasets.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/eval_tasks.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/models.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/providers.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/resources.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/scoring_functions.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/distribution/shields.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/evaluations/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/evaluations/app_eval.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/evaluations/native_eval.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/playground/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/playground/chat.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/ui/page/playground/tools.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/config_dirs.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/config_resolution.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/context.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/dynamic.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/exec.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/image_types.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/model_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/prompt_for_config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/core/utils/serialize.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/dell/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/dell/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/dell/dell.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/dell/run-with-safety.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/dell/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/meta_reference.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/run-with-safety.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/meta-reference-gpu/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/nvidia.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/run-with-safety.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/nvidia/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/open_benchmark.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/open-benchmark/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/postgres_demo.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/postgres-demo/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter/run-with-postgres-store.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter/starter.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/run-with-postgres-store.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/starter-gpu/starter_gpu.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/template.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/build.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/run.yaml +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/distributions/watsonx/watsonx.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/env.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/log.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/checkpoint.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/datatypes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/hadamard_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/args.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/chat_format.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/generation.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/interface.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/model.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/encoder_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/image_transform.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/model.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/multimodal/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/base.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/system_prompts.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/prompt_templates/tool_response.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/quantization/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/quantization/loader.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/template_data.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/tokenizer.model +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/tokenizer.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3/tool_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_1/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_1/prompt_format.md +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_1/prompts.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/prompts_text.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/prompts_vision.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/text_prompt_format.md +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_2/vision_prompt_format.md +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_3/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama3_3/prompts.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/args.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/chat_format.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/datatypes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/ffn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/generation.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/model.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/moe.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/preprocess.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompt_format.md +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompt_templates/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompt_templates/system_prompts.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/prompts.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/quantization/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/quantization/loader.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/tokenizer.model +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/tokenizer.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/vision/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/vision/embedding.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/llama4/vision/encoder.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/prompt_format.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/quantize_impls.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/sku_list.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/sku_types.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/models/llama/tokenizer_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/datatypes.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/agent_instance.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/agents.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/persistence.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/openai_responses.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/streaming.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/tool_executor.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/types.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/responses/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/agents/meta_reference/safety.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/reference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/reference/batches.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/batches/reference/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/localfs/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/localfs/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/datasetio/localfs/datasetio.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/meta_reference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/meta_reference/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/eval/meta_reference/eval.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/files/localfs/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/files/localfs/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/files/localfs/files.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/common.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/generators.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/inference.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/model_parallel.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/meta_reference/parallel_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/sentence_transformers/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/sentence_transformers/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/inference/sentence_transformers/sentence_transformers.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/common/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/common/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/common/validator.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/post_training.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/recipes/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/recipes/finetune_single_device.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/recipes/finetune_single_device_dpo.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/huggingface/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/common/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/common/checkpointer.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/common/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/datasets/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/datasets/format_adapter.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/datasets/sft.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/post_training.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/recipes/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/post_training/torchtune/recipes/lora_finetuning_single_device.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/code_scanner/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/code_scanner/code_scanner.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/code_scanner/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/llama_guard/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/llama_guard/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/llama_guard/llama_guard.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/prompt_guard/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/prompt_guard/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/safety/prompt_guard/prompt_guard.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/docvqa_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/equality_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/docvqa.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/equality.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/ifeval.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/regex_parser_math_response.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/regex_parser_multiple_choice_answer.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/fn_defs/subset_of.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/ifeval_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/regex_parser_math_response_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/regex_parser_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/scoring_fn/subset_of_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/utils/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/utils/ifeval_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/basic/utils/math_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/braintrust.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/answer_correctness.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/answer_relevancy.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/answer_similarity.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_entity_recall.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_precision.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_recall.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/context_relevancy.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/factuality.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/braintrust/scoring_fn/fn_defs/faithfulness.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/fn_defs/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/fn_defs/llm_as_judge_405b_simpleqa.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/fn_defs/llm_as_judge_base.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/scoring/llm_as_judge/scoring_fn/llm_as_judge_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/meta_reference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/meta_reference/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/telemetry/meta_reference/telemetry.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/context_retriever.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/tool_runtime/rag/memory.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/chroma/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/chroma/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/faiss/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/faiss/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/faiss/faiss.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/milvus/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/milvus/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/qdrant/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/qdrant/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/sqlite_vec/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/sqlite_vec/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/batches.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/datasetio.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/eval.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/files.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/inference.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/post_training.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/safety.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/scoring.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/registry/vector_io.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/agents/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/huggingface/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/huggingface/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/huggingface/huggingface.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/nvidia/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/nvidia/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/datasetio/nvidia/datasetio.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/nvidia/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/nvidia/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/eval/nvidia/eval.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/files/s3/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/files/s3/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/files/s3/files.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/anthropic/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/anthropic/anthropic.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/anthropic/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/azure/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/azure/azure.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/azure/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/bedrock.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/bedrock/models.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/cerebras/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/cerebras/cerebras.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/cerebras/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/databricks/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/databricks/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/databricks/databricks.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/fireworks/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/fireworks/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/fireworks/fireworks.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/gemini/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/gemini/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/gemini/gemini.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/groq/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/groq/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/groq/groq.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/llama_openai_compat/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/llama_openai_compat/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/llama_openai_compat/llama.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/nvidia.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/nvidia/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/ollama/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/ollama/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/ollama/ollama.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/openai/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/openai/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/openai/openai.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/passthrough/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/passthrough/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/passthrough/passthrough.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/runpod/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/runpod/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/runpod/runpod.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/sambanova/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/sambanova/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/sambanova/sambanova.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/tgi/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/tgi/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/tgi/tgi.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/together/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/together/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/together/together.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vertexai/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vertexai/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vertexai/vertexai.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vllm/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vllm/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/vllm/vllm.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/watsonx/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/watsonx/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/models.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/post_training.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/post_training/nvidia/utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/bedrock/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/bedrock/bedrock.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/bedrock/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/nvidia/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/nvidia/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/nvidia/nvidia.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/sambanova/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/sambanova/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/safety/sambanova/sambanova.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/bing_search/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/bing_search/bing_search.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/bing_search/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/brave_search/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/brave_search/brave_search.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/brave_search/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/model_context_protocol/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/model_context_protocol/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/model_context_protocol/model_context_protocol.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/tavily_search/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/tavily_search/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/tavily_search/tavily_search.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/wolfram_alpha/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/wolfram_alpha/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/tool_runtime/wolfram_alpha/wolfram_alpha.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/chroma/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/chroma/chroma.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/chroma/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/milvus/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/milvus/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/milvus/milvus.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/pgvector/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/pgvector/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/pgvector/pgvector.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/qdrant/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/qdrant/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/qdrant/qdrant.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/weaviate/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/weaviate/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/vector_io/weaviate/weaviate.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/client.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/bedrock/refreshable_boto_session.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/common/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/common/data_schema_validator.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/datasetio/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/datasetio/url_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/files/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/files/form_data.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/embedding_mixin.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/litellm_openai_mixin.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/model_registry.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/openai_compat.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/openai_mixin.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/prompt_adapter.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/api.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/kvstore.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/mongodb/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/mongodb/mongodb.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/postgres/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/postgres/postgres.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/redis/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/redis/redis.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/sqlite/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/sqlite/config.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/kvstore/sqlite/sqlite.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/file_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/openai_vector_store_mixin.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/memory/vector_store.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/pagination.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/responses/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/scheduler.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/aggregation_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/base_scoring_fn.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/scoring/basic_scoring_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/api.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/authorized_sqlstore.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/sqlalchemy_sqlstore.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/sqlstore/sqlstore.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/telemetry/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/telemetry/trace_protocol.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/telemetry/tracing.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/tools/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/tools/mcp.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/tools/ttl_dict.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/vector_io/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/vector_io/vector_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/schema_utils.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/auxiliary.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/classdef.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/core.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/deserializer.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/docstring.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/exception.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/inspection.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/mapping.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/name.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/py.typed +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/schema.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/serialization.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/serializer.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/slots.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/strong_typing/topological.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/testing/__init__.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/testing/api_recorder.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/ui/node_modules/flatted/python/flatted.py +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack.egg-info/SOURCES.txt +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack.egg-info/dependency_links.txt +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack.egg-info/entry_points.txt +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack.egg-info/top_level.txt +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/setup.cfg +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/tests/integration/test_cases/inference/chat_completion.json +0 -0
- {llama_stack-0.3.3 → llama_stack-0.3.5}/tests/integration/test_cases/inference/completion.json +0 -0
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.4
|
|
2
2
|
Name: llama_stack
|
|
3
|
-
Version: 0.3.
|
|
3
|
+
Version: 0.3.5
|
|
4
4
|
Summary: Llama Stack
|
|
5
5
|
Author-email: Meta Llama <llama-oss@meta.com>
|
|
6
6
|
License: MIT
|
|
@@ -22,7 +22,7 @@ Requires-Dist: fire
|
|
|
22
22
|
Requires-Dist: httpx
|
|
23
23
|
Requires-Dist: jinja2>=3.1.6
|
|
24
24
|
Requires-Dist: jsonschema
|
|
25
|
-
Requires-Dist: llama-stack-client
|
|
25
|
+
Requires-Dist: llama-stack-client==0.3.5
|
|
26
26
|
Requires-Dist: openai>=1.107
|
|
27
27
|
Requires-Dist: prompt-toolkit
|
|
28
28
|
Requires-Dist: python-dotenv
|
|
@@ -41,10 +41,11 @@ Requires-Dist: opentelemetry-exporter-otlp-proto-http>=1.30.0
|
|
|
41
41
|
Requires-Dist: aiosqlite>=0.21.0
|
|
42
42
|
Requires-Dist: asyncpg
|
|
43
43
|
Requires-Dist: sqlalchemy[asyncio]>=2.0.41
|
|
44
|
+
Requires-Dist: starlette>=0.49.1
|
|
44
45
|
Provides-Extra: ui
|
|
45
46
|
Requires-Dist: streamlit; extra == "ui"
|
|
46
47
|
Requires-Dist: pandas; extra == "ui"
|
|
47
|
-
Requires-Dist: llama-stack-client
|
|
48
|
+
Requires-Dist: llama-stack-client==0.3.5; extra == "ui"
|
|
48
49
|
Requires-Dist: streamlit-option-menu; extra == "ui"
|
|
49
50
|
Dynamic: license-file
|
|
50
51
|
|
|
@@ -60,83 +61,6 @@ Dynamic: license-file
|
|
|
60
61
|
[**Quick Start**](https://llamastack.github.io/docs/getting_started/quickstart) | [**Documentation**](https://llamastack.github.io/docs) | [**Colab Notebook**](./docs/getting_started.ipynb) | [**Discord**](https://discord.gg/llama-stack)
|
|
61
62
|
|
|
62
63
|
|
|
63
|
-
### ✨🎉 Llama 4 Support 🎉✨
|
|
64
|
-
We released [Version 0.2.0](https://github.com/meta-llama/llama-stack/releases/tag/v0.2.0) with support for the Llama 4 herd of models released by Meta.
|
|
65
|
-
|
|
66
|
-
<details>
|
|
67
|
-
|
|
68
|
-
<summary>👋 Click here to see how to run Llama 4 models on Llama Stack </summary>
|
|
69
|
-
|
|
70
|
-
\
|
|
71
|
-
*Note you need 8xH100 GPU-host to run these models*
|
|
72
|
-
|
|
73
|
-
```bash
|
|
74
|
-
pip install -U llama_stack
|
|
75
|
-
|
|
76
|
-
MODEL="Llama-4-Scout-17B-16E-Instruct"
|
|
77
|
-
# get meta url from llama.com
|
|
78
|
-
huggingface-cli download meta-llama/$MODEL --local-dir ~/.llama/$MODEL
|
|
79
|
-
|
|
80
|
-
# install dependencies for the distribution
|
|
81
|
-
llama stack list-deps meta-reference-gpu | xargs -L1 uv pip install
|
|
82
|
-
|
|
83
|
-
# start a llama stack server
|
|
84
|
-
INFERENCE_MODEL=meta-llama/$MODEL llama stack run meta-reference-gpu
|
|
85
|
-
|
|
86
|
-
# install client to interact with the server
|
|
87
|
-
pip install llama-stack-client
|
|
88
|
-
```
|
|
89
|
-
### CLI
|
|
90
|
-
```bash
|
|
91
|
-
# Run a chat completion
|
|
92
|
-
MODEL="Llama-4-Scout-17B-16E-Instruct"
|
|
93
|
-
|
|
94
|
-
llama-stack-client --endpoint http://localhost:8321 \
|
|
95
|
-
inference chat-completion \
|
|
96
|
-
--model-id meta-llama/$MODEL \
|
|
97
|
-
--message "write a haiku for meta's llama 4 models"
|
|
98
|
-
|
|
99
|
-
OpenAIChatCompletion(
|
|
100
|
-
...
|
|
101
|
-
choices=[
|
|
102
|
-
OpenAIChatCompletionChoice(
|
|
103
|
-
finish_reason='stop',
|
|
104
|
-
index=0,
|
|
105
|
-
message=OpenAIChatCompletionChoiceMessageOpenAIAssistantMessageParam(
|
|
106
|
-
role='assistant',
|
|
107
|
-
content='...**Silent minds awaken,** \n**Whispers of billions of words,** \n**Reasoning breaks the night.** \n\n— \n*This haiku blends the essence of LLaMA 4\'s capabilities with nature-inspired metaphor, evoking its vast training data and transformative potential.*',
|
|
108
|
-
...
|
|
109
|
-
),
|
|
110
|
-
...
|
|
111
|
-
)
|
|
112
|
-
],
|
|
113
|
-
...
|
|
114
|
-
)
|
|
115
|
-
```
|
|
116
|
-
### Python SDK
|
|
117
|
-
```python
|
|
118
|
-
from llama_stack_client import LlamaStackClient
|
|
119
|
-
|
|
120
|
-
client = LlamaStackClient(base_url=f"http://localhost:8321")
|
|
121
|
-
|
|
122
|
-
model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"
|
|
123
|
-
prompt = "Write a haiku about coding"
|
|
124
|
-
|
|
125
|
-
print(f"User> {prompt}")
|
|
126
|
-
response = client.chat.completions.create(
|
|
127
|
-
model=model_id,
|
|
128
|
-
messages=[
|
|
129
|
-
{"role": "system", "content": "You are a helpful assistant."},
|
|
130
|
-
{"role": "user", "content": prompt},
|
|
131
|
-
],
|
|
132
|
-
)
|
|
133
|
-
print(f"Assistant> {response.choices[0].message.content}")
|
|
134
|
-
```
|
|
135
|
-
As more providers start supporting Llama 4, you can use them in Llama Stack as well. We are adding to the list. Stay tuned!
|
|
136
|
-
|
|
137
|
-
|
|
138
|
-
</details>
|
|
139
|
-
|
|
140
64
|
### 🚀 One-Line Installer 🚀
|
|
141
65
|
|
|
142
66
|
To try Llama Stack locally, run:
|
|
@@ -10,83 +10,6 @@
|
|
|
10
10
|
[**Quick Start**](https://llamastack.github.io/docs/getting_started/quickstart) | [**Documentation**](https://llamastack.github.io/docs) | [**Colab Notebook**](./docs/getting_started.ipynb) | [**Discord**](https://discord.gg/llama-stack)
|
|
11
11
|
|
|
12
12
|
|
|
13
|
-
### ✨🎉 Llama 4 Support 🎉✨
|
|
14
|
-
We released [Version 0.2.0](https://github.com/meta-llama/llama-stack/releases/tag/v0.2.0) with support for the Llama 4 herd of models released by Meta.
|
|
15
|
-
|
|
16
|
-
<details>
|
|
17
|
-
|
|
18
|
-
<summary>👋 Click here to see how to run Llama 4 models on Llama Stack </summary>
|
|
19
|
-
|
|
20
|
-
\
|
|
21
|
-
*Note you need 8xH100 GPU-host to run these models*
|
|
22
|
-
|
|
23
|
-
```bash
|
|
24
|
-
pip install -U llama_stack
|
|
25
|
-
|
|
26
|
-
MODEL="Llama-4-Scout-17B-16E-Instruct"
|
|
27
|
-
# get meta url from llama.com
|
|
28
|
-
huggingface-cli download meta-llama/$MODEL --local-dir ~/.llama/$MODEL
|
|
29
|
-
|
|
30
|
-
# install dependencies for the distribution
|
|
31
|
-
llama stack list-deps meta-reference-gpu | xargs -L1 uv pip install
|
|
32
|
-
|
|
33
|
-
# start a llama stack server
|
|
34
|
-
INFERENCE_MODEL=meta-llama/$MODEL llama stack run meta-reference-gpu
|
|
35
|
-
|
|
36
|
-
# install client to interact with the server
|
|
37
|
-
pip install llama-stack-client
|
|
38
|
-
```
|
|
39
|
-
### CLI
|
|
40
|
-
```bash
|
|
41
|
-
# Run a chat completion
|
|
42
|
-
MODEL="Llama-4-Scout-17B-16E-Instruct"
|
|
43
|
-
|
|
44
|
-
llama-stack-client --endpoint http://localhost:8321 \
|
|
45
|
-
inference chat-completion \
|
|
46
|
-
--model-id meta-llama/$MODEL \
|
|
47
|
-
--message "write a haiku for meta's llama 4 models"
|
|
48
|
-
|
|
49
|
-
OpenAIChatCompletion(
|
|
50
|
-
...
|
|
51
|
-
choices=[
|
|
52
|
-
OpenAIChatCompletionChoice(
|
|
53
|
-
finish_reason='stop',
|
|
54
|
-
index=0,
|
|
55
|
-
message=OpenAIChatCompletionChoiceMessageOpenAIAssistantMessageParam(
|
|
56
|
-
role='assistant',
|
|
57
|
-
content='...**Silent minds awaken,** \n**Whispers of billions of words,** \n**Reasoning breaks the night.** \n\n— \n*This haiku blends the essence of LLaMA 4\'s capabilities with nature-inspired metaphor, evoking its vast training data and transformative potential.*',
|
|
58
|
-
...
|
|
59
|
-
),
|
|
60
|
-
...
|
|
61
|
-
)
|
|
62
|
-
],
|
|
63
|
-
...
|
|
64
|
-
)
|
|
65
|
-
```
|
|
66
|
-
### Python SDK
|
|
67
|
-
```python
|
|
68
|
-
from llama_stack_client import LlamaStackClient
|
|
69
|
-
|
|
70
|
-
client = LlamaStackClient(base_url=f"http://localhost:8321")
|
|
71
|
-
|
|
72
|
-
model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"
|
|
73
|
-
prompt = "Write a haiku about coding"
|
|
74
|
-
|
|
75
|
-
print(f"User> {prompt}")
|
|
76
|
-
response = client.chat.completions.create(
|
|
77
|
-
model=model_id,
|
|
78
|
-
messages=[
|
|
79
|
-
{"role": "system", "content": "You are a helpful assistant."},
|
|
80
|
-
{"role": "user", "content": prompt},
|
|
81
|
-
],
|
|
82
|
-
)
|
|
83
|
-
print(f"Assistant> {response.choices[0].message.content}")
|
|
84
|
-
```
|
|
85
|
-
As more providers start supporting Llama 4, you can use them in Llama Stack as well. We are adding to the list. Stay tuned!
|
|
86
|
-
|
|
87
|
-
|
|
88
|
-
</details>
|
|
89
|
-
|
|
90
13
|
### 🚀 One-Line Installer 🚀
|
|
91
14
|
|
|
92
15
|
To try Llama Stack locally, run:
|
|
@@ -391,6 +391,9 @@ async def instantiate_provider(
|
|
|
391
391
|
method = "get_adapter_impl"
|
|
392
392
|
args = [config, deps]
|
|
393
393
|
|
|
394
|
+
if "policy" in inspect.signature(getattr(module, method)).parameters:
|
|
395
|
+
args.append(policy)
|
|
396
|
+
|
|
394
397
|
elif isinstance(provider_spec, AutoRoutedProviderSpec):
|
|
395
398
|
method = "get_auto_router_impl"
|
|
396
399
|
|
|
@@ -49,10 +49,17 @@ from llama_stack.apis.inference import (
|
|
|
49
49
|
)
|
|
50
50
|
from llama_stack.apis.models import Model, ModelType
|
|
51
51
|
from llama_stack.apis.telemetry import MetricEvent, MetricInResponse, Telemetry
|
|
52
|
+
from llama_stack.core.access_control.access_control import is_action_allowed
|
|
53
|
+
from llama_stack.core.datatypes import ModelWithOwner
|
|
54
|
+
from llama_stack.core.request_headers import get_authenticated_user
|
|
52
55
|
from llama_stack.log import get_logger
|
|
53
56
|
from llama_stack.models.llama.llama3.chat_format import ChatFormat
|
|
54
57
|
from llama_stack.models.llama.llama3.tokenizer import Tokenizer
|
|
55
|
-
from llama_stack.providers.datatypes import
|
|
58
|
+
from llama_stack.providers.datatypes import (
|
|
59
|
+
HealthResponse,
|
|
60
|
+
HealthStatus,
|
|
61
|
+
RoutingTable,
|
|
62
|
+
)
|
|
56
63
|
from llama_stack.providers.utils.inference.inference_store import InferenceStore
|
|
57
64
|
from llama_stack.providers.utils.telemetry.tracing import enqueue_event, get_current_span
|
|
58
65
|
|
|
@@ -186,15 +193,41 @@ class InferenceRouter(Inference):
|
|
|
186
193
|
provider = await self.routing_table.get_provider_impl(model.identifier)
|
|
187
194
|
return provider, model.provider_resource_id
|
|
188
195
|
|
|
196
|
+
# Handles cases where clients use the provider format directly
|
|
197
|
+
return await self._get_provider_by_fallback(model_id, expected_model_type)
|
|
198
|
+
|
|
199
|
+
async def _get_provider_by_fallback(self, model_id: str, expected_model_type: str) -> tuple[Inference, str]:
|
|
200
|
+
"""
|
|
201
|
+
Handle fallback case where model_id is in provider_id/provider_resource_id format.
|
|
202
|
+
"""
|
|
189
203
|
splits = model_id.split("/", maxsplit=1)
|
|
190
204
|
if len(splits) != 2:
|
|
191
205
|
raise ModelNotFoundError(model_id)
|
|
192
206
|
|
|
193
207
|
provider_id, provider_resource_id = splits
|
|
208
|
+
|
|
209
|
+
# Check if provider exists
|
|
194
210
|
if provider_id not in self.routing_table.impls_by_provider_id:
|
|
195
211
|
logger.warning(f"Provider {provider_id} not found for model {model_id}")
|
|
196
212
|
raise ModelNotFoundError(model_id)
|
|
197
213
|
|
|
214
|
+
# Create a temporary model object for RBAC check
|
|
215
|
+
temp_model = ModelWithOwner(
|
|
216
|
+
identifier=model_id,
|
|
217
|
+
provider_id=provider_id,
|
|
218
|
+
provider_resource_id=provider_resource_id,
|
|
219
|
+
model_type=expected_model_type,
|
|
220
|
+
metadata={}, # Empty metadata for temporary object
|
|
221
|
+
)
|
|
222
|
+
|
|
223
|
+
# Perform RBAC check
|
|
224
|
+
user = get_authenticated_user()
|
|
225
|
+
if not is_action_allowed(self.routing_table.policy, "read", temp_model, user):
|
|
226
|
+
logger.debug(
|
|
227
|
+
f"Access denied to model '{model_id}' via fallback path for user {user.principal if user else 'anonymous'}"
|
|
228
|
+
)
|
|
229
|
+
raise ModelNotFoundError(model_id)
|
|
230
|
+
|
|
198
231
|
return self.routing_table.impls_by_provider_id[provider_id], provider_resource_id
|
|
199
232
|
|
|
200
233
|
async def openai_completion(
|
|
@@ -23,7 +23,7 @@ def available_providers() -> list[ProviderSpec]:
|
|
|
23
23
|
"pillow",
|
|
24
24
|
"pandas",
|
|
25
25
|
"scikit-learn",
|
|
26
|
-
"mcp>=1.
|
|
26
|
+
"mcp>=1.23.0",
|
|
27
27
|
]
|
|
28
28
|
+ kvstore_dependencies(), # TODO make this dynamic based on the kvstore config
|
|
29
29
|
module="llama_stack.providers.inline.agents.meta_reference",
|
|
@@ -80,7 +80,7 @@ def available_providers() -> list[ProviderSpec]:
|
|
|
80
80
|
provider_type="remote::model-context-protocol",
|
|
81
81
|
module="llama_stack.providers.remote.tool_runtime.model_context_protocol",
|
|
82
82
|
config_class="llama_stack.providers.remote.tool_runtime.model_context_protocol.config.MCPProviderConfig",
|
|
83
|
-
pip_packages=["mcp>=1.
|
|
83
|
+
pip_packages=["mcp>=1.23.0"],
|
|
84
84
|
provider_data_validator="llama_stack.providers.remote.tool_runtime.model_context_protocol.config.MCPProviderDataValidator",
|
|
85
85
|
description="Model Context Protocol (MCP) tool for standardized tool calling and context management.",
|
|
86
86
|
),
|
{llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/remote/inference/watsonx/watsonx.py
RENAMED
|
@@ -283,8 +283,8 @@ class WatsonXInferenceAdapter(LiteLLMOpenAIMixin):
|
|
|
283
283
|
# ...
|
|
284
284
|
provider_resource_id = f"{self.__provider_id__}/{model_spec['model_id']}"
|
|
285
285
|
if "embedding" in functions:
|
|
286
|
-
embedding_dimension = model_spec
|
|
287
|
-
context_length = model_spec
|
|
286
|
+
embedding_dimension = model_spec.get("model_limits", {}).get("embedding_dimension", 0)
|
|
287
|
+
context_length = model_spec.get("model_limits", {}).get("max_sequence_length", 0)
|
|
288
288
|
embedding_metadata = {
|
|
289
289
|
"embedding_dimension": embedding_dimension,
|
|
290
290
|
"context_length": context_length,
|
|
@@ -306,10 +306,6 @@ class WatsonXInferenceAdapter(LiteLLMOpenAIMixin):
|
|
|
306
306
|
metadata={},
|
|
307
307
|
model_type=ModelType.llm,
|
|
308
308
|
)
|
|
309
|
-
# In theory, I guess it is possible that a model could be both an embedding model and a text chat model.
|
|
310
|
-
# In that case, the cache will record the generator Model object, and the list which we return will have
|
|
311
|
-
# both the generator Model object and the text chat Model object. That's fine because the cache is
|
|
312
|
-
# only used for check_model_availability() anyway.
|
|
313
309
|
self._model_cache[provider_resource_id] = model
|
|
314
310
|
models.append(model)
|
|
315
311
|
return models
|
{llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/inference/inference_store.py
RENAMED
|
@@ -56,7 +56,7 @@ class InferenceStore:
|
|
|
56
56
|
logger.debug("Write queue disabled for SQLite (WAL mode handles concurrency)")
|
|
57
57
|
|
|
58
58
|
await self.sql_store.create_table(
|
|
59
|
-
|
|
59
|
+
self.reference.table_name,
|
|
60
60
|
{
|
|
61
61
|
"id": ColumnDefinition(type=ColumnType.STRING, primary_key=True),
|
|
62
62
|
"created": ColumnType.INTEGER,
|
|
@@ -66,14 +66,6 @@ class InferenceStore:
|
|
|
66
66
|
},
|
|
67
67
|
)
|
|
68
68
|
|
|
69
|
-
if self.enable_write_queue:
|
|
70
|
-
self._queue = asyncio.Queue(maxsize=self._max_write_queue_size)
|
|
71
|
-
for _ in range(self._num_writers):
|
|
72
|
-
self._worker_tasks.append(asyncio.create_task(self._worker_loop()))
|
|
73
|
-
logger.debug(
|
|
74
|
-
f"Inference store write queue enabled with {self._num_writers} writers, max queue size {self._max_write_queue_size}"
|
|
75
|
-
)
|
|
76
|
-
|
|
77
69
|
async def shutdown(self) -> None:
|
|
78
70
|
if not self._worker_tasks:
|
|
79
71
|
return
|
|
@@ -161,7 +153,7 @@ class InferenceStore:
|
|
|
161
153
|
|
|
162
154
|
try:
|
|
163
155
|
await self.sql_store.insert(
|
|
164
|
-
table=
|
|
156
|
+
table=self.reference.table_name,
|
|
165
157
|
data=record_data,
|
|
166
158
|
)
|
|
167
159
|
except IntegrityError as e:
|
|
@@ -173,7 +165,7 @@ class InferenceStore:
|
|
|
173
165
|
error_message = str(e.orig) if e.orig else str(e)
|
|
174
166
|
if self._is_unique_constraint_error(error_message):
|
|
175
167
|
# Update the existing record instead
|
|
176
|
-
await self.sql_store.update(table=
|
|
168
|
+
await self.sql_store.update(table=self.reference.table_name, data=record_data, where={"id": data["id"]})
|
|
177
169
|
else:
|
|
178
170
|
# Re-raise if it's not a unique constraint error
|
|
179
171
|
raise
|
|
@@ -217,7 +209,7 @@ class InferenceStore:
|
|
|
217
209
|
where_conditions["model"] = model
|
|
218
210
|
|
|
219
211
|
paginated_result = await self.sql_store.fetch_all(
|
|
220
|
-
table=
|
|
212
|
+
table=self.reference.table_name,
|
|
221
213
|
where=where_conditions if where_conditions else None,
|
|
222
214
|
order_by=[("created", order.value)],
|
|
223
215
|
cursor=("id", after) if after else None,
|
|
@@ -246,7 +238,7 @@ class InferenceStore:
|
|
|
246
238
|
raise ValueError("Inference store is not initialized")
|
|
247
239
|
|
|
248
240
|
row = await self.sql_store.fetch_one(
|
|
249
|
-
table=
|
|
241
|
+
table=self.reference.table_name,
|
|
250
242
|
where={"id": completion_id},
|
|
251
243
|
)
|
|
252
244
|
|
{llama_stack-0.3.3 → llama_stack-0.3.5}/llama_stack/providers/utils/responses/responses_store.py
RENAMED
|
@@ -3,7 +3,6 @@
|
|
|
3
3
|
#
|
|
4
4
|
# This source code is licensed under the terms described in the LICENSE file in
|
|
5
5
|
# the root directory of this source tree.
|
|
6
|
-
import asyncio
|
|
7
6
|
|
|
8
7
|
from llama_stack.apis.agents import (
|
|
9
8
|
Order,
|
|
@@ -18,12 +17,12 @@ from llama_stack.apis.agents.openai_responses import (
|
|
|
18
17
|
)
|
|
19
18
|
from llama_stack.apis.inference import OpenAIMessageParam
|
|
20
19
|
from llama_stack.core.datatypes import AccessRule
|
|
21
|
-
from llama_stack.core.storage.datatypes import ResponsesStoreReference, SqlStoreReference
|
|
20
|
+
from llama_stack.core.storage.datatypes import ResponsesStoreReference, SqlStoreReference
|
|
22
21
|
from llama_stack.log import get_logger
|
|
23
22
|
|
|
24
23
|
from ..sqlstore.api import ColumnDefinition, ColumnType
|
|
25
24
|
from ..sqlstore.authorized_sqlstore import AuthorizedSqlStore
|
|
26
|
-
from ..sqlstore.sqlstore import
|
|
25
|
+
from ..sqlstore.sqlstore import sqlstore_impl
|
|
27
26
|
|
|
28
27
|
logger = get_logger(name=__name__, category="openai_responses")
|
|
29
28
|
|
|
@@ -60,13 +59,6 @@ class ResponsesStore:
|
|
|
60
59
|
base_store = sqlstore_impl(self.reference)
|
|
61
60
|
self.sql_store = AuthorizedSqlStore(base_store, self.policy)
|
|
62
61
|
|
|
63
|
-
# Disable write queue for SQLite since WAL mode handles concurrency
|
|
64
|
-
# Keep it enabled for other backends (like Postgres) for performance
|
|
65
|
-
backend_config = _SQLSTORE_BACKENDS.get(self.reference.backend)
|
|
66
|
-
if backend_config and backend_config.type == StorageBackendType.SQL_SQLITE:
|
|
67
|
-
self.enable_write_queue = False
|
|
68
|
-
logger.debug("Write queue disabled for SQLite (WAL mode handles concurrency)")
|
|
69
|
-
|
|
70
62
|
await self.sql_store.create_table(
|
|
71
63
|
"openai_responses",
|
|
72
64
|
{
|
|
@@ -85,14 +77,6 @@ class ResponsesStore:
|
|
|
85
77
|
},
|
|
86
78
|
)
|
|
87
79
|
|
|
88
|
-
if self.enable_write_queue:
|
|
89
|
-
self._queue = asyncio.Queue(maxsize=self._max_write_queue_size)
|
|
90
|
-
for _ in range(self._num_writers):
|
|
91
|
-
self._worker_tasks.append(asyncio.create_task(self._worker_loop()))
|
|
92
|
-
logger.debug(
|
|
93
|
-
f"Responses store write queue enabled with {self._num_writers} writers, max queue size {self._max_write_queue_size}"
|
|
94
|
-
)
|
|
95
|
-
|
|
96
80
|
async def shutdown(self) -> None:
|
|
97
81
|
return
|
|
98
82
|
|
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
Metadata-Version: 2.4
|
|
2
2
|
Name: llama_stack
|
|
3
|
-
Version: 0.3.
|
|
3
|
+
Version: 0.3.5
|
|
4
4
|
Summary: Llama Stack
|
|
5
5
|
Author-email: Meta Llama <llama-oss@meta.com>
|
|
6
6
|
License: MIT
|
|
@@ -22,7 +22,7 @@ Requires-Dist: fire
|
|
|
22
22
|
Requires-Dist: httpx
|
|
23
23
|
Requires-Dist: jinja2>=3.1.6
|
|
24
24
|
Requires-Dist: jsonschema
|
|
25
|
-
Requires-Dist: llama-stack-client
|
|
25
|
+
Requires-Dist: llama-stack-client==0.3.5
|
|
26
26
|
Requires-Dist: openai>=1.107
|
|
27
27
|
Requires-Dist: prompt-toolkit
|
|
28
28
|
Requires-Dist: python-dotenv
|
|
@@ -41,10 +41,11 @@ Requires-Dist: opentelemetry-exporter-otlp-proto-http>=1.30.0
|
|
|
41
41
|
Requires-Dist: aiosqlite>=0.21.0
|
|
42
42
|
Requires-Dist: asyncpg
|
|
43
43
|
Requires-Dist: sqlalchemy[asyncio]>=2.0.41
|
|
44
|
+
Requires-Dist: starlette>=0.49.1
|
|
44
45
|
Provides-Extra: ui
|
|
45
46
|
Requires-Dist: streamlit; extra == "ui"
|
|
46
47
|
Requires-Dist: pandas; extra == "ui"
|
|
47
|
-
Requires-Dist: llama-stack-client
|
|
48
|
+
Requires-Dist: llama-stack-client==0.3.5; extra == "ui"
|
|
48
49
|
Requires-Dist: streamlit-option-menu; extra == "ui"
|
|
49
50
|
Dynamic: license-file
|
|
50
51
|
|
|
@@ -60,83 +61,6 @@ Dynamic: license-file
|
|
|
60
61
|
[**Quick Start**](https://llamastack.github.io/docs/getting_started/quickstart) | [**Documentation**](https://llamastack.github.io/docs) | [**Colab Notebook**](./docs/getting_started.ipynb) | [**Discord**](https://discord.gg/llama-stack)
|
|
61
62
|
|
|
62
63
|
|
|
63
|
-
### ✨🎉 Llama 4 Support 🎉✨
|
|
64
|
-
We released [Version 0.2.0](https://github.com/meta-llama/llama-stack/releases/tag/v0.2.0) with support for the Llama 4 herd of models released by Meta.
|
|
65
|
-
|
|
66
|
-
<details>
|
|
67
|
-
|
|
68
|
-
<summary>👋 Click here to see how to run Llama 4 models on Llama Stack </summary>
|
|
69
|
-
|
|
70
|
-
\
|
|
71
|
-
*Note you need 8xH100 GPU-host to run these models*
|
|
72
|
-
|
|
73
|
-
```bash
|
|
74
|
-
pip install -U llama_stack
|
|
75
|
-
|
|
76
|
-
MODEL="Llama-4-Scout-17B-16E-Instruct"
|
|
77
|
-
# get meta url from llama.com
|
|
78
|
-
huggingface-cli download meta-llama/$MODEL --local-dir ~/.llama/$MODEL
|
|
79
|
-
|
|
80
|
-
# install dependencies for the distribution
|
|
81
|
-
llama stack list-deps meta-reference-gpu | xargs -L1 uv pip install
|
|
82
|
-
|
|
83
|
-
# start a llama stack server
|
|
84
|
-
INFERENCE_MODEL=meta-llama/$MODEL llama stack run meta-reference-gpu
|
|
85
|
-
|
|
86
|
-
# install client to interact with the server
|
|
87
|
-
pip install llama-stack-client
|
|
88
|
-
```
|
|
89
|
-
### CLI
|
|
90
|
-
```bash
|
|
91
|
-
# Run a chat completion
|
|
92
|
-
MODEL="Llama-4-Scout-17B-16E-Instruct"
|
|
93
|
-
|
|
94
|
-
llama-stack-client --endpoint http://localhost:8321 \
|
|
95
|
-
inference chat-completion \
|
|
96
|
-
--model-id meta-llama/$MODEL \
|
|
97
|
-
--message "write a haiku for meta's llama 4 models"
|
|
98
|
-
|
|
99
|
-
OpenAIChatCompletion(
|
|
100
|
-
...
|
|
101
|
-
choices=[
|
|
102
|
-
OpenAIChatCompletionChoice(
|
|
103
|
-
finish_reason='stop',
|
|
104
|
-
index=0,
|
|
105
|
-
message=OpenAIChatCompletionChoiceMessageOpenAIAssistantMessageParam(
|
|
106
|
-
role='assistant',
|
|
107
|
-
content='...**Silent minds awaken,** \n**Whispers of billions of words,** \n**Reasoning breaks the night.** \n\n— \n*This haiku blends the essence of LLaMA 4\'s capabilities with nature-inspired metaphor, evoking its vast training data and transformative potential.*',
|
|
108
|
-
...
|
|
109
|
-
),
|
|
110
|
-
...
|
|
111
|
-
)
|
|
112
|
-
],
|
|
113
|
-
...
|
|
114
|
-
)
|
|
115
|
-
```
|
|
116
|
-
### Python SDK
|
|
117
|
-
```python
|
|
118
|
-
from llama_stack_client import LlamaStackClient
|
|
119
|
-
|
|
120
|
-
client = LlamaStackClient(base_url=f"http://localhost:8321")
|
|
121
|
-
|
|
122
|
-
model_id = "meta-llama/Llama-4-Scout-17B-16E-Instruct"
|
|
123
|
-
prompt = "Write a haiku about coding"
|
|
124
|
-
|
|
125
|
-
print(f"User> {prompt}")
|
|
126
|
-
response = client.chat.completions.create(
|
|
127
|
-
model=model_id,
|
|
128
|
-
messages=[
|
|
129
|
-
{"role": "system", "content": "You are a helpful assistant."},
|
|
130
|
-
{"role": "user", "content": prompt},
|
|
131
|
-
],
|
|
132
|
-
)
|
|
133
|
-
print(f"Assistant> {response.choices[0].message.content}")
|
|
134
|
-
```
|
|
135
|
-
As more providers start supporting Llama 4, you can use them in Llama Stack as well. We are adding to the list. Stay tuned!
|
|
136
|
-
|
|
137
|
-
|
|
138
|
-
</details>
|
|
139
|
-
|
|
140
64
|
### 🚀 One-Line Installer 🚀
|
|
141
65
|
|
|
142
66
|
To try Llama Stack locally, run:
|
|
@@ -4,7 +4,7 @@ fire
|
|
|
4
4
|
httpx
|
|
5
5
|
jinja2>=3.1.6
|
|
6
6
|
jsonschema
|
|
7
|
-
llama-stack-client
|
|
7
|
+
llama-stack-client==0.3.5
|
|
8
8
|
openai>=1.107
|
|
9
9
|
prompt-toolkit
|
|
10
10
|
python-dotenv
|
|
@@ -23,9 +23,10 @@ opentelemetry-exporter-otlp-proto-http>=1.30.0
|
|
|
23
23
|
aiosqlite>=0.21.0
|
|
24
24
|
asyncpg
|
|
25
25
|
sqlalchemy[asyncio]>=2.0.41
|
|
26
|
+
starlette>=0.49.1
|
|
26
27
|
|
|
27
28
|
[ui]
|
|
28
29
|
streamlit
|
|
29
30
|
pandas
|
|
30
|
-
llama-stack-client
|
|
31
|
+
llama-stack-client==0.3.5
|
|
31
32
|
streamlit-option-menu
|
|
@@ -7,7 +7,7 @@ required-version = ">=0.7.0"
|
|
|
7
7
|
|
|
8
8
|
[project]
|
|
9
9
|
name = "llama_stack"
|
|
10
|
-
version = "0.3.
|
|
10
|
+
version = "0.3.5"
|
|
11
11
|
authors = [{ name = "Meta Llama", email = "llama-oss@meta.com" }]
|
|
12
12
|
description = "Llama Stack"
|
|
13
13
|
readme = "README.md"
|
|
@@ -30,7 +30,7 @@ dependencies = [
|
|
|
30
30
|
"httpx",
|
|
31
31
|
"jinja2>=3.1.6",
|
|
32
32
|
"jsonschema",
|
|
33
|
-
"llama-stack-client
|
|
33
|
+
"llama-stack-client==0.3.5",
|
|
34
34
|
"openai>=1.107", # for expires_after support
|
|
35
35
|
"prompt-toolkit",
|
|
36
36
|
"python-dotenv",
|
|
@@ -49,13 +49,14 @@ dependencies = [
|
|
|
49
49
|
"aiosqlite>=0.21.0", # server - for metadata store
|
|
50
50
|
"asyncpg", # for metadata store
|
|
51
51
|
"sqlalchemy[asyncio]>=2.0.41", # server - for conversations
|
|
52
|
+
"starlette>=0.49.1",
|
|
52
53
|
]
|
|
53
54
|
|
|
54
55
|
[project.optional-dependencies]
|
|
55
56
|
ui = [
|
|
56
57
|
"streamlit",
|
|
57
58
|
"pandas",
|
|
58
|
-
"llama-stack-client
|
|
59
|
+
"llama-stack-client==0.3.5",
|
|
59
60
|
"streamlit-option-menu",
|
|
60
61
|
]
|
|
61
62
|
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|
|
File without changes
|