PyPI - llama-stack - Versions diffs - 0.4.3__py3-none-any.whl → 0.5.0rc1__py3-none-any.whl - Mend

llama-stack 0.4.3py3-none-any.whl → 0.5.0rc1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (307) hide show

llama_stack/cli/stack/_list_deps.py +11 -7
llama_stack/cli/stack/run.py +3 -25
llama_stack/core/access_control/datatypes.py +78 -0
llama_stack/core/configure.py +2 -2
{llama_stack_api/internal → llama_stack/core/connectors}/__init__.py +2 -2
llama_stack/core/connectors/connectors.py +162 -0
llama_stack/core/conversations/conversations.py +61 -58
llama_stack/core/datatypes.py +54 -8
llama_stack/core/library_client.py +60 -13
llama_stack/core/prompts/prompts.py +43 -42
llama_stack/core/routers/datasets.py +20 -17
llama_stack/core/routers/eval_scoring.py +143 -53
llama_stack/core/routers/inference.py +20 -9
llama_stack/core/routers/safety.py +30 -42
llama_stack/core/routers/vector_io.py +15 -7
llama_stack/core/routing_tables/models.py +42 -3
llama_stack/core/routing_tables/scoring_functions.py +19 -19
llama_stack/core/routing_tables/shields.py +20 -17
llama_stack/core/routing_tables/vector_stores.py +8 -5
llama_stack/core/server/auth.py +192 -17
llama_stack/core/server/fastapi_router_registry.py +40 -5
llama_stack/core/server/server.py +24 -5
llama_stack/core/stack.py +54 -10
llama_stack/core/storage/datatypes.py +9 -0
llama_stack/core/store/registry.py +1 -1
llama_stack/core/utils/exec.py +2 -2
llama_stack/core/utils/type_inspection.py +16 -2
llama_stack/distributions/dell/config.yaml +4 -1
llama_stack/distributions/dell/doc_template.md +209 -0
llama_stack/distributions/dell/run-with-safety.yaml +4 -1
llama_stack/distributions/nvidia/config.yaml +4 -1
llama_stack/distributions/nvidia/doc_template.md +170 -0
llama_stack/distributions/nvidia/run-with-safety.yaml +4 -1
llama_stack/distributions/oci/config.yaml +4 -1
llama_stack/distributions/oci/doc_template.md +140 -0
llama_stack/distributions/open-benchmark/config.yaml +9 -1
llama_stack/distributions/postgres-demo/config.yaml +1 -1
llama_stack/distributions/starter/build.yaml +62 -0
llama_stack/distributions/starter/config.yaml +22 -3
llama_stack/distributions/starter/run-with-postgres-store.yaml +22 -3
llama_stack/distributions/starter/starter.py +13 -1
llama_stack/distributions/starter-gpu/build.yaml +62 -0
llama_stack/distributions/starter-gpu/config.yaml +22 -3
llama_stack/distributions/starter-gpu/run-with-postgres-store.yaml +22 -3
llama_stack/distributions/template.py +10 -2
llama_stack/distributions/watsonx/config.yaml +4 -1
llama_stack/log.py +1 -0
llama_stack/models/llama/resources/dog.jpg +0 -0
llama_stack/models/llama/resources/pasta.jpeg +0 -0
llama_stack/models/llama/resources/small_dog.jpg +0 -0
llama_stack/providers/inline/agents/meta_reference/__init__.py +1 -0
llama_stack/providers/inline/agents/meta_reference/agents.py +57 -61
llama_stack/providers/inline/agents/meta_reference/responses/openai_responses.py +183 -60
llama_stack/providers/inline/agents/meta_reference/responses/streaming.py +94 -22
llama_stack/providers/inline/agents/meta_reference/responses/types.py +2 -1
llama_stack/providers/inline/agents/meta_reference/responses/utils.py +4 -1
llama_stack/providers/inline/agents/meta_reference/safety.py +2 -2
llama_stack/providers/inline/batches/reference/batches.py +2 -1
llama_stack/providers/inline/eval/meta_reference/eval.py +40 -32
llama_stack/providers/inline/ios/inference/LocalInferenceImpl/LocalInference.h +9 -0
llama_stack/providers/inline/ios/inference/LocalInferenceImpl/LocalInference.swift +189 -0
llama_stack/providers/inline/ios/inference/LocalInferenceImpl/Parsing.swift +238 -0
llama_stack/providers/inline/ios/inference/LocalInferenceImpl/PromptTemplate.swift +12 -0
llama_stack/providers/inline/ios/inference/LocalInferenceImpl/SystemPrompts.swift +89 -0
llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.pbxproj +550 -0
llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.xcworkspace/contents.xcworkspacedata +7 -0
llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist +8 -0
llama_stack/providers/inline/post_training/huggingface/post_training.py +33 -38
llama_stack/providers/inline/post_training/huggingface/utils.py +2 -5
llama_stack/providers/inline/post_training/torchtune/post_training.py +28 -33
llama_stack/providers/inline/post_training/torchtune/recipes/lora_finetuning_single_device.py +2 -4
llama_stack/providers/inline/safety/code_scanner/code_scanner.py +12 -15
llama_stack/providers/inline/safety/llama_guard/llama_guard.py +15 -18
llama_stack/providers/inline/safety/prompt_guard/prompt_guard.py +11 -17
llama_stack/providers/inline/scoring/basic/scoring.py +13 -17
llama_stack/providers/inline/scoring/braintrust/braintrust.py +15 -15
llama_stack/providers/inline/scoring/llm_as_judge/scoring.py +13 -17
llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py +1 -1
llama_stack/providers/registry/agents.py +1 -0
llama_stack/providers/registry/inference.py +1 -9
llama_stack/providers/registry/vector_io.py +136 -16
llama_stack/providers/remote/datasetio/nvidia/README.md +74 -0
llama_stack/providers/remote/eval/nvidia/README.md +134 -0
llama_stack/providers/remote/eval/nvidia/eval.py +22 -21
llama_stack/providers/remote/files/s3/README.md +266 -0
llama_stack/providers/remote/files/s3/config.py +5 -3
llama_stack/providers/remote/files/s3/files.py +2 -2
llama_stack/providers/remote/inference/gemini/gemini.py +4 -0
llama_stack/providers/remote/inference/nvidia/NVIDIA.md +203 -0
llama_stack/providers/remote/inference/openai/openai.py +2 -0
llama_stack/providers/remote/inference/together/together.py +4 -0
llama_stack/providers/remote/inference/vertexai/config.py +3 -3
llama_stack/providers/remote/inference/vertexai/vertexai.py +5 -2
llama_stack/providers/remote/inference/vllm/config.py +37 -18
llama_stack/providers/remote/inference/vllm/vllm.py +0 -3
llama_stack/providers/remote/inference/watsonx/watsonx.py +4 -0
llama_stack/providers/remote/post_training/nvidia/README.md +151 -0
llama_stack/providers/remote/post_training/nvidia/post_training.py +31 -33
llama_stack/providers/remote/safety/bedrock/bedrock.py +10 -27
llama_stack/providers/remote/safety/nvidia/README.md +78 -0
llama_stack/providers/remote/safety/nvidia/nvidia.py +9 -25
llama_stack/providers/remote/safety/sambanova/sambanova.py +13 -11
llama_stack/providers/remote/vector_io/elasticsearch/__init__.py +17 -0
llama_stack/providers/remote/vector_io/elasticsearch/config.py +32 -0
llama_stack/providers/remote/vector_io/elasticsearch/elasticsearch.py +463 -0
llama_stack/providers/remote/vector_io/oci/__init__.py +22 -0
llama_stack/providers/remote/vector_io/oci/config.py +41 -0
llama_stack/providers/remote/vector_io/oci/oci26ai.py +595 -0
llama_stack/providers/remote/vector_io/pgvector/config.py +69 -2
llama_stack/providers/remote/vector_io/pgvector/pgvector.py +255 -6
llama_stack/providers/remote/vector_io/qdrant/qdrant.py +62 -38
llama_stack/providers/utils/bedrock/client.py +3 -3
llama_stack/providers/utils/bedrock/config.py +7 -7
llama_stack/providers/utils/inference/embedding_mixin.py +4 -0
llama_stack/providers/utils/inference/http_client.py +239 -0
llama_stack/providers/utils/inference/litellm_openai_mixin.py +5 -0
llama_stack/providers/utils/inference/model_registry.py +148 -2
llama_stack/providers/utils/inference/openai_compat.py +2 -1
llama_stack/providers/utils/inference/openai_mixin.py +41 -2
llama_stack/providers/utils/memory/openai_vector_store_mixin.py +92 -5
llama_stack/providers/utils/memory/vector_store.py +46 -19
llama_stack/providers/utils/responses/responses_store.py +40 -6
llama_stack/providers/utils/safety.py +114 -0
llama_stack/providers/utils/tools/mcp.py +44 -3
llama_stack/testing/api_recorder.py +9 -3
{llama_stack-0.4.3.dist-info → llama_stack-0.5.0rc1.dist-info}/METADATA +14 -2
{llama_stack-0.4.3.dist-info → llama_stack-0.5.0rc1.dist-info}/RECORD +131 -275
llama_stack-0.5.0rc1.dist-info/top_level.txt +1 -0
llama_stack/distributions/meta-reference-gpu/__init__.py +0 -7
llama_stack/distributions/meta-reference-gpu/config.yaml +0 -140
llama_stack/distributions/meta-reference-gpu/meta_reference.py +0 -163
llama_stack/distributions/meta-reference-gpu/run-with-safety.yaml +0 -155
llama_stack/models/llama/hadamard_utils.py +0 -88
llama_stack/models/llama/llama3/args.py +0 -74
llama_stack/models/llama/llama3/generation.py +0 -378
llama_stack/models/llama/llama3/model.py +0 -304
llama_stack/models/llama/llama3/multimodal/__init__.py +0 -12
llama_stack/models/llama/llama3/multimodal/encoder_utils.py +0 -180
llama_stack/models/llama/llama3/multimodal/image_transform.py +0 -409
llama_stack/models/llama/llama3/multimodal/model.py +0 -1430
llama_stack/models/llama/llama3/multimodal/utils.py +0 -26
llama_stack/models/llama/llama3/quantization/__init__.py +0 -5
llama_stack/models/llama/llama3/quantization/loader.py +0 -316
llama_stack/models/llama/llama3_1/__init__.py +0 -12
llama_stack/models/llama/llama3_1/prompt_format.md +0 -358
llama_stack/models/llama/llama3_1/prompts.py +0 -258
llama_stack/models/llama/llama3_2/__init__.py +0 -5
llama_stack/models/llama/llama3_2/prompts_text.py +0 -229
llama_stack/models/llama/llama3_2/prompts_vision.py +0 -126
llama_stack/models/llama/llama3_2/text_prompt_format.md +0 -286
llama_stack/models/llama/llama3_2/vision_prompt_format.md +0 -141
llama_stack/models/llama/llama3_3/__init__.py +0 -5
llama_stack/models/llama/llama3_3/prompts.py +0 -259
llama_stack/models/llama/llama4/args.py +0 -107
llama_stack/models/llama/llama4/ffn.py +0 -58
llama_stack/models/llama/llama4/moe.py +0 -214
llama_stack/models/llama/llama4/preprocess.py +0 -435
llama_stack/models/llama/llama4/quantization/__init__.py +0 -5
llama_stack/models/llama/llama4/quantization/loader.py +0 -226
llama_stack/models/llama/llama4/vision/__init__.py +0 -5
llama_stack/models/llama/llama4/vision/embedding.py +0 -210
llama_stack/models/llama/llama4/vision/encoder.py +0 -412
llama_stack/models/llama/quantize_impls.py +0 -316
llama_stack/providers/inline/inference/meta_reference/__init__.py +0 -20
llama_stack/providers/inline/inference/meta_reference/common.py +0 -24
llama_stack/providers/inline/inference/meta_reference/config.py +0 -68
llama_stack/providers/inline/inference/meta_reference/generators.py +0 -201
llama_stack/providers/inline/inference/meta_reference/inference.py +0 -542
llama_stack/providers/inline/inference/meta_reference/model_parallel.py +0 -77
llama_stack/providers/inline/inference/meta_reference/parallel_utils.py +0 -353
llama_stack-0.4.3.dist-info/top_level.txt +0 -2
llama_stack_api/__init__.py +0 -945
llama_stack_api/admin/__init__.py +0 -45
llama_stack_api/admin/api.py +0 -72
llama_stack_api/admin/fastapi_routes.py +0 -117
llama_stack_api/admin/models.py +0 -113
llama_stack_api/agents.py +0 -173
llama_stack_api/batches/__init__.py +0 -40
llama_stack_api/batches/api.py +0 -53
llama_stack_api/batches/fastapi_routes.py +0 -113
llama_stack_api/batches/models.py +0 -78
llama_stack_api/benchmarks/__init__.py +0 -43
llama_stack_api/benchmarks/api.py +0 -39
llama_stack_api/benchmarks/fastapi_routes.py +0 -109
llama_stack_api/benchmarks/models.py +0 -109
llama_stack_api/common/__init__.py +0 -5
llama_stack_api/common/content_types.py +0 -101
llama_stack_api/common/errors.py +0 -95
llama_stack_api/common/job_types.py +0 -38
llama_stack_api/common/responses.py +0 -77
llama_stack_api/common/training_types.py +0 -47
llama_stack_api/common/type_system.py +0 -146
llama_stack_api/connectors.py +0 -146
llama_stack_api/conversations.py +0 -270
llama_stack_api/datasetio.py +0 -55
llama_stack_api/datasets/__init__.py +0 -61
llama_stack_api/datasets/api.py +0 -35
llama_stack_api/datasets/fastapi_routes.py +0 -104
llama_stack_api/datasets/models.py +0 -152
llama_stack_api/datatypes.py +0 -373
llama_stack_api/eval.py +0 -137
llama_stack_api/file_processors/__init__.py +0 -27
llama_stack_api/file_processors/api.py +0 -64
llama_stack_api/file_processors/fastapi_routes.py +0 -78
llama_stack_api/file_processors/models.py +0 -42
llama_stack_api/files/__init__.py +0 -35
llama_stack_api/files/api.py +0 -51
llama_stack_api/files/fastapi_routes.py +0 -124
llama_stack_api/files/models.py +0 -107
llama_stack_api/inference.py +0 -1169
llama_stack_api/inspect_api/__init__.py +0 -37
llama_stack_api/inspect_api/api.py +0 -25
llama_stack_api/inspect_api/fastapi_routes.py +0 -76
llama_stack_api/inspect_api/models.py +0 -28
llama_stack_api/internal/kvstore.py +0 -28
llama_stack_api/internal/sqlstore.py +0 -81
llama_stack_api/llama_stack_api/__init__.py +0 -945
llama_stack_api/llama_stack_api/admin/__init__.py +0 -45
llama_stack_api/llama_stack_api/admin/api.py +0 -72
llama_stack_api/llama_stack_api/admin/fastapi_routes.py +0 -117
llama_stack_api/llama_stack_api/admin/models.py +0 -113
llama_stack_api/llama_stack_api/agents.py +0 -173
llama_stack_api/llama_stack_api/batches/__init__.py +0 -40
llama_stack_api/llama_stack_api/batches/api.py +0 -53
llama_stack_api/llama_stack_api/batches/fastapi_routes.py +0 -113
llama_stack_api/llama_stack_api/batches/models.py +0 -78
llama_stack_api/llama_stack_api/benchmarks/__init__.py +0 -43
llama_stack_api/llama_stack_api/benchmarks/api.py +0 -39
llama_stack_api/llama_stack_api/benchmarks/fastapi_routes.py +0 -109
llama_stack_api/llama_stack_api/benchmarks/models.py +0 -109
llama_stack_api/llama_stack_api/common/__init__.py +0 -5
llama_stack_api/llama_stack_api/common/content_types.py +0 -101
llama_stack_api/llama_stack_api/common/errors.py +0 -95
llama_stack_api/llama_stack_api/common/job_types.py +0 -38
llama_stack_api/llama_stack_api/common/responses.py +0 -77
llama_stack_api/llama_stack_api/common/training_types.py +0 -47
llama_stack_api/llama_stack_api/common/type_system.py +0 -146
llama_stack_api/llama_stack_api/connectors.py +0 -146
llama_stack_api/llama_stack_api/conversations.py +0 -270
llama_stack_api/llama_stack_api/datasetio.py +0 -55
llama_stack_api/llama_stack_api/datasets/__init__.py +0 -61
llama_stack_api/llama_stack_api/datasets/api.py +0 -35
llama_stack_api/llama_stack_api/datasets/fastapi_routes.py +0 -104
llama_stack_api/llama_stack_api/datasets/models.py +0 -152
llama_stack_api/llama_stack_api/datatypes.py +0 -373
llama_stack_api/llama_stack_api/eval.py +0 -137
llama_stack_api/llama_stack_api/file_processors/__init__.py +0 -27
llama_stack_api/llama_stack_api/file_processors/api.py +0 -64
llama_stack_api/llama_stack_api/file_processors/fastapi_routes.py +0 -78
llama_stack_api/llama_stack_api/file_processors/models.py +0 -42
llama_stack_api/llama_stack_api/files/__init__.py +0 -35
llama_stack_api/llama_stack_api/files/api.py +0 -51
llama_stack_api/llama_stack_api/files/fastapi_routes.py +0 -124
llama_stack_api/llama_stack_api/files/models.py +0 -107
llama_stack_api/llama_stack_api/inference.py +0 -1169
llama_stack_api/llama_stack_api/inspect_api/__init__.py +0 -37
llama_stack_api/llama_stack_api/inspect_api/api.py +0 -25
llama_stack_api/llama_stack_api/inspect_api/fastapi_routes.py +0 -76
llama_stack_api/llama_stack_api/inspect_api/models.py +0 -28
llama_stack_api/llama_stack_api/internal/__init__.py +0 -9
llama_stack_api/llama_stack_api/internal/kvstore.py +0 -28
llama_stack_api/llama_stack_api/internal/sqlstore.py +0 -81
llama_stack_api/llama_stack_api/models.py +0 -171
llama_stack_api/llama_stack_api/openai_responses.py +0 -1468
llama_stack_api/llama_stack_api/post_training.py +0 -370
llama_stack_api/llama_stack_api/prompts.py +0 -203
llama_stack_api/llama_stack_api/providers/__init__.py +0 -33
llama_stack_api/llama_stack_api/providers/api.py +0 -16
llama_stack_api/llama_stack_api/providers/fastapi_routes.py +0 -57
llama_stack_api/llama_stack_api/providers/models.py +0 -24
llama_stack_api/llama_stack_api/py.typed +0 -0
llama_stack_api/llama_stack_api/rag_tool.py +0 -168
llama_stack_api/llama_stack_api/resource.py +0 -37
llama_stack_api/llama_stack_api/router_utils.py +0 -160
llama_stack_api/llama_stack_api/safety.py +0 -132
llama_stack_api/llama_stack_api/schema_utils.py +0 -208
llama_stack_api/llama_stack_api/scoring.py +0 -93
llama_stack_api/llama_stack_api/scoring_functions.py +0 -211
llama_stack_api/llama_stack_api/shields.py +0 -93
llama_stack_api/llama_stack_api/tools.py +0 -226
llama_stack_api/llama_stack_api/vector_io.py +0 -941
llama_stack_api/llama_stack_api/vector_stores.py +0 -53
llama_stack_api/llama_stack_api/version.py +0 -9
llama_stack_api/models.py +0 -171
llama_stack_api/openai_responses.py +0 -1468
llama_stack_api/post_training.py +0 -370
llama_stack_api/prompts.py +0 -203
llama_stack_api/providers/__init__.py +0 -33
llama_stack_api/providers/api.py +0 -16
llama_stack_api/providers/fastapi_routes.py +0 -57
llama_stack_api/providers/models.py +0 -24
llama_stack_api/py.typed +0 -0
llama_stack_api/rag_tool.py +0 -168
llama_stack_api/resource.py +0 -37
llama_stack_api/router_utils.py +0 -160
llama_stack_api/safety.py +0 -132
llama_stack_api/schema_utils.py +0 -208
llama_stack_api/scoring.py +0 -93
llama_stack_api/scoring_functions.py +0 -211
llama_stack_api/shields.py +0 -93
llama_stack_api/tools.py +0 -226
llama_stack_api/vector_io.py +0 -941
llama_stack_api/vector_stores.py +0 -53
llama_stack_api/version.py +0 -9
{llama_stack-0.4.3.dist-info → llama_stack-0.5.0rc1.dist-info}/WHEEL +0 -0
{llama_stack-0.4.3.dist-info → llama_stack-0.5.0rc1.dist-info}/entry_points.txt +0 -0
{llama_stack-0.4.3.dist-info → llama_stack-0.5.0rc1.dist-info}/licenses/LICENSE +0 -0

llama_stack/core/datatypes.py CHANGED Viewed

@@ -11,7 +11,7 @@ from urllib.parse import urlparse
 from pydantic import BaseModel, Field, field_validator, model_validator
-from llama_stack.core.access_control.datatypes import AccessRule
+from llama_stack.core.access_control.datatypes import AccessRule, RouteAccessRule
 from llama_stack.core.storage.datatypes import (
     KVStoreReference,
     StorageBackendType,
@@ -329,13 +329,17 @@ AuthProviderConfig = Annotated[
 class AuthenticationConfig(BaseModel):
     """Top-level authentication configuration."""
-    provider_config: AuthProviderConfig = Field(
-        ...,
-        description="Authentication provider configuration",
+    provider_config: AuthProviderConfig | None = Field(
+        default=None,
+        description="Authentication provider configuration (optional if only using route_policy)",
+    )
+    route_policy: list[RouteAccessRule] = Field(
+        default=[],
+        description="Rules for determining access to API routes (infrastructure-level)",
     )
     access_policy: list[AccessRule] = Field(
         default=[],
-        description="Rules for determining access to resources",
+        description="Rules for determining access to resources (data-level)",
     )
@@ -348,6 +352,7 @@ class QualifiedModel(BaseModel):
     provider_id: str
     model_id: str
+    embedding_dimensions: int | None = None
 class RewriteQueryParams(BaseModel):
@@ -654,7 +659,6 @@ class RegisteredResources(BaseModel):
     scoring_fns: list[ScoringFnInput] = Field(default_factory=list)
     benchmarks: list[BenchmarkInput] = Field(default_factory=list)
     tool_groups: list[ToolGroupInput] = Field(default_factory=list)
-    connectors: list[ConnectorInput] = Field(default_factory=list)
 class ServerConfig(BaseModel):
@@ -703,11 +707,20 @@ class ServerConfig(BaseModel):
 class StackConfig(BaseModel):
     version: int = LLAMA_STACK_RUN_CONFIG_VERSION
-    image_name: str = Field(
-        ...,
+    distro_name: str | None = Field(
+        default=None,
         description="""
 Reference to the distribution this package refers to. For unregistered (adhoc) packages,
 this could be just a hash
+""",
+    )
+    image_name: str | None = Field(
+        default=None,
+        deprecated=True,
+        description="""
+DEPRECATED: Use 'distro_name' instead. This field is maintained for backward compatibility.
+Reference to the distribution this package refers to. For unregistered (adhoc) packages,
+this could be just a hash
 """,
     )
     container_image: str | None = Field(
@@ -763,6 +776,11 @@ can be instantiated multiple times (with different configs) if necessary.
         description="Configuration for default moderations model",
     )
+    connectors: list[ConnectorInput] = Field(
+        default_factory=list,
+        description="List of connectors to register at stack startup",
+    )
     @field_validator("external_providers_dir")
     @classmethod
     def validate_external_providers_dir(cls, v):
@@ -772,6 +790,34 @@ can be instantiated multiple times (with different configs) if necessary.
             return Path(v)
         return v
+    @model_validator(mode="after")
+    def validate_distro_name_migration(self) -> "StackConfig":
+        """Handle migration from image_name to distro_name."""
+        import warnings
+        if self.distro_name is None and self.image_name is None:
+            raise ValueError("Either 'distro_name' or 'image_name' must be provided")
+        if self.image_name is not None and self.distro_name is None:
+            # Migrate from image_name to distro_name
+            warnings.warn(
+                "The 'image_name' field is deprecated. Please use 'distro_name' instead.",
+                DeprecationWarning,
+                stacklevel=2,
+            )
+            self.distro_name = self.image_name
+        elif self.image_name is not None and self.distro_name is not None:
+            # Both provided - warn and prefer distro_name
+            warnings.warn(
+                "Both 'image_name' and 'distro_name' were provided. "
+                "The 'image_name' field is deprecated and will be ignored. "
+                "Please use only 'distro_name' in your configuration.",
+                DeprecationWarning,
+                stacklevel=2,
+            )
+        return self
     @model_validator(mode="after")
     def validate_server_stores(self) -> "StackConfig":
         backend_map = self.storage.backends

llama_stack/core/library_client.py CHANGED Viewed

@@ -20,7 +20,7 @@ import httpx
 import yaml
 from fastapi import Response as FastAPIResponse
-from llama_stack.core.utils.type_inspection import is_unwrapped_body_param
+from llama_stack.core.utils.type_inspection import is_body_param, is_unwrapped_body_param
 try:
     from llama_stack_client import (
@@ -504,11 +504,30 @@ class AsyncLlamaStackAsLibraryClient(AsyncLlamaStackClient):
         # Prepare body for the function call (handles both Pydantic and traditional params)
         body = self._convert_body(func, body)
+        result = await func(**body)
+        content_type = "application/json"
+        if isinstance(result, FastAPIResponse):
+            content_type = result.media_type or content_type
         async def gen():
-            async for chunk in await func(**body):
-                data = json.dumps(convert_pydantic_to_json_value(chunk))
-                sse_event = f"data: {data}\n\n"
-                yield sse_event.encode("utf-8")
+            # Handle FastAPI StreamingResponse (returned by router endpoints)
+            # Extract the async generator from the StreamingResponse body
+            from fastapi.responses import StreamingResponse
+            if isinstance(result, StreamingResponse):
+                # StreamingResponse.body_iterator is the async generator
+                async for chunk in result.body_iterator:
+                    # Chunk is already SSE-formatted string from sse_generator, encode to bytes
+                    if isinstance(chunk, str):
+                        yield chunk.encode("utf-8")
+                    else:
+                        yield chunk
+            else:
+                # Direct async generator from implementation
+                async for chunk in result:
+                    data = json.dumps(convert_pydantic_to_json_value(chunk))
+                    sse_event = f"data: {data}\n\n"
+                    yield sse_event.encode("utf-8")
         wrapped_gen = preserve_contexts_async_generator(gen(), [PROVIDER_DATA_VAR])
@@ -516,7 +535,7 @@ class AsyncLlamaStackAsLibraryClient(AsyncLlamaStackClient):
             status_code=httpx.codes.OK,
             content=wrapped_gen,
             headers={
-                "Content-Type": "application/json",
+                "Content-Type": content_type,
             },
             request=httpx.Request(
                 method=options.method,
@@ -549,10 +568,26 @@ class AsyncLlamaStackAsLibraryClient(AsyncLlamaStackClient):
         sig = inspect.signature(func)
         params_list = [p for p in sig.parameters.values() if p.name != "self"]
+        # Resolve string annotations (from `from __future__ import annotations`) to actual types
+        try:
+            type_hints = typing.get_type_hints(func, include_extras=True)
+        except NameError as e:
+            # Forward reference could not be resolved - fall back to raw annotations
+            logger.debug(f"Could not resolve type hints for {func.__name__}: {e}")
+            type_hints = {}
+        except Exception as e:
+            # Unexpected error - log and fall back
+            logger.warning(f"Failed to resolve type hints for {func.__name__}: {e}")
+            type_hints = {}
+        # Helper to get the resolved type for a parameter
+        def get_param_type(param: inspect.Parameter) -> Any:
+            return type_hints.get(param.name, param.annotation)
         # Flatten if there's a single unwrapped body parameter (BaseModel or Annotated[BaseModel, Body(embed=False)])
         if len(params_list) == 1:
             param = params_list[0]
-            param_type = param.annotation
+            param_type = get_param_type(param)
             if is_unwrapped_body_param(param_type):
                 base_type = get_args(param_type)[0]
                 return {param.name: base_type(**body)}
@@ -563,16 +598,22 @@ class AsyncLlamaStackAsLibraryClient(AsyncLlamaStackClient):
         # Check if there's an unwrapped body parameter among multiple parameters
         # (e.g., path param + body param like: vector_store_id: str, params: Annotated[Model, Body(...)])
         unwrapped_body_param = None
+        unwrapped_body_param_type = None
+        body_param = None
         for param in params_list:
-            if is_unwrapped_body_param(param.annotation):
+            param_type = get_param_type(param)
+            if is_unwrapped_body_param(param_type):
                 unwrapped_body_param = param
+                unwrapped_body_param_type = param_type
                 break
+            if body_param is None and is_body_param(param_type):
+                body_param = param
         # Check for parameters with Depends() annotation (FastAPI router endpoints)
         # These need special handling: construct the request model from body
         depends_param = None
         for param in params_list:
-            param_type = param.annotation
+            param_type = get_param_type(param)
             if get_origin(param_type) is typing.Annotated:
                 args = get_args(param_type)
                 if len(args) > 1:
@@ -595,11 +636,12 @@ class AsyncLlamaStackAsLibraryClient(AsyncLlamaStackClient):
                 if param_name in exclude_params:
                     converted_body[param_name] = value
                 else:
-                    converted_body[param_name] = convert_to_pydantic(param.annotation, value)
+                    resolved_type = get_param_type(param)
+                    converted_body[param_name] = convert_to_pydantic(resolved_type, value)
         # Handle Depends parameter: construct request model from body
         if depends_param and depends_param.name not in converted_body:
-            param_type = depends_param.annotation
+            param_type = get_param_type(depends_param)
             if get_origin(param_type) is typing.Annotated:
                 base_type = get_args(param_type)[0]
                 # Handle Union types (e.g., SomeRequestModel | None) - extract the non-None type
@@ -619,10 +661,15 @@ class AsyncLlamaStackAsLibraryClient(AsyncLlamaStackClient):
                     converted_body[depends_param.name] = base_type(**body)
         # handle unwrapped body parameter after processing all named parameters
-        if unwrapped_body_param:
-            base_type = get_args(unwrapped_body_param.annotation)[0]
+        if unwrapped_body_param and unwrapped_body_param_type:
+            base_type = get_args(unwrapped_body_param_type)[0]
             # extract only keys not already used by other params
             remaining_keys = {k: v for k, v in body.items() if k not in converted_body}
             converted_body[unwrapped_body_param.name] = base_type(**remaining_keys)
+        elif body_param and body_param.name not in converted_body:
+            body_param_type = get_param_type(body_param)
+            base_type = get_args(body_param_type)[0]
+            remaining_keys = {k: v for k, v in body.items() if k not in converted_body}
+            converted_body[body_param.name] = base_type(**remaining_keys)
         return converted_body

llama_stack/core/prompts/prompts.py CHANGED Viewed

@@ -11,7 +11,17 @@ from pydantic import BaseModel
 from llama_stack.core.datatypes import StackConfig
 from llama_stack.core.storage.kvstore import KVStore, kvstore_impl
-from llama_stack_api import ListPromptsResponse, Prompt, Prompts
+from llama_stack_api import (
+    CreatePromptRequest,
+    DeletePromptRequest,
+    GetPromptRequest,
+    ListPromptsResponse,
+    ListPromptVersionsRequest,
+    Prompt,
+    Prompts,
+    SetDefaultVersionRequest,
+    UpdatePromptRequest,
+)
 class PromptServiceConfig(BaseModel):
@@ -114,26 +124,23 @@ class PromptServiceImpl(Prompts):
         prompts.sort(key=lambda p: p.prompt_id or "", reverse=True)
         return ListPromptsResponse(data=prompts)
-    async def get_prompt(self, prompt_id: str, version: int | None = None) -> Prompt:
+    async def get_prompt(self, request: GetPromptRequest) -> Prompt:
         """Get a prompt by its identifier and optional version."""
-        key = await self._get_prompt_key(prompt_id, version)
+        key = await self._get_prompt_key(request.prompt_id, request.version)
         data = await self.kvstore.get(key)
         if data is None:
-            raise ValueError(f"Prompt {prompt_id}:{version if version else 'default'} not found")
+            raise ValueError(
+                f"Prompt {request.prompt_id}:{request.version if request.version else 'default'} not found"
+            )
         return self._deserialize_prompt(data)
-    async def create_prompt(
-        self,
-        prompt: str,
-        variables: list[str] | None = None,
-    ) -> Prompt:
+    async def create_prompt(self, request: CreatePromptRequest) -> Prompt:
         """Create a new prompt."""
-        if variables is None:
-            variables = []
+        variables = request.variables if request.variables is not None else []
         prompt_obj = Prompt(
             prompt_id=Prompt.generate_prompt_id(),
-            prompt=prompt,
+            prompt=request.prompt,
             version=1,
             variables=variables,
         )
@@ -147,55 +154,49 @@ class PromptServiceImpl(Prompts):
         return prompt_obj
-    async def update_prompt(
-        self,
-        prompt_id: str,
-        prompt: str,
-        version: int,
-        variables: list[str] | None = None,
-        set_as_default: bool = True,
-    ) -> Prompt:
+    async def update_prompt(self, request: UpdatePromptRequest) -> Prompt:
         """Update an existing prompt (increments version)."""
-        if version < 1:
+        if request.version < 1:
             raise ValueError("Version must be >= 1")
-        if variables is None:
-            variables = []
+        variables = request.variables if request.variables is not None else []
-        prompt_versions = await self.list_prompt_versions(prompt_id)
+        prompt_versions = await self.list_prompt_versions(ListPromptVersionsRequest(prompt_id=request.prompt_id))
         latest_prompt = max(prompt_versions.data, key=lambda x: int(x.version))
-        if version and latest_prompt.version != version:
+        if request.version and latest_prompt.version != request.version:
             raise ValueError(
-                f"'{version}' is not the latest prompt version for prompt_id='{prompt_id}'. Use the latest version '{latest_prompt.version}' in request."
+                f"'{request.version}' is not the latest prompt version for prompt_id='{request.prompt_id}'. Use the latest version '{latest_prompt.version}' in request."
             )
-        current_version = latest_prompt.version if version is None else version
+        current_version = latest_prompt.version if request.version is None else request.version
         new_version = current_version + 1
-        updated_prompt = Prompt(prompt_id=prompt_id, prompt=prompt, version=new_version, variables=variables)
+        updated_prompt = Prompt(
+            prompt_id=request.prompt_id, prompt=request.prompt, version=new_version, variables=variables
+        )
-        version_key = self._get_version_key(prompt_id, str(new_version))
+        version_key = self._get_version_key(request.prompt_id, str(new_version))
         data = self._serialize_prompt(updated_prompt)
         await self.kvstore.set(version_key, data)
-        if set_as_default:
-            await self.set_default_version(prompt_id, new_version)
+        if request.set_as_default:
+            await self.set_default_version(SetDefaultVersionRequest(prompt_id=request.prompt_id, version=new_version))
         return updated_prompt
-    async def delete_prompt(self, prompt_id: str) -> None:
+    async def delete_prompt(self, request: DeletePromptRequest) -> None:
         """Delete a prompt and all its versions."""
-        await self.get_prompt(prompt_id)
+        await self.get_prompt(GetPromptRequest(prompt_id=request.prompt_id))
-        prefix = f"prompts:v1:{prompt_id}:"
+        prefix = f"prompts:v1:{request.prompt_id}:"
         keys = await self.kvstore.keys_in_range(prefix, prefix + "\xff")
         for key in keys:
             await self.kvstore.delete(key)
-    async def list_prompt_versions(self, prompt_id: str) -> ListPromptsResponse:
+    async def list_prompt_versions(self, request: ListPromptVersionsRequest) -> ListPromptsResponse:
         """List all versions of a specific prompt."""
-        prefix = f"prompts:v1:{prompt_id}:"
+        prefix = f"prompts:v1:{request.prompt_id}:"
         keys = await self.kvstore.keys_in_range(prefix, prefix + "\xff")
         default_version = None
@@ -211,7 +212,7 @@ class PromptServiceImpl(Prompts):
                     prompts.append(prompt_obj)
         if not prompts:
-            raise ValueError(f"Prompt {prompt_id} not found")
+            raise ValueError(f"Prompt {request.prompt_id} not found")
         for prompt in prompts:
             prompt.is_default = str(prompt.version) == default_version
@@ -219,15 +220,15 @@ class PromptServiceImpl(Prompts):
         prompts.sort(key=lambda x: x.version)
         return ListPromptsResponse(data=prompts)
-    async def set_default_version(self, prompt_id: str, version: int) -> Prompt:
+    async def set_default_version(self, request: SetDefaultVersionRequest) -> Prompt:
         """Set which version of a prompt should be the default, If not set. the default is the latest."""
-        version_key = self._get_version_key(prompt_id, str(version))
+        version_key = self._get_version_key(request.prompt_id, str(request.version))
         data = await self.kvstore.get(version_key)
         if data is None:
-            raise ValueError(f"Prompt {prompt_id} version {version} not found")
+            raise ValueError(f"Prompt {request.prompt_id} version {request.version} not found")
-        default_key = self._get_default_key(prompt_id)
-        await self.kvstore.set(default_key, str(version))
+        default_key = self._get_default_key(request.prompt_id)
+        await self.kvstore.set(default_key, str(request.version))
         return self._deserialize_prompt(data)

llama_stack/core/routers/datasets.py CHANGED Viewed

@@ -7,7 +7,15 @@
 from typing import Any
 from llama_stack.log import get_logger
-from llama_stack_api import DatasetIO, DatasetPurpose, DataSource, PaginatedResponse, RoutingTable
+from llama_stack_api import (
+    AppendRowsRequest,
+    DatasetIO,
+    DatasetPurpose,
+    DataSource,
+    IterRowsRequest,
+    PaginatedResponse,
+    RoutingTable,
+)
 logger = get_logger(name=__name__, category="core::routers")
@@ -45,26 +53,21 @@ class DatasetIORouter(DatasetIO):
             dataset_id=dataset_id,
         )
-    async def iterrows(
-        self,
-        dataset_id: str,
-        start_index: int | None = None,
-        limit: int | None = None,
-    ) -> PaginatedResponse:
+    async def iterrows(self, request: IterRowsRequest) -> PaginatedResponse:
         logger.debug(
-            f"DatasetIORouter.iterrows: {dataset_id}, {start_index=} {limit=}",
+            f"DatasetIORouter.iterrows: {request.dataset_id}, start_index={request.start_index} limit={request.limit}",
         )
-        provider = await self.routing_table.get_provider_impl(dataset_id)
+        provider = await self.routing_table.get_provider_impl(request.dataset_id)
         return await provider.iterrows(
-            dataset_id=dataset_id,
-            start_index=start_index,
-            limit=limit,
+            dataset_id=request.dataset_id,
+            start_index=request.start_index,
+            limit=request.limit,
         )
-    async def append_rows(self, dataset_id: str, rows: list[dict[str, Any]]) -> None:
-        logger.debug(f"DatasetIORouter.append_rows: {dataset_id}, {len(rows)} rows")
-        provider = await self.routing_table.get_provider_impl(dataset_id)
+    async def append_rows(self, request: AppendRowsRequest) -> None:
+        logger.debug(f"DatasetIORouter.append_rows: {request.dataset_id}, {len(request.rows)} rows")
+        provider = await self.routing_table.get_provider_impl(request.dataset_id)
         return await provider.append_rows(
-            dataset_id=dataset_id,
-            rows=rows,
+            dataset_id=request.dataset_id,
+            rows=request.rows,
         )

llama-stack 0.4.3__py3-none-any.whl → 0.5.0rc1__py3-none-any.whl

llama-stack 0.4.3py3-none-any.whl → 0.5.0rc1py3-none-any.whl