PyPI - llama-stack - Versions diffs - 0.3.2__py3-none-any.whl → 0.3.3__py3-none-any.whl - Mend

llama-stack 0.3.2py3-none-any.whl → 0.3.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (19) hide show

llama_stack/providers/inline/vector_io/faiss/faiss.py CHANGED Viewed

@@ -223,7 +223,8 @@ class FaissVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoco
             return HealthResponse(status=HealthStatus.ERROR, message=f"Health check failed: {str(e)}")
     async def register_vector_store(self, vector_store: VectorStore) -> None:
-        assert self.kvstore is not None
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before registering vector stores.")
         key = f"{VECTOR_DBS_PREFIX}{vector_store.identifier}"
         await self.kvstore.set(key=key, value=vector_store.model_dump_json())
@@ -239,7 +240,8 @@ class FaissVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoco
         return [i.vector_store for i in self.cache.values()]
     async def unregister_vector_store(self, vector_store_id: str) -> None:
-        assert self.kvstore is not None
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before unregistering vector stores.")
         if vector_store_id not in self.cache:
             return
@@ -248,6 +250,27 @@ class FaissVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoco
         del self.cache[vector_store_id]
         await self.kvstore.delete(f"{VECTOR_DBS_PREFIX}{vector_store_id}")
+    async def _get_and_cache_vector_store_index(self, vector_store_id: str) -> VectorStoreWithIndex | None:
+        if vector_store_id in self.cache:
+            return self.cache[vector_store_id]
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
+        key = f"{VECTOR_DBS_PREFIX}{vector_store_id}"
+        vector_store_data = await self.kvstore.get(key)
+        if not vector_store_data:
+            raise VectorStoreNotFoundError(vector_store_id)
+        vector_store = VectorStore.model_validate_json(vector_store_data)
+        index = VectorStoreWithIndex(
+            vector_store=vector_store,
+            index=await FaissIndex.create(vector_store.embedding_dimension, self.kvstore, vector_store.identifier),
+            inference_api=self.inference_api,
+        )
+        self.cache[vector_store_id] = index
+        return index
     async def insert_chunks(self, vector_db_id: str, chunks: list[Chunk], ttl_seconds: int | None = None) -> None:
         index = self.cache.get(vector_db_id)
         if index is None:

llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py CHANGED Viewed

@@ -412,6 +412,14 @@ class SQLiteVecVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresPro
         return [v.vector_store for v in self.cache.values()]
     async def register_vector_store(self, vector_store: VectorStore) -> None:
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before registering vector stores.")
+        # Save to kvstore for persistence
+        key = f"{VECTOR_DBS_PREFIX}{vector_store.identifier}"
+        await self.kvstore.set(key=key, value=vector_store.model_dump_json())
+        # Create and cache the index
         index = await SQLiteVecIndex.create(
             vector_store.embedding_dimension, self.config.db_path, vector_store.identifier
         )
@@ -421,13 +429,16 @@ class SQLiteVecVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresPro
         if vector_store_id in self.cache:
             return self.cache[vector_store_id]
-        if self.vector_store_table is None:
-            raise VectorStoreNotFoundError(vector_store_id)
+        # Try to load from kvstore
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
-        vector_store = self.vector_store_table.get_vector_store(vector_store_id)
-        if not vector_store:
+        key = f"{VECTOR_DBS_PREFIX}{vector_store_id}"
+        vector_store_data = await self.kvstore.get(key)
+        if not vector_store_data:
             raise VectorStoreNotFoundError(vector_store_id)
+        vector_store = VectorStore.model_validate_json(vector_store_data)
         index = VectorStoreWithIndex(
             vector_store=vector_store,
             index=SQLiteVecIndex(

llama_stack/providers/remote/inference/vertexai/vertexai.py CHANGED Viewed

@@ -4,6 +4,7 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.
+from collections.abc import Iterable
 import google.auth.transport.requests
 from google.auth import default
@@ -42,3 +43,12 @@ class VertexAIInferenceAdapter(OpenAIMixin):
         Source: https://cloud.google.com/vertex-ai/generative-ai/docs/start/openai
         """
         return f"https://{self.config.location}-aiplatform.googleapis.com/v1/projects/{self.config.project}/locations/{self.config.location}/endpoints/openapi"
+    async def list_provider_model_ids(self) -> Iterable[str]:
+        """
+        VertexAI doesn't currently offer a way to query a list of available models from Google's Model Garden
+        For now we return a hardcoded version of the available models
+        :return: An iterable of model IDs
+        """
+        return ["google/gemini-2.0-flash", "google/gemini-2.5-flash", "google/gemini-2.5-pro"]

llama_stack/providers/remote/vector_io/chroma/chroma.py CHANGED Viewed

@@ -131,7 +131,6 @@ class ChromaVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoc
     async def initialize(self) -> None:
         self.kvstore = await kvstore_impl(self.config.persistence)
-        self.vector_store_table = self.kvstore
         if isinstance(self.config, RemoteChromaVectorIOConfig):
             log.info(f"Connecting to Chroma server at: {self.config.url}")
@@ -190,9 +189,16 @@ class ChromaVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoc
         if vector_store_id in self.cache:
             return self.cache[vector_store_id]
-        vector_store = await self.vector_store_table.get_vector_store(vector_store_id)
-        if not vector_store:
+        # Try to load from kvstore
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
+        key = f"{VECTOR_DBS_PREFIX}{vector_store_id}"
+        vector_store_data = await self.kvstore.get(key)
+        if not vector_store_data:
             raise ValueError(f"Vector DB {vector_store_id} not found in Llama Stack")
+        vector_store = VectorStore.model_validate_json(vector_store_data)
         collection = await maybe_await(self.client.get_collection(vector_store_id))
         if not collection:
             raise ValueError(f"Vector DB {vector_store_id} not found in Chroma")

llama_stack/providers/remote/vector_io/milvus/milvus.py CHANGED Viewed

@@ -328,13 +328,16 @@ class MilvusVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoc
         if vector_store_id in self.cache:
             return self.cache[vector_store_id]
-        if self.vector_store_table is None:
-            raise VectorStoreNotFoundError(vector_store_id)
+        # Try to load from kvstore
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
-        vector_store = await self.vector_store_table.get_vector_store(vector_store_id)
-        if not vector_store:
+        key = f"{VECTOR_DBS_PREFIX}{vector_store_id}"
+        vector_store_data = await self.kvstore.get(key)
+        if not vector_store_data:
             raise VectorStoreNotFoundError(vector_store_id)
+        vector_store = VectorStore.model_validate_json(vector_store_data)
         index = VectorStoreWithIndex(
             vector_store=vector_store,
             index=MilvusIndex(client=self.client, collection_name=vector_store.identifier, kvstore=self.kvstore),

llama_stack/providers/remote/vector_io/pgvector/pgvector.py CHANGED Viewed

@@ -368,6 +368,22 @@ class PGVectorVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProt
             log.exception("Could not connect to PGVector database server")
             raise RuntimeError("Could not connect to PGVector database server") from e
+        # Load existing vector stores from KV store into cache
+        start_key = VECTOR_DBS_PREFIX
+        end_key = f"{VECTOR_DBS_PREFIX}\xff"
+        stored_vector_stores = await self.kvstore.values_in_range(start_key, end_key)
+        for vector_store_data in stored_vector_stores:
+            vector_store = VectorStore.model_validate_json(vector_store_data)
+            pgvector_index = PGVectorIndex(
+                vector_store=vector_store,
+                dimension=vector_store.embedding_dimension,
+                conn=self.conn,
+                kvstore=self.kvstore,
+            )
+            await pgvector_index.initialize()
+            index = VectorStoreWithIndex(vector_store, index=pgvector_index, inference_api=self.inference_api)
+            self.cache[vector_store.identifier] = index
     async def shutdown(self) -> None:
         if self.conn is not None:
             self.conn.close()
@@ -377,7 +393,13 @@ class PGVectorVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProt
     async def register_vector_store(self, vector_store: VectorStore) -> None:
         # Persist vector DB metadata in the KV store
-        assert self.kvstore is not None
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before registering vector stores.")
+        # Save to kvstore for persistence
+        key = f"{VECTOR_DBS_PREFIX}{vector_store.identifier}"
+        await self.kvstore.set(key=key, value=vector_store.model_dump_json())
         # Upsert model metadata in Postgres
         upsert_models(self.conn, [(vector_store.identifier, vector_store)])
@@ -396,7 +418,8 @@ class PGVectorVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProt
             del self.cache[vector_store_id]
         # Delete vector DB metadata from KV store
-        assert self.kvstore is not None
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before unregistering vector stores.")
         await self.kvstore.delete(key=f"{VECTOR_DBS_PREFIX}{vector_store_id}")
     async def insert_chunks(self, vector_db_id: str, chunks: list[Chunk], ttl_seconds: int | None = None) -> None:
@@ -413,13 +436,16 @@ class PGVectorVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProt
         if vector_store_id in self.cache:
             return self.cache[vector_store_id]
-        if self.vector_store_table is None:
-            raise VectorStoreNotFoundError(vector_store_id)
+        # Try to load from kvstore
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
-        vector_store = await self.vector_store_table.get_vector_store(vector_store_id)
-        if not vector_store:
+        key = f"{VECTOR_DBS_PREFIX}{vector_store_id}"
+        vector_store_data = await self.kvstore.get(key)
+        if not vector_store_data:
             raise VectorStoreNotFoundError(vector_store_id)
+        vector_store = VectorStore.model_validate_json(vector_store_data)
         index = PGVectorIndex(vector_store, vector_store.embedding_dimension, self.conn)
         await index.initialize()
         self.cache[vector_store_id] = VectorStoreWithIndex(vector_store, index, self.inference_api)

llama_stack/providers/remote/vector_io/qdrant/qdrant.py CHANGED Viewed

@@ -183,7 +183,8 @@ class QdrantVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoc
         await super().shutdown()
     async def register_vector_store(self, vector_store: VectorStore) -> None:
-        assert self.kvstore is not None
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before registering vector stores.")
         key = f"{VECTOR_DBS_PREFIX}{vector_store.identifier}"
         await self.kvstore.set(key=key, value=vector_store.model_dump_json())
@@ -200,20 +201,24 @@ class QdrantVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorStoresProtoc
             await self.cache[vector_store_id].index.delete()
             del self.cache[vector_store_id]
-        assert self.kvstore is not None
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
         await self.kvstore.delete(f"{VECTOR_DBS_PREFIX}{vector_store_id}")
     async def _get_and_cache_vector_store_index(self, vector_store_id: str) -> VectorStoreWithIndex | None:
         if vector_store_id in self.cache:
             return self.cache[vector_store_id]
-        if self.vector_store_table is None:
-            raise ValueError(f"Vector DB not found {vector_store_id}")
+        # Try to load from kvstore
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
-        vector_store = await self.vector_store_table.get_vector_store(vector_store_id)
-        if not vector_store:
+        key = f"{VECTOR_DBS_PREFIX}{vector_store_id}"
+        vector_store_data = await self.kvstore.get(key)
+        if not vector_store_data:
             raise VectorStoreNotFoundError(vector_store_id)
+        vector_store = VectorStore.model_validate_json(vector_store_data)
         index = VectorStoreWithIndex(
             vector_store=vector_store,
             index=QdrantIndex(client=self.client, collection_name=vector_store.identifier),

llama_stack/providers/remote/vector_io/weaviate/weaviate.py CHANGED Viewed

@@ -346,13 +346,16 @@ class WeaviateVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, NeedsRequestProv
         if vector_store_id in self.cache:
             return self.cache[vector_store_id]
-        if self.vector_store_table is None:
-            raise VectorStoreNotFoundError(vector_store_id)
+        # Try to load from kvstore
+        if self.kvstore is None:
+            raise RuntimeError("KVStore not initialized. Call initialize() before using vector stores.")
-        vector_store = await self.vector_store_table.get_vector_store(vector_store_id)
-        if not vector_store:
+        key = f"{VECTOR_DBS_PREFIX}{vector_store_id}"
+        vector_store_data = await self.kvstore.get(key)
+        if not vector_store_data:
             raise VectorStoreNotFoundError(vector_store_id)
+        vector_store = VectorStore.model_validate_json(vector_store_data)
         client = self._get_client()
         sanitized_collection_name = sanitize_collection_name(vector_store.identifier, weaviate_format=True)
         if not client.collections.exists(sanitized_collection_name):

llama_stack/providers/utils/inference/inference_store.py CHANGED Viewed

@@ -35,6 +35,7 @@ class InferenceStore:
         self.reference = reference
         self.sql_store = None
         self.policy = policy
+        self.enable_write_queue = True
         # Async write queue and worker control
         self._queue: asyncio.Queue[tuple[OpenAIChatCompletion, list[OpenAIMessageParam]]] | None = None
@@ -47,14 +48,13 @@ class InferenceStore:
         base_store = sqlstore_impl(self.reference)
         self.sql_store = AuthorizedSqlStore(base_store, self.policy)
-        # Disable write queue for SQLite to avoid concurrency issues
-        backend_name = self.reference.backend
-        backend_config = _SQLSTORE_BACKENDS.get(backend_name)
-        if backend_config is None:
-            raise ValueError(
-                f"Unregistered SQL backend '{backend_name}'. Registered backends: {sorted(_SQLSTORE_BACKENDS)}"
-            )
-        self.enable_write_queue = backend_config.type != StorageBackendType.SQL_SQLITE
+        # Disable write queue for SQLite since WAL mode handles concurrency
+        # Keep it enabled for other backends (like Postgres) for performance
+        backend_config = _SQLSTORE_BACKENDS.get(self.reference.backend)
+        if backend_config and backend_config.type == StorageBackendType.SQL_SQLITE:
+            self.enable_write_queue = False
+            logger.debug("Write queue disabled for SQLite (WAL mode handles concurrency)")
         await self.sql_store.create_table(
             "chat_completions",
             {
@@ -66,6 +66,14 @@ class InferenceStore:
             },
         )
+        if self.enable_write_queue:
+            self._queue = asyncio.Queue(maxsize=self._max_write_queue_size)
+            for _ in range(self._num_writers):
+                self._worker_tasks.append(asyncio.create_task(self._worker_loop()))
+            logger.debug(
+                f"Inference store write queue enabled with {self._num_writers} writers, max queue size {self._max_write_queue_size}"
+            )
     async def shutdown(self) -> None:
         if not self._worker_tasks:
             return

llama_stack/providers/utils/inference/model_registry.py CHANGED Viewed

@@ -20,7 +20,7 @@ logger = get_logger(name=__name__, category="providers::utils")
 class RemoteInferenceProviderConfig(BaseModel):
-    allowed_models: list[str] | None = Field(  # TODO: make this non-optional and give a list() default
+    allowed_models: list[str] | None = Field(
         default=None,
         description="List of models that should be registered with the model registry. If None, all models are allowed.",
     )

llama_stack/providers/utils/inference/openai_mixin.py CHANGED Viewed

@@ -82,9 +82,6 @@ class OpenAIMixin(NeedsRequestProviderData, ABC, BaseModel):
     # This is set in list_models() and used in check_model_availability()
     _model_cache: dict[str, Model] = {}
-    # List of allowed models for this provider, if empty all models allowed
-    allowed_models: list[str] = []
     # Optional field name in provider data to look for API key, which takes precedence
     provider_data_api_key_field: str | None = None
@@ -191,6 +188,19 @@ class OpenAIMixin(NeedsRequestProviderData, ABC, BaseModel):
         return api_key
+    def _validate_model_allowed(self, provider_model_id: str) -> None:
+        """
+        Validate that the model is in the allowed_models list if configured.
+        :param provider_model_id: The provider-specific model ID to validate
+        :raises ValueError: If the model is not in the allowed_models list
+        """
+        if self.config.allowed_models is not None and provider_model_id not in self.config.allowed_models:
+            raise ValueError(
+                f"Model '{provider_model_id}' is not in the allowed models list. "
+                f"Allowed models: {self.config.allowed_models}"
+            )
     async def _get_provider_model_id(self, model: str) -> str:
         """
         Get the provider-specific model ID from the model store.
@@ -237,8 +247,11 @@ class OpenAIMixin(NeedsRequestProviderData, ABC, BaseModel):
         Direct OpenAI completion API call.
         """
         # TODO: fix openai_completion to return type compatible with OpenAI's API response
+        provider_model_id = await self._get_provider_model_id(params.model)
+        self._validate_model_allowed(provider_model_id)
         completion_kwargs = await prepare_openai_completion_params(
-            model=await self._get_provider_model_id(params.model),
+            model=provider_model_id,
             prompt=params.prompt,
             best_of=params.best_of,
             echo=params.echo,
@@ -270,6 +283,9 @@ class OpenAIMixin(NeedsRequestProviderData, ABC, BaseModel):
         """
         Direct OpenAI chat completion API call.
         """
+        provider_model_id = await self._get_provider_model_id(params.model)
+        self._validate_model_allowed(provider_model_id)
         messages = params.messages
         if self.download_images:
@@ -291,7 +307,7 @@ class OpenAIMixin(NeedsRequestProviderData, ABC, BaseModel):
             messages = [await _localize_image_url(m) for m in messages]
         request_params = await prepare_openai_completion_params(
-            model=await self._get_provider_model_id(params.model),
+            model=provider_model_id,
             messages=messages,
             frequency_penalty=params.frequency_penalty,
             function_call=params.function_call,
@@ -329,9 +345,13 @@ class OpenAIMixin(NeedsRequestProviderData, ABC, BaseModel):
         """
         Direct OpenAI embeddings API call.
         """
-        # Prepare request parameters
-        request_params = {
-            "model": await self._get_provider_model_id(params.model),
+        provider_model_id = await self._get_provider_model_id(params.model)
+        self._validate_model_allowed(provider_model_id)
+        # Build request params conditionally to avoid NotGiven/Omit type mismatch
+        # The OpenAI SDK uses Omit in signatures but NOT_GIVEN has type NotGiven
+        request_params: dict[str, Any] = {
+            "model": provider_model_id,
             "input": params.input,
             "encoding_format": params.encoding_format if params.encoding_format is not None else NOT_GIVEN,
             "dimensions": params.dimensions if params.dimensions is not None else NOT_GIVEN,
@@ -416,7 +436,7 @@ class OpenAIMixin(NeedsRequestProviderData, ABC, BaseModel):
         for provider_model_id in provider_models_ids:
             if not isinstance(provider_model_id, str):
                 raise ValueError(f"Model ID {provider_model_id} from list_provider_model_ids() is not a string")
-            if self.allowed_models and provider_model_id not in self.allowed_models:
+            if self.config.allowed_models is not None and provider_model_id not in self.config.allowed_models:
                 logger.info(f"Skipping model {provider_model_id} as it is not in the allowed models list")
                 continue
             if metadata := self.embedding_model_metadata.get(provider_model_id):

llama_stack/providers/utils/responses/responses_store.py CHANGED Viewed

@@ -3,6 +3,7 @@
 #
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.
+import asyncio
 from llama_stack.apis.agents import (
     Order,
@@ -17,12 +18,12 @@ from llama_stack.apis.agents.openai_responses import (
 )
 from llama_stack.apis.inference import OpenAIMessageParam
 from llama_stack.core.datatypes import AccessRule
-from llama_stack.core.storage.datatypes import ResponsesStoreReference, SqlStoreReference
+from llama_stack.core.storage.datatypes import ResponsesStoreReference, SqlStoreReference, StorageBackendType
 from llama_stack.log import get_logger
 from ..sqlstore.api import ColumnDefinition, ColumnType
 from ..sqlstore.authorized_sqlstore import AuthorizedSqlStore
-from ..sqlstore.sqlstore import sqlstore_impl
+from ..sqlstore.sqlstore import _SQLSTORE_BACKENDS, sqlstore_impl
 logger = get_logger(name=__name__, category="openai_responses")
@@ -59,6 +60,13 @@ class ResponsesStore:
         base_store = sqlstore_impl(self.reference)
         self.sql_store = AuthorizedSqlStore(base_store, self.policy)
+        # Disable write queue for SQLite since WAL mode handles concurrency
+        # Keep it enabled for other backends (like Postgres) for performance
+        backend_config = _SQLSTORE_BACKENDS.get(self.reference.backend)
+        if backend_config and backend_config.type == StorageBackendType.SQL_SQLITE:
+            self.enable_write_queue = False
+            logger.debug("Write queue disabled for SQLite (WAL mode handles concurrency)")
         await self.sql_store.create_table(
             "openai_responses",
             {
@@ -77,6 +85,14 @@ class ResponsesStore:
             },
         )
+        if self.enable_write_queue:
+            self._queue = asyncio.Queue(maxsize=self._max_write_queue_size)
+            for _ in range(self._num_writers):
+                self._worker_tasks.append(asyncio.create_task(self._worker_loop()))
+            logger.debug(
+                f"Responses store write queue enabled with {self._num_writers} writers, max queue size {self._max_write_queue_size}"
+            )
     async def shutdown(self) -> None:
         return

llama_stack/providers/utils/sqlstore/sqlalchemy_sqlstore.py CHANGED Viewed

@@ -17,6 +17,7 @@ from sqlalchemy import (
     String,
     Table,
     Text,
+    event,
     inspect,
     select,
     text,
@@ -75,7 +76,36 @@ class SqlAlchemySqlStoreImpl(SqlStore):
         self.metadata = MetaData()
     def create_engine(self) -> AsyncEngine:
-        return create_async_engine(self.config.engine_str, pool_pre_ping=True)
+        # Configure connection args for better concurrency support
+        connect_args = {}
+        if "sqlite" in self.config.engine_str:
+            # SQLite-specific optimizations for concurrent access
+            # With WAL mode, most locks resolve in milliseconds, but allow up to 5s for edge cases
+            connect_args["timeout"] = 5.0
+            connect_args["check_same_thread"] = False  # Allow usage across asyncio tasks
+        engine = create_async_engine(
+            self.config.engine_str,
+            pool_pre_ping=True,
+            connect_args=connect_args,
+        )
+        # Enable WAL mode for SQLite to support concurrent readers and writers
+        if "sqlite" in self.config.engine_str:
+            @event.listens_for(engine.sync_engine, "connect")
+            def set_sqlite_pragma(dbapi_conn, connection_record):
+                cursor = dbapi_conn.cursor()
+                # Enable Write-Ahead Logging for better concurrency
+                cursor.execute("PRAGMA journal_mode=WAL")
+                # Set busy timeout to 5 seconds (retry instead of immediate failure)
+                # With WAL mode, locks should be brief; if we hit 5s there's a bigger issue
+                cursor.execute("PRAGMA busy_timeout=5000")
+                # Use NORMAL synchronous mode for better performance (still safe with WAL)
+                cursor.execute("PRAGMA synchronous=NORMAL")
+                cursor.close()
+        return engine
     async def create_table(
         self,

{llama_stack-0.3.2.dist-info → llama_stack-0.3.3.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: llama_stack
-Version: 0.3.2
+Version: 0.3.3
 Summary: Llama Stack
 Author-email: Meta Llama <llama-oss@meta.com>
 License: MIT
@@ -22,7 +22,7 @@ Requires-Dist: fire
 Requires-Dist: httpx
 Requires-Dist: jinja2>=3.1.6
 Requires-Dist: jsonschema
-Requires-Dist: llama-stack-client>=0.3.2
+Requires-Dist: llama-stack-client>=0.3.3
 Requires-Dist: openai>=1.107
 Requires-Dist: prompt-toolkit
 Requires-Dist: python-dotenv
@@ -44,7 +44,7 @@ Requires-Dist: sqlalchemy[asyncio]>=2.0.41
 Provides-Extra: ui
 Requires-Dist: streamlit; extra == "ui"
 Requires-Dist: pandas; extra == "ui"
-Requires-Dist: llama-stack-client>=0.3.2; extra == "ui"
+Requires-Dist: llama-stack-client>=0.3.3; extra == "ui"
 Requires-Dist: streamlit-option-menu; extra == "ui"
 Dynamic: license-file

{llama_stack-0.3.2.dist-info → llama_stack-0.3.3.dist-info}/RECORD RENAMED Viewed

@@ -394,14 +394,14 @@ llama_stack/providers/inline/vector_io/chroma/__init__.py,sha256=7zeAups-Y1Uowud
 llama_stack/providers/inline/vector_io/chroma/config.py,sha256=xRSJPOF9aMKBDIdIUFCfvOeq4qCQmbXae2s68vojoS0,934
 llama_stack/providers/inline/vector_io/faiss/__init__.py,sha256=rwB9SaZR6i5WwFCypC58EFJI3ii3hOkpXmHS4CPD6lc,662
 llama_stack/providers/inline/vector_io/faiss/config.py,sha256=3cgZiUAxULaU0qnhhl-DAWU0KjND3g9TdZvdycDU4zI,771
-llama_stack/providers/inline/vector_io/faiss/faiss.py,sha256=TkWk7UL_2tqMEqw7QTMEs9fRbhvp524oaUmnlidUq04,11255
+llama_stack/providers/inline/vector_io/faiss/faiss.py,sha256=rATsfuSOzWOqBydYMkBUH0Pa7-jmrwHSST-T1Fl7HxU,12396
 llama_stack/providers/inline/vector_io/milvus/__init__.py,sha256=fHR2w5MvA-qZsVD2OE88mkgLL8yvuu6TuKmWNLYMA6o,617
 llama_stack/providers/inline/vector_io/milvus/config.py,sha256=yO8gS6lNLTqJwUHRzKRybX77KC7ndZ9eHI7iYU8U0UY,1069
 llama_stack/providers/inline/vector_io/qdrant/__init__.py,sha256=De9BAorlOtcgWNgR97_LVvtzQRxJc-Jp1l79qNsnt6w,712
 llama_stack/providers/inline/vector_io/qdrant/config.py,sha256=xjOI1dHMT_aL-5J7tF4Lczva5UHvfja7wMOWRdbr8Qc,864
 llama_stack/providers/inline/vector_io/sqlite_vec/__init__.py,sha256=_gP1I0fHxY3fdmPkr_FqMbjSfhDOfCpxj2rbhDSwQpM,677
 llama_stack/providers/inline/vector_io/sqlite_vec/config.py,sha256=zwHR-7oXMSbTnXeO2pJ1BmXWGL9NBkQ76A5Wb3fjqZQ,937
-llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py,sha256=FDw0d_jGU4EfX7olsQQmVwXAvZ-FANiOCwHkcbOIHIM,19969
+llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py,sha256=jhBqfQI4E4EqijQR-2-f99YDQ4WENqHrkgoRirsVhd0,20511
 llama_stack/providers/registry/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
 llama_stack/providers/registry/agents.py,sha256=brI3222FyMoFtN4ooWJsoqMRNK9s0L87xkBISqrd2I8,1416
 llama_stack/providers/registry/batches.py,sha256=KElTpHCiLl4J7pa5BOkVYNK7woC9JB96JU0IcEjpdHI,901
@@ -486,7 +486,7 @@ llama_stack/providers/remote/inference/together/config.py,sha256=sefPbjy538oUbgw
 llama_stack/providers/remote/inference/together/together.py,sha256=V7M-0lzT3kGhEfhPYL2UNj97zNL9yk0D69jyevXrFHs,4477
 llama_stack/providers/remote/inference/vertexai/__init__.py,sha256=Bq5thvFjeShxdr8I1fZRJRCv3wKAX48qGknQ4j57gyY,444
 llama_stack/providers/remote/inference/vertexai/config.py,sha256=sHmX8pAg8UTUgwyF2K9W2oXdYOfSALREV3v48sGTsLU,1428
-llama_stack/providers/remote/inference/vertexai/vertexai.py,sha256=cDR7Jh9h07MuotPpIo0cNaZJEXPEWWrdfc9As36iF4s,1719
+llama_stack/providers/remote/inference/vertexai/vertexai.py,sha256=BEI_qWMK6COirXuGld6nHHY12gtuVa7UQ-Jlp76MBQo,2161
 llama_stack/providers/remote/inference/vllm/__init__.py,sha256=xoVNaQvqBOiKxiCc-iHI1fYTyAcZvRKizYBtBjIwPi8,673
 llama_stack/providers/remote/inference/vllm/config.py,sha256=qN_djLcdnmknwLnLSYTW9r9TNAb1MYMHNHmGM05wtAc,1917
 llama_stack/providers/remote/inference/vllm/vllm.py,sha256=0IfNDNtLXuYDTsp29b9hM1zTfJoqH-QRjCg_w0NpDbg,4101
@@ -527,20 +527,20 @@ llama_stack/providers/remote/tool_runtime/wolfram_alpha/config.py,sha256=RK12PdV
 llama_stack/providers/remote/tool_runtime/wolfram_alpha/wolfram_alpha.py,sha256=-9hb_2Z2dkTYARg8G267GDHZ4BbYkXhbAz1w-t3r9aY,5182
 llama_stack/providers/remote/vector_io/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
 llama_stack/providers/remote/vector_io/chroma/__init__.py,sha256=t9lO66Cr_8tdhswtvbSnSZR2nFB2C23LyDxuPqQe6_c,570
-llama_stack/providers/remote/vector_io/chroma/chroma.py,sha256=s0ERLl6ZUsOgm-f9BUgxNV__DR5isAMA9fyyt13wR2o,8780
+llama_stack/providers/remote/vector_io/chroma/chroma.py,sha256=958kw8apWWZpOjXA-hxVorfonrDvzYowVU9w9dzx7LI,9010
 llama_stack/providers/remote/vector_io/chroma/config.py,sha256=T9PnQRzfPQR8VR1XDMXZedhh5EFLsEKUyF6sFEDoJ7w,917
 llama_stack/providers/remote/vector_io/milvus/__init__.py,sha256=XLdJvLapmiKt_nkzrhpFLGP-toMsMiGrZ79-ZuYETvM,665
 llama_stack/providers/remote/vector_io/milvus/config.py,sha256=lpr1Dc1R7870A9LKlNpu7sAoA9c_iZXgbiuDFFJ3d8M,1465
-llama_stack/providers/remote/vector_io/milvus/milvus.py,sha256=MzXiHTB6kX6YolhgMZ4pOXsoDFSwiTKMh4-1gWf1-II,16319
+llama_stack/providers/remote/vector_io/milvus/milvus.py,sha256=j8dH3MfPWId6xVUvW1xoEGnGA4i7tNKzaUX2tnzMQOY,16490
 llama_stack/providers/remote/vector_io/pgvector/__init__.py,sha256=yzHD7-1O7NAf3YUy1ShDN_LdDKvvZaJDhaCq-FtTZUw,580
 llama_stack/providers/remote/vector_io/pgvector/config.py,sha256=IrZQt43N3Q7YpQHMN3jERw2i3FSnON_SmQi0Q2O1rFI,1549
-llama_stack/providers/remote/vector_io/pgvector/pgvector.py,sha256=WaRVefFSknv8w3j3aHp9UyQ0JkgKAbJCAPcVhdovMHU,18110
+llama_stack/providers/remote/vector_io/pgvector/pgvector.py,sha256=FDpmCb3QLvPpbXryE1xdEdW6YcTRaa-xovcRKIDslVo,19485
 llama_stack/providers/remote/vector_io/qdrant/__init__.py,sha256=hZfyksxpFotJlJ5mre5iT_ohnGkG7uwsv_QFOscALgw,570
 llama_stack/providers/remote/vector_io/qdrant/config.py,sha256=njL6MbyUd_fUM0PfzOeWeRLN4dKazYPAqSrZMvDk598,1124
-llama_stack/providers/remote/vector_io/qdrant/qdrant.py,sha256=YVBgjnoCigBpLe_tlm_oL7QqrrqNlPBSO1s-vLzc3QI,10399
+llama_stack/providers/remote/vector_io/qdrant/qdrant.py,sha256=WNWutg1aFE__xOqBKzF0H5IJvyub-1xTwJAI863dWcs,10761
 llama_stack/providers/remote/vector_io/weaviate/__init__.py,sha256=RPJQ2JlcxGnaUkjfR1V7UimQPgE76WNQ-SbfTZLjylE,580
 llama_stack/providers/remote/vector_io/weaviate/config.py,sha256=Ghy6LEx2aQ8KyXv97F0ZXOClAKt0gNTenucP_JLuGqM,1240
-llama_stack/providers/remote/vector_io/weaviate/weaviate.py,sha256=-CYU2Orq9mLh6Z4GPiyue4mfQpYDtwuLNqca561_rco,17248
+llama_stack/providers/remote/vector_io/weaviate/weaviate.py,sha256=oC0O4rI4s6Y53MFOQ5YpbJ1eJwiTyy9htfCHvwq7X1M,17419
 llama_stack/providers/utils/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
 llama_stack/providers/utils/pagination.py,sha256=Racj4zXqi19AQlA2FkVhcyzueNd9s7MTy0Fc0FZjNQc,1409
 llama_stack/providers/utils/scheduler.py,sha256=kP6lR0KPsYnd_mtwInuqegNqTSylZ09WiDQfiDyaX2k,8473
@@ -556,11 +556,11 @@ llama_stack/providers/utils/files/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8us
 llama_stack/providers/utils/files/form_data.py,sha256=oLDS9gsOWpUnqX51qczjNGTfHJBrZ0SFZbEHFtsfqCs,2291
 llama_stack/providers/utils/inference/__init__.py,sha256=Ocwqyn7ytwdt1vMFXsPBoa5D6uhA1fIljF-HiIsVvKw,1089
 llama_stack/providers/utils/inference/embedding_mixin.py,sha256=Ur9A0VJB0BEDh00Er8Ua-Mc08Sa69YAQW_cCcAdxB88,3336
-llama_stack/providers/utils/inference/inference_store.py,sha256=ur6sBcabh6mxTcsghEBHpn2Vm0lOYqjjGzuz50uR21M,9827
+llama_stack/providers/utils/inference/inference_store.py,sha256=zNscOx7uiIspV8UoAdSlciWvupOWrLDBEtoros5tlpk,10273
 llama_stack/providers/utils/inference/litellm_openai_mixin.py,sha256=tcRCccOd4fR61TIQjFGb-B6Qybu5q-pklK5fo87Ji3I,13094
-llama_stack/providers/utils/inference/model_registry.py,sha256=XatzxKD90h1lK2NVbLjsg_uBUSWD7gTA5xeK8QVlQr8,8308
+llama_stack/providers/utils/inference/model_registry.py,sha256=ElaDfW67XphDvVLYBBghwSB-2A704ELqpJpm42Hdpc8,8250
 llama_stack/providers/utils/inference/openai_compat.py,sha256=kTjea5GUmaD8UfA6UgoPD8wvmWNBnAwuWLkmNUwy-as,49768
-llama_stack/providers/utils/inference/openai_mixin.py,sha256=CQWqTRTm3CZqRtcoEdZ-a1tgh5PW8y5t2Ik7VNaiByo,19850
+llama_stack/providers/utils/inference/openai_mixin.py,sha256=WFRSrrtah3P_eDMJiA2fW_vGSEkl5I12p6SYfWdDB6U,20839
 llama_stack/providers/utils/inference/prompt_adapter.py,sha256=fSP6G79BSyO32UHUY19x7kdypNXPIZP_nOX6DW7oAQA,17890
 llama_stack/providers/utils/kvstore/__init__.py,sha256=GUuUhxrSBkRqNRORwBvoiBJfg6YDgg1cAaH4G35iY4Y,244
 llama_stack/providers/utils/kvstore/api.py,sha256=v89kXHvy4vBoK9xIjyJDJuNOS0RTWTV4U8W8VX3YxYs,707
@@ -580,7 +580,7 @@ llama_stack/providers/utils/memory/file_utils.py,sha256=1Lz7FTR4eV1OYPgD3oABRCho
 llama_stack/providers/utils/memory/openai_vector_store_mixin.py,sha256=XbmaUW7srqYbx1UZGn8h0NjCe3o9j_afeG-sdrYYaME,53335
 llama_stack/providers/utils/memory/vector_store.py,sha256=bAnoHLa68Z9Zsaufpovkwb5wlAvoyXVHRG33gvTcjls,12023
 llama_stack/providers/utils/responses/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
-llama_stack/providers/utils/responses/responses_store.py,sha256=r1SxlhSvT4XeZm-2zqI4A17LISjI9yzWxEewAlUyEJw,10734
+llama_stack/providers/utils/responses/responses_store.py,sha256=cJF93RVEyeGvd7-YJK9HK9NpfkcWzZ507bEK0D9Z8XI,11651
 llama_stack/providers/utils/scoring/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
 llama_stack/providers/utils/scoring/aggregation_utils.py,sha256=vNtkQbyEg71tWLCwibOHJyNGHqk5GBNB6uSMnlDaqJs,2775
 llama_stack/providers/utils/scoring/base_scoring_fn.py,sha256=q4KZZxU1TVBKO21bTcO5bnXu2LuzjjYzQZ492i_DfhA,4153
@@ -588,7 +588,7 @@ llama_stack/providers/utils/scoring/basic_scoring_utils.py,sha256=JmGA65N55raHR7
 llama_stack/providers/utils/sqlstore/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
 llama_stack/providers/utils/sqlstore/api.py,sha256=qhhfUWQ1erK9Bo5ocoFOuHgRAlOwi_8uh2wuvrqBbX8,3738
 llama_stack/providers/utils/sqlstore/authorized_sqlstore.py,sha256=GJ8T-wg_tkc2tITC6ne0X0Kfqc0pHbs9dDcHNMbkueE,14143
-llama_stack/providers/utils/sqlstore/sqlalchemy_sqlstore.py,sha256=v7c8Uze8ucCUn_C1v8-Fg2_7MsuYA3Ic0E8W4degfts,12098
+llama_stack/providers/utils/sqlstore/sqlalchemy_sqlstore.py,sha256=o-D-34JmuX5LR8lj_UV4TkgtqG7ivH8qLhEZeSSeQTk,13491
 llama_stack/providers/utils/sqlstore/sqlstore.py,sha256=o9o4kSSYgQQ1g1zfuPNYb1_f6x_knhniHG6xwG-VgNQ,2360
 llama_stack/providers/utils/telemetry/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
 llama_stack/providers/utils/telemetry/trace_protocol.py,sha256=VjTZ40NWQLdUfZuU07rtaLFn6wU9guuXAP62WkBd1Ws,5277
@@ -617,9 +617,9 @@ llama_stack/strong_typing/topological.py,sha256=I2YyhYW62PBM2wpfn6mbeCRxKGl_oa5t
 llama_stack/testing/__init__.py,sha256=vUvqRS2CXhASaFzYVspRYa5q8usSCzjKUlZhzNLuiKg,200
 llama_stack/testing/api_recorder.py,sha256=jt5Fq8HOPTA4rDzwIWWdBQJjxtivhbqoghFql3D--A0,38423
 llama_stack/ui/node_modules/flatted/python/flatted.py,sha256=UYburBDqkySaTfSpntPCUJRxiBGcplusJM7ECX8FEgA,3860
-llama_stack-0.3.2.dist-info/licenses/LICENSE,sha256=42g1gBn9gHYdBt5e6e1aFYhnc-JT9trU9qBD84oUAlY,1087
-llama_stack-0.3.2.dist-info/METADATA,sha256=LFLFZTDHA2F8GchS95FrwclHERxd0Hws-PILWn3F8B4,15124
-llama_stack-0.3.2.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
-llama_stack-0.3.2.dist-info/entry_points.txt,sha256=E5xoyAM9064aW_y96eSSwZCNT_ANctrvrhLMJnMQlw0,141
-llama_stack-0.3.2.dist-info/top_level.txt,sha256=2-nbQ1CAn4_w76YD_O6N6ofvjmk4DX5NFaBuApSx5N0,12
-llama_stack-0.3.2.dist-info/RECORD,,
+llama_stack-0.3.3.dist-info/licenses/LICENSE,sha256=42g1gBn9gHYdBt5e6e1aFYhnc-JT9trU9qBD84oUAlY,1087
+llama_stack-0.3.3.dist-info/METADATA,sha256=-2v1yFVpGA-OAXZICSSE1aB-XqIRLEDoPD2w6AHSsUI,15124
+llama_stack-0.3.3.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
+llama_stack-0.3.3.dist-info/entry_points.txt,sha256=E5xoyAM9064aW_y96eSSwZCNT_ANctrvrhLMJnMQlw0,141
+llama_stack-0.3.3.dist-info/top_level.txt,sha256=2-nbQ1CAn4_w76YD_O6N6ofvjmk4DX5NFaBuApSx5N0,12
+llama_stack-0.3.3.dist-info/RECORD,,

{llama_stack-0.3.2.dist-info → llama_stack-0.3.3.dist-info}/WHEEL RENAMED Viewed

File without changes

{llama_stack-0.3.2.dist-info → llama_stack-0.3.3.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{llama_stack-0.3.2.dist-info → llama_stack-0.3.3.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{llama_stack-0.3.2.dist-info → llama_stack-0.3.3.dist-info}/top_level.txt RENAMED Viewed

File without changes

llama-stack 0.3.2__py3-none-any.whl → 0.3.3__py3-none-any.whl

llama-stack 0.3.2py3-none-any.whl → 0.3.3py3-none-any.whl