PyPI - kodit - Versions diffs - 0.4.3__py3-none-any.whl → 0.5.1__py3-none-any.whl - Mend

kodit 0.4.3py3-none-any.whl → 0.5.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kodit might be problematic. Click here for more details.

Files changed (135) hide show

kodit/_version.py +2 -2
kodit/app.py +51 -23
kodit/application/factories/reporting_factory.py +6 -2
kodit/application/factories/server_factory.py +353 -0
kodit/application/services/code_search_application_service.py +144 -0
kodit/application/services/commit_indexing_application_service.py +700 -0
kodit/application/services/indexing_worker_service.py +13 -44
kodit/application/services/queue_service.py +24 -3
kodit/application/services/reporting.py +0 -2
kodit/application/services/sync_scheduler.py +15 -31
kodit/cli.py +2 -753
kodit/cli_utils.py +2 -9
kodit/config.py +4 -97
kodit/database.py +38 -1
kodit/domain/enrichments/__init__.py +1 -0
kodit/domain/enrichments/architecture/__init__.py +1 -0
kodit/domain/enrichments/architecture/architecture.py +20 -0
kodit/domain/enrichments/architecture/physical/__init__.py +1 -0
kodit/domain/enrichments/architecture/physical/discovery_notes.py +14 -0
kodit/domain/enrichments/architecture/physical/formatter.py +11 -0
kodit/domain/enrichments/architecture/physical/physical.py +17 -0
kodit/domain/enrichments/development/__init__.py +1 -0
kodit/domain/enrichments/development/development.py +18 -0
kodit/domain/enrichments/development/snippet/__init__.py +1 -0
kodit/domain/enrichments/development/snippet/snippet.py +21 -0
kodit/domain/enrichments/enricher.py +17 -0
kodit/domain/enrichments/enrichment.py +39 -0
kodit/domain/enrichments/request.py +12 -0
kodit/domain/enrichments/response.py +11 -0
kodit/domain/enrichments/usage/__init__.py +1 -0
kodit/domain/enrichments/usage/api_docs.py +19 -0
kodit/domain/enrichments/usage/usage.py +18 -0
kodit/domain/{entities.py → entities/__init__.py} +50 -195
kodit/domain/entities/git.py +190 -0
kodit/domain/factories/__init__.py +1 -0
kodit/domain/factories/git_repo_factory.py +76 -0
kodit/domain/protocols.py +264 -64
kodit/domain/services/bm25_service.py +5 -1
kodit/domain/services/embedding_service.py +3 -0
kodit/domain/services/enrichment_service.py +9 -30
kodit/domain/services/git_repository_service.py +429 -0
kodit/domain/services/git_service.py +300 -0
kodit/domain/services/physical_architecture_service.py +182 -0
kodit/domain/services/task_status_query_service.py +2 -2
kodit/domain/value_objects.py +87 -135
kodit/infrastructure/api/client/__init__.py +0 -2
kodit/infrastructure/api/v1/__init__.py +0 -4
kodit/infrastructure/api/v1/dependencies.py +92 -46
kodit/infrastructure/api/v1/routers/__init__.py +0 -6
kodit/infrastructure/api/v1/routers/commits.py +352 -0
kodit/infrastructure/api/v1/routers/queue.py +2 -2
kodit/infrastructure/api/v1/routers/repositories.py +282 -0
kodit/infrastructure/api/v1/routers/search.py +31 -14
kodit/infrastructure/api/v1/schemas/__init__.py +0 -24
kodit/infrastructure/api/v1/schemas/commit.py +96 -0
kodit/infrastructure/api/v1/schemas/context.py +2 -0
kodit/infrastructure/api/v1/schemas/enrichment.py +29 -0
kodit/infrastructure/api/v1/schemas/repository.py +128 -0
kodit/infrastructure/api/v1/schemas/search.py +12 -9
kodit/infrastructure/api/v1/schemas/snippet.py +58 -0
kodit/infrastructure/api/v1/schemas/tag.py +31 -0
kodit/infrastructure/api/v1/schemas/task_status.py +2 -0
kodit/infrastructure/bm25/local_bm25_repository.py +16 -4
kodit/infrastructure/bm25/vectorchord_bm25_repository.py +68 -52
kodit/infrastructure/cloning/git/git_python_adaptor.py +534 -0
kodit/infrastructure/cloning/git/working_copy.py +1 -1
kodit/infrastructure/embedding/embedding_factory.py +3 -2
kodit/infrastructure/embedding/local_vector_search_repository.py +1 -1
kodit/infrastructure/embedding/vectorchord_vector_search_repository.py +111 -84
kodit/infrastructure/enricher/__init__.py +1 -0
kodit/infrastructure/enricher/enricher_factory.py +53 -0
kodit/infrastructure/{enrichment/litellm_enrichment_provider.py → enricher/litellm_enricher.py} +36 -56
kodit/infrastructure/{enrichment/local_enrichment_provider.py → enricher/local_enricher.py} +19 -24
kodit/infrastructure/enricher/null_enricher.py +36 -0
kodit/infrastructure/indexing/fusion_service.py +1 -1
kodit/infrastructure/mappers/enrichment_mapper.py +83 -0
kodit/infrastructure/mappers/git_mapper.py +193 -0
kodit/infrastructure/mappers/snippet_mapper.py +104 -0
kodit/infrastructure/mappers/task_mapper.py +5 -44
kodit/infrastructure/physical_architecture/__init__.py +1 -0
kodit/infrastructure/physical_architecture/detectors/__init__.py +1 -0
kodit/infrastructure/physical_architecture/detectors/docker_compose_detector.py +336 -0
kodit/infrastructure/physical_architecture/formatters/__init__.py +1 -0
kodit/infrastructure/physical_architecture/formatters/narrative_formatter.py +149 -0
kodit/infrastructure/reporting/log_progress.py +8 -5
kodit/infrastructure/reporting/telemetry_progress.py +21 -0
kodit/infrastructure/slicing/api_doc_extractor.py +836 -0
kodit/infrastructure/slicing/ast_analyzer.py +1128 -0
kodit/infrastructure/slicing/slicer.py +87 -421
kodit/infrastructure/sqlalchemy/embedding_repository.py +43 -23
kodit/infrastructure/sqlalchemy/enrichment_v2_repository.py +118 -0
kodit/infrastructure/sqlalchemy/entities.py +402 -158
kodit/infrastructure/sqlalchemy/git_branch_repository.py +274 -0
kodit/infrastructure/sqlalchemy/git_commit_repository.py +346 -0
kodit/infrastructure/sqlalchemy/git_repository.py +262 -0
kodit/infrastructure/sqlalchemy/git_tag_repository.py +268 -0
kodit/infrastructure/sqlalchemy/snippet_v2_repository.py +479 -0
kodit/infrastructure/sqlalchemy/task_repository.py +29 -23
kodit/infrastructure/sqlalchemy/task_status_repository.py +24 -12
kodit/infrastructure/sqlalchemy/unit_of_work.py +10 -14
kodit/mcp.py +12 -30
kodit/migrations/env.py +1 -0
kodit/migrations/versions/04b80f802e0c_foreign_key_review.py +100 -0
kodit/migrations/versions/19f8c7faf8b9_add_generic_enrichment_type.py +260 -0
kodit/migrations/versions/7f15f878c3a1_add_new_git_entities.py +690 -0
kodit/migrations/versions/f9e5ef5e688f_add_git_commits_number.py +43 -0
kodit/py.typed +0 -0
kodit/utils/dump_config.py +361 -0
kodit/utils/dump_openapi.py +6 -4
kodit/utils/path_utils.py +29 -0
{kodit-0.4.3.dist-info → kodit-0.5.1.dist-info}/METADATA +3 -3
kodit-0.5.1.dist-info/RECORD +168 -0
kodit/application/factories/code_indexing_factory.py +0 -195
kodit/application/services/auto_indexing_service.py +0 -99
kodit/application/services/code_indexing_application_service.py +0 -410
kodit/domain/services/index_query_service.py +0 -70
kodit/domain/services/index_service.py +0 -269
kodit/infrastructure/api/client/index_client.py +0 -57
kodit/infrastructure/api/v1/routers/indexes.py +0 -164
kodit/infrastructure/api/v1/schemas/index.py +0 -101
kodit/infrastructure/bm25/bm25_factory.py +0 -28
kodit/infrastructure/cloning/__init__.py +0 -1
kodit/infrastructure/cloning/metadata.py +0 -98
kodit/infrastructure/enrichment/__init__.py +0 -1
kodit/infrastructure/enrichment/enrichment_factory.py +0 -52
kodit/infrastructure/enrichment/null_enrichment_provider.py +0 -19
kodit/infrastructure/mappers/index_mapper.py +0 -345
kodit/infrastructure/reporting/tdqm_progress.py +0 -38
kodit/infrastructure/slicing/language_detection_service.py +0 -18
kodit/infrastructure/sqlalchemy/index_repository.py +0 -646
kodit-0.4.3.dist-info/RECORD +0 -125
/kodit/infrastructure/{enrichment → enricher}/utils.py +0 -0
{kodit-0.4.3.dist-info → kodit-0.5.1.dist-info}/WHEEL +0 -0
{kodit-0.4.3.dist-info → kodit-0.5.1.dist-info}/entry_points.txt +0 -0
{kodit-0.4.3.dist-info → kodit-0.5.1.dist-info}/licenses/LICENSE +0 -0

kodit/infrastructure/embedding/vectorchord_vector_search_repository.py CHANGED Viewed

@@ -1,10 +1,10 @@
 """VectorChord vector search repository implementation."""
-from collections.abc import AsyncGenerator
-from typing import Any, Literal
+from collections.abc import AsyncGenerator, Callable
+from typing import Literal
 import structlog
-from sqlalchemy import Result, TextClause, text
+from sqlalchemy import text
 from sqlalchemy.ext.asyncio import AsyncSession
 from kodit.domain.services.embedding_service import (
@@ -19,6 +19,7 @@ from kodit.domain.value_objects import (
     SearchResult,
 )
 from kodit.infrastructure.sqlalchemy.entities import EmbeddingType
+from kodit.infrastructure.sqlalchemy.unit_of_work import SqlAlchemyUnitOfWork
 # SQL Queries
 CREATE_VCHORD_EXTENSION = """
@@ -72,6 +73,10 @@ CHECK_VCHORD_EMBEDDING_EXISTS = """
 SELECT EXISTS(SELECT 1 FROM {TABLE_NAME} WHERE snippet_id = :snippet_id)
 """
+CHECK_VCHORD_EMBEDDING_EXISTS_MULTIPLE = """
+SELECT snippet_id FROM {TABLE_NAME} WHERE snippet_id = ANY(:snippet_ids)
+"""
 TaskName = Literal["code", "text"]
@@ -80,8 +85,8 @@ class VectorChordVectorSearchRepository(VectorSearchRepository):
     def __init__(
         self,
+        session_factory: Callable[[], AsyncSession],
         task_name: TaskName,
-        session: AsyncSession,
         embedding_provider: EmbeddingProvider,
     ) -> None:
         """Initialize the VectorChord vector search repository.
@@ -93,7 +98,7 @@ class VectorChordVectorSearchRepository(VectorSearchRepository):
         """
         self.embedding_provider = embedding_provider
-        self._session = session
+        self.session_factory = session_factory
         self._initialized = False
         self.table_name = f"vectorchord_{task_name}_embeddings"
         self.index_name = f"{self.table_name}_idx"
@@ -111,12 +116,12 @@ class VectorChordVectorSearchRepository(VectorSearchRepository):
     async def _create_extensions(self) -> None:
         """Create the necessary extensions."""
-        await self._session.execute(text(CREATE_VCHORD_EXTENSION))
-        await self._commit()
+        async with SqlAlchemyUnitOfWork(self.session_factory) as session:
+            await session.execute(text(CREATE_VCHORD_EXTENSION))
     async def _create_tables(self) -> None:
         """Create the necessary tables."""
-        req = EmbeddingRequest(snippet_id=0, text="dimension")
+        req = EmbeddingRequest(snippet_id="0", text="dimension")
         vector_dim: list[float] | None = None
         async for batch in self.embedding_provider.embed([req]):
             if batch:
@@ -125,79 +130,85 @@ class VectorChordVectorSearchRepository(VectorSearchRepository):
         if vector_dim is None:
             msg = "Failed to obtain embedding dimension from provider"
             raise RuntimeError(msg)
-        await self._session.execute(
-            text(
-                f"""CREATE TABLE IF NOT EXISTS {self.table_name} (
-                    id SERIAL PRIMARY KEY,
-                    snippet_id INT NOT NULL UNIQUE,
-                    embedding VECTOR({len(vector_dim)}) NOT NULL
-                );"""
+        async with SqlAlchemyUnitOfWork(self.session_factory) as session:
+            await session.execute(
+                text(
+                    f"""CREATE TABLE IF NOT EXISTS {self.table_name} (
+                        id SERIAL PRIMARY KEY,
+                        snippet_id VARCHAR(255) NOT NULL UNIQUE,
+                        embedding VECTOR({len(vector_dim)}) NOT NULL
+                    );"""
+                )
             )
-        )
-        await self._session.execute(
-            text(
-                CREATE_VCHORD_INDEX.format(
-                    TABLE_NAME=self.table_name, INDEX_NAME=self.index_name
+            await session.execute(
+                text(
+                    CREATE_VCHORD_INDEX.format(
+                        TABLE_NAME=self.table_name, INDEX_NAME=self.index_name
+                    )
                 )
             )
-        )
-        result = await self._session.execute(
-            text(CHECK_VCHORD_EMBEDDING_DIMENSION.format(TABLE_NAME=self.table_name))
-        )
-        vector_dim_from_db = result.scalar_one()
-        if vector_dim_from_db != len(vector_dim):
-            msg = (
-                f"Embedding vector dimension does not match database, "
-                f"please delete your index: {vector_dim_from_db} != {len(vector_dim)}"
+            result = await session.execute(
+                text(
+                    CHECK_VCHORD_EMBEDDING_DIMENSION.format(TABLE_NAME=self.table_name)
+                )
             )
-            raise ValueError(msg)
-        await self._commit()
-    async def _execute(
-        self, query: TextClause, param_list: list[Any] | dict[str, Any] | None = None
-    ) -> Result:
-        """Execute a query."""
-        if not self._initialized:
-            await self._initialize()
-        return await self._session.execute(query, param_list)
-    async def _commit(self) -> None:
-        """Commit the session."""
-        await self._session.commit()
+            vector_dim_from_db = result.scalar_one()
+            if vector_dim_from_db != len(vector_dim):
+                msg = (
+                    f"Embedding vector dimension does not match database, please "
+                    f"delete your index: {vector_dim_from_db} != {len(vector_dim)}"
+                )
+                raise ValueError(msg)
     async def index_documents(
         self, request: IndexRequest
     ) -> AsyncGenerator[list[IndexResult], None]:
         """Index documents for vector search."""
+        if not self._initialized:
+            await self._initialize()
         if not request.documents:
             yield []
+        # Search for existing embeddings
+        existing_ids = await self._get_existing_ids(
+            [doc.snippet_id for doc in request.documents]
+        )
+        new_documents = [
+            doc for doc in request.documents if doc.snippet_id not in existing_ids
+        ]
+        if not new_documents:
+            self.log.info("No new documents to index")
+            return
         # Convert to embedding requests
-        requests = [
+        embedding_requests = [
             EmbeddingRequest(snippet_id=doc.snippet_id, text=doc.text)
-            for doc in request.documents
+            for doc in new_documents
         ]
-        async for batch in self.embedding_provider.embed(requests):
-            await self._execute(
-                text(INSERT_QUERY.format(TABLE_NAME=self.table_name)),
-                [
-                    {
-                        "snippet_id": result.snippet_id,
-                        "embedding": str(result.embedding),
-                    }
-                    for result in batch
-                ],
-            )
-            await self._commit()
-            yield [IndexResult(snippet_id=result.snippet_id) for result in batch]
+        async for batch in self.embedding_provider.embed(embedding_requests):
+            async with SqlAlchemyUnitOfWork(self.session_factory) as session:
+                await session.execute(
+                    text(INSERT_QUERY.format(TABLE_NAME=self.table_name)),
+                    [
+                        {
+                            "snippet_id": result.snippet_id,
+                            "embedding": str(result.embedding),
+                        }
+                        for result in batch
+                    ],
+                )
+                yield [IndexResult(snippet_id=result.snippet_id) for result in batch]
     async def search(self, request: SearchRequest) -> list[SearchResult]:
         """Search documents using vector similarity."""
+        if not self._initialized:
+            await self._initialize()
         if not request.query or not request.query.strip():
             return []
-        req = EmbeddingRequest(snippet_id=0, text=request.query)
+        req = EmbeddingRequest(snippet_id="0", text=request.query)
         embedding_vec: list[float] | None = None
         async for batch in self.embedding_provider.embed([req]):
             if batch:
@@ -207,39 +218,55 @@ class VectorChordVectorSearchRepository(VectorSearchRepository):
         if not embedding_vec:
             return []
-        # Use filtered query if snippet_ids are provided
-        if request.snippet_ids is not None:
-            result = await self._execute(
-                text(SEARCH_QUERY_WITH_FILTER.format(TABLE_NAME=self.table_name)),
-                {
-                    "query": str(embedding_vec),
-                    "top_k": request.top_k,
-                    "snippet_ids": request.snippet_ids,
-                },
-            )
-        else:
-            result = await self._execute(
-                text(SEARCH_QUERY.format(TABLE_NAME=self.table_name)),
-                {"query": str(embedding_vec), "top_k": request.top_k},
-            )
+        async with SqlAlchemyUnitOfWork(self.session_factory) as session:
+            # Use filtered query if snippet_ids are provided
+            if request.snippet_ids is not None:
+                result = await session.execute(
+                    text(SEARCH_QUERY_WITH_FILTER.format(TABLE_NAME=self.table_name)),
+                    {
+                        "query": str(embedding_vec),
+                        "top_k": request.top_k,
+                        "snippet_ids": request.snippet_ids,
+                    },
+                )
+            else:
+                result = await session.execute(
+                    text(SEARCH_QUERY.format(TABLE_NAME=self.table_name)),
+                    {"query": str(embedding_vec), "top_k": request.top_k},
+                )
-        rows = result.mappings().all()
+            rows = result.mappings().all()
-        return [
-            SearchResult(snippet_id=row["snippet_id"], score=row["score"])
-            for row in rows
-        ]
+            return [
+                SearchResult(snippet_id=row["snippet_id"], score=row["score"])
+                for row in rows
+            ]
     async def has_embedding(
         self, snippet_id: int, embedding_type: EmbeddingType
     ) -> bool:
         """Check if a snippet has an embedding."""
+        if not self._initialized:
+            await self._initialize()
         # For VectorChord, we check if the snippet exists in the table
         # Note: embedding_type is ignored since VectorChord uses separate
         # tables per task
         # ruff: noqa: ARG002
-        result = await self._execute(
-            text(CHECK_VCHORD_EMBEDDING_EXISTS.format(TABLE_NAME=self.table_name)),
-            {"snippet_id": snippet_id},
-        )
-        return bool(result.scalar())
+        async with SqlAlchemyUnitOfWork(self.session_factory) as session:
+            result = await session.execute(
+                text(CHECK_VCHORD_EMBEDDING_EXISTS.format(TABLE_NAME=self.table_name)),
+                {"snippet_id": snippet_id},
+            )
+            return bool(result.scalar())
+    async def _get_existing_ids(self, snippet_ids: list[str]) -> set[str]:
+        async with SqlAlchemyUnitOfWork(self.session_factory) as session:
+            result = await session.execute(
+                text(
+                    CHECK_VCHORD_EMBEDDING_EXISTS_MULTIPLE.format(
+                        TABLE_NAME=self.table_name
+                    )
+                ),
+                {"snippet_ids": snippet_ids},
+            )
+            return {row[0] for row in result.fetchall()}

kodit/infrastructure/enricher/__init__.py ADDED Viewed

	@@ -0,0 +1 @@
1	+ """Generic enricher infrastructure implementations."""

kodit/infrastructure/enricher/enricher_factory.py ADDED Viewed

@@ -0,0 +1,53 @@
+"""Enricher factory for creating generic enricher domain services."""
+from kodit.config import AppContext, Endpoint
+from kodit.domain.enrichments.enricher import Enricher
+from kodit.infrastructure.enricher.litellm_enricher import LiteLLMEnricher
+from kodit.infrastructure.enricher.local_enricher import LocalEnricher
+from kodit.infrastructure.enricher.null_enricher import NullEnricher
+from kodit.log import log_event
+def _get_endpoint_configuration(app_context: AppContext) -> Endpoint | None:
+    """Get the endpoint configuration for the enricher service.
+    Args:
+        app_context: The application context.
+    Returns:
+        The endpoint configuration or None.
+    """
+    return app_context.enrichment_endpoint or None
+def enricher_domain_service_factory(
+    app_context: AppContext,
+    *,
+    use_null_enricher: bool = False,
+) -> Enricher:
+    """Create an enricher domain service.
+    Args:
+        app_context: The application context.
+        use_null_enricher: Whether to use the null enricher instead.
+    Returns:
+        An enricher domain service instance.
+    """
+    enricher: Enricher
+    if use_null_enricher:
+        log_event("kodit.enricher", {"provider": "null"})
+        enricher = NullEnricher()
+    else:
+        endpoint = _get_endpoint_configuration(app_context)
+        if endpoint:
+            log_event("kodit.enricher", {"provider": "litellm"})
+            enricher = LiteLLMEnricher(endpoint=endpoint)
+        else:
+            log_event("kodit.enricher", {"provider": "local"})
+            enricher = LocalEnricher()
+    return enricher

kodit/infrastructure/{enrichment/litellm_enrichment_provider.py → enricher/litellm_enricher.py} RENAMED Viewed

@@ -1,4 +1,4 @@
-"""LiteLLM enrichment provider implementation."""
+"""LiteLLM enricher implementation."""
 import asyncio
 from collections.abc import AsyncGenerator
@@ -10,27 +10,22 @@ import structlog
 from litellm import acompletion
 from kodit.config import Endpoint
-from kodit.domain.services.enrichment_service import EnrichmentProvider
-from kodit.domain.value_objects import EnrichmentRequest, EnrichmentResponse
-from kodit.infrastructure.enrichment.utils import clean_thinking_tags
+from kodit.domain.enrichments.enricher import Enricher
+from kodit.domain.enrichments.request import EnrichmentRequest
+from kodit.domain.enrichments.response import EnrichmentResponse
+from kodit.infrastructure.enricher.utils import clean_thinking_tags
-ENRICHMENT_SYSTEM_PROMPT = """
-You are a professional software developer. You will be given a snippet of code.
-Please provide a concise explanation of the code.
-"""
-# Default tuned conservatively for broad provider compatibility
 DEFAULT_NUM_PARALLEL_TASKS = 20
-class LiteLLMEnrichmentProvider(EnrichmentProvider):
-    """LiteLLM enrichment provider that supports 100+ providers."""
+class LiteLLMEnricher(Enricher):
+    """LiteLLM enricher that supports 100+ providers."""
     def __init__(
         self,
         endpoint: Endpoint,
     ) -> None:
-        """Initialize the LiteLLM enrichment provider.
+        """Initialize the LiteLLM enricher.
         Args:
             endpoint: The endpoint configuration containing all settings.
@@ -44,23 +39,20 @@ class LiteLLMEnrichmentProvider(EnrichmentProvider):
         self.num_parallel_tasks = (
             endpoint.num_parallel_tasks or DEFAULT_NUM_PARALLEL_TASKS
         )
-        self.timeout = endpoint.timeout or 30.0
+        self.timeout = endpoint.timeout
         self.extra_params = endpoint.extra_params or {}
-        # Configure LiteLLM with custom HTTPX client for Unix socket support if needed
         self._setup_litellm_client()
     def _setup_litellm_client(self) -> None:
         """Set up LiteLLM with custom HTTPX client for Unix socket support."""
         if self.socket_path:
-            # Create HTTPX client with Unix socket transport
             transport = httpx.AsyncHTTPTransport(uds=self.socket_path)
             unix_client = httpx.AsyncClient(
                 transport=transport,
-                base_url="http://localhost",  # Base URL for Unix socket
+                base_url="http://localhost",
                 timeout=self.timeout,
             )
-            # Set as LiteLLM's async client session
             litellm.aclient_session = unix_client
     async def _call_chat_completion(self, messages: list[dict[str, str]]) -> Any:
@@ -79,20 +71,17 @@ class LiteLLMEnrichmentProvider(EnrichmentProvider):
             "timeout": self.timeout,
         }
-        # Add API key if provided
         if self.api_key:
             kwargs["api_key"] = self.api_key
-        # Add base_url if provided
         if self.base_url:
             kwargs["api_base"] = self.base_url
-        # Add extra parameters
         kwargs.update(self.extra_params)
         try:
-            # Use litellm's async completion function
             response = await acompletion(**kwargs)
+            self.log.debug("enrichment request", request=kwargs, response=response)
             return (
                 response.model_dump() if hasattr(response, "model_dump") else response
             )
@@ -108,62 +97,53 @@ class LiteLLMEnrichmentProvider(EnrichmentProvider):
         """Enrich a list of requests using LiteLLM.
         Args:
-            requests: List of enrichment requests.
+            requests: List of generic enrichment requests.
         Yields:
-            Enrichment responses as they are processed.
+            Generic enrichment responses as they are processed.
         """
         if not requests:
             self.log.warning("No requests for enrichment")
             return
-        # Process requests in parallel with a semaphore to limit concurrent requests
         sem = asyncio.Semaphore(self.num_parallel_tasks)
-        async def process_request(request: EnrichmentRequest) -> EnrichmentResponse:
+        async def process_request(
+            request: EnrichmentRequest,
+        ) -> EnrichmentResponse:
             async with sem:
                 if not request.text:
                     return EnrichmentResponse(
-                        snippet_id=request.snippet_id,
-                        text="",
-                    )
-                try:
-                    messages = [
-                        {
-                            "role": "system",
-                            "content": ENRICHMENT_SYSTEM_PROMPT,
-                        },
-                        {"role": "user", "content": request.text},
-                    ]
-                    response = await self._call_chat_completion(messages)
-                    content = (
-                        response.get("choices", [{}])[0]
-                        .get("message", {})
-                        .get("content", "")
-                    )
-                    # Remove thinking tags from the response
-                    cleaned_content = clean_thinking_tags(content or "")
-                    return EnrichmentResponse(
-                        snippet_id=request.snippet_id,
-                        text=cleaned_content,
-                    )
-                except Exception as e:
-                    self.log.exception("Error enriching request", error=str(e))
-                    return EnrichmentResponse(
-                        snippet_id=request.snippet_id,
+                        id=request.id,
                         text="",
                     )
+                messages = [
+                    {
+                        "role": "system",
+                        "content": request.system_prompt,
+                    },
+                    {"role": "user", "content": request.text},
+                ]
+                response = await self._call_chat_completion(messages)
+                content = (
+                    response.get("choices", [{}])[0]
+                    .get("message", {})
+                    .get("content", "")
+                )
+                cleaned_content = clean_thinking_tags(content or "")
+                return EnrichmentResponse(
+                    id=request.id,
+                    text=cleaned_content,
+                )
-        # Create tasks for all requests
         tasks = [process_request(request) for request in requests]
-        # Process all requests and yield results as they complete
         for task in asyncio.as_completed(tasks):
             yield await task
     async def close(self) -> None:
-        """Close the provider and cleanup HTTPX client if using Unix sockets."""
+        """Close the enricher and cleanup HTTPX client if using Unix sockets."""
         if (
             self.socket_path
             and hasattr(litellm, "aclient_session")

kodit/infrastructure/{enrichment/local_enrichment_provider.py → enricher/local_enricher.py} RENAMED Viewed

@@ -1,4 +1,4 @@
-"""Local enrichment provider implementation."""
+"""Local enricher implementation."""
 import asyncio
 import os
@@ -8,28 +8,24 @@ from typing import Any
 import structlog
 import tiktoken
-from kodit.domain.services.enrichment_service import EnrichmentProvider
-from kodit.domain.value_objects import EnrichmentRequest, EnrichmentResponse
-from kodit.infrastructure.enrichment.utils import clean_thinking_tags
+from kodit.domain.enrichments.enricher import Enricher
+from kodit.domain.enrichments.request import EnrichmentRequest
+from kodit.domain.enrichments.response import EnrichmentResponse
+from kodit.infrastructure.enricher.utils import clean_thinking_tags
-ENRICHMENT_SYSTEM_PROMPT = """
-You are a professional software developer. You will be given a snippet of code.
-Please provide a concise explanation of the code.
-"""
+DEFAULT_ENRICHER_MODEL = "Qwen/Qwen3-0.6B"
+DEFAULT_CONTEXT_WINDOW_SIZE = 2048
-DEFAULT_ENRICHMENT_MODEL = "Qwen/Qwen3-0.6B"
-DEFAULT_CONTEXT_WINDOW_SIZE = 2048  # Small so it works even on low-powered devices
-class LocalEnrichmentProvider(EnrichmentProvider):
-    """Local enrichment provider implementation."""
+class LocalEnricher(Enricher):
+    """Local enricher implementation using local models."""
     def __init__(
         self,
-        model_name: str = DEFAULT_ENRICHMENT_MODEL,
+        model_name: str = DEFAULT_ENRICHER_MODEL,
         context_window: int = DEFAULT_CONTEXT_WINDOW_SIZE,
     ) -> None:
-        """Initialize the local enrichment provider.
+        """Initialize the local enricher.
         Args:
             model_name: The model name to use for enrichment.
@@ -49,13 +45,13 @@ class LocalEnrichmentProvider(EnrichmentProvider):
         """Enrich a list of requests using local model.
         Args:
-            requests: List of enrichment requests.
+            requests: List of generic enrichment requests.
         Yields:
-            Enrichment responses as they are processed.
+            Generic enrichment responses as they are processed.
         """
-        # Remove empty snippets
+        # Remove empty requests
         requests = [req for req in requests if req.text]
         if not requests:
@@ -73,7 +69,7 @@ class LocalEnrichmentProvider(EnrichmentProvider):
                     self.model_name, padding_side="left"
                 )
             if self.model is None:
-                os.environ["TOKENIZERS_PARALLELISM"] = "false"  # Avoid warnings
+                os.environ["TOKENIZERS_PARALLELISM"] = "false"
                 self.model = AutoModelForCausalLM.from_pretrained(
                     self.model_name,
                     torch_dtype="auto",
@@ -83,13 +79,13 @@ class LocalEnrichmentProvider(EnrichmentProvider):
         await asyncio.to_thread(_init_model)
-        # Prepare prompts
+        # Prepare prompts with custom system prompts
         prompts = [
             {
-                "id": req.snippet_id,
+                "id": req.id,
                 "text": self.tokenizer.apply_chat_template(  # type: ignore[attr-defined]
                     [
-                        {"role": "system", "content": ENRICHMENT_SYSTEM_PROMPT},
+                        {"role": "system", "content": req.system_prompt},
                         {"role": "user", "content": req.text},
                     ],
                     tokenize=False,
@@ -121,9 +117,8 @@ class LocalEnrichmentProvider(EnrichmentProvider):
                 )
             content = await asyncio.to_thread(process_prompt, prompt)
-            # Remove thinking tags from the response
             cleaned_content = clean_thinking_tags(content)
             yield EnrichmentResponse(
-                snippet_id=prompt["id"],
+                id=prompt["id"],
                 text=cleaned_content,
             )

kodit/infrastructure/enricher/null_enricher.py ADDED Viewed

@@ -0,0 +1,36 @@
+"""Null enricher implementation."""
+from collections.abc import AsyncGenerator
+import structlog
+from kodit.domain.enrichments.enricher import Enricher
+from kodit.domain.enrichments.request import EnrichmentRequest
+from kodit.domain.enrichments.response import EnrichmentResponse
+class NullEnricher(Enricher):
+    """Null enricher that returns empty responses."""
+    def __init__(self) -> None:
+        """Initialize the null enricher."""
+        self.log = structlog.get_logger(__name__)
+    async def enrich(
+        self, requests: list[EnrichmentRequest]
+    ) -> AsyncGenerator[EnrichmentResponse, None]:
+        """Return empty responses for all requests.
+        Args:
+            requests: List of generic enrichment requests.
+        Yields:
+            Empty generic enrichment responses.
+        """
+        self.log.info("NullEnricher: returning empty responses", count=len(requests))
+        for request in requests:
+            yield EnrichmentResponse(
+                id=request.id,
+                text="",
+            )

kodit/infrastructure/indexing/fusion_service.py CHANGED Viewed

@@ -2,7 +2,7 @@
 from collections import defaultdict
-from kodit.domain.services.index_query_service import FusionService
+from kodit.domain.protocols import FusionService
 from kodit.domain.value_objects import FusionRequest, FusionResult

kodit 0.4.3__py3-none-any.whl → 0.5.1__py3-none-any.whl

Potentially problematic release.

kodit 0.4.3py3-none-any.whl → 0.5.1py3-none-any.whl