PyPI - codexa - Versions diffs - 0.4.0__py3-none-any.whl - Mend

codexa 0.4.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (189) hide show

codexa-0.4.0.dist-info/METADATA +650 -0
codexa-0.4.0.dist-info/RECORD +189 -0
codexa-0.4.0.dist-info/WHEEL +5 -0
codexa-0.4.0.dist-info/entry_points.txt +2 -0
codexa-0.4.0.dist-info/licenses/LICENSE +21 -0
codexa-0.4.0.dist-info/top_level.txt +1 -0
semantic_code_intelligence/__init__.py +5 -0
semantic_code_intelligence/analysis/__init__.py +21 -0
semantic_code_intelligence/analysis/ai_features.py +351 -0
semantic_code_intelligence/bridge/__init__.py +28 -0
semantic_code_intelligence/bridge/context_provider.py +245 -0
semantic_code_intelligence/bridge/protocol.py +167 -0
semantic_code_intelligence/bridge/server.py +348 -0
semantic_code_intelligence/bridge/vscode.py +271 -0
semantic_code_intelligence/ci/__init__.py +13 -0
semantic_code_intelligence/ci/hooks.py +98 -0
semantic_code_intelligence/ci/hotspots.py +272 -0
semantic_code_intelligence/ci/impact.py +246 -0
semantic_code_intelligence/ci/metrics.py +591 -0
semantic_code_intelligence/ci/pr.py +412 -0
semantic_code_intelligence/ci/quality.py +557 -0
semantic_code_intelligence/ci/templates.py +164 -0
semantic_code_intelligence/ci/trace.py +224 -0
semantic_code_intelligence/cli/__init__.py +0 -0
semantic_code_intelligence/cli/commands/__init__.py +0 -0
semantic_code_intelligence/cli/commands/ask_cmd.py +153 -0
semantic_code_intelligence/cli/commands/benchmark_cmd.py +303 -0
semantic_code_intelligence/cli/commands/chat_cmd.py +252 -0
semantic_code_intelligence/cli/commands/ci_gen_cmd.py +74 -0
semantic_code_intelligence/cli/commands/context_cmd.py +120 -0
semantic_code_intelligence/cli/commands/cross_refactor_cmd.py +113 -0
semantic_code_intelligence/cli/commands/deps_cmd.py +91 -0
semantic_code_intelligence/cli/commands/docs_cmd.py +101 -0
semantic_code_intelligence/cli/commands/doctor_cmd.py +147 -0
semantic_code_intelligence/cli/commands/evolve_cmd.py +171 -0
semantic_code_intelligence/cli/commands/explain_cmd.py +112 -0
semantic_code_intelligence/cli/commands/gate_cmd.py +135 -0
semantic_code_intelligence/cli/commands/grep_cmd.py +234 -0
semantic_code_intelligence/cli/commands/hotspots_cmd.py +119 -0
semantic_code_intelligence/cli/commands/impact_cmd.py +131 -0
semantic_code_intelligence/cli/commands/index_cmd.py +138 -0
semantic_code_intelligence/cli/commands/init_cmd.py +152 -0
semantic_code_intelligence/cli/commands/investigate_cmd.py +163 -0
semantic_code_intelligence/cli/commands/languages_cmd.py +101 -0
semantic_code_intelligence/cli/commands/lsp_cmd.py +49 -0
semantic_code_intelligence/cli/commands/mcp_cmd.py +50 -0
semantic_code_intelligence/cli/commands/metrics_cmd.py +264 -0
semantic_code_intelligence/cli/commands/models_cmd.py +157 -0
semantic_code_intelligence/cli/commands/plugin_cmd.py +275 -0
semantic_code_intelligence/cli/commands/pr_summary_cmd.py +178 -0
semantic_code_intelligence/cli/commands/quality_cmd.py +208 -0
semantic_code_intelligence/cli/commands/refactor_cmd.py +103 -0
semantic_code_intelligence/cli/commands/review_cmd.py +88 -0
semantic_code_intelligence/cli/commands/search_cmd.py +236 -0
semantic_code_intelligence/cli/commands/serve_cmd.py +117 -0
semantic_code_intelligence/cli/commands/suggest_cmd.py +100 -0
semantic_code_intelligence/cli/commands/summary_cmd.py +78 -0
semantic_code_intelligence/cli/commands/tool_cmd.py +282 -0
semantic_code_intelligence/cli/commands/trace_cmd.py +123 -0
semantic_code_intelligence/cli/commands/tui_cmd.py +58 -0
semantic_code_intelligence/cli/commands/viz_cmd.py +127 -0
semantic_code_intelligence/cli/commands/watch_cmd.py +72 -0
semantic_code_intelligence/cli/commands/web_cmd.py +61 -0
semantic_code_intelligence/cli/commands/workspace_cmd.py +250 -0
semantic_code_intelligence/cli/main.py +65 -0
semantic_code_intelligence/cli/router.py +92 -0
semantic_code_intelligence/config/__init__.py +0 -0
semantic_code_intelligence/config/settings.py +260 -0
semantic_code_intelligence/context/__init__.py +19 -0
semantic_code_intelligence/context/engine.py +429 -0
semantic_code_intelligence/context/memory.py +253 -0
semantic_code_intelligence/daemon/__init__.py +1 -0
semantic_code_intelligence/daemon/watcher.py +515 -0
semantic_code_intelligence/docs/__init__.py +1080 -0
semantic_code_intelligence/embeddings/__init__.py +0 -0
semantic_code_intelligence/embeddings/enhanced.py +131 -0
semantic_code_intelligence/embeddings/generator.py +149 -0
semantic_code_intelligence/embeddings/model_registry.py +100 -0
semantic_code_intelligence/evolution/__init__.py +1 -0
semantic_code_intelligence/evolution/budget_guard.py +111 -0
semantic_code_intelligence/evolution/commit_manager.py +88 -0
semantic_code_intelligence/evolution/context_builder.py +131 -0
semantic_code_intelligence/evolution/engine.py +249 -0
semantic_code_intelligence/evolution/patch_generator.py +229 -0
semantic_code_intelligence/evolution/task_selector.py +214 -0
semantic_code_intelligence/evolution/test_runner.py +111 -0
semantic_code_intelligence/indexing/__init__.py +0 -0
semantic_code_intelligence/indexing/chunker.py +174 -0
semantic_code_intelligence/indexing/parallel.py +86 -0
semantic_code_intelligence/indexing/scanner.py +146 -0
semantic_code_intelligence/indexing/semantic_chunker.py +337 -0
semantic_code_intelligence/llm/__init__.py +62 -0
semantic_code_intelligence/llm/cache.py +219 -0
semantic_code_intelligence/llm/cached_provider.py +145 -0
semantic_code_intelligence/llm/conversation.py +190 -0
semantic_code_intelligence/llm/cross_refactor.py +272 -0
semantic_code_intelligence/llm/investigation.py +274 -0
semantic_code_intelligence/llm/mock_provider.py +77 -0
semantic_code_intelligence/llm/ollama_provider.py +122 -0
semantic_code_intelligence/llm/openai_provider.py +100 -0
semantic_code_intelligence/llm/provider.py +92 -0
semantic_code_intelligence/llm/rate_limiter.py +164 -0
semantic_code_intelligence/llm/reasoning.py +438 -0
semantic_code_intelligence/llm/safety.py +110 -0
semantic_code_intelligence/llm/streaming.py +251 -0
semantic_code_intelligence/lsp/__init__.py +609 -0
semantic_code_intelligence/mcp/__init__.py +393 -0
semantic_code_intelligence/parsing/__init__.py +19 -0
semantic_code_intelligence/parsing/parser.py +375 -0
semantic_code_intelligence/plugins/__init__.py +255 -0
semantic_code_intelligence/plugins/examples/__init__.py +1 -0
semantic_code_intelligence/plugins/examples/code_quality.py +73 -0
semantic_code_intelligence/plugins/examples/search_annotator.py +56 -0
semantic_code_intelligence/scalability/__init__.py +205 -0
semantic_code_intelligence/search/__init__.py +0 -0
semantic_code_intelligence/search/formatter.py +123 -0
semantic_code_intelligence/search/grep.py +361 -0
semantic_code_intelligence/search/hybrid_search.py +170 -0
semantic_code_intelligence/search/keyword_search.py +311 -0
semantic_code_intelligence/search/section_expander.py +103 -0
semantic_code_intelligence/services/__init__.py +0 -0
semantic_code_intelligence/services/indexing_service.py +630 -0
semantic_code_intelligence/services/search_service.py +269 -0
semantic_code_intelligence/storage/__init__.py +0 -0
semantic_code_intelligence/storage/chunk_hash_store.py +86 -0
semantic_code_intelligence/storage/hash_store.py +66 -0
semantic_code_intelligence/storage/index_manifest.py +85 -0
semantic_code_intelligence/storage/index_stats.py +138 -0
semantic_code_intelligence/storage/query_history.py +160 -0
semantic_code_intelligence/storage/symbol_registry.py +209 -0
semantic_code_intelligence/storage/vector_store.py +297 -0
semantic_code_intelligence/tests/__init__.py +0 -0
semantic_code_intelligence/tests/test_ai_features.py +351 -0
semantic_code_intelligence/tests/test_chunker.py +119 -0
semantic_code_intelligence/tests/test_cli.py +188 -0
semantic_code_intelligence/tests/test_config.py +154 -0
semantic_code_intelligence/tests/test_context.py +381 -0
semantic_code_intelligence/tests/test_embeddings.py +73 -0
semantic_code_intelligence/tests/test_endtoend.py +1142 -0
semantic_code_intelligence/tests/test_enhanced_embeddings.py +92 -0
semantic_code_intelligence/tests/test_hash_store.py +79 -0
semantic_code_intelligence/tests/test_logging.py +55 -0
semantic_code_intelligence/tests/test_new_cli.py +138 -0
semantic_code_intelligence/tests/test_parser.py +495 -0
semantic_code_intelligence/tests/test_phase10.py +355 -0
semantic_code_intelligence/tests/test_phase11.py +593 -0
semantic_code_intelligence/tests/test_phase12.py +375 -0
semantic_code_intelligence/tests/test_phase13.py +663 -0
semantic_code_intelligence/tests/test_phase14.py +568 -0
semantic_code_intelligence/tests/test_phase15.py +814 -0
semantic_code_intelligence/tests/test_phase16.py +792 -0
semantic_code_intelligence/tests/test_phase17.py +815 -0
semantic_code_intelligence/tests/test_phase18.py +934 -0
semantic_code_intelligence/tests/test_phase19.py +986 -0
semantic_code_intelligence/tests/test_phase20.py +2753 -0
semantic_code_intelligence/tests/test_phase20b.py +2058 -0
semantic_code_intelligence/tests/test_phase20c.py +962 -0
semantic_code_intelligence/tests/test_phase21.py +428 -0
semantic_code_intelligence/tests/test_phase22.py +799 -0
semantic_code_intelligence/tests/test_phase23.py +783 -0
semantic_code_intelligence/tests/test_phase24.py +715 -0
semantic_code_intelligence/tests/test_phase25.py +496 -0
semantic_code_intelligence/tests/test_phase26.py +251 -0
semantic_code_intelligence/tests/test_phase27.py +531 -0
semantic_code_intelligence/tests/test_phase8.py +592 -0
semantic_code_intelligence/tests/test_phase9.py +643 -0
semantic_code_intelligence/tests/test_plugins.py +293 -0
semantic_code_intelligence/tests/test_priority_features.py +727 -0
semantic_code_intelligence/tests/test_router.py +41 -0
semantic_code_intelligence/tests/test_scalability.py +138 -0
semantic_code_intelligence/tests/test_scanner.py +125 -0
semantic_code_intelligence/tests/test_search.py +160 -0
semantic_code_intelligence/tests/test_semantic_chunker.py +255 -0
semantic_code_intelligence/tests/test_tools.py +182 -0
semantic_code_intelligence/tests/test_vector_store.py +151 -0
semantic_code_intelligence/tests/test_watcher.py +211 -0
semantic_code_intelligence/tools/__init__.py +442 -0
semantic_code_intelligence/tools/executor.py +232 -0
semantic_code_intelligence/tools/protocol.py +200 -0
semantic_code_intelligence/tui/__init__.py +454 -0
semantic_code_intelligence/utils/__init__.py +0 -0
semantic_code_intelligence/utils/logging.py +112 -0
semantic_code_intelligence/version.py +3 -0
semantic_code_intelligence/web/__init__.py +11 -0
semantic_code_intelligence/web/api.py +289 -0
semantic_code_intelligence/web/server.py +397 -0
semantic_code_intelligence/web/ui.py +659 -0
semantic_code_intelligence/web/visualize.py +226 -0
semantic_code_intelligence/workspace/__init__.py +427 -0

semantic_code_intelligence/tests/test_priority_features.py ADDED Viewed

@@ -0,0 +1,727 @@
+"""Tests for Priority 1-5 features: hybrid search, keyword search, model registry,
+chunk hash store, section expander, parallel indexing, codexaignore, AST call graphs,
+cross-repo search modes, TUI, MCP, and streaming.
+"""
+from __future__ import annotations
+import json
+import os
+import re
+import textwrap
+from pathlib import Path
+from unittest.mock import MagicMock, patch
+import numpy as np
+import pytest
+from semantic_code_intelligence.config.settings import AppConfig, init_project
+from semantic_code_intelligence.embeddings.generator import generate_embeddings
+from semantic_code_intelligence.storage.vector_store import ChunkMetadata, VectorStore
+# ===========================================================================
+# Fixtures
+# ===========================================================================
+@pytest.fixture
+def indexed_project(tmp_path: Path) -> Path:
+    """Create a project with indexed code chunks for search tests."""
+    config, _ = init_project(tmp_path)
+    index_dir = AppConfig.index_dir(tmp_path)
+    code_snippets = [
+        "def authenticate_user(username, password):\n    return check_credentials(username, password)\n",
+        "def connect_to_database(host, port):\n    return Database(host=host, port=port)\n",
+        "def handle_http_request(request):\n    response = process(request)\n    return response\n",
+        "def verify_jwt_token(token):\n    payload = jwt.decode(token, SECRET_KEY)\n    return payload\n",
+        "def calculate_statistics(data):\n    mean = sum(data) / len(data)\n    return mean\n",
+    ]
+    embeddings = generate_embeddings(code_snippets)
+    metadata = [
+        ChunkMetadata(
+            file_path=f"src/module_{i}.py",
+            start_line=1,
+            end_line=3,
+            chunk_index=0,
+            language="python",
+            content=snippet,
+            content_hash=f"hash_{i}",
+        )
+        for i, snippet in enumerate(code_snippets)
+    ]
+    store = VectorStore(embeddings.shape[1])
+    store.add(embeddings, metadata)
+    store.save(index_dir)
+    return tmp_path
+@pytest.fixture
+def vector_store(indexed_project: Path) -> VectorStore:
+    """Load the vector store from the indexed project."""
+    index_dir = AppConfig.index_dir(indexed_project)
+    return VectorStore.load(index_dir)
+# ===========================================================================
+# P1: Keyword Search (BM25)
+# ===========================================================================
+class TestKeywordSearch:
+    """Tests for the BM25 keyword search engine."""
+    def test_keyword_search_returns_results(self, indexed_project: Path, vector_store: VectorStore):
+        from semantic_code_intelligence.search.keyword_search import keyword_search, _bm25_cache
+        # Clear cache so we get a fresh BM25 index for this store
+        _bm25_cache.clear()
+        index_dir = AppConfig.index_dir(indexed_project)
+        results = keyword_search("authenticate", vector_store, index_dir, top_k=3)
+        assert len(results) > 0
+        assert any("authenticate" in r.content.lower() for r in results)
+    def test_keyword_search_empty_query(self, indexed_project: Path, vector_store: VectorStore):
+        from semantic_code_intelligence.search.keyword_search import keyword_search
+        index_dir = AppConfig.index_dir(indexed_project)
+        results = keyword_search("", vector_store, index_dir, top_k=3)
+        assert isinstance(results, list)
+    def test_keyword_search_no_match(self, indexed_project: Path, vector_store: VectorStore):
+        from semantic_code_intelligence.search.keyword_search import keyword_search
+        index_dir = AppConfig.index_dir(indexed_project)
+        results = keyword_search("xyznonexistent999", vector_store, index_dir, top_k=3)
+        assert len(results) == 0
+class TestRegexSearch:
+    """Tests for the regex search engine."""
+    def test_regex_search_finds_pattern(self, vector_store: VectorStore):
+        from semantic_code_intelligence.search.keyword_search import regex_search
+        results = regex_search(r"def \w+_user", vector_store, top_k=5)
+        assert len(results) > 0
+    def test_regex_search_case_insensitive(self, vector_store: VectorStore):
+        from semantic_code_intelligence.search.keyword_search import regex_search
+        results = regex_search("DATABASE", vector_store, top_k=5, case_insensitive=True)
+        assert len(results) > 0
+    def test_regex_search_case_sensitive(self, vector_store: VectorStore):
+        from semantic_code_intelligence.search.keyword_search import regex_search
+        results = regex_search("DATABASE", vector_store, top_k=5, case_insensitive=False)
+        # All content uses lowercase, so no match expected
+        assert len(results) == 0
+    def test_regex_search_invalid_pattern(self, vector_store: VectorStore):
+        from semantic_code_intelligence.search.keyword_search import regex_search
+        # Invalid regex should return empty, not crash
+        results = regex_search("[invalid", vector_store, top_k=5)
+        assert isinstance(results, list)
+# ===========================================================================
+# P1: Hybrid Search (RRF)
+# ===========================================================================
+class TestHybridSearch:
+    """Tests for Reciprocal Rank Fusion hybrid search."""
+    def test_hybrid_search_returns_results(self, indexed_project: Path, vector_store: VectorStore):
+        from semantic_code_intelligence.search.hybrid_search import hybrid_search
+        index_dir = AppConfig.index_dir(indexed_project)
+        results = hybrid_search(
+            "authenticate user",
+            vector_store,
+            index_dir,
+            top_k=3,
+        )
+        assert len(results) > 0
+    def test_hybrid_search_rrf_formula(self):
+        from semantic_code_intelligence.search.hybrid_search import reciprocal_rank_fusion
+        # RRF expects list of (chunk_index, score) tuples
+        semantic = [(0, 1.0), (1, 0.5), (2, 0.3)]
+        keyword = [(1, 1.0), (3, 0.8)]
+        fused = reciprocal_rank_fusion(semantic, keyword, k=60)
+        # Returns list of (index, fused_score, sem_score, kw_score)
+        indices = {t[0] for t in fused}
+        assert 1 in indices  # "b" equivalent — in both lists
+        # Item in both lists should have higher fused score
+        scores_by_idx = {t[0]: t[1] for t in fused}
+        assert scores_by_idx[1] >= scores_by_idx.get(0, 0)
+    def test_hybrid_search_empty_query(self, indexed_project: Path, vector_store: VectorStore):
+        from semantic_code_intelligence.search.hybrid_search import hybrid_search
+        index_dir = AppConfig.index_dir(indexed_project)
+        results = hybrid_search("", vector_store, index_dir, top_k=3)
+        assert isinstance(results, list)
+# ===========================================================================
+# P1: Section Expander
+# ===========================================================================
+class TestSectionExpander:
+    """Tests for full-section expansion."""
+    def test_expand_returns_results(self, indexed_project: Path):
+        from semantic_code_intelligence.search.section_expander import expand_to_full_section
+        from semantic_code_intelligence.services.search_service import SearchResult
+        results = [
+            SearchResult(
+                file_path="src/module_0.py",
+                start_line=1,
+                end_line=3,
+                language="python",
+                content="def authenticate_user():\n    pass\n",
+                score=0.9,
+                chunk_index=0,
+            )
+        ]
+        index_dir = AppConfig.index_dir(indexed_project)
+        expanded = expand_to_full_section(results, indexed_project, index_dir)
+        # Should return at least the original results
+        assert len(expanded) >= 1
+# ===========================================================================
+# P1: Auto-index on Search
+# ===========================================================================
+class TestAutoIndex:
+    """Tests for auto-indexing when searching without an existing index."""
+    def test_search_auto_indexes(self, tmp_path: Path):
+        """Searching a project with no index should trigger auto-index."""
+        config, _ = init_project(tmp_path)
+        # Create a file to index
+        src = tmp_path / "hello.py"
+        src.write_text("def greet(name):\n    return f'Hello {name}'\n")
+        from semantic_code_intelligence.services.search_service import search_codebase
+        results = search_codebase("greet", tmp_path, auto_index=True)
+        # At minimum the auto-index ran without error
+        assert isinstance(results, list)
+# ===========================================================================
+# P2: Chunk Hash Store
+# ===========================================================================
+class TestChunkHashStore:
+    """Tests for chunk-level content hashing."""
+    def test_store_and_check(self, tmp_path: Path):
+        from semantic_code_intelligence.storage.chunk_hash_store import ChunkHashStore
+        store = ChunkHashStore()
+        store.set("file.py:1:10", "abc123")
+        assert store.get("file.py:1:10") == "abc123"
+        assert store.get("nonexistent") is None
+    def test_has_changed(self, tmp_path: Path):
+        from semantic_code_intelligence.storage.chunk_hash_store import ChunkHashStore
+        store = ChunkHashStore()
+        store.set("file.py:1:10", "abc123")
+        assert not store.has_changed("file.py:1:10", "abc123")
+        assert store.has_changed("file.py:1:10", "def456")
+        assert store.has_changed("new_key", "anything")
+    def test_remove_by_file(self, tmp_path: Path):
+        from semantic_code_intelligence.storage.chunk_hash_store import ChunkHashStore
+        store = ChunkHashStore()
+        store.set("a.py:1:10", "h1")
+        store.set("a.py:11:20", "h2")
+        store.set("b.py:1:5", "h3")
+        removed = store.remove_by_file("a.py")
+        assert removed == 2
+        assert store.get("a.py:1:10") is None
+        assert store.get("b.py:1:5") == "h3"
+    def test_save_and_load(self, tmp_path: Path):
+        from semantic_code_intelligence.storage.chunk_hash_store import ChunkHashStore
+        store = ChunkHashStore()
+        store.set("file.py:1:10", "abc123")
+        store.save(tmp_path)
+        loaded = ChunkHashStore.load(tmp_path)
+        assert loaded.get("file.py:1:10") == "abc123"
+    def test_keys_for_file(self):
+        from semantic_code_intelligence.storage.chunk_hash_store import ChunkHashStore
+        store = ChunkHashStore()
+        store.set("a.py:1:10", "h1")
+        store.set("a.py:11:20", "h2")
+        store.set("b.py:1:5", "h3")
+        keys = store.keys_for_file("a.py")
+        assert len(keys) == 2
+        assert "a.py:1:10" in keys
+# ===========================================================================
+# P2: Model Registry
+# ===========================================================================
+class TestModelRegistry:
+    """Tests for the embedding model registry."""
+    def test_resolve_alias(self):
+        from semantic_code_intelligence.embeddings.model_registry import resolve_model_name
+        assert resolve_model_name("minilm") == "all-MiniLM-L6-v2"
+        assert resolve_model_name("bge-small") == "BAAI/bge-small-en-v1.5"
+    def test_resolve_full_name(self):
+        from semantic_code_intelligence.embeddings.model_registry import resolve_model_name
+        assert resolve_model_name("all-MiniLM-L6-v2") == "all-MiniLM-L6-v2"
+    def test_resolve_unknown(self):
+        from semantic_code_intelligence.embeddings.model_registry import resolve_model_name
+        # Unknown names should be returned as-is (for custom models)
+        assert resolve_model_name("my-custom-model") == "my-custom-model"
+    def test_get_model_info(self):
+        from semantic_code_intelligence.embeddings.model_registry import get_model_info
+        info = get_model_info("all-MiniLM-L6-v2")
+        assert info is not None
+        assert info.dimension == 384
+    def test_list_models(self):
+        from semantic_code_intelligence.embeddings.model_registry import list_models
+        models = list_models()
+        assert len(models) >= 5
+        names = [m.name for m in models]
+        assert "all-MiniLM-L6-v2" in names
+# ===========================================================================
+# P2: ONNX Backend Detection
+# ===========================================================================
+class TestONNXBackend:
+    """Tests for ONNX backend detection in generator."""
+    def test_onnx_available_detection(self):
+        from semantic_code_intelligence.embeddings.generator import _onnx_available
+        # Just verify it returns a bool without crashing
+        result = _onnx_available()
+        assert isinstance(result, bool)
+# ===========================================================================
+# P3: Parallel Indexing
+# ===========================================================================
+class TestParallelIndexing:
+    """Tests for parallel file chunking and hash scanning."""
+    def test_parallel_chunk_files(self, tmp_path: Path):
+        from semantic_code_intelligence.indexing.parallel import parallel_chunk_files
+        from semantic_code_intelligence.indexing.scanner import ScannedFile
+        # Create some source files and wrap them as ScannedFile
+        scanned = []
+        for i in range(5):
+            p = tmp_path / f"file_{i}.py"
+            p.write_text(f"def func_{i}():\n    return {i}\n")
+            scanned.append(ScannedFile(
+                path=p,
+                relative_path=f"file_{i}.py",
+                extension=".py",
+                size_bytes=p.stat().st_size,
+                content_hash=f"hash_{i}",
+            ))
+        chunks = parallel_chunk_files(scanned, chunk_size=200, chunk_overlap=0)
+        assert len(chunks) >= 5  # At least one tuple per file
+    def test_parallel_scan_hashes(self, tmp_path: Path):
+        from semantic_code_intelligence.indexing.parallel import parallel_scan_hashes
+        for i in range(3):
+            (tmp_path / f"f{i}.py").write_text(f"# file {i}\n")
+        files = [tmp_path / f"f{i}.py" for i in range(3)]
+        hashes = parallel_scan_hashes(files)
+        assert len(hashes) == 3
+        # All hashes should be hex strings
+        for h in hashes.values():
+            assert len(h) == 64  # SHA-256 hex
+# ===========================================================================
+# P4: .codexaignore
+# ===========================================================================
+class TestCodexaIgnore:
+    """Tests for .codexaignore file support in the scanner."""
+    def test_codexaignore_excludes_files(self, tmp_path: Path):
+        from semantic_code_intelligence.indexing.scanner import scan_repository
+        from semantic_code_intelligence.config.settings import IndexConfig
+        # Create files
+        (tmp_path / "keep.py").write_text("x = 1\n")
+        (tmp_path / "secret.py").write_text("password = 'abc'\n")
+        subdir = tmp_path / "vendor"
+        subdir.mkdir()
+        (subdir / "lib.py").write_text("y = 2\n")
+        # Create .codexaignore
+        (tmp_path / ".codexaignore").write_text("secret.py\nvendor/*\n")
+        config = IndexConfig(extensions={".py"})
+        results = scan_repository(tmp_path, config)
+        paths = [r.relative_path for r in results]
+        assert any("keep.py" in p for p in paths)
+        assert not any("secret.py" in p for p in paths)
+        assert not any("vendor" in p for p in paths)
+    def test_codexaignore_comments_ignored(self, tmp_path: Path):
+        from semantic_code_intelligence.indexing.scanner import _load_ignore_patterns
+        (tmp_path / ".codexaignore").write_text("# comment\npattern\n  \n")
+        patterns = _load_ignore_patterns(tmp_path)
+        assert patterns == ["pattern"]
+    def test_no_codexaignore_file(self, tmp_path: Path):
+        from semantic_code_intelligence.indexing.scanner import _load_ignore_patterns
+        patterns = _load_ignore_patterns(tmp_path)
+        assert patterns == []
+# ===========================================================================
+# P4: TUI
+# ===========================================================================
+class TestTUI:
+    """Tests for the TUI module."""
+    def test_tui_import(self):
+        from semantic_code_intelligence.tui import run_tui
+        assert callable(run_tui)
+# ===========================================================================
+# P4: MCP Server
+# ===========================================================================
+class TestMCPServer:
+    """Tests for the MCP server (official SDK)."""
+    @pytest.fixture(autouse=True)
+    def _require_mcp(self):
+        pytest.importorskip("mcp", reason="mcp SDK not installed")
+    def test_mcp_import(self):
+        from semantic_code_intelligence.mcp import run_mcp_server, MCP_TOOLS
+        assert callable(run_mcp_server)
+        assert len(MCP_TOOLS) >= 8
+    def test_mcp_tool_definitions(self):
+        from semantic_code_intelligence.mcp import MCP_TOOLS
+        names = {t.name for t in MCP_TOOLS}
+        assert "semantic_search" in names
+        assert "keyword_search" in names
+        assert "hybrid_search" in names
+        assert "regex_search" in names
+        assert "explain_symbol" in names
+        assert "health_check" in names
+    def test_mcp_dispatch_health_check(self):
+        from semantic_code_intelligence.mcp import _dispatch_tool
+        result = _dispatch_tool("health_check", {}, Path("."))
+        assert result["status"] == "ok"
+    def test_mcp_dispatch_unknown_tool(self):
+        from semantic_code_intelligence.mcp import _dispatch_tool
+        result = _dispatch_tool("nonexistent_tool", {}, Path("."))
+        assert "error" in result
+    def test_mcp_create_server(self):
+        from semantic_code_intelligence.mcp import _create_server
+        server = _create_server(Path("."))
+        assert server is not None
+# ===========================================================================
+# P5: AST-based Call Graphs
+# ===========================================================================
+class TestASTCallGraph:
+    """Tests for the AST-based call graph."""
+    def test_ast_call_graph_detects_calls(self):
+        from semantic_code_intelligence.context.engine import CallGraph
+        from semantic_code_intelligence.parsing.parser import Symbol
+        symbols = [
+            Symbol(
+                name="caller_func",
+                kind="function",
+                file_path="test.py",
+                start_line=1,
+                end_line=3,
+                start_col=0,
+                end_col=0,
+                body="def caller_func():\n    result = callee_func()\n    return result\n",
+            ),
+            Symbol(
+                name="callee_func",
+                kind="function",
+                file_path="test.py",
+                start_line=5,
+                end_line=6,
+                start_col=0,
+                end_col=0,
+                body="def callee_func():\n    return 42\n",
+            ),
+        ]
+        cg = CallGraph()
+        cg.build(symbols)
+        callers = cg.callers_of("callee_func")
+        assert len(callers) >= 1
+        assert any("caller_func" in e.caller for e in callers)
+    def test_ast_call_graph_no_self_reference(self):
+        from semantic_code_intelligence.context.engine import CallGraph
+        from semantic_code_intelligence.parsing.parser import Symbol
+        symbols = [
+            Symbol(
+                name="recursive",
+                kind="function",
+                file_path="test.py",
+                start_line=1,
+                end_line=3,
+                start_col=0,
+                end_col=0,
+                body="def recursive():\n    return recursive()\n",
+            ),
+        ]
+        cg = CallGraph()
+        cg.build(symbols)
+        assert len(cg.edges) == 0
+    def test_ast_call_graph_method_call(self):
+        from semantic_code_intelligence.context.engine import CallGraph
+        from semantic_code_intelligence.parsing.parser import Symbol
+        symbols = [
+            Symbol(
+                name="main",
+                kind="function",
+                file_path="test.py",
+                start_line=1,
+                end_line=3,
+                start_col=0,
+                end_col=0,
+                body="def main():\n    obj.helper()\n    return\n",
+            ),
+            Symbol(
+                name="helper",
+                kind="method",
+                file_path="test.py",
+                start_line=5,
+                end_line=6,
+                start_col=0,
+                end_col=0,
+                body="def helper(self):\n    pass\n",
+            ),
+        ]
+        cg = CallGraph()
+        cg.build(symbols)
+        callers = cg.callers_of("helper")
+        assert len(callers) >= 1
+    def test_call_graph_to_dict(self):
+        from semantic_code_intelligence.context.engine import CallGraph
+        from semantic_code_intelligence.parsing.parser import Symbol
+        symbols = [
+            Symbol(
+                name="a", kind="function", file_path="t.py",
+                start_line=1, end_line=2, start_col=0, end_col=0,
+                body="def a():\n    b()\n",
+            ),
+            Symbol(
+                name="b", kind="function", file_path="t.py",
+                start_line=3, end_line=4, start_col=0, end_col=0,
+                body="def b():\n    pass\n",
+            ),
+        ]
+        cg = CallGraph()
+        cg.build(symbols)
+        d = cg.to_dict()
+        assert "edges" in d
+        assert "node_count" in d
+        assert "edge_count" in d
+        assert d["edge_count"] >= 1
+# ===========================================================================
+# P5: Cross-repo Search Modes
+# ===========================================================================
+class TestCrossRepoSearchModes:
+    """Tests for multi-mode cross-repo workspace search."""
+    def test_workspace_search_keyword_mode(self, tmp_path: Path):
+        from semantic_code_intelligence.workspace import Workspace
+        ws_root = tmp_path / "workspace"
+        ws_root.mkdir()
+        repo_a = ws_root / "repo_a"
+        repo_a.mkdir()
+        (repo_a / "hello.py").write_text("def greet():\n    print('hello')\n")
+        ws = Workspace.load_or_create(ws_root)
+        ws.add_repo("repo_a", repo_a)
+        ws.save()
+        ws.index_all()
+        # Keyword mode search
+        results = ws.search("greet", top_k=5, mode="keyword")
+        assert isinstance(results, list)
+    def test_workspace_search_regex_mode(self, tmp_path: Path):
+        from semantic_code_intelligence.workspace import Workspace
+        ws_root = tmp_path / "workspace"
+        ws_root.mkdir()
+        repo_a = ws_root / "repo_a"
+        repo_a.mkdir()
+        (repo_a / "hello.py").write_text("def greet():\n    print('hello')\n")
+        ws = Workspace.load_or_create(ws_root)
+        ws.add_repo("repo_a", repo_a)
+        ws.save()
+        ws.index_all()
+        results = ws.search(r"def \w+", top_k=5, mode="regex")
+        assert isinstance(results, list)
+# ===========================================================================
+# P5: Streaming
+# ===========================================================================
+class TestStreaming:
+    """Tests for streaming chat and investigation responses."""
+    def test_stream_chat_mock(self):
+        from semantic_code_intelligence.llm.mock_provider import MockProvider
+        from semantic_code_intelligence.llm.provider import LLMMessage, MessageRole
+        from semantic_code_intelligence.llm.streaming import StreamEvent, stream_chat
+        provider = MockProvider()
+        messages = [LLMMessage(role=MessageRole.USER, content="Hello")]
+        events: list[StreamEvent] = []
+        gen = stream_chat(provider, messages)
+        for event in gen:
+            events.append(event)
+        kinds = [e.kind for e in events]
+        assert "start" in kinds
+        assert "token" in kinds
+        assert "done" in kinds
+    def test_chat_cmd_stream_flag_exists(self):
+        """Verify the --stream option is registered on chat_cmd."""
+        from semantic_code_intelligence.cli.commands.chat_cmd import chat_cmd
+        param_names = [p.name for p in chat_cmd.params]
+        assert "stream" in param_names
+    def test_investigate_cmd_stream_flag_exists(self):
+        """Verify the --stream option is registered on investigate_cmd."""
+        from semantic_code_intelligence.cli.commands.investigate_cmd import investigate_cmd
+        param_names = [p.name for p in investigate_cmd.params]
+        assert "stream" in param_names
+# ===========================================================================
+# Router Registration
+# ===========================================================================
+class TestRouterRegistration:
+    """Tests that new commands are registered in the CLI router."""
+    def test_tui_and_mcp_registered(self):
+        from semantic_code_intelligence.cli.router import register_commands
+        group = __import__("click").Group()
+        register_commands(group)
+        command_names = list(group.commands.keys())
+        assert "tui" in command_names
+        assert "mcp" in command_names
+# ===========================================================================
+# Search Service Multi-Mode
+# ===========================================================================
+class TestSearchServiceModes:
+    """Tests for the search service's multi-mode dispatch."""
+    def test_semantic_mode(self, indexed_project: Path):
+        from semantic_code_intelligence.services.search_service import search_codebase
+        results = search_codebase("authenticate", indexed_project, mode="semantic")
+        assert len(results) > 0
+    def test_keyword_mode(self, indexed_project: Path):
+        from semantic_code_intelligence.services.search_service import search_codebase
+        # BM25 tokenizer splits camelCase; use a token that directly matches
+        results = search_codebase("authenticate", indexed_project, mode="keyword")
+        # Keyword search should at least not crash; may return 0 if token
+        # tokenization doesn't match exactly — that's valid BM25 behaviour.
+        assert isinstance(results, list)
+    def test_regex_mode(self, indexed_project: Path):
+        from semantic_code_intelligence.services.search_service import search_codebase
+        results = search_codebase(r"def \w+_user", indexed_project, mode="regex")
+        assert len(results) > 0
+    def test_hybrid_mode(self, indexed_project: Path):
+        from semantic_code_intelligence.services.search_service import search_codebase
+        results = search_codebase("authenticate user database", indexed_project, mode="hybrid")
+        assert len(results) > 0