npm - claude-code-workflow - Versions diffs - 6.2.7 → 6.3.0 - Mend

claude-code-workflow 6.2.7 → 6.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (208) hide show

package/.claude/CLAUDE.md +16 -1
package/.claude/workflows/cli-templates/protocols/analysis-protocol.md +11 -4
package/.claude/workflows/cli-templates/protocols/write-protocol.md +10 -75
package/.claude/workflows/cli-tools-usage.md +14 -24
package/.codex/AGENTS.md +51 -1
package/.codex/prompts/compact.md +378 -0
package/.gemini/GEMINI.md +57 -20
package/ccw/dist/cli.d.ts.map +1 -1
package/ccw/dist/cli.js +21 -8
package/ccw/dist/cli.js.map +1 -1
package/ccw/dist/commands/cli.d.ts +2 -0
package/ccw/dist/commands/cli.d.ts.map +1 -1
package/ccw/dist/commands/cli.js +129 -8
package/ccw/dist/commands/cli.js.map +1 -1
package/ccw/dist/commands/hook.d.ts.map +1 -1
package/ccw/dist/commands/hook.js +3 -2
package/ccw/dist/commands/hook.js.map +1 -1
package/ccw/dist/config/litellm-api-config-manager.d.ts +180 -0
package/ccw/dist/config/litellm-api-config-manager.d.ts.map +1 -0
package/ccw/dist/config/litellm-api-config-manager.js +770 -0
package/ccw/dist/config/litellm-api-config-manager.js.map +1 -0
package/ccw/dist/config/provider-models.d.ts +73 -0
package/ccw/dist/config/provider-models.d.ts.map +1 -0
package/ccw/dist/config/provider-models.js +172 -0
package/ccw/dist/config/provider-models.js.map +1 -0
package/ccw/dist/core/cache-manager.d.ts.map +1 -1
package/ccw/dist/core/cache-manager.js +3 -5
package/ccw/dist/core/cache-manager.js.map +1 -1
package/ccw/dist/core/dashboard-generator.d.ts.map +1 -1
package/ccw/dist/core/dashboard-generator.js +3 -1
package/ccw/dist/core/dashboard-generator.js.map +1 -1
package/ccw/dist/core/routes/cli-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/cli-routes.js +169 -0
package/ccw/dist/core/routes/cli-routes.js.map +1 -1
package/ccw/dist/core/routes/codexlens-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/codexlens-routes.js +234 -18
package/ccw/dist/core/routes/codexlens-routes.js.map +1 -1
package/ccw/dist/core/routes/hooks-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/hooks-routes.js +30 -32
package/ccw/dist/core/routes/hooks-routes.js.map +1 -1
package/ccw/dist/core/routes/litellm-api-routes.d.ts +21 -0
package/ccw/dist/core/routes/litellm-api-routes.d.ts.map +1 -0
package/ccw/dist/core/routes/litellm-api-routes.js +780 -0
package/ccw/dist/core/routes/litellm-api-routes.js.map +1 -0
package/ccw/dist/core/routes/litellm-routes.d.ts +20 -0
package/ccw/dist/core/routes/litellm-routes.d.ts.map +1 -0
package/ccw/dist/core/routes/litellm-routes.js +85 -0
package/ccw/dist/core/routes/litellm-routes.js.map +1 -0
package/ccw/dist/core/routes/mcp-routes.js +2 -2
package/ccw/dist/core/routes/mcp-routes.js.map +1 -1
package/ccw/dist/core/routes/status-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/status-routes.js +39 -0
package/ccw/dist/core/routes/status-routes.js.map +1 -1
package/ccw/dist/core/routes/system-routes.js +1 -1
package/ccw/dist/core/routes/system-routes.js.map +1 -1
package/ccw/dist/core/server.d.ts.map +1 -1
package/ccw/dist/core/server.js +15 -1
package/ccw/dist/core/server.js.map +1 -1
package/ccw/dist/mcp-server/index.js +1 -1
package/ccw/dist/mcp-server/index.js.map +1 -1
package/ccw/dist/tools/claude-cli-tools.d.ts +82 -0
package/ccw/dist/tools/claude-cli-tools.d.ts.map +1 -0
package/ccw/dist/tools/claude-cli-tools.js +216 -0
package/ccw/dist/tools/claude-cli-tools.js.map +1 -0
package/ccw/dist/tools/cli-executor.d.ts.map +1 -1
package/ccw/dist/tools/cli-executor.js +76 -14
package/ccw/dist/tools/cli-executor.js.map +1 -1
package/ccw/dist/tools/codex-lens.d.ts +9 -2
package/ccw/dist/tools/codex-lens.d.ts.map +1 -1
package/ccw/dist/tools/codex-lens.js +114 -9
package/ccw/dist/tools/codex-lens.js.map +1 -1
package/ccw/dist/tools/context-cache-store.d.ts +136 -0
package/ccw/dist/tools/context-cache-store.d.ts.map +1 -0
package/ccw/dist/tools/context-cache-store.js +256 -0
package/ccw/dist/tools/context-cache-store.js.map +1 -0
package/ccw/dist/tools/context-cache.d.ts +56 -0
package/ccw/dist/tools/context-cache.d.ts.map +1 -0
package/ccw/dist/tools/context-cache.js +294 -0
package/ccw/dist/tools/context-cache.js.map +1 -0
package/ccw/dist/tools/core-memory.d.ts.map +1 -1
package/ccw/dist/tools/core-memory.js +33 -19
package/ccw/dist/tools/core-memory.js.map +1 -1
package/ccw/dist/tools/index.d.ts.map +1 -1
package/ccw/dist/tools/index.js +2 -0
package/ccw/dist/tools/index.js.map +1 -1
package/ccw/dist/tools/litellm-client.d.ts +85 -0
package/ccw/dist/tools/litellm-client.d.ts.map +1 -0
package/ccw/dist/tools/litellm-client.js +188 -0
package/ccw/dist/tools/litellm-client.js.map +1 -0
package/ccw/dist/tools/litellm-executor.d.ts +34 -0
package/ccw/dist/tools/litellm-executor.d.ts.map +1 -0
package/ccw/dist/tools/litellm-executor.js +192 -0
package/ccw/dist/tools/litellm-executor.js.map +1 -0
package/ccw/dist/tools/pattern-parser.d.ts +55 -0
package/ccw/dist/tools/pattern-parser.d.ts.map +1 -0
package/ccw/dist/tools/pattern-parser.js +237 -0
package/ccw/dist/tools/pattern-parser.js.map +1 -0
package/ccw/dist/tools/smart-search.d.ts +1 -0
package/ccw/dist/tools/smart-search.d.ts.map +1 -1
package/ccw/dist/tools/smart-search.js +117 -41
package/ccw/dist/tools/smart-search.js.map +1 -1
package/ccw/dist/types/litellm-api-config.d.ts +294 -0
package/ccw/dist/types/litellm-api-config.d.ts.map +1 -0
package/ccw/dist/types/litellm-api-config.js +8 -0
package/ccw/dist/types/litellm-api-config.js.map +1 -0
package/ccw/src/cli.ts +258 -244
package/ccw/src/commands/cli.ts +153 -9
package/ccw/src/commands/hook.ts +3 -2
package/ccw/src/config/.litellm-api-config-manager.ts.2025-12-23T11-57-43-727Z.bak +441 -0
package/ccw/src/config/litellm-api-config-manager.ts +1012 -0
package/ccw/src/config/provider-models.ts +222 -0
package/ccw/src/core/cache-manager.ts +292 -294
package/ccw/src/core/dashboard-generator.ts +3 -1
package/ccw/src/core/routes/cli-routes.ts +192 -0
package/ccw/src/core/routes/codexlens-routes.ts +241 -19
package/ccw/src/core/routes/hooks-routes.ts +399 -405
package/ccw/src/core/routes/litellm-api-routes.ts +930 -0
package/ccw/src/core/routes/litellm-routes.ts +107 -0
package/ccw/src/core/routes/mcp-routes.ts +1271 -1271
package/ccw/src/core/routes/status-routes.ts +51 -0
package/ccw/src/core/routes/system-routes.ts +1 -1
package/ccw/src/core/server.ts +15 -1
package/ccw/src/mcp-server/index.ts +1 -1
package/ccw/src/templates/dashboard-css/12-cli-legacy.css +44 -0
package/ccw/src/templates/dashboard-css/31-api-settings.css +2265 -0
package/ccw/src/templates/dashboard-js/components/cli-history.js +15 -8
package/ccw/src/templates/dashboard-js/components/cli-status.js +323 -9
package/ccw/src/templates/dashboard-js/components/navigation.js +329 -313
package/ccw/src/templates/dashboard-js/i18n.js +583 -1
package/ccw/src/templates/dashboard-js/views/api-settings.js +3362 -0
package/ccw/src/templates/dashboard-js/views/cli-manager.js +199 -24
package/ccw/src/templates/dashboard-js/views/codexlens-manager.js +1265 -27
package/ccw/src/templates/dashboard.html +840 -831
package/ccw/src/tools/claude-cli-tools.ts +300 -0
package/ccw/src/tools/cli-executor.ts +83 -14
package/ccw/src/tools/codex-lens.ts +146 -9
package/ccw/src/tools/context-cache-store.ts +368 -0
package/ccw/src/tools/context-cache.ts +393 -0
package/ccw/src/tools/core-memory.ts +33 -19
package/ccw/src/tools/index.ts +2 -0
package/ccw/src/tools/litellm-client.ts +246 -0
package/ccw/src/tools/litellm-executor.ts +241 -0
package/ccw/src/tools/pattern-parser.ts +329 -0
package/ccw/src/tools/smart-search.ts +142 -41
package/ccw/src/types/litellm-api-config.ts +402 -0
package/ccw-litellm/README.md +180 -0
package/ccw-litellm/pyproject.toml +35 -0
package/ccw-litellm/src/ccw_litellm/__init__.py +47 -0
package/ccw-litellm/src/ccw_litellm/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/__pycache__/cli.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/cli.py +108 -0
package/ccw-litellm/src/ccw_litellm/clients/__init__.py +12 -0
package/ccw-litellm/src/ccw_litellm/clients/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/clients/__pycache__/litellm_embedder.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/clients/__pycache__/litellm_llm.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/clients/litellm_embedder.py +251 -0
package/ccw-litellm/src/ccw_litellm/clients/litellm_llm.py +165 -0
package/ccw-litellm/src/ccw_litellm/config/__init__.py +22 -0
package/ccw-litellm/src/ccw_litellm/config/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/config/__pycache__/loader.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/config/__pycache__/models.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/config/loader.py +316 -0
package/ccw-litellm/src/ccw_litellm/config/models.py +130 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__init__.py +14 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__pycache__/embedder.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__pycache__/llm.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/interfaces/embedder.py +52 -0
package/ccw-litellm/src/ccw_litellm/interfaces/llm.py +45 -0
package/codex-lens/src/codexlens/__pycache__/config.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/commands.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/embedding_manager.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/model_manager.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/output.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/commands.py +378 -23
package/codex-lens/src/codexlens/cli/embedding_manager.py +660 -56
package/codex-lens/src/codexlens/cli/model_manager.py +31 -18
package/codex-lens/src/codexlens/cli/output.py +12 -1
package/codex-lens/src/codexlens/config.py +93 -0
package/codex-lens/src/codexlens/search/__pycache__/chain_search.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/search/__pycache__/hybrid_search.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/search/__pycache__/ranking.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/search/chain_search.py +6 -2
package/codex-lens/src/codexlens/search/hybrid_search.py +44 -21
package/codex-lens/src/codexlens/search/ranking.py +1 -1
package/codex-lens/src/codexlens/semantic/__init__.py +42 -0
package/codex-lens/src/codexlens/semantic/__pycache__/__init__.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/base.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/chunker.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/embedder.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/factory.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/gpu_support.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/litellm_embedder.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/vector_store.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/base.py +61 -0
package/codex-lens/src/codexlens/semantic/chunker.py +43 -20
package/codex-lens/src/codexlens/semantic/embedder.py +60 -13
package/codex-lens/src/codexlens/semantic/factory.py +98 -0
package/codex-lens/src/codexlens/semantic/gpu_support.py +225 -3
package/codex-lens/src/codexlens/semantic/litellm_embedder.py +144 -0
package/codex-lens/src/codexlens/semantic/rotational_embedder.py +434 -0
package/codex-lens/src/codexlens/semantic/vector_store.py +33 -8
package/codex-lens/src/codexlens/storage/__pycache__/path_mapper.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/storage/migrations/__pycache__/migration_004_dual_fts.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/storage/path_mapper.py +27 -1
package/package.json +15 -5
package/.codex/prompts.zip +0 -0
package/ccw/package.json +0 -65

package/codex-lens/src/codexlens/cli/model_manager.py CHANGED Viewed

@@ -79,36 +79,38 @@ def get_cache_dir() -> Path:
     """Get fastembed cache directory.
     Returns:
-        Path to cache directory (usually ~/.cache/fastembed or %LOCALAPPDATA%\\Temp\\fastembed_cache)
+        Path to cache directory (~/.cache/huggingface or custom path)
     """
     # Check HF_HOME environment variable first
     if "HF_HOME" in os.environ:
         return Path(os.environ["HF_HOME"])
-    # Default cache locations
-    if os.name == "nt":  # Windows
-        cache_dir = Path(os.environ.get("LOCALAPPDATA", Path.home() / "AppData" / "Local")) / "Temp" / "fastembed_cache"
-    else:  # Unix-like
-        cache_dir = Path.home() / ".cache" / "fastembed"
-    return cache_dir
+    # fastembed 0.7.4+ uses HuggingFace cache when cache_dir is specified
+    # Models are stored directly under the cache directory
+    return Path.home() / ".cache" / "huggingface"
 def _get_model_cache_path(cache_dir: Path, info: Dict) -> Path:
     """Get the actual cache path for a model.
-    fastembed uses ONNX versions of models with different names than the original.
-    This function returns the correct path based on the cache_name field.
+    fastembed 0.7.4+ uses HuggingFace Hub's naming convention:
+    - Prefix: 'models--'
+    - Replace '/' with '--' in model name
+    Example: jinaai/jina-embeddings-v2-base-code
+             -> models--jinaai--jina-embeddings-v2-base-code
     Args:
-        cache_dir: The fastembed cache directory
+        cache_dir: The fastembed cache directory (HuggingFace hub path)
         info: Model profile info dictionary
     Returns:
         Path to the model cache directory
     """
-    cache_name = info.get("cache_name", info["model_name"])
-    return cache_dir / f"models--{cache_name.replace('/', '--')}"
+    # HuggingFace Hub naming: models--{org}--{model}
+    # Use cache_name if available (for mapped ONNX models), else model_name
+    target_name = info.get("cache_name", info["model_name"])
+    sanitized_name = f"models--{target_name.replace('/', '--')}"
+    return cache_dir / sanitized_name
 def list_models() -> Dict[str, any]:
@@ -194,18 +196,29 @@ def download_model(profile: str, progress_callback: Optional[callable] = None) -
     model_name = info["model_name"]
     try:
-        # Download model by instantiating TextEmbedding
-        # This will automatically download to cache if not present
+        # Get cache directory
+        cache_dir = get_cache_dir()
+        # Download model by instantiating TextEmbedding with explicit cache_dir
+        # This ensures fastembed uses the correct HuggingFace Hub cache location
         if progress_callback:
             progress_callback(f"Downloading {model_name}...")
-        embedder = TextEmbedding(model_name=model_name)
+        # CRITICAL: Must specify cache_dir to use HuggingFace cache
+        # and call embed() to trigger actual download
+        embedder = TextEmbedding(model_name=model_name, cache_dir=str(cache_dir))
+        # Trigger actual download by calling embed
+        # TextEmbedding.__init__ alone doesn't download files
+        if progress_callback:
+            progress_callback(f"Initializing {model_name}...")
+        list(embedder.embed(["test"]))  # Trigger download
         if progress_callback:
             progress_callback(f"Model {model_name} downloaded successfully")
-        # Get cache info using correct cache_name
-        cache_dir = get_cache_dir()
+        # Get cache info using correct HuggingFace Hub path
         model_cache_path = _get_model_cache_path(cache_dir, info)
         cache_size = 0

package/codex-lens/src/codexlens/cli/output.py CHANGED Viewed

@@ -35,12 +35,23 @@ def _to_jsonable(value: Any) -> Any:
     return value
-def print_json(*, success: bool, result: Any = None, error: str | None = None) -> None:
+def print_json(*, success: bool, result: Any = None, error: str | None = None, **kwargs: Any) -> None:
+    """Print JSON output with optional additional fields.
+    Args:
+        success: Whether the operation succeeded
+        result: Result data (used when success=True)
+        error: Error message (used when success=False)
+        **kwargs: Additional fields to include in the payload (e.g., code, details)
+    """
     payload: dict[str, Any] = {"success": success}
     if success:
         payload["result"] = _to_jsonable(result)
     else:
         payload["error"] = error or "Unknown error"
+        # Include additional error details if provided
+        for key, value in kwargs.items():
+            payload[key] = _to_jsonable(value)
     console.print_json(json.dumps(payload, ensure_ascii=False))

package/codex-lens/src/codexlens/config.py CHANGED Viewed

@@ -2,6 +2,7 @@
 from __future__ import annotations
+import json
 import os
 from dataclasses import dataclass, field
 from functools import cached_property
@@ -14,6 +15,9 @@ from .errors import ConfigError
 # Workspace-local directory name
 WORKSPACE_DIR_NAME = ".codexlens"
+# Settings file name
+SETTINGS_FILE_NAME = "settings.json"
 def _default_global_dir() -> Path:
     """Get global CodexLens data directory."""
@@ -89,6 +93,19 @@ class Config:
     # Hybrid chunker configuration
     hybrid_max_chunk_size: int = 2000  # Max characters per chunk before LLM refinement
     hybrid_llm_refinement: bool = False  # Enable LLM-based semantic boundary refinement
+    # Embedding configuration
+    embedding_backend: str = "fastembed"  # "fastembed" (local) or "litellm" (API)
+    embedding_model: str = "code"  # For fastembed: profile (fast/code/multilingual/balanced)
+                                   # For litellm: model name from config (e.g., "qwen3-embedding")
+    embedding_use_gpu: bool = True  # For fastembed: whether to use GPU acceleration
+    # Multi-endpoint configuration for litellm backend
+    embedding_endpoints: List[Dict[str, Any]] = field(default_factory=list)
+    # List of endpoint configs: [{"model": "...", "api_key": "...", "api_base": "...", "weight": 1.0}]
+    embedding_strategy: str = "latency_aware"  # round_robin, latency_aware, weighted_random
+    embedding_cooldown: float = 60.0  # Default cooldown seconds for rate-limited endpoints
     def __post_init__(self) -> None:
         try:
             self.data_dir = self.data_dir.expanduser().resolve()
@@ -133,6 +150,82 @@ class Config:
         """Get parsing rules for a specific language, falling back to defaults."""
         return {**self.parsing_rules.get("default", {}), **self.parsing_rules.get(language_id, {})}
+    @cached_property
+    def settings_path(self) -> Path:
+        """Path to the settings file."""
+        return self.data_dir / SETTINGS_FILE_NAME
+    def save_settings(self) -> None:
+        """Save embedding and other settings to file."""
+        embedding_config = {
+            "backend": self.embedding_backend,
+            "model": self.embedding_model,
+            "use_gpu": self.embedding_use_gpu,
+        }
+        # Include multi-endpoint config if present
+        if self.embedding_endpoints:
+            embedding_config["endpoints"] = self.embedding_endpoints
+            embedding_config["strategy"] = self.embedding_strategy
+            embedding_config["cooldown"] = self.embedding_cooldown
+        settings = {
+            "embedding": embedding_config,
+            "llm": {
+                "enabled": self.llm_enabled,
+                "tool": self.llm_tool,
+                "timeout_ms": self.llm_timeout_ms,
+                "batch_size": self.llm_batch_size,
+            },
+        }
+        with open(self.settings_path, "w", encoding="utf-8") as f:
+            json.dump(settings, f, indent=2)
+    def load_settings(self) -> None:
+        """Load settings from file if exists."""
+        if not self.settings_path.exists():
+            return
+        try:
+            with open(self.settings_path, "r", encoding="utf-8") as f:
+                settings = json.load(f)
+            # Load embedding settings
+            embedding = settings.get("embedding", {})
+            if "backend" in embedding:
+                self.embedding_backend = embedding["backend"]
+            if "model" in embedding:
+                self.embedding_model = embedding["model"]
+            if "use_gpu" in embedding:
+                self.embedding_use_gpu = embedding["use_gpu"]
+            # Load multi-endpoint configuration
+            if "endpoints" in embedding:
+                self.embedding_endpoints = embedding["endpoints"]
+            if "strategy" in embedding:
+                self.embedding_strategy = embedding["strategy"]
+            if "cooldown" in embedding:
+                self.embedding_cooldown = embedding["cooldown"]
+            # Load LLM settings
+            llm = settings.get("llm", {})
+            if "enabled" in llm:
+                self.llm_enabled = llm["enabled"]
+            if "tool" in llm:
+                self.llm_tool = llm["tool"]
+            if "timeout_ms" in llm:
+                self.llm_timeout_ms = llm["timeout_ms"]
+            if "batch_size" in llm:
+                self.llm_batch_size = llm["batch_size"]
+        except Exception:
+            pass  # Silently ignore errors
+    @classmethod
+    def load(cls) -> "Config":
+        """Load config with settings from file."""
+        config = cls()
+        config.load_settings()
+        return config
 @dataclass
 class WorkspaceConfig:

package/codex-lens/src/codexlens/search/__pycache__/chain_search.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/search/__pycache__/hybrid_search.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/search/__pycache__/ranking.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/search/chain_search.py CHANGED Viewed

@@ -494,9 +494,13 @@ class ChainSearchEngine:
                     else:
                         # Use fuzzy FTS if enable_fuzzy=True (mode="fuzzy"), otherwise exact FTS
                         if enable_fuzzy:
-                            fts_results = store.search_fts_fuzzy(query, limit=limit)
+                            fts_results = store.search_fts_fuzzy(
+                                query, limit=limit, return_full_content=True
+                            )
                         else:
-                            fts_results = store.search_fts(query, limit=limit)
+                            fts_results = store.search_fts_exact(
+                                query, limit=limit, return_full_content=True
+                            )
                     # Optionally add semantic keyword results
                     if include_semantic:

package/codex-lens/src/codexlens/search/hybrid_search.py CHANGED Viewed

@@ -27,11 +27,11 @@ class HybridSearchEngine:
         default_weights: Default RRF weights for each source
     """
-    # Default RRF weights (exact: 40%, fuzzy: 30%, vector: 30%)
+    # Default RRF weights (vector: 60%, exact: 30%, fuzzy: 10%)
     DEFAULT_WEIGHTS = {
-        "exact": 0.4,
-        "fuzzy": 0.3,
-        "vector": 0.3,
+        "exact": 0.3,
+        "fuzzy": 0.1,
+        "vector": 0.6,
     }
     def __init__(self, weights: Optional[Dict[str, float]] = None):
@@ -200,7 +200,9 @@ class HybridSearchEngine:
         """
         try:
             with DirIndexStore(index_path) as store:
-                return store.search_fts_exact(query, limit=limit)
+                return store.search_fts_exact(
+                    query, limit=limit, return_full_content=True
+                )
         except Exception as exc:
             self.logger.debug("Exact search error: %s", exc)
             return []
@@ -220,7 +222,9 @@ class HybridSearchEngine:
         """
         try:
             with DirIndexStore(index_path) as store:
-                return store.search_fts_fuzzy(query, limit=limit)
+                return store.search_fts_fuzzy(
+                    query, limit=limit, return_full_content=True
+                )
         except Exception as exc:
             self.logger.debug("Fuzzy search error: %s", exc)
             return []
@@ -260,7 +264,7 @@ class HybridSearchEngine:
                 return []
             # Initialize embedder and vector store
-            from codexlens.semantic.embedder import get_embedder
+            from codexlens.semantic.factory import get_embedder
             from codexlens.semantic.vector_store import VectorStore
             vector_store = VectorStore(index_path)
@@ -277,32 +281,51 @@ class HybridSearchEngine:
             # Get stored model configuration (preferred) or auto-detect from dimension
             model_config = vector_store.get_model_config()
             if model_config:
-                profile = model_config["model_profile"]
+                backend = model_config.get("backend", "fastembed")
+                model_name = model_config["model_name"]
+                model_profile = model_config["model_profile"]
                 self.logger.debug(
-                    "Using stored model config: %s (%s, %dd)",
-                    profile, model_config["model_name"], model_config["embedding_dim"]
+                    "Using stored model config: %s backend, %s (%s, %dd)",
+                    backend, model_profile, model_name, model_config["embedding_dim"]
                 )
+                # Get embedder based on backend
+                if backend == "litellm":
+                    embedder = get_embedder(backend="litellm", model=model_name)
+                else:
+                    embedder = get_embedder(backend="fastembed", profile=model_profile)
             else:
                 # Fallback: auto-detect from embedding dimension
                 detected_dim = vector_store.dimension
                 if detected_dim is None:
                     self.logger.info("Vector store dimension unknown, using default profile")
-                    profile = "code"  # Default fallback
+                    embedder = get_embedder(backend="fastembed", profile="code")
                 elif detected_dim == 384:
-                    profile = "fast"
+                    embedder = get_embedder(backend="fastembed", profile="fast")
                 elif detected_dim == 768:
-                    profile = "code"
+                    embedder = get_embedder(backend="fastembed", profile="code")
                 elif detected_dim == 1024:
-                    profile = "multilingual"  # or balanced, both are 1024
+                    embedder = get_embedder(backend="fastembed", profile="multilingual")
+                elif detected_dim == 1536:
+                    # Likely OpenAI text-embedding-3-small or ada-002
+                    self.logger.info(
+                        "Detected 1536-dim embeddings (likely OpenAI), using litellm backend with text-embedding-3-small"
+                    )
+                    embedder = get_embedder(backend="litellm", model="text-embedding-3-small")
+                elif detected_dim == 3072:
+                    # Likely OpenAI text-embedding-3-large
+                    self.logger.info(
+                        "Detected 3072-dim embeddings (likely OpenAI), using litellm backend with text-embedding-3-large"
+                    )
+                    embedder = get_embedder(backend="litellm", model="text-embedding-3-large")
                 else:
-                    profile = "code"  # Default fallback
-                self.logger.debug(
-                    "No stored model config, auto-detected profile '%s' from dimension %s",
-                    profile, detected_dim
-                )
+                    self.logger.debug(
+                        "Unknown dimension %s, using default fastembed profile 'code'",
+                        detected_dim
+                    )
+                    embedder = get_embedder(backend="fastembed", profile="code")
-            # Use cached embedder (singleton) for performance
-            embedder = get_embedder(profile=profile)
             # Generate query embedding
             query_embedding = embedder.embed_single(query)

package/codex-lens/src/codexlens/search/ranking.py CHANGED Viewed

@@ -25,7 +25,7 @@ def reciprocal_rank_fusion(
         results_map: Dictionary mapping source name to list of SearchResult objects
                      Sources: 'exact', 'fuzzy', 'vector'
         weights: Dictionary mapping source name to weight (default: equal weights)
-                 Example: {'exact': 0.4, 'fuzzy': 0.3, 'vector': 0.3}
+                 Example: {'exact': 0.3, 'fuzzy': 0.1, 'vector': 0.6}
         k: Constant to avoid division by zero and control rank influence (default 60)
     Returns:

package/codex-lens/src/codexlens/semantic/__init__.py CHANGED Viewed

@@ -14,6 +14,7 @@ from __future__ import annotations
 SEMANTIC_AVAILABLE = False
 SEMANTIC_BACKEND: str | None = None
 GPU_AVAILABLE = False
+LITELLM_AVAILABLE = False
 _import_error: str | None = None
@@ -67,10 +68,51 @@ def check_gpu_available() -> tuple[bool, str]:
         return False, "GPU support module not available"
+# Export embedder components
+# BaseEmbedder is always available (abstract base class)
+from .base import BaseEmbedder
+# Factory function for creating embedders
+from .factory import get_embedder as get_embedder_factory
+# Optional: LiteLLMEmbedderWrapper (only if ccw-litellm is installed)
+try:
+    import ccw_litellm  # noqa: F401
+    from .litellm_embedder import LiteLLMEmbedderWrapper
+    LITELLM_AVAILABLE = True
+except ImportError:
+    LiteLLMEmbedderWrapper = None
+    LITELLM_AVAILABLE = False
+def is_embedding_backend_available(backend: str) -> tuple[bool, str | None]:
+    """Check whether a specific embedding backend can be used.
+    Notes:
+    - "fastembed" requires the optional semantic deps (pip install codexlens[semantic]).
+    - "litellm" requires ccw-litellm to be installed in the same environment.
+    """
+    backend = (backend or "").strip().lower()
+    if backend == "fastembed":
+        if SEMANTIC_AVAILABLE:
+            return True, None
+        return False, _import_error or "fastembed not available. Install with: pip install codexlens[semantic]"
+    if backend == "litellm":
+        if LITELLM_AVAILABLE:
+            return True, None
+        return False, "ccw-litellm not available. Install with: pip install ccw-litellm"
+    return False, f"Invalid embedding backend: {backend}. Must be 'fastembed' or 'litellm'."
 __all__ = [
     "SEMANTIC_AVAILABLE",
     "SEMANTIC_BACKEND",
     "GPU_AVAILABLE",
+    "LITELLM_AVAILABLE",
     "check_semantic_available",
+    "is_embedding_backend_available",
     "check_gpu_available",
+    "BaseEmbedder",
+    "get_embedder_factory",
+    "LiteLLMEmbedderWrapper",
 ]

package/codex-lens/src/codexlens/semantic/__pycache__/__init__.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/__pycache__/base.cpython-313.pyc ADDED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/__pycache__/chunker.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/__pycache__/embedder.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/__pycache__/factory.cpython-313.pyc ADDED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/__pycache__/gpu_support.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/__pycache__/litellm_embedder.cpython-313.pyc ADDED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/__pycache__/vector_store.cpython-313.pyc CHANGED Viewed

Binary file

package/codex-lens/src/codexlens/semantic/base.py ADDED Viewed

@@ -0,0 +1,61 @@
+"""Base class for embedders.
+Defines the interface that all embedders must implement.
+"""
+from __future__ import annotations
+from abc import ABC, abstractmethod
+from typing import Iterable
+import numpy as np
+class BaseEmbedder(ABC):
+    """Base class for all embedders.
+    All embedder implementations must inherit from this class and implement
+    the abstract methods to ensure a consistent interface.
+    """
+    @property
+    @abstractmethod
+    def embedding_dim(self) -> int:
+        """Return embedding dimensions.
+        Returns:
+            int: Dimension of the embedding vectors.
+        """
+        ...
+    @property
+    @abstractmethod
+    def model_name(self) -> str:
+        """Return model name.
+        Returns:
+            str: Name or identifier of the underlying model.
+        """
+        ...
+    @property
+    def max_tokens(self) -> int:
+        """Return maximum token limit for embeddings.
+        Returns:
+            int: Maximum number of tokens that can be embedded at once.
+                Default is 8192 if not overridden by implementation.
+        """
+        return 8192
+    @abstractmethod
+    def embed_to_numpy(self, texts: str | Iterable[str]) -> np.ndarray:
+        """Embed texts to numpy array.
+        Args:
+            texts: Single text or iterable of texts to embed.
+        Returns:
+            numpy.ndarray: Array of shape (n_texts, embedding_dim) containing embeddings.
+        """
+        ...

package/codex-lens/src/codexlens/semantic/chunker.py CHANGED Viewed

@@ -39,7 +39,7 @@ from codexlens.parsers.tokenizer import get_default_tokenizer
 class ChunkConfig:
     """Configuration for chunking strategies."""
     max_chunk_size: int = 1000  # Max characters per chunk
-    overlap: int = 100  # Overlap for sliding window
+    overlap: int = 200  # Overlap for sliding window (increased from 100 for better context)
     strategy: str = "auto"  # Chunking strategy: auto, symbol, sliding_window, hybrid
     min_chunk_size: int = 50  # Minimum chunk size
     skip_token_count: bool = False  # Skip expensive token counting (use char/4 estimate)
@@ -80,6 +80,7 @@ class Chunker:
         """Chunk code by extracted symbols (functions, classes).
         Each symbol becomes one chunk with its full content.
+        Large symbols exceeding max_chunk_size are recursively split using sliding window.
         Args:
             content: Source code content
@@ -101,27 +102,49 @@ class Chunker:
             if len(chunk_content.strip()) < self.config.min_chunk_size:
                 continue
-            # Calculate token count if not provided
-            token_count = None
-            if symbol_token_counts and symbol.name in symbol_token_counts:
-                token_count = symbol_token_counts[symbol.name]
+            # Check if symbol content exceeds max_chunk_size
+            if len(chunk_content) > self.config.max_chunk_size:
+                # Create line mapping for correct line number tracking
+                line_mapping = list(range(start_line, end_line + 1))
+                # Use sliding window to split large symbol
+                sub_chunks = self.chunk_sliding_window(
+                    chunk_content,
+                    file_path=file_path,
+                    language=language,
+                    line_mapping=line_mapping
+                )
+                # Update sub_chunks with parent symbol metadata
+                for sub_chunk in sub_chunks:
+                    sub_chunk.metadata["symbol_name"] = symbol.name
+                    sub_chunk.metadata["symbol_kind"] = symbol.kind
+                    sub_chunk.metadata["strategy"] = "symbol_split"
+                    sub_chunk.metadata["parent_symbol_range"] = (start_line, end_line)
+                chunks.extend(sub_chunks)
             else:
-                token_count = self._estimate_token_count(chunk_content)
+                # Calculate token count if not provided
+                token_count = None
+                if symbol_token_counts and symbol.name in symbol_token_counts:
+                    token_count = symbol_token_counts[symbol.name]
+                else:
+                    token_count = self._estimate_token_count(chunk_content)
-            chunks.append(SemanticChunk(
-                content=chunk_content,
-                embedding=None,
-                metadata={
-                    "file": str(file_path),
-                    "language": language,
-                    "symbol_name": symbol.name,
-                    "symbol_kind": symbol.kind,
-                    "start_line": start_line,
-                    "end_line": end_line,
-                    "strategy": "symbol",
-                    "token_count": token_count,
-                }
-            ))
+                chunks.append(SemanticChunk(
+                    content=chunk_content,
+                    embedding=None,
+                    metadata={
+                        "file": str(file_path),
+                        "language": language,
+                        "symbol_name": symbol.name,
+                        "symbol_kind": symbol.kind,
+                        "start_line": start_line,
+                        "end_line": end_line,
+                        "strategy": "symbol",
+                        "token_count": token_count,
+                    }
+                ))
         return chunks