npm - claude-code-workflow - Versions diffs - 6.2.9 → 6.3.0 - Mend

claude-code-workflow 6.2.9 → 6.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (202) hide show

package/.claude/CLAUDE.md +16 -1
package/.claude/workflows/cli-templates/protocols/analysis-protocol.md +11 -4
package/.claude/workflows/cli-templates/protocols/write-protocol.md +10 -75
package/.claude/workflows/cli-tools-usage.md +14 -24
package/.codex/AGENTS.md +51 -1
package/.codex/prompts/compact.md +378 -0
package/.gemini/GEMINI.md +57 -20
package/ccw/dist/cli.d.ts.map +1 -1
package/ccw/dist/cli.js +3 -1
package/ccw/dist/cli.js.map +1 -1
package/ccw/dist/commands/cli.d.ts +2 -0
package/ccw/dist/commands/cli.d.ts.map +1 -1
package/ccw/dist/commands/cli.js +129 -8
package/ccw/dist/commands/cli.js.map +1 -1
package/ccw/dist/commands/hook.d.ts.map +1 -1
package/ccw/dist/commands/hook.js +3 -2
package/ccw/dist/commands/hook.js.map +1 -1
package/ccw/dist/config/litellm-api-config-manager.d.ts +180 -0
package/ccw/dist/config/litellm-api-config-manager.d.ts.map +1 -0
package/ccw/dist/config/litellm-api-config-manager.js +770 -0
package/ccw/dist/config/litellm-api-config-manager.js.map +1 -0
package/ccw/dist/config/provider-models.d.ts +73 -0
package/ccw/dist/config/provider-models.d.ts.map +1 -0
package/ccw/dist/config/provider-models.js +172 -0
package/ccw/dist/config/provider-models.js.map +1 -0
package/ccw/dist/core/cache-manager.d.ts.map +1 -1
package/ccw/dist/core/cache-manager.js +3 -5
package/ccw/dist/core/cache-manager.js.map +1 -1
package/ccw/dist/core/dashboard-generator.d.ts.map +1 -1
package/ccw/dist/core/dashboard-generator.js +3 -1
package/ccw/dist/core/dashboard-generator.js.map +1 -1
package/ccw/dist/core/routes/cli-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/cli-routes.js +169 -0
package/ccw/dist/core/routes/cli-routes.js.map +1 -1
package/ccw/dist/core/routes/codexlens-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/codexlens-routes.js +234 -18
package/ccw/dist/core/routes/codexlens-routes.js.map +1 -1
package/ccw/dist/core/routes/hooks-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/hooks-routes.js +30 -32
package/ccw/dist/core/routes/hooks-routes.js.map +1 -1
package/ccw/dist/core/routes/litellm-api-routes.d.ts +21 -0
package/ccw/dist/core/routes/litellm-api-routes.d.ts.map +1 -0
package/ccw/dist/core/routes/litellm-api-routes.js +780 -0
package/ccw/dist/core/routes/litellm-api-routes.js.map +1 -0
package/ccw/dist/core/routes/litellm-routes.d.ts +20 -0
package/ccw/dist/core/routes/litellm-routes.d.ts.map +1 -0
package/ccw/dist/core/routes/litellm-routes.js +85 -0
package/ccw/dist/core/routes/litellm-routes.js.map +1 -0
package/ccw/dist/core/routes/mcp-routes.js +2 -2
package/ccw/dist/core/routes/mcp-routes.js.map +1 -1
package/ccw/dist/core/routes/status-routes.d.ts.map +1 -1
package/ccw/dist/core/routes/status-routes.js +39 -0
package/ccw/dist/core/routes/status-routes.js.map +1 -1
package/ccw/dist/core/server.d.ts.map +1 -1
package/ccw/dist/core/server.js +15 -1
package/ccw/dist/core/server.js.map +1 -1
package/ccw/dist/mcp-server/index.js +1 -1
package/ccw/dist/mcp-server/index.js.map +1 -1
package/ccw/dist/tools/claude-cli-tools.d.ts +82 -0
package/ccw/dist/tools/claude-cli-tools.d.ts.map +1 -0
package/ccw/dist/tools/claude-cli-tools.js +216 -0
package/ccw/dist/tools/claude-cli-tools.js.map +1 -0
package/ccw/dist/tools/cli-executor.d.ts.map +1 -1
package/ccw/dist/tools/cli-executor.js +76 -14
package/ccw/dist/tools/cli-executor.js.map +1 -1
package/ccw/dist/tools/codex-lens.d.ts +9 -2
package/ccw/dist/tools/codex-lens.d.ts.map +1 -1
package/ccw/dist/tools/codex-lens.js +114 -9
package/ccw/dist/tools/codex-lens.js.map +1 -1
package/ccw/dist/tools/context-cache-store.d.ts +136 -0
package/ccw/dist/tools/context-cache-store.d.ts.map +1 -0
package/ccw/dist/tools/context-cache-store.js +256 -0
package/ccw/dist/tools/context-cache-store.js.map +1 -0
package/ccw/dist/tools/context-cache.d.ts +56 -0
package/ccw/dist/tools/context-cache.d.ts.map +1 -0
package/ccw/dist/tools/context-cache.js +294 -0
package/ccw/dist/tools/context-cache.js.map +1 -0
package/ccw/dist/tools/core-memory.d.ts.map +1 -1
package/ccw/dist/tools/core-memory.js +33 -19
package/ccw/dist/tools/core-memory.js.map +1 -1
package/ccw/dist/tools/index.d.ts.map +1 -1
package/ccw/dist/tools/index.js +2 -0
package/ccw/dist/tools/index.js.map +1 -1
package/ccw/dist/tools/litellm-client.d.ts +85 -0
package/ccw/dist/tools/litellm-client.d.ts.map +1 -0
package/ccw/dist/tools/litellm-client.js +188 -0
package/ccw/dist/tools/litellm-client.js.map +1 -0
package/ccw/dist/tools/litellm-executor.d.ts +34 -0
package/ccw/dist/tools/litellm-executor.d.ts.map +1 -0
package/ccw/dist/tools/litellm-executor.js +192 -0
package/ccw/dist/tools/litellm-executor.js.map +1 -0
package/ccw/dist/tools/pattern-parser.d.ts +55 -0
package/ccw/dist/tools/pattern-parser.d.ts.map +1 -0
package/ccw/dist/tools/pattern-parser.js +237 -0
package/ccw/dist/tools/pattern-parser.js.map +1 -0
package/ccw/dist/tools/smart-search.d.ts +1 -0
package/ccw/dist/tools/smart-search.d.ts.map +1 -1
package/ccw/dist/tools/smart-search.js +117 -41
package/ccw/dist/tools/smart-search.js.map +1 -1
package/ccw/dist/types/litellm-api-config.d.ts +294 -0
package/ccw/dist/types/litellm-api-config.d.ts.map +1 -0
package/ccw/dist/types/litellm-api-config.js +8 -0
package/ccw/dist/types/litellm-api-config.js.map +1 -0
package/ccw/src/cli.ts +3 -1
package/ccw/src/commands/cli.ts +153 -9
package/ccw/src/commands/hook.ts +3 -2
package/ccw/src/config/.litellm-api-config-manager.ts.2025-12-23T11-57-43-727Z.bak +441 -0
package/ccw/src/config/litellm-api-config-manager.ts +1012 -0
package/ccw/src/config/provider-models.ts +222 -0
package/ccw/src/core/cache-manager.ts +292 -294
package/ccw/src/core/dashboard-generator.ts +3 -1
package/ccw/src/core/routes/cli-routes.ts +192 -0
package/ccw/src/core/routes/codexlens-routes.ts +241 -19
package/ccw/src/core/routes/hooks-routes.ts +399 -405
package/ccw/src/core/routes/litellm-api-routes.ts +930 -0
package/ccw/src/core/routes/litellm-routes.ts +107 -0
package/ccw/src/core/routes/mcp-routes.ts +1271 -1271
package/ccw/src/core/routes/status-routes.ts +51 -0
package/ccw/src/core/server.ts +15 -1
package/ccw/src/mcp-server/index.ts +1 -1
package/ccw/src/templates/dashboard-css/12-cli-legacy.css +44 -0
package/ccw/src/templates/dashboard-css/31-api-settings.css +2265 -0
package/ccw/src/templates/dashboard-js/components/cli-history.js +15 -8
package/ccw/src/templates/dashboard-js/components/cli-status.js +323 -9
package/ccw/src/templates/dashboard-js/components/navigation.js +329 -313
package/ccw/src/templates/dashboard-js/i18n.js +583 -1
package/ccw/src/templates/dashboard-js/views/api-settings.js +3362 -0
package/ccw/src/templates/dashboard-js/views/cli-manager.js +199 -24
package/ccw/src/templates/dashboard-js/views/codexlens-manager.js +1265 -27
package/ccw/src/templates/dashboard.html +840 -831
package/ccw/src/tools/claude-cli-tools.ts +300 -0
package/ccw/src/tools/cli-executor.ts +83 -14
package/ccw/src/tools/codex-lens.ts +146 -9
package/ccw/src/tools/context-cache-store.ts +368 -0
package/ccw/src/tools/context-cache.ts +393 -0
package/ccw/src/tools/core-memory.ts +33 -19
package/ccw/src/tools/index.ts +2 -0
package/ccw/src/tools/litellm-client.ts +246 -0
package/ccw/src/tools/litellm-executor.ts +241 -0
package/ccw/src/tools/pattern-parser.ts +329 -0
package/ccw/src/tools/smart-search.ts +142 -41
package/ccw/src/types/litellm-api-config.ts +402 -0
package/ccw-litellm/README.md +180 -0
package/ccw-litellm/pyproject.toml +35 -0
package/ccw-litellm/src/ccw_litellm/__init__.py +47 -0
package/ccw-litellm/src/ccw_litellm/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/__pycache__/cli.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/cli.py +108 -0
package/ccw-litellm/src/ccw_litellm/clients/__init__.py +12 -0
package/ccw-litellm/src/ccw_litellm/clients/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/clients/__pycache__/litellm_embedder.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/clients/__pycache__/litellm_llm.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/clients/litellm_embedder.py +251 -0
package/ccw-litellm/src/ccw_litellm/clients/litellm_llm.py +165 -0
package/ccw-litellm/src/ccw_litellm/config/__init__.py +22 -0
package/ccw-litellm/src/ccw_litellm/config/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/config/__pycache__/loader.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/config/__pycache__/models.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/config/loader.py +316 -0
package/ccw-litellm/src/ccw_litellm/config/models.py +130 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__init__.py +14 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__pycache__/__init__.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__pycache__/embedder.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/interfaces/__pycache__/llm.cpython-313.pyc +0 -0
package/ccw-litellm/src/ccw_litellm/interfaces/embedder.py +52 -0
package/ccw-litellm/src/ccw_litellm/interfaces/llm.py +45 -0
package/codex-lens/src/codexlens/__pycache__/config.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/commands.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/embedding_manager.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/model_manager.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/__pycache__/output.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/cli/commands.py +360 -22
package/codex-lens/src/codexlens/cli/embedding_manager.py +660 -56
package/codex-lens/src/codexlens/cli/model_manager.py +31 -18
package/codex-lens/src/codexlens/cli/output.py +12 -1
package/codex-lens/src/codexlens/config.py +93 -0
package/codex-lens/src/codexlens/search/__pycache__/chain_search.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/search/__pycache__/hybrid_search.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/search/__pycache__/ranking.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/search/chain_search.py +6 -2
package/codex-lens/src/codexlens/search/hybrid_search.py +44 -21
package/codex-lens/src/codexlens/search/ranking.py +1 -1
package/codex-lens/src/codexlens/semantic/__init__.py +42 -0
package/codex-lens/src/codexlens/semantic/__pycache__/__init__.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/base.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/chunker.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/embedder.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/factory.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/gpu_support.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/litellm_embedder.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/__pycache__/vector_store.cpython-313.pyc +0 -0
package/codex-lens/src/codexlens/semantic/base.py +61 -0
package/codex-lens/src/codexlens/semantic/chunker.py +43 -20
package/codex-lens/src/codexlens/semantic/embedder.py +60 -13
package/codex-lens/src/codexlens/semantic/factory.py +98 -0
package/codex-lens/src/codexlens/semantic/gpu_support.py +225 -3
package/codex-lens/src/codexlens/semantic/litellm_embedder.py +144 -0
package/codex-lens/src/codexlens/semantic/rotational_embedder.py +434 -0
package/codex-lens/src/codexlens/semantic/vector_store.py +33 -8
package/codex-lens/src/codexlens/storage/migrations/__pycache__/migration_004_dual_fts.cpython-313.pyc +0 -0
package/package.json +3 -1
package/.codex/prompts.zip +0 -0

package/codex-lens/src/codexlens/cli/commands.py CHANGED Viewed

@@ -103,10 +103,12 @@ def init(
         "-l",
         help="Limit indexing to specific languages (repeat or comma-separated).",
     ),
-    workers: Optional[int] = typer.Option(None, "--workers", "-w", min=1, max=16, help="Parallel worker processes (default: auto-detect based on CPU count, max 16)."),
+    workers: Optional[int] = typer.Option(None, "--workers", "-w", min=1, help="Parallel worker processes (default: auto-detect based on CPU count)."),
     force: bool = typer.Option(False, "--force", "-f", help="Force full reindex (skip incremental mode)."),
     no_embeddings: bool = typer.Option(False, "--no-embeddings", help="Skip automatic embedding generation (if semantic deps installed)."),
-    embedding_model: str = typer.Option("code", "--embedding-model", help="Embedding model profile: fast, code, multilingual, balanced."),
+    embedding_backend: str = typer.Option("fastembed", "--embedding-backend", help="Embedding backend: fastembed (local) or litellm (remote API)."),
+    embedding_model: str = typer.Option("code", "--embedding-model", help="Embedding model: profile name for fastembed (fast/code/multilingual/balanced) or model name for litellm (e.g. text-embedding-3-small)."),
+    max_workers: int = typer.Option(1, "--max-workers", min=1, help="Max concurrent API calls for embedding generation. Recommended: 4-8 for litellm backend."),
     json_mode: bool = typer.Option(False, "--json", help="Output JSON response."),
     verbose: bool = typer.Option(False, "--verbose", "-v", help="Enable debug logging."),
 ) -> None:
@@ -120,6 +122,14 @@ def init(
     If semantic search dependencies are installed, automatically generates embeddings
     after indexing completes. Use --no-embeddings to skip this step.
+    Embedding Backend Options:
+      - fastembed: Local ONNX-based embeddings (default, no API calls)
+      - litellm: Remote API embeddings via ccw-litellm (requires API keys)
+    Embedding Model Options:
+      - For fastembed backend: Use profile names (fast, code, multilingual, balanced)
+      - For litellm backend: Use model names (e.g., text-embedding-3-small, text-embedding-ada-002)
     """
     _configure_logging(verbose, json_mode)
     config = Config()
@@ -156,26 +166,37 @@ def init(
             "errors": len(build_result.errors),
         }
-        if json_mode:
-            print_json(success=True, result=result)
-        else:
+        if not json_mode:
             console.print(f"[green]OK[/green] Indexed [bold]{build_result.total_files}[/bold] files in [bold]{build_result.total_dirs}[/bold] directories")
             console.print(f"  Index root: {build_result.index_root}")
             if build_result.errors:
                 console.print(f"  [yellow]Warnings:[/yellow] {len(build_result.errors)} errors")
-        # Auto-generate embeddings if semantic search is available
+        # Auto-generate embeddings if the requested backend is available
         if not no_embeddings:
             try:
-                from codexlens.semantic import SEMANTIC_AVAILABLE
+                from codexlens.semantic import is_embedding_backend_available
                 from codexlens.cli.embedding_manager import generate_embeddings_recursive, get_embeddings_status
-                if SEMANTIC_AVAILABLE:
+                # Validate embedding backend
+                valid_backends = ["fastembed", "litellm"]
+                if embedding_backend not in valid_backends:
+                    error_msg = f"Invalid embedding backend: {embedding_backend}. Must be one of: {', '.join(valid_backends)}"
+                    if json_mode:
+                        print_json(success=False, error=error_msg)
+                    else:
+                        console.print(f"[red]Error:[/red] {error_msg}")
+                    raise typer.Exit(code=1)
+                backend_available, backend_error = is_embedding_backend_available(embedding_backend)
+                if backend_available:
                     # Use the index root directory (not the _index.db file)
                     index_root = Path(build_result.index_root)
                     if not json_mode:
                         console.print("\n[bold]Generating embeddings...[/bold]")
+                        console.print(f"Backend: [cyan]{embedding_backend}[/cyan]")
                         console.print(f"Model: [cyan]{embedding_model}[/cyan]")
                     else:
                         # Output progress message for JSON mode (parsed by Node.js)
@@ -196,10 +217,12 @@ def init(
                     embed_result = generate_embeddings_recursive(
                         index_root,
+                        embedding_backend=embedding_backend,
                         model_profile=embedding_model,
                         force=False,  # Don't force regenerate during init
                         chunk_size=2000,
                         progress_callback=progress_update,  # Always use callback
+                        max_workers=max_workers,
                     )
                     if embed_result["success"]:
@@ -241,10 +264,10 @@ def init(
                         }
                 else:
                     if not json_mode and verbose:
-                        console.print("[dim]Semantic search not available. Skipping embeddings.[/dim]")
+                        console.print(f"[dim]Embedding backend '{embedding_backend}' not available. Skipping embeddings.[/dim]")
                     result["embeddings"] = {
                         "generated": False,
-                        "error": "Semantic dependencies not installed",
+                        "error": backend_error or "Embedding backend not available",
                     }
             except Exception as e:
                 if not json_mode and verbose:
@@ -259,6 +282,10 @@ def init(
                 "error": "Skipped (--no-embeddings)",
             }
+        # Output final JSON result with embeddings status
+        if json_mode:
+            print_json(success=True, result=result)
     except StorageError as exc:
         if json_mode:
             print_json(success=False, error=f"Storage error: {exc}")
@@ -324,7 +351,7 @@ def search(
       Use 'codexlens embeddings-generate' to create embeddings first.
     Hybrid Mode:
-      Default weights: exact=0.4, fuzzy=0.3, vector=0.3
+      Default weights: exact=0.3, fuzzy=0.1, vector=0.6
       Use --weights to customize (e.g., --weights 0.5,0.3,0.2)
     Examples:
@@ -451,6 +478,7 @@ def search(
                     "path": r.path,
                     "score": r.score,
                     "excerpt": r.excerpt,
+                    "content": r.content,  # Full function/class body
                     "source": getattr(r, "search_source", None),
                     "symbol": getattr(r, "symbol", None),
                 }
@@ -732,6 +760,16 @@ def status(
                 console.print(f"  Coverage: {embeddings_info['coverage_percent']:.1f}%")
                 console.print(f"  Total Chunks: {embeddings_info['total_chunks']}")
+                # Display model information if available
+                model_info = embeddings_info.get('model_info')
+                if model_info:
+                    console.print("\n[bold]Embedding Model:[/bold]")
+                    console.print(f"  Backend: [cyan]{model_info.get('backend', 'unknown')}[/cyan]")
+                    console.print(f"  Model: [cyan]{model_info.get('model_profile', 'unknown')}[/cyan] ({model_info.get('model_name', '')})")
+                    console.print(f"  Dimensions: {model_info.get('embedding_dim', 'unknown')}")
+                    if model_info.get('updated_at'):
+                        console.print(f"  Last Updated: {model_info['updated_at']}")
     except StorageError as exc:
         if json_mode:
             print_json(success=False, error=f"Storage error: {exc}")
@@ -1781,11 +1819,17 @@ def embeddings_generate(
         exists=True,
         help="Path to _index.db file or project directory.",
     ),
+    backend: str = typer.Option(
+        "fastembed",
+        "--backend",
+        "-b",
+        help="Embedding backend: fastembed (local) or litellm (remote API).",
+    ),
     model: str = typer.Option(
         "code",
         "--model",
         "-m",
-        help="Model profile: fast, code, multilingual, balanced.",
+        help="Model: profile name for fastembed (fast/code/multilingual/balanced) or model name for litellm (e.g. text-embedding-3-small).",
     ),
     force: bool = typer.Option(
         False,
@@ -1804,6 +1848,13 @@ def embeddings_generate(
         "-r",
         help="Recursively process all _index.db files in directory tree.",
     ),
+    max_workers: int = typer.Option(
+        1,
+        "--max-workers",
+        "-w",
+        min=1,
+        help="Max concurrent API calls. Recommended: 4-8 for litellm backend. Default: 1 (sequential).",
+    ),
     json_mode: bool = typer.Option(False, "--json", help="Output JSON response."),
     verbose: bool = typer.Option(False, "--verbose", "-v", help="Enable verbose output."),
 ) -> None:
@@ -1813,20 +1864,48 @@ def embeddings_generate(
     semantic search capabilities. Embeddings are stored in the same
     database as the FTS index.
-    Model Profiles:
-      - fast: BAAI/bge-small-en-v1.5 (384 dims, ~80MB)
-      - code: jinaai/jina-embeddings-v2-base-code (768 dims, ~150MB) [recommended]
-      - multilingual: intfloat/multilingual-e5-large (1024 dims, ~1GB)
-      - balanced: mixedbread-ai/mxbai-embed-large-v1 (1024 dims, ~600MB)
+    Embedding Backend Options:
+      - fastembed: Local ONNX-based embeddings (default, no API calls)
+      - litellm: Remote API embeddings via ccw-litellm (requires API keys)
+    Model Options:
+      For fastembed backend (profiles):
+        - fast: BAAI/bge-small-en-v1.5 (384 dims, ~80MB)
+        - code: jinaai/jina-embeddings-v2-base-code (768 dims, ~150MB) [recommended]
+        - multilingual: intfloat/multilingual-e5-large (1024 dims, ~1GB)
+        - balanced: mixedbread-ai/mxbai-embed-large-v1 (1024 dims, ~600MB)
+      For litellm backend (model names):
+        - text-embedding-3-small, text-embedding-3-large (OpenAI)
+        - text-embedding-ada-002 (OpenAI legacy)
+        - Any model supported by ccw-litellm
     Examples:
-        codexlens embeddings-generate ~/projects/my-app              # Auto-find index for project
+        codexlens embeddings-generate ~/projects/my-app              # Auto-find index (fastembed, code profile)
         codexlens embeddings-generate ~/.codexlens/indexes/project/_index.db  # Specific index
-        codexlens embeddings-generate ~/projects/my-app --model fast --force  # Regenerate with fast model
+        codexlens embeddings-generate ~/projects/my-app --backend litellm --model text-embedding-3-small  # Use LiteLLM
+        codexlens embeddings-generate ~/projects/my-app --model fast --force  # Regenerate with fast profile
     """
     _configure_logging(verbose, json_mode)
-    from codexlens.cli.embedding_manager import generate_embeddings, generate_embeddings_recursive
+    from codexlens.cli.embedding_manager import (
+        generate_embeddings,
+        generate_embeddings_recursive,
+        scan_for_model_conflicts,
+        check_global_model_lock,
+        set_locked_model_config,
+    )
+    # Validate backend
+    valid_backends = ["fastembed", "litellm"]
+    if backend not in valid_backends:
+        error_msg = f"Invalid backend: {backend}. Must be one of: {', '.join(valid_backends)}"
+        if json_mode:
+            print_json(success=False, error=error_msg)
+        else:
+            console.print(f"[red]Error:[/red] {error_msg}")
+            console.print(f"[dim]Valid backends: {', '.join(valid_backends)}[/dim]")
+        raise typer.Exit(code=1)
     # Resolve path
     target_path = path.expanduser().resolve()
@@ -1877,23 +1956,100 @@ def embeddings_generate(
         console.print(f"Mode: [yellow]Recursive[/yellow]")
     else:
         console.print(f"Index: [dim]{index_path}[/dim]")
-    console.print(f"Model: [cyan]{model}[/cyan]\n")
+    console.print(f"Backend: [cyan]{backend}[/cyan]")
+    console.print(f"Model: [cyan]{model}[/cyan]")
+    if max_workers > 1:
+        console.print(f"Concurrency: [cyan]{max_workers} workers[/cyan]")
+    console.print()
+    # Check global model lock (prevents mixing different models)
+    if not force:
+        lock_result = check_global_model_lock(backend, model)
+        if lock_result["has_conflict"]:
+            locked = lock_result["locked_config"]
+            if json_mode:
+                print_json(
+                    success=False,
+                    error="Global model lock conflict",
+                    code="MODEL_LOCKED",
+                    locked_config=locked,
+                    target_config=lock_result["target_config"],
+                    hint="Use --force to override the lock and switch to a different model (will regenerate all embeddings)",
+                )
+                raise typer.Exit(code=1)
+            else:
+                console.print("[red]⛔ Global Model Lock Active[/red]")
+                console.print(f"  Locked model: [cyan]{locked['backend']}/{locked['model']}[/cyan]")
+                console.print(f"  Requested: [yellow]{backend}/{model}[/yellow]")
+                console.print(f"  Locked at: {locked.get('locked_at', 'unknown')}")
+                console.print()
+                console.print("[dim]All indexes must use the same embedding model.[/dim]")
+                console.print("[dim]Use --force to switch models (will regenerate all embeddings).[/dim]")
+                raise typer.Exit(code=1)
+    # Pre-check for model conflicts (only if not forcing)
+    if not force:
+        # Determine the index root for conflict scanning
+        scan_root = index_root if use_recursive else (index_path.parent if index_path else None)
+        if scan_root:
+            conflict_result = scan_for_model_conflicts(scan_root, backend, model)
+            if conflict_result["has_conflict"]:
+                existing = conflict_result["existing_config"]
+                conflict_count = len(conflict_result["conflicts"])
+                if json_mode:
+                    # JSON mode: return structured error for UI handling
+                    print_json(
+                        success=False,
+                        error="Model conflict detected",
+                        code="MODEL_CONFLICT",
+                        existing_config=existing,
+                        target_config=conflict_result["target_config"],
+                        conflict_count=conflict_count,
+                        conflicts=conflict_result["conflicts"][:5],  # Show first 5 conflicts
+                        hint="Use --force to overwrite existing embeddings with the new model",
+                    )
+                    raise typer.Exit(code=1)
+                else:
+                    # Interactive mode: show warning and ask for confirmation
+                    console.print("[yellow]⚠ Model Conflict Detected[/yellow]")
+                    console.print(f"  Existing: [red]{existing['backend']}/{existing['model']}[/red] ({existing.get('embedding_dim', '?')} dim)")
+                    console.print(f"  Requested: [green]{backend}/{model}[/green]")
+                    console.print(f"  Affected indexes: [yellow]{conflict_count}[/yellow]")
+                    console.print()
+                    console.print("[dim]Mixing different embedding models in the same index is not supported.[/dim]")
+                    console.print("[dim]Overwriting will delete all existing embeddings and regenerate with the new model.[/dim]")
+                    console.print()
+                    # Ask for confirmation
+                    if typer.confirm("Overwrite existing embeddings with the new model?", default=False):
+                        force = True
+                        console.print("[green]Confirmed.[/green] Proceeding with overwrite...\n")
+                    else:
+                        console.print("[yellow]Cancelled.[/yellow] Use --force to skip this prompt.")
+                        raise typer.Exit(code=0)
     if use_recursive:
         result = generate_embeddings_recursive(
             index_root,
+            embedding_backend=backend,
             model_profile=model,
             force=force,
             chunk_size=chunk_size,
             progress_callback=progress_update,
+            max_workers=max_workers,
         )
     else:
         result = generate_embeddings(
             index_path,
+            embedding_backend=backend,
             model_profile=model,
             force=force,
             chunk_size=chunk_size,
             progress_callback=progress_update,
+            max_workers=max_workers,
         )
     if json_mode:
@@ -1906,14 +2062,21 @@ def embeddings_generate(
             # Provide helpful hints
             if "already has" in error_msg:
                 console.print("\n[dim]Use --force to regenerate existing embeddings[/dim]")
-            elif "Semantic search not available" in error_msg:
+            elif "fastembed not available" in error_msg or "Semantic search not available" in error_msg:
                 console.print("\n[dim]Install semantic dependencies:[/dim]")
                 console.print("  [cyan]pip install codexlens[semantic][/cyan]")
+            elif "ccw-litellm not available" in error_msg:
+                console.print("\n[dim]Install LiteLLM backend dependencies:[/dim]")
+                console.print("  [cyan]pip install ccw-litellm[/cyan]")
             raise typer.Exit(code=1)
         data = result["result"]
+        # Set global model lock after successful generation
+        # This prevents using different models for future indexes
+        set_locked_model_config(backend, model)
         if use_recursive:
             # Recursive mode output
             console.print(f"[green]✓[/green] Recursive embeddings generation complete!")
@@ -1955,3 +2118,178 @@ def embeddings_generate(
         console.print("\n[dim]Use vector search with:[/dim]")
         console.print("  [cyan]codexlens search 'your query' --mode pure-vector[/cyan]")
+# ==================== GPU Management Commands ====================
+@app.command(name="gpu-list")
+def gpu_list(
+    json_mode: bool = typer.Option(False, "--json", help="Output JSON response."),
+) -> None:
+    """List available GPU devices for embedding acceleration.
+    Shows all detected GPU devices with their capabilities and selection status.
+    Discrete GPUs (NVIDIA, AMD) are automatically preferred over integrated GPUs.
+    Examples:
+        codexlens gpu-list                    # List all GPUs
+        codexlens gpu-list --json             # JSON output for scripting
+    """
+    from codexlens.semantic.gpu_support import get_gpu_devices, detect_gpu, get_selected_device_id
+    gpu_info = detect_gpu()
+    devices = get_gpu_devices()
+    selected_id = get_selected_device_id()
+    if json_mode:
+        print_json(
+            success=True,
+            result={
+                "devices": devices,
+                "selected_device_id": selected_id,
+                "gpu_available": gpu_info.gpu_available,
+                "providers": gpu_info.onnx_providers,
+            }
+        )
+    else:
+        if not devices:
+            console.print("[yellow]No GPU devices detected[/yellow]")
+            console.print(f"ONNX Providers: [dim]{', '.join(gpu_info.onnx_providers)}[/dim]")
+            return
+        console.print("[bold]Available GPU Devices[/bold]\n")
+        table = Table(show_header=True, header_style="bold")
+        table.add_column("ID", justify="center")
+        table.add_column("Name")
+        table.add_column("Vendor", justify="center")
+        table.add_column("Type", justify="center")
+        table.add_column("Status", justify="center")
+        for dev in devices:
+            type_str = "[green]Discrete[/green]" if dev["is_discrete"] else "[dim]Integrated[/dim]"
+            vendor_color = {
+                "nvidia": "green",
+                "amd": "red",
+                "intel": "blue"
+            }.get(dev["vendor"], "white")
+            vendor_str = f"[{vendor_color}]{dev['vendor'].upper()}[/{vendor_color}]"
+            status_parts = []
+            if dev["is_preferred"]:
+                status_parts.append("[cyan]Auto[/cyan]")
+            if dev["is_selected"]:
+                status_parts.append("[green]✓ Selected[/green]")
+            status_str = " ".join(status_parts) if status_parts else "[dim]—[/dim]"
+            table.add_row(
+                str(dev["device_id"]),
+                dev["name"],
+                vendor_str,
+                type_str,
+                status_str,
+            )
+        console.print(table)
+        console.print(f"\nONNX Providers: [dim]{', '.join(gpu_info.onnx_providers)}[/dim]")
+        console.print("\n[dim]Select GPU with:[/dim]")
+        console.print("  [cyan]codexlens gpu-select <device_id>[/cyan]")
+@app.command(name="gpu-select")
+def gpu_select(
+    device_id: int = typer.Argument(
+        ...,
+        help="GPU device ID to use for embeddings. Use 'codexlens gpu-list' to see available IDs.",
+    ),
+    json_mode: bool = typer.Option(False, "--json", help="Output JSON response."),
+) -> None:
+    """Select a specific GPU device for embedding generation.
+    By default, CodexLens automatically selects the most powerful GPU (discrete over integrated).
+    Use this command to override the selection.
+    Examples:
+        codexlens gpu-select 1                # Use GPU device 1
+        codexlens gpu-select 0 --json         # Select GPU 0 with JSON output
+    """
+    from codexlens.semantic.gpu_support import set_selected_device_id, get_gpu_devices
+    from codexlens.semantic.embedder import clear_embedder_cache
+    devices = get_gpu_devices()
+    valid_ids = [dev["device_id"] for dev in devices]
+    if device_id not in valid_ids:
+        if json_mode:
+            print_json(success=False, error=f"Invalid device_id {device_id}. Valid IDs: {valid_ids}")
+        else:
+            console.print(f"[red]Error:[/red] Invalid device_id {device_id}")
+            console.print(f"Valid IDs: {valid_ids}")
+            console.print("\n[dim]Use 'codexlens gpu-list' to see available devices[/dim]")
+        raise typer.Exit(code=1)
+    success = set_selected_device_id(device_id)
+    if success:
+        # Clear embedder cache to force reload with new GPU
+        clear_embedder_cache()
+        device_name = next((dev["name"] for dev in devices if dev["device_id"] == device_id), "Unknown")
+        if json_mode:
+            print_json(
+                success=True,
+                result={
+                    "device_id": device_id,
+                    "device_name": device_name,
+                    "message": f"GPU selection set to device {device_id}: {device_name}",
+                }
+            )
+        else:
+            console.print(f"[green]✓[/green] GPU selection updated")
+            console.print(f"  Device ID: {device_id}")
+            console.print(f"  Device: [cyan]{device_name}[/cyan]")
+            console.print("\n[dim]New embeddings will use this GPU[/dim]")
+    else:
+        if json_mode:
+            print_json(success=False, error="Failed to set GPU selection")
+        else:
+            console.print("[red]Error:[/red] Failed to set GPU selection")
+        raise typer.Exit(code=1)
+@app.command(name="gpu-reset")
+def gpu_reset(
+    json_mode: bool = typer.Option(False, "--json", help="Output JSON response."),
+) -> None:
+    """Reset GPU selection to automatic detection.
+    Clears any manual GPU selection and returns to automatic selection
+    (discrete GPU preferred over integrated).
+    Examples:
+        codexlens gpu-reset                   # Reset to auto-detection
+    """
+    from codexlens.semantic.gpu_support import set_selected_device_id, detect_gpu
+    from codexlens.semantic.embedder import clear_embedder_cache
+    set_selected_device_id(None)
+    clear_embedder_cache()
+    gpu_info = detect_gpu(force_refresh=True)
+    if json_mode:
+        print_json(
+            success=True,
+            result={
+                "message": "GPU selection reset to auto-detection",
+                "preferred_device_id": gpu_info.preferred_device_id,
+                "preferred_device_name": gpu_info.gpu_name,
+            }
+        )
+    else:
+        console.print("[green]✓[/green] GPU selection reset to auto-detection")
+        if gpu_info.preferred_device_id is not None:
+            console.print(f"  Auto-selected device: {gpu_info.preferred_device_id}")
+            console.print(f"  Device: [cyan]{gpu_info.gpu_name}[/cyan]")