npm - llm-cli-gateway - Versions diffs - 1.0.1 → 1.1.0 - Mend

llm-cli-gateway 1.0.1 → 1.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (29) hide show

package/CHANGELOG.md +21 -0
package/README.md +31 -1
package/dist/approval-manager.js +7 -4
package/dist/async-job-manager.js +18 -11
package/dist/claude-mcp-config.js +7 -4
package/dist/config.js +15 -9
package/dist/db.js +4 -4
package/dist/executor.js +20 -13
package/dist/flight-recorder.d.ts +48 -0
package/dist/flight-recorder.js +220 -0
package/dist/health.js +3 -3
package/dist/index.d.ts +1 -0
package/dist/index.js +812 -259
package/dist/logger.js +1 -1
package/dist/metrics.js +9 -12
package/dist/migrate-sessions.js +2 -2
package/dist/model-registry.js +12 -14
package/dist/optimizer.js +9 -9
package/dist/process-monitor.js +24 -8
package/dist/request-helpers.d.ts +7 -0
package/dist/request-helpers.js +24 -2
package/dist/resources.js +32 -32
package/dist/retry.js +6 -4
package/dist/review-integrity.d.ts +6 -38
package/dist/review-integrity.js +41 -275
package/dist/session-manager-pg.js +6 -4
package/dist/session-manager.js +7 -4
package/dist/stream-json-parser.js +8 -6
package/package.json +6 -3

package/dist/index.js CHANGED Viewed

@@ -11,15 +11,16 @@ import { parseStreamJson } from "./stream-json-parser.js";
 import { createSessionManager } from "./session-manager.js";
 import { ResourceProvider } from "./resources.js";
 import { PerformanceMetrics } from "./metrics.js";
-import { estimateTokens, optimizePrompt as optimizePromptText, optimizeResponse as optimizeResponseText } from "./optimizer.js";
+import { estimateTokens, optimizePrompt as optimizePromptText, optimizeResponse as optimizeResponseText, } from "./optimizer.js";
 import { loadConfig } from "./config.js";
 import { checkHealth } from "./health.js";
 import { getCliInfo, resolveModelAlias } from "./model-registry.js";
 import { AsyncJobManager } from "./async-job-manager.js";
 import { ApprovalManager } from "./approval-manager.js";
 import { checkReviewIntegrity } from "./review-integrity.js";
-import { buildClaudeMcpConfig, CLAUDE_MCP_SERVER_NAMES } from "./claude-mcp-config.js";
-import { resolveSessionResumeArgs, GATEWAY_SESSION_PREFIX } from "./request-helpers.js";
+import { buildClaudeMcpConfig, CLAUDE_MCP_SERVER_NAMES, } from "./claude-mcp-config.js";
+import { resolveSessionResumeArgs, sanitizeCliArgValues, GATEWAY_SESSION_PREFIX, } from "./request-helpers.js";
+import { createFlightRecorder } from "./flight-recorder.js";
 // Simple logger that writes to stderr (stdout is used for MCP protocol)
 const logger = {
     info: (message, ...args) => {
@@ -32,7 +33,7 @@ const logger = {
         if (process.env.DEBUG) {
             console.error(`[DEBUG] ${new Date().toISOString()} - ${message}`, ...args);
         }
-    }
+    },
 };
 function logOptimizationTokens(kind, correlationId, original, optimized) {
     const originalTokens = estimateTokens(original);
@@ -106,6 +107,7 @@ let sessionManager;
 let db = null;
 const performanceMetrics = new PerformanceMetrics();
 let resourceProvider;
+const flightRecorder = createFlightRecorder(logger);
 const asyncJobManager = new AsyncJobManager(logger, (cli, durationMs, success) => {
     performanceMetrics.recordRequest(cli, durationMs, success);
 });
@@ -147,7 +149,7 @@ async function awaitJobOrDefer(cli, args, corrId, idleTimeoutMs, outputFormat) {
             return {
                 stdout: result.stdout,
                 stderr: result.stderr,
-                code: result.exitCode ?? 1
+                code: result.exitCode ?? 1,
             };
         }
         await new Promise(resolve => setTimeout(resolve, SYNC_POLL_INTERVAL_MS));
@@ -159,7 +161,7 @@ async function awaitJobOrDefer(cli, args, corrId, idleTimeoutMs, outputFormat) {
         jobId: job.id,
         cli,
         correlationId: corrId,
-        message: `Execution exceeded sync deadline (${SYNC_DEADLINE_MS}ms). Poll with llm_job_status, fetch with llm_job_result.`
+        message: `Execution exceeded sync deadline (${SYNC_DEADLINE_MS}ms). Poll with llm_job_status, fetch with llm_job_result.`,
     };
 }
 function isDeferredResponse(result) {
@@ -167,7 +169,8 @@ function isDeferredResponse(result) {
 }
 function buildDeferredToolResponse(deferred, sessionId) {
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
                 text: JSON.stringify({
                     status: "deferred",
@@ -178,9 +181,10 @@ function buildDeferredToolResponse(deferred, sessionId) {
                     sessionId: sessionId || null,
                     pollWith: "llm_job_status",
                     fetchWith: "llm_job_result",
-                    cancelWith: "llm_job_cancel"
-                }, null, 2)
-            }]
+                    cancelWith: "llm_job_cancel",
+                }, null, 2),
+            },
+        ],
     };
 }
 // Helper function for standardized error responses
@@ -211,20 +215,61 @@ function createErrorResponse(cli, code, stderr, correlationId, error) {
     }
     return {
         content: [{ type: "text", text: errorMessage }],
-        isError: true
+        isError: true,
+        structuredContent: {
+            correlationId: correlationId || null,
+            cli,
+            exitCode: code,
+            errorCategory: code === 124
+                ? "timeout"
+                : code === 125
+                    ? "idle_timeout"
+                    : error
+                        ? "spawn_error"
+                        : "cli_error",
+        },
     };
 }
+function extractUsageAndCost(cli, output, outputFormat) {
+    if (cli === "claude" && outputFormat === "stream-json") {
+        const parsed = parseStreamJson(output);
+        return {
+            inputTokens: parsed.usage?.inputTokens,
+            outputTokens: parsed.usage?.outputTokens,
+            costUsd: parsed.costUsd ?? undefined,
+        };
+    }
+    return {};
+}
+function safeFlightStart(entry) {
+    try {
+        flightRecorder.logStart(entry);
+    }
+    catch (error) {
+        logger.error("Flight recorder logStart failed", error);
+    }
+}
+function safeFlightComplete(correlationId, result) {
+    try {
+        flightRecorder.logComplete(correlationId, result);
+    }
+    catch (error) {
+        logger.error("Flight recorder logComplete failed", error);
+    }
+}
 function createApprovalDeniedResponse(operation, decision) {
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
                 text: JSON.stringify({
                     success: false,
                     error: `${operation} denied by MCP-managed approval policy`,
-                    approval: decision
-                }, null, 2)
-            }],
-        isError: true
+                    approval: decision,
+                }, null, 2),
+            },
+        ],
+        isError: true,
     };
 }
 function normalizeMcpServers(mcpServers) {
@@ -235,7 +280,8 @@ function normalizeMcpServers(mcpServers) {
 }
 function createMcpConfigErrorResponse(operation, correlationId, requested, message, missing = []) {
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
                 text: JSON.stringify({
                     success: false,
@@ -244,11 +290,12 @@ function createMcpConfigErrorResponse(operation, correlationId, requested, messa
                     correlationId,
                     mcpServers: {
                         requested,
-                        missing
-                    }
-                }, null, 2)
-            }],
-        isError: true
+                        missing,
+                    },
+                }, null, 2),
+            },
+        ],
+        isError: true,
     };
 }
 function resolveClaudeMcpConfig(operation, correlationId, requestedMcpServers, strictMcpConfig) {
@@ -260,13 +307,13 @@ function resolveClaudeMcpConfig(operation, correlationId, requestedMcpServers, s
         const message = error instanceof Error ? error.message : String(error);
         logger.error(`[${correlationId}] ${operation} failed to build Claude MCP config: ${message}`);
         return {
-            errorResponse: createMcpConfigErrorResponse(operation, correlationId, requestedMcpServers, message)
+            errorResponse: createMcpConfigErrorResponse(operation, correlationId, requestedMcpServers, message),
         };
     }
     if (strictMcpConfig && mcpConfig.missing.length > 0) {
         const missing = mcpConfig.missing.join(", ");
         return {
-            errorResponse: createMcpConfigErrorResponse(operation, correlationId, requestedMcpServers, `strictMcpConfig=true but requested servers are unavailable: ${missing}`, mcpConfig.missing)
+            errorResponse: createMcpConfigErrorResponse(operation, correlationId, requestedMcpServers, `strictMcpConfig=true but requested servers are unavailable: ${missing}`, mcpConfig.missing),
         };
     }
     return { config: mcpConfig };
@@ -279,13 +326,15 @@ for (const skill of loadedSkills) {
     server.registerResource(`skill-${skill.name}`, `skills://${skill.name}`, {
         title: skill.name,
         description: skill.description,
-        mimeType: "text/markdown"
+        mimeType: "text/markdown",
     }, async () => ({
-        contents: [{
+        contents: [
+            {
                 uri: `skills://${skill.name}`,
                 mimeType: "text/markdown",
-                text: skill.content
-            }]
+                text: skill.content,
+            },
+        ],
     }));
 }
 logger.info(`Registered ${loadedSkills.length} skill resources`);
@@ -293,7 +342,7 @@ logger.info(`Registered ${loadedSkills.length} skill resources`);
 server.registerResource("all-sessions", "sessions://all", {
     title: "📋 All Sessions",
     description: "All conversation sessions across CLIs",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading all sessions resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -303,7 +352,7 @@ server.registerResource("all-sessions", "sessions://all", {
 server.registerResource("claude-sessions", "sessions://claude", {
     title: "🤖 Claude Sessions",
     description: "Claude conversation sessions",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading Claude sessions resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -313,7 +362,7 @@ server.registerResource("claude-sessions", "sessions://claude", {
 server.registerResource("codex-sessions", "sessions://codex", {
     title: "💻 Codex Sessions",
     description: "Codex conversation sessions",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading Codex sessions resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -323,7 +372,7 @@ server.registerResource("codex-sessions", "sessions://codex", {
 server.registerResource("gemini-sessions", "sessions://gemini", {
     title: "✨ Gemini Sessions",
     description: "Gemini conversation sessions",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading Gemini sessions resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -333,7 +382,7 @@ server.registerResource("gemini-sessions", "sessions://gemini", {
 server.registerResource("claude-models", "models://claude", {
     title: "🧠 Claude Models",
     description: "Claude models and capabilities",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading Claude models resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -343,7 +392,7 @@ server.registerResource("claude-models", "models://claude", {
 server.registerResource("codex-models", "models://codex", {
     title: "🔧 Codex Models",
     description: "Codex models and capabilities",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading Codex models resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -353,7 +402,7 @@ server.registerResource("codex-models", "models://codex", {
 server.registerResource("gemini-models", "models://gemini", {
     title: "🌟 Gemini Models",
     description: "Gemini models and capabilities",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading Gemini models resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -363,7 +412,7 @@ server.registerResource("gemini-models", "models://gemini", {
 server.registerResource("performance-metrics", "metrics://performance", {
     title: "📈 Performance Metrics",
     description: "Request counts, latency, success/failure rates",
-    mimeType: "application/json"
+    mimeType: "application/json",
 }, async (uri) => {
     logger.debug("Reading performance metrics resource");
     const contents = await resourceProvider.readResource(uri.href);
@@ -374,10 +423,16 @@ function prepareClaudeRequest(params) {
     const cliInfo = getCliInfo();
     const resolvedModel = resolveModelAlias("claude", params.model, cliInfo);
     // Review integrity check on raw prompt (before optimization)
-    const reviewIntegrity = checkReviewIntegrity({ prompt: params.prompt, allowedTools: params.allowedTools, disallowedTools: params.disallowedTools });
+    const reviewIntegrity = checkReviewIntegrity({
+        prompt: params.prompt,
+        allowedTools: params.allowedTools,
+        disallowedTools: params.disallowedTools,
+    });
     if (reviewIntegrity.violations.length > 0) {
         logger.info(`[${corrId}] Review integrity violations detected: ${reviewIntegrity.violations.map(v => v.type).join(", ")}`, {
-            cli: "claude", operation: params.operation, score: reviewIntegrity.totalScore
+            cli: "claude",
+            operation: params.operation,
+            score: reviewIntegrity.totalScore,
         });
     }
     let effectivePrompt = params.prompt;
@@ -405,7 +460,7 @@ function prepareClaudeRequest(params) {
             disallowedTools: params.disallowedTools,
             policy: params.approvalPolicy,
             metadata: { model: resolvedModel || "default", strictMcpConfig: params.strictMcpConfig },
-            reviewIntegrity
+            reviewIntegrity,
         });
         if (approvalDecision.status !== "approved") {
             return createApprovalDeniedResponse(params.operation, approvalDecision);
@@ -421,9 +476,11 @@ function prepareClaudeRequest(params) {
         args.push("--output-format", "stream-json", "--include-partial-messages");
     }
     if (params.allowedTools && params.allowedTools.length > 0) {
+        sanitizeCliArgValues(params.allowedTools, "allowedTools");
         args.push("--allowed-tools", ...params.allowedTools);
     }
     if (params.disallowedTools && params.disallowedTools.length > 0) {
+        sanitizeCliArgValues(params.disallowedTools, "disallowedTools");
         args.push("--disallowed-tools", ...params.disallowedTools);
     }
     if (params.approvalStrategy === "mcp_managed") {
@@ -438,7 +495,16 @@ function prepareClaudeRequest(params) {
             args.push("--strict-mcp-config");
         }
     }
-    return { corrId, effectivePrompt, resolvedModel, requestedMcpServers, mcpConfig, approvalDecision, reviewIntegrity, args };
+    return {
+        corrId,
+        effectivePrompt,
+        resolvedModel,
+        requestedMcpServers,
+        mcpConfig,
+        approvalDecision,
+        reviewIntegrity,
+        args,
+    };
 }
 function prepareCodexRequest(params) {
     const corrId = params.correlationId || randomUUID();
@@ -448,7 +514,9 @@ function prepareCodexRequest(params) {
     const reviewIntegrity = checkReviewIntegrity({ prompt: params.prompt });
     if (reviewIntegrity.violations.length > 0) {
         logger.info(`[${corrId}] Review integrity violations detected: ${reviewIntegrity.violations.map(v => v.type).join(", ")}`, {
-            cli: "codex", operation: params.operation, score: reviewIntegrity.totalScore
+            cli: "codex",
+            operation: params.operation,
+            score: reviewIntegrity.totalScore,
         });
     }
     let effectivePrompt = params.prompt;
@@ -469,7 +537,7 @@ function prepareCodexRequest(params) {
             requestedMcpServers,
             policy: params.approvalPolicy,
             metadata: { model: resolvedModel || "default" },
-            reviewIntegrity
+            reviewIntegrity,
         });
         if (approvalDecision.status !== "approved") {
             return createApprovalDeniedResponse(params.operation, approvalDecision);
@@ -484,17 +552,30 @@ function prepareCodexRequest(params) {
         args.push("--dangerously-bypass-approvals-and-sandbox");
     }
     args.push("--skip-git-repo-check", effectivePrompt);
-    return { corrId, effectivePrompt, resolvedModel, requestedMcpServers, approvalDecision, reviewIntegrity, args };
+    return {
+        corrId,
+        effectivePrompt,
+        resolvedModel,
+        requestedMcpServers,
+        approvalDecision,
+        reviewIntegrity,
+        args,
+    };
 }
 function prepareGeminiRequest(params) {
     const corrId = params.correlationId || randomUUID();
     const cliInfo = getCliInfo();
     const resolvedModel = resolveModelAlias("gemini", params.model, cliInfo);
     // Review integrity check on raw prompt (before optimization)
-    const reviewIntegrity = checkReviewIntegrity({ prompt: params.prompt, allowedTools: params.allowedTools });
+    const reviewIntegrity = checkReviewIntegrity({
+        prompt: params.prompt,
+        allowedTools: params.allowedTools,
+    });
     if (reviewIntegrity.violations.length > 0) {
         logger.info(`[${corrId}] Review integrity violations detected: ${reviewIntegrity.violations.map(v => v.type).join(", ")}`, {
-            cli: "gemini", operation: params.operation, score: reviewIntegrity.totalScore
+            cli: "gemini",
+            operation: params.operation,
+            score: reviewIntegrity.totalScore,
         });
     }
     let effectivePrompt = params.prompt;
@@ -516,7 +597,7 @@ function prepareGeminiRequest(params) {
             allowedTools: params.allowedTools,
             policy: params.approvalPolicy,
             metadata: { model: resolvedModel || "default" },
-            reviewIntegrity
+            reviewIntegrity,
         });
         if (approvalDecision.status !== "approved") {
             return createApprovalDeniedResponse(params.operation, approvalDecision);
@@ -529,17 +610,28 @@ function prepareGeminiRequest(params) {
     if (effectiveApprovalMode)
         args.push("--approval-mode", effectiveApprovalMode);
     if (params.allowedTools && params.allowedTools.length > 0) {
+        sanitizeCliArgValues(params.allowedTools, "allowedTools");
         params.allowedTools.forEach(tool => args.push("--allowed-tools", tool));
     }
     if (requestedMcpServers.length > 0) {
+        sanitizeCliArgValues(requestedMcpServers, "mcpServers");
         requestedMcpServers.forEach(serverName => args.push("--allowed-mcp-server-names", serverName));
     }
     if (params.includeDirs && params.includeDirs.length > 0) {
+        sanitizeCliArgValues(params.includeDirs, "includeDirs");
         params.includeDirs.forEach(dir => args.push("--include-directories", dir));
     }
-    return { corrId, effectivePrompt, resolvedModel, requestedMcpServers, approvalDecision, reviewIntegrity, args };
+    return {
+        corrId,
+        effectivePrompt,
+        resolvedModel,
+        requestedMcpServers,
+        approvalDecision,
+        reviewIntegrity,
+        args,
+    };
 }
-function buildCliResponse(stdout, optimizeResponse, corrId, sessionId, prep, resumable, outputFormat) {
+function buildCliResponse(cli, stdout, optimizeResponse, corrId, sessionId, prep, durationMs, resumable, outputFormat) {
     let finalStdout = stdout;
     // Skip response optimization for JSON output to prevent corrupting structured data
     if (optimizeResponse && outputFormat !== "json") {
@@ -548,7 +640,9 @@ function buildCliResponse(stdout, optimizeResponse, corrId, sessionId, prep, res
         finalStdout = optimized;
     }
     // Append review integrity warnings to response text (skip for JSON output to avoid corruption)
-    if (prep.reviewIntegrity && prep.reviewIntegrity.violations.length > 0 && outputFormat !== "json") {
+    if (prep.reviewIntegrity &&
+        prep.reviewIntegrity.violations.length > 0 &&
+        outputFormat !== "json") {
         const warnings = prep.reviewIntegrity.violations
             .map(v => `- [${v.type}] ${v.detail}`)
             .join("\n");
@@ -556,9 +650,23 @@ function buildCliResponse(stdout, optimizeResponse, corrId, sessionId, prep, res
     }
     const response = {
         content: [{ type: "text", text: finalStdout }],
+        structuredContent: {
+            model: prep.resolvedModel || "default",
+            cli,
+            correlationId: corrId,
+            sessionId: sessionId || null,
+            durationMs,
+            ...extractUsageAndCost(cli, stdout, outputFormat),
+            exitCode: 0,
+            retryCount: 0,
+        },
         mcpServers: prep.mcpConfig
-            ? { requested: prep.requestedMcpServers, enabled: prep.mcpConfig.enabled, missing: prep.mcpConfig.missing }
-            : { requested: prep.requestedMcpServers }
+            ? {
+                requested: prep.requestedMcpServers,
+                enabled: prep.mcpConfig.enabled,
+                missing: prep.mcpConfig.missing,
+            }
+            : { requested: prep.requestedMcpServers },
     };
     if (sessionId) {
         response.sessionId = sessionId;
@@ -577,22 +685,37 @@ function buildCliResponse(stdout, optimizeResponse, corrId, sessionId, prep, res
 export async function handleGeminiRequest(deps, params) {
     const startTime = Date.now();
     const prep = prepareGeminiRequest({
-        prompt: params.prompt, model: params.model, approvalMode: params.approvalMode,
-        approvalStrategy: params.approvalStrategy, approvalPolicy: params.approvalPolicy,
-        allowedTools: params.allowedTools, includeDirs: params.includeDirs,
-        mcpServers: params.mcpServers, correlationId: params.correlationId,
-        optimizePrompt: params.optimizePrompt, operation: "gemini_request"
+        prompt: params.prompt,
+        model: params.model,
+        approvalMode: params.approvalMode,
+        approvalStrategy: params.approvalStrategy,
+        approvalPolicy: params.approvalPolicy,
+        allowedTools: params.allowedTools,
+        includeDirs: params.includeDirs,
+        mcpServers: params.mcpServers,
+        correlationId: params.correlationId,
+        optimizePrompt: params.optimizePrompt,
+        operation: "gemini_request",
     });
     if (!("args" in prep))
         return prep;
     const { corrId, args } = prep;
     let durationMs = 0;
     let wasSuccessful = false;
+    safeFlightStart({
+        correlationId: corrId,
+        cli: "gemini",
+        model: prep.resolvedModel || "default",
+        prompt: params.prompt,
+        sessionId: params.sessionId,
+    });
     deps.logger.info(`[${corrId}] gemini_request invoked with model=${prep.resolvedModel || "default"}, approvalMode=${params.approvalMode}, prompt length=${params.prompt.length}`);
     try {
         // Session arg planning (pure, no I/O)
         const sessionResult = resolveSessionResumeArgs({
-            sessionId: params.sessionId, resumeLatest: params.resumeLatest, createNewSession: params.createNewSession
+            sessionId: params.sessionId,
+            resumeLatest: params.resumeLatest,
+            createNewSession: params.createNewSession,
         });
         args.push(...sessionResult.resumeArgs);
         const result = await awaitJobOrDefer("gemini", args, corrId, resolveIdleTimeout("gemini", params.idleTimeoutMs));
@@ -604,6 +727,16 @@ export async function handleGeminiRequest(deps, params) {
         durationMs = Math.max(0, Date.now() - startTime);
         if (code !== 0) {
             deps.logger.info(`[${corrId}] gemini_request failed in ${durationMs}ms`);
+            safeFlightComplete(corrId, {
+                response: stderr || "",
+                durationMs,
+                retryCount: 0,
+                circuitBreakerState: "closed",
+                optimizationApplied: false,
+                exitCode: code,
+                errorMessage: stderr || `Exit code ${code}`,
+                status: "failed",
+            });
             return createErrorResponse("gemini", code, stderr, corrId);
         }
         wasSuccessful = true;
@@ -628,11 +761,32 @@ export async function handleGeminiRequest(deps, params) {
             effectiveSessionId = newSession.id;
         }
         deps.logger.info(`[${corrId}] gemini_request completed successfully in ${durationMs}ms`);
-        return buildCliResponse(stdout, params.optimizeResponse ?? false, corrId, effectiveSessionId, prep, sessionResult.userProvidedSession);
+        const response = buildCliResponse("gemini", stdout, params.optimizeResponse ?? false, corrId, effectiveSessionId, prep, durationMs, sessionResult.userProvidedSession);
+        safeFlightComplete(corrId, {
+            response: stdout,
+            durationMs,
+            retryCount: 0,
+            circuitBreakerState: "closed",
+            approvalDecision: prep.approvalDecision?.status,
+            optimizationApplied: params.optimizePrompt || (params.optimizeResponse ?? false),
+            exitCode: 0,
+            status: "completed",
+        });
+        return response;
     }
     catch (error) {
         const elapsedMs = Math.max(0, Date.now() - startTime);
         deps.logger.info(`[${corrId}] gemini_request threw exception after ${elapsedMs}ms`);
+        safeFlightComplete(corrId, {
+            response: "",
+            durationMs: elapsedMs,
+            retryCount: 0,
+            circuitBreakerState: "closed",
+            optimizationApplied: false,
+            exitCode: 1,
+            errorMessage: error.message,
+            status: "failed",
+        });
         return createErrorResponse("gemini", 1, "", corrId, error);
     }
     finally {
@@ -642,11 +796,17 @@ export async function handleGeminiRequest(deps, params) {
 }
 export async function handleGeminiRequestAsync(deps, params) {
     const prep = prepareGeminiRequest({
-        prompt: params.prompt, model: params.model, approvalMode: params.approvalMode,
-        approvalStrategy: params.approvalStrategy, approvalPolicy: params.approvalPolicy,
-        allowedTools: params.allowedTools, includeDirs: params.includeDirs,
-        mcpServers: params.mcpServers, correlationId: params.correlationId,
-        optimizePrompt: params.optimizePrompt, operation: "gemini_request_async"
+        prompt: params.prompt,
+        model: params.model,
+        approvalMode: params.approvalMode,
+        approvalStrategy: params.approvalStrategy,
+        approvalPolicy: params.approvalPolicy,
+        allowedTools: params.allowedTools,
+        includeDirs: params.includeDirs,
+        mcpServers: params.mcpServers,
+        correlationId: params.correlationId,
+        optimizePrompt: params.optimizePrompt,
+        operation: "gemini_request_async",
     });
     if (!("args" in prep))
         return prep;
@@ -654,7 +814,9 @@ export async function handleGeminiRequestAsync(deps, params) {
     try {
         // Session arg planning (pure, no I/O)
         const sessionResult = resolveSessionResumeArgs({
-            sessionId: params.sessionId, resumeLatest: params.resumeLatest, createNewSession: params.createNewSession
+            sessionId: params.sessionId,
+            resumeLatest: params.resumeLatest,
+            createNewSession: params.createNewSession,
         });
         args.push(...sessionResult.resumeArgs);
         // Pre-start session I/O (async handlers: prevent orphaned jobs)
@@ -686,16 +848,18 @@ export async function handleGeminiRequestAsync(deps, params) {
             sessionId: effectiveSessionId || null,
             resumable: sessionResult.userProvidedSession,
             approval: approvalDecision,
-            mcpServers: { requested: requestedMcpServers }
+            mcpServers: { requested: requestedMcpServers },
         };
         if (prep.reviewIntegrity && prep.reviewIntegrity.violations.length > 0) {
             asyncResponse.reviewIntegrity = prep.reviewIntegrity;
         }
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
-                    text: JSON.stringify(asyncResponse, null, 2)
-                }]
+                    text: JSON.stringify(asyncResponse, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -704,12 +868,16 @@ export async function handleGeminiRequestAsync(deps, params) {
 }
 export async function handleCodexRequestAsync(deps, params) {
     const prep = prepareCodexRequest({
-        prompt: params.prompt, model: params.model, fullAuto: params.fullAuto,
+        prompt: params.prompt,
+        model: params.model,
+        fullAuto: params.fullAuto,
         dangerouslyBypassApprovalsAndSandbox: params.dangerouslyBypassApprovalsAndSandbox,
-        approvalStrategy: params.approvalStrategy, approvalPolicy: params.approvalPolicy,
+        approvalStrategy: params.approvalStrategy,
+        approvalPolicy: params.approvalPolicy,
         mcpServers: params.mcpServers,
-        correlationId: params.correlationId, optimizePrompt: params.optimizePrompt,
-        operation: "codex_request_async"
+        correlationId: params.correlationId,
+        optimizePrompt: params.optimizePrompt,
+        operation: "codex_request_async",
     });
     if (!("args" in prep))
         return prep;
@@ -742,16 +910,18 @@ export async function handleCodexRequestAsync(deps, params) {
             job,
             sessionId: effectiveSessionId || null,
             approval: approvalDecision,
-            mcpServers: { requested: requestedMcpServers }
+            mcpServers: { requested: requestedMcpServers },
         };
         if (prep.reviewIntegrity && prep.reviewIntegrity.violations.length > 0) {
             asyncResponse.reviewIntegrity = prep.reviewIntegrity;
         }
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
-                    text: JSON.stringify(asyncResponse, null, 2)
-                }]
+                    text: JSON.stringify(asyncResponse, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -762,35 +932,86 @@ export async function handleCodexRequestAsync(deps, params) {
 // Claude Code Tool
 //──────────────────────────────────────────────────────────────────────────────
 server.tool("claude_request", {
-    prompt: z.string().min(1, "Prompt cannot be empty").max(100000, "Prompt too long (max 100k chars)").describe("Prompt text for Claude"),
-    model: z.string().optional().describe("Model name or alias (e.g. sonnet, claude-sonnet-4-5-20250929, latest)"),
-    outputFormat: z.enum(["text", "json", "stream-json"]).default("text").describe("Output format (text|json|stream-json). stream-json: NDJSON with idle timeout."),
+    prompt: z
+        .string()
+        .min(1, "Prompt cannot be empty")
+        .max(100000, "Prompt too long (max 100k chars)")
+        .describe("Prompt text for Claude"),
+    model: z
+        .string()
+        .optional()
+        .describe("Model name or alias (e.g. sonnet, claude-sonnet-4-5-20250929, latest)"),
+    outputFormat: z
+        .enum(["text", "json", "stream-json"])
+        .default("text")
+        .describe("Output format (text|json|stream-json). stream-json: NDJSON with idle timeout."),
     sessionId: z.string().optional().describe("Session ID (uses active if omitted)"),
     continueSession: z.boolean().default(false).describe("Continue active session"),
     createNewSession: z.boolean().default(false).describe("Force new session"),
-    allowedTools: z.array(z.string()).optional().describe("Allowed tools (['Bash(git:*)','Edit','Write'])"),
+    allowedTools: z
+        .array(z.string())
+        .optional()
+        .describe("Allowed tools (['Bash(git:*)','Edit','Write'])"),
     disallowedTools: z.array(z.string()).optional().describe("Disallowed tools"),
-    dangerouslySkipPermissions: z.boolean().default(false).describe("Bypass permissions (sandbox only)"),
-    approvalStrategy: z.enum(["legacy", "mcp_managed"]).default("legacy").describe("Approval strategy"),
-    approvalPolicy: z.enum(["strict", "balanced", "permissive"]).optional().describe("Approval policy override"),
-    mcpServers: z.array(MCP_SERVER_ENUM).default(["sqry"]).describe("MCP servers exposed to Claude"),
-    strictMcpConfig: z.boolean().default(false).describe("Restrict Claude to provided MCP config only"),
+    dangerouslySkipPermissions: z
+        .boolean()
+        .default(false)
+        .describe("Bypass permissions (sandbox only)"),
+    approvalStrategy: z
+        .enum(["legacy", "mcp_managed"])
+        .default("legacy")
+        .describe("Approval strategy"),
+    approvalPolicy: z
+        .enum(["strict", "balanced", "permissive"])
+        .optional()
+        .describe("Approval policy override"),
+    mcpServers: z
+        .array(MCP_SERVER_ENUM)
+        .default(["sqry"])
+        .describe("MCP servers exposed to Claude"),
+    strictMcpConfig: z
+        .boolean()
+        .default(false)
+        .describe("Restrict Claude to provided MCP config only"),
     correlationId: z.string().optional().describe("Request trace ID (auto if omitted)"),
     optimizePrompt: z.boolean().default(false).describe("Optimize prompt before execution"),
     optimizeResponse: z.boolean().default(false).describe("Optimize response output"),
-    idleTimeoutMs: z.number().int().min(30_000).max(3_600_000).optional().describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)")
-}, async ({ prompt, model, outputFormat, sessionId, continueSession, createNewSession, allowedTools, disallowedTools, dangerouslySkipPermissions, approvalStrategy, approvalPolicy, mcpServers, strictMcpConfig, correlationId, optimizePrompt, optimizeResponse, idleTimeoutMs }) => {
+    idleTimeoutMs: z
+        .number()
+        .int()
+        .min(30_000)
+        .max(3_600_000)
+        .optional()
+        .describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)"),
+}, async ({ prompt, model, outputFormat, sessionId, continueSession, createNewSession, allowedTools, disallowedTools, dangerouslySkipPermissions, approvalStrategy, approvalPolicy, mcpServers, strictMcpConfig, correlationId, optimizePrompt, optimizeResponse, idleTimeoutMs, }) => {
     const startTime = Date.now();
     const prep = prepareClaudeRequest({
-        prompt, model, outputFormat, allowedTools, disallowedTools, dangerouslySkipPermissions,
-        approvalStrategy, approvalPolicy, mcpServers,
-        strictMcpConfig, correlationId, optimizePrompt, operation: "claude_request"
+        prompt,
+        model,
+        outputFormat,
+        allowedTools,
+        disallowedTools,
+        dangerouslySkipPermissions,
+        approvalStrategy,
+        approvalPolicy,
+        mcpServers,
+        strictMcpConfig,
+        correlationId,
+        optimizePrompt,
+        operation: "claude_request",
     });
     if (!("args" in prep))
         return prep;
     const { corrId, args } = prep;
     let durationMs = 0;
     let wasSuccessful = false;
+    safeFlightStart({
+        correlationId: corrId,
+        cli: "claude",
+        model: prep.resolvedModel || "default",
+        prompt,
+        sessionId,
+    });
     logger.info(`[${corrId}] claude_request invoked with model=${prep.resolvedModel || "default"}, outputFormat=${outputFormat}, prompt length=${prompt.length}, sessionId=${sessionId}`);
     try {
         // Session management
@@ -812,9 +1033,7 @@ server.tool("claude_request", {
             await sessionManager.updateSessionUsage(effectiveSessionId);
         }
         // Idle timeout only for stream-json (text/json produce no output until done)
-        const effectiveIdleTimeout = outputFormat === "stream-json"
-            ? resolveIdleTimeout("claude", idleTimeoutMs)
-            : undefined;
+        const effectiveIdleTimeout = outputFormat === "stream-json" ? resolveIdleTimeout("claude", idleTimeoutMs) : undefined;
         const result = await awaitJobOrDefer("claude", args, corrId, effectiveIdleTimeout, outputFormat);
         // Deferred — job still running, return async reference
         if (isDeferredResponse(result)) {
@@ -824,6 +1043,16 @@ server.tool("claude_request", {
         durationMs = Math.max(0, Date.now() - startTime);
         if (code !== 0) {
             logger.info(`[${corrId}] claude_request failed in ${durationMs}ms`);
+            safeFlightComplete(corrId, {
+                response: stderr || "",
+                durationMs,
+                retryCount: 0,
+                circuitBreakerState: "closed",
+                optimizationApplied: optimizePrompt || optimizeResponse,
+                exitCode: code,
+                errorMessage: stderr || `Exit code ${code}`,
+                status: "failed",
+            });
             return createErrorResponse("claude", code, stderr, corrId);
         }
         wasSuccessful = true;
@@ -841,13 +1070,44 @@ server.tool("claude_request", {
             if (parsed.costUsd !== null) {
                 logger.debug(`[${corrId}] stream-json cost=$${parsed.costUsd}, model=${parsed.model}, turns=${parsed.numTurns}`);
             }
-            return buildCliResponse(parsed.text, optimizeResponse, corrId, effectiveSessionId, prep, undefined, outputFormat);
+            safeFlightComplete(corrId, {
+                response: parsed.text,
+                inputTokens: parsed.usage?.inputTokens,
+                outputTokens: parsed.usage?.outputTokens,
+                durationMs,
+                retryCount: 0,
+                circuitBreakerState: "closed",
+                costUsd: parsed.costUsd ?? undefined,
+                optimizationApplied: optimizePrompt || optimizeResponse,
+                exitCode: 0,
+                status: "completed",
+            });
+            return buildCliResponse("claude", parsed.text, optimizeResponse, corrId, effectiveSessionId, prep, durationMs, undefined, outputFormat);
         }
-        return buildCliResponse(stdout, optimizeResponse, corrId, effectiveSessionId, prep, undefined, outputFormat);
+        safeFlightComplete(corrId, {
+            response: stdout,
+            durationMs,
+            retryCount: 0,
+            circuitBreakerState: "closed",
+            optimizationApplied: optimizePrompt || optimizeResponse,
+            exitCode: 0,
+            status: "completed",
+        });
+        return buildCliResponse("claude", stdout, optimizeResponse, corrId, effectiveSessionId, prep, durationMs, undefined, outputFormat);
     }
     catch (error) {
         const elapsedMs = Math.max(0, Date.now() - startTime);
         logger.info(`[${corrId}] claude_request threw exception after ${elapsedMs}ms`);
+        safeFlightComplete(corrId, {
+            response: "",
+            durationMs: elapsedMs,
+            retryCount: 0,
+            circuitBreakerState: "closed",
+            optimizationApplied: optimizePrompt || optimizeResponse,
+            exitCode: 1,
+            errorMessage: error.message,
+            status: "failed",
+        });
         return createErrorResponse("claude", 1, "", corrId, error);
     }
     finally {
@@ -859,31 +1119,67 @@ server.tool("claude_request", {
 // Codex Tool
 //──────────────────────────────────────────────────────────────────────────────
 server.tool("codex_request", {
-    prompt: z.string().min(1, "Prompt cannot be empty").max(100000, "Prompt too long (max 100k chars)").describe("Prompt text for Codex"),
+    prompt: z
+        .string()
+        .min(1, "Prompt cannot be empty")
+        .max(100000, "Prompt too long (max 100k chars)")
+        .describe("Prompt text for Codex"),
     model: z.string().optional().describe("Model name or alias (e.g. gpt-5.4, latest)"),
     fullAuto: z.boolean().default(false).describe("Full-auto mode (sandboxed execution)"),
-    dangerouslyBypassApprovalsAndSandbox: z.boolean().default(false).describe("Run Codex without approvals/sandbox"),
-    approvalStrategy: z.enum(["legacy", "mcp_managed"]).default("legacy").describe("Approval strategy"),
-    approvalPolicy: z.enum(["strict", "balanced", "permissive"]).optional().describe("Approval policy override"),
-    mcpServers: z.array(MCP_SERVER_ENUM).default(["sqry"]).describe("MCP server names for approval tracking (Codex manages its own MCP config)"),
+    dangerouslyBypassApprovalsAndSandbox: z
+        .boolean()
+        .default(false)
+        .describe("Run Codex without approvals/sandbox"),
+    approvalStrategy: z
+        .enum(["legacy", "mcp_managed"])
+        .default("legacy")
+        .describe("Approval strategy"),
+    approvalPolicy: z
+        .enum(["strict", "balanced", "permissive"])
+        .optional()
+        .describe("Approval policy override"),
+    mcpServers: z
+        .array(MCP_SERVER_ENUM)
+        .default(["sqry"])
+        .describe("MCP server names for approval tracking (Codex manages its own MCP config)"),
     sessionId: z.string().optional().describe("Session ID (Codex manages internally)"),
     createNewSession: z.boolean().default(false).describe("Force new session"),
     correlationId: z.string().optional().describe("Request trace ID (auto if omitted)"),
     optimizePrompt: z.boolean().default(false).describe("Optimize prompt before execution"),
     optimizeResponse: z.boolean().default(false).describe("Optimize response output"),
-    idleTimeoutMs: z.number().int().min(30_000).max(3_600_000).optional().describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)")
-}, async ({ prompt, model, fullAuto, dangerouslyBypassApprovalsAndSandbox, approvalStrategy, approvalPolicy, mcpServers, sessionId, createNewSession, correlationId, optimizePrompt, optimizeResponse, idleTimeoutMs }) => {
+    idleTimeoutMs: z
+        .number()
+        .int()
+        .min(30_000)
+        .max(3_600_000)
+        .optional()
+        .describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)"),
+}, async ({ prompt, model, fullAuto, dangerouslyBypassApprovalsAndSandbox, approvalStrategy, approvalPolicy, mcpServers, sessionId, createNewSession, correlationId, optimizePrompt, optimizeResponse, idleTimeoutMs, }) => {
     const startTime = Date.now();
     const prep = prepareCodexRequest({
-        prompt, model, fullAuto, dangerouslyBypassApprovalsAndSandbox,
-        approvalStrategy, approvalPolicy, mcpServers,
-        correlationId, optimizePrompt, operation: "codex_request"
+        prompt,
+        model,
+        fullAuto,
+        dangerouslyBypassApprovalsAndSandbox,
+        approvalStrategy,
+        approvalPolicy,
+        mcpServers,
+        correlationId,
+        optimizePrompt,
+        operation: "codex_request",
     });
     if (!("args" in prep))
         return prep;
     const { corrId, args } = prep;
     let durationMs = 0;
     let wasSuccessful = false;
+    safeFlightStart({
+        correlationId: corrId,
+        cli: "codex",
+        model: prep.resolvedModel || "default",
+        prompt,
+        sessionId,
+    });
     logger.info(`[${corrId}] codex_request invoked with model=${prep.resolvedModel || "default"}, fullAuto=${fullAuto}, prompt length=${prompt.length}`);
     try {
         const result = await awaitJobOrDefer("codex", args, corrId, resolveIdleTimeout("codex", idleTimeoutMs));
@@ -895,6 +1191,16 @@ server.tool("codex_request", {
         durationMs = Math.max(0, Date.now() - startTime);
         if (code !== 0) {
             logger.info(`[${corrId}] codex_request failed in ${durationMs}ms`);
+            safeFlightComplete(corrId, {
+                response: stderr || "",
+                durationMs,
+                retryCount: 0,
+                circuitBreakerState: "closed",
+                optimizationApplied: optimizePrompt || optimizeResponse,
+                exitCode: code,
+                errorMessage: stderr || `Exit code ${code}`,
+                status: "failed",
+            });
             return createErrorResponse("codex", code, stderr, corrId);
         }
         wasSuccessful = true;
@@ -918,11 +1224,30 @@ server.tool("codex_request", {
             effectiveSessionId = newSession.id;
         }
         logger.info(`[${corrId}] codex_request completed successfully in ${durationMs}ms`);
-        return buildCliResponse(stdout, optimizeResponse, corrId, effectiveSessionId, prep);
+        safeFlightComplete(corrId, {
+            response: stdout,
+            durationMs,
+            retryCount: 0,
+            circuitBreakerState: "closed",
+            optimizationApplied: optimizePrompt || optimizeResponse,
+            exitCode: 0,
+            status: "completed",
+        });
+        return buildCliResponse("codex", stdout, optimizeResponse, corrId, effectiveSessionId, prep, durationMs);
     }
     catch (error) {
         const elapsedMs = Math.max(0, Date.now() - startTime);
         logger.info(`[${corrId}] codex_request threw exception after ${elapsedMs}ms`);
+        safeFlightComplete(corrId, {
+            response: "",
+            durationMs: elapsedMs,
+            retryCount: 0,
+            circuitBreakerState: "closed",
+            optimizationApplied: optimizePrompt || optimizeResponse,
+            exitCode: 1,
+            errorMessage: error.message,
+            status: "failed",
+        });
         return createErrorResponse("codex", 1, "", corrId, error);
     }
     finally {
@@ -934,49 +1259,137 @@ server.tool("codex_request", {
 // Gemini Tool
 //──────────────────────────────────────────────────────────────────────────────
 server.tool("gemini_request", {
-    prompt: z.string().min(1, "Prompt cannot be empty").max(100000, "Prompt too long (max 100k chars)").describe("Prompt text for Gemini"),
-    model: z.string().optional().describe("Model name or alias (e.g. gemini-3-pro-preview, gemini-2.5-flash, pro, flash, latest)"),
+    prompt: z
+        .string()
+        .min(1, "Prompt cannot be empty")
+        .max(100000, "Prompt too long (max 100k chars)")
+        .describe("Prompt text for Gemini"),
+    model: z
+        .string()
+        .optional()
+        .describe("Model name or alias (e.g. gemini-3-pro-preview, gemini-2.5-flash, pro, flash, latest)"),
     sessionId: z.string().optional().describe("Session ID or 'latest'"),
     resumeLatest: z.boolean().default(false).describe("Resume latest session"),
     createNewSession: z.boolean().default(false).describe("Force new session"),
-    approvalMode: z.enum(["default", "auto_edit", "yolo"]).optional().describe("Approval: default|auto_edit|yolo"),
-    approvalStrategy: z.enum(["legacy", "mcp_managed"]).default("legacy").describe("Approval strategy"),
-    approvalPolicy: z.enum(["strict", "balanced", "permissive"]).optional().describe("Approval policy override"),
-    mcpServers: z.array(MCP_SERVER_ENUM).default(["sqry"]).describe("MCP server names passed to Gemini as --allowed-mcp-server-names"),
-    allowedTools: z.array(z.string()).optional().describe("Allowed tools (['Write','Edit','Bash'])"),
+    approvalMode: z
+        .enum(["default", "auto_edit", "yolo"])
+        .optional()
+        .describe("Approval: default|auto_edit|yolo"),
+    approvalStrategy: z
+        .enum(["legacy", "mcp_managed"])
+        .default("legacy")
+        .describe("Approval strategy"),
+    approvalPolicy: z
+        .enum(["strict", "balanced", "permissive"])
+        .optional()
+        .describe("Approval policy override"),
+    mcpServers: z
+        .array(MCP_SERVER_ENUM)
+        .default(["sqry"])
+        .describe("MCP server names passed to Gemini as --allowed-mcp-server-names"),
+    allowedTools: z
+        .array(z.string())
+        .optional()
+        .describe("Allowed tools (['Write','Edit','Bash'])"),
     includeDirs: z.array(z.string()).optional().describe("Additional workspace directories"),
     correlationId: z.string().optional().describe("Request trace ID (auto if omitted)"),
     optimizePrompt: z.boolean().default(false).describe("Optimize prompt before execution"),
     optimizeResponse: z.boolean().default(false).describe("Optimize response output"),
-    idleTimeoutMs: z.number().int().min(30_000).max(3_600_000).optional().describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)")
-}, async ({ prompt, model, sessionId, resumeLatest, createNewSession, approvalMode, approvalStrategy, approvalPolicy, mcpServers, allowedTools, includeDirs, correlationId, optimizePrompt, optimizeResponse, idleTimeoutMs }) => {
-    return handleGeminiRequest({ sessionManager, logger }, { prompt, model, sessionId, resumeLatest, createNewSession, approvalMode, approvalStrategy, approvalPolicy, mcpServers, allowedTools, includeDirs, correlationId, optimizePrompt, optimizeResponse, idleTimeoutMs });
+    idleTimeoutMs: z
+        .number()
+        .int()
+        .min(30_000)
+        .max(3_600_000)
+        .optional()
+        .describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)"),
+}, async ({ prompt, model, sessionId, resumeLatest, createNewSession, approvalMode, approvalStrategy, approvalPolicy, mcpServers, allowedTools, includeDirs, correlationId, optimizePrompt, optimizeResponse, idleTimeoutMs, }) => {
+    return handleGeminiRequest({ sessionManager, logger }, {
+        prompt,
+        model,
+        sessionId,
+        resumeLatest,
+        createNewSession,
+        approvalMode,
+        approvalStrategy,
+        approvalPolicy,
+        mcpServers,
+        allowedTools,
+        includeDirs,
+        correlationId,
+        optimizePrompt,
+        optimizeResponse,
+        idleTimeoutMs,
+    });
 });
 //──────────────────────────────────────────────────────────────────────────────
 // Async Long-Running Job Tools (No Time-Bound LLM Execution)
 //──────────────────────────────────────────────────────────────────────────────
 server.tool("claude_request_async", {
-    prompt: z.string().min(1, "Prompt cannot be empty").max(100000, "Prompt too long (max 100k chars)").describe("Prompt text for Claude"),
-    model: z.string().optional().describe("Model name or alias (e.g. sonnet, claude-sonnet-4-5-20250929, latest)"),
-    outputFormat: z.enum(["text", "json", "stream-json"]).default("text").describe("Output format (text|json|stream-json). stream-json: NDJSON with idle timeout."),
+    prompt: z
+        .string()
+        .min(1, "Prompt cannot be empty")
+        .max(100000, "Prompt too long (max 100k chars)")
+        .describe("Prompt text for Claude"),
+    model: z
+        .string()
+        .optional()
+        .describe("Model name or alias (e.g. sonnet, claude-sonnet-4-5-20250929, latest)"),
+    outputFormat: z
+        .enum(["text", "json", "stream-json"])
+        .default("text")
+        .describe("Output format (text|json|stream-json). stream-json: NDJSON with idle timeout."),
     sessionId: z.string().optional().describe("Session ID (uses active if omitted)"),
     continueSession: z.boolean().default(false).describe("Continue active session"),
     createNewSession: z.boolean().default(false).describe("Force new session"),
-    allowedTools: z.array(z.string()).optional().describe("Allowed tools (['Bash(git:*)','Edit','Write'])"),
+    allowedTools: z
+        .array(z.string())
+        .optional()
+        .describe("Allowed tools (['Bash(git:*)','Edit','Write'])"),
     disallowedTools: z.array(z.string()).optional().describe("Disallowed tools"),
-    dangerouslySkipPermissions: z.boolean().default(false).describe("Bypass permissions (sandbox only)"),
-    approvalStrategy: z.enum(["legacy", "mcp_managed"]).default("legacy").describe("Approval strategy"),
-    approvalPolicy: z.enum(["strict", "balanced", "permissive"]).optional().describe("Approval policy override"),
-    mcpServers: z.array(MCP_SERVER_ENUM).default(["sqry"]).describe("MCP servers exposed to Claude"),
-    strictMcpConfig: z.boolean().default(false).describe("Restrict Claude to provided MCP config only"),
+    dangerouslySkipPermissions: z
+        .boolean()
+        .default(false)
+        .describe("Bypass permissions (sandbox only)"),
+    approvalStrategy: z
+        .enum(["legacy", "mcp_managed"])
+        .default("legacy")
+        .describe("Approval strategy"),
+    approvalPolicy: z
+        .enum(["strict", "balanced", "permissive"])
+        .optional()
+        .describe("Approval policy override"),
+    mcpServers: z
+        .array(MCP_SERVER_ENUM)
+        .default(["sqry"])
+        .describe("MCP servers exposed to Claude"),
+    strictMcpConfig: z
+        .boolean()
+        .default(false)
+        .describe("Restrict Claude to provided MCP config only"),
     correlationId: z.string().optional().describe("Request trace ID (auto if omitted)"),
     optimizePrompt: z.boolean().default(false).describe("Optimize prompt before execution"),
-    idleTimeoutMs: z.number().int().min(30_000).max(3_600_000).optional().describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)")
-}, async ({ prompt, model, outputFormat, sessionId, continueSession, createNewSession, allowedTools, disallowedTools, dangerouslySkipPermissions, approvalStrategy, approvalPolicy, mcpServers, strictMcpConfig, correlationId, optimizePrompt, idleTimeoutMs }) => {
+    idleTimeoutMs: z
+        .number()
+        .int()
+        .min(30_000)
+        .max(3_600_000)
+        .optional()
+        .describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)"),
+}, async ({ prompt, model, outputFormat, sessionId, continueSession, createNewSession, allowedTools, disallowedTools, dangerouslySkipPermissions, approvalStrategy, approvalPolicy, mcpServers, strictMcpConfig, correlationId, optimizePrompt, idleTimeoutMs, }) => {
     const prep = prepareClaudeRequest({
-        prompt, model, outputFormat, allowedTools, disallowedTools, dangerouslySkipPermissions,
-        approvalStrategy, approvalPolicy, mcpServers,
-        strictMcpConfig, correlationId, optimizePrompt, operation: "claude_request_async"
+        prompt,
+        model,
+        outputFormat,
+        allowedTools,
+        disallowedTools,
+        dangerouslySkipPermissions,
+        approvalStrategy,
+        approvalPolicy,
+        mcpServers,
+        strictMcpConfig,
+        correlationId,
+        optimizePrompt,
+        operation: "claude_request_async",
     });
     if (!("args" in prep))
         return prep;
@@ -1007,9 +1420,7 @@ server.tool("claude_request_async", {
             }
         }
         // Idle timeout only for stream-json (text/json produce no output until done)
-        const effectiveIdleTimeout = outputFormat === "stream-json"
-            ? resolveIdleTimeout("claude", idleTimeoutMs)
-            : undefined;
+        const effectiveIdleTimeout = outputFormat === "stream-json" ? resolveIdleTimeout("claude", idleTimeoutMs) : undefined;
         const job = asyncJobManager.startJob("claude", args, corrId, undefined, effectiveIdleTimeout, outputFormat);
         logger.info(`[${corrId}] claude_request_async started job ${job.id}, outputFormat=${outputFormat}`);
         const asyncResponse = {
@@ -1020,17 +1431,19 @@ server.tool("claude_request_async", {
             mcpServers: {
                 requested: requestedMcpServers,
                 enabled: mcpConfig?.enabled,
-                missing: mcpConfig?.missing
-            }
+                missing: mcpConfig?.missing,
+            },
         };
         if (prep.reviewIntegrity && prep.reviewIntegrity.violations.length > 0) {
             asyncResponse.reviewIntegrity = prep.reviewIntegrity;
         }
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
-                    text: JSON.stringify(asyncResponse, null, 2)
-                }]
+                    text: JSON.stringify(asyncResponse, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -1038,82 +1451,172 @@ server.tool("claude_request_async", {
     }
 });
 server.tool("codex_request_async", {
-    prompt: z.string().min(1, "Prompt cannot be empty").max(100000, "Prompt too long (max 100k chars)").describe("Prompt text for Codex"),
+    prompt: z
+        .string()
+        .min(1, "Prompt cannot be empty")
+        .max(100000, "Prompt too long (max 100k chars)")
+        .describe("Prompt text for Codex"),
     model: z.string().optional().describe("Model name or alias (e.g. gpt-5.4, latest)"),
     fullAuto: z.boolean().default(false).describe("Full-auto mode (sandboxed execution)"),
-    dangerouslyBypassApprovalsAndSandbox: z.boolean().default(false).describe("Run Codex without approvals/sandbox"),
-    approvalStrategy: z.enum(["legacy", "mcp_managed"]).default("legacy").describe("Approval strategy"),
-    approvalPolicy: z.enum(["strict", "balanced", "permissive"]).optional().describe("Approval policy override"),
-    mcpServers: z.array(MCP_SERVER_ENUM).default(["sqry"]).describe("MCP server names for approval tracking (Codex manages its own MCP config)"),
+    dangerouslyBypassApprovalsAndSandbox: z
+        .boolean()
+        .default(false)
+        .describe("Run Codex without approvals/sandbox"),
+    approvalStrategy: z
+        .enum(["legacy", "mcp_managed"])
+        .default("legacy")
+        .describe("Approval strategy"),
+    approvalPolicy: z
+        .enum(["strict", "balanced", "permissive"])
+        .optional()
+        .describe("Approval policy override"),
+    mcpServers: z
+        .array(MCP_SERVER_ENUM)
+        .default(["sqry"])
+        .describe("MCP server names for approval tracking (Codex manages its own MCP config)"),
     sessionId: z.string().optional().describe("Session ID (Codex manages internally)"),
     createNewSession: z.boolean().default(false).describe("Force new session"),
     correlationId: z.string().optional().describe("Request trace ID (auto if omitted)"),
     optimizePrompt: z.boolean().default(false).describe("Optimize prompt before execution"),
-    idleTimeoutMs: z.number().int().min(30_000).max(3_600_000).optional().describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)")
-}, async ({ prompt, model, fullAuto, dangerouslyBypassApprovalsAndSandbox, approvalStrategy, approvalPolicy, mcpServers, sessionId, createNewSession, correlationId, optimizePrompt, idleTimeoutMs }) => {
-    return handleCodexRequestAsync({ sessionManager, asyncJobManager, logger }, { prompt, model, fullAuto, dangerouslyBypassApprovalsAndSandbox, approvalStrategy, approvalPolicy, mcpServers, sessionId, createNewSession, correlationId, optimizePrompt, idleTimeoutMs });
+    idleTimeoutMs: z
+        .number()
+        .int()
+        .min(30_000)
+        .max(3_600_000)
+        .optional()
+        .describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)"),
+}, async ({ prompt, model, fullAuto, dangerouslyBypassApprovalsAndSandbox, approvalStrategy, approvalPolicy, mcpServers, sessionId, createNewSession, correlationId, optimizePrompt, idleTimeoutMs, }) => {
+    return handleCodexRequestAsync({ sessionManager, asyncJobManager, logger }, {
+        prompt,
+        model,
+        fullAuto,
+        dangerouslyBypassApprovalsAndSandbox,
+        approvalStrategy,
+        approvalPolicy,
+        mcpServers,
+        sessionId,
+        createNewSession,
+        correlationId,
+        optimizePrompt,
+        idleTimeoutMs,
+    });
 });
 server.tool("gemini_request_async", {
-    prompt: z.string().min(1, "Prompt cannot be empty").max(100000, "Prompt too long (max 100k chars)").describe("Prompt text for Gemini"),
-    model: z.string().optional().describe("Model name or alias (e.g. gemini-3-pro-preview, gemini-2.5-flash, pro, flash, latest)"),
+    prompt: z
+        .string()
+        .min(1, "Prompt cannot be empty")
+        .max(100000, "Prompt too long (max 100k chars)")
+        .describe("Prompt text for Gemini"),
+    model: z
+        .string()
+        .optional()
+        .describe("Model name or alias (e.g. gemini-3-pro-preview, gemini-2.5-flash, pro, flash, latest)"),
     sessionId: z.string().optional().describe("Session ID (user-provided CLI handle for --resume)"),
     resumeLatest: z.boolean().default(false).describe("Resume latest session"),
     createNewSession: z.boolean().default(false).describe("Force new session"),
-    approvalMode: z.enum(["default", "auto_edit", "yolo"]).optional().describe("Approval: default|auto_edit|yolo"),
-    approvalStrategy: z.enum(["legacy", "mcp_managed"]).default("legacy").describe("Approval strategy"),
-    approvalPolicy: z.enum(["strict", "balanced", "permissive"]).optional().describe("Approval policy override"),
-    mcpServers: z.array(MCP_SERVER_ENUM).default(["sqry"]).describe("MCP server names passed to Gemini as --allowed-mcp-server-names"),
-    allowedTools: z.array(z.string()).optional().describe("Allowed tools (['Write','Edit','Bash'])"),
+    approvalMode: z
+        .enum(["default", "auto_edit", "yolo"])
+        .optional()
+        .describe("Approval: default|auto_edit|yolo"),
+    approvalStrategy: z
+        .enum(["legacy", "mcp_managed"])
+        .default("legacy")
+        .describe("Approval strategy"),
+    approvalPolicy: z
+        .enum(["strict", "balanced", "permissive"])
+        .optional()
+        .describe("Approval policy override"),
+    mcpServers: z
+        .array(MCP_SERVER_ENUM)
+        .default(["sqry"])
+        .describe("MCP server names passed to Gemini as --allowed-mcp-server-names"),
+    allowedTools: z
+        .array(z.string())
+        .optional()
+        .describe("Allowed tools (['Write','Edit','Bash'])"),
     includeDirs: z.array(z.string()).optional().describe("Additional workspace directories"),
     correlationId: z.string().optional().describe("Request trace ID (auto if omitted)"),
     optimizePrompt: z.boolean().default(false).describe("Optimize prompt before execution"),
-    idleTimeoutMs: z.number().int().min(30_000).max(3_600_000).optional().describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)")
-}, async ({ prompt, model, sessionId, resumeLatest, createNewSession, approvalMode, approvalStrategy, approvalPolicy, mcpServers, allowedTools, includeDirs, correlationId, optimizePrompt, idleTimeoutMs }) => {
-    return handleGeminiRequestAsync({ sessionManager, asyncJobManager, logger }, { prompt, model, sessionId, resumeLatest, createNewSession, approvalMode, approvalStrategy, approvalPolicy, mcpServers, allowedTools, includeDirs, correlationId, optimizePrompt, idleTimeoutMs });
+    idleTimeoutMs: z
+        .number()
+        .int()
+        .min(30_000)
+        .max(3_600_000)
+        .optional()
+        .describe("Idle timeout in ms (min 30s, max 1h, omit=CLI default)"),
+}, async ({ prompt, model, sessionId, resumeLatest, createNewSession, approvalMode, approvalStrategy, approvalPolicy, mcpServers, allowedTools, includeDirs, correlationId, optimizePrompt, idleTimeoutMs, }) => {
+    return handleGeminiRequestAsync({ sessionManager, asyncJobManager, logger }, {
+        prompt,
+        model,
+        sessionId,
+        resumeLatest,
+        createNewSession,
+        approvalMode,
+        approvalStrategy,
+        approvalPolicy,
+        mcpServers,
+        allowedTools,
+        includeDirs,
+        correlationId,
+        optimizePrompt,
+        idleTimeoutMs,
+    });
 });
 server.tool("llm_job_status", {
-    jobId: z.string().describe("Async job ID from *_request_async")
+    jobId: z.string().describe("Async job ID from *_request_async"),
 }, async ({ jobId }) => {
     const job = asyncJobManager.getJobSnapshot(jobId);
     if (!job) {
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success: false,
                         error: "Job not found",
-                        jobId
-                    }, null, 2)
-                }],
-            isError: true
+                        jobId,
+                    }, null, 2),
+                },
+            ],
+            isError: true,
         };
     }
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
                 text: JSON.stringify({
                     success: true,
-                    job
-                }, null, 2)
-            }]
+                    job,
+                }, null, 2),
+            },
+        ],
     };
 });
 server.tool("llm_job_result", {
     jobId: z.string().describe("Async job ID from *_request_async"),
-    maxChars: z.number().int().min(1000).max(2000000).default(200000).describe("Max chars returned per stream")
+    maxChars: z
+        .number()
+        .int()
+        .min(1000)
+        .max(2000000)
+        .default(200000)
+        .describe("Max chars returned per stream"),
 }, async ({ jobId, maxChars }) => {
     const result = asyncJobManager.getJobResult(jobId, maxChars);
     if (!result) {
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success: false,
                         error: "Job not found",
-                        jobId
-                    }, null, 2)
-                }],
-            isError: true
+                        jobId,
+                    }, null, 2),
+                },
+            ],
+            isError: true,
         };
     }
     // Parse stream-json output for Claude async jobs
@@ -1123,50 +1626,68 @@ server.tool("llm_job_result", {
         parsed = parseStreamJson(result.stdout);
     }
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
                 text: JSON.stringify({
                     success: true,
                     result,
-                    ...(parsed ? { parsed: { text: parsed.text, costUsd: parsed.costUsd, usage: parsed.usage, model: parsed.model, numTurns: parsed.numTurns } } : {})
-                }, null, 2)
-            }]
+                    ...(parsed
+                        ? {
+                            parsed: {
+                                text: parsed.text,
+                                costUsd: parsed.costUsd,
+                                usage: parsed.usage,
+                                model: parsed.model,
+                                numTurns: parsed.numTurns,
+                            },
+                        }
+                        : {}),
+                }, null, 2),
+            },
+        ],
     };
 });
 server.tool("llm_job_cancel", {
-    jobId: z.string().describe("Async job ID from *_request_async")
+    jobId: z.string().describe("Async job ID from *_request_async"),
 }, async ({ jobId }) => {
     const cancel = asyncJobManager.cancelJob(jobId);
     if (!cancel.canceled) {
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success: false,
                         jobId,
-                        reason: cancel.reason || "Unable to cancel"
-                    }, null, 2)
-                }],
-            isError: true
+                        reason: cancel.reason || "Unable to cancel",
+                    }, null, 2),
+                },
+            ],
+            isError: true,
         };
     }
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
                 text: JSON.stringify({
                     success: true,
-                    jobId
-                }, null, 2)
-            }]
+                    jobId,
+                }, null, 2),
+            },
+        ],
     };
 });
 server.tool("llm_process_health", {}, async () => {
     const health = asyncJobManager.getJobHealth();
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
-                text: JSON.stringify({ success: true, ...health }, null, 2)
-            }]
+                text: JSON.stringify({ success: true, ...health }, null, 2),
+            },
+        ],
     };
 });
 //──────────────────────────────────────────────────────────────────────────────
@@ -1174,25 +1695,29 @@ server.tool("llm_process_health", {}, async () => {
 //──────────────────────────────────────────────────────────────────────────────
 server.tool("approval_list", {
     limit: z.number().int().min(1).max(500).default(50).describe("Max number of approval records"),
-    cli: z.enum(["claude", "codex", "gemini"]).optional().describe("Optional CLI filter")
+    cli: z.enum(["claude", "codex", "gemini"]).optional().describe("Optional CLI filter"),
 }, async ({ limit, cli }) => {
     const approvals = approvalManager.list(limit, cli);
     return {
-        content: [{
+        content: [
+            {
                 type: "text",
                 text: JSON.stringify({
                     success: true,
                     count: approvals.length,
-                    approvals
-                }, null, 2)
-            }]
+                    approvals,
+                }, null, 2),
+            },
+        ],
     };
 });
 //──────────────────────────────────────────────────────────────────────────────
 // List Models Tool
 //──────────────────────────────────────────────────────────────────────────────
 server.tool("list_models", {
-    cli: z.preprocess((value) => (value === "" || value === null ? undefined : value), z.enum(["claude", "codex", "gemini"]).optional()).describe("CLI filter (claude|codex|gemini)")
+    cli: z
+        .preprocess(value => (value === "" || value === null ? undefined : value), z.enum(["claude", "codex", "gemini"]).optional())
+        .describe("CLI filter (claude|codex|gemini)"),
 }, async ({ cli }) => {
     const cliInfo = getCliInfo();
     const result = cli ? { [cli]: cliInfo[cli] } : cliInfo;
@@ -1204,7 +1729,7 @@ server.tool("list_models", {
 server.tool("session_create", {
     cli: z.enum(["claude", "codex", "gemini"]).describe("CLI type (claude|codex|gemini)"),
     description: z.string().optional().describe("Session description"),
-    setAsActive: z.boolean().default(true).describe("Set as active session")
+    setAsActive: z.boolean().default(true).describe("Set as active session"),
 }, async ({ cli, description, setAsActive }) => {
     try {
         const session = await sessionManager.createSession(cli, description);
@@ -1213,7 +1738,8 @@ server.tool("session_create", {
         }
         logger.info(`Created new ${cli} session: ${session.id}`);
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success: true,
@@ -1222,10 +1748,11 @@ server.tool("session_create", {
                             cli: session.cli,
                             description: session.description,
                             createdAt: session.createdAt,
-                            isActive: setAsActive
-                        }
-                    }, null, 2)
-                }]
+                            isActive: setAsActive,
+                        },
+                    }, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -1233,14 +1760,17 @@ server.tool("session_create", {
     }
 });
 server.tool("session_list", {
-    cli: z.enum(["claude", "codex", "gemini"]).optional().describe("CLI filter (claude|codex|gemini)")
+    cli: z
+        .enum(["claude", "codex", "gemini"])
+        .optional()
+        .describe("CLI filter (claude|codex|gemini)"),
 }, async ({ cli }) => {
     try {
         const sessions = await sessionManager.listSessions(cli);
         const activeSessions = {
             claude: await sessionManager.getActiveSession("claude"),
             codex: await sessionManager.getActiveSession("codex"),
-            gemini: await sessionManager.getActiveSession("gemini")
+            gemini: await sessionManager.getActiveSession("gemini"),
         };
         const sessionList = sessions.map(s => ({
             id: s.id,
@@ -1248,10 +1778,11 @@ server.tool("session_list", {
             description: s.description,
             createdAt: s.createdAt,
             lastUsedAt: s.lastUsedAt,
-            isActive: activeSessions[s.cli]?.id === s.id
+            isActive: activeSessions[s.cli]?.id === s.id,
         }));
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         total: sessionList.length,
@@ -1259,10 +1790,11 @@ server.tool("session_list", {
                         activeSessions: {
                             claude: activeSessions.claude?.id || null,
                             codex: activeSessions.codex?.id || null,
-                            gemini: activeSessions.gemini?.id || null
-                        }
-                    }, null, 2)
-                }]
+                            gemini: activeSessions.gemini?.id || null,
+                        },
+                    }, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -1271,32 +1803,36 @@ server.tool("session_list", {
 });
 server.tool("session_set_active", {
     cli: z.enum(["claude", "codex", "gemini"]).describe("CLI type (claude|codex|gemini)"),
-    sessionId: z.string().nullable().describe("Session ID (null to clear)")
+    sessionId: z.string().nullable().describe("Session ID (null to clear)"),
 }, async ({ cli, sessionId }) => {
     try {
         const success = await sessionManager.setActiveSession(cli, sessionId || null);
         if (!success) {
             return {
-                content: [{
+                content: [
+                    {
                         type: "text",
                         text: JSON.stringify({
                             success: false,
-                            error: "Session not found or does not belong to the specified CLI"
-                        }, null, 2)
-                    }],
-                isError: true
+                            error: "Session not found or does not belong to the specified CLI",
+                        }, null, 2),
+                    },
+                ],
+                isError: true,
             };
         }
         logger.info(`Set active ${cli} session to: ${sessionId}`);
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success: true,
                         cli,
-                        activeSessionId: sessionId
-                    }, null, 2)
-                }]
+                        activeSessionId: sessionId,
+                    }, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -1304,36 +1840,40 @@ server.tool("session_set_active", {
     }
 });
 server.tool("session_delete", {
-    sessionId: z.string().describe("Session ID")
+    sessionId: z.string().describe("Session ID"),
 }, async ({ sessionId }) => {
     try {
         const session = await sessionManager.getSession(sessionId);
         if (!session) {
             return {
-                content: [{
+                content: [
+                    {
                         type: "text",
                         text: JSON.stringify({
                             success: false,
-                            error: "Session not found"
-                        }, null, 2)
-                    }],
-                isError: true
+                            error: "Session not found",
+                        }, null, 2),
+                    },
+                ],
+                isError: true,
             };
         }
         const success = await sessionManager.deleteSession(sessionId);
         logger.info(`Deleted session: ${sessionId}`);
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success,
                         deletedSession: {
                             id: session.id,
                             cli: session.cli,
-                            description: session.description
-                        }
-                    }, null, 2)
-                }]
+                            description: session.description,
+                        },
+                    }, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -1341,34 +1881,38 @@ server.tool("session_delete", {
     }
 });
 server.tool("session_get", {
-    sessionId: z.string().describe("Session ID")
+    sessionId: z.string().describe("Session ID"),
 }, async ({ sessionId }) => {
     try {
         const session = await sessionManager.getSession(sessionId);
         if (!session) {
             return {
-                content: [{
+                content: [
+                    {
                         type: "text",
                         text: JSON.stringify({
                             success: false,
-                            error: "Session not found"
-                        }, null, 2)
-                    }],
-                isError: true
+                            error: "Session not found",
+                        }, null, 2),
+                    },
+                ],
+                isError: true,
             };
         }
         const activeSession = await sessionManager.getActiveSession(session.cli);
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success: true,
                         session: {
                             ...session,
-                            isActive: activeSession?.id === session.id
-                        }
-                    }, null, 2)
-                }]
+                            isActive: activeSession?.id === session.id,
+                        },
+                    }, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -1376,20 +1920,25 @@ server.tool("session_get", {
     }
 });
 server.tool("session_clear_all", {
-    cli: z.enum(["claude", "codex", "gemini"]).optional().describe("CLI filter (claude|codex|gemini)")
+    cli: z
+        .enum(["claude", "codex", "gemini"])
+        .optional()
+        .describe("CLI filter (claude|codex|gemini)"),
 }, async ({ cli }) => {
     try {
         const count = await sessionManager.clearAllSessions(cli);
-        logger.info(`Cleared ${count} sessions${cli ? ` for ${cli}` : ''}`);
+        logger.info(`Cleared ${count} sessions${cli ? ` for ${cli}` : ""}`);
         return {
-            content: [{
+            content: [
+                {
                     type: "text",
                     text: JSON.stringify({
                         success: true,
                         deletedCount: count,
-                        cli: cli || "all"
-                    }, null, 2)
-                }]
+                        cli: cli || "all",
+                    }, null, 2),
+                },
+            ],
         };
     }
     catch (error) {
@@ -1423,15 +1972,17 @@ function registerHealthResource() {
         server.registerResource("health", "health://status", {
             title: "🏥 Health Status",
             description: "DB connectivity and latency",
-            mimeType: "application/json"
+            mimeType: "application/json",
         }, async () => {
             const health = await checkHealth(db);
             return {
-                contents: [{
+                contents: [
+                    {
                         uri: "health://status",
                         text: JSON.stringify(health, null, 2),
-                        mimeType: "application/json"
-                    }]
+                        mimeType: "application/json",
+                    },
+                ],
             };
         });
         logger.info("Health check resource registered");
@@ -1440,15 +1991,17 @@ function registerHealthResource() {
     server.registerResource("process-health", "metrics://process-health", {
         title: "Process Health",
         description: "Async job health (CPU, memory, zombie detection)",
-        mimeType: "application/json"
+        mimeType: "application/json",
     }, async (uri) => {
         const health = asyncJobManager.getJobHealth();
         return {
-            contents: [{
+            contents: [
+                {
                     uri: uri.href,
                     mimeType: "application/json",
-                    text: JSON.stringify(health, null, 2)
-                }]
+                    text: JSON.stringify(health, null, 2),
+                },
+            ],
         };
     });
     logger.info("Process health resource registered");
@@ -1468,6 +2021,8 @@ async function shutdown(signal) {
             await db.disconnect();
             logger.info("Database connections closed");
         }
+        flightRecorder.close();
+        logger.info("Flight recorder closed");
         process.exit(0);
     }
     catch (error) {
@@ -1492,11 +2047,9 @@ async function main() {
 }
 // Guard: only auto-start when run directly (not imported for testing)
 // Resolve symlinks so `llm-cli-gateway` (npm-linked bin) matches import.meta.url
-const __entryUrl = process.argv[1]
-    ? new URL(realpathSync(process.argv[1]), "file://").href
-    : "";
+const __entryUrl = process.argv[1] ? new URL(realpathSync(process.argv[1]), "file://").href : "";
 if (__entryUrl === import.meta.url) {
-    main().catch((error) => {
+    main().catch(error => {
         logger.error("Fatal server error:", error);
         process.exit(1);
     });