npm - @falai/agent - Versions diffs - 1.1.3 → 1.2.1 - Mend

@falai/agent 1.1.3 → 1.2.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (193) hide show

package/README.md +9 -0
package/dist/cjs/core/Agent.d.ts +17 -1
package/dist/cjs/core/Agent.d.ts.map +1 -1
package/dist/cjs/core/Agent.js +47 -0
package/dist/cjs/core/Agent.js.map +1 -1
package/dist/cjs/core/BatchPromptBuilder.d.ts +3 -0
package/dist/cjs/core/BatchPromptBuilder.d.ts.map +1 -1
package/dist/cjs/core/BatchPromptBuilder.js +4 -1
package/dist/cjs/core/BatchPromptBuilder.js.map +1 -1
package/dist/cjs/core/CompactionEngine.d.ts +65 -0
package/dist/cjs/core/CompactionEngine.d.ts.map +1 -0
package/dist/cjs/core/CompactionEngine.js +251 -0
package/dist/cjs/core/CompactionEngine.js.map +1 -0
package/dist/cjs/core/PromptComposer.d.ts +8 -1
package/dist/cjs/core/PromptComposer.d.ts.map +1 -1
package/dist/cjs/core/PromptComposer.js +238 -126
package/dist/cjs/core/PromptComposer.js.map +1 -1
package/dist/cjs/core/PromptSectionCache.d.ts +57 -0
package/dist/cjs/core/PromptSectionCache.d.ts.map +1 -0
package/dist/cjs/core/PromptSectionCache.js +108 -0
package/dist/cjs/core/PromptSectionCache.js.map +1 -0
package/dist/cjs/core/ResponseEngine.d.ts +3 -2
package/dist/cjs/core/ResponseEngine.d.ts.map +1 -1
package/dist/cjs/core/ResponseEngine.js +8 -8
package/dist/cjs/core/ResponseEngine.js.map +1 -1
package/dist/cjs/core/ResponseModal.d.ts.map +1 -1
package/dist/cjs/core/ResponseModal.js +120 -70
package/dist/cjs/core/ResponseModal.js.map +1 -1
package/dist/cjs/core/ResponsePipeline.d.ts +2 -1
package/dist/cjs/core/ResponsePipeline.d.ts.map +1 -1
package/dist/cjs/core/ResponsePipeline.js +17 -19
package/dist/cjs/core/ResponsePipeline.js.map +1 -1
package/dist/cjs/core/RoutingEngine.d.ts +10 -0
package/dist/cjs/core/RoutingEngine.d.ts.map +1 -1
package/dist/cjs/core/RoutingEngine.js +5 -4
package/dist/cjs/core/RoutingEngine.js.map +1 -1
package/dist/cjs/core/SessionManager.d.ts.map +1 -1
package/dist/cjs/core/SessionManager.js +20 -0
package/dist/cjs/core/SessionManager.js.map +1 -1
package/dist/cjs/core/StreamingToolExecutor.d.ts +142 -0
package/dist/cjs/core/StreamingToolExecutor.d.ts.map +1 -0
package/dist/cjs/core/StreamingToolExecutor.js +455 -0
package/dist/cjs/core/StreamingToolExecutor.js.map +1 -0
package/dist/cjs/core/ToolManager.d.ts +18 -1
package/dist/cjs/core/ToolManager.d.ts.map +1 -1
package/dist/cjs/core/ToolManager.js +91 -0
package/dist/cjs/core/ToolManager.js.map +1 -1
package/dist/cjs/index.d.ts +5 -1
package/dist/cjs/index.d.ts.map +1 -1
package/dist/cjs/index.js +8 -2
package/dist/cjs/index.js.map +1 -1
package/dist/cjs/providers/AnthropicProvider.d.ts +7 -0
package/dist/cjs/providers/AnthropicProvider.d.ts.map +1 -1
package/dist/cjs/providers/AnthropicProvider.js +109 -19
package/dist/cjs/providers/AnthropicProvider.js.map +1 -1
package/dist/cjs/providers/GeminiProvider.d.ts +32 -0
package/dist/cjs/providers/GeminiProvider.d.ts.map +1 -1
package/dist/cjs/providers/GeminiProvider.js +160 -53
package/dist/cjs/providers/GeminiProvider.js.map +1 -1
package/dist/cjs/providers/OpenAIProvider.d.ts +5 -0
package/dist/cjs/providers/OpenAIProvider.d.ts.map +1 -1
package/dist/cjs/providers/OpenAIProvider.js +65 -18
package/dist/cjs/providers/OpenAIProvider.js.map +1 -1
package/dist/cjs/providers/OpenRouterProvider.d.ts +5 -0
package/dist/cjs/providers/OpenRouterProvider.d.ts.map +1 -1
package/dist/cjs/providers/OpenRouterProvider.js +57 -18
package/dist/cjs/providers/OpenRouterProvider.js.map +1 -1
package/dist/cjs/types/agent.d.ts +44 -0
package/dist/cjs/types/agent.d.ts.map +1 -1
package/dist/cjs/types/agent.js.map +1 -1
package/dist/cjs/types/ai.d.ts +2 -2
package/dist/cjs/types/ai.d.ts.map +1 -1
package/dist/cjs/types/compaction.d.ts +50 -0
package/dist/cjs/types/compaction.d.ts.map +1 -0
package/dist/cjs/types/compaction.js +6 -0
package/dist/cjs/types/compaction.js.map +1 -0
package/dist/cjs/types/index.d.ts +4 -2
package/dist/cjs/types/index.d.ts.map +1 -1
package/dist/cjs/types/index.js.map +1 -1
package/dist/cjs/types/tool.d.ts +84 -0
package/dist/cjs/types/tool.d.ts.map +1 -1
package/dist/core/Agent.d.ts +17 -1
package/dist/core/Agent.d.ts.map +1 -1
package/dist/core/Agent.js +47 -0
package/dist/core/Agent.js.map +1 -1
package/dist/core/BatchPromptBuilder.d.ts +3 -0
package/dist/core/BatchPromptBuilder.d.ts.map +1 -1
package/dist/core/BatchPromptBuilder.js +4 -1
package/dist/core/BatchPromptBuilder.js.map +1 -1
package/dist/core/CompactionEngine.d.ts +65 -0
package/dist/core/CompactionEngine.d.ts.map +1 -0
package/dist/core/CompactionEngine.js +244 -0
package/dist/core/CompactionEngine.js.map +1 -0
package/dist/core/PromptComposer.d.ts +8 -1
package/dist/core/PromptComposer.d.ts.map +1 -1
package/dist/core/PromptComposer.js +238 -126
package/dist/core/PromptComposer.js.map +1 -1
package/dist/core/PromptSectionCache.d.ts +57 -0
package/dist/core/PromptSectionCache.d.ts.map +1 -0
package/dist/core/PromptSectionCache.js +104 -0
package/dist/core/PromptSectionCache.js.map +1 -0
package/dist/core/ResponseEngine.d.ts +3 -2
package/dist/core/ResponseEngine.d.ts.map +1 -1
package/dist/core/ResponseEngine.js +8 -8
package/dist/core/ResponseEngine.js.map +1 -1
package/dist/core/ResponseModal.d.ts.map +1 -1
package/dist/core/ResponseModal.js +121 -71
package/dist/core/ResponseModal.js.map +1 -1
package/dist/core/ResponsePipeline.d.ts +2 -1
package/dist/core/ResponsePipeline.d.ts.map +1 -1
package/dist/core/ResponsePipeline.js +18 -20
package/dist/core/ResponsePipeline.js.map +1 -1
package/dist/core/RoutingEngine.d.ts +10 -0
package/dist/core/RoutingEngine.d.ts.map +1 -1
package/dist/core/RoutingEngine.js +6 -5
package/dist/core/RoutingEngine.js.map +1 -1
package/dist/core/SessionManager.d.ts.map +1 -1
package/dist/core/SessionManager.js +17 -0
package/dist/core/SessionManager.js.map +1 -1
package/dist/core/StreamingToolExecutor.d.ts +142 -0
package/dist/core/StreamingToolExecutor.d.ts.map +1 -0
package/dist/core/StreamingToolExecutor.js +448 -0
package/dist/core/StreamingToolExecutor.js.map +1 -0
package/dist/core/ToolManager.d.ts +18 -1
package/dist/core/ToolManager.d.ts.map +1 -1
package/dist/core/ToolManager.js +91 -0
package/dist/core/ToolManager.js.map +1 -1
package/dist/index.d.ts +5 -1
package/dist/index.d.ts.map +1 -1
package/dist/index.js +3 -0
package/dist/index.js.map +1 -1
package/dist/providers/AnthropicProvider.d.ts +7 -0
package/dist/providers/AnthropicProvider.d.ts.map +1 -1
package/dist/providers/AnthropicProvider.js +109 -19
package/dist/providers/AnthropicProvider.js.map +1 -1
package/dist/providers/GeminiProvider.d.ts +32 -0
package/dist/providers/GeminiProvider.d.ts.map +1 -1
package/dist/providers/GeminiProvider.js +160 -53
package/dist/providers/GeminiProvider.js.map +1 -1
package/dist/providers/OpenAIProvider.d.ts +5 -0
package/dist/providers/OpenAIProvider.d.ts.map +1 -1
package/dist/providers/OpenAIProvider.js +65 -18
package/dist/providers/OpenAIProvider.js.map +1 -1
package/dist/providers/OpenRouterProvider.d.ts +5 -0
package/dist/providers/OpenRouterProvider.d.ts.map +1 -1
package/dist/providers/OpenRouterProvider.js +57 -18
package/dist/providers/OpenRouterProvider.js.map +1 -1
package/dist/types/agent.d.ts +44 -0
package/dist/types/agent.d.ts.map +1 -1
package/dist/types/agent.js.map +1 -1
package/dist/types/ai.d.ts +2 -2
package/dist/types/ai.d.ts.map +1 -1
package/dist/types/compaction.d.ts +50 -0
package/dist/types/compaction.d.ts.map +1 -0
package/dist/types/compaction.js +5 -0
package/dist/types/compaction.js.map +1 -0
package/dist/types/index.d.ts +4 -2
package/dist/types/index.d.ts.map +1 -1
package/dist/types/index.js.map +1 -1
package/dist/types/tool.d.ts +84 -0
package/dist/types/tool.d.ts.map +1 -1
package/docs/api/overview.md +140 -0
package/docs/core/tools/enhanced-tool.md +186 -0
package/docs/core/tools/streaming-execution.md +161 -0
package/docs/guides/context-compaction.md +96 -0
package/docs/guides/prompt-optimization.md +164 -0
package/examples/advanced-patterns/context-compaction.ts +223 -0
package/examples/advanced-patterns/streaming-responses.ts +85 -7
package/examples/tools/enhanced-tool-metadata.ts +268 -0
package/examples/tools/streaming-tool-execution.ts +283 -0
package/package.json +1 -1
package/src/core/Agent.ts +58 -2
package/src/core/BatchPromptBuilder.ts +4 -1
package/src/core/CompactionEngine.ts +318 -0
package/src/core/PromptComposer.ts +259 -156
package/src/core/PromptSectionCache.ts +136 -0
package/src/core/ResponseEngine.ts +7 -11
package/src/core/ResponseModal.ts +133 -83
package/src/core/ResponsePipeline.ts +22 -22
package/src/core/RoutingEngine.ts +16 -5
package/src/core/SessionManager.ts +19 -0
package/src/core/StreamingToolExecutor.ts +572 -0
package/src/core/ToolManager.ts +151 -41
package/src/index.ts +14 -0
package/src/providers/AnthropicProvider.ts +121 -24
package/src/providers/GeminiProvider.ts +174 -54
package/src/providers/OpenAIProvider.ts +77 -25
package/src/providers/OpenRouterProvider.ts +68 -25
package/src/types/agent.ts +45 -0
package/src/types/ai.ts +2 -2
package/src/types/compaction.ts +52 -0
package/src/types/index.ts +35 -14
package/src/types/tool.ts +108 -0

package/src/core/Agent.ts CHANGED Viewed

@@ -18,6 +18,7 @@ import type {
   ValidationError,
   ValidationResult,
   AiProvider,
+  CompactionOptions,
 } from "../types";
 import { CompositionMode } from "../types";
 import type { StreamOptions, GenerateOptions, RespondParams } from "./ResponseModal";
@@ -35,9 +36,11 @@ import { Step } from "./Step";
 import { PersistenceManager } from "./PersistenceManager";
 import { SessionManager } from "./SessionManager";
 import { RoutingEngine } from "./RoutingEngine";
+import { PromptSectionCache } from "./PromptSectionCache";
 import { ResponseModal } from "./ResponseModal";
 import { ToolManager } from "./ToolManager";
+import { CompactionEngine } from "./CompactionEngine";
 /**
  * Error thrown when data validation fails
@@ -78,6 +81,8 @@ export class Agent<TContext = any, TData = any> {
   private _knowledgeBase: Record<string, unknown> = {};
   private _schema?: StructuredSchema;
   private _collectedData: Partial<TData> = {};
+  private _compactionOptions?: CompactionOptions;
+  private _promptSectionCache: PromptSectionCache;
   /** Public session manager for easy session management */
   public session: SessionManager<TData>;
@@ -125,9 +130,14 @@ export class Agent<TContext = any, TData = any> {
     // Initialize current session if provided
     this._currentSession = options.session;
+    // Initialize prompt section cache
+    this._promptSectionCache = new PromptSectionCache(options.promptCache);
     // Initialize routing engine
     this._routingEngine = new RoutingEngine<TContext, TData>({
       routeSwitchMargin: options.routeSwitchMargin,
+      onRouteSwitch: () => this.invalidateRouteSections(),
+      promptSectionCache: this._promptSectionCache,
     });
     // Initialize ResponseModal for handling all response generation
@@ -205,6 +215,20 @@ export class Agent<TContext = any, TData = any> {
       this._knowledgeBase = { ...options.knowledgeBase };
     }
+    // Initialize compaction options if configured
+    if (options.compaction && options.compaction.enabled !== false) {
+      const compactionOptions: CompactionOptions = {
+        maxTokens: options.compaction.maxTokens,
+        compactionThreshold: options.compaction.compactionThreshold ?? 0.8,
+        preserveRecentCount: options.compaction.preserveRecentCount ?? 4,
+        maxToolResultChars: options.compaction.maxToolResultChars ?? 5000,
+        provider: options.provider,
+      };
+      CompactionEngine.validateOptions(compactionOptions);
+      this._compactionOptions = compactionOptions;
+      logger.debug("[Agent] Compaction options initialized and validated");
+    }
     // Initialize session manager with reference to this agent for bidirectional sync
     this.session = new SessionManager<TData>(this._persistenceManager, this);
@@ -505,6 +529,13 @@ export class Agent<TContext = any, TData = any> {
     this.options.routeSwitchMargin = value;
   }
+  /**
+   * Get the prompt section cache instance
+   */
+  get promptSectionCache(): PromptSectionCache {
+    return this._promptSectionCache;
+  }
   /**
    * Get the maximum steps per batch
    * @default 1
@@ -620,6 +651,7 @@ export class Agent<TContext = any, TData = any> {
    */
   set currentSession(value: SessionState | undefined) {
     this._currentSession = value;
+    this._promptSectionCache.invalidateAll();
   }
   // ---------------------------------------------------------------------------
@@ -705,6 +737,7 @@ export class Agent<TContext = any, TData = any> {
    */
   setCurrentSession(session: SessionState): void {
     this.currentSession = session;
+    this._promptSectionCache.invalidateAll();
   }
   /**
@@ -713,6 +746,18 @@ export class Agent<TContext = any, TData = any> {
    */
   clearCurrentSession(): void {
     this._currentSession = undefined;
+    this._promptSectionCache.invalidateAll();
+  }
+  /**
+   * Invalidate route-dependent prompt cache sections.
+   * Called automatically when the active route changes.
+   */
+  invalidateRouteSections(): void {
+    this._promptSectionCache.invalidate('activeRoutes');
+    this._promptSectionCache.invalidate('routeRules');
+    this._promptSectionCache.invalidate('routeProhibitions');
+    this._promptSectionCache.invalidate('routeKnowledgeBase');
   }
   /**
@@ -729,6 +774,13 @@ export class Agent<TContext = any, TData = any> {
     return this._persistenceManager !== undefined;
   }
+  /**
+   * Get the resolved compaction options (if compaction is configured)
+   */
+  getCompactionOptions(): CompactionOptions | undefined {
+    return this._compactionOptions;
+  }
   // ---------------------------------------------------------------------------
   // Core methods
   // ---------------------------------------------------------------------------
@@ -876,6 +928,10 @@ export class Agent<TContext = any, TData = any> {
     if (this.options.hooks?.onContextUpdate && previousContext !== undefined) {
       await this.options.hooks.onContextUpdate(this._context, previousContext);
     }
+    // Invalidate context-dependent prompt cache sections
+    this._promptSectionCache.invalidate('agentMeta');
+    this._promptSectionCache.invalidate('knowledgeBase');
   }
   /**
@@ -939,7 +995,7 @@ export class Agent<TContext = any, TData = any> {
   /**
    * Generate a response based on history and context as a stream
    */
-  async *respondStream(params: RespondParams<TContext, TData>): AsyncGenerator<AgentResponseStreamChunk<TData>> {
+  async * respondStream(params: RespondParams<TContext, TData>): AsyncGenerator<AgentResponseStreamChunk<TData>> {
     // Delegate to ResponseModal
     yield* this._responseModal.respondStream(params);
   }
@@ -1210,7 +1266,7 @@ export class Agent<TContext = any, TData = any> {
    * Modern streaming API - simple interface like chat() but returns a stream
    * Automatically manages conversation history through the session
    */
-  async *stream(
+  async * stream(
     message?: string,
     options?: StreamOptions<TContext>
   ): AsyncGenerator<AgentResponseStreamChunk<TData>> {

package/src/core/BatchPromptBuilder.ts CHANGED Viewed

@@ -14,6 +14,7 @@ import type { Event } from '../types/history';
 import type { Route } from './Route';
 import { render, renderMany, createTemplateContext } from '../utils/template';
 import { PromptComposer } from './PromptComposer';
+import type { PromptSectionCache } from './PromptSectionCache';
 /**
  * Parameters for building a batch prompt
@@ -56,6 +57,8 @@ export interface BatchPromptResult {
  * **Validates: Requirements 4.1, 4.2, 4.3, 4.4**
  */
 export class BatchPromptBuilder<TContext = unknown, TData = unknown> {
+  constructor(private readonly promptSectionCache?: PromptSectionCache) { }
   /**
    * Build a combined prompt for a batch of Steps
    *
@@ -89,7 +92,7 @@ export class BatchPromptBuilder<TContext = unknown, TData = unknown> {
     }
     // Build the combined prompt using PromptComposer for consistency
-    const composer = new PromptComposer<TContext, TData>(templateContext);
+    const composer = new PromptComposer<TContext, TData>(templateContext, this.promptSectionCache);
     // Add agent meta information
     await composer.addAgentMeta(agentOptions);

package/src/core/CompactionEngine.ts ADDED Viewed

@@ -0,0 +1,318 @@
+/**
+ * CompactionEngine - Manages conversation history size through multi-layered compaction strategies.
+ *
+ * Strategies are applied in order of cost:
+ * 1. none - history is under threshold, no action needed
+ * 2. tool_result_budget - truncate oversized tool results (no LLM call)
+ * 3. micro_compact - compress verbose tool outputs inline (no LLM call)
+ * 4. auto_compact - summarize old messages via LLM provider
+ */
+import log from "loglevel";
+import type { HistoryItem } from "../types/history";
+import type { CompactionOptions, CompactionResult } from "../types/compaction";
+export class CompactionEngine {
+    /**
+     * Validate CompactionOptions. Throws on invalid values.
+     */
+    static validateOptions(options: CompactionOptions): void {
+        if (
+            typeof options.compactionThreshold !== "number" ||
+            options.compactionThreshold < 0.5 ||
+            options.compactionThreshold > 0.95
+        ) {
+            throw new Error(
+                `compactionThreshold must be between 0.5 and 0.95, got ${options.compactionThreshold}`
+            );
+        }
+        if (
+            typeof options.preserveRecentCount !== "number" ||
+            options.preserveRecentCount < 2
+        ) {
+            throw new Error(
+                `preserveRecentCount must be >= 2, got ${options.preserveRecentCount}`
+            );
+        }
+        if (
+            typeof options.maxToolResultChars !== "number" ||
+            options.maxToolResultChars <= 0
+        ) {
+            throw new Error(
+                `maxToolResultChars must be > 0, got ${options.maxToolResultChars}`
+            );
+        }
+    }
+    /**
+     * Estimate token count using a character-based heuristic (~4 chars/token).
+     *
+     * For each HistoryItem: count content length + name length (if present) + 4 (role overhead).
+     * Returns Math.ceil(totalChars / 4). Empty history returns 0.
+     * Deterministic for the same input.
+     */
+    static estimateTokens(history: HistoryItem[]): number {
+        if (history.length === 0) return 0;
+        let totalChars = 0;
+        for (const item of history) {
+            const content = item.content;
+            const contentLength =
+                typeof content === "string" ? content.length : JSON.stringify(content ?? "").length;
+            totalChars += contentLength;
+            if ("name" in item && typeof item.name === "string") {
+                totalChars += item.name.length;
+            }
+            totalChars += 4; // role overhead
+        }
+        return Math.ceil(totalChars / 4);
+    }
+    /**
+     * Truncate tool results that exceed the per-message character budget.
+     *
+     * For HistoryItem with role === 'tool' whose content exceeds maxChars,
+     * truncate to maxChars and append truncation notice.
+     * Items within budget are returned unchanged.
+     */
+    static applyToolResultBudget(
+        history: HistoryItem[],
+        maxCharsPerResult: number
+    ): HistoryItem[] {
+        return history.map((item) => {
+            if (item.role !== "tool") return item;
+            const contentStr =
+                typeof item.content === "string"
+                    ? item.content
+                    : JSON.stringify(item.content ?? "");
+            const totalChars = contentStr.length;
+            if (totalChars <= maxCharsPerResult) return item;
+            const preview = contentStr.slice(0, maxCharsPerResult);
+            const truncatedContent = `${preview}\n\n[Truncated: ${totalChars} chars total, showing first ${maxCharsPerResult}]`;
+            return { ...item, content: truncatedContent };
+        });
+    }
+    /**
+     * Micro-compact: compress verbose tool outputs inline.
+     * Strips excessive whitespace and shortens JSON-like content in tool results.
+     * Preserves the last `preserveCount` messages unchanged.
+     */
+    private static microCompact(
+        history: HistoryItem[],
+        preserveCount: number
+    ): HistoryItem[] {
+        const cutoff = Math.max(0, history.length - preserveCount);
+        const compactable = history.slice(0, cutoff);
+        const preserved = history.slice(cutoff);
+        const compacted = compactable.map((item) => {
+            if (item.role !== "tool") return item;
+            const contentStr =
+                typeof item.content === "string"
+                    ? item.content
+                    : JSON.stringify(item.content ?? "");
+            // Strip excessive whitespace: collapse runs of whitespace to single space
+            const compressed = contentStr
+                .replace(/\s+/g, " ")
+                .trim();
+            return { ...item, content: compressed };
+        });
+        return [...compacted, ...preserved];
+    }
+    /**
+     * Count how many messages differ between original and compacted history.
+     */
+    private static countDifferences(
+        original: HistoryItem[],
+        compacted: HistoryItem[]
+    ): number {
+        let count = 0;
+        const len = Math.min(original.length, compacted.length);
+        for (let i = 0; i < len; i++) {
+            if (original[i] !== compacted[i]) count++;
+        }
+        // If lengths differ, count the extra messages
+        count += Math.abs(original.length - compacted.length);
+        return count;
+    }
+    /**
+     * Summarize old messages via LLM provider.
+     * On failure, returns null (caller should fall back).
+     */
+    private static async summarizeMessages(
+        messages: HistoryItem[],
+        options: CompactionOptions
+    ): Promise<string | null> {
+        try {
+            const messagesText = messages
+                .map((m) => {
+                    const content =
+                        typeof m.content === "string"
+                            ? m.content
+                            : JSON.stringify(m.content ?? "");
+                    return `[${m.role}]: ${content}`;
+                })
+                .join("\n");
+            const result = await options.provider.generateMessage({
+                prompt: `Summarize the following conversation concisely, preserving key facts, decisions, and context:\n\n${messagesText}`,
+                history: [],
+                context: {},
+                parameters: {
+                    maxOutputTokens: 1024,
+                    jsonSchema: {},
+                },
+            });
+            return result.message;
+        } catch {
+            return null;
+        }
+    }
+    /**
+     * Aggressive truncation fallback: remove oldest messages (no LLM needed).
+     * Keeps only the most recent messages that fit within the token budget.
+     */
+    private static aggressiveTruncate(
+        history: HistoryItem[],
+        options: CompactionOptions
+    ): HistoryItem[] {
+        const threshold = options.maxTokens * options.compactionThreshold;
+        const preserveCount = options.preserveRecentCount;
+        // Always preserve the last preserveRecentCount messages
+        const preserved = history.slice(-preserveCount);
+        // Try to keep as many older messages as fit within budget
+        const older = history.slice(0, -preserveCount);
+        const result: HistoryItem[] = [];
+        // Add older messages from most recent backwards until we'd exceed budget
+        for (let i = older.length - 1; i >= 0; i--) {
+            const candidate = [older[i], ...result, ...preserved];
+            if (CompactionEngine.estimateTokens(candidate) < threshold) {
+                result.unshift(older[i]);
+            } else {
+                break;
+            }
+        }
+        return [...result, ...preserved];
+    }
+    /**
+     * Multi-layered compaction strategy.
+     *
+     * Layer 1 (none): If estimatedTokens < maxTokens * compactionThreshold, return unchanged
+     * Layer 2 (tool_result_budget): Apply applyToolResultBudget, check if under threshold
+     * Layer 3 (micro_compact): Compress verbose tool outputs inline
+     * Layer 4 (auto_compact): Summarize old messages via LLM provider
+     *
+     * The last `preserveRecentCount` messages are NEVER modified or removed.
+     */
+    static async checkAndCompact(
+        history: HistoryItem[],
+        options: CompactionOptions
+    ): Promise<CompactionResult> {
+        CompactionEngine.validateOptions(options);
+        const threshold = options.maxTokens * options.compactionThreshold;
+        const estimatedTokens = CompactionEngine.estimateTokens(history);
+        // Layer 1: No compaction needed
+        if (estimatedTokens < threshold) {
+            return {
+                history,
+                strategy: "none",
+                estimatedTokens,
+                messagesCompacted: 0,
+            };
+        }
+        // Layer 2: Tool result budgeting (cheapest — no LLM call)
+        // Apply budget but preserve recent messages
+        const preserveCount = Math.min(options.preserveRecentCount, history.length);
+        const cutoff2 = Math.max(0, history.length - preserveCount);
+        const budgeted = [
+            ...CompactionEngine.applyToolResultBudget(
+                history.slice(0, cutoff2),
+                options.maxToolResultChars
+            ),
+            ...history.slice(cutoff2),
+        ];
+        let newEstimate = CompactionEngine.estimateTokens(budgeted);
+        if (newEstimate < threshold) {
+            return {
+                history: budgeted,
+                strategy: "tool_result_budget",
+                estimatedTokens: newEstimate,
+                messagesCompacted: CompactionEngine.countDifferences(history, budgeted),
+            };
+        }
+        // Layer 3: Micro-compaction (compress verbose tool outputs)
+        const microCompacted = CompactionEngine.microCompact(budgeted, preserveCount);
+        newEstimate = CompactionEngine.estimateTokens(microCompacted);
+        if (newEstimate < threshold) {
+            return {
+                history: microCompacted,
+                strategy: "micro_compact",
+                estimatedTokens: newEstimate,
+                messagesCompacted: CompactionEngine.countDifferences(
+                    history,
+                    microCompacted
+                ),
+            };
+        }
+        // Layer 4: Auto-compact (summarize old messages via LLM)
+        const oldMessages = microCompacted.slice(0, -preserveCount);
+        const recentMessages = microCompacted.slice(-preserveCount);
+        const summary = await CompactionEngine.summarizeMessages(
+            oldMessages,
+            options
+        );
+        if (summary !== null) {
+            const summaryItem: HistoryItem = {
+                role: "system",
+                content: `[Conversation Summary]\n${summary}`,
+            };
+            const finalHistory = [summaryItem, ...recentMessages];
+            return {
+                history: finalHistory,
+                strategy: "auto_compact",
+                estimatedTokens: CompactionEngine.estimateTokens(finalHistory),
+                messagesCompacted: oldMessages.length,
+                summary,
+            };
+        }
+        // Fallback: LLM summarization failed — aggressive truncation
+        log.warn(
+            "CompactionEngine: LLM summarization failed, falling back to aggressive truncation"
+        );
+        const truncated = CompactionEngine.aggressiveTruncate(
+            microCompacted,
+            options
+        );
+        return {
+            history: truncated,
+            strategy: "auto_compact",
+            estimatedTokens: CompactionEngine.estimateTokens(truncated),
+            messagesCompacted: history.length - truncated.length,
+        };
+    }
+}