npm - gencode-ai - Versions diffs - 0.3.0 → 0.4.1 - Mend

gencode-ai 0.3.0 → 0.4.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (116) hide show

package/RELEASE_NOTES_v0.4.0.md +140 -0
package/dist/agent/agent.d.ts +17 -2
package/dist/agent/agent.d.ts.map +1 -1
package/dist/agent/agent.js +279 -49
package/dist/agent/agent.js.map +1 -1
package/dist/agent/types.d.ts +15 -1
package/dist/agent/types.d.ts.map +1 -1
package/dist/checkpointing/checkpoint-manager.d.ts +24 -0
package/dist/checkpointing/checkpoint-manager.d.ts.map +1 -1
package/dist/checkpointing/checkpoint-manager.js +28 -0
package/dist/checkpointing/checkpoint-manager.js.map +1 -1
package/dist/cli/components/App.d.ts +8 -0
package/dist/cli/components/App.d.ts.map +1 -1
package/dist/cli/components/App.js +478 -36
package/dist/cli/components/App.js.map +1 -1
package/dist/cli/components/CommandSuggestions.d.ts.map +1 -1
package/dist/cli/components/CommandSuggestions.js +2 -0
package/dist/cli/components/CommandSuggestions.js.map +1 -1
package/dist/cli/components/Header.d.ts +6 -1
package/dist/cli/components/Header.d.ts.map +1 -1
package/dist/cli/components/Header.js +3 -3
package/dist/cli/components/Header.js.map +1 -1
package/dist/cli/components/Messages.d.ts.map +1 -1
package/dist/cli/components/Messages.js +7 -9
package/dist/cli/components/Messages.js.map +1 -1
package/dist/cli/index.js +3 -2
package/dist/cli/index.js.map +1 -1
package/dist/config/types.d.ts +20 -1
package/dist/config/types.d.ts.map +1 -1
package/dist/config/types.js.map +1 -1
package/dist/index.d.ts +2 -2
package/dist/index.js +2 -2
package/dist/input/history-manager.d.ts +78 -0
package/dist/input/history-manager.d.ts.map +1 -0
package/dist/input/history-manager.js +224 -0
package/dist/input/history-manager.js.map +1 -0
package/dist/input/index.d.ts +6 -0
package/dist/input/index.d.ts.map +1 -0
package/dist/input/index.js +5 -0
package/dist/input/index.js.map +1 -0
package/dist/prompts/index.js +3 -3
package/dist/prompts/index.js.map +1 -1
package/dist/providers/gemini.d.ts.map +1 -1
package/dist/providers/gemini.js +33 -2
package/dist/providers/gemini.js.map +1 -1
package/dist/providers/google.d.ts +22 -0
package/dist/providers/google.d.ts.map +1 -0
package/dist/providers/google.js +297 -0
package/dist/providers/google.js.map +1 -0
package/dist/providers/index.d.ts +4 -4
package/dist/providers/index.js +11 -11
package/dist/providers/index.js.map +1 -1
package/dist/providers/openai.d.ts.map +1 -1
package/dist/providers/openai.js +6 -0
package/dist/providers/openai.js.map +1 -1
package/dist/providers/registry.js +3 -3
package/dist/providers/registry.js.map +1 -1
package/dist/providers/types.d.ts +30 -4
package/dist/providers/types.d.ts.map +1 -1
package/dist/session/compression/engine.d.ts +109 -0
package/dist/session/compression/engine.d.ts.map +1 -0
package/dist/session/compression/engine.js +311 -0
package/dist/session/compression/engine.js.map +1 -0
package/dist/session/compression/index.d.ts +12 -0
package/dist/session/compression/index.d.ts.map +1 -0
package/dist/session/compression/index.js +11 -0
package/dist/session/compression/index.js.map +1 -0
package/dist/session/compression/types.d.ts +90 -0
package/dist/session/compression/types.d.ts.map +1 -0
package/dist/session/compression/types.js +17 -0
package/dist/session/compression/types.js.map +1 -0
package/dist/session/manager.d.ts +64 -3
package/dist/session/manager.d.ts.map +1 -1
package/dist/session/manager.js +254 -2
package/dist/session/manager.js.map +1 -1
package/dist/session/types.d.ts +16 -0
package/dist/session/types.d.ts.map +1 -1
package/dist/session/types.js.map +1 -1
package/docs/README.md +1 -0
package/docs/diagrams/compression-decision.mmd +30 -0
package/docs/diagrams/compression-workflow.mmd +54 -0
package/docs/diagrams/layer1-pruning.mmd +45 -0
package/docs/diagrams/layer2-compaction.mmd +42 -0
package/docs/proposals/0007-context-management.md +252 -2
package/docs/proposals/README.md +4 -3
package/docs/providers.md +3 -3
package/docs/session-compression.md +695 -0
package/examples/agent-demo.ts +23 -1
package/examples/basic.ts +3 -3
package/package.json +4 -5
package/src/agent/agent.ts +314 -52
package/src/agent/types.ts +19 -1
package/src/checkpointing/checkpoint-manager.ts +48 -0
package/src/cli/components/App.tsx +553 -34
package/src/cli/components/CommandSuggestions.tsx +2 -0
package/src/cli/components/Header.tsx +16 -1
package/src/cli/components/Messages.tsx +20 -14
package/src/cli/index.tsx +3 -2
package/src/config/types.ts +26 -1
package/src/index.ts +3 -3
package/src/input/history-manager.ts +289 -0
package/src/input/index.ts +6 -0
package/src/prompts/index.test.ts +2 -1
package/src/prompts/index.ts +3 -3
package/src/providers/{gemini.ts → google.ts} +69 -18
package/src/providers/index.ts +14 -14
package/src/providers/openai.ts +7 -0
package/src/providers/registry.ts +3 -3
package/src/providers/types.ts +33 -3
package/src/session/compression/engine.ts +406 -0
package/src/session/compression/index.ts +18 -0
package/src/session/compression/types.ts +102 -0
package/src/session/manager.ts +326 -3
package/src/session/types.ts +21 -0
package/tests/input-history-manager.test.ts +335 -0
package/tests/session-checkpoint-persistence.test.ts +198 -0

package/examples/agent-demo.ts CHANGED Viewed

@@ -24,7 +24,7 @@ function getConfig() {
   } else if (process.env.OPENAI_API_KEY) {
     return { provider: 'openai' as const, model: 'gpt-4o' };
   } else if (process.env.GOOGLE_API_KEY || process.env.GEMINI_API_KEY) {
-    return { provider: 'gemini' as const, model: 'gemini-2.0-flash' };
+    return { provider: 'google' as const, model: 'gemini-2.0-flash' };
   }
   throw new Error('No API key found. Set OPENAI_API_KEY, ANTHROPIC_API_KEY, or GOOGLE_API_KEY');
 }
@@ -93,6 +93,10 @@ Use the Glob and Read tools to explore.`;
       case 'error':
         console.log(chalk.red('✗ Error:') + ` ${event.error.message}`);
+        // Display full stack trace if DEBUG is enabled
+        if (event.error.stack && process.env.DEBUG) {
+          console.log(chalk.dim(event.error.stack));
+        }
         break;
       case 'done':
@@ -101,6 +105,24 @@ Use the Glob and Read tools to explore.`;
         for (const line of respLines) {
           console.log('  ' + line);
         }
+        console.log();
+        // Display usage and cost information
+        if (event.usage) {
+          console.log(
+            chalk.dim(
+              `  Usage: ${event.usage.inputTokens} in / ${event.usage.outputTokens} out`
+            )
+          );
+        }
+        if (event.cost) {
+          console.log(chalk.dim(`  Cost: ~$${event.cost.total.toFixed(4)}`));
+        }
+        // Warn if suspicious token count
+        if (event.usage?.outputTokens === 0 && event.text) {
+          console.log(chalk.yellow('  ⚠ Warning: 0 output tokens reported but text was returned'));
+        }
         break;
     }
   }

package/examples/basic.ts CHANGED Viewed

@@ -19,7 +19,7 @@ if (proxyUrl) {
 import {
   OpenAIProvider,
   AnthropicProvider,
-  GeminiProvider,
+  GoogleProvider,
   createProvider,
   inferProvider,
   type LLMProvider,
@@ -126,7 +126,7 @@ async function main() {
   if (process.env.GOOGLE_API_KEY || process.env.GEMINI_API_KEY) {
     tests.push({
-      provider: new GeminiProvider(),
+      provider: new GoogleProvider(),
       model: 'gemini-2.0-flash',
       envKey: 'GOOGLE_API_KEY',
     });
@@ -151,7 +151,7 @@ async function main() {
   // Test createProvider factory (use first available provider)
   console.log('\n--- Factory Test ---');
   const firstProvider = tests[0];
-  const providerName = firstProvider.provider.name as 'openai' | 'anthropic' | 'gemini';
+  const providerName = firstProvider.provider.name as 'openai' | 'anthropic' | 'google';
   const factoryProvider = createProvider({ provider: providerName });
   console.log(`Created provider via factory: ${factoryProvider.name}`);

package/package.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
   "name": "gencode-ai",
-  "version": "0.3.0",
+  "version": "0.4.1",
   "description": "An open-source AI assistant for your terminal",
   "type": "module",
   "main": "dist/index.js",
   "types": "dist/index.d.ts",
   "bin": {
-    "gencode": "./dist/cli/index.js"
+    "gencode": "dist/cli/index.js"
   },
   "scripts": {
     "build": "tsc",
@@ -14,8 +14,7 @@
     "start": "node dist/cli/index.js",
     "start:dev": "npx tsx src/cli/index.tsx",
     "test": "node --experimental-vm-modules node_modules/jest/bin/jest.js",
-    "example": "npx tsx examples/basic.ts",
-    "migrate": "npx tsx scripts/migrate.ts"
+    "example": "npx tsx examples/basic.ts"
   },
   "keywords": [
     "agent",
@@ -59,4 +58,4 @@
     "tsx": "^4.21.0",
     "typescript": "^5.9.3"
   }
-}
+}

package/src/agent/agent.ts CHANGED Viewed

@@ -23,6 +23,7 @@ import {
   type ModeType,
   type AllowedPrompt,
 } from '../planning/index.js';
+import { initCheckpointManager } from '../checkpointing/index.js';
 // Type for askUser callback
 export type AskUserCallback = (questions: Question[]) => Promise<QuestionAnswer[]>;
@@ -35,7 +36,6 @@ export class Agent {
   private memoryManager: MemoryManager;
   private planModeManager: PlanModeManager;
   private config: AgentConfig;
-  private messages: Message[] = [];
   private sessionId: string | null = null;
   private loadedMemory: LoadedMemory | null = null;
   private askUserCallback: AskUserCallback | null = null;
@@ -56,9 +56,14 @@ export class Agent {
       config: config.permissions,
       projectPath: config.cwd,
     });
-    this.sessionManager = new SessionManager();
+    this.sessionManager = new SessionManager({
+      compression: config.compression,
+    });
     this.memoryManager = new MemoryManager();
     this.planModeManager = getPlanModeManager();
+    // Set compression engine with current model
+    this.sessionManager.setCompressionEngine(this.provider, this.config.model);
   }
   /**
@@ -277,6 +282,8 @@ export class Agent {
         provider: newProvider,
         authMethod: newAuthMethod,
       });
+      // Update compression engine with new provider and model
+      this.sessionManager.setCompressionEngine(this.provider, model);
     }
   }
@@ -294,6 +301,38 @@ export class Agent {
     return this.config.provider;
   }
+  /**
+   * Get model information for compression
+   */
+  getModelInfo(): { contextWindow: number; outputLimit?: number } {
+    // Try to get from provider if available
+    if (this.provider.getModelInfo) {
+      const info = this.provider.getModelInfo(this.config.model);
+      if (info.contextWindow) {
+        return { contextWindow: info.contextWindow, outputLimit: info.outputLimit };
+      }
+    }
+    // Fallback: rough estimates based on model name
+    // These should eventually be moved to provider implementations
+    const model = this.config.model.toLowerCase();
+    if (model.includes('claude')) {
+      return { contextWindow: 200_000, outputLimit: 8192 };
+    }
+    if (model.includes('gpt-4') || model.includes('gpt-3.5')) {
+      return { contextWindow: 128_000, outputLimit: 4096 };
+    }
+    if (model.includes('gemini')) {
+      return { contextWindow: 1_000_000, outputLimit: 8192 };
+    }
+    // Default fallback
+    return { contextWindow: 128_000, outputLimit: 4096 };
+  }
   /**
    * List available models from the provider API
    */
@@ -313,7 +352,9 @@ export class Agent {
     });
     this.sessionId = session.metadata.id;
-    this.messages = [];
+    // Initialize checkpoint manager for this session
+    initCheckpointManager(this.sessionId);
     return this.sessionId;
   }
@@ -328,7 +369,9 @@ export class Agent {
     }
     this.sessionId = session.metadata.id;
-    this.messages = session.messages;
+    // CheckpointManager already restored by SessionManager.load()
+    // No need to call initCheckpointManager again
     return true;
   }
@@ -343,7 +386,9 @@ export class Agent {
     }
     this.sessionId = session.metadata.id;
-    this.messages = session.messages;
+    // CheckpointManager already restored by SessionManager.load()
+    // No need to call initCheckpointManager again
     return true;
   }
@@ -382,7 +427,6 @@ export class Agent {
   async saveSession(): Promise<void> {
     const current = this.sessionManager.getCurrent();
     if (current) {
-      current.messages = this.messages;
       await this.sessionManager.save(current);
     }
   }
@@ -390,21 +434,42 @@ export class Agent {
   /**
    * Run a single query through the agent
    */
-  async *run(prompt: string): AsyncGenerator<AgentEvent, void, unknown> {
-    // Auto-create session if none exists
-    if (!this.sessionId) {
-      await this.startSession();
+  async *run(prompt: string, signal?: AbortSignal): AsyncGenerator<AgentEvent, void, unknown> {
+    // Check for abort before starting
+    if (signal?.aborted) {
+      yield { type: 'error', error: new Error('Operation cancelled') };
+      return;
     }
-    // Load memory if not already loaded
-    if (!this.loadedMemory) {
-      await this.loadMemory();
+    // Auto-create session if none exists
+    try {
+      if (!this.sessionId) {
+        await this.startSession();
+      }
+      // Load memory if not already loaded
+      if (!this.loadedMemory) {
+        await this.loadMemory();
+      }
+    } catch (error) {
+      yield {
+        type: 'error',
+        error: error instanceof Error ? error : new Error(String(error))
+      };
+      return;
     }
     // Add user message
     const userMessage: Message = { role: 'user', content: prompt };
-    this.messages.push(userMessage);
-    await this.sessionManager.addMessage(userMessage);
+    try {
+      await this.sessionManager.addMessage(userMessage, this.getModelInfo());
+    } catch (error) {
+      yield {
+        type: 'error',
+        error: new Error(`Failed to save user message: ${error instanceof Error ? error.message : String(error)}`)
+      };
+      return;
+    }
     let turns = 0;
     const maxTurns = this.config.maxTurns ?? 10;
@@ -417,6 +482,10 @@ export class Agent {
       // Call LLM
       let response;
+      const processingStartTime = Date.now();
+      // Determine if streaming is enabled
+      const useStreaming = process.env.GEN_STREAM === '1' || this.config.streaming;
       try {
         // Debug prompt loading (enabled with GENCODE_DEBUG_PROMPTS=1)
         debugPromptLoading(this.config.model, this.config.provider);
@@ -433,18 +502,145 @@ export class Agent {
             this.config.provider // Fallback provider if model lookup fails
           );
-        response = await this.provider.complete({
-          model: this.config.model,
-          messages: this.messages,
-          tools: toolDefs,
-          systemPrompt,
-          maxTokens: 4096,
-        });
+        if (useStreaming) {
+          // === STREAMING PATH ===
+          // Build response incrementally from stream chunks
+          const responseBuilder = {
+            content: [] as Array<{ type: 'text'; text: string } | { type: 'tool_use'; id: string; name: string; input: Record<string, unknown> }>,
+            textBuffer: '',
+            toolCalls: new Map<string, { id: string; name: string; inputBuffer: string }>(),
+            stopReason: 'end_turn' as 'end_turn' | 'max_tokens' | 'tool_use' | 'stop_sequence',
+            usage: undefined as { inputTokens: number; outputTokens: number } | undefined,
+            cost: undefined as { inputCost: number; outputCost: number; totalCost: number; currency: string } | undefined,
+          };
+          // Process stream chunks
+          for await (const chunk of this.provider.stream({
+            model: this.config.model,
+            messages: this.sessionManager.getMessagesForLLM(),
+            tools: toolDefs,
+            systemPrompt,
+            maxTokens: 4096,
+            signal, // Pass abort signal for cancellation
+          })) {
+            // Check for abort
+            if (signal?.aborted) {
+              yield { type: 'error', error: new Error('Operation cancelled by user') };
+              return;
+            }
+            switch (chunk.type) {
+              case 'text':
+                // Accumulate text and yield immediately for real-time display
+                responseBuilder.textBuffer += chunk.text;
+                yield { type: 'text', text: chunk.text };
+                break;
+              case 'reasoning':
+                // Forward reasoning content (o1/o3/Gemini 3+ thinking)
+                yield { type: 'reasoning_delta', text: chunk.text };
+                break;
+              case 'tool_start':
+                // Initialize tool call tracking
+                responseBuilder.toolCalls.set(chunk.id, {
+                  id: chunk.id,
+                  name: chunk.name,
+                  inputBuffer: '',
+                });
+                break;
+              case 'tool_input':
+                // Accumulate incremental JSON input and forward delta
+                const tool = responseBuilder.toolCalls.get(chunk.id);
+                if (tool) {
+                  tool.inputBuffer += chunk.input;
+                  // Emit incremental tool input for progressive display
+                  yield { type: 'tool_input_delta', id: chunk.id, delta: chunk.input };
+                }
+                break;
+              case 'done':
+                // Save final metadata
+                responseBuilder.stopReason = chunk.response.stopReason;
+                responseBuilder.usage = chunk.response.usage;
+                responseBuilder.cost = chunk.response.cost;
+                break;
+              case 'error':
+                yield { type: 'error', error: chunk.error };
+                return;
+            }
+          }
+          // Build complete response from accumulated data
+          if (responseBuilder.textBuffer) {
+            responseBuilder.content.push({
+              type: 'text',
+              text: responseBuilder.textBuffer,
+            });
+          }
+          for (const [_id, tool] of responseBuilder.toolCalls) {
+            try {
+              responseBuilder.content.push({
+                type: 'tool_use',
+                id: tool.id,
+                name: tool.name,
+                input: JSON.parse(tool.inputBuffer || '{}'),
+              });
+            } catch (error) {
+              // If JSON parsing fails, treat as malformed tool call
+              yield {
+                type: 'error',
+                error: new Error(`Failed to parse tool input for ${tool.name}: ${error instanceof Error ? error.message : String(error)}`),
+              };
+              return;
+            }
+          }
+          response = {
+            content: responseBuilder.content,
+            stopReason: responseBuilder.stopReason,
+            usage: responseBuilder.usage,
+            cost: responseBuilder.cost,
+          };
+        } else {
+          // === TRADITIONAL PATH (COMPLETE) ===
+          response = await this.provider.complete({
+            model: this.config.model,
+            messages: this.sessionManager.getMessagesForLLM(),
+            tools: toolDefs,
+            systemPrompt,
+            maxTokens: 4096,
+          });
+        }
       } catch (error) {
         yield { type: 'error', error: error as Error };
         return;
       }
+      // Validate response completeness
+      if (!response || !response.content) {
+        yield {
+          type: 'error',
+          error: new Error('Provider returned null or undefined response')
+        };
+        return;
+      }
+      // Validate content is not empty (excluding max_tokens case)
+      if (response.content.length === 0 && response.stopReason !== 'max_tokens') {
+        yield {
+          type: 'error',
+          error: new Error(
+            `Provider returned empty content (stopReason: ${response.stopReason}, ` +
+            `usage: ${JSON.stringify(response.usage)})`
+          )
+        };
+        return;
+      }
       // Process response content
       const toolCalls: Array<{ id: string; name: string; input: Record<string, unknown> }> = [];
       let textContent = '';
@@ -452,18 +648,51 @@ export class Agent {
       for (const content of response.content) {
         if (content.type === 'text') {
           textContent += content.text;
-          yield { type: 'text', text: content.text };
+          // Only yield text if not in streaming mode (streaming already yielded chunks)
+          if (!useStreaming) {
+            yield { type: 'text', text: content.text };
+          }
         } else if (content.type === 'tool_use') {
           toolCalls.push({ id: content.id, name: content.name, input: content.input });
         }
       }
       // Add assistant message and check if done
-      this.messages.push({ role: 'assistant', content: response.content });
-      await this.sessionManager.addMessage({ role: 'assistant', content: response.content });
+      try {
+        await this.sessionManager.addMessage(
+          { role: 'assistant', content: response.content },
+          this.getModelInfo()
+        );
+      } catch (error) {
+        yield {
+          type: 'error',
+          error: new Error(`Failed to save assistant message: ${error instanceof Error ? error.message : String(error)}`)
+        };
+        return;
+      }
       if (response.stopReason !== 'tool_use' || toolCalls.length === 0) {
         yield { type: 'done', text: textContent, usage: response.usage, cost: response.cost };
+        // Save completion metadata for UI restoration
+        if (response.usage || response.cost) {
+          const current = this.sessionManager.getCurrent();
+          if (current) {
+            if (!current.metadata.completions) {
+              current.metadata.completions = [];
+            }
+            current.metadata.completions.push({
+              afterMessageIndex: current.messages.length - 1,
+              durationMs: Date.now() - processingStartTime,
+              usage: response.usage ? {
+                inputTokens: response.usage.inputTokens,
+                outputTokens: response.usage.outputTokens,
+              } : undefined,
+              cost: response.cost,
+            });
+          }
+        }
         return;
       }
@@ -480,23 +709,51 @@ export class Agent {
       for (const call of toolCalls) {
         yield { type: 'tool_start', id: call.id, name: call.name, input: call.input };
-        const allowed = await this.permissions.requestPermission(call.name, call.input);
-        const result = allowed
-          ? await this.registry.execute(call.name, call.input, toolContext)
-          : { success: false, output: '', error: 'Permission denied by user' };
-        yield { type: 'tool_result', id: call.id, name: call.name, result };
-        toolResults.push({
-          type: 'tool_result',
-          toolUseId: call.id,
-          content: result.success ? result.output : (result.error ?? 'Unknown error'),
-          isError: !result.success,
-        });
+        try {
+          // Protect permission check and tool execution
+          const allowed = await this.permissions.requestPermission(call.name, call.input);
+          const result = allowed
+            ? await this.registry.execute(call.name, call.input, toolContext)
+            : { success: false, output: '', error: 'Permission denied by user' };
+          yield { type: 'tool_result', id: call.id, name: call.name, result };
+          toolResults.push({
+            type: 'tool_result',
+            toolUseId: call.id,
+            content: result.success ? result.output : (result.error ?? 'Unknown error'),
+            isError: !result.success,
+          });
+        } catch (error) {
+          // Catch permission check or tool execution errors
+          const errorMsg = error instanceof Error ? error.message : String(error);
+          const errorResult = {
+            success: false,
+            output: '',
+            error: `Tool execution error: ${errorMsg}`
+          };
+          yield { type: 'tool_result', id: call.id, name: call.name, result: errorResult };
+          toolResults.push({
+            type: 'tool_result',
+            toolUseId: call.id,
+            content: errorMsg,
+            isError: true,
+          });
+        }
       }
       // Add tool results as user message
-      this.messages.push({ role: 'user', content: toolResults });
-      await this.sessionManager.addMessage({ role: 'user', content: toolResults });
+      try {
+        await this.sessionManager.addMessage(
+          { role: 'user', content: toolResults },
+          this.getModelInfo()
+        );
+      } catch (error) {
+        yield {
+          type: 'error',
+          error: new Error(`Failed to save tool results: ${error instanceof Error ? error.message : String(error)}`)
+        };
+        return;
+      }
     }
     yield { type: 'error', error: new Error(`Max turns (${maxTurns}) exceeded`) };
@@ -506,7 +763,6 @@ export class Agent {
    * Clear conversation history
    */
   clearHistory(): void {
-    this.messages = [];
     this.sessionManager.clearMessages();
   }
@@ -515,24 +771,18 @@ export class Agent {
    * Removes the last assistant message if it contains tool_use without corresponding tool_result
    */
   cleanupIncompleteMessages(): void {
-    if (this.messages.length === 0) return;
+    const messages = this.sessionManager.getMessages();
+    if (messages.length === 0) return;
-    const lastMessage = this.messages[this.messages.length - 1];
+    const lastMessage = messages[messages.length - 1];
     // Check if last message is an assistant message with tool_use
     if (lastMessage.role === 'assistant' && Array.isArray(lastMessage.content)) {
       const hasToolUse = lastMessage.content.some((c) => c.type === 'tool_use');
       if (hasToolUse) {
-        // Remove the incomplete assistant message
-        this.messages.pop();
-        // Also remove from session manager
-        // Note: SessionManager should have corresponding cleanup method
-        const messages = this.sessionManager.getMessages();
-        if (messages.length > 0 && messages[messages.length - 1].role === 'assistant') {
-          this.sessionManager.removeLastMessage();
-        }
+        // Remove the incomplete assistant message from session manager
+        this.sessionManager.removeLastMessage();
       }
     }
   }
@@ -541,6 +791,18 @@ export class Agent {
    * Get conversation history
    */
   getHistory(): Message[] {
-    return [...this.messages];
+    return this.sessionManager.getMessages();
+  }
+  /**
+   * Get compression statistics
+   */
+  getCompressionStats(): {
+    totalMessages: number;
+    activeMessages: number;
+    summaryCount: number;
+    compressionRatio: number;
+  } | null {
+    return this.sessionManager.getCompressionStats();
   }
 }

package/src/agent/types.ts CHANGED Viewed

@@ -5,6 +5,7 @@
 import type { PermissionConfig } from '../permissions/types.js';
 import type { CostEstimate } from '../pricing/types.js';
 import type { Provider, AuthMethod } from '../providers/types.js';
+import type { CompressionConfig } from '../session/compression/types.js';
 export interface AgentConfig {
   provider: Provider;
@@ -17,6 +18,10 @@ export interface AgentConfig {
   permissions?: Partial<PermissionConfig>;
   memoryMergeStrategy?: 'fallback' | 'both' | 'gen-only' | 'claude-only';
   verbose?: boolean;
+  /** Compression configuration */
+  compression?: Partial<CompressionConfig>;
+  /** Enable LLM token streaming for real-time output */
+  streaming?: boolean;
 }
 // Agent Events
@@ -82,6 +87,17 @@ export interface AgentEventAskUser {
   }>;
 }
+export interface AgentEventReasoningDelta {
+  type: 'reasoning_delta';
+  text: string;  // Reasoning content from o1/o3/Gemini 3+ models
+}
+export interface AgentEventToolInputDelta {
+  type: 'tool_input_delta';
+  id: string;
+  delta: string;  // Incremental JSON string fragment
+}
 export type AgentEvent =
   | AgentEventText
   | AgentEventToolStart
@@ -89,4 +105,6 @@ export type AgentEvent =
   | AgentEventThinking
   | AgentEventError
   | AgentEventDone
-  | AgentEventAskUser;
+  | AgentEventAskUser
+  | AgentEventReasoningDelta
+  | AgentEventToolInputDelta;