npm - @machina.ai/cell-cli-core - Versions diffs - 1.8.2-rc1 → 1.10.0-rc1 - Mend

@machina.ai/cell-cli-core 1.8.2-rc1 → 1.10.0-rc1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (237) hide show

package/dist/index.d.ts +1 -1
package/dist/index.js +1 -1
package/dist/index.js.map +1 -1
package/dist/package.json +1 -1
package/dist/src/agents/codebase-investigator.d.ts +36 -1
package/dist/src/agents/codebase-investigator.js +93 -31
package/dist/src/agents/codebase-investigator.js.map +1 -1
package/dist/src/agents/executor.d.ts +15 -11
package/dist/src/agents/executor.js +265 -103
package/dist/src/agents/executor.js.map +1 -1
package/dist/src/agents/executor.test.js +493 -232
package/dist/src/agents/executor.test.js.map +1 -1
package/dist/src/agents/invocation.d.ts +5 -2
package/dist/src/agents/invocation.js +4 -2
package/dist/src/agents/invocation.js.map +1 -1
package/dist/src/agents/invocation.test.js +9 -0
package/dist/src/agents/invocation.test.js.map +1 -1
package/dist/src/agents/registry.d.ts +2 -1
package/dist/src/agents/registry.js +24 -1
package/dist/src/agents/registry.js.map +1 -1
package/dist/src/agents/subagent-tool-wrapper.d.ts +3 -1
package/dist/src/agents/subagent-tool-wrapper.js +4 -3
package/dist/src/agents/subagent-tool-wrapper.js.map +1 -1
package/dist/src/agents/subagent-tool-wrapper.test.js +8 -1
package/dist/src/agents/subagent-tool-wrapper.test.js.map +1 -1
package/dist/src/agents/types.d.ts +35 -6
package/dist/src/agents/types.js +1 -0
package/dist/src/agents/types.js.map +1 -1
package/dist/src/code_assist/oauth-credential-storage.js +1 -1
package/dist/src/code_assist/oauth-credential-storage.js.map +1 -1
package/dist/src/code_assist/oauth-credential-storage.test.js +1 -1
package/dist/src/code_assist/oauth-credential-storage.test.js.map +1 -1
package/dist/src/code_assist/oauth2.test.js +14 -13
package/dist/src/code_assist/oauth2.test.js.map +1 -1
package/dist/src/code_assist/setup.js +4 -2
package/dist/src/code_assist/setup.js.map +1 -1
package/dist/src/config/config.d.ts +48 -9
package/dist/src/config/config.js +91 -16
package/dist/src/config/config.js.map +1 -1
package/dist/src/config/config.test.js +67 -3
package/dist/src/config/config.test.js.map +1 -1
package/dist/src/config/storage.d.ts +0 -1
package/dist/src/config/storage.js +2 -2
package/dist/src/config/storage.js.map +1 -1
package/dist/src/config/storage.test.js +7 -6
package/dist/src/config/storage.test.js.map +1 -1
package/dist/src/core/client.d.ts +3 -1
package/dist/src/core/client.js +67 -17
package/dist/src/core/client.js.map +1 -1
package/dist/src/core/client.test.js +199 -5
package/dist/src/core/client.test.js.map +1 -1
package/dist/src/core/contentGenerator.js +3 -1
package/dist/src/core/contentGenerator.js.map +1 -1
package/dist/src/core/coreToolScheduler.js +12 -12
package/dist/src/core/coreToolScheduler.js.map +1 -1
package/dist/src/core/coreToolScheduler.test.js +227 -0
package/dist/src/core/coreToolScheduler.test.js.map +1 -1
package/dist/src/core/geminiChat.d.ts +7 -11
package/dist/src/core/geminiChat.js +32 -70
package/dist/src/core/geminiChat.js.map +1 -1
package/dist/src/core/geminiChat.test.js +93 -228
package/dist/src/core/geminiChat.test.js.map +1 -1
package/dist/src/core/logger.test.js +2 -2
package/dist/src/core/logger.test.js.map +1 -1
package/dist/src/core/nonInteractiveToolExecutor.d.ts +3 -2
package/dist/src/core/nonInteractiveToolExecutor.js +2 -2
package/dist/src/core/nonInteractiveToolExecutor.js.map +1 -1
package/dist/src/core/nonInteractiveToolExecutor.test.js +8 -8
package/dist/src/core/nonInteractiveToolExecutor.test.js.map +1 -1
package/dist/src/core/prompts.d.ts +2 -1
package/dist/src/core/prompts.js +51 -110
package/dist/src/core/prompts.js.map +1 -1
package/dist/src/core/prompts.test.js +83 -29
package/dist/src/core/prompts.test.js.map +1 -1
package/dist/src/core/subagent.js +1 -1
package/dist/src/core/subagent.js.map +1 -1
package/dist/src/core/subagent.test.js +38 -12
package/dist/src/core/subagent.test.js.map +1 -1
package/dist/src/core/turn.d.ts +14 -2
package/dist/src/core/turn.js +12 -1
package/dist/src/core/turn.js.map +1 -1
package/dist/src/core/turn.test.js +14 -2
package/dist/src/core/turn.test.js.map +1 -1
package/dist/src/generated/git-commit.d.ts +2 -2
package/dist/src/generated/git-commit.js +2 -2
package/dist/src/generated/git-commit.js.map +1 -1
package/dist/src/ide/detect-ide.test.js +11 -0
package/dist/src/ide/detect-ide.test.js.map +1 -1
package/dist/src/ide/ide-client.js +3 -3
package/dist/src/ide/ide-client.test.js +4 -4
package/dist/src/ide/ide-installer.js +1 -1
package/dist/src/ide/ide-installer.js.map +1 -1
package/dist/src/ide/ide-installer.test.js +13 -1
package/dist/src/ide/ide-installer.test.js.map +1 -1
package/dist/src/ide/process-utils.js +85 -75
package/dist/src/ide/process-utils.js.map +1 -1
package/dist/src/ide/process-utils.test.js +83 -90
package/dist/src/ide/process-utils.test.js.map +1 -1
package/dist/src/index.d.ts +2 -0
package/dist/src/index.js +2 -0
package/dist/src/index.js.map +1 -1
package/dist/src/mcp/token-storage/file-token-storage.js +2 -1
package/dist/src/mcp/token-storage/file-token-storage.js.map +1 -1
package/dist/src/mcp/token-storage/file-token-storage.test.js +4 -3
package/dist/src/mcp/token-storage/file-token-storage.test.js.map +1 -1
package/dist/src/services/chatRecordingService.d.ts +2 -1
package/dist/src/services/chatRecordingService.js +2 -1
package/dist/src/services/chatRecordingService.js.map +1 -1
package/dist/src/services/shellExecutionService.d.ts +1 -0
package/dist/src/services/shellExecutionService.js +144 -69
package/dist/src/services/shellExecutionService.js.map +1 -1
package/dist/src/services/shellExecutionService.test.js +61 -1
package/dist/src/services/shellExecutionService.test.js.map +1 -1
package/dist/src/telemetry/clearcut-logger/clearcut-logger.d.ts +14 -2
package/dist/src/telemetry/clearcut-logger/clearcut-logger.js +104 -8
package/dist/src/telemetry/clearcut-logger/clearcut-logger.js.map +1 -1
package/dist/src/telemetry/clearcut-logger/clearcut-logger.test.js +81 -1
package/dist/src/telemetry/clearcut-logger/clearcut-logger.test.js.map +1 -1
package/dist/src/telemetry/clearcut-logger/event-metadata-key.d.ts +13 -3
package/dist/src/telemetry/clearcut-logger/event-metadata-key.js +32 -5
package/dist/src/telemetry/clearcut-logger/event-metadata-key.js.map +1 -1
package/dist/src/telemetry/constants.d.ts +0 -28
package/dist/src/telemetry/constants.js +0 -29
package/dist/src/telemetry/constants.js.map +1 -1
package/dist/src/telemetry/index.d.ts +5 -3
package/dist/src/telemetry/index.js +11 -4
package/dist/src/telemetry/index.js.map +1 -1
package/dist/src/telemetry/loggers.d.ts +8 -2
package/dist/src/telemetry/loggers.js +165 -299
package/dist/src/telemetry/loggers.js.map +1 -1
package/dist/src/telemetry/loggers.test.js +195 -7
package/dist/src/telemetry/loggers.test.js.map +1 -1
package/dist/src/telemetry/memory-monitor.d.ts +149 -0
package/dist/src/telemetry/memory-monitor.js +335 -0
package/dist/src/telemetry/memory-monitor.js.map +1 -0
package/dist/src/telemetry/memory-monitor.test.d.ts +6 -0
package/dist/src/telemetry/memory-monitor.test.js +472 -0
package/dist/src/telemetry/memory-monitor.test.js.map +1 -0
package/dist/src/telemetry/metrics.d.ts +131 -4
package/dist/src/telemetry/metrics.js +182 -6
package/dist/src/telemetry/metrics.js.map +1 -1
package/dist/src/telemetry/metrics.test.js +360 -1
package/dist/src/telemetry/metrics.test.js.map +1 -1
package/dist/src/telemetry/telemetryAttributes.d.ts +8 -0
package/dist/src/telemetry/telemetryAttributes.js +18 -0
package/dist/src/telemetry/telemetryAttributes.js.map +1 -0
package/dist/src/telemetry/types.d.ts +150 -3
package/dist/src/telemetry/types.js +664 -33
package/dist/src/telemetry/types.js.map +1 -1
package/dist/src/telemetry/uiTelemetry.d.ts +1 -1
package/dist/src/telemetry/uiTelemetry.js +1 -1
package/dist/src/telemetry/uiTelemetry.js.map +1 -1
package/dist/src/telemetry/uiTelemetry.test.js +1 -1
package/dist/src/telemetry/uiTelemetry.test.js.map +1 -1
package/dist/src/tools/glob.js +2 -1
package/dist/src/tools/glob.js.map +1 -1
package/dist/src/tools/mcp-client.d.ts +3 -2
package/dist/src/tools/mcp-client.js +29 -33
package/dist/src/tools/mcp-client.js.map +1 -1
package/dist/src/tools/mcp-client.test.js +168 -5
package/dist/src/tools/mcp-client.test.js.map +1 -1
package/dist/src/tools/memoryTool.d.ts +1 -1
package/dist/src/tools/memoryTool.js +1 -2
package/dist/src/tools/memoryTool.js.map +1 -1
package/dist/src/tools/memoryTool.test.js +9 -8
package/dist/src/tools/memoryTool.test.js.map +1 -1
package/dist/src/tools/shell.js +55 -2
package/dist/src/tools/shell.js.map +1 -1
package/dist/src/tools/shell.test.js +2 -1
package/dist/src/tools/shell.test.js.map +1 -1
package/dist/src/tools/smart-edit.d.ts +1 -20
package/dist/src/tools/smart-edit.js +57 -55
package/dist/src/tools/smart-edit.js.map +1 -1
package/dist/src/tools/smart-edit.test.js +70 -86
package/dist/src/tools/smart-edit.test.js.map +1 -1
package/dist/src/tools/tool-error.d.ts +21 -0
package/dist/src/tools/tool-error.js +27 -0
package/dist/src/tools/tool-error.js.map +1 -1
package/dist/src/tools/tool-names.d.ts +9 -0
package/dist/src/tools/tool-names.js +18 -0
package/dist/src/tools/tool-names.js.map +1 -0
package/dist/src/tools/web-fetch.d.ts +7 -0
package/dist/src/tools/web-fetch.js +42 -10
package/dist/src/tools/web-fetch.js.map +1 -1
package/dist/src/tools/web-fetch.test.js +127 -8
package/dist/src/tools/web-fetch.test.js.map +1 -1
package/dist/src/tools/web-search.js +2 -1
package/dist/src/tools/web-search.js.map +1 -1
package/dist/src/tools/write-file.js +2 -1
package/dist/src/tools/write-file.js.map +1 -1
package/dist/src/tools/write-todos.d.ts +1 -1
package/dist/src/tools/write-todos.js +4 -3
package/dist/src/tools/write-todos.js.map +1 -1
package/dist/src/utils/editCorrector.js +2 -2
package/dist/src/utils/editCorrector.js.map +1 -1
package/dist/src/utils/editor.js +1 -0
package/dist/src/utils/editor.js.map +1 -1
package/dist/src/utils/editor.test.js +1 -0
package/dist/src/utils/editor.test.js.map +1 -1
package/dist/src/utils/formatters.d.ts +1 -0
package/dist/src/utils/formatters.js +2 -1
package/dist/src/utils/formatters.js.map +1 -1
package/dist/src/utils/formatters.test.d.ts +6 -0
package/dist/src/utils/formatters.test.js +26 -0
package/dist/src/utils/formatters.test.js.map +1 -0
package/dist/src/utils/getFolderStructure.test.js +7 -6
package/dist/src/utils/getFolderStructure.test.js.map +1 -1
package/dist/src/utils/installationManager.test.js +2 -1
package/dist/src/utils/installationManager.test.js.map +1 -1
package/dist/src/utils/llm-edit-fixer.js +3 -3
package/dist/src/utils/memoryDiscovery.d.ts +1 -0
package/dist/src/utils/memoryDiscovery.js +2 -1
package/dist/src/utils/memoryDiscovery.js.map +1 -1
package/dist/src/utils/memoryDiscovery.test.js +99 -21
package/dist/src/utils/memoryDiscovery.test.js.map +1 -1
package/dist/src/utils/pathCorrector.d.ts +25 -0
package/dist/src/utils/pathCorrector.js +33 -0
package/dist/src/utils/pathCorrector.js.map +1 -0
package/dist/src/utils/pathCorrector.test.d.ts +6 -0
package/dist/src/utils/pathCorrector.test.js +83 -0
package/dist/src/utils/pathCorrector.test.js.map +1 -0
package/dist/src/utils/retry.d.ts +2 -1
package/dist/src/utils/retry.js +22 -14
package/dist/src/utils/retry.js.map +1 -1
package/dist/src/utils/retry.test.js +83 -39
package/dist/src/utils/retry.test.js.map +1 -1
package/dist/src/utils/shell-utils.d.ts +1 -0
package/dist/src/utils/shell-utils.js +1 -1
package/dist/src/utils/shell-utils.js.map +1 -1
package/dist/src/utils/tool-utils.js +2 -2
package/dist/src/utils/tool-utils.js.map +1 -1
package/dist/src/utils/tool-utils.test.js +8 -0
package/dist/src/utils/tool-utils.test.js.map +1 -1
package/dist/src/utils/userAccountManager.test.js +2 -1
package/dist/src/utils/userAccountManager.test.js.map +1 -1
package/dist/tsconfig.tsbuildinfo +1 -1
package/package.json +1 -1

package/dist/src/agents/executor.test.js CHANGED Viewed

@@ -3,16 +3,21 @@
  * Copyright 2025 Google LLC
  * SPDX-License-Identifier: Apache-2.0
  */
-import { describe, it, expect, vi, beforeEach, afterEach, } from 'vitest';
+import { describe, it, expect, vi, beforeEach, afterEach } from 'vitest';
 import { AgentExecutor } from './executor.js';
-import { AgentTerminateMode } from './types.js';
 import { makeFakeConfig } from '../test-utils/config.js';
 import { ToolRegistry } from '../tools/tool-registry.js';
 import { LSTool } from '../tools/ls.js';
 import { ReadFileTool } from '../tools/read-file.js';
 import { GeminiChat, StreamEventType, } from '../core/geminiChat.js';
+import {} from '@google/genai';
 import { MockTool } from '../test-utils/mock-tool.js';
 import { getDirectoryContextString } from '../utils/environmentContext.js';
+import { z } from 'zod';
+import { promptIdContext } from '../utils/promptIdContext.js';
+import { logAgentStart, logAgentFinish } from '../telemetry/loggers.js';
+import { AgentStartEvent, AgentFinishEvent } from '../telemetry/types.js';
+import { AgentTerminateMode } from './types.js';
 const { mockSendMessageStream, mockExecuteToolCall } = vi.hoisted(() => ({
     mockSendMessageStream: vi.fn(),
     mockExecuteToolCall: vi.fn(),
@@ -30,13 +35,40 @@ vi.mock('../core/nonInteractiveToolExecutor.js', () => ({
     executeToolCall: mockExecuteToolCall,
 }));
 vi.mock('../utils/environmentContext.js');
-const MockedGeminiChat = GeminiChat;
-// A mock tool that is NOT on the NON_INTERACTIVE_TOOL_ALLOWLIST
-const MOCK_TOOL_NOT_ALLOWED = new MockTool({ name: 'write_file' });
+vi.mock('../telemetry/loggers.js', () => ({
+    logAgentStart: vi.fn(),
+    logAgentFinish: vi.fn(),
+}));
+vi.mock('../utils/promptIdContext.js', async (importOriginal) => {
+    const actual = await importOriginal();
+    return {
+        ...actual,
+        promptIdContext: {
+            ...actual.promptIdContext,
+            getStore: vi.fn(),
+            run: vi.fn((_id, fn) => fn()),
+        },
+    };
+});
+const MockedGeminiChat = vi.mocked(GeminiChat);
+const mockedGetDirectoryContextString = vi.mocked(getDirectoryContextString);
+const mockedPromptIdContext = vi.mocked(promptIdContext);
+const mockedLogAgentStart = vi.mocked(logAgentStart);
+const mockedLogAgentFinish = vi.mocked(logAgentFinish);
+// Constants for testing
+const TASK_COMPLETE_TOOL_NAME = 'complete_task';
+const MOCK_TOOL_NOT_ALLOWED = new MockTool({ name: 'write_file_interactive' });
+/**
+ * Helper to create a mock API response chunk.
+ * Uses conditional spread to handle readonly functionCalls property safely.
+ */
 const createMockResponseChunk = (parts, functionCalls) => ({
     candidates: [{ index: 0, content: { role: 'model', parts } }],
-    functionCalls,
+    ...(functionCalls && functionCalls.length > 0 ? { functionCalls } : {}),
 });
+/**
+ * Helper to mock a single turn of model response in the stream.
+ */
 const mockModelResponse = (functionCalls, thought, text) => {
     const parts = [];
     if (thought) {
@@ -47,9 +79,7 @@ const mockModelResponse = (functionCalls, thought, text) => {
     }
     if (text)
         parts.push({ text });
-    const responseChunk = createMockResponseChunk(parts,
-    // Ensure functionCalls is undefined if the array is empty, matching API behavior
-    functionCalls.length > 0 ? functionCalls : undefined);
+    const responseChunk = createMockResponseChunk(parts, functionCalls);
     mockSendMessageStream.mockImplementationOnce(async () => (async function* () {
         yield {
             type: StreamEventType.CHUNK,
@@ -57,30 +87,59 @@ const mockModelResponse = (functionCalls, thought, text) => {
         };
     })());
 };
+/**
+ * Helper to extract the message parameters sent to sendMessageStream.
+ * Provides type safety for inspecting mock calls.
+ */
+const getMockMessageParams = (callIndex) => {
+    const call = mockSendMessageStream.mock.calls[callIndex];
+    expect(call).toBeDefined();
+    // Arg 1 of sendMessageStream is the message parameters
+    return call[1];
+};
 let mockConfig;
 let parentToolRegistry;
-const createTestDefinition = (tools = [LSTool.Name], runConfigOverrides = {}, outputConfigOverrides = {}) => ({
-    name: 'TestAgent',
-    description: 'An agent for testing.',
-    inputConfig: {
-        inputs: { goal: { type: 'string', required: true, description: 'goal' } },
-    },
-    modelConfig: { model: 'gemini-test-model', temp: 0, top_p: 1 },
-    runConfig: { max_time_minutes: 5, max_turns: 5, ...runConfigOverrides },
-    promptConfig: { systemPrompt: 'Achieve the goal: ${goal}.' },
-    toolConfig: { tools },
-    outputConfig: { description: 'The final result.', ...outputConfigOverrides },
-});
+/**
+ * Type-safe helper to create agent definitions for tests.
+ */
+const createTestDefinition = (tools = [LSTool.Name], runConfigOverrides = {}, outputConfigMode = 'default', schema = z.string()) => {
+    let outputConfig;
+    if (outputConfigMode === 'default') {
+        outputConfig = {
+            outputName: 'finalResult',
+            description: 'The final result.',
+            schema,
+        };
+    }
+    return {
+        name: 'TestAgent',
+        description: 'An agent for testing.',
+        inputConfig: {
+            inputs: { goal: { type: 'string', required: true, description: 'goal' } },
+        },
+        modelConfig: { model: 'gemini-test-model', temp: 0, top_p: 1 },
+        runConfig: { max_time_minutes: 5, max_turns: 5, ...runConfigOverrides },
+        promptConfig: { systemPrompt: 'Achieve the goal: ${goal}.' },
+        toolConfig: { tools },
+        outputConfig,
+    };
+};
 describe('AgentExecutor', () => {
     let activities;
     let onActivity;
     let abortController;
     let signal;
     beforeEach(async () => {
-        mockSendMessageStream.mockClear();
-        mockExecuteToolCall.mockClear();
-        vi.clearAllMocks();
-        // Use fake timers for timeout and concurrency testing
+        vi.resetAllMocks();
+        mockSendMessageStream.mockReset();
+        mockExecuteToolCall.mockReset();
+        mockedLogAgentStart.mockReset();
+        mockedLogAgentFinish.mockReset();
+        mockedPromptIdContext.getStore.mockReset();
+        mockedPromptIdContext.run.mockImplementation((_id, fn) => fn());
+        MockedGeminiChat.mockImplementation(() => ({
+            sendMessageStream: mockSendMessageStream,
+        }));
         vi.useFakeTimers();
         mockConfig = makeFakeConfig();
         parentToolRegistry = new ToolRegistry(mockConfig);
@@ -88,7 +147,7 @@ describe('AgentExecutor', () => {
         parentToolRegistry.registerTool(new ReadFileTool(mockConfig));
         parentToolRegistry.registerTool(MOCK_TOOL_NOT_ALLOWED);
         vi.spyOn(mockConfig, 'getToolRegistry').mockResolvedValue(parentToolRegistry);
-        vi.mocked(getDirectoryContextString).mockResolvedValue('Mocked Environment Context');
+        mockedGetDirectoryContextString.mockResolvedValue('Mocked Environment Context');
         activities = [];
         onActivity = (activity) => activities.push(activity);
         abortController = new AbortController();
@@ -105,313 +164,515 @@ describe('AgentExecutor', () => {
         });
         it('SECURITY: should throw if a tool is not on the non-interactive allowlist', async () => {
             const definition = createTestDefinition([MOCK_TOOL_NOT_ALLOWED.name]);
-            await expect(AgentExecutor.create(definition, mockConfig, onActivity)).rejects.toThrow(`Tool "${MOCK_TOOL_NOT_ALLOWED.name}" is not on the allow-list for non-interactive execution`);
+            await expect(AgentExecutor.create(definition, mockConfig, onActivity)).rejects.toThrow(/not on the allow-list for non-interactive execution/);
         });
         it('should create an isolated ToolRegistry for the agent', async () => {
             const definition = createTestDefinition([LSTool.Name, ReadFileTool.Name]);
             const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            // @ts-expect-error - accessing private property for test validation
-            const agentRegistry = executor.toolRegistry;
+            const agentRegistry = executor['toolRegistry'];
             expect(agentRegistry).not.toBe(parentToolRegistry);
             expect(agentRegistry.getAllToolNames()).toEqual(expect.arrayContaining([LSTool.Name, ReadFileTool.Name]));
             expect(agentRegistry.getAllToolNames()).toHaveLength(2);
             expect(agentRegistry.getTool(MOCK_TOOL_NOT_ALLOWED.name)).toBeUndefined();
         });
+        it('should use parentPromptId from context to create agentId', async () => {
+            const parentId = 'parent-id';
+            mockedPromptIdContext.getStore.mockReturnValue(parentId);
+            const definition = createTestDefinition();
+            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
+            expect(executor['agentId']).toMatch(new RegExp(`^${parentId}-${definition.name}-`));
+        });
     });
     describe('run (Execution Loop and Logic)', () => {
-        it('should execute a successful work and extraction phase (Happy Path) and emit activities', async () => {
+        it('should log AgentFinish with error if run throws', async () => {
+            const definition = createTestDefinition();
+            // Make the definition invalid to cause an error during run
+            definition.inputConfig.inputs = {
+                goal: { type: 'string', required: true, description: 'goal' },
+            };
+            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
+            // Run without inputs to trigger validation error
+            await expect(executor.run({}, signal)).rejects.toThrow(/Missing required input parameters/);
+            expect(mockedLogAgentStart).toHaveBeenCalledTimes(1);
+            expect(mockedLogAgentFinish).toHaveBeenCalledTimes(1);
+            expect(mockedLogAgentFinish).toHaveBeenCalledWith(mockConfig, expect.objectContaining({
+                terminate_reason: AgentTerminateMode.ERROR,
+            }));
+        });
+        it('should execute successfully when model calls complete_task with output (Happy Path with Output)', async () => {
             const definition = createTestDefinition();
             const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
             const inputs = { goal: 'Find files' };
             // Turn 1: Model calls ls
             mockModelResponse([{ name: LSTool.Name, args: { path: '.' }, id: 'call1' }], 'T1: Listing');
             mockExecuteToolCall.mockResolvedValueOnce({
-                callId: 'call1',
-                resultDisplay: 'file1.txt',
-                responseParts: [
-                    {
-                        functionResponse: {
-                            name: LSTool.Name,
-                            response: { result: 'file1.txt' },
-                            id: 'call1',
+                status: 'success',
+                request: {
+                    callId: 'call1',
+                    name: LSTool.Name,
+                    args: { path: '.' },
+                    isClientInitiated: false,
+                    prompt_id: 'test-prompt',
+                },
+                tool: {},
+                invocation: {},
+                response: {
+                    callId: 'call1',
+                    resultDisplay: 'file1.txt',
+                    responseParts: [
+                        {
+                            functionResponse: {
+                                name: LSTool.Name,
+                                response: { result: 'file1.txt' },
+                                id: 'call1',
+                            },
                         },
-                    },
-                ],
-                error: undefined,
+                    ],
+                    error: undefined,
+                    errorType: undefined,
+                    contentLength: undefined,
+                },
             });
-            // Turn 2: Model stops
-            mockModelResponse([], 'T2: Done');
-            // Extraction Phase
-            mockModelResponse([], undefined, 'Result: file1.txt.');
+            // Turn 2: Model calls complete_task with required output
+            mockModelResponse([
+                {
+                    name: TASK_COMPLETE_TOOL_NAME,
+                    args: { finalResult: 'Found file1.txt' },
+                    id: 'call2',
+                },
+            ], 'T2: Done');
             const output = await executor.run(inputs, signal);
-            expect(mockSendMessageStream).toHaveBeenCalledTimes(3);
-            expect(mockExecuteToolCall).toHaveBeenCalledTimes(1);
-            // Verify System Prompt Templating
+            expect(mockSendMessageStream).toHaveBeenCalledTimes(2);
             const chatConstructorArgs = MockedGeminiChat.mock.calls[0];
             const chatConfig = chatConstructorArgs[1];
-            expect(chatConfig?.systemInstruction).toContain('Achieve the goal: Find files.');
-            // Verify environment context is appended
-            expect(chatConfig?.systemInstruction).toContain('# Environment Context\nMocked Environment Context');
-            // Verify standard rules are appended
-            expect(chatConfig?.systemInstruction).toContain('You are running in a non-interactive mode.');
-            // Verify absolute path rule is appended
-            expect(chatConfig?.systemInstruction).toContain('Always use absolute paths for file operations.');
-            // Verify Extraction Phase Call (Specific arguments)
-            expect(mockSendMessageStream).toHaveBeenCalledWith('gemini-test-model', expect.objectContaining({
-                // Extraction message should be based on outputConfig.description
-                message: expect.arrayContaining([
-                    {
-                        text: expect.stringContaining('Based on your work so far, provide: The final result.'),
-                    },
-                ]),
-                config: expect.objectContaining({ tools: undefined }), // No tools in extraction
-            }), expect.stringContaining('#extraction'));
-            expect(output.result).toBe('Result: file1.txt.');
+            expect(chatConfig?.systemInstruction).toContain(`MUST call the \`${TASK_COMPLETE_TOOL_NAME}\` tool`);
+            const turn1Params = getMockMessageParams(0);
+            const firstToolGroup = turn1Params.config?.tools?.[0];
+            expect(firstToolGroup).toBeDefined();
+            if (!firstToolGroup || !('functionDeclarations' in firstToolGroup)) {
+                throw new Error('Test expectation failed: Config does not contain functionDeclarations.');
+            }
+            const sentTools = firstToolGroup.functionDeclarations;
+            expect(sentTools).toBeDefined();
+            expect(sentTools).toEqual(expect.arrayContaining([
+                expect.objectContaining({ name: LSTool.Name }),
+                expect.objectContaining({ name: TASK_COMPLETE_TOOL_NAME }),
+            ]));
+            const completeToolDef = sentTools.find((t) => t.name === TASK_COMPLETE_TOOL_NAME);
+            expect(completeToolDef?.parameters?.required).toContain('finalResult');
+            expect(output.result).toBe('Found file1.txt');
             expect(output.terminate_reason).toBe(AgentTerminateMode.GOAL);
-            // Verify Activity Stream (Observability)
+            // Telemetry checks
+            expect(mockedLogAgentStart).toHaveBeenCalledTimes(1);
+            expect(mockedLogAgentStart).toHaveBeenCalledWith(mockConfig, expect.any(AgentStartEvent));
+            expect(mockedLogAgentFinish).toHaveBeenCalledTimes(1);
+            expect(mockedLogAgentFinish).toHaveBeenCalledWith(mockConfig, expect.any(AgentFinishEvent));
+            const finishEvent = mockedLogAgentFinish.mock.calls[0][1];
+            expect(finishEvent.terminate_reason).toBe(AgentTerminateMode.GOAL);
+            // Context checks
+            expect(mockedPromptIdContext.run).toHaveBeenCalledTimes(2); // Two turns
+            const agentId = executor['agentId'];
+            expect(mockedPromptIdContext.run).toHaveBeenNthCalledWith(1, `${agentId}#0`, expect.any(Function));
+            expect(mockedPromptIdContext.run).toHaveBeenNthCalledWith(2, `${agentId}#1`, expect.any(Function));
             expect(activities).toEqual(expect.arrayContaining([
-                // Thought subjects are extracted by the executor (parseThought)
                 expect.objectContaining({
                     type: 'THOUGHT_CHUNK',
                     data: { text: 'T1: Listing' },
                 }),
-                expect.objectContaining({
-                    type: 'TOOL_CALL_START',
-                    data: { name: LSTool.Name, args: { path: '.' } },
-                }),
                 expect.objectContaining({
                     type: 'TOOL_CALL_END',
                     data: { name: LSTool.Name, output: 'file1.txt' },
                 }),
                 expect.objectContaining({
-                    type: 'THOUGHT_CHUNK',
-                    data: { text: 'T2: Done' },
+                    type: 'TOOL_CALL_START',
+                    data: {
+                        name: TASK_COMPLETE_TOOL_NAME,
+                        args: { finalResult: 'Found file1.txt' },
+                    },
+                }),
+                expect.objectContaining({
+                    type: 'TOOL_CALL_END',
+                    data: {
+                        name: TASK_COMPLETE_TOOL_NAME,
+                        output: expect.stringContaining('Output submitted'),
+                    },
                 }),
             ]));
         });
-        it('should execute parallel tool calls concurrently', async () => {
-            const definition = createTestDefinition([LSTool.Name, ReadFileTool.Name]);
+        it('should execute successfully when model calls complete_task without output (Happy Path No Output)', async () => {
+            const definition = createTestDefinition([LSTool.Name], {}, 'none');
             const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            const call1 = {
-                name: LSTool.Name,
-                args: { path: '/dir1' },
-                id: 'call1',
-            };
-            // Using LSTool twice for simplicity in mocking standardized responses.
-            const call2 = {
-                name: LSTool.Name,
-                args: { path: '/dir2' },
-                id: 'call2',
-            };
-            // Turn 1: Model calls two tools simultaneously
-            mockModelResponse([call1, call2], 'T1: Listing both');
-            // Use concurrency tracking to ensure parallelism
-            let activeCalls = 0;
-            let maxActiveCalls = 0;
-            mockExecuteToolCall.mockImplementation(async (_ctx, reqInfo) => {
-                activeCalls++;
-                maxActiveCalls = Math.max(maxActiveCalls, activeCalls);
-                // Simulate latency. We must advance the fake timers for this to resolve.
-                await new Promise((resolve) => setTimeout(resolve, 100));
-                activeCalls--;
-                return {
-                    callId: reqInfo.callId,
-                    resultDisplay: `Result for ${reqInfo.name}`,
+            mockModelResponse([
+                { name: LSTool.Name, args: { path: '.' }, id: 'call1' },
+            ]);
+            mockExecuteToolCall.mockResolvedValueOnce({
+                status: 'success',
+                request: {
+                    callId: 'call1',
+                    name: LSTool.Name,
+                    args: { path: '.' },
+                    isClientInitiated: false,
+                    prompt_id: 'test-prompt',
+                },
+                tool: {},
+                invocation: {},
+                response: {
+                    callId: 'call1',
+                    resultDisplay: 'ok',
                     responseParts: [
                         {
                             functionResponse: {
-                                name: reqInfo.name,
+                                name: LSTool.Name,
                                 response: {},
-                                id: reqInfo.callId,
+                                id: 'call1',
                             },
                         },
                     ],
                     error: undefined,
-                };
+                    errorType: undefined,
+                    contentLength: undefined,
+                },
             });
-            // Turn 2: Model stops
-            mockModelResponse([]);
-            // Extraction
-            mockModelResponse([], undefined, 'Done.');
-            const runPromise = executor.run({ goal: 'Parallel test' }, signal);
-            // Advance timers while the parallel calls (Promise.all + setTimeout) are running
-            await vi.advanceTimersByTimeAsync(150);
-            await runPromise;
-            expect(mockExecuteToolCall).toHaveBeenCalledTimes(2);
-            expect(maxActiveCalls).toBe(2);
-            // Verify the input to the next model call (Turn 2) contains both responses
-            // sendMessageStream calls: [0] Turn 1, [1] Turn 2, [2] Extraction
-            const turn2Input = mockSendMessageStream.mock.calls[1][1];
-            const turn2Parts = turn2Input.message;
-            // Promise.all preserves the order of the input array.
-            expect(turn2Parts.length).toBe(2);
-            expect(turn2Parts[0]).toEqual(expect.objectContaining({
-                functionResponse: expect.objectContaining({ id: 'call1' }),
-            }));
-            expect(turn2Parts[1]).toEqual(expect.objectContaining({
-                functionResponse: expect.objectContaining({ id: 'call2' }),
-            }));
+            mockModelResponse([{ name: TASK_COMPLETE_TOOL_NAME, args: {}, id: 'call2' }], 'Task finished.');
+            const output = await executor.run({ goal: 'Do work' }, signal);
+            const turn1Params = getMockMessageParams(0);
+            const firstToolGroup = turn1Params.config?.tools?.[0];
+            expect(firstToolGroup).toBeDefined();
+            if (!firstToolGroup || !('functionDeclarations' in firstToolGroup)) {
+                throw new Error('Test expectation failed: Config does not contain functionDeclarations.');
+            }
+            const sentTools = firstToolGroup.functionDeclarations;
+            expect(sentTools).toBeDefined();
+            const completeToolDef = sentTools.find((t) => t.name === TASK_COMPLETE_TOOL_NAME);
+            expect(completeToolDef?.parameters?.required).toEqual([]);
+            expect(completeToolDef?.description).toContain('signal that you have completed');
+            expect(output.result).toBe('Task completed successfully.');
+            expect(output.terminate_reason).toBe(AgentTerminateMode.GOAL);
         });
-        it('should handle tool execution failure gracefully and report error', async () => {
-            const definition = createTestDefinition([LSTool.Name]);
+        it('should error immediately if the model stops tools without calling complete_task (Protocol Violation)', async () => {
+            const definition = createTestDefinition();
             const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            // Turn 1: Model calls ls, but it fails
             mockModelResponse([
-                { name: LSTool.Name, args: { path: '/invalid' }, id: 'call1' },
+                { name: LSTool.Name, args: { path: '.' }, id: 'call1' },
             ]);
-            const errorMessage = 'Internal failure.';
             mockExecuteToolCall.mockResolvedValueOnce({
-                callId: 'call1',
-                resultDisplay: `Error: ${errorMessage}`,
-                responseParts: undefined, // Failed tools might return undefined parts
-                error: { message: errorMessage },
+                status: 'success',
+                request: {
+                    callId: 'call1',
+                    name: LSTool.Name,
+                    args: { path: '.' },
+                    isClientInitiated: false,
+                    prompt_id: 'test-prompt',
+                },
+                tool: {},
+                invocation: {},
+                response: {
+                    callId: 'call1',
+                    resultDisplay: 'ok',
+                    responseParts: [
+                        {
+                            functionResponse: {
+                                name: LSTool.Name,
+                                response: {},
+                                id: 'call1',
+                            },
+                        },
+                    ],
+                    error: undefined,
+                    errorType: undefined,
+                    contentLength: undefined,
+                },
             });
-            // Turn 2: Model stops
-            mockModelResponse([]);
-            mockModelResponse([], undefined, 'Failed.');
-            await executor.run({ goal: 'Failure test' }, signal);
-            // Verify that the error was reported in the activity stream
+            mockModelResponse([], 'I think I am done.');
+            const output = await executor.run({ goal: 'Strict test' }, signal);
+            expect(mockSendMessageStream).toHaveBeenCalledTimes(2);
+            const expectedError = `Agent stopped calling tools but did not call '${TASK_COMPLETE_TOOL_NAME}' to finalize the session.`;
+            expect(output.terminate_reason).toBe(AgentTerminateMode.ERROR);
+            expect(output.result).toBe(expectedError);
+            // Telemetry check for error
+            expect(mockedLogAgentFinish).toHaveBeenCalledWith(mockConfig, expect.objectContaining({
+                terminate_reason: AgentTerminateMode.ERROR,
+            }));
+            expect(activities).toContainEqual(expect.objectContaining({
+                type: 'ERROR',
+                data: expect.objectContaining({
+                    context: 'protocol_violation',
+                    error: expectedError,
+                }),
+            }));
+        });
+        it('should report an error if complete_task is called with missing required arguments', async () => {
+            const definition = createTestDefinition();
+            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
+            // Turn 1: Missing arg
+            mockModelResponse([
+                {
+                    name: TASK_COMPLETE_TOOL_NAME,
+                    args: { wrongArg: 'oops' },
+                    id: 'call1',
+                },
+            ]);
+            // Turn 2: Corrected
+            mockModelResponse([
+                {
+                    name: TASK_COMPLETE_TOOL_NAME,
+                    args: { finalResult: 'Corrected result' },
+                    id: 'call2',
+                },
+            ]);
+            const output = await executor.run({ goal: 'Error test' }, signal);
+            expect(mockSendMessageStream).toHaveBeenCalledTimes(2);
+            const expectedError = "Missing required argument 'finalResult' for completion.";
             expect(activities).toContainEqual(expect.objectContaining({
                 type: 'ERROR',
                 data: {
-                    error: errorMessage,
                     context: 'tool_call',
-                    name: LSTool.Name,
+                    name: TASK_COMPLETE_TOOL_NAME,
+                    error: expectedError,
                 },
             }));
-            // Verify the input to the next model call (Turn 2) contains the fallback error message
-            const turn2Input = mockSendMessageStream.mock.calls[1][1];
-            const turn2Parts = turn2Input.message;
-            expect(turn2Parts).toEqual([
+            const turn2Params = getMockMessageParams(1);
+            const turn2Parts = turn2Params.message;
+            expect(turn2Parts).toBeDefined();
+            expect(turn2Parts).toHaveLength(1);
+            expect(turn2Parts[0]).toEqual(expect.objectContaining({
+                functionResponse: expect.objectContaining({
+                    name: TASK_COMPLETE_TOOL_NAME,
+                    response: { error: expectedError },
+                    id: 'call1',
+                }),
+            }));
+            expect(output.result).toBe('Corrected result');
+            expect(output.terminate_reason).toBe(AgentTerminateMode.GOAL);
+        });
+        it('should handle multiple calls to complete_task in the same turn (accept first, block rest)', async () => {
+            const definition = createTestDefinition([], {}, 'none');
+            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
+            // Turn 1: Duplicate calls
+            mockModelResponse([
+                { name: TASK_COMPLETE_TOOL_NAME, args: {}, id: 'call1' },
+                { name: TASK_COMPLETE_TOOL_NAME, args: {}, id: 'call2' },
+            ]);
+            const output = await executor.run({ goal: 'Dup test' }, signal);
+            expect(mockSendMessageStream).toHaveBeenCalledTimes(1);
+            expect(output.terminate_reason).toBe(AgentTerminateMode.GOAL);
+            const completions = activities.filter((a) => a.type === 'TOOL_CALL_END' &&
+                a.data['name'] === TASK_COMPLETE_TOOL_NAME);
+            const errors = activities.filter((a) => a.type === 'ERROR' && a.data['name'] === TASK_COMPLETE_TOOL_NAME);
+            expect(completions).toHaveLength(1);
+            expect(errors).toHaveLength(1);
+            expect(errors[0].data['error']).toContain('Task already marked complete in this turn');
+        });
+        it('should execute parallel tool calls and then complete', async () => {
+            const definition = createTestDefinition([LSTool.Name]);
+            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
+            const call1 = {
+                name: LSTool.Name,
+                args: { path: '/a' },
+                id: 'c1',
+            };
+            const call2 = {
+                name: LSTool.Name,
+                args: { path: '/b' },
+                id: 'c2',
+            };
+            // Turn 1: Parallel calls
+            mockModelResponse([call1, call2]);
+            // Concurrency mock
+            let callsStarted = 0;
+            let resolveCalls;
+            const bothStarted = new Promise((r) => {
+                resolveCalls = r;
+            });
+            mockExecuteToolCall.mockImplementation(async (_ctx, reqInfo) => {
+                callsStarted++;
+                if (callsStarted === 2)
+                    resolveCalls();
+                await vi.advanceTimersByTimeAsync(100);
+                return {
+                    status: 'success',
+                    request: reqInfo,
+                    tool: {},
+                    invocation: {},
+                    response: {
+                        callId: reqInfo.callId,
+                        resultDisplay: 'ok',
+                        responseParts: [
+                            {
+                                functionResponse: {
+                                    name: reqInfo.name,
+                                    response: {},
+                                    id: reqInfo.callId,
+                                },
+                            },
+                        ],
+                        error: undefined,
+                        errorType: undefined,
+                        contentLength: undefined,
+                    },
+                };
+            });
+            // Turn 2: Completion
+            mockModelResponse([
                 {
-                    text: 'All tool calls failed. Please analyze the errors and try an alternative approach.',
+                    name: TASK_COMPLETE_TOOL_NAME,
+                    args: { finalResult: 'done' },
+                    id: 'c3',
                 },
             ]);
+            const runPromise = executor.run({ goal: 'Parallel' }, signal);
+            await vi.advanceTimersByTimeAsync(1);
+            await bothStarted;
+            await vi.advanceTimersByTimeAsync(150);
+            await vi.advanceTimersByTimeAsync(1);
+            const output = await runPromise;
+            expect(mockExecuteToolCall).toHaveBeenCalledTimes(2);
+            expect(output.terminate_reason).toBe(AgentTerminateMode.GOAL);
+            // Safe access to message parts
+            const turn2Params = getMockMessageParams(1);
+            const parts = turn2Params.message;
+            expect(parts).toBeDefined();
+            expect(parts).toHaveLength(2);
+            expect(parts).toEqual(expect.arrayContaining([
+                expect.objectContaining({
+                    functionResponse: expect.objectContaining({ id: 'c1' }),
+                }),
+                expect.objectContaining({
+                    functionResponse: expect.objectContaining({ id: 'c2' }),
+                }),
+            ]));
         });
-        it('SECURITY: should block calls to tools not registered for the agent at runtime', async () => {
-            // Agent definition only includes LSTool
+        it('SECURITY: should block unauthorized tools and provide explicit failure to model', async () => {
             const definition = createTestDefinition([LSTool.Name]);
             const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            // Turn 1: Model hallucinates a call to ReadFileTool
-            // (ReadFileTool exists in the parent registry but not the agent's isolated registry)
+            // Turn 1: Model tries to use a tool not in its config
+            const badCallId = 'bad_call_1';
             mockModelResponse([
                 {
                     name: ReadFileTool.Name,
-                    args: { path: 'config.txt' },
-                    id: 'call_blocked',
+                    args: { path: 'secret.txt' },
+                    id: badCallId,
+                },
+            ]);
+            // Turn 2: Model gives up and completes
+            mockModelResponse([
+                {
+                    name: TASK_COMPLETE_TOOL_NAME,
+                    args: { finalResult: 'Could not read file.' },
+                    id: 'c2',
                 },
             ]);
-            // Turn 2: Model stops
-            mockModelResponse([]);
-            // Extraction
-            mockModelResponse([], undefined, 'Done.');
             const consoleWarnSpy = vi
                 .spyOn(console, 'warn')
                 .mockImplementation(() => { });
-            await executor.run({ goal: 'Security test' }, signal);
-            // Verify executeToolCall was NEVER called because the tool was unauthorized
+            await executor.run({ goal: 'Sec test' }, signal);
+            // Verify external executor was not called (Security held)
             expect(mockExecuteToolCall).not.toHaveBeenCalled();
-            expect(consoleWarnSpy).toHaveBeenCalledWith(expect.stringContaining(`attempted to call unauthorized tool '${ReadFileTool.Name}'`));
+            // 2. Verify console warning
+            expect(consoleWarnSpy).toHaveBeenCalledWith(expect.stringContaining(`[AgentExecutor] Blocked call:`));
             consoleWarnSpy.mockRestore();
-            // Verify the input to the next model call (Turn 2) indicates failure (as the only call was blocked)
-            const turn2Input = mockSendMessageStream.mock.calls[1][1];
-            const turn2Parts = turn2Input.message;
-            expect(turn2Parts[0].text).toContain('All tool calls failed');
-        });
-        it('should use OutputConfig completion_criteria in the extraction message', async () => {
-            const definition = createTestDefinition([LSTool.Name], {}, {
-                description: 'A summary.',
-                completion_criteria: ['Must include file names', 'Must be concise'],
-            });
-            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            // Turn 1: Model stops immediately
-            mockModelResponse([]);
-            // Extraction Phase
-            mockModelResponse([], undefined, 'Result: Done.');
-            await executor.run({ goal: 'Extraction test' }, signal);
-            // Verify the extraction call (the second call)
-            const extractionCallArgs = mockSendMessageStream.mock.calls[1][1];
-            const extractionMessageParts = extractionCallArgs.message;
-            const extractionText = extractionMessageParts[0].text;
-            expect(extractionText).toContain('Based on your work so far, provide: A summary.');
-            expect(extractionText).toContain('Be sure you have addressed:');
-            expect(extractionText).toContain('- Must include file names');
-            expect(extractionText).toContain('- Must be concise');
+            // Verify specific error was sent back to model
+            const turn2Params = getMockMessageParams(1);
+            const parts = turn2Params.message;
+            expect(parts).toBeDefined();
+            expect(parts[0]).toEqual(expect.objectContaining({
+                functionResponse: expect.objectContaining({
+                    id: badCallId,
+                    name: ReadFileTool.Name,
+                    response: {
+                        error: expect.stringContaining('Unauthorized tool call'),
+                    },
+                }),
+            }));
+            // Verify Activity Stream reported the error
+            expect(activities).toContainEqual(expect.objectContaining({
+                type: 'ERROR',
+                data: expect.objectContaining({
+                    context: 'tool_call_unauthorized',
+                    name: ReadFileTool.Name,
+                }),
+            }));
         });
     });
     describe('run (Termination Conditions)', () => {
-        const mockKeepAliveResponse = () => {
-            mockModelResponse([{ name: LSTool.Name, args: { path: '.' }, id: 'loop' }], 'Looping');
-            mockExecuteToolCall.mockResolvedValue({
-                callId: 'loop',
-                resultDisplay: 'ok',
-                responseParts: [
-                    { functionResponse: { name: LSTool.Name, response: {}, id: 'loop' } },
-                ],
-                error: undefined,
+        const mockWorkResponse = (id) => {
+            mockModelResponse([{ name: LSTool.Name, args: { path: '.' }, id }]);
+            mockExecuteToolCall.mockResolvedValueOnce({
+                status: 'success',
+                request: {
+                    callId: id,
+                    name: LSTool.Name,
+                    args: { path: '.' },
+                    isClientInitiated: false,
+                    prompt_id: 'test-prompt',
+                },
+                tool: {},
+                invocation: {},
+                response: {
+                    callId: id,
+                    resultDisplay: 'ok',
+                    responseParts: [
+                        { functionResponse: { name: LSTool.Name, response: {}, id } },
+                    ],
+                    error: undefined,
+                    errorType: undefined,
+                    contentLength: undefined,
+                },
             });
         };
         it('should terminate when max_turns is reached', async () => {
-            const MAX_TURNS = 2;
+            const MAX = 2;
             const definition = createTestDefinition([LSTool.Name], {
-                max_turns: MAX_TURNS,
+                max_turns: MAX,
             });
-            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            // Turn 1
-            mockKeepAliveResponse();
-            // Turn 2
-            mockKeepAliveResponse();
-            const output = await executor.run({ goal: 'Termination test' }, signal);
+            const executor = await AgentExecutor.create(definition, mockConfig);
+            mockWorkResponse('t1');
+            mockWorkResponse('t2');
+            const output = await executor.run({ goal: 'Turns test' }, signal);
             expect(output.terminate_reason).toBe(AgentTerminateMode.MAX_TURNS);
-            expect(mockSendMessageStream).toHaveBeenCalledTimes(MAX_TURNS);
-            // Extraction phase should be skipped when termination is forced
-            expect(mockSendMessageStream).not.toHaveBeenCalledWith(expect.any(String), expect.any(Object), expect.stringContaining('#extraction'));
+            expect(mockSendMessageStream).toHaveBeenCalledTimes(MAX);
         });
         it('should terminate if timeout is reached', async () => {
             const definition = createTestDefinition([LSTool.Name], {
-                max_time_minutes: 5,
-                max_turns: 100,
+                max_time_minutes: 1,
             });
-            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            // Turn 1 setup
-            mockModelResponse([{ name: LSTool.Name, args: { path: '.' }, id: 'loop' }], 'Looping');
-            // Mock a tool call that takes a long time, causing the overall timeout
-            mockExecuteToolCall.mockImplementation(async () => {
-                // Advance time past the 5-minute limit during the tool call execution
-                await vi.advanceTimersByTimeAsync(5 * 60 * 1000 + 1);
+            const executor = await AgentExecutor.create(definition, mockConfig);
+            mockModelResponse([{ name: LSTool.Name, args: { path: '.' }, id: 't1' }]);
+            // Long running tool
+            mockExecuteToolCall.mockImplementationOnce(async (_ctx, reqInfo) => {
+                await vi.advanceTimersByTimeAsync(61 * 1000);
                 return {
-                    callId: 'loop',
-                    resultDisplay: 'ok',
-                    responseParts: [
-                        {
-                            functionResponse: { name: LSTool.Name, response: {}, id: 'loop' },
-                        },
-                    ],
-                    error: undefined,
+                    status: 'success',
+                    request: reqInfo,
+                    tool: {},
+                    invocation: {},
+                    response: {
+                        callId: 't1',
+                        resultDisplay: 'ok',
+                        responseParts: [],
+                        error: undefined,
+                        errorType: undefined,
+                        contentLength: undefined,
+                    },
                 };
             });
-            const output = await executor.run({ goal: 'Termination test' }, signal);
+            const output = await executor.run({ goal: 'Timeout test' }, signal);
             expect(output.terminate_reason).toBe(AgentTerminateMode.TIMEOUT);
-            // Should only have called the model once before the timeout check stopped it
             expect(mockSendMessageStream).toHaveBeenCalledTimes(1);
         });
-        it('should terminate when AbortSignal is triggered mid-stream', async () => {
+        it('should terminate when AbortSignal is triggered', async () => {
             const definition = createTestDefinition();
-            const executor = await AgentExecutor.create(definition, mockConfig, onActivity);
-            // Mock the model response stream
-            mockSendMessageStream.mockImplementation(async () => (async function* () {
-                // Yield the first chunk
+            const executor = await AgentExecutor.create(definition, mockConfig);
+            mockSendMessageStream.mockImplementationOnce(async () => (async function* () {
                 yield {
                     type: StreamEventType.CHUNK,
                     value: createMockResponseChunk([
-                        { text: '**Thinking** Step 1', thought: true },
+                        { text: 'Thinking...', thought: true },
                     ]),
                 };
-                // Simulate abort happening mid-stream
                 abortController.abort();
-                // The loop in callModel should break immediately due to signal check.
             })());
-            const output = await executor.run({ goal: 'Termination test' }, signal);
+            const output = await executor.run({ goal: 'Abort test' }, signal);
             expect(output.terminate_reason).toBe(AgentTerminateMode.ABORTED);
         });
     });