npm - @illuma-ai/agents - Versions diffs - 1.1.21 → 1.1.22 - Mend

@illuma-ai/agents 1.1.21 → 1.1.22

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (241) hide show

package/dist/cjs/graphs/Graph.cjs +12 -1
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +85 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -1
package/dist/cjs/run.cjs +20 -9
package/dist/cjs/run.cjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +12 -1
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +85 -1
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -1
package/dist/esm/run.mjs +20 -9
package/dist/esm/run.mjs.map +1 -1
package/dist/types/graphs/MultiAgentGraph.d.ts +17 -0
package/package.json +1 -1
package/src/graphs/Graph.ts +12 -1
package/src/graphs/MultiAgentGraph.ts +105 -1
package/src/graphs/__tests__/multi-agent-delegate.test.ts +191 -0
package/src/run.ts +20 -11
package/src/scripts/test-bedrock-handoff-autonomous.ts +231 -0
package/src/agents/AgentContext.js +0 -782
package/src/agents/AgentContext.test.js +0 -421
package/src/agents/__tests__/AgentContext.test.js +0 -678
package/src/agents/__tests__/resolveStructuredOutputMode.test.js +0 -117
package/src/common/enum.js +0 -192
package/src/common/index.js +0 -3
package/src/events.js +0 -166
package/src/graphs/Graph.js +0 -1857
package/src/graphs/MultiAgentGraph.js +0 -1092
package/src/graphs/__tests__/structured-output.integration.test.js +0 -624
package/src/graphs/__tests__/structured-output.test.js +0 -144
package/src/graphs/contextManagement.e2e.test.js +0 -718
package/src/graphs/contextManagement.test.js +0 -485
package/src/graphs/handoffValidation.test.js +0 -276
package/src/graphs/index.js +0 -3
package/src/index.js +0 -28
package/src/instrumentation.js +0 -21
package/src/llm/anthropic/index.js +0 -319
package/src/llm/anthropic/types.js +0 -46
package/src/llm/anthropic/utils/message_inputs.js +0 -627
package/src/llm/anthropic/utils/message_outputs.js +0 -290
package/src/llm/anthropic/utils/output_parsers.js +0 -89
package/src/llm/anthropic/utils/tools.js +0 -25
package/src/llm/bedrock/__tests__/bedrock-caching.test.js +0 -392
package/src/llm/bedrock/index.js +0 -303
package/src/llm/bedrock/types.js +0 -2
package/src/llm/bedrock/utils/index.js +0 -6
package/src/llm/bedrock/utils/message_inputs.js +0 -463
package/src/llm/bedrock/utils/message_outputs.js +0 -269
package/src/llm/fake.js +0 -92
package/src/llm/google/index.js +0 -215
package/src/llm/google/types.js +0 -12
package/src/llm/google/utils/common.js +0 -670
package/src/llm/google/utils/tools.js +0 -111
package/src/llm/google/utils/zod_to_genai_parameters.js +0 -47
package/src/llm/openai/index.js +0 -1033
package/src/llm/openai/types.js +0 -2
package/src/llm/openai/utils/index.js +0 -756
package/src/llm/openai/utils/isReasoningModel.test.js +0 -79
package/src/llm/openrouter/index.js +0 -261
package/src/llm/openrouter/reasoning.test.js +0 -181
package/src/llm/providers.js +0 -36
package/src/llm/text.js +0 -65
package/src/llm/vertexai/index.js +0 -402
package/src/messages/__tests__/tools.test.js +0 -392
package/src/messages/cache.js +0 -404
package/src/messages/cache.test.js +0 -1167
package/src/messages/content.js +0 -48
package/src/messages/content.test.js +0 -314
package/src/messages/core.js +0 -359
package/src/messages/ensureThinkingBlock.test.js +0 -997
package/src/messages/format.js +0 -973
package/src/messages/formatAgentMessages.test.js +0 -2278
package/src/messages/formatAgentMessages.tools.test.js +0 -362
package/src/messages/formatMessage.test.js +0 -608
package/src/messages/ids.js +0 -18
package/src/messages/index.js +0 -9
package/src/messages/labelContentByAgent.test.js +0 -725
package/src/messages/prune.js +0 -438
package/src/messages/reducer.js +0 -60
package/src/messages/shiftIndexTokenCountMap.test.js +0 -63
package/src/messages/summarize.js +0 -146
package/src/messages/summarize.test.js +0 -332
package/src/messages/tools.js +0 -90
package/src/mockStream.js +0 -81
package/src/prompts/collab.js +0 -7
package/src/prompts/index.js +0 -3
package/src/prompts/taskmanager.js +0 -58
package/src/run.js +0 -427
package/src/schemas/index.js +0 -3
package/src/schemas/schema-preparation.test.js +0 -370
package/src/schemas/validate.js +0 -314
package/src/schemas/validate.test.js +0 -264
package/src/scripts/abort.js +0 -127
package/src/scripts/ant_web_search.js +0 -130
package/src/scripts/ant_web_search_edge_case.js +0 -133
package/src/scripts/ant_web_search_error_edge_case.js +0 -119
package/src/scripts/args.js +0 -41
package/src/scripts/bedrock-cache-debug.js +0 -186
package/src/scripts/bedrock-content-aggregation-test.js +0 -195
package/src/scripts/bedrock-merge-test.js +0 -80
package/src/scripts/bedrock-parallel-tools-test.js +0 -150
package/src/scripts/caching.js +0 -106
package/src/scripts/cli.js +0 -152
package/src/scripts/cli2.js +0 -119
package/src/scripts/cli3.js +0 -163
package/src/scripts/cli4.js +0 -165
package/src/scripts/cli5.js +0 -165
package/src/scripts/code_exec.js +0 -171
package/src/scripts/code_exec_files.js +0 -180
package/src/scripts/code_exec_multi_session.js +0 -185
package/src/scripts/code_exec_ptc.js +0 -265
package/src/scripts/code_exec_session.js +0 -217
package/src/scripts/code_exec_simple.js +0 -120
package/src/scripts/content.js +0 -111
package/src/scripts/empty_input.js +0 -125
package/src/scripts/handoff-test.js +0 -96
package/src/scripts/image.js +0 -138
package/src/scripts/memory.js +0 -83
package/src/scripts/multi-agent-chain.js +0 -271
package/src/scripts/multi-agent-conditional.js +0 -185
package/src/scripts/multi-agent-document-review-chain.js +0 -171
package/src/scripts/multi-agent-hybrid-flow.js +0 -264
package/src/scripts/multi-agent-parallel-start.js +0 -214
package/src/scripts/multi-agent-parallel.js +0 -346
package/src/scripts/multi-agent-sequence.js +0 -184
package/src/scripts/multi-agent-supervisor.js +0 -324
package/src/scripts/multi-agent-test.js +0 -147
package/src/scripts/parallel-asymmetric-tools-test.js +0 -202
package/src/scripts/parallel-full-metadata-test.js +0 -176
package/src/scripts/parallel-tools-test.js +0 -256
package/src/scripts/programmatic_exec.js +0 -277
package/src/scripts/programmatic_exec_agent.js +0 -168
package/src/scripts/search.js +0 -118
package/src/scripts/sequential-full-metadata-test.js +0 -143
package/src/scripts/simple.js +0 -174
package/src/scripts/single-agent-metadata-test.js +0 -152
package/src/scripts/stream.js +0 -113
package/src/scripts/test-custom-prompt-key.js +0 -132
package/src/scripts/test-handoff-input.js +0 -143
package/src/scripts/test-handoff-preamble.js +0 -227
package/src/scripts/test-handoff-steering.js +0 -353
package/src/scripts/test-multi-agent-list-handoff.js +0 -318
package/src/scripts/test-parallel-agent-labeling.js +0 -253
package/src/scripts/test-parallel-handoffs.js +0 -229
package/src/scripts/test-thinking-handoff-bedrock.js +0 -132
package/src/scripts/test-thinking-handoff.js +0 -132
package/src/scripts/test-thinking-to-thinking-handoff-bedrock.js +0 -140
package/src/scripts/test-tool-before-handoff-role-order.js +0 -223
package/src/scripts/test-tools-before-handoff.js +0 -187
package/src/scripts/test_code_api.js +0 -263
package/src/scripts/thinking-bedrock.js +0 -128
package/src/scripts/thinking-vertexai.js +0 -130
package/src/scripts/thinking.js +0 -134
package/src/scripts/tool_search.js +0 -114
package/src/scripts/tools.js +0 -125
package/src/specs/agent-handoffs-bedrock.integration.test.js +0 -280
package/src/specs/agent-handoffs.test.js +0 -924
package/src/specs/anthropic.simple.test.js +0 -287
package/src/specs/azure.simple.test.js +0 -381
package/src/specs/cache.simple.test.js +0 -282
package/src/specs/custom-event-await.test.js +0 -148
package/src/specs/deepseek.simple.test.js +0 -189
package/src/specs/emergency-prune.test.js +0 -308
package/src/specs/moonshot.simple.test.js +0 -237
package/src/specs/observability.integration.test.js +0 -1337
package/src/specs/openai.simple.test.js +0 -233
package/src/specs/openrouter.simple.test.js +0 -202
package/src/specs/prune.test.js +0 -733
package/src/specs/reasoning.test.js +0 -144
package/src/specs/spec.utils.js +0 -4
package/src/specs/thinking-handoff.test.js +0 -486
package/src/specs/thinking-prune.test.js +0 -600
package/src/specs/token-distribution-edge-case.test.js +0 -246
package/src/specs/token-memoization.test.js +0 -32
package/src/specs/tokens.test.js +0 -49
package/src/specs/tool-error.test.js +0 -139
package/src/splitStream.js +0 -204
package/src/splitStream.test.js +0 -504
package/src/stream.js +0 -650
package/src/stream.test.js +0 -225
package/src/test/mockTools.js +0 -340
package/src/tools/BrowserTools.js +0 -245
package/src/tools/Calculator.js +0 -38
package/src/tools/Calculator.test.js +0 -225
package/src/tools/CodeExecutor.js +0 -233
package/src/tools/ProgrammaticToolCalling.js +0 -602
package/src/tools/StreamingToolCallBuffer.js +0 -179
package/src/tools/ToolNode.js +0 -930
package/src/tools/ToolSearch.js +0 -904
package/src/tools/__tests__/BrowserTools.test.js +0 -306
package/src/tools/__tests__/ProgrammaticToolCalling.integration.test.js +0 -276
package/src/tools/__tests__/ProgrammaticToolCalling.test.js +0 -807
package/src/tools/__tests__/StreamingToolCallBuffer.test.js +0 -175
package/src/tools/__tests__/ToolApproval.test.js +0 -675
package/src/tools/__tests__/ToolNode.recovery.test.js +0 -200
package/src/tools/__tests__/ToolNode.session.test.js +0 -319
package/src/tools/__tests__/ToolSearch.integration.test.js +0 -125
package/src/tools/__tests__/ToolSearch.test.js +0 -812
package/src/tools/__tests__/handlers.test.js +0 -799
package/src/tools/__tests__/truncation-recovery.integration.test.js +0 -362
package/src/tools/handlers.js +0 -306
package/src/tools/schema.js +0 -25
package/src/tools/search/anthropic.js +0 -34
package/src/tools/search/content.js +0 -116
package/src/tools/search/content.test.js +0 -133
package/src/tools/search/firecrawl.js +0 -173
package/src/tools/search/format.js +0 -198
package/src/tools/search/highlights.js +0 -241
package/src/tools/search/index.js +0 -3
package/src/tools/search/jina-reranker.test.js +0 -106
package/src/tools/search/rerankers.js +0 -165
package/src/tools/search/schema.js +0 -102
package/src/tools/search/search.js +0 -561
package/src/tools/search/serper-scraper.js +0 -126
package/src/tools/search/test.js +0 -129
package/src/tools/search/tool.js +0 -453
package/src/tools/search/types.js +0 -2
package/src/tools/search/utils.js +0 -59
package/src/types/graph.js +0 -24
package/src/types/graph.test.js +0 -192
package/src/types/index.js +0 -7
package/src/types/llm.js +0 -2
package/src/types/messages.js +0 -2
package/src/types/run.js +0 -2
package/src/types/stream.js +0 -2
package/src/types/tools.js +0 -2
package/src/utils/contextAnalytics.js +0 -79
package/src/utils/contextAnalytics.test.js +0 -166
package/src/utils/events.js +0 -26
package/src/utils/graph.js +0 -11
package/src/utils/handlers.js +0 -65
package/src/utils/index.js +0 -10
package/src/utils/llm.js +0 -21
package/src/utils/llmConfig.js +0 -205
package/src/utils/logging.js +0 -37
package/src/utils/misc.js +0 -51
package/src/utils/run.js +0 -69
package/src/utils/schema.js +0 -21
package/src/utils/title.js +0 -119
package/src/utils/tokens.js +0 -92
package/src/utils/toonFormat.js +0 -379

package/src/scripts/code_exec_files.js DELETED Viewed

@@ -1,180 +0,0 @@
-// src/scripts/code_exec_files.ts
-/**
- * Tests automatic session tracking for code execution file persistence.
- * Files created in one execution are automatically available in subsequent executions
- * without the LLM needing to track or pass session_id.
- *
- * Run with: npm run code_exec_files
- */
-import { config } from 'dotenv';
-config();
-import { HumanMessage } from '@langchain/core/messages';
-import { ChatModelStreamHandler, createContentAggregator } from '@/stream';
-import { ToolEndHandler, ModelEndHandler, createMetadataAggregator, } from '@/events';
-import { getLLMConfig } from '@/utils/llmConfig';
-import { getArgs } from '@/scripts/args';
-import { Constants, GraphEvents } from '@/common';
-import { Run } from '@/run';
-import { createCodeExecutionTool } from '@/tools/CodeExecutor';
-const conversationHistory = [];
-/**
- * Prints session context from the graph for debugging
- */
-function printSessionContext(run) {
-    const graph = run.Graph;
-    if (!graph) {
-        console.log('[Session] No graph available');
-        return;
-    }
-    const session = graph.sessions.get(Constants.EXECUTE_CODE);
-    if (!session) {
-        console.log('[Session] No session context stored yet');
-        return;
-    }
-    console.log('[Session] Current session context:');
-    console.log(`  - session_id: ${session.session_id}`);
-    console.log(`  - files: ${JSON.stringify(session.files, null, 2)}`);
-    console.log(`  - lastUpdated: ${new Date(session.lastUpdated).toISOString()}`);
-}
-async function testCodeExecution() {
-    const { userName, location, provider, currentDate } = await getArgs();
-    const { contentParts, aggregateContent } = createContentAggregator();
-    const customHandlers = {
-        [GraphEvents.TOOL_END]: new ToolEndHandler(),
-        [GraphEvents.CHAT_MODEL_END]: new ModelEndHandler(),
-        [GraphEvents.CHAT_MODEL_STREAM]: new ChatModelStreamHandler(),
-        [GraphEvents.ON_RUN_STEP_COMPLETED]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP_COMPLETED ======');
-                console.dir(data, { depth: null });
-                aggregateContent({
-                    event,
-                    data: data,
-                });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP ======');
-                console.dir(data, { depth: null });
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP_DELTA]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP_DELTA ======');
-                console.dir(data, { depth: null });
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.ON_MESSAGE_DELTA]: {
-            handle: (event, data) => {
-                console.log('====== ON_MESSAGE_DELTA ======');
-                console.dir(data, { depth: null });
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.TOOL_START]: {
-            handle: (_event, data, _metadata) => {
-                console.log('====== TOOL_START ======');
-                console.dir(data, { depth: null });
-            },
-        },
-    };
-    const llmConfig = getLLMConfig(provider);
-    const run = await Run.create({
-        runId: 'message-num-1',
-        graphConfig: {
-            type: 'standard',
-            llmConfig,
-            tools: [createCodeExecutionTool()],
-            instructions: 'You are a friendly AI assistant with coding capabilities. Always address the user by their name.',
-            additional_instructions: `The user's name is ${userName} and they are located in ${location}. The current date is ${currentDate}.`,
-        },
-        returnContent: true,
-        skipCleanup: true,
-        customHandlers,
-    });
-    const streamConfig = {
-        configurable: {
-            provider,
-            thread_id: 'conversation-num-1',
-        },
-        streamMode: 'values',
-        version: 'v2',
-    };
-    console.log('\n========== Test 1: Create Project Plan ==========\n');
-    console.log('Creating initial file - this establishes the session context.\n');
-    const userMessage1 = `
-  Hi ${userName} here. We are testing your file capabilities.
-  1. Create a text file named "project_plan.txt" that contains: "This is a project plan for a new software development project."
-  Please generate this file so I can review it.
-  `;
-    conversationHistory.push(new HumanMessage(userMessage1));
-    let inputs = {
-        messages: conversationHistory,
-    };
-    await run.processStream(inputs, streamConfig);
-    const finalMessages1 = run.getRunMessages();
-    if (finalMessages1) {
-        conversationHistory.push(...finalMessages1);
-    }
-    console.log('\n\n========== Session Context After Test 1 ==========\n');
-    printSessionContext(run);
-    console.dir(contentParts, { depth: null });
-    console.log('\n========== Test 2: Edit Project Plan ==========\n');
-    console.log('Editing the file from Test 1 - session_id is automatically injected.\n');
-    const userMessage2 = `
-  Thanks for creating the project plan. Now I'd like you to edit the same plan to:
-  1. Read the existing project_plan.txt file
-  2. Add a new section called "Technology Stack" that contains: "The technology stack for this project includes the following technologies" and nothing more.
-  3. Save this as a new file called "project_plan_v2.txt" (remember files are read-only)
-  4. Print the contents of both files to verify
-`;
-    conversationHistory.push(new HumanMessage(userMessage2));
-    inputs = {
-        messages: conversationHistory,
-    };
-    await run.processStream(inputs, streamConfig);
-    const finalMessages2 = run.getRunMessages();
-    if (finalMessages2) {
-        conversationHistory.push(...finalMessages2);
-    }
-    console.log('\n\n========== Session Context After Test 2 ==========\n');
-    printSessionContext(run);
-    console.dir(contentParts, { depth: null });
-    const { handleLLMEnd, collected } = createMetadataAggregator();
-    const titleResult = await run.generateTitle({
-        provider,
-        inputText: userMessage2,
-        contentParts,
-        chainOptions: {
-            callbacks: [
-                {
-                    handleLLMEnd,
-                },
-            ],
-        },
-    });
-    console.log('Generated Title:', titleResult);
-    console.log('Collected metadata:', collected);
-}
-process.on('unhandledRejection', (reason, promise) => {
-    console.error('Unhandled Rejection at:', promise, 'reason:', reason);
-    console.log('Conversation history:');
-    console.dir(conversationHistory, { depth: null });
-    process.exit(1);
-});
-process.on('uncaughtException', (err) => {
-    console.error('Uncaught Exception:', err);
-});
-testCodeExecution().catch((err) => {
-    console.error(err);
-    console.log('Conversation history:');
-    console.dir(conversationHistory, { depth: null });
-    process.exit(1);
-});
-//# sourceMappingURL=code_exec_files.js.map

package/src/scripts/code_exec_multi_session.js DELETED Viewed

@@ -1,185 +0,0 @@
-// src/scripts/code_exec_multi_session.ts
-/**
- * Tests multi-session file tracking for code execution.
- * Verifies that:
- * 1. Files from multiple executions are accumulated
- * 2. Each file tracks its source session_id
- * 3. Edited/recreated files replace older versions (latest preferred)
- *
- * Run with: npm run code_exec_multi_session
- */
-import { config } from 'dotenv';
-config();
-import { HumanMessage } from '@langchain/core/messages';
-import { ChatModelStreamHandler } from '@/stream';
-import { ToolEndHandler, ModelEndHandler } from '@/events';
-import { getLLMConfig } from '@/utils/llmConfig';
-import { getArgs } from '@/scripts/args';
-import { Constants, GraphEvents } from '@/common';
-import { Run } from '@/run';
-import { createCodeExecutionTool } from '@/tools/CodeExecutor';
-const conversationHistory = [];
-/**
- * Prints session context from the graph
- */
-function printSessionContext(run, label) {
-    const graph = run.Graph;
-    if (!graph) {
-        console.log(`\n[${label}] No graph available`);
-        return;
-    }
-    const session = graph.sessions.get(Constants.EXECUTE_CODE);
-    console.log(`\n========== ${label} ==========`);
-    if (!session) {
-        console.log('  No session context stored yet');
-        return;
-    }
-    console.log(`  Latest session_id: ${session.session_id}`);
-    console.log(`  Files tracked: ${session.files?.length ?? 0}`);
-    for (const file of session.files ?? []) {
-        console.log(`    - ${file.name} (session: ${file.session_id})`);
-    }
-}
-async function testMultiSessionFiles() {
-    const { provider } = await getArgs();
-    const customHandlers = {
-        [GraphEvents.TOOL_END]: new ToolEndHandler(),
-        [GraphEvents.CHAT_MODEL_END]: new ModelEndHandler(),
-        [GraphEvents.CHAT_MODEL_STREAM]: new ChatModelStreamHandler(),
-    };
-    const llmConfig = getLLMConfig(provider);
-    const run = await Run.create({
-        runId: 'multi-session-test',
-        graphConfig: {
-            type: 'standard',
-            llmConfig,
-            tools: [createCodeExecutionTool()],
-            instructions: `You are a coding assistant. Execute code exactly as requested.
-When asked to create files, use Python and save to /mnt/data/.
-When reading files, print their contents.
-Be concise in responses.`,
-        },
-        returnContent: true,
-        skipCleanup: true,
-        customHandlers,
-    });
-    const streamConfig = {
-        configurable: {
-            provider,
-            thread_id: 'multi-session-test',
-        },
-        streamMode: 'values',
-        version: 'v2',
-    };
-    // ========== TEST 1: Create first file ==========
-    console.log('\n\n' + '='.repeat(60));
-    console.log('TEST 1: Create first file (file_a.txt)');
-    console.log('='.repeat(60));
-    conversationHistory.push(new HumanMessage(`
-Create a file called "file_a.txt" with the content:
-"This is file A, version 1"
-Print confirmation when done.
-`));
-    await run.processStream({ messages: conversationHistory }, streamConfig);
-    const messages1 = run.getRunMessages();
-    if (messages1)
-        conversationHistory.push(...messages1);
-    printSessionContext(run, 'After Test 1');
-    // ========== TEST 2: Create second file (different session) ==========
-    console.log('\n\n' + '='.repeat(60));
-    console.log('TEST 2: Create second file (file_b.txt)');
-    console.log('Expecting: Both file_a.txt and file_b.txt tracked');
-    console.log('='.repeat(60));
-    conversationHistory.push(new HumanMessage(`
-Create a NEW file called "file_b.txt" with the content:
-"This is file B"
-Print confirmation when done.
-`));
-    await run.processStream({ messages: conversationHistory }, streamConfig);
-    const messages2 = run.getRunMessages();
-    if (messages2)
-        conversationHistory.push(...messages2);
-    printSessionContext(run, 'After Test 2');
-    // ========== TEST 3: Read BOTH files (verifies accumulation) ==========
-    console.log('\n\n' + '='.repeat(60));
-    console.log('TEST 3: Read BOTH files from previous executions');
-    console.log('This verifies multi-session file accumulation works');
-    console.log('='.repeat(60));
-    conversationHistory.push(new HumanMessage(`
-Read and print the contents of BOTH files:
-1. file_a.txt
-2. file_b.txt
-Show me what's in each file.
-`));
-    await run.processStream({ messages: conversationHistory }, streamConfig);
-    const messages3 = run.getRunMessages();
-    if (messages3)
-        conversationHistory.push(...messages3);
-    printSessionContext(run, 'After Test 3');
-    // ========== TEST 4: Edit file_a.txt (verifies latest-wins) ==========
-    console.log('\n\n' + '='.repeat(60));
-    console.log('TEST 4: Edit file_a.txt (create new version)');
-    console.log('Expecting: Old file_a.txt replaced with new version');
-    console.log('='.repeat(60));
-    conversationHistory.push(new HumanMessage(`
-Create an UPDATED version of "file_a.txt" with the content:
-"This is file A, version 2 - UPDATED"
-Print confirmation when done.
-`));
-    await run.processStream({ messages: conversationHistory }, streamConfig);
-    const messages4 = run.getRunMessages();
-    if (messages4)
-        conversationHistory.push(...messages4);
-    printSessionContext(run, 'After Test 4');
-    // ========== TEST 5: Read file_a.txt (verifies latest version) ==========
-    console.log('\n\n' + '='.repeat(60));
-    console.log('TEST 5: Read file_a.txt to verify it has the UPDATED content');
-    console.log('Expected: "version 2 - UPDATED" NOT "version 1"');
-    console.log('='.repeat(60));
-    conversationHistory.push(new HumanMessage(`
-Read and print the contents of file_a.txt.
-Tell me what version it shows.
-`));
-    await run.processStream({ messages: conversationHistory }, streamConfig);
-    const messages5 = run.getRunMessages();
-    if (messages5)
-        conversationHistory.push(...messages5);
-    printSessionContext(run, 'Final Session State');
-    // ========== SUMMARY ==========
-    console.log('\n\n' + '='.repeat(60));
-    console.log('TEST SUMMARY');
-    console.log('='.repeat(60));
-    const finalSession = run.Graph?.sessions.get(Constants.EXECUTE_CODE);
-    if (finalSession) {
-        const files = finalSession.files ?? [];
-        const uniqueSessionIds = new Set(files.map((f) => f.session_id));
-        console.log(`\nTotal files tracked: ${files.length}`);
-        console.log(`Unique session_ids: ${uniqueSessionIds.size}`);
-        console.log('\nFiles:');
-        for (const file of files) {
-            console.log(`  - ${file.name} (session: ${file.session_id?.slice(0, 20)}...)`);
-        }
-        // Verify expectations
-        const fileACount = files.filter((f) => f.name === 'file_a.txt').length;
-        const fileBCount = files.filter((f) => f.name === 'file_b.txt').length;
-        console.log('\n✓ Checks:');
-        console.log(`  file_a.txt count: ${fileACount} (expected: 1, latest wins)`);
-        console.log(`  file_b.txt count: ${fileBCount} (expected: 1)`);
-        if (fileACount === 1 && fileBCount === 1) {
-            console.log('\n✅ All tests passed! Multi-session tracking works.');
-        }
-        else {
-            console.log('\n❌ Test failed - unexpected file counts');
-        }
-    }
-}
-process.on('unhandledRejection', (reason, promise) => {
-    console.error('Unhandled Rejection at:', promise, 'reason:', reason);
-    process.exit(1);
-});
-testMultiSessionFiles().catch((err) => {
-    console.error('Test failed:', err);
-    process.exit(1);
-});
-//# sourceMappingURL=code_exec_multi_session.js.map

package/src/scripts/code_exec_ptc.js DELETED Viewed

@@ -1,265 +0,0 @@
-// src/scripts/code_exec_ptc.ts
-/**
- * Live LLM test for Programmatic Tool Calling (PTC).
- * Run with: npm run code_exec_ptc
- *
- * Tests PTC with a real LLM in the loop, demonstrating:
- * 1. LLM decides when to use PTC
- * 2. LLM writes Python code that calls tools programmatically
- * 3. ToolNode automatically injects programmatic tools
- * 4. Tools filtered by allowed_callers
- */
-import { config } from 'dotenv';
-config();
-import { randomUUID } from 'crypto';
-import { HumanMessage } from '@langchain/core/messages';
-import { ChatModelStreamHandler, createContentAggregator } from '@/stream';
-import {
-// createProgrammaticToolRegistry,
-createGetTeamMembersTool, createGetExpensesTool, createGetWeatherTool, } from '@/test/mockTools';
-import { createMetadataAggregator, ModelEndHandler, ToolEndHandler, } from '@/events';
-import { createProgrammaticToolCallingTool } from '@/tools/ProgrammaticToolCalling';
-import { createCodeExecutionTool } from '@/tools/CodeExecutor';
-import { getLLMConfig } from '@/utils/llmConfig';
-import { getArgs } from '@/scripts/args';
-import { GraphEvents } from '@/common';
-import { Run } from '@/run';
-const conversationHistory = [];
-/**
- * Creates a tool registry where ALL business tools are code_execution ONLY.
- * This forces the LLM to use PTC - it cannot call these tools directly.
- */
-function createPTCOnlyToolRegistry() {
-    const toolDefs = [
-        {
-            name: 'get_team_members',
-            description: 'Get list of team members. Returns array of objects with id, name, and department fields.',
-            parameters: {
-                type: 'object',
-                properties: {},
-                required: [],
-            },
-            allowed_callers: ['code_execution'], // PTC ONLY - not direct
-        },
-        {
-            name: 'get_expenses',
-            description: 'Get expense records for a user. Returns array of objects with amount and category fields.',
-            parameters: {
-                type: 'object',
-                properties: {
-                    user_id: {
-                        type: 'string',
-                        description: 'The user ID to fetch expenses for',
-                    },
-                },
-                required: ['user_id'],
-            },
-            allowed_callers: ['code_execution'], // PTC ONLY - not direct
-        },
-        {
-            name: 'get_weather',
-            description: 'Get current weather for a city. Returns object with temperature (number) and condition (string) fields.',
-            parameters: {
-                type: 'object',
-                properties: {
-                    city: {
-                        type: 'string',
-                        description: 'City name',
-                    },
-                },
-                required: ['city'],
-            },
-            allowed_callers: ['code_execution'], // PTC ONLY - not direct (changed from ['direct', 'code_execution'])
-        },
-    ];
-    return new Map(toolDefs.map((def) => [def.name, def]));
-}
-async function testProgrammaticToolCalling() {
-    const { userName, location, provider, currentDate } = await getArgs();
-    const { contentParts, aggregateContent } = createContentAggregator();
-    const customHandlers = {
-        [GraphEvents.TOOL_END]: new ToolEndHandler(),
-        [GraphEvents.CHAT_MODEL_END]: new ModelEndHandler(),
-        [GraphEvents.CHAT_MODEL_STREAM]: new ChatModelStreamHandler(),
-        [GraphEvents.ON_RUN_STEP_COMPLETED]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP_COMPLETED ======');
-                console.dir(data, { depth: null });
-                aggregateContent({
-                    event,
-                    data: data,
-                });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP ======');
-                console.dir(data, { depth: null });
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP_DELTA]: {
-            handle: (event, data) => {
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.ON_MESSAGE_DELTA]: {
-            handle: (event, data) => {
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.TOOL_START]: {
-            handle: (_event, data, metadata) => {
-                console.log('====== TOOL_START ======');
-                console.dir(data, { depth: null });
-            },
-        },
-    };
-    const llmConfig = getLLMConfig(provider);
-    // Create mock tool instances
-    const teamTool = createGetTeamMembersTool();
-    const expensesTool = createGetExpensesTool();
-    const weatherTool = createGetWeatherTool();
-    // Create special tools
-    const codeExecTool = createCodeExecutionTool();
-    const ptcTool = createProgrammaticToolCallingTool();
-    // Build complete tool list and map
-    const allTools = [teamTool, expensesTool, weatherTool, codeExecTool, ptcTool];
-    const toolMap = new Map(allTools.map((t) => [t.name, t]));
-    // Create tool registry where ALL business tools are PTC-only
-    // This means the LLM CANNOT call get_team_members, get_expenses, get_weather directly
-    // It MUST use run_tools_with_code to invoke them
-    const toolRegistry = createPTCOnlyToolRegistry();
-    console.log('\n' + '='.repeat(70));
-    console.log('Tool Configuration Summary:');
-    console.log('='.repeat(70));
-    console.log('Total tools:', allTools.length);
-    console.log('Programmatic-allowed:', Array.from(toolRegistry.values())
-        .filter((t) => t.allowed_callers?.includes('code_execution'))
-        .map((t) => t.name)
-        .join(', '));
-    console.log('Direct-callable:', Array.from(toolRegistry.values())
-        .filter((t) => !t.allowed_callers || t.allowed_callers.includes('direct'))
-        .map((t) => t.name)
-        .join(', '));
-    console.log('='.repeat(70) + '\n');
-    const run = await Run.create({
-        runId: randomUUID(),
-        graphConfig: {
-            type: 'standard',
-            llmConfig,
-            agents: [
-                {
-                    agentId: 'default',
-                    provider: llmConfig.provider,
-                    clientOptions: llmConfig,
-                    tools: allTools,
-                    toolMap,
-                    toolRegistry,
-                    instructions: 'You are a friendly AI assistant with advanced coding capabilities.\n\n' +
-                        'IMPORTANT: The tools get_team_members(), get_expenses(), and get_weather() are NOT available ' +
-                        'for direct function calling. You MUST use the run_tools_with_code tool to invoke them.\n\n' +
-                        'When you need to use these tools, write Python code using run_tools_with_code that calls:\n' +
-                        '- await get_team_members() - returns list of team members\n' +
-                        '- await get_expenses(user_id="...") - returns expenses for a user\n' +
-                        '- await get_weather(city="...") - returns weather data\n\n' +
-                        'Use asyncio.gather() for parallel execution when calling multiple tools.',
-                    additional_instructions: `The user's name is ${userName} and they are located in ${location}. Today is ${currentDate}.`,
-                },
-            ],
-        },
-        returnContent: true,
-        skipCleanup: true,
-        customHandlers,
-    });
-    const config = {
-        configurable: {
-            provider,
-            thread_id: 'ptc-conversation-1',
-        },
-        streamMode: 'values',
-        version: 'v2',
-    };
-    console.log('Test 1: Team Expense Analysis with PTC');
-    console.log('='.repeat(70) + '\n');
-    const userMessage1 = `Hi ${userName}! I need you to analyze our team's expenses. Please:
-1. Get the list of all team members
-2. For each member, fetch their expense records
-3. Calculate the total expenses per member
-4. Identify anyone who spent more than $500
-5. Show me a summary report
-IMPORTANT: Use the run_tools_with_code tool to do this efficiently.
-Don't call each tool separately - write Python code that orchestrates all the calls!`;
-    conversationHistory.push(new HumanMessage(userMessage1));
-    let inputs = {
-        messages: conversationHistory,
-    };
-    const finalContentParts1 = await run.processStream(inputs, config);
-    const finalMessages1 = run.getRunMessages();
-    if (finalMessages1) {
-        conversationHistory.push(...finalMessages1);
-    }
-    console.log('\n\n====================\n\n');
-    console.log('Content Parts:');
-    console.dir(contentParts, { depth: null });
-    console.log('\n\n' + '='.repeat(70));
-    console.log('Test 2: Conditional Logic and Parallel Execution');
-    console.log('='.repeat(70) + '\n');
-    const userMessage2 = `Great job! Now let's test some advanced patterns. Please:
-1. Check the weather in both San Francisco and New York (in parallel!)
-2. Based on which city has better weather (warmer), fetch the team members
-3. For the Engineering team members only, calculate their travel expenses
-4. Show me the results
-Again, use run_tools_with_code for maximum efficiency. Use asyncio.gather()
-to check both cities' weather at the same time!`;
-    conversationHistory.push(new HumanMessage(userMessage2));
-    inputs = {
-        messages: conversationHistory,
-    };
-    const finalContentParts2 = await run.processStream(inputs, config);
-    const finalMessages2 = run.getRunMessages();
-    if (finalMessages2) {
-        conversationHistory.push(...finalMessages2);
-    }
-    console.log('\n\n====================\n\n');
-    console.log('Final Content Parts:');
-    console.dir(finalContentParts2, { depth: null });
-    console.log('\n\n' + '='.repeat(70));
-    console.log('Generating conversation title...');
-    console.log('='.repeat(70) + '\n');
-    const { handleLLMEnd, collected } = createMetadataAggregator();
-    const titleResult = await run.generateTitle({
-        provider,
-        inputText: userMessage1,
-        contentParts,
-        chainOptions: {
-            callbacks: [
-                {
-                    handleLLMEnd,
-                },
-            ],
-        },
-    });
-    console.log('Generated Title:', titleResult);
-    console.log('Collected metadata:', collected);
-}
-process.on('unhandledRejection', (reason, promise) => {
-    console.error('Unhandled Rejection at:', promise, 'reason:', reason);
-    console.log('Conversation history:');
-    console.dir(conversationHistory, { depth: null });
-    process.exit(1);
-});
-process.on('uncaughtException', (err) => {
-    console.error('Uncaught Exception:', err);
-});
-testProgrammaticToolCalling().catch((err) => {
-    console.error(err);
-    console.log('Conversation history:');
-    console.dir(conversationHistory, { depth: null });
-    process.exit(1);
-});
-//# sourceMappingURL=code_exec_ptc.js.map