npm - @illuma-ai/agents - Versions diffs - 1.1.20 → 1.1.22 - Mend

@illuma-ai/agents 1.1.20 → 1.1.22

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (246) hide show

package/dist/cjs/graphs/Graph.cjs +12 -1
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +85 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -1
package/dist/cjs/llm/bedrock/index.cjs +14 -0
package/dist/cjs/llm/bedrock/index.cjs.map +1 -1
package/dist/cjs/run.cjs +20 -9
package/dist/cjs/run.cjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +12 -1
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +85 -1
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -1
package/dist/esm/llm/bedrock/index.mjs +14 -0
package/dist/esm/llm/bedrock/index.mjs.map +1 -1
package/dist/esm/run.mjs +20 -9
package/dist/esm/run.mjs.map +1 -1
package/dist/types/graphs/MultiAgentGraph.d.ts +17 -0
package/package.json +1 -1
package/src/graphs/Graph.ts +12 -1
package/src/graphs/MultiAgentGraph.ts +105 -1
package/src/graphs/__tests__/multi-agent-delegate.test.ts +191 -0
package/src/llm/bedrock/index.ts +17 -0
package/src/run.ts +20 -11
package/src/scripts/test-bedrock-handoff-autonomous.ts +231 -0
package/src/agents/AgentContext.js +0 -782
package/src/agents/AgentContext.test.js +0 -421
package/src/agents/__tests__/AgentContext.test.js +0 -678
package/src/agents/__tests__/resolveStructuredOutputMode.test.js +0 -117
package/src/common/enum.js +0 -192
package/src/common/index.js +0 -3
package/src/events.js +0 -166
package/src/graphs/Graph.js +0 -1857
package/src/graphs/MultiAgentGraph.js +0 -1092
package/src/graphs/__tests__/structured-output.integration.test.js +0 -624
package/src/graphs/__tests__/structured-output.test.js +0 -144
package/src/graphs/contextManagement.e2e.test.js +0 -718
package/src/graphs/contextManagement.test.js +0 -485
package/src/graphs/handoffValidation.test.js +0 -276
package/src/graphs/index.js +0 -3
package/src/index.js +0 -28
package/src/instrumentation.js +0 -21
package/src/llm/anthropic/index.js +0 -319
package/src/llm/anthropic/types.js +0 -46
package/src/llm/anthropic/utils/message_inputs.js +0 -627
package/src/llm/anthropic/utils/message_outputs.js +0 -290
package/src/llm/anthropic/utils/output_parsers.js +0 -89
package/src/llm/anthropic/utils/tools.js +0 -25
package/src/llm/bedrock/__tests__/bedrock-caching.test.js +0 -392
package/src/llm/bedrock/index.js +0 -303
package/src/llm/bedrock/types.js +0 -2
package/src/llm/bedrock/utils/index.js +0 -6
package/src/llm/bedrock/utils/message_inputs.js +0 -463
package/src/llm/bedrock/utils/message_outputs.js +0 -269
package/src/llm/fake.js +0 -92
package/src/llm/google/index.js +0 -215
package/src/llm/google/types.js +0 -12
package/src/llm/google/utils/common.js +0 -670
package/src/llm/google/utils/tools.js +0 -111
package/src/llm/google/utils/zod_to_genai_parameters.js +0 -47
package/src/llm/openai/index.js +0 -1033
package/src/llm/openai/types.js +0 -2
package/src/llm/openai/utils/index.js +0 -756
package/src/llm/openai/utils/isReasoningModel.test.js +0 -79
package/src/llm/openrouter/index.js +0 -261
package/src/llm/openrouter/reasoning.test.js +0 -181
package/src/llm/providers.js +0 -36
package/src/llm/text.js +0 -65
package/src/llm/vertexai/index.js +0 -402
package/src/messages/__tests__/tools.test.js +0 -392
package/src/messages/cache.js +0 -404
package/src/messages/cache.test.js +0 -1167
package/src/messages/content.js +0 -48
package/src/messages/content.test.js +0 -314
package/src/messages/core.js +0 -359
package/src/messages/ensureThinkingBlock.test.js +0 -997
package/src/messages/format.js +0 -973
package/src/messages/formatAgentMessages.test.js +0 -2278
package/src/messages/formatAgentMessages.tools.test.js +0 -362
package/src/messages/formatMessage.test.js +0 -608
package/src/messages/ids.js +0 -18
package/src/messages/index.js +0 -9
package/src/messages/labelContentByAgent.test.js +0 -725
package/src/messages/prune.js +0 -438
package/src/messages/reducer.js +0 -60
package/src/messages/shiftIndexTokenCountMap.test.js +0 -63
package/src/messages/summarize.js +0 -146
package/src/messages/summarize.test.js +0 -332
package/src/messages/tools.js +0 -90
package/src/mockStream.js +0 -81
package/src/prompts/collab.js +0 -7
package/src/prompts/index.js +0 -3
package/src/prompts/taskmanager.js +0 -58
package/src/run.js +0 -427
package/src/schemas/index.js +0 -3
package/src/schemas/schema-preparation.test.js +0 -370
package/src/schemas/validate.js +0 -314
package/src/schemas/validate.test.js +0 -264
package/src/scripts/abort.js +0 -127
package/src/scripts/ant_web_search.js +0 -130
package/src/scripts/ant_web_search_edge_case.js +0 -133
package/src/scripts/ant_web_search_error_edge_case.js +0 -119
package/src/scripts/args.js +0 -41
package/src/scripts/bedrock-cache-debug.js +0 -186
package/src/scripts/bedrock-content-aggregation-test.js +0 -195
package/src/scripts/bedrock-merge-test.js +0 -80
package/src/scripts/bedrock-parallel-tools-test.js +0 -150
package/src/scripts/caching.js +0 -106
package/src/scripts/cli.js +0 -152
package/src/scripts/cli2.js +0 -119
package/src/scripts/cli3.js +0 -163
package/src/scripts/cli4.js +0 -165
package/src/scripts/cli5.js +0 -165
package/src/scripts/code_exec.js +0 -171
package/src/scripts/code_exec_files.js +0 -180
package/src/scripts/code_exec_multi_session.js +0 -185
package/src/scripts/code_exec_ptc.js +0 -265
package/src/scripts/code_exec_session.js +0 -217
package/src/scripts/code_exec_simple.js +0 -120
package/src/scripts/content.js +0 -111
package/src/scripts/empty_input.js +0 -125
package/src/scripts/handoff-test.js +0 -96
package/src/scripts/image.js +0 -138
package/src/scripts/memory.js +0 -83
package/src/scripts/multi-agent-chain.js +0 -271
package/src/scripts/multi-agent-conditional.js +0 -185
package/src/scripts/multi-agent-document-review-chain.js +0 -171
package/src/scripts/multi-agent-hybrid-flow.js +0 -264
package/src/scripts/multi-agent-parallel-start.js +0 -214
package/src/scripts/multi-agent-parallel.js +0 -346
package/src/scripts/multi-agent-sequence.js +0 -184
package/src/scripts/multi-agent-supervisor.js +0 -324
package/src/scripts/multi-agent-test.js +0 -147
package/src/scripts/parallel-asymmetric-tools-test.js +0 -202
package/src/scripts/parallel-full-metadata-test.js +0 -176
package/src/scripts/parallel-tools-test.js +0 -256
package/src/scripts/programmatic_exec.js +0 -277
package/src/scripts/programmatic_exec_agent.js +0 -168
package/src/scripts/search.js +0 -118
package/src/scripts/sequential-full-metadata-test.js +0 -143
package/src/scripts/simple.js +0 -174
package/src/scripts/single-agent-metadata-test.js +0 -152
package/src/scripts/stream.js +0 -113
package/src/scripts/test-custom-prompt-key.js +0 -132
package/src/scripts/test-handoff-input.js +0 -143
package/src/scripts/test-handoff-preamble.js +0 -227
package/src/scripts/test-handoff-steering.js +0 -353
package/src/scripts/test-multi-agent-list-handoff.js +0 -318
package/src/scripts/test-parallel-agent-labeling.js +0 -253
package/src/scripts/test-parallel-handoffs.js +0 -229
package/src/scripts/test-thinking-handoff-bedrock.js +0 -132
package/src/scripts/test-thinking-handoff.js +0 -132
package/src/scripts/test-thinking-to-thinking-handoff-bedrock.js +0 -140
package/src/scripts/test-tool-before-handoff-role-order.js +0 -223
package/src/scripts/test-tools-before-handoff.js +0 -187
package/src/scripts/test_code_api.js +0 -263
package/src/scripts/thinking-bedrock.js +0 -128
package/src/scripts/thinking-vertexai.js +0 -130
package/src/scripts/thinking.js +0 -134
package/src/scripts/tool_search.js +0 -114
package/src/scripts/tools.js +0 -125
package/src/specs/agent-handoffs-bedrock.integration.test.js +0 -280
package/src/specs/agent-handoffs.test.js +0 -924
package/src/specs/anthropic.simple.test.js +0 -287
package/src/specs/azure.simple.test.js +0 -381
package/src/specs/cache.simple.test.js +0 -282
package/src/specs/custom-event-await.test.js +0 -148
package/src/specs/deepseek.simple.test.js +0 -189
package/src/specs/emergency-prune.test.js +0 -308
package/src/specs/moonshot.simple.test.js +0 -237
package/src/specs/observability.integration.test.js +0 -1337
package/src/specs/openai.simple.test.js +0 -233
package/src/specs/openrouter.simple.test.js +0 -202
package/src/specs/prune.test.js +0 -733
package/src/specs/reasoning.test.js +0 -144
package/src/specs/spec.utils.js +0 -4
package/src/specs/thinking-handoff.test.js +0 -486
package/src/specs/thinking-prune.test.js +0 -600
package/src/specs/token-distribution-edge-case.test.js +0 -246
package/src/specs/token-memoization.test.js +0 -32
package/src/specs/tokens.test.js +0 -49
package/src/specs/tool-error.test.js +0 -139
package/src/splitStream.js +0 -204
package/src/splitStream.test.js +0 -504
package/src/stream.js +0 -650
package/src/stream.test.js +0 -225
package/src/test/mockTools.js +0 -340
package/src/tools/BrowserTools.js +0 -245
package/src/tools/Calculator.js +0 -38
package/src/tools/Calculator.test.js +0 -225
package/src/tools/CodeExecutor.js +0 -233
package/src/tools/ProgrammaticToolCalling.js +0 -602
package/src/tools/StreamingToolCallBuffer.js +0 -179
package/src/tools/ToolNode.js +0 -930
package/src/tools/ToolSearch.js +0 -904
package/src/tools/__tests__/BrowserTools.test.js +0 -306
package/src/tools/__tests__/ProgrammaticToolCalling.integration.test.js +0 -276
package/src/tools/__tests__/ProgrammaticToolCalling.test.js +0 -807
package/src/tools/__tests__/StreamingToolCallBuffer.test.js +0 -175
package/src/tools/__tests__/ToolApproval.test.js +0 -675
package/src/tools/__tests__/ToolNode.recovery.test.js +0 -200
package/src/tools/__tests__/ToolNode.session.test.js +0 -319
package/src/tools/__tests__/ToolSearch.integration.test.js +0 -125
package/src/tools/__tests__/ToolSearch.test.js +0 -812
package/src/tools/__tests__/handlers.test.js +0 -799
package/src/tools/__tests__/truncation-recovery.integration.test.js +0 -362
package/src/tools/handlers.js +0 -306
package/src/tools/schema.js +0 -25
package/src/tools/search/anthropic.js +0 -34
package/src/tools/search/content.js +0 -116
package/src/tools/search/content.test.js +0 -133
package/src/tools/search/firecrawl.js +0 -173
package/src/tools/search/format.js +0 -198
package/src/tools/search/highlights.js +0 -241
package/src/tools/search/index.js +0 -3
package/src/tools/search/jina-reranker.test.js +0 -106
package/src/tools/search/rerankers.js +0 -165
package/src/tools/search/schema.js +0 -102
package/src/tools/search/search.js +0 -561
package/src/tools/search/serper-scraper.js +0 -126
package/src/tools/search/test.js +0 -129
package/src/tools/search/tool.js +0 -453
package/src/tools/search/types.js +0 -2
package/src/tools/search/utils.js +0 -59
package/src/types/graph.js +0 -24
package/src/types/graph.test.js +0 -192
package/src/types/index.js +0 -7
package/src/types/llm.js +0 -2
package/src/types/messages.js +0 -2
package/src/types/run.js +0 -2
package/src/types/stream.js +0 -2
package/src/types/tools.js +0 -2
package/src/utils/contextAnalytics.js +0 -79
package/src/utils/contextAnalytics.test.js +0 -166
package/src/utils/events.js +0 -26
package/src/utils/graph.js +0 -11
package/src/utils/handlers.js +0 -65
package/src/utils/index.js +0 -10
package/src/utils/llm.js +0 -21
package/src/utils/llmConfig.js +0 -205
package/src/utils/logging.js +0 -37
package/src/utils/misc.js +0 -51
package/src/utils/run.js +0 -69
package/src/utils/schema.js +0 -21
package/src/utils/title.js +0 -119
package/src/utils/tokens.js +0 -92
package/src/utils/toonFormat.js +0 -379

package/src/scripts/ant_web_search_error_edge_case.js DELETED Viewed

@@ -1,119 +0,0 @@
-/* eslint-disable no-console */
-// src/scripts/ant_web_search_error_edge_case.ts
-import { config } from 'dotenv';
-config();
-import { HumanMessage } from '@langchain/core/messages';
-import { ChatModelStreamHandler, createContentAggregator } from '@/stream';
-import { ToolEndHandler, ModelEndHandler } from '@/events';
-import { getArgs } from '@/scripts/args';
-import { Run } from '@/run';
-import { GraphEvents, Providers } from '@/common';
-import { getLLMConfig } from '@/utils/llmConfig';
-const conversationHistory = [];
-let _contentParts = [];
-async function testStandardStreaming() {
-    const { userName, location, currentDate } = await getArgs();
-    const { contentParts, aggregateContent } = createContentAggregator();
-    _contentParts = contentParts;
-    const customHandlers = {
-        [GraphEvents.TOOL_END]: new ToolEndHandler(),
-        [GraphEvents.CHAT_MODEL_END]: new ModelEndHandler(),
-        [GraphEvents.CHAT_MODEL_STREAM]: new ChatModelStreamHandler(),
-        [GraphEvents.ON_RUN_STEP_COMPLETED]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP_COMPLETED ======');
-                // console.dir(data, { depth: null });
-                aggregateContent({
-                    event,
-                    data: data,
-                });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP ======');
-                console.dir(data, { depth: null });
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP_DELTA]: {
-            handle: (event, data) => {
-                console.log('====== ON_RUN_STEP_DELTA ======');
-                console.dir(data, { depth: null });
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.ON_MESSAGE_DELTA]: {
-            handle: (event, data) => {
-                // console.log('====== ON_MESSAGE_DELTA ======');
-                // console.dir(data, { depth: null });
-                aggregateContent({ event, data: data });
-            },
-        },
-        [GraphEvents.TOOL_START]: {
-            handle: (_event, data, metadata) => {
-                console.log('====== TOOL_START ======');
-                // console.dir(data, { depth: null });
-            },
-        },
-    };
-    const llmConfig = getLLMConfig(Providers.ANTHROPIC);
-    llmConfig.model = 'claude-haiku-4-5';
-    const run = await Run.create({
-        runId: 'test-run-id',
-        graphConfig: {
-            type: 'standard',
-            llmConfig,
-            tools: [
-                {
-                    type: 'web_search_20250305',
-                    name: 'web_search',
-                    max_uses: 5,
-                },
-            ],
-            instructions: 'You are a helpful AI research assistant.',
-        },
-        returnContent: true,
-        skipCleanup: true,
-        customHandlers,
-    });
-    const config = {
-        configurable: {
-            provider: Providers.ANTHROPIC,
-            thread_id: 'conversation-num-1',
-        },
-        streamMode: 'values',
-        version: 'v2',
-    };
-    console.log('Test: Web search with multiple searches (error edge case test)');
-    // This prompt should trigger multiple web searches which may result in errors
-    const userMessage = 'Do a deep deep research on CoreWeave. I need you to perform multiple searches before you generate the answer. The basis of our research should be to investigate if this is a solid long term investment.';
-    conversationHistory.push(new HumanMessage(userMessage));
-    const inputs = {
-        messages: conversationHistory,
-    };
-    const finalContentParts = await run.processStream(inputs, config);
-    const finalMessages = run.getRunMessages();
-    if (finalMessages) {
-        conversationHistory.push(...finalMessages);
-        console.dir(conversationHistory, { depth: null });
-    }
-    // console.dir(finalContentParts, { depth: null });
-    console.log('\n\n====================\n\n');
-    // console.dir(contentParts, { depth: null });
-}
-process.on('unhandledRejection', (reason, promise) => {
-    console.error('Unhandled Rejection at:', promise, 'reason:', reason);
-    console.log('Content Parts:');
-    console.dir(_contentParts, { depth: null });
-    process.exit(1);
-});
-testStandardStreaming().catch((err) => {
-    console.error(err);
-    console.log('Conversation history:');
-    console.dir(conversationHistory, { depth: null });
-    console.log('Content Parts:');
-    console.dir(_contentParts, { depth: null });
-    process.exit(1);
-});
-//# sourceMappingURL=ant_web_search_error_edge_case.js.map

package/src/scripts/args.js DELETED Viewed

@@ -1,41 +0,0 @@
-// src/scripts/args.ts
-import yargs from 'yargs';
-import { hideBin } from 'yargs/helpers';
-import { llmConfigs } from '@/utils/llmConfig';
-import { Providers } from '@/common';
-export async function getArgs() {
-    const argv = yargs(hideBin(process.argv))
-        .option('name', {
-        alias: 'n',
-        type: 'string',
-        description: 'User name',
-        default: 'Jo',
-    })
-        .option('location', {
-        alias: 'l',
-        type: 'string',
-        description: 'User location',
-        default: 'New York',
-    })
-        .option('provider', {
-        alias: 'p',
-        type: 'string',
-        description: 'LLM provider',
-        choices: Object.keys(llmConfigs),
-        default: Providers.OPENAI,
-    })
-        .help()
-        .alias('help', 'h').argv;
-    const args = await argv;
-    const userName = args.name;
-    const location = args.location;
-    const provider = args.provider;
-    const currentDate = new Date().toLocaleString();
-    return {
-        userName,
-        location,
-        provider,
-        currentDate,
-    };
-}
-//# sourceMappingURL=args.js.map

package/src/scripts/bedrock-cache-debug.js DELETED Viewed

@@ -1,186 +0,0 @@
-/**
- * Debug script to investigate cache token omission in Bedrock responses.
- *
- * This script:
- * 1. Makes a streaming call to Bedrock and logs the raw metadata event
- * 2. Shows exactly what fields the AWS SDK returns in usage (including cache tokens)
- * 3. Shows what our handleConverseStreamMetadata produces vs what it should produce
- * 4. Makes a multi-turn call to trigger caching and verify cache tokens appear
- */
-import { config } from 'dotenv';
-config();
-import { concat } from '@langchain/core/utils/stream';
-import { HumanMessage } from '@langchain/core/messages';
-import { BedrockRuntimeClient, ConverseStreamCommand, } from '@aws-sdk/client-bedrock-runtime';
-import { CustomChatBedrockConverse } from '@/llm/bedrock';
-const region = process.env.BEDROCK_AWS_REGION ?? 'us-east-1';
-const credentials = {
-    accessKeyId: process.env.BEDROCK_AWS_ACCESS_KEY_ID,
-    secretAccessKey: process.env.BEDROCK_AWS_SECRET_ACCESS_KEY,
-};
-const MODEL_ID = 'us.anthropic.claude-sonnet-4-5-20250929-v1:0';
-// A long system prompt to increase likelihood of cache usage
-// Bedrock requires minimum 1024 tokens for prompt caching to activate
-const SYSTEM_PROMPT = `You are an expert assistant. Here is a large context block to help trigger cache behavior:
-${Array(200).fill('This is padding content to make the prompt large enough to trigger Bedrock prompt caching. The minimum requirement for Anthropic models on Bedrock is 1024 tokens in the cached prefix. We need to ensure this prompt is well above that threshold. ').join('')}
-When answering, be brief and direct.`;
-async function rawSdkCall() {
-    console.log('='.repeat(60));
-    console.log('TEST 1: Raw AWS SDK call - inspect metadata.usage directly');
-    console.log('='.repeat(60));
-    const client = new BedrockRuntimeClient({ region, credentials });
-    // First call - should create cache
-    // Use cachePoint block to explicitly enable prompt caching
-    console.log('\n--- Call 1 (cache write expected) ---');
-    const command1 = new ConverseStreamCommand({
-        modelId: MODEL_ID,
-        system: [{ text: SYSTEM_PROMPT }, { cachePoint: { type: 'default' } }],
-        messages: [{ role: 'user', content: [{ text: 'What is 2+2?' }] }],
-        inferenceConfig: { maxTokens: 100 },
-    });
-    const response1 = await client.send(command1);
-    if (response1.stream) {
-        for await (const event of response1.stream) {
-            if (event.metadata != null) {
-                console.log('\nRAW metadata event (Call 1):');
-                console.dir(event.metadata, { depth: null });
-                console.log('\nRAW metadata.usage:');
-                console.dir(event.metadata.usage, { depth: null });
-                console.log('\nSpecific cache fields:');
-                console.log('  cacheReadInputTokens:', event.metadata.usage
-                    ?.cacheReadInputTokens);
-                console.log('  cacheWriteInputTokens:', event.metadata.usage
-                    ?.cacheWriteInputTokens);
-            }
-        }
-    }
-    // Second call - should read from cache
-    console.log('\n--- Call 2 (cache read expected) ---');
-    const command2 = new ConverseStreamCommand({
-        modelId: MODEL_ID,
-        system: [{ text: SYSTEM_PROMPT }, { cachePoint: { type: 'default' } }],
-        messages: [
-            { role: 'user', content: [{ text: 'What is 2+2?' }] },
-            { role: 'assistant', content: [{ text: '4' }] },
-            { role: 'user', content: [{ text: 'And what is 3+3?' }] },
-        ],
-        inferenceConfig: { maxTokens: 100 },
-    });
-    const response2 = await client.send(command2);
-    if (response2.stream) {
-        for await (const event of response2.stream) {
-            if (event.metadata != null) {
-                console.log('\nRAW metadata event (Call 2):');
-                console.dir(event.metadata, { depth: null });
-                console.log('\nRAW metadata.usage:');
-                console.dir(event.metadata.usage, { depth: null });
-                console.log('\nSpecific cache fields:');
-                console.log('  cacheReadInputTokens:', event.metadata.usage
-                    ?.cacheReadInputTokens);
-                console.log('  cacheWriteInputTokens:', event.metadata.usage
-                    ?.cacheWriteInputTokens);
-            }
-        }
-    }
-}
-async function wrapperStreamCallNoCachePoint() {
-    console.log('\n' + '='.repeat(60));
-    console.log('TEST 2: CustomChatBedrockConverse stream (NO cachePoint) - check usage_metadata');
-    console.log('='.repeat(60));
-    console.log('(Without cachePoint, Bedrock does NOT return cache tokens)');
-    const model = new CustomChatBedrockConverse({
-        model: MODEL_ID,
-        region,
-        credentials,
-        maxTokens: 100,
-        streaming: true,
-        streamUsage: true,
-    });
-    console.log('\n--- Wrapper Call (no cachePoint) ---');
-    const messages1 = [new HumanMessage(SYSTEM_PROMPT + '\n\nWhat is 2+2?')];
-    let finalChunk1;
-    for await (const chunk of await model.stream(messages1)) {
-        finalChunk1 = finalChunk1 ? concat(finalChunk1, chunk) : chunk;
-    }
-    console.log('\nFinal usage_metadata:', JSON.stringify(finalChunk1.usage_metadata));
-    console.log('(No cache tokens expected since no cachePoint block was sent)');
-}
-async function wrapperStreamCallWithCachePoint() {
-    console.log('\n' + '='.repeat(60));
-    console.log('TEST 3: Raw SDK with cachePoint -> verify handleConverseStreamMetadata extracts cache tokens');
-    console.log('='.repeat(60));
-    // We use the raw SDK with cachePoint to trigger caching, then verify
-    // that our handleConverseStreamMetadata function properly extracts cache fields
-    const { handleConverseStreamMetadata } = await import('@/llm/bedrock/utils/message_outputs');
-    const client = new BedrockRuntimeClient({ region, credentials });
-    // Call 1 - establish cache
-    console.log('\n--- Call 1 (cache write) ---');
-    const command1 = new ConverseStreamCommand({
-        modelId: MODEL_ID,
-        system: [{ text: SYSTEM_PROMPT }, { cachePoint: { type: 'default' } }],
-        messages: [{ role: 'user', content: [{ text: 'What is 2+2?' }] }],
-        inferenceConfig: { maxTokens: 100 },
-    });
-    const response1 = await client.send(command1);
-    if (response1.stream) {
-        for await (const event of response1.stream) {
-            if (event.metadata != null) {
-                console.log('Raw usage:', JSON.stringify(event.metadata.usage));
-                // Test our handler
-                const chunk = handleConverseStreamMetadata(event.metadata, {
-                    streamUsage: true,
-                });
-                const msg = chunk.message;
-                console.log('handleConverseStreamMetadata output usage_metadata:', JSON.stringify(msg.usage_metadata));
-                const hasDetails = msg.usage_metadata?.input_token_details != null;
-                console.log(`Has input_token_details: ${hasDetails}`, hasDetails
-                    ? JSON.stringify(msg.usage_metadata.input_token_details)
-                    : '(MISSING - BUG!)');
-            }
-        }
-    }
-    // Call 2 - read from cache
-    console.log('\n--- Call 2 (cache read) ---');
-    const command2 = new ConverseStreamCommand({
-        modelId: MODEL_ID,
-        system: [{ text: SYSTEM_PROMPT }, { cachePoint: { type: 'default' } }],
-        messages: [
-            { role: 'user', content: [{ text: 'What is 2+2?' }] },
-            { role: 'assistant', content: [{ text: '4' }] },
-            { role: 'user', content: [{ text: 'What is 3+3?' }] },
-        ],
-        inferenceConfig: { maxTokens: 100 },
-    });
-    const response2 = await client.send(command2);
-    if (response2.stream) {
-        for await (const event of response2.stream) {
-            if (event.metadata != null) {
-                console.log('Raw usage:', JSON.stringify(event.metadata.usage));
-                const chunk = handleConverseStreamMetadata(event.metadata, {
-                    streamUsage: true,
-                });
-                const msg = chunk.message;
-                console.log('handleConverseStreamMetadata output usage_metadata:', JSON.stringify(msg.usage_metadata));
-                const hasDetails = msg.usage_metadata?.input_token_details != null;
-                console.log(`Has input_token_details: ${hasDetails}`, hasDetails
-                    ? JSON.stringify(msg.usage_metadata.input_token_details)
-                    : '(MISSING - BUG!)');
-            }
-        }
-    }
-}
-async function main() {
-    console.log('Bedrock Cache Token Debug Script');
-    console.log(`Model: ${MODEL_ID}`);
-    console.log(`Region: ${region}\n`);
-    await rawSdkCall();
-    await wrapperStreamCallNoCachePoint();
-    await wrapperStreamCallWithCachePoint();
-}
-main().catch((err) => {
-    console.error('Fatal error:', err);
-    process.exit(1);
-});
-//# sourceMappingURL=bedrock-cache-debug.js.map

package/src/scripts/bedrock-content-aggregation-test.js DELETED Viewed

@@ -1,195 +0,0 @@
-import { config } from 'dotenv';
-config();
-import { HumanMessage } from '@langchain/core/messages';
-import { ChatModelStreamHandler, createContentAggregator } from '@/stream';
-import { createCodeExecutionTool } from '@/tools/CodeExecutor';
-import { ToolEndHandler, ModelEndHandler } from '@/events';
-import { GraphEvents, ContentTypes, Providers } from '@/common';
-import { getLLMConfig } from '@/utils/llmConfig';
-import { Run } from '@/run';
-const conversationHistory = [];
-let _contentParts = [];
-const collectedUsage = [];
-async function testBedrockContentAggregation() {
-    const instructions = 'You are a helpful AI assistant with coding capabilities. When answering questions, be thorough in your reasoning.';
-    const { contentParts, aggregateContent } = createContentAggregator();
-    _contentParts = contentParts;
-    const customHandlers = {
-        [GraphEvents.TOOL_END]: new ToolEndHandler(),
-        [GraphEvents.CHAT_MODEL_END]: new ModelEndHandler(collectedUsage),
-        [GraphEvents.CHAT_MODEL_STREAM]: new ChatModelStreamHandler(),
-        [GraphEvents.ON_RUN_STEP_COMPLETED]: {
-            handle: (event, data) => {
-                const result = data.result;
-                console.log(`[ON_RUN_STEP_COMPLETED] stepId=${result.id} index=${result.index} type=${result.type} tool=${result.tool_call?.name ?? 'n/a'}`);
-                aggregateContent({
-                    event,
-                    data: data,
-                });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP]: {
-            handle: (event, data) => {
-                const toolCalls = data.stepDetails.type === 'tool_calls' && data.stepDetails.tool_calls
-                    ? data.stepDetails.tool_calls
-                        .map((tc) => `${tc.name ?? '?'}(${tc.id ?? '?'})`)
-                        .join(', ')
-                    : 'none';
-                console.log(`[ON_RUN_STEP] stepId=${data.id} index=${data.index} type=${data.type} stepIndex=${data.stepIndex} toolCalls=[${toolCalls}]`);
-                aggregateContent({ event, data });
-            },
-        },
-        [GraphEvents.ON_RUN_STEP_DELTA]: {
-            handle: (event, data) => {
-                const tcNames = data.delta.tool_calls
-                    ?.map((tc) => `${tc.name ?? '?'}(args=${(tc.args ?? '').substring(0, 30)}...)`)
-                    .join(', ') ?? 'none';
-                console.log(`[ON_RUN_STEP_DELTA] stepId=${data.id} type=${data.delta.type} toolCalls=[${tcNames}]`);
-                aggregateContent({ event, data });
-            },
-        },
-        [GraphEvents.ON_MESSAGE_DELTA]: {
-            handle: (event, data) => {
-                const preview = Array.isArray(data.delta.content)
-                    ? data.delta.content
-                        .map((c) => `${c.type}:"${String(c.text ?? c.think ?? '').substring(0, 40)}"`)
-                        .join(', ')
-                    : String(data.delta.content).substring(0, 40);
-                console.log(`[ON_MESSAGE_DELTA] stepId=${data.id} content=[${preview}]`);
-                aggregateContent({ event, data });
-            },
-        },
-        [GraphEvents.ON_REASONING_DELTA]: {
-            handle: (event, data) => {
-                const preview = Array.isArray(data.delta.content)
-                    ? data.delta.content
-                        .map((c) => `${c.type}:"${String(c.think ?? '').substring(0, 40)}"`)
-                        .join(', ')
-                    : '?';
-                console.log(`[ON_REASONING_DELTA] stepId=${data.id} content=[${preview}]`);
-                aggregateContent({ event, data });
-            },
-        },
-    };
-    const baseLlmConfig = getLLMConfig(Providers.BEDROCK);
-    const llmConfig = {
-        ...baseLlmConfig,
-        model: 'global.anthropic.claude-opus-4-6-v1',
-        maxTokens: 16000,
-        additionalModelRequestFields: {
-            thinking: { type: 'enabled', budget_tokens: 10000 },
-        },
-    };
-    const run = await Run.create({
-        runId: 'bedrock-content-aggregation-test',
-        graphConfig: {
-            instructions,
-            type: 'standard',
-            tools: [createCodeExecutionTool()],
-            llmConfig,
-        },
-        returnContent: true,
-        skipCleanup: true,
-        customHandlers: customHandlers,
-    });
-    const streamConfig = {
-        configurable: {
-            thread_id: 'bedrock-content-aggregation-thread',
-        },
-        streamMode: 'values',
-        version: 'v2',
-    };
-    const userMessage = `im testing edge cases with our code interpreter. i know we can persist files, but what happens when we put them in directories?`;
-    conversationHistory.push(new HumanMessage(userMessage));
-    console.log('Running Bedrock content aggregation test...\n');
-    console.log(`Prompt: "${userMessage}"\n`);
-    const inputs = { messages: [...conversationHistory] };
-    await run.processStream(inputs, streamConfig);
-    console.log('\n\n========== CONTENT PARTS ANALYSIS ==========\n');
-    let hasEmptyToolCall = false;
-    let hasReasoningOrderIssue = false;
-    for (let i = 0; i < _contentParts.length; i++) {
-        const part = _contentParts[i];
-        if (!part) {
-            console.log(`  [${i}] undefined`);
-            continue;
-        }
-        const partType = part.type;
-        if (partType === ContentTypes.TOOL_CALL) {
-            const tc = part.tool_call;
-            if (!tc || !tc.name) {
-                hasEmptyToolCall = true;
-                console.log(`  [${i}] TOOL_CALL *** EMPTY (no tool_call data) ***`);
-            }
-            else {
-                const outputPreview = tc.output
-                    ? `output=${tc.output.substring(0, 80)}...`
-                    : 'no output';
-                console.log(`  [${i}] TOOL_CALL name=${tc.name} ${outputPreview}`);
-            }
-        }
-        else if (partType === ContentTypes.THINK) {
-            const think = part.think ?? '';
-            console.log(`  [${i}] THINK (${think.length} chars): "${think.substring(0, 80)}..."`);
-        }
-        else if (partType === ContentTypes.TEXT) {
-            const text = part.text ?? '';
-            console.log(`  [${i}] TEXT (${text.length} chars): "${text.substring(0, 80)}..."`);
-        }
-        else {
-            console.log(`  [${i}] ${partType}`);
-        }
-    }
-    /**
-     * Check reasoning ordering within a single invocation cycle.
-     * A tool_call resets the cycle — text before think across different
-     * invocations (e.g., text from invocation 2, think from invocation 3) is valid.
-     */
-    let lastTextInCycle = null;
-    for (let i = 0; i < _contentParts.length; i++) {
-        const part = _contentParts[i];
-        if (!part)
-            continue;
-        if (part.type === ContentTypes.TOOL_CALL) {
-            lastTextInCycle = null;
-            continue;
-        }
-        if (part.type === ContentTypes.TEXT) {
-            lastTextInCycle = i;
-        }
-        else if (part.type === ContentTypes.THINK && lastTextInCycle !== null) {
-            const prevText = _contentParts[lastTextInCycle];
-            const thinkContent = part.think ?? '';
-            if (prevText?.text &&
-                prevText.text.trim().length > 5 &&
-                thinkContent.length > 0) {
-                hasReasoningOrderIssue = true;
-                console.log(`\n  *** ORDERING ISSUE (same invocation): TEXT at [${lastTextInCycle}] appears before THINK at [${i}]`);
-                console.log(`      Text ends with: "...${prevText.text.substring(prevText.text.length - 60)}"`);
-                console.log(`      Think starts with: "${thinkContent.substring(0, 60)}..."`);
-            }
-        }
-    }
-    console.log('\n========== SUMMARY ==========\n');
-    console.log(`Total content parts: ${_contentParts.filter(Boolean).length}`);
-    console.log(`Empty tool_call parts: ${hasEmptyToolCall ? 'YES (BUG)' : 'No'}`);
-    console.log(`Reasoning order issues: ${hasReasoningOrderIssue ? 'YES (BUG)' : 'No'}`);
-    console.log('\nFull contentParts dump:');
-    console.dir(_contentParts, { depth: null });
-}
-process.on('unhandledRejection', (reason, promise) => {
-    console.error('Unhandled Rejection at:', promise, 'reason:', reason);
-    console.log('Content parts:');
-    console.dir(_contentParts, { depth: null });
-    process.exit(1);
-});
-process.on('uncaughtException', (err) => {
-    console.error('Uncaught Exception:', err);
-});
-testBedrockContentAggregation().catch((err) => {
-    console.error(err);
-    console.log('Content parts:');
-    console.dir(_contentParts, { depth: null });
-    process.exit(1);
-});
-//# sourceMappingURL=bedrock-content-aggregation-test.js.map

package/src/scripts/bedrock-merge-test.js DELETED Viewed

@@ -1,80 +0,0 @@
-import { config } from 'dotenv';
-config();
-import { HumanMessage } from '@langchain/core/messages';
-import { concat } from '@langchain/core/utils/stream';
-import { CustomChatBedrockConverse } from '@/llm/bedrock';
-import { modifyDeltaProperties } from '@/messages/core';
-import { Providers } from '@/common';
-async function testBedrockMerge() {
-    const model = new CustomChatBedrockConverse({
-        model: 'us.anthropic.claude-3-7-sonnet-20250219-v1:0',
-        region: process.env.BEDROCK_AWS_REGION,
-        credentials: {
-            accessKeyId: process.env.BEDROCK_AWS_ACCESS_KEY_ID,
-            secretAccessKey: process.env.BEDROCK_AWS_SECRET_ACCESS_KEY,
-        },
-        maxTokens: 4000,
-        streaming: true,
-        streamUsage: true,
-        additionalModelRequestFields: {
-            thinking: { type: 'enabled', budget_tokens: 2000 },
-        },
-    });
-    const messages = [new HumanMessage('What is 25 * 37? Think step by step.')];
-    console.log('Streaming from Bedrock with thinking enabled...\n');
-    const stream = await model.stream(messages);
-    let finalChunk;
-    let chunkCount = 0;
-    let firstTextLogged = false;
-    for await (const chunk of stream) {
-        chunkCount++;
-        const isArr = Array.isArray(chunk.content);
-        const isStr = typeof chunk.content === 'string';
-        const isTextStr = isStr && chunk.content.length > 0;
-        if (!firstTextLogged && isTextStr) {
-            console.log(`chunk ${chunkCount} (first text): contentType=string, value="${chunk.content}"`);
-            console.log('  response_metadata:', JSON.stringify(chunk.response_metadata));
-            firstTextLogged = true;
-        }
-        if (isArr) {
-            const blocks = chunk.content;
-            const info = blocks.map((b) => ({
-                type: b.type,
-                hasIndex: 'index' in b,
-                index: b.index,
-            }));
-            console.log(`chunk ${chunkCount}: array content, blocks:`, info);
-        }
-        finalChunk = finalChunk ? concat(finalChunk, chunk) : chunk;
-    }
-    console.log(`Total chunks received: ${chunkCount}\n`);
-    console.log('=== RAW concat result (before modifyDeltaProperties) ===');
-    console.log('content type:', typeof finalChunk.content);
-    if (Array.isArray(finalChunk.content)) {
-        console.log('content array length:', finalChunk.content.length);
-        const types = finalChunk.content.map((b) => typeof b === 'object' && 'type' in b ? b.type : typeof b);
-        const typeCounts = types.reduce((acc, t) => {
-            acc[t ?? ''] = (acc[t ?? ''] || 0) + 1;
-            return acc;
-        }, {});
-        console.log('content block type counts:', typeCounts);
-    }
-    console.log('\ncontent:');
-    console.dir(finalChunk.content, { depth: null });
-    console.log('\n=== lc_kwargs.content ===');
-    if (Array.isArray(finalChunk.lc_kwargs.content)) {
-        console.log('lc_kwargs.content length:', finalChunk.lc_kwargs.content.length);
-    }
-    console.dir(finalChunk.lc_kwargs.content, { depth: null });
-    const modified = modifyDeltaProperties(Providers.BEDROCK, finalChunk);
-    console.log('\n=== After modifyDeltaProperties ===');
-    console.log('content:');
-    console.dir(modified.content, { depth: null });
-    console.log('\nlc_kwargs.content:');
-    console.dir(modified.lc_kwargs.content, { depth: null });
-}
-testBedrockMerge().catch((err) => {
-    console.error(err);
-    process.exit(1);
-});
-//# sourceMappingURL=bedrock-merge-test.js.map