npm - illuma-agents - Versions diffs - 1.0.9 → 1.0.11 - Mend

illuma-agents 1.0.9 → 1.0.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (146) hide show

package/LICENSE +1 -1
package/dist/cjs/agents/AgentContext.cjs +228 -27
package/dist/cjs/agents/AgentContext.cjs.map +1 -1
package/dist/cjs/common/enum.cjs +2 -0
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +3 -0
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +29 -19
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/instrumentation.cjs +1 -1
package/dist/cjs/instrumentation.cjs.map +1 -1
package/dist/cjs/llm/anthropic/index.cjs +1 -1
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/bedrock/index.cjs +122 -7
package/dist/cjs/llm/bedrock/index.cjs.map +1 -1
package/dist/cjs/llm/google/index.cjs +1 -1
package/dist/cjs/llm/google/index.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +108 -6
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +87 -1
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs +176 -2
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/main.cjs +18 -0
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +149 -54
package/dist/cjs/messages/cache.cjs.map +1 -1
package/dist/cjs/messages/tools.cjs +85 -0
package/dist/cjs/messages/tools.cjs.map +1 -0
package/dist/cjs/stream.cjs +20 -0
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/CodeExecutor.cjs +4 -0
package/dist/cjs/tools/CodeExecutor.cjs.map +1 -1
package/dist/cjs/tools/ProgrammaticToolCalling.cjs +438 -0
package/dist/cjs/tools/ProgrammaticToolCalling.cjs.map +1 -0
package/dist/cjs/tools/ToolNode.cjs +54 -6
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/ToolSearchRegex.cjs +455 -0
package/dist/cjs/tools/ToolSearchRegex.cjs.map +1 -0
package/dist/cjs/tools/search/tool.cjs +21 -1
package/dist/cjs/tools/search/tool.cjs.map +1 -1
package/dist/cjs/utils/run.cjs +5 -1
package/dist/cjs/utils/run.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +228 -27
package/dist/esm/agents/AgentContext.mjs.map +1 -1
package/dist/esm/common/enum.mjs +2 -0
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +4 -1
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +29 -19
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/instrumentation.mjs +1 -1
package/dist/esm/instrumentation.mjs.map +1 -1
package/dist/esm/llm/anthropic/index.mjs +1 -1
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/bedrock/index.mjs +122 -7
package/dist/esm/llm/bedrock/index.mjs.map +1 -1
package/dist/esm/llm/google/index.mjs +1 -1
package/dist/esm/llm/google/index.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +109 -7
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +88 -2
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs +176 -2
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/main.mjs +3 -0
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +149 -54
package/dist/esm/messages/cache.mjs.map +1 -1
package/dist/esm/messages/tools.mjs +82 -0
package/dist/esm/messages/tools.mjs.map +1 -0
package/dist/esm/stream.mjs +20 -0
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/CodeExecutor.mjs +4 -0
package/dist/esm/tools/CodeExecutor.mjs.map +1 -1
package/dist/esm/tools/ProgrammaticToolCalling.mjs +430 -0
package/dist/esm/tools/ProgrammaticToolCalling.mjs.map +1 -0
package/dist/esm/tools/ToolNode.mjs +54 -6
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/ToolSearchRegex.mjs +448 -0
package/dist/esm/tools/ToolSearchRegex.mjs.map +1 -0
package/dist/esm/tools/search/tool.mjs +21 -1
package/dist/esm/tools/search/tool.mjs.map +1 -1
package/dist/esm/utils/run.mjs +5 -1
package/dist/esm/utils/run.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +65 -5
package/dist/types/common/enum.d.ts +2 -0
package/dist/types/graphs/Graph.d.ts +3 -2
package/dist/types/index.d.ts +2 -0
package/dist/types/llm/anthropic/index.d.ts +1 -1
package/dist/types/llm/bedrock/index.d.ts +31 -4
package/dist/types/llm/google/index.d.ts +1 -1
package/dist/types/llm/openai/index.d.ts +4 -3
package/dist/types/llm/openai/utils/index.d.ts +10 -1
package/dist/types/llm/openrouter/index.d.ts +5 -2
package/dist/types/messages/cache.d.ts +23 -8
package/dist/types/messages/index.d.ts +1 -0
package/dist/types/messages/tools.d.ts +17 -0
package/dist/types/test/mockTools.d.ts +28 -0
package/dist/types/tools/ProgrammaticToolCalling.d.ts +91 -0
package/dist/types/tools/ToolNode.d.ts +10 -2
package/dist/types/tools/ToolSearchRegex.d.ts +80 -0
package/dist/types/types/graph.d.ts +7 -1
package/dist/types/types/tools.d.ts +138 -0
package/package.json +8 -3
package/src/agents/AgentContext.ts +267 -27
package/src/agents/__tests__/AgentContext.test.ts +805 -0
package/src/common/enum.ts +2 -0
package/src/events.ts +5 -1
package/src/graphs/Graph.ts +35 -20
package/src/index.ts +2 -0
package/src/instrumentation.ts +1 -1
package/src/llm/anthropic/index.ts +2 -2
package/src/llm/bedrock/__tests__/bedrock-caching.test.ts +473 -0
package/src/llm/bedrock/index.ts +150 -13
package/src/llm/google/index.ts +2 -2
package/src/llm/google/llm.spec.ts +3 -1
package/src/llm/openai/index.ts +135 -9
package/src/llm/openai/utils/index.ts +116 -1
package/src/llm/openrouter/index.ts +224 -3
package/src/messages/__tests__/tools.test.ts +473 -0
package/src/messages/cache.ts +163 -61
package/src/messages/index.ts +1 -0
package/src/messages/tools.ts +99 -0
package/src/scripts/code_exec_ptc.ts +334 -0
package/src/scripts/programmatic_exec.ts +396 -0
package/src/scripts/programmatic_exec_agent.ts +231 -0
package/src/scripts/tool_search_regex.ts +162 -0
package/src/specs/thinking-prune.test.ts +52 -118
package/src/stream.ts +26 -0
package/src/test/mockTools.ts +366 -0
package/src/tools/CodeExecutor.ts +4 -0
package/src/tools/ProgrammaticToolCalling.ts +558 -0
package/src/tools/ToolNode.ts +60 -7
package/src/tools/ToolSearchRegex.ts +535 -0
package/src/tools/__tests__/ProgrammaticToolCalling.integration.test.ts +318 -0
package/src/tools/__tests__/ProgrammaticToolCalling.test.ts +853 -0
package/src/tools/__tests__/ToolSearchRegex.integration.test.ts +161 -0
package/src/tools/__tests__/ToolSearchRegex.test.ts +232 -0
package/src/tools/search/jina-reranker.test.ts +16 -16
package/src/tools/search/tool.ts +23 -1
package/src/types/graph.ts +7 -1
package/src/types/tools.ts +166 -0
package/src/utils/llmConfig.ts +8 -2
package/src/utils/run.ts +5 -1
package/src/tools/search/direct-url.test.ts +0 -530

package/src/scripts/code_exec_ptc.ts ADDED Viewed

@@ -0,0 +1,334 @@
+// src/scripts/code_exec_ptc.ts
+/**
+ * Live LLM test for Programmatic Tool Calling (PTC).
+ * Run with: npm run code_exec_ptc
+ *
+ * Tests PTC with a real LLM in the loop, demonstrating:
+ * 1. LLM decides when to use PTC
+ * 2. LLM writes Python code that calls tools programmatically
+ * 3. ToolNode automatically injects programmatic tools
+ * 4. Tools filtered by allowed_callers
+ */
+import { config } from 'dotenv';
+config();
+import { randomUUID } from 'crypto';
+import { HumanMessage, BaseMessage } from '@langchain/core/messages';
+import type { RunnableConfig } from '@langchain/core/runnables';
+import type * as t from '@/types';
+import { ChatModelStreamHandler, createContentAggregator } from '@/stream';
+import {
+  // createProgrammaticToolRegistry,
+  createGetTeamMembersTool,
+  createGetExpensesTool,
+  createGetWeatherTool,
+} from '@/test/mockTools';
+import {
+  createMetadataAggregator,
+  ModelEndHandler,
+  ToolEndHandler,
+} from '@/events';
+import { createProgrammaticToolCallingTool } from '@/tools/ProgrammaticToolCalling';
+import { createCodeExecutionTool } from '@/tools/CodeExecutor';
+import { getLLMConfig } from '@/utils/llmConfig';
+import { getArgs } from '@/scripts/args';
+import { GraphEvents } from '@/common';
+import { Run } from '@/run';
+const conversationHistory: BaseMessage[] = [];
+/**
+ * Creates a tool registry where ALL business tools are code_execution ONLY.
+ * This forces the LLM to use PTC - it cannot call these tools directly.
+ */
+function createPTCOnlyToolRegistry(): t.LCToolRegistry {
+  const toolDefs: t.LCTool[] = [
+    {
+      name: 'get_team_members',
+      description:
+        'Get list of team members. Returns array of objects with id, name, and department fields.',
+      parameters: {
+        type: 'object',
+        properties: {},
+        required: [],
+      },
+      allowed_callers: ['code_execution'], // PTC ONLY - not direct
+    },
+    {
+      name: 'get_expenses',
+      description:
+        'Get expense records for a user. Returns array of objects with amount and category fields.',
+      parameters: {
+        type: 'object',
+        properties: {
+          user_id: {
+            type: 'string',
+            description: 'The user ID to fetch expenses for',
+          },
+        },
+        required: ['user_id'],
+      },
+      allowed_callers: ['code_execution'], // PTC ONLY - not direct
+    },
+    {
+      name: 'get_weather',
+      description:
+        'Get current weather for a city. Returns object with temperature (number) and condition (string) fields.',
+      parameters: {
+        type: 'object',
+        properties: {
+          city: {
+            type: 'string',
+            description: 'City name',
+          },
+        },
+        required: ['city'],
+      },
+      allowed_callers: ['code_execution'], // PTC ONLY - not direct (changed from ['direct', 'code_execution'])
+    },
+  ];
+  return new Map(toolDefs.map((def) => [def.name, def]));
+}
+async function testProgrammaticToolCalling(): Promise<void> {
+  const { userName, location, provider, currentDate } = await getArgs();
+  const { contentParts, aggregateContent } = createContentAggregator();
+  const customHandlers = {
+    [GraphEvents.TOOL_END]: new ToolEndHandler(),
+    [GraphEvents.CHAT_MODEL_END]: new ModelEndHandler(),
+    [GraphEvents.CHAT_MODEL_STREAM]: new ChatModelStreamHandler(),
+    [GraphEvents.ON_RUN_STEP_COMPLETED]: {
+      handle: (
+        event: GraphEvents.ON_RUN_STEP_COMPLETED,
+        data: t.StreamEventData
+      ): void => {
+        console.log('====== ON_RUN_STEP_COMPLETED ======');
+        console.dir(data, { depth: null });
+        aggregateContent({
+          event,
+          data: data as unknown as { result: t.ToolEndEvent },
+        });
+      },
+    },
+    [GraphEvents.ON_RUN_STEP]: {
+      handle: (
+        event: GraphEvents.ON_RUN_STEP,
+        data: t.StreamEventData
+      ): void => {
+        console.log('====== ON_RUN_STEP ======');
+        console.dir(data, { depth: null });
+        aggregateContent({ event, data: data as t.RunStep });
+      },
+    },
+    [GraphEvents.ON_RUN_STEP_DELTA]: {
+      handle: (
+        event: GraphEvents.ON_RUN_STEP_DELTA,
+        data: t.StreamEventData
+      ): void => {
+        aggregateContent({ event, data: data as t.RunStepDeltaEvent });
+      },
+    },
+    [GraphEvents.ON_MESSAGE_DELTA]: {
+      handle: (
+        event: GraphEvents.ON_MESSAGE_DELTA,
+        data: t.StreamEventData
+      ): void => {
+        aggregateContent({ event, data: data as t.MessageDeltaEvent });
+      },
+    },
+    [GraphEvents.TOOL_START]: {
+      handle: (
+        _event: string,
+        data: t.StreamEventData,
+        metadata?: Record<string, unknown>
+      ): void => {
+        console.log('====== TOOL_START ======');
+        console.dir(data, { depth: null });
+      },
+    },
+  };
+  const llmConfig = getLLMConfig(provider);
+  // Create mock tool instances
+  const teamTool = createGetTeamMembersTool();
+  const expensesTool = createGetExpensesTool();
+  const weatherTool = createGetWeatherTool();
+  // Create special tools
+  const codeExecTool = createCodeExecutionTool();
+  const ptcTool = createProgrammaticToolCallingTool();
+  // Build complete tool list and map
+  const allTools = [teamTool, expensesTool, weatherTool, codeExecTool, ptcTool];
+  const toolMap = new Map(allTools.map((t) => [t.name, t]));
+  // Create tool registry where ALL business tools are PTC-only
+  // This means the LLM CANNOT call get_team_members, get_expenses, get_weather directly
+  // It MUST use run_tools_with_code to invoke them
+  const toolRegistry = createPTCOnlyToolRegistry();
+  console.log('\n' + '='.repeat(70));
+  console.log('Tool Configuration Summary:');
+  console.log('='.repeat(70));
+  console.log('Total tools:', allTools.length);
+  console.log(
+    'Programmatic-allowed:',
+    Array.from(toolRegistry.values())
+      .filter((t) => t.allowed_callers?.includes('code_execution'))
+      .map((t) => t.name)
+      .join(', ')
+  );
+  console.log(
+    'Direct-callable:',
+    Array.from(toolRegistry.values())
+      .filter((t) => !t.allowed_callers || t.allowed_callers.includes('direct'))
+      .map((t) => t.name)
+      .join(', ')
+  );
+  console.log('='.repeat(70) + '\n');
+  const run = await Run.create<t.IState>({
+    runId: randomUUID(),
+    graphConfig: {
+      type: 'standard',
+      llmConfig,
+      agents: [
+        {
+          agentId: 'default',
+          provider: llmConfig.provider,
+          clientOptions: llmConfig,
+          tools: allTools,
+          toolMap,
+          toolRegistry,
+          instructions:
+            'You are a friendly AI assistant with advanced coding capabilities.\n\n' +
+            'IMPORTANT: The tools get_team_members(), get_expenses(), and get_weather() are NOT available ' +
+            'for direct function calling. You MUST use the run_tools_with_code tool to invoke them.\n\n' +
+            'When you need to use these tools, write Python code using run_tools_with_code that calls:\n' +
+            '- await get_team_members() - returns list of team members\n' +
+            '- await get_expenses(user_id="...") - returns expenses for a user\n' +
+            '- await get_weather(city="...") - returns weather data\n\n' +
+            'Use asyncio.gather() for parallel execution when calling multiple tools.',
+          additional_instructions: `The user's name is ${userName} and they are located in ${location}. Today is ${currentDate}.`,
+        },
+      ],
+    },
+    returnContent: true,
+    customHandlers,
+  });
+  const config: Partial<RunnableConfig> & {
+    version: 'v1' | 'v2';
+    run_id?: string;
+    streamMode: string;
+  } = {
+    configurable: {
+      provider,
+      thread_id: 'ptc-conversation-1',
+    },
+    streamMode: 'values',
+    version: 'v2' as const,
+  };
+  console.log('Test 1: Team Expense Analysis with PTC');
+  console.log('='.repeat(70) + '\n');
+  const userMessage1 = `Hi ${userName}! I need you to analyze our team's expenses. Please:
+1. Get the list of all team members
+2. For each member, fetch their expense records
+3. Calculate the total expenses per member
+4. Identify anyone who spent more than $500
+5. Show me a summary report
+IMPORTANT: Use the run_tools_with_code tool to do this efficiently.
+Don't call each tool separately - write Python code that orchestrates all the calls!`;
+  conversationHistory.push(new HumanMessage(userMessage1));
+  let inputs = {
+    messages: conversationHistory,
+  };
+  const finalContentParts1 = await run.processStream(inputs, config);
+  const finalMessages1 = run.getRunMessages();
+  if (finalMessages1) {
+    conversationHistory.push(...finalMessages1);
+  }
+  console.log('\n\n====================\n\n');
+  console.log('Content Parts:');
+  console.dir(contentParts, { depth: null });
+  console.log('\n\n' + '='.repeat(70));
+  console.log('Test 2: Conditional Logic and Parallel Execution');
+  console.log('='.repeat(70) + '\n');
+  const userMessage2 = `Great job! Now let's test some advanced patterns. Please:
+1. Check the weather in both San Francisco and New York (in parallel!)
+2. Based on which city has better weather (warmer), fetch the team members
+3. For the Engineering team members only, calculate their travel expenses
+4. Show me the results
+Again, use run_tools_with_code for maximum efficiency. Use asyncio.gather()
+to check both cities' weather at the same time!`;
+  conversationHistory.push(new HumanMessage(userMessage2));
+  inputs = {
+    messages: conversationHistory,
+  };
+  const finalContentParts2 = await run.processStream(inputs, config);
+  const finalMessages2 = run.getRunMessages();
+  if (finalMessages2) {
+    conversationHistory.push(...finalMessages2);
+  }
+  console.log('\n\n====================\n\n');
+  console.log('Final Content Parts:');
+  console.dir(finalContentParts2, { depth: null });
+  console.log('\n\n' + '='.repeat(70));
+  console.log('Generating conversation title...');
+  console.log('='.repeat(70) + '\n');
+  const { handleLLMEnd, collected } = createMetadataAggregator();
+  const titleResult = await run.generateTitle({
+    provider,
+    inputText: userMessage1,
+    contentParts,
+    chainOptions: {
+      callbacks: [
+        {
+          handleLLMEnd,
+        },
+      ],
+    },
+  });
+  console.log('Generated Title:', titleResult);
+  console.log('Collected metadata:', collected);
+}
+process.on('unhandledRejection', (reason, promise) => {
+  console.error('Unhandled Rejection at:', promise, 'reason:', reason);
+  console.log('Conversation history:');
+  console.dir(conversationHistory, { depth: null });
+  process.exit(1);
+});
+process.on('uncaughtException', (err) => {
+  console.error('Uncaught Exception:', err);
+});
+testProgrammaticToolCalling().catch((err) => {
+  console.error(err);
+  console.log('Conversation history:');
+  console.dir(conversationHistory, { depth: null });
+  process.exit(1);
+});