npm - @illuma-ai/agents - Versions diffs - 1.0.89 → 1.0.93 - Mend

@illuma-ai/agents 1.0.89 → 1.0.93

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (838) hide show

package/dist/cjs/agents/AgentContext.cjs +98 -49
package/dist/cjs/agents/AgentContext.cjs.map +1 -1
package/dist/cjs/common/constants.cjs +25 -0
package/dist/cjs/common/constants.cjs.map +1 -0
package/dist/cjs/common/enum.cjs +30 -0
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +9 -4
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +397 -92
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +223 -92
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -1
package/dist/cjs/instrumentation.cjs +30 -14
package/dist/cjs/instrumentation.cjs.map +1 -1
package/dist/cjs/llm/anthropic/index.cjs +43 -11
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/anthropic/types.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +10 -7
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs +32 -0
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/tools.cjs.map +1 -1
package/dist/cjs/llm/bedrock/index.cjs +129 -101
package/dist/cjs/llm/bedrock/index.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs +489 -0
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs.map +1 -0
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs +176 -0
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs.map +1 -0
package/dist/cjs/llm/fake.cjs.map +1 -1
package/dist/cjs/llm/google/index.cjs.map +1 -1
package/dist/cjs/llm/google/utils/common.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +1 -1
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs +59 -5
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/llm/providers.cjs.map +1 -1
package/dist/cjs/llm/text.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs +80 -2
package/dist/cjs/llm/vertexai/index.cjs.map +1 -1
package/dist/cjs/main.cjs +60 -27
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +131 -108
package/dist/cjs/messages/cache.cjs.map +1 -1
package/dist/cjs/messages/content.cjs.map +1 -1
package/dist/cjs/messages/core.cjs +3 -0
package/dist/cjs/messages/core.cjs.map +1 -1
package/dist/cjs/messages/format.cjs +265 -47
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/messages/ids.cjs.map +1 -1
package/dist/cjs/messages/prune.cjs +55 -2
package/dist/cjs/messages/prune.cjs.map +1 -1
package/dist/cjs/messages/summarize.cjs +170 -0
package/dist/cjs/messages/summarize.cjs.map +1 -0
package/dist/cjs/messages/tools.cjs.map +1 -1
package/dist/cjs/run.cjs +87 -30
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/schemas/validate.cjs.map +1 -1
package/dist/cjs/splitStream.cjs.map +1 -1
package/dist/cjs/stream.cjs +59 -25
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/AskUser.cjs +131 -0
package/dist/cjs/tools/AskUser.cjs.map +1 -0
package/dist/cjs/tools/BrowserTools.cjs +11 -7
package/dist/cjs/tools/BrowserTools.cjs.map +1 -1
package/dist/cjs/tools/Calculator.cjs.map +1 -1
package/dist/cjs/tools/CodeExecutor.cjs +46 -4
package/dist/cjs/tools/CodeExecutor.cjs.map +1 -1
package/dist/cjs/tools/ProgrammaticToolCalling.cjs +36 -53
package/dist/cjs/tools/ProgrammaticToolCalling.cjs.map +1 -1
package/dist/cjs/tools/StreamingToolCallBuffer.cjs +208 -0
package/dist/cjs/tools/StreamingToolCallBuffer.cjs.map +1 -0
package/dist/cjs/tools/ToolNode.cjs +333 -30
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/ToolSearch.cjs +66 -30
package/dist/cjs/tools/ToolSearch.cjs.map +1 -1
package/dist/cjs/tools/handlers.cjs +94 -8
package/dist/cjs/tools/handlers.cjs.map +1 -1
package/dist/cjs/tools/schema.cjs.map +1 -1
package/dist/cjs/tools/search/content.cjs.map +1 -1
package/dist/cjs/tools/search/firecrawl.cjs.map +1 -1
package/dist/cjs/tools/search/format.cjs.map +1 -1
package/dist/cjs/tools/search/highlights.cjs.map +1 -1
package/dist/cjs/tools/search/rerankers.cjs.map +1 -1
package/dist/cjs/tools/search/schema.cjs.map +1 -1
package/dist/cjs/tools/search/search.cjs +1 -0
package/dist/cjs/tools/search/search.cjs.map +1 -1
package/dist/cjs/tools/search/serper-scraper.cjs.map +1 -1
package/dist/cjs/tools/search/tool.cjs.map +1 -1
package/dist/cjs/tools/search/utils.cjs.map +1 -1
package/dist/cjs/types/graph.cjs +1 -1
package/dist/cjs/types/graph.cjs.map +1 -1
package/dist/cjs/utils/contextAnalytics.cjs +23 -6
package/dist/cjs/utils/contextAnalytics.cjs.map +1 -1
package/dist/cjs/utils/events.cjs.map +1 -1
package/dist/cjs/utils/graph.cjs.map +1 -1
package/dist/cjs/utils/handlers.cjs.map +1 -1
package/dist/cjs/utils/llm.cjs.map +1 -1
package/dist/cjs/utils/misc.cjs.map +1 -1
package/dist/cjs/utils/run.cjs +3 -1
package/dist/cjs/utils/run.cjs.map +1 -1
package/dist/cjs/utils/schema.cjs.map +1 -1
package/dist/cjs/utils/title.cjs.map +1 -1
package/dist/cjs/utils/tokens.cjs +33 -58
package/dist/cjs/utils/tokens.cjs.map +1 -1
package/dist/cjs/utils/toolCallContinuation.cjs +55 -0
package/dist/cjs/utils/toolCallContinuation.cjs.map +1 -0
package/dist/cjs/utils/toonFormat.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +98 -49
package/dist/esm/agents/AgentContext.mjs.map +1 -1
package/dist/esm/common/constants.mjs +22 -0
package/dist/esm/common/constants.mjs.map +1 -0
package/dist/esm/common/enum.mjs +31 -1
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +9 -4
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +393 -88
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +224 -93
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -1
package/dist/esm/instrumentation.mjs +30 -14
package/dist/esm/instrumentation.mjs.map +1 -1
package/dist/esm/llm/anthropic/index.mjs +43 -11
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/anthropic/types.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +10 -7
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_outputs.mjs +32 -0
package/dist/esm/llm/anthropic/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/tools.mjs.map +1 -1
package/dist/esm/llm/bedrock/index.mjs +128 -101
package/dist/esm/llm/bedrock/index.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_inputs.mjs +484 -0
package/dist/esm/llm/bedrock/utils/message_inputs.mjs.map +1 -0
package/dist/esm/llm/bedrock/utils/message_outputs.mjs +171 -0
package/dist/esm/llm/bedrock/utils/message_outputs.mjs.map +1 -0
package/dist/esm/llm/fake.mjs.map +1 -1
package/dist/esm/llm/google/index.mjs.map +1 -1
package/dist/esm/llm/google/utils/common.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +1 -1
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs +59 -5
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/llm/providers.mjs.map +1 -1
package/dist/esm/llm/text.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs +80 -2
package/dist/esm/llm/vertexai/index.mjs.map +1 -1
package/dist/esm/main.mjs +8 -3
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +131 -108
package/dist/esm/messages/cache.mjs.map +1 -1
package/dist/esm/messages/content.mjs.map +1 -1
package/dist/esm/messages/core.mjs +4 -1
package/dist/esm/messages/core.mjs.map +1 -1
package/dist/esm/messages/format.mjs +267 -49
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/messages/ids.mjs.map +1 -1
package/dist/esm/messages/prune.mjs +56 -4
package/dist/esm/messages/prune.mjs.map +1 -1
package/dist/esm/messages/summarize.mjs +161 -0
package/dist/esm/messages/summarize.mjs.map +1 -0
package/dist/esm/messages/tools.mjs.map +1 -1
package/dist/esm/run.mjs +88 -31
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/schemas/validate.mjs.map +1 -1
package/dist/esm/splitStream.mjs.map +1 -1
package/dist/esm/stream.mjs +60 -26
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/AskUser.mjs +125 -0
package/dist/esm/tools/AskUser.mjs.map +1 -0
package/dist/esm/tools/BrowserTools.mjs +11 -7
package/dist/esm/tools/BrowserTools.mjs.map +1 -1
package/dist/esm/tools/Calculator.mjs.map +1 -1
package/dist/esm/tools/CodeExecutor.mjs +46 -4
package/dist/esm/tools/CodeExecutor.mjs.map +1 -1
package/dist/esm/tools/ProgrammaticToolCalling.mjs +37 -54
package/dist/esm/tools/ProgrammaticToolCalling.mjs.map +1 -1
package/dist/esm/tools/StreamingToolCallBuffer.mjs +206 -0
package/dist/esm/tools/StreamingToolCallBuffer.mjs.map +1 -0
package/dist/esm/tools/ToolNode.mjs +333 -30
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/ToolSearch.mjs +66 -30
package/dist/esm/tools/ToolSearch.mjs.map +1 -1
package/dist/esm/tools/handlers.mjs +95 -9
package/dist/esm/tools/handlers.mjs.map +1 -1
package/dist/esm/tools/schema.mjs.map +1 -1
package/dist/esm/tools/search/content.mjs.map +1 -1
package/dist/esm/tools/search/firecrawl.mjs.map +1 -1
package/dist/esm/tools/search/format.mjs.map +1 -1
package/dist/esm/tools/search/highlights.mjs.map +1 -1
package/dist/esm/tools/search/rerankers.mjs.map +1 -1
package/dist/esm/tools/search/schema.mjs.map +1 -1
package/dist/esm/tools/search/search.mjs +1 -0
package/dist/esm/tools/search/search.mjs.map +1 -1
package/dist/esm/tools/search/serper-scraper.mjs.map +1 -1
package/dist/esm/tools/search/tool.mjs.map +1 -1
package/dist/esm/tools/search/utils.mjs.map +1 -1
package/dist/esm/types/graph.mjs +1 -1
package/dist/esm/types/graph.mjs.map +1 -1
package/dist/esm/utils/contextAnalytics.mjs +23 -6
package/dist/esm/utils/contextAnalytics.mjs.map +1 -1
package/dist/esm/utils/events.mjs.map +1 -1
package/dist/esm/utils/graph.mjs.map +1 -1
package/dist/esm/utils/handlers.mjs.map +1 -1
package/dist/esm/utils/llm.mjs.map +1 -1
package/dist/esm/utils/misc.mjs.map +1 -1
package/dist/esm/utils/run.mjs +3 -1
package/dist/esm/utils/run.mjs.map +1 -1
package/dist/esm/utils/schema.mjs.map +1 -1
package/dist/esm/utils/title.mjs.map +1 -1
package/dist/esm/utils/tokens.mjs +33 -59
package/dist/esm/utils/tokens.mjs.map +1 -1
package/dist/esm/utils/toolCallContinuation.mjs +52 -0
package/dist/esm/utils/toolCallContinuation.mjs.map +1 -0
package/dist/esm/utils/toonFormat.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +14 -7
package/dist/types/common/constants.d.ts +18 -0
package/dist/types/common/enum.d.ts +28 -0
package/dist/types/common/index.d.ts +1 -0
package/dist/types/events.d.ts +10 -3
package/dist/types/graphs/Graph.d.ts +37 -0
package/dist/types/index.d.ts +4 -0
package/dist/types/llm/anthropic/index.d.ts +7 -1
package/dist/types/llm/anthropic/types.d.ts +5 -2
package/dist/types/llm/anthropic/utils/message_outputs.d.ts +1 -1
package/dist/types/llm/bedrock/index.d.ts +40 -33
package/dist/types/llm/bedrock/utils/message_outputs.d.ts +1 -1
package/dist/types/llm/google/index.d.ts +2 -3
package/dist/types/llm/openrouter/index.d.ts +21 -1
package/dist/types/llm/vertexai/index.d.ts +3 -2
package/dist/types/messages/cache.d.ts +1 -1
package/dist/types/messages/index.d.ts +1 -0
package/dist/types/messages/prune.d.ts +2 -7
package/dist/types/messages/summarize.d.ts +33 -0
package/dist/types/run.d.ts +6 -0
package/dist/types/tools/AskUser.d.ts +408 -0
package/dist/types/tools/BrowserTools.d.ts +2 -2
package/dist/types/tools/CodeExecutor.d.ts +2 -2
package/dist/types/tools/StreamingToolCallBuffer.d.ts +106 -0
package/dist/types/tools/ToolNode.d.ts +55 -3
package/dist/types/tools/ToolSearch.d.ts +9 -5
package/dist/types/tools/handlers.d.ts +2 -2
package/dist/types/types/graph.d.ts +9 -2
package/dist/types/types/llm.d.ts +8 -3
package/dist/types/types/run.d.ts +2 -0
package/dist/types/types/tools.d.ts +20 -2
package/dist/types/utils/contextAnalytics.d.ts +5 -4
package/dist/types/utils/index.d.ts +1 -0
package/dist/types/utils/tokens.d.ts +6 -19
package/dist/types/utils/toolCallContinuation.d.ts +30 -0
package/package.json +15 -8
package/src/agents/AgentContext.js +782 -0
package/src/agents/AgentContext.js.map +1 -0
package/src/agents/AgentContext.test.js +421 -0
package/src/agents/AgentContext.test.js.map +1 -0
package/src/agents/AgentContext.ts +132 -64
package/src/agents/__tests__/AgentContext.test.js +678 -0
package/src/agents/__tests__/AgentContext.test.js.map +1 -0
package/src/agents/__tests__/AgentContext.test.ts +25 -4
package/src/agents/__tests__/resolveStructuredOutputMode.test.js +117 -0
package/src/agents/__tests__/resolveStructuredOutputMode.test.js.map +1 -0
package/src/common/__tests__/enum.test.ts +135 -0
package/src/common/constants.ts +21 -0
package/src/common/enum.js +192 -0
package/src/common/enum.js.map +1 -0
package/src/common/enum.ts +30 -0
package/src/common/index.js +3 -0
package/src/common/index.js.map +1 -0
package/src/common/index.ts +2 -1
package/src/events.js +166 -0
package/src/events.js.map +1 -0
package/src/events.ts +11 -14
package/src/graphs/Graph.js +1857 -0
package/src/graphs/Graph.js.map +1 -0
package/src/graphs/Graph.ts +580 -162
package/src/graphs/MultiAgentGraph.js +1092 -0
package/src/graphs/MultiAgentGraph.js.map +1 -0
package/src/graphs/MultiAgentGraph.ts +331 -112
package/src/graphs/__tests__/adaptive-thinking.test.ts +369 -0
package/src/graphs/__tests__/graph-direct-tool-names.test.ts +210 -0
package/src/graphs/__tests__/multi-agent-edges.test.ts +237 -0
package/src/graphs/__tests__/structured-output.integration.test.js +624 -0
package/src/graphs/__tests__/structured-output.integration.test.js.map +1 -0
package/src/graphs/__tests__/structured-output.test.js +144 -0
package/src/graphs/__tests__/structured-output.test.js.map +1 -0
package/src/graphs/contextManagement.e2e.test.js +718 -0
package/src/graphs/contextManagement.e2e.test.js.map +1 -0
package/src/graphs/contextManagement.e2e.test.ts +990 -0
package/src/graphs/contextManagement.test.js +485 -0
package/src/graphs/contextManagement.test.js.map +1 -0
package/src/graphs/contextManagement.test.ts +625 -0
package/src/graphs/handoffValidation.test.js +276 -0
package/src/graphs/handoffValidation.test.js.map +1 -0
package/src/graphs/handoffValidation.test.ts +353 -0
package/src/graphs/index.js +3 -0
package/src/graphs/index.js.map +1 -0
package/src/index.js +28 -0
package/src/index.js.map +1 -0
package/src/index.ts +13 -0
package/src/instrumentation.js +21 -0
package/src/instrumentation.js.map +1 -0
package/src/instrumentation.ts +38 -17
package/src/llm/anthropic/index.js +319 -0
package/src/llm/anthropic/index.js.map +1 -0
package/src/llm/anthropic/index.ts +68 -15
package/src/llm/anthropic/llm.spec.ts +402 -0
package/src/llm/anthropic/types.js +46 -0
package/src/llm/anthropic/types.js.map +1 -0
package/src/llm/anthropic/types.ts +8 -2
package/src/llm/anthropic/utils/message_inputs.js +627 -0
package/src/llm/anthropic/utils/message_inputs.js.map +1 -0
package/src/llm/anthropic/utils/message_inputs.ts +16 -33
package/src/llm/anthropic/utils/message_outputs.js +290 -0
package/src/llm/anthropic/utils/message_outputs.js.map +1 -0
package/src/llm/anthropic/utils/message_outputs.ts +40 -1
package/src/llm/anthropic/utils/output_parsers.js +89 -0
package/src/llm/anthropic/utils/output_parsers.js.map +1 -0
package/src/llm/anthropic/utils/tools.js +25 -0
package/src/llm/anthropic/utils/tools.js.map +1 -0
package/src/llm/bedrock/__tests__/bedrock-caching.test.js +392 -0
package/src/llm/bedrock/__tests__/bedrock-caching.test.js.map +1 -0
package/src/llm/bedrock/__tests__/bedrock-caching.test.ts +24 -40
package/src/llm/bedrock/index.js +303 -0
package/src/llm/bedrock/index.js.map +1 -0
package/src/llm/bedrock/index.ts +171 -134
package/src/llm/bedrock/llm.spec.ts +395 -52
package/src/llm/bedrock/types.js +2 -0
package/src/llm/bedrock/types.js.map +1 -0
package/src/llm/bedrock/utils/index.js +6 -0
package/src/llm/bedrock/utils/index.js.map +1 -0
package/src/llm/bedrock/utils/message_inputs.js +463 -0
package/src/llm/bedrock/utils/message_inputs.js.map +1 -0
package/src/llm/bedrock/utils/message_inputs.ts +30 -5
package/src/llm/bedrock/utils/message_outputs.js +269 -0
package/src/llm/bedrock/utils/message_outputs.js.map +1 -0
package/src/llm/bedrock/utils/message_outputs.ts +70 -22
package/src/llm/fake.js +92 -0
package/src/llm/fake.js.map +1 -0
package/src/llm/google/index.js +215 -0
package/src/llm/google/index.js.map +1 -0
package/src/llm/google/index.ts +2 -3
package/src/llm/google/types.js +12 -0
package/src/llm/google/types.js.map +1 -0
package/src/llm/google/utils/common.js +670 -0
package/src/llm/google/utils/common.js.map +1 -0
package/src/llm/google/utils/tools.js +111 -0
package/src/llm/google/utils/tools.js.map +1 -0
package/src/llm/google/utils/zod_to_genai_parameters.js +47 -0
package/src/llm/google/utils/zod_to_genai_parameters.js.map +1 -0
package/src/llm/openai/index.js +1033 -0
package/src/llm/openai/index.js.map +1 -0
package/src/llm/openai/types.js +2 -0
package/src/llm/openai/types.js.map +1 -0
package/src/llm/openai/utils/index.js +756 -0
package/src/llm/openai/utils/index.js.map +1 -0
package/src/llm/openai/utils/isReasoningModel.test.js +79 -0
package/src/llm/openai/utils/isReasoningModel.test.js.map +1 -0
package/src/llm/openrouter/index.js +261 -0
package/src/llm/openrouter/index.js.map +1 -0
package/src/llm/openrouter/index.ts +117 -6
package/src/llm/openrouter/reasoning.test.js +181 -0
package/src/llm/openrouter/reasoning.test.js.map +1 -0
package/src/llm/openrouter/reasoning.test.ts +207 -0
package/src/llm/providers.js +36 -0
package/src/llm/providers.js.map +1 -0
package/src/llm/text.js +65 -0
package/src/llm/text.js.map +1 -0
package/src/llm/vertexai/index.js +402 -0
package/src/llm/vertexai/index.js.map +1 -0
package/src/llm/vertexai/index.ts +115 -5
package/src/llm/vertexai/llm.spec.ts +114 -0
package/src/messages/__tests__/tools.test.js +392 -0
package/src/messages/__tests__/tools.test.js.map +1 -0
package/src/messages/cache.js +404 -0
package/src/messages/cache.js.map +1 -0
package/src/messages/cache.test.js +1167 -0
package/src/messages/cache.test.js.map +1 -0
package/src/messages/cache.test.ts +178 -16
package/src/messages/cache.ts +152 -147
package/src/messages/content.js +48 -0
package/src/messages/content.js.map +1 -0
package/src/messages/content.test.js +314 -0
package/src/messages/content.test.js.map +1 -0
package/src/messages/core.js +359 -0
package/src/messages/core.js.map +1 -0
package/src/messages/core.ts +5 -0
package/src/messages/ensureThinkingBlock.test.js +997 -0
package/src/messages/ensureThinkingBlock.test.js.map +1 -0
package/src/messages/ensureThinkingBlock.test.ts +751 -10
package/src/messages/format.js +973 -0
package/src/messages/format.js.map +1 -0
package/src/messages/format.ts +334 -57
package/src/messages/formatAgentMessages.test.js +2278 -0
package/src/messages/formatAgentMessages.test.js.map +1 -0
package/src/messages/formatAgentMessages.test.ts +1175 -1
package/src/messages/formatAgentMessages.tools.test.js +362 -0
package/src/messages/formatAgentMessages.tools.test.js.map +1 -0
package/src/messages/formatMessage.test.js +608 -0
package/src/messages/formatMessage.test.js.map +1 -0
package/src/messages/ids.js +18 -0
package/src/messages/ids.js.map +1 -0
package/src/messages/index.js +9 -0
package/src/messages/index.js.map +1 -0
package/src/messages/index.ts +1 -0
package/src/messages/labelContentByAgent.test.js +725 -0
package/src/messages/labelContentByAgent.test.js.map +1 -0
package/src/messages/prune.js +438 -0
package/src/messages/prune.js.map +1 -0
package/src/messages/prune.ts +87 -25
package/src/messages/reducer.js +60 -0
package/src/messages/reducer.js.map +1 -0
package/src/messages/shiftIndexTokenCountMap.test.js +63 -0
package/src/messages/shiftIndexTokenCountMap.test.js.map +1 -0
package/src/messages/summarize.js +146 -0
package/src/messages/summarize.js.map +1 -0
package/src/messages/summarize.test.js +332 -0
package/src/messages/summarize.test.js.map +1 -0
package/src/messages/summarize.test.ts +466 -0
package/src/messages/summarize.ts +222 -0
package/src/messages/tools.js +90 -0
package/src/messages/tools.js.map +1 -0
package/src/mockStream.js +81 -0
package/src/mockStream.js.map +1 -0
package/src/prompts/collab.js +7 -0
package/src/prompts/collab.js.map +1 -0
package/src/prompts/index.js +3 -0
package/src/prompts/index.js.map +1 -0
package/src/prompts/taskmanager.js +58 -0
package/src/prompts/taskmanager.js.map +1 -0
package/src/run.js +427 -0
package/src/run.js.map +1 -0
package/src/run.ts +101 -33
package/src/schemas/index.js +3 -0
package/src/schemas/index.js.map +1 -0
package/src/schemas/schema-preparation.test.js +370 -0
package/src/schemas/schema-preparation.test.js.map +1 -0
package/src/schemas/validate.js +314 -0
package/src/schemas/validate.js.map +1 -0
package/src/schemas/validate.test.js +264 -0
package/src/schemas/validate.test.js.map +1 -0
package/src/scripts/abort.js +127 -0
package/src/scripts/abort.js.map +1 -0
package/src/scripts/ant_web_search.js +130 -0
package/src/scripts/ant_web_search.js.map +1 -0
package/src/scripts/ant_web_search.ts +1 -0
package/src/scripts/ant_web_search_edge_case.js +133 -0
package/src/scripts/ant_web_search_edge_case.js.map +1 -0
package/src/scripts/ant_web_search_edge_case.ts +1 -0
package/src/scripts/ant_web_search_error_edge_case.js +119 -0
package/src/scripts/ant_web_search_error_edge_case.js.map +1 -0
package/src/scripts/ant_web_search_error_edge_case.ts +1 -0
package/src/scripts/args.js +41 -0
package/src/scripts/args.js.map +1 -0
package/src/scripts/bedrock-cache-debug.js +186 -0
package/src/scripts/bedrock-cache-debug.js.map +1 -0
package/src/scripts/bedrock-cache-debug.ts +250 -0
package/src/scripts/bedrock-content-aggregation-test.js +195 -0
package/src/scripts/bedrock-content-aggregation-test.js.map +1 -0
package/src/scripts/bedrock-content-aggregation-test.ts +266 -0
package/src/scripts/bedrock-merge-test.js +80 -0
package/src/scripts/bedrock-merge-test.js.map +1 -0
package/src/scripts/bedrock-merge-test.ts +107 -0
package/src/scripts/bedrock-parallel-tools-test.js +150 -0
package/src/scripts/bedrock-parallel-tools-test.js.map +1 -0
package/src/scripts/bedrock-parallel-tools-test.ts +204 -0
package/src/scripts/caching.js +106 -0
package/src/scripts/caching.js.map +1 -0
package/src/scripts/caching.ts +1 -0
package/src/scripts/cli.js +152 -0
package/src/scripts/cli.js.map +1 -0
package/src/scripts/cli2.js +119 -0
package/src/scripts/cli2.js.map +1 -0
package/src/scripts/cli3.js +163 -0
package/src/scripts/cli3.js.map +1 -0
package/src/scripts/cli4.js +165 -0
package/src/scripts/cli4.js.map +1 -0
package/src/scripts/cli5.js +165 -0
package/src/scripts/cli5.js.map +1 -0
package/src/scripts/code_exec.js +171 -0
package/src/scripts/code_exec.js.map +1 -0
package/src/scripts/code_exec.ts +1 -0
package/src/scripts/code_exec_files.js +180 -0
package/src/scripts/code_exec_files.js.map +1 -0
package/src/scripts/code_exec_files.ts +1 -0
package/src/scripts/code_exec_multi_session.js +185 -0
package/src/scripts/code_exec_multi_session.js.map +1 -0
package/src/scripts/code_exec_multi_session.ts +9 -13
package/src/scripts/code_exec_ptc.js +265 -0
package/src/scripts/code_exec_ptc.js.map +1 -0
package/src/scripts/code_exec_ptc.ts +1 -0
package/src/scripts/code_exec_session.js +217 -0
package/src/scripts/code_exec_session.js.map +1 -0
package/src/scripts/code_exec_session.ts +1 -0
package/src/scripts/code_exec_simple.js +120 -0
package/src/scripts/code_exec_simple.js.map +1 -0
package/src/scripts/code_exec_simple.ts +1 -0
package/src/scripts/content.js +111 -0
package/src/scripts/content.js.map +1 -0
package/src/scripts/content.ts +1 -0
package/src/scripts/empty_input.js +125 -0
package/src/scripts/empty_input.js.map +1 -0
package/src/scripts/handoff-test.js +96 -0
package/src/scripts/handoff-test.js.map +1 -0
package/src/scripts/image.js +138 -0
package/src/scripts/image.js.map +1 -0
package/src/scripts/image.ts +3 -1
package/src/scripts/memory.js +83 -0
package/src/scripts/memory.js.map +1 -0
package/src/scripts/memory.ts +16 -6
package/src/scripts/multi-agent-chain.js +271 -0
package/src/scripts/multi-agent-chain.js.map +1 -0
package/src/scripts/multi-agent-chain.ts +1 -0
package/src/scripts/multi-agent-conditional.js +185 -0
package/src/scripts/multi-agent-conditional.js.map +1 -0
package/src/scripts/multi-agent-conditional.ts +1 -0
package/src/scripts/multi-agent-document-review-chain.js +171 -0
package/src/scripts/multi-agent-document-review-chain.js.map +1 -0
package/src/scripts/multi-agent-document-review-chain.ts +1 -0
package/src/scripts/multi-agent-hybrid-flow.js +264 -0
package/src/scripts/multi-agent-hybrid-flow.js.map +1 -0
package/src/scripts/multi-agent-hybrid-flow.ts +1 -0
package/src/scripts/multi-agent-parallel-start.js +214 -0
package/src/scripts/multi-agent-parallel-start.js.map +1 -0
package/src/scripts/multi-agent-parallel-start.ts +4 -4
package/src/scripts/multi-agent-parallel.js +346 -0
package/src/scripts/multi-agent-parallel.js.map +1 -0
package/src/scripts/multi-agent-parallel.ts +1 -0
package/src/scripts/multi-agent-sequence.js +184 -0
package/src/scripts/multi-agent-sequence.js.map +1 -0
package/src/scripts/multi-agent-sequence.ts +4 -4
package/src/scripts/multi-agent-supervisor.js +324 -0
package/src/scripts/multi-agent-supervisor.js.map +1 -0
package/src/scripts/multi-agent-supervisor.ts +1 -0
package/src/scripts/multi-agent-test.js +147 -0
package/src/scripts/multi-agent-test.js.map +1 -0
package/src/scripts/multi-agent-test.ts +1 -0
package/src/scripts/parallel-asymmetric-tools-test.js +202 -0
package/src/scripts/parallel-asymmetric-tools-test.js.map +1 -0
package/src/scripts/parallel-asymmetric-tools-test.ts +1 -0
package/src/scripts/parallel-full-metadata-test.js +176 -0
package/src/scripts/parallel-full-metadata-test.js.map +1 -0
package/src/scripts/parallel-full-metadata-test.ts +1 -0
package/src/scripts/parallel-tools-test.js +256 -0
package/src/scripts/parallel-tools-test.js.map +1 -0
package/src/scripts/parallel-tools-test.ts +1 -0
package/src/scripts/poc-multi-agent-comprehensive.ts +1222 -0
package/src/scripts/programmatic_exec.js +277 -0
package/src/scripts/programmatic_exec.js.map +1 -0
package/src/scripts/programmatic_exec_agent.js +168 -0
package/src/scripts/programmatic_exec_agent.js.map +1 -0
package/src/scripts/programmatic_exec_agent.ts +1 -0
package/src/scripts/search.js +118 -0
package/src/scripts/search.js.map +1 -0
package/src/scripts/search.ts +1 -0
package/src/scripts/sequential-full-metadata-test.js +143 -0
package/src/scripts/sequential-full-metadata-test.js.map +1 -0
package/src/scripts/sequential-full-metadata-test.ts +1 -0
package/src/scripts/simple.js +174 -0
package/src/scripts/simple.js.map +1 -0
package/src/scripts/simple.ts +2 -1
package/src/scripts/single-agent-metadata-test.js +152 -0
package/src/scripts/single-agent-metadata-test.js.map +1 -0
package/src/scripts/single-agent-metadata-test.ts +4 -6
package/src/scripts/stream.js +113 -0
package/src/scripts/stream.js.map +1 -0
package/src/scripts/stream.ts +1 -0
package/src/scripts/test-custom-prompt-key.js +132 -0
package/src/scripts/test-custom-prompt-key.js.map +1 -0
package/src/scripts/test-handoff-input.js +143 -0
package/src/scripts/test-handoff-input.js.map +1 -0
package/src/scripts/test-handoff-preamble.js +227 -0
package/src/scripts/test-handoff-preamble.js.map +1 -0
package/src/scripts/test-handoff-preamble.ts +1 -0
package/src/scripts/test-handoff-steering.js +353 -0
package/src/scripts/test-handoff-steering.js.map +1 -0
package/src/scripts/test-handoff-steering.ts +430 -0
package/src/scripts/test-multi-agent-list-handoff.js +318 -0
package/src/scripts/test-multi-agent-list-handoff.js.map +1 -0
package/src/scripts/test-multi-agent-list-handoff.ts +1 -0
package/src/scripts/test-parallel-agent-labeling.js +253 -0
package/src/scripts/test-parallel-agent-labeling.js.map +1 -0
package/src/scripts/test-parallel-agent-labeling.ts +2 -0
package/src/scripts/test-parallel-handoffs.js +229 -0
package/src/scripts/test-parallel-handoffs.js.map +1 -0
package/src/scripts/test-parallel-handoffs.ts +1 -0
package/src/scripts/test-thinking-handoff-bedrock.js +132 -0
package/src/scripts/test-thinking-handoff-bedrock.js.map +1 -0
package/src/scripts/test-thinking-handoff-bedrock.ts +1 -0
package/src/scripts/test-thinking-handoff.js +132 -0
package/src/scripts/test-thinking-handoff.js.map +1 -0
package/src/scripts/test-thinking-handoff.ts +1 -0
package/src/scripts/test-thinking-to-thinking-handoff-bedrock.js +140 -0
package/src/scripts/test-thinking-to-thinking-handoff-bedrock.js.map +1 -0
package/src/scripts/test-thinking-to-thinking-handoff-bedrock.ts +166 -0
package/src/scripts/test-tool-before-handoff-role-order.js +223 -0
package/src/scripts/test-tool-before-handoff-role-order.js.map +1 -0
package/src/scripts/test-tool-before-handoff-role-order.ts +276 -0
package/src/scripts/test-tools-before-handoff.js +187 -0
package/src/scripts/test-tools-before-handoff.js.map +1 -0
package/src/scripts/test-tools-before-handoff.ts +4 -8
package/src/scripts/test_code_api.js +263 -0
package/src/scripts/test_code_api.js.map +1 -0
package/src/scripts/thinking-bedrock.js +128 -0
package/src/scripts/thinking-bedrock.js.map +1 -0
package/src/scripts/thinking-bedrock.ts +1 -0
package/src/scripts/thinking-vertexai.js +130 -0
package/src/scripts/thinking-vertexai.js.map +1 -0
package/src/scripts/thinking-vertexai.ts +168 -0
package/src/scripts/thinking.js +134 -0
package/src/scripts/thinking.js.map +1 -0
package/src/scripts/thinking.ts +1 -0
package/src/scripts/tool_search.js +114 -0
package/src/scripts/tool_search.js.map +1 -0
package/src/scripts/tools.js +125 -0
package/src/scripts/tools.js.map +1 -0
package/src/scripts/tools.ts +5 -19
package/src/specs/agent-handoffs-bedrock.integration.test.js +280 -0
package/src/specs/agent-handoffs-bedrock.integration.test.js.map +1 -0
package/src/specs/agent-handoffs-bedrock.integration.test.ts +412 -375
package/src/specs/agent-handoffs.test.js +924 -0
package/src/specs/agent-handoffs.test.js.map +1 -0
package/src/specs/agent-handoffs.test.ts +152 -39
package/src/specs/anthropic.simple.test.js +287 -0
package/src/specs/anthropic.simple.test.js.map +1 -0
package/src/specs/anthropic.simple.test.ts +7 -4
package/src/specs/azure.simple.test.js +381 -0
package/src/specs/azure.simple.test.js.map +1 -0
package/src/specs/azure.simple.test.ts +143 -5
package/src/specs/cache.simple.test.js +282 -0
package/src/specs/cache.simple.test.js.map +1 -0
package/src/specs/cache.simple.test.ts +9 -2
package/src/specs/custom-event-await.test.js +148 -0
package/src/specs/custom-event-await.test.js.map +1 -0
package/src/specs/custom-event-await.test.ts +215 -0
package/src/specs/deepseek.simple.test.js +189 -0
package/src/specs/deepseek.simple.test.js.map +1 -0
package/src/specs/deepseek.simple.test.ts +4 -2
package/src/specs/emergency-prune.test.js +308 -0
package/src/specs/emergency-prune.test.js.map +1 -0
package/src/specs/moonshot.simple.test.js +237 -0
package/src/specs/moonshot.simple.test.js.map +1 -0
package/src/specs/moonshot.simple.test.ts +6 -2
package/src/specs/observability.integration.test.js +1337 -0
package/src/specs/observability.integration.test.js.map +1 -0
package/src/specs/observability.integration.test.ts +2223 -0
package/src/specs/openai.simple.test.js +233 -0
package/src/specs/openai.simple.test.js.map +1 -0
package/src/specs/openai.simple.test.ts +4 -2
package/src/specs/openrouter.simple.test.js +202 -0
package/src/specs/openrouter.simple.test.js.map +1 -0
package/src/specs/openrouter.simple.test.ts +165 -4
package/src/specs/prune.test.js +733 -0
package/src/specs/prune.test.js.map +1 -0
package/src/specs/prune.test.ts +1 -0
package/src/specs/reasoning.test.js +144 -0
package/src/specs/reasoning.test.js.map +1 -0
package/src/specs/reasoning.test.ts +2 -2
package/src/specs/spec.utils.js +4 -0
package/src/specs/spec.utils.js.map +1 -0
package/src/specs/thinking-handoff.test.js +486 -0
package/src/specs/thinking-handoff.test.js.map +1 -0
package/src/specs/thinking-handoff.test.ts +3 -2
package/src/specs/thinking-prune.test.js +600 -0
package/src/specs/thinking-prune.test.js.map +1 -0
package/src/specs/token-distribution-edge-case.test.js +246 -0
package/src/specs/token-distribution-edge-case.test.js.map +1 -0
package/src/specs/token-memoization.test.js +32 -0
package/src/specs/token-memoization.test.js.map +1 -0
package/src/specs/token-memoization.test.ts +14 -5
package/src/specs/tokens.test.js +49 -0
package/src/specs/tokens.test.js.map +1 -0
package/src/specs/tokens.test.ts +64 -0
package/src/specs/tool-error.test.js +139 -0
package/src/specs/tool-error.test.js.map +1 -0
package/src/specs/tool-error.test.ts +2 -2
package/src/splitStream.js +204 -0
package/src/splitStream.js.map +1 -0
package/src/splitStream.test.js +504 -0
package/src/splitStream.test.js.map +1 -0
package/src/stream.js +650 -0
package/src/stream.js.map +1 -0
package/src/stream.test.js +225 -0
package/src/stream.test.js.map +1 -0
package/src/stream.test.ts +25 -15
package/src/stream.ts +82 -32
package/src/test/mockTools.js +340 -0
package/src/test/mockTools.js.map +1 -0
package/src/tools/AskUser.ts +159 -0
package/src/tools/BrowserTools.js +245 -0
package/src/tools/BrowserTools.js.map +1 -0
package/src/tools/BrowserTools.ts +12 -8
package/src/tools/Calculator.js +38 -0
package/src/tools/Calculator.js.map +1 -0
package/src/tools/Calculator.test.js +225 -0
package/src/tools/Calculator.test.js.map +1 -0
package/src/tools/CodeExecutor.js +233 -0
package/src/tools/CodeExecutor.js.map +1 -0
package/src/tools/CodeExecutor.selfhealing.test.ts +435 -0
package/src/tools/CodeExecutor.ts +62 -4
package/src/tools/ProgrammaticToolCalling.js +602 -0
package/src/tools/ProgrammaticToolCalling.js.map +1 -0
package/src/tools/ProgrammaticToolCalling.ts +40 -52
package/src/tools/StreamingToolCallBuffer.js +179 -0
package/src/tools/StreamingToolCallBuffer.js.map +1 -0
package/src/tools/StreamingToolCallBuffer.ts +218 -0
package/src/tools/ToolNode.js +930 -0
package/src/tools/ToolNode.js.map +1 -0
package/src/tools/ToolNode.ts +454 -41
package/src/tools/ToolSearch.js +904 -0
package/src/tools/ToolSearch.js.map +1 -0
package/src/tools/ToolSearch.ts +84 -33
package/src/tools/__tests__/AskUser.test.ts +537 -0
package/src/tools/__tests__/BrowserTools.test.js +306 -0
package/src/tools/__tests__/BrowserTools.test.js.map +1 -0
package/src/tools/__tests__/BrowserTools.test.ts +131 -6
package/src/tools/__tests__/ProgrammaticToolCalling.integration.test.js +276 -0
package/src/tools/__tests__/ProgrammaticToolCalling.integration.test.js.map +1 -0
package/src/tools/__tests__/ProgrammaticToolCalling.test.js +807 -0
package/src/tools/__tests__/ProgrammaticToolCalling.test.js.map +1 -0
package/src/tools/__tests__/StreamingToolCallBuffer.test.js +175 -0
package/src/tools/__tests__/StreamingToolCallBuffer.test.js.map +1 -0
package/src/tools/__tests__/StreamingToolCallBuffer.test.ts +263 -0
package/src/tools/__tests__/ToolApproval.test.js +675 -0
package/src/tools/__tests__/ToolApproval.test.js.map +1 -0
package/src/tools/__tests__/ToolApproval.test.ts +194 -20
package/src/tools/__tests__/ToolNode.hitl.test.ts +267 -0
package/src/tools/__tests__/ToolNode.recovery.test.js +200 -0
package/src/tools/__tests__/ToolNode.recovery.test.js.map +1 -0
package/src/tools/__tests__/ToolNode.recovery.test.ts +276 -0
package/src/tools/__tests__/ToolNode.session.test.js +319 -0
package/src/tools/__tests__/ToolNode.session.test.js.map +1 -0
package/src/tools/__tests__/ToolNode.session.test.ts +465 -0
package/src/tools/__tests__/ToolSearch.integration.test.js +125 -0
package/src/tools/__tests__/ToolSearch.integration.test.js.map +1 -0
package/src/tools/__tests__/ToolSearch.test.js +812 -0
package/src/tools/__tests__/ToolSearch.test.js.map +1 -0
package/src/tools/__tests__/ToolSearch.test.ts +78 -5
package/src/tools/__tests__/handlers.test.js +799 -0
package/src/tools/__tests__/handlers.test.js.map +1 -0
package/src/tools/__tests__/handlers.test.ts +1100 -0
package/src/tools/__tests__/truncation-recovery.integration.test.js +362 -0
package/src/tools/__tests__/truncation-recovery.integration.test.js.map +1 -0
package/src/tools/__tests__/truncation-recovery.integration.test.ts +560 -0
package/src/tools/handlers.js +306 -0
package/src/tools/handlers.js.map +1 -0
package/src/tools/handlers.ts +119 -16
package/src/tools/schema.js +25 -0
package/src/tools/schema.js.map +1 -0
package/src/tools/search/anthropic.js +34 -0
package/src/tools/search/anthropic.js.map +1 -0
package/src/tools/search/content.js +116 -0
package/src/tools/search/content.js.map +1 -0
package/src/tools/search/content.test.js +133 -0
package/src/tools/search/content.test.js.map +1 -0
package/src/tools/search/firecrawl.js +173 -0
package/src/tools/search/firecrawl.js.map +1 -0
package/src/tools/search/format.js +198 -0
package/src/tools/search/format.js.map +1 -0
package/src/tools/search/highlights.js +241 -0
package/src/tools/search/highlights.js.map +1 -0
package/src/tools/search/index.js +3 -0
package/src/tools/search/index.js.map +1 -0
package/src/tools/search/jina-reranker.test.js +106 -0
package/src/tools/search/jina-reranker.test.js.map +1 -0
package/src/tools/search/rerankers.js +165 -0
package/src/tools/search/rerankers.js.map +1 -0
package/src/tools/search/schema.js +102 -0
package/src/tools/search/schema.js.map +1 -0
package/src/tools/search/search.js +561 -0
package/src/tools/search/search.js.map +1 -0
package/src/tools/search/serper-scraper.js +126 -0
package/src/tools/search/serper-scraper.js.map +1 -0
package/src/tools/search/test.js +129 -0
package/src/tools/search/test.js.map +1 -0
package/src/tools/search/tool.js +453 -0
package/src/tools/search/tool.js.map +1 -0
package/src/tools/search/types.js +2 -0
package/src/tools/search/types.js.map +1 -0
package/src/tools/search/utils.js +59 -0
package/src/tools/search/utils.js.map +1 -0
package/src/types/graph.js +24 -0
package/src/types/graph.js.map +1 -0
package/src/types/graph.test.js +192 -0
package/src/types/graph.test.js.map +1 -0
package/src/types/graph.ts +26 -6
package/src/types/index.js +7 -0
package/src/types/index.js.map +1 -0
package/src/types/llm.js +2 -0
package/src/types/llm.js.map +1 -0
package/src/types/llm.ts +8 -3
package/src/types/messages.js +2 -0
package/src/types/messages.js.map +1 -0
package/src/types/run.js +2 -0
package/src/types/run.js.map +1 -0
package/src/types/run.ts +2 -0
package/src/types/stream.js +2 -0
package/src/types/stream.js.map +1 -0
package/src/types/tools.js +2 -0
package/src/types/tools.js.map +1 -0
package/src/types/tools.ts +21 -2
package/src/utils/contextAnalytics.js +79 -0
package/src/utils/contextAnalytics.js.map +1 -0
package/src/utils/contextAnalytics.test.js +166 -0
package/src/utils/contextAnalytics.test.js.map +1 -0
package/src/utils/contextAnalytics.test.ts +222 -0
package/src/utils/contextAnalytics.ts +27 -9
package/src/utils/events.js +26 -0
package/src/utils/events.js.map +1 -0
package/src/utils/graph.js +11 -0
package/src/utils/graph.js.map +1 -0
package/src/utils/handlers.js +65 -0
package/src/utils/handlers.js.map +1 -0
package/src/utils/index.js +10 -0
package/src/utils/index.js.map +1 -0
package/src/utils/index.ts +1 -0
package/src/utils/llm.js +21 -0
package/src/utils/llm.js.map +1 -0
package/src/utils/llmConfig.js +205 -0
package/src/utils/llmConfig.js.map +1 -0
package/src/utils/llmConfig.ts +5 -5
package/src/utils/logging.js +37 -0
package/src/utils/logging.js.map +1 -0
package/src/utils/misc.js +51 -0
package/src/utils/misc.js.map +1 -0
package/src/utils/run.js +69 -0
package/src/utils/run.js.map +1 -0
package/src/utils/run.ts +108 -106
package/src/utils/schema.js +21 -0
package/src/utils/schema.js.map +1 -0
package/src/utils/title.js +119 -0
package/src/utils/title.js.map +1 -0
package/src/utils/tokens.js +92 -0
package/src/utils/tokens.js.map +1 -0
package/src/utils/tokens.ts +118 -142
package/src/utils/toolCallContinuation.ts +55 -0
package/src/utils/toonFormat.js +379 -0
package/src/utils/toonFormat.js.map +1 -0

package/src/specs/observability.integration.test.js ADDED Viewed

@@ -0,0 +1,1337 @@
+/**
+ * Integration tests for Illuma Observability SDK integration in agents.
+ *
+ * These tests verify that the ObservabilityCallbackHandler and IllumaSpanProcessor
+ * correctly route LangChain/OTel events to trace payloads with proper structure,
+ * parent-child relationships, and token usage metrics.
+ *
+ * Uses a mock client to capture enqueued events without hitting a real server.
+ */
+import { ObservabilityCallbackHandler } from '@illuma-ai/observability-langchain';
+// ---------------------------------------------------------------------------
+// Mock Client - captures enqueued events for assertions
+// ---------------------------------------------------------------------------
+class MockObservabilityClient {
+    events = [];
+    flushed = false;
+    shutdownCalled = false;
+    enqueue(event) {
+        this.events.push(event);
+    }
+    async flush() {
+        this.flushed = true;
+    }
+    async shutdown() {
+        this.shutdownCalled = true;
+        await this.flush();
+    }
+    /** Get events filtered by type */
+    getByType(type) {
+        return this.events.filter((e) => e.type === type);
+    }
+    /** Get all event types in order */
+    getEventTypes() {
+        return this.events.map((e) => e.type);
+    }
+    /** Pretty-print all events for debugging */
+    printEvents() {
+        for (const event of this.events) {
+            const body = event.body;
+            const usage = body.usage;
+            console.log(`  ${event.type} | name=${body.name ?? '—'} | id=${body.id ?? '—'} | traceId=${body.traceId ?? '—'} | parentObsId=${body.parentObservationId ?? '—'}` +
+                (usage ? ` | usage={prompt:${usage.promptTokens ?? '—'},completion:${usage.completionTokens ?? '—'},total:${usage.totalTokens ?? '—'}}` : '') +
+                (body.model ? ` | model=${body.model}` : '') +
+                (body.provider ? ` | provider=${body.provider}` : '') +
+                (body.level === 'ERROR' ? ` | ERROR: ${body.statusMessage}` : ''));
+        }
+    }
+}
+// ---------------------------------------------------------------------------
+// Helpers
+// ---------------------------------------------------------------------------
+const serialized = (name) => ({
+    lc: 1,
+    type: 'not_implemented',
+    id: ['langchain', name],
+});
+function makeUUID() {
+    return 'xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx'.replace(/[xy]/g, (c) => {
+        const r = (Math.random() * 16) | 0;
+        const v = c === 'x' ? r : (r & 0x3) | 0x8;
+        return v.toString(16);
+    });
+}
+// ---------------------------------------------------------------------------
+// Tests
+// ---------------------------------------------------------------------------
+describe('ObservabilityCallbackHandler integration', () => {
+    let client;
+    let handler;
+    beforeEach(() => {
+        client = new MockObservabilityClient();
+        handler = new ObservabilityCallbackHandler({
+            client,
+            traceName: 'test-agent-run',
+            userId: 'user-42',
+            sessionId: 'session-abc',
+            tags: ['integration-test'],
+            metadata: { messageId: 'msg-001' },
+            environment: 'test',
+            debug: false,
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 1. Root trace creation
+    // -----------------------------------------------------------------------
+    describe('root trace creation', () => {
+        it('should create a trace on the first chain start', async () => {
+            const chainRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'Hello agent' }, chainRunId);
+            const traceEvents = client.getByType('trace-create');
+            expect(traceEvents).toHaveLength(1);
+            const trace = traceEvents[0].body;
+            expect(trace.name).toBe('test-agent-run');
+            expect(trace.userId).toBe('user-42');
+            expect(trace.sessionId).toBe('session-abc');
+            expect(trace.tags).toEqual(['integration-test']);
+            expect(trace.metadata).toEqual({ messageId: 'msg-001' });
+            expect(trace.environment).toBe('test');
+            expect(trace.input).toEqual({ input: 'Hello agent' });
+        });
+        it('should not create a second trace for nested chains', async () => {
+            const outerRunId = makeUUID();
+            const innerRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'outer' }, outerRunId);
+            await handler.handleChainStart(serialized('ChatPromptTemplate'), { input: 'inner' }, innerRunId, outerRunId);
+            const traceEvents = client.getByType('trace-create');
+            expect(traceEvents).toHaveLength(1); // Only one trace, not two
+        });
+        it('should return the trace ID after creation', async () => {
+            expect(handler.getTraceId()).toBeNull();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, makeUUID());
+            expect(handler.getTraceId()).toBeTruthy();
+            expect(typeof handler.getTraceId()).toBe('string');
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 2. LLM generation events
+    // -----------------------------------------------------------------------
+    describe('LLM generation tracing', () => {
+        it('should create generation-create with input prompts', async () => {
+            const chainRunId = makeUUID();
+            const llmRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleLLMStart(serialized('ChatAnthropic'), ['You are a helpful assistant.\n\nHuman: Hello'], llmRunId, chainRunId, undefined, undefined, { ls_model_name: 'claude-sonnet-4-20250514', ls_provider: 'anthropic' });
+            const genEvents = client.getByType('generation-create');
+            expect(genEvents).toHaveLength(1);
+            const gen = genEvents[0].body;
+            expect(gen.name).toBe('ChatAnthropic');
+            expect(gen.model).toBe('claude-sonnet-4-20250514');
+            expect(gen.provider).toBe('anthropic');
+            expect(gen.input).toEqual(['You are a helpful assistant.\n\nHuman: Hello']);
+            expect(gen.traceId).toBe(handler.getTraceId());
+            // Parent should be the chain
+            const chainEvents = client.getByType('chain-create');
+            const chainObsId = chainEvents[0].body.id;
+            expect(gen.parentObservationId).toBe(chainObsId);
+        });
+        it('should create generation-update with token usage on LLM end', async () => {
+            const chainRunId = makeUUID();
+            const llmRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleLLMStart(serialized('ChatOpenAI'), ['Hello'], llmRunId, chainRunId);
+            const llmResult = {
+                generations: [[{ text: 'Hi there! How can I help?', generationInfo: {} }]],
+                llmOutput: {
+                    tokenUsage: {
+                        promptTokens: 150,
+                        completionTokens: 42,
+                        totalTokens: 192,
+                    },
+                    modelName: 'gpt-4o',
+                    provider: 'openai',
+                },
+            };
+            await handler.handleLLMEnd(llmResult, llmRunId);
+            const genUpdates = client.getByType('generation-update');
+            expect(genUpdates).toHaveLength(1);
+            const update = genUpdates[0].body;
+            expect(update.output).toBe('Hi there! How can I help?');
+            expect(update.model).toBe('gpt-4o');
+            expect(update.provider).toBe('openai');
+            expect(update.endTime).toBeDefined();
+            const usage = update.usage;
+            expect(usage.promptTokens).toBe(150);
+            expect(usage.completionTokens).toBe(42);
+            expect(usage.totalTokens).toBe(192);
+        });
+        it('should handle LLM errors with ERROR level', async () => {
+            const chainRunId = makeUUID();
+            const llmRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleLLMStart(serialized('ChatAnthropic'), ['Hello'], llmRunId, chainRunId);
+            await handler.handleLLMError(new Error('Rate limit exceeded'), llmRunId);
+            const genUpdates = client.getByType('generation-update');
+            expect(genUpdates).toHaveLength(1);
+            const update = genUpdates[0].body;
+            expect(update.level).toBe('ERROR');
+            expect(update.statusMessage).toBe('Rate limit exceeded');
+            expect(update.endTime).toBeDefined();
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 3. Chain events
+    // -----------------------------------------------------------------------
+    describe('chain tracing', () => {
+        it('should create chain-create events with input', async () => {
+            const chainRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { query: 'What is AI?' }, chainRunId);
+            const chainEvents = client.getByType('chain-create');
+            expect(chainEvents).toHaveLength(1);
+            const chain = chainEvents[0].body;
+            expect(chain.name).toBe('RunnableSequence');
+            expect(chain.input).toEqual({ query: 'What is AI?' });
+            expect(chain.traceId).toBe(handler.getTraceId());
+        });
+        it('should create span-update on chain end with output', async () => {
+            const chainRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleChainEnd({ output: 'AI is artificial intelligence.' }, chainRunId);
+            const spanUpdates = client.getByType('span-update');
+            expect(spanUpdates).toHaveLength(1);
+            const update = spanUpdates[0].body;
+            expect(update.output).toEqual({ output: 'AI is artificial intelligence.' });
+            expect(update.endTime).toBeDefined();
+        });
+        it('should handle chain error with ERROR level', async () => {
+            const chainRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleChainError(new Error('Chain failed: missing tool'), chainRunId);
+            const spanUpdates = client.getByType('span-update');
+            const errorUpdate = spanUpdates.find((e) => e.body.level === 'ERROR');
+            expect(errorUpdate).toBeDefined();
+            expect(errorUpdate.body.statusMessage).toBe('Chain failed: missing tool');
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 4. Tool events
+    // -----------------------------------------------------------------------
+    describe('tool tracing', () => {
+        it('should create tool-create events', async () => {
+            const chainRunId = makeUUID();
+            const toolRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleToolStart(serialized('web_search'), '{"query": "latest AI news"}', toolRunId, chainRunId);
+            const toolEvents = client.getByType('tool-create');
+            expect(toolEvents).toHaveLength(1);
+            const tool = toolEvents[0].body;
+            expect(tool.name).toBe('Tool: web_search');
+            expect(tool.input).toBe('{"query": "latest AI news"}');
+            expect(tool.traceId).toBe(handler.getTraceId());
+        });
+        it('should create span-update on tool end', async () => {
+            const chainRunId = makeUUID();
+            const toolRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleToolStart(serialized('calculator'), '{"expression": "2+2"}', toolRunId, chainRunId);
+            await handler.handleToolEnd('4', toolRunId);
+            const spanUpdates = client.getByType('span-update');
+            expect(spanUpdates).toHaveLength(1);
+            expect(spanUpdates[0].body.output).toBe('4');
+        });
+        it('should handle tool error', async () => {
+            const chainRunId = makeUUID();
+            const toolRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleToolStart(serialized('api_call'), '{"url": "https://example.com"}', toolRunId, chainRunId);
+            await handler.handleToolError(new Error('Connection timeout'), toolRunId);
+            const spanUpdates = client.getByType('span-update');
+            const errorUpdate = spanUpdates.find((e) => e.body.level === 'ERROR');
+            expect(errorUpdate).toBeDefined();
+            expect(errorUpdate.body.statusMessage).toBe('Connection timeout');
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 5. Retriever events
+    // -----------------------------------------------------------------------
+    describe('retriever tracing', () => {
+        it('should create retriever-create events', async () => {
+            const chainRunId = makeUUID();
+            const retrieverRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleRetrieverStart(serialized('VectorStoreRetriever'), 'How does photosynthesis work?', retrieverRunId, chainRunId);
+            const retrieverEvents = client.getByType('retriever-create');
+            expect(retrieverEvents).toHaveLength(1);
+            const retriever = retrieverEvents[0].body;
+            expect(retriever.name).toBe('Retriever: VectorStoreRetriever');
+            expect(retriever.input).toBe('How does photosynthesis work?');
+        });
+        it('should produce span-update with documents on retriever end', async () => {
+            const chainRunId = makeUUID();
+            const retrieverRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'test' }, chainRunId);
+            await handler.handleRetrieverStart(serialized('VectorStoreRetriever'), 'photosynthesis', retrieverRunId, chainRunId);
+            const documents = [
+                { pageContent: 'Photosynthesis is the process...', metadata: { source: 'wiki', page: 1 } },
+                { pageContent: 'Plants use chlorophyll...', metadata: { source: 'textbook', page: 42 } },
+            ];
+            await handler.handleRetrieverEnd(documents, retrieverRunId);
+            const spanUpdates = client.getByType('span-update');
+            expect(spanUpdates).toHaveLength(1);
+            const update = spanUpdates[0].body;
+            const output = update.output;
+            expect(output).toHaveLength(2);
+            expect(output[0].pageContent).toBe('Photosynthesis is the process...');
+            expect(output[0].metadata).toEqual({ source: 'wiki', page: 1 });
+            const meta = update.metadata;
+            expect(meta.documentCount).toBe(2);
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 6. Parent-child hierarchy
+    // -----------------------------------------------------------------------
+    describe('parent-child hierarchy', () => {
+        it('should correctly link nested observations to parent', async () => {
+            const outerChainId = makeUUID();
+            const innerChainId = makeUUID();
+            const llmRunId = makeUUID();
+            const toolRunId = makeUUID();
+            // Outer chain starts
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'orchestrate' }, outerChainId);
+            // Inner chain nested under outer
+            await handler.handleChainStart(serialized('ChatPromptTemplate'), { input: 'format prompt' }, innerChainId, outerChainId);
+            // LLM nested under inner chain
+            await handler.handleLLMStart(serialized('ChatOpenAI'), ['formatted prompt'], llmRunId, innerChainId);
+            // Tool nested under outer chain
+            await handler.handleToolStart(serialized('calculator'), '2+2', toolRunId, outerChainId);
+            // Verify hierarchy
+            const chainCreates = client.getByType('chain-create');
+            const genCreates = client.getByType('generation-create');
+            const toolCreates = client.getByType('tool-create');
+            // All share the same traceId
+            const traceId = handler.getTraceId();
+            expect(chainCreates[0].body.traceId).toBe(traceId);
+            expect(chainCreates[1].body.traceId).toBe(traceId);
+            expect(genCreates[0].body.traceId).toBe(traceId);
+            expect(toolCreates[0].body.traceId).toBe(traceId);
+            // Inner chain -> parent is outer chain's observationId
+            const outerChainObsId = chainCreates[0].body.id;
+            const innerChainObsId = chainCreates[1].body.id;
+            expect(chainCreates[1].body.parentObservationId).toBe(outerChainObsId);
+            // LLM -> parent is inner chain
+            expect(genCreates[0].body.parentObservationId).toBe(innerChainObsId);
+            // Tool -> parent is outer chain
+            expect(toolCreates[0].body.parentObservationId).toBe(outerChainObsId);
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 7. Full agent pipeline simulation
+    // -----------------------------------------------------------------------
+    describe('full agent pipeline simulation', () => {
+        it('should produce correct event sequence for a RAG agent with tools', async () => {
+            const chainRunId = makeUUID();
+            const agentChainId = makeUUID();
+            const retrieverRunId = makeUUID();
+            const llmRunId1 = makeUUID();
+            const toolRunId = makeUUID();
+            const llmRunId2 = makeUUID();
+            // 1. Root chain starts (the main graph)
+            await handler.handleChainStart(serialized('CompiledStateGraph'), { messages: [{ role: 'user', content: 'What papers did OpenAI publish in 2024?' }] }, chainRunId);
+            // 2. Agent chain starts (nested)
+            await handler.handleChainStart(serialized('AgentExecutor'), { input: 'What papers did OpenAI publish in 2024?' }, agentChainId, chainRunId);
+            // 3. First LLM call (decides to use tool)
+            await handler.handleLLMStart(serialized('ChatAnthropic'), ['System: You are a research assistant.\nHuman: What papers...'], llmRunId1, agentChainId, undefined, undefined, { ls_model_name: 'claude-sonnet-4-20250514', ls_provider: 'anthropic' });
+            await handler.handleLLMEnd({
+                generations: [[{
+                            text: 'I\'ll search for OpenAI papers from 2024.',
+                            generationInfo: {},
+                        }]],
+                llmOutput: {
+                    tokenUsage: { promptTokens: 200, completionTokens: 30, totalTokens: 230 },
+                    modelName: 'claude-sonnet-4-20250514',
+                    provider: 'anthropic',
+                },
+            }, llmRunId1);
+            // 4. Retriever runs
+            await handler.handleRetrieverStart(serialized('VectorStoreRetriever'), 'OpenAI papers 2024', retrieverRunId, agentChainId);
+            await handler.handleRetrieverEnd([
+                { pageContent: 'GPT-4o: omni-model for text, vision, audio...', metadata: { source: 'arxiv', year: 2024 } },
+                { pageContent: 'Sora: text-to-video generation model...', metadata: { source: 'blog', year: 2024 } },
+            ], retrieverRunId);
+            // 5. Tool call (web search)
+            await handler.handleToolStart(serialized('web_search'), '{"query": "OpenAI 2024 research papers list"}', toolRunId, agentChainId);
+            await handler.handleToolEnd(JSON.stringify([
+                { title: 'GPT-4o Technical Report', url: 'https://arxiv.org/...' },
+                { title: 'Sora', url: 'https://openai.com/sora' },
+            ]), toolRunId);
+            // 6. Second LLM call (final answer)
+            await handler.handleLLMStart(serialized('ChatAnthropic'), ['System: ...\nContext: ...\nHuman: What papers...'], llmRunId2, agentChainId, undefined, undefined, { ls_model_name: 'claude-sonnet-4-20250514', ls_provider: 'anthropic' });
+            await handler.handleLLMEnd({
+                generations: [[{
+                            text: 'OpenAI published several notable papers in 2024 including GPT-4o and Sora...',
+                            generationInfo: {},
+                        }]],
+                llmOutput: {
+                    tokenUsage: { promptTokens: 800, completionTokens: 150, totalTokens: 950 },
+                    modelName: 'claude-sonnet-4-20250514',
+                    provider: 'anthropic',
+                },
+            }, llmRunId2);
+            // 7. Chains end
+            await handler.handleChainEnd({ output: 'OpenAI published several notable papers...' }, agentChainId);
+            await handler.handleChainEnd({ messages: [{ role: 'assistant', content: 'OpenAI published several notable papers...' }] }, chainRunId);
+            // Flush
+            await handler.flushAsync();
+            expect(client.flushed).toBe(true);
+            // --- Assertions ---
+            // Uncomment to debug: client.printEvents();
+            // Verify event counts
+            const eventTypes = client.getEventTypes();
+            const typeCounts = eventTypes.reduce((acc, t) => { acc[t] = (acc[t] || 0) + 1; return acc; }, {});
+            expect(typeCounts['trace-create']).toBe(1); // Root trace
+            expect(typeCounts['chain-create']).toBe(1); // Outer chain only
+            expect(typeCounts['agent-create']).toBe(1); // AgentExecutor detected as agent!
+            expect(typeCounts['generation-create']).toBe(2); // Two LLM calls
+            expect(typeCounts['generation-update']).toBe(2); // Two LLM ends
+            expect(typeCounts['retriever-create']).toBe(1); // One retriever
+            expect(typeCounts['tool-create']).toBe(1); // One tool
+            expect(typeCounts['span-update']).toBe(4); // retriever end + tool end + 2 chain ends
+            // Verify all events share the same traceId
+            const traceId = handler.getTraceId();
+            for (const event of client.events) {
+                const body = event.body;
+                if (body.traceId) {
+                    expect(body.traceId).toBe(traceId);
+                }
+            }
+            // Verify token usage in generation-update events
+            const genUpdates = client.getByType('generation-update');
+            // First LLM call usage
+            const firstLLMUpdate = genUpdates[0].body;
+            const firstUsage = firstLLMUpdate.usage;
+            expect(firstUsage.promptTokens).toBe(200);
+            expect(firstUsage.completionTokens).toBe(30);
+            expect(firstUsage.totalTokens).toBe(230);
+            expect(firstLLMUpdate.model).toBe('claude-sonnet-4-20250514');
+            expect(firstLLMUpdate.provider).toBe('anthropic');
+            // Second LLM call usage
+            const secondLLMUpdate = genUpdates[1].body;
+            const secondUsage = secondLLMUpdate.usage;
+            expect(secondUsage.promptTokens).toBe(800);
+            expect(secondUsage.completionTokens).toBe(150);
+            expect(secondUsage.totalTokens).toBe(950);
+            // Verify total token computation
+            const totalPrompt = 200 + 800;
+            const totalCompletion = 30 + 150;
+            const totalTokens = totalPrompt + totalCompletion;
+            expect(totalPrompt).toBe(1000);
+            expect(totalCompletion).toBe(180);
+            expect(totalTokens).toBe(1180);
+            // Total: 1180 tokens (1000 prompt + 180 completion) across 2 LLM calls
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 8. Token usage edge cases
+    // -----------------------------------------------------------------------
+    describe('token usage edge cases', () => {
+        it('should handle different token usage field names (prompt_tokens vs promptTokens)', async () => {
+            const chainRunId = makeUUID();
+            const llmRunId = makeUUID();
+            await handler.handleChainStart(serialized('Chain'), { input: 'test' }, chainRunId);
+            await handler.handleLLMStart(serialized('ChatOpenAI'), ['test'], llmRunId, chainRunId);
+            // OpenAI style: uses prompt_tokens (snake_case)
+            await handler.handleLLMEnd({
+                generations: [[{ text: 'response', generationInfo: {} }]],
+                llmOutput: {
+                    tokenUsage: {
+                        prompt_tokens: 100,
+                        completion_tokens: 50,
+                        total_tokens: 150,
+                    },
+                },
+            }, llmRunId);
+            const updates = client.getByType('generation-update');
+            const usage = updates[0].body.usage;
+            // The handler should normalize both field naming conventions
+            expect(usage.promptTokens ?? usage.prompt_tokens).toBeTruthy();
+        });
+        it('should handle missing token usage gracefully', async () => {
+            const chainRunId = makeUUID();
+            const llmRunId = makeUUID();
+            await handler.handleChainStart(serialized('Chain'), { input: 'test' }, chainRunId);
+            await handler.handleLLMStart(serialized('ChatOpenAI'), ['test'], llmRunId, chainRunId);
+            // No llmOutput at all
+            await handler.handleLLMEnd({ generations: [[{ text: 'response', generationInfo: {} }]] }, llmRunId);
+            const updates = client.getByType('generation-update');
+            expect(updates).toHaveLength(1);
+            // Should not crash, usage should be present but with undefined values
+            const usage = updates[0].body.usage;
+            expect(usage).toBeDefined();
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 9. Flush and shutdown
+    // -----------------------------------------------------------------------
+    describe('flush and shutdown', () => {
+        it('flushAsync should call client.flush()', async () => {
+            await handler.handleChainStart(serialized('Chain'), { input: 'test' }, makeUUID());
+            await handler.flushAsync();
+            expect(client.flushed).toBe(true);
+        });
+        it('shutdown should call client.flush() (not shutdown) for external client', async () => {
+            await handler.handleChainStart(serialized('Chain'), { input: 'test' }, makeUUID());
+            await handler.shutdown();
+            // Since we provided an external client, it should only flush, not shutdown
+            expect(client.flushed).toBe(true);
+            expect(client.shutdownCalled).toBe(false);
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 10. Agent detection
+    // -----------------------------------------------------------------------
+    describe('agent detection', () => {
+        it('should emit agent-create for chains with langgraph_node agent= metadata', async () => {
+            const outerChainId = makeUUID();
+            const agentChainId = makeUUID();
+            await handler.handleChainStart(serialized('CompiledStateGraph'), { messages: [{ role: 'user', content: 'Hello' }] }, outerChainId);
+            // Agent chain with langgraph_node metadata
+            // Cast to any to pass tags/metadata params (ts-jest resolves different .d.ts for BaseCallbackHandler)
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'agent task' }, agentChainId, outerChainId, undefined, // tags
+            { langgraph_node: 'agent=research-agent' });
+            const agentEvents = client.getByType('agent-create');
+            expect(agentEvents).toHaveLength(1);
+            const agentBody = agentEvents[0].body;
+            expect(agentBody.name).toBe('Agent: research-agent');
+            expect(agentBody.traceId).toBe(handler.getTraceId());
+            const meta = agentBody.metadata;
+            expect(meta.agentId).toBe('research-agent');
+            expect(meta.langchainMetadata).toEqual({ langgraph_node: 'agent=research-agent' });
+        });
+        it('should emit agent-create for AgentExecutor chain name', async () => {
+            const agentRunId = makeUUID();
+            await handler.handleChainStart(serialized('AgentExecutor'), { input: 'do something' }, agentRunId);
+            const agentEvents = client.getByType('agent-create');
+            expect(agentEvents).toHaveLength(1);
+            expect(agentEvents[0].body.name).toBe('AgentExecutor');
+            // Should NOT produce a chain-create
+            const chainEvents = client.getByType('chain-create');
+            expect(chainEvents).toHaveLength(0);
+        });
+        it('should emit agent-create for chain names ending in Agent', async () => {
+            const agentRunId = makeUUID();
+            await handler.handleChainStart(serialized('ReactAgent'), { input: 'think and act' }, agentRunId);
+            const agentEvents = client.getByType('agent-create');
+            expect(agentEvents).toHaveLength(1);
+            expect(agentEvents[0].body.name).toBe('ReactAgent');
+        });
+        it('should NOT emit agent-create for regular chains', async () => {
+            const chainRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'regular chain' }, chainRunId);
+            const agentEvents = client.getByType('agent-create');
+            expect(agentEvents).toHaveLength(0);
+            const chainEvents = client.getByType('chain-create');
+            expect(chainEvents).toHaveLength(1);
+        });
+        it('should correctly end agent observations with span-update', async () => {
+            const agentRunId = makeUUID();
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'agent task' }, agentRunId, undefined, // parentRunId
+            undefined, // tags
+            { langgraph_node: 'agent=planner' });
+            await handler.handleChainEnd({ output: 'agent completed' }, agentRunId);
+            const agentEvents = client.getByType('agent-create');
+            expect(agentEvents).toHaveLength(1);
+            const spanUpdates = client.getByType('span-update');
+            expect(spanUpdates).toHaveLength(1);
+            const update = spanUpdates[0].body;
+            expect(update.output).toEqual({ output: 'agent completed' });
+            expect(update.endTime).toBeDefined();
+            // The span-update should reference the same observation ID as agent-create
+            expect(update.id).toBe(agentEvents[0].body.id);
+        });
+        it('should handle agent error with ERROR level', async () => {
+            const agentRunId = makeUUID();
+            await handler.handleChainStart(serialized('AgentExecutor'), { input: 'fail task' }, agentRunId);
+            await handler.handleChainError(new Error('Agent failed: tool not found'), agentRunId);
+            const agentEvents = client.getByType('agent-create');
+            expect(agentEvents).toHaveLength(1);
+            const spanUpdates = client.getByType('span-update');
+            const errorUpdate = spanUpdates.find((e) => e.body.level === 'ERROR');
+            expect(errorUpdate).toBeDefined();
+            expect(errorUpdate.body.statusMessage).toBe('Agent failed: tool not found');
+        });
+        it('should integrate agent-create in full pipeline with correct counts', async () => {
+            const rootChainId = makeUUID();
+            const agentChainId = makeUUID();
+            const llmRunId = makeUUID();
+            // Root chain
+            await handler.handleChainStart(serialized('CompiledStateGraph'), { messages: [{ role: 'user', content: 'Hello' }] }, rootChainId);
+            // Agent chain (detected via metadata)
+            await handler.handleChainStart(serialized('RunnableSequence'), { input: 'agent work' }, agentChainId, rootChainId, undefined, // tags
+            { langgraph_node: 'agent=qa-agent' });
+            // LLM inside agent
+            await handler.handleLLMStart(serialized('ChatAnthropic'), ['prompt'], llmRunId, agentChainId, undefined, undefined, { ls_model_name: 'claude-sonnet-4-20250514', ls_provider: 'anthropic' });
+            await handler.handleLLMEnd({
+                generations: [[{ text: 'answer', generationInfo: {} }]],
+                llmOutput: {
+                    tokenUsage: { promptTokens: 100, completionTokens: 20, totalTokens: 120 },
+                    modelName: 'claude-sonnet-4-20250514',
+                },
+            }, llmRunId);
+            await handler.handleChainEnd({ output: 'done' }, agentChainId);
+            await handler.handleChainEnd({ output: 'done' }, rootChainId);
+            const typeCounts = client.getEventTypes().reduce((acc, t) => { acc[t] = (acc[t] || 0) + 1; return acc; }, {});
+            expect(typeCounts['trace-create']).toBe(1);
+            expect(typeCounts['chain-create']).toBe(1); // Only root chain
+            expect(typeCounts['agent-create']).toBe(1); // Agent detected!
+            expect(typeCounts['generation-create']).toBe(1);
+            expect(typeCounts['generation-update']).toBe(1);
+            expect(typeCounts['span-update']).toBe(2); // agent end + root chain end
+            // LLM parent should be the agent observation
+            const agentObsId = client.getByType('agent-create')[0].body.id;
+            const genCreate = client.getByType('generation-create')[0].body;
+            expect(genCreate.parentObservationId).toBe(agentObsId);
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 11. Event structure validation
+    // -----------------------------------------------------------------------
+    describe('event structure validation', () => {
+        it('every event should have id, type, timestamp, and body', async () => {
+            const chainRunId = makeUUID();
+            const llmRunId = makeUUID();
+            await handler.handleChainStart(serialized('Chain'), { input: 'test' }, chainRunId);
+            await handler.handleLLMStart(serialized('LLM'), ['test'], llmRunId, chainRunId);
+            await handler.handleLLMEnd({ generations: [[{ text: 'ok', generationInfo: {} }]], llmOutput: { tokenUsage: {} } }, llmRunId);
+            await handler.handleChainEnd({ output: 'done' }, chainRunId);
+            for (const event of client.events) {
+                expect(event.id).toBeDefined();
+                expect(typeof event.id).toBe('string');
+                expect(event.type).toBeDefined();
+                expect(event.timestamp).toMatch(/^\d{4}-\d{2}-\d{2}T/);
+                expect(event.body).toBeDefined();
+                expect(typeof event.body).toBe('object');
+            }
+        });
+        it('observation events should have traceId and observationId', async () => {
+            const chainRunId = makeUUID();
+            await handler.handleChainStart(serialized('Chain'), { input: 'test' }, chainRunId);
+            await handler.handleChainEnd({ output: 'done' }, chainRunId);
+            const nonTraceEvents = client.events.filter((e) => e.type !== 'trace-create');
+            for (const event of nonTraceEvents) {
+                const body = event.body;
+                expect(body.traceId).toBe(handler.getTraceId());
+                expect(body.id).toBeDefined();
+            }
+        });
+    });
+});
+// ---------------------------------------------------------------------------
+// IllumaSpanProcessor unit tests (OTel integration)
+// ---------------------------------------------------------------------------
+describe('IllumaSpanProcessor integration', () => {
+    it('should be importable from @illuma-ai/observability-otel', async () => {
+        const { IllumaSpanProcessor } = await import('@illuma-ai/observability-otel');
+        expect(IllumaSpanProcessor).toBeDefined();
+        expect(typeof IllumaSpanProcessor).toBe('function');
+    });
+});
+// ---------------------------------------------------------------------------
+// Core SDK features: sampling, PII masking, observation types, prompt/dataset
+// ---------------------------------------------------------------------------
+describe('Core SDK features', () => {
+    // Use require to bypass ts-jest module resolution issues with dynamic imports
+    // eslint-disable-next-line @typescript-eslint/no-require-imports
+    const { ObservabilityCoreClient, TraceClient, SpanClient, IngestionEventType, } = require('@illuma-ai/observability-core');
+    // Create a concrete subclass at runtime to avoid TS abstract class issues
+    const TestClientClass = class extends ObservabilityCoreClient {
+        async fetchWithRetry() {
+            return { status: 200, statusText: 'OK', ok: true, json: async () => ({}), text: async () => '' };
+        }
+    };
+    function createTestClient(config = {}) {
+        const events = [];
+        const client = new TestClientClass({
+            publicKey: 'pk-test',
+            secretKey: 'sk-test',
+            baseUrl: 'http://localhost:9999',
+            flushInterval: 0,
+            ...config,
+        });
+        // Intercept enqueue to capture events
+        const origEnqueue = client.enqueue.bind(client);
+        client.enqueue = (event) => {
+            origEnqueue(event);
+            events.push(event);
+        };
+        return { client, events };
+    }
+    // -----------------------------------------------------------------------
+    // 12. Sampling rate
+    // -----------------------------------------------------------------------
+    describe('sampling rate', () => {
+        it('should trace everything when sampleRate=1.0 (default)', () => {
+            const { client, events } = createTestClient({ sampleRate: 1.0 });
+            for (let i = 0; i < 20; i++) {
+                client.trace({ name: `trace-${i}` });
+            }
+            // All 20 traces should be created (each produces a trace-create event queued)
+            const traceEvents = events.filter((e) => e.type === 'trace-create');
+            expect(traceEvents.length).toBe(20);
+        });
+        it('should trace nothing when sampleRate=0.0', () => {
+            const { client, events } = createTestClient({ sampleRate: 0.0 });
+            for (let i = 0; i < 20; i++) {
+                const trace = client.trace({ name: `trace-${i}` });
+                // Even child events should be silently dropped
+                trace.generation({ name: 'gen', model: 'gpt-4o' });
+                trace.span({ name: 'span' });
+            }
+            // No events should be enqueued at all
+            expect(events.length).toBe(0);
+        });
+        it('should sample approximately the right percentage', () => {
+            // Use a fixed seed approach: run many traces with 50% sample rate
+            const { client, events } = createTestClient({ sampleRate: 0.5 });
+            const iterations = 1000;
+            for (let i = 0; i < iterations; i++) {
+                client.trace({ name: `trace-${i}` });
+            }
+            const traceEvents = events.filter((e) => e.type === 'trace-create');
+            // With 1000 iterations at 50%, expect roughly 400-600 traces
+            expect(traceEvents.length).toBeGreaterThan(300);
+            expect(traceEvents.length).toBeLessThan(700);
+        });
+        it('should include all children once a trace is sampled in', () => {
+            const { client, events } = createTestClient({ sampleRate: 1.0 });
+            const trace = client.trace({ name: 'sampled-trace' });
+            trace.span({ name: 'child-span' });
+            trace.generation({ name: 'child-gen', model: 'gpt-4o' });
+            trace.agent({ name: 'child-agent' });
+            trace.tool({ name: 'child-tool' });
+            // 1 trace + 4 children = 5 events
+            expect(events.length).toBe(5);
+        });
+        it('should clamp sampleRate to [0, 1] range', () => {
+            // sampleRate > 1 should be clamped to 1 (trace everything)
+            const { events: events1 } = createTestClient({ sampleRate: 5.0 });
+            // sampleRate < 0 should be clamped to 0 (trace nothing)
+            const { client: client2, events: events2 } = createTestClient({ sampleRate: -1 });
+            client2.trace({ name: 'should-not-appear' });
+            expect(events2.length).toBe(0);
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 13. PII masking
+    // -----------------------------------------------------------------------
+    describe('PII masking', () => {
+        it('should apply mask function to event bodies', () => {
+            const maskFunction = (body) => {
+                const masked = { ...body };
+                if (typeof masked.input === 'string') {
+                    masked.input = masked.input.replace(/[\w.-]+@[\w.-]+\.\w+/g, '[EMAIL]');
+                }
+                return masked;
+            };
+            const { client } = createTestClient({ maskFunction });
+            const trace = client.trace({ name: 'pii-test' });
+            trace.span({
+                name: 'user-query',
+                input: 'My email is john@example.com and I need help',
+            });
+            // Check the queued events - the span should have masked input
+            const queue = client.getQueue();
+            const spanEvent = [...queue].find((e) => e.type === 'span-create');
+            if (spanEvent) {
+                expect(spanEvent.body.input).toBe('My email is [EMAIL] and I need help');
+                expect(spanEvent.body.input).not.toContain('john@example.com');
+            }
+        });
+        it('should mask multiple PII patterns', () => {
+            const maskFunction = (body) => {
+                const masked = { ...body };
+                const str = JSON.stringify(masked);
+                const redacted = str
+                    .replace(/[\w.-]+@[\w.-]+\.\w+/g, '[EMAIL]')
+                    .replace(/\b\d{3}[-.]?\d{3}[-.]?\d{4}\b/g, '[PHONE]')
+                    .replace(/\b\d{4}[- ]?\d{4}[- ]?\d{4}[- ]?\d{4}\b/g, '[CARD]');
+                return JSON.parse(redacted);
+            };
+            const { client } = createTestClient({ maskFunction });
+            const trace = client.trace({
+                name: 'multi-pii',
+                metadata: { userEmail: 'test@corp.com', phone: '555-123-4567' },
+            });
+            const queue = client.getQueue();
+            const traceEvent = [...queue].find((e) => e.type === 'trace-create');
+            if (traceEvent) {
+                const meta = traceEvent.body.metadata;
+                expect(meta.userEmail).toBe('[EMAIL]');
+                expect(meta.phone).toBe('[PHONE]');
+            }
+        });
+        it('should gracefully handle mask function errors', () => {
+            const maskFunction = () => {
+                throw new Error('Mask function exploded');
+            };
+            const { client } = createTestClient({ maskFunction });
+            // Should not throw — falls back to unmasked
+            expect(() => {
+                client.trace({ name: 'should-not-crash' });
+            }).not.toThrow();
+            const queue = client.getQueue();
+            expect(queue.length).toBeGreaterThan(0);
+        });
+        it('should not modify events when no mask function is set', () => {
+            const { client } = createTestClient();
+            client.trace({
+                name: 'no-mask',
+                metadata: { email: 'visible@example.com' },
+            });
+            const queue = client.getQueue();
+            const traceEvent = [...queue].find((e) => e.type === 'trace-create');
+            expect(traceEvent.body.metadata.email).toBe('visible@example.com');
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 14. All observation types (TraceClient + SpanClient)
+    // -----------------------------------------------------------------------
+    describe('observation types completeness', () => {
+        it('TraceClient should have all observation type methods', () => {
+            const enqueue = jest.fn();
+            const trace = new TraceClient('trace-123', enqueue);
+            // All typed observation methods should exist and return SpanClient or GenerationClient
+            expect(typeof trace.span).toBe('function');
+            expect(typeof trace.agent).toBe('function');
+            expect(typeof trace.tool).toBe('function');
+            expect(typeof trace.chain).toBe('function');
+            expect(typeof trace.retriever).toBe('function');
+            expect(typeof trace.guardrail).toBe('function');
+            expect(typeof trace.evaluator).toBe('function');
+            expect(typeof trace.embedding).toBe('function');
+            expect(typeof trace.generation).toBe('function');
+            expect(typeof trace.event).toBe('function');
+            expect(typeof trace.score).toBe('function');
+        });
+        it('SpanClient should have all observation type methods', () => {
+            const enqueue = jest.fn();
+            const span = new SpanClient('span-123', 'trace-123', enqueue);
+            expect(typeof span.span).toBe('function');
+            expect(typeof span.agent).toBe('function');
+            expect(typeof span.tool).toBe('function');
+            expect(typeof span.chain).toBe('function');
+            expect(typeof span.retriever).toBe('function');
+            expect(typeof span.guardrail).toBe('function');
+            expect(typeof span.evaluator).toBe('function');
+            expect(typeof span.embedding).toBe('function');
+            expect(typeof span.generation).toBe('function');
+            expect(typeof span.event).toBe('function');
+            expect(typeof span.score).toBe('function');
+        });
+        it('should emit correct event types for each observation method on TraceClient', () => {
+            const events = [];
+            const enqueue = (event) => events.push(event);
+            const trace = new TraceClient('trace-456', enqueue);
+            trace.span({ name: 'span' });
+            trace.agent({ name: 'agent' });
+            trace.tool({ name: 'tool' });
+            trace.chain({ name: 'chain' });
+            trace.retriever({ name: 'retriever' });
+            trace.guardrail({ name: 'guardrail' });
+            trace.evaluator({ name: 'evaluator' });
+            trace.embedding({ name: 'embedding' });
+            trace.generation({ name: 'generation' });
+            trace.event({ name: 'event' });
+            const types = events.map((e) => e.type);
+            expect(types).toContain('span-create');
+            expect(types).toContain('agent-create');
+            expect(types).toContain('tool-create');
+            expect(types).toContain('chain-create');
+            expect(types).toContain('retriever-create');
+            expect(types).toContain('guardrail-create');
+            expect(types).toContain('evaluator-create');
+            expect(types).toContain('embedding-create');
+            expect(types).toContain('generation-create');
+            expect(types).toContain('event-create');
+        });
+        it('should emit correct event types for each observation method on SpanClient', () => {
+            const events = [];
+            const enqueue = (event) => events.push(event);
+            const span = new SpanClient('span-789', 'trace-789', enqueue);
+            span.span({ name: 'child-span' });
+            span.agent({ name: 'child-agent' });
+            span.tool({ name: 'child-tool' });
+            span.chain({ name: 'child-chain' });
+            span.retriever({ name: 'child-retriever' });
+            span.guardrail({ name: 'child-guardrail' });
+            span.evaluator({ name: 'child-evaluator' });
+            span.embedding({ name: 'child-embedding' });
+            span.generation({ name: 'child-generation' });
+            span.event({ name: 'child-event' });
+            const types = events.map((e) => e.type);
+            expect(types).toContain('span-create');
+            expect(types).toContain('agent-create');
+            expect(types).toContain('tool-create');
+            expect(types).toContain('chain-create');
+            expect(types).toContain('retriever-create');
+            expect(types).toContain('guardrail-create');
+            expect(types).toContain('evaluator-create');
+            expect(types).toContain('embedding-create');
+            expect(types).toContain('generation-create');
+            expect(types).toContain('event-create');
+        });
+        it('SpanClient children should set parentObservationId automatically', () => {
+            const events = [];
+            const enqueue = (event) => events.push(event);
+            const span = new SpanClient('parent-span', 'trace-abc', enqueue);
+            span.guardrail({ name: 'guardrail-check' });
+            span.evaluator({ name: 'eval-run' });
+            span.embedding({ name: 'embed-op' });
+            for (const event of events) {
+                expect(event.body.parentObservationId).toBe('parent-span');
+                expect(event.body.traceId).toBe('trace-abc');
+            }
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 15. Prompt & Dataset SDK methods
+    // -----------------------------------------------------------------------
+    describe('prompt and dataset SDK methods', () => {
+        it('core client should expose getPrompt method', () => {
+            const { client } = createTestClient();
+            expect(typeof client.getPrompt).toBe('function');
+        });
+        it('core client should expose createPrompt method', () => {
+            const { client } = createTestClient();
+            expect(typeof client.createPrompt).toBe('function');
+        });
+        it('core client should expose getDataset method', () => {
+            const { client } = createTestClient();
+            expect(typeof client.getDataset).toBe('function');
+        });
+        it('core client should expose createDataset method', () => {
+            const { client } = createTestClient();
+            expect(typeof client.createDataset).toBe('function');
+        });
+        it('core client should expose createDatasetItem method', () => {
+            const { client } = createTestClient();
+            expect(typeof client.createDatasetItem).toBe('function');
+        });
+        it('getPrompt should return parsed response from server', async () => {
+            const { client } = createTestClient();
+            // Mock fetchWithRetry returns { ok: true, json: async () => ({}) }
+            const result = await client.getPrompt({ name: 'my-prompt' });
+            expect(result).toBeDefined();
+            expect(result).toEqual({});
+        });
+        it('getDataset should return parsed response from server', async () => {
+            const { client } = createTestClient();
+            const result = await client.getDataset({ name: 'my-dataset' });
+            expect(result).toBeDefined();
+            expect(result).toEqual({});
+        });
+        it('prompt/dataset methods should return null when disabled', async () => {
+            const { client } = createTestClient({ enabled: false });
+            expect(await client.getPrompt({ name: 'test' })).toBeNull();
+            expect(await client.createPrompt({ name: 'test', prompt: 'hello' })).toBeNull();
+            expect(await client.getDataset({ name: 'test' })).toBeNull();
+            expect(await client.createDataset({ name: 'test' })).toBeNull();
+            expect(await client.createDatasetItem({ datasetName: 'test', input: 'x' })).toBeNull();
+        });
+    });
+    // -----------------------------------------------------------------------
+    // 16. Node SDK: sampling + PII masking propagation
+    // -----------------------------------------------------------------------
+    describe('node SDK config propagation', () => {
+        // eslint-disable-next-line @typescript-eslint/no-require-imports
+        const { Observability } = require('@illuma-ai/observability-node');
+        it('Observability class should accept sampleRate option', async () => {
+            expect(Observability).toBeDefined();
+            const obs = new Observability({
+                publicKey: 'pk-test',
+                secretKey: 'sk-test',
+                baseUrl: 'http://localhost:9999',
+                sampleRate: 0.5,
+                flushInterval: 0,
+            });
+            expect(obs).toBeDefined();
+            await obs.shutdown();
+        });
+        it('Observability class should accept maskFunction option', async () => {
+            const obs = new Observability({
+                publicKey: 'pk-test',
+                secretKey: 'sk-test',
+                baseUrl: 'http://localhost:9999',
+                maskFunction: (body) => ({ ...body, input: '[REDACTED]' }),
+                flushInterval: 0,
+            });
+            expect(obs).toBeDefined();
+            await obs.shutdown();
+        });
+    });
+});
+// ---------------------------------------------------------------------------
+// 17. Guardrail tracing via ObservabilityCallbackHandler
+// ---------------------------------------------------------------------------
+/** Re-use MockObservabilityClient shape for guardrail tests (same file, top-level scope) */
+class GuardrailMockClient {
+    events = [];
+    flushed = false;
+    shutdownCalled = false;
+    enqueue(event) { this.events.push(event); }
+    async flush() { this.flushed = true; }
+    async shutdown() { this.shutdownCalled = true; }
+    getByType(type) { return this.events.filter((e) => e.type === type); }
+    getEventTypes() { return this.events.map((e) => e.type); }
+    printEvents() {
+        for (const event of this.events) {
+            const body = event.body;
+            const usage = body.usage;
+            console.log(`  ${event.type} | name=${body.name ?? '—'} | id=${body.id ?? '—'} | traceId=${body.traceId ?? '—'} | parentObsId=${body.parentObservationId ?? '—'}` +
+                (usage ? ` | usage={prompt:${usage.promptTokens ?? '—'},completion:${usage.completionTokens ?? '—'},total:${usage.totalTokens ?? '—'}}` : '') +
+                (body.model ? ` | model=${body.model}` : '') +
+                (body.level === 'ERROR' || body.level === 'WARNING' ? ` | ${body.level}: ${body.statusMessage}` : ''));
+        }
+    }
+}
+const grSerialized = (name) => ({
+    lc: 1,
+    type: 'not_implemented',
+    id: ['langchain', name],
+});
+describe('Guardrail tracing', () => {
+    let grClient;
+    let grHandler; // Use any to bypass ts-jest type resolution for traceGuardrail
+    beforeEach(() => {
+        grClient = new GuardrailMockClient();
+        grHandler = new ObservabilityCallbackHandler({
+            client: grClient,
+        });
+    });
+    it('outcome=passed should create guardrail-create + span-update with DEFAULT level', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('RunnableSequence'), { input: 'hello' }, chainRunId);
+        const result = grHandler.traceGuardrail({
+            name: 'Output Moderation',
+            guardrailId: 'bedrock-guardrail-123',
+            guardrailVersion: '1',
+            outcome: 'passed',
+            actionApplied: false,
+            action: 'NONE',
+            reason: 'passed',
+            source: 'OUTPUT',
+            input: 'What is the weather?',
+            output: 'The weather is sunny.',
+            violations: [],
+            assessments: [{ contentPolicy: { filters: [] } }],
+        });
+        expect(result).not.toBeNull();
+        const guardrailEvents = grClient.getByType('guardrail-create');
+        expect(guardrailEvents).toHaveLength(1);
+        const grBody = guardrailEvents[0].body;
+        expect(grBody.name).toBe('Output Moderation');
+        expect(grBody.input).toBe('What is the weather?');
+        expect(grBody.metadata.guardrailId).toBe('bedrock-guardrail-123');
+        expect(grBody.metadata.outcome).toBe('passed');
+        expect(grBody.metadata.source).toBe('OUTPUT');
+        // span-update should show PASSED
+        const spanUpdates = grClient.getByType('span-update');
+        const guardrailUpdate = spanUpdates.find((e) => e.body.id === result);
+        expect(guardrailUpdate).toBeDefined();
+        expect(guardrailUpdate.body.output).toBe('The weather is sunny.');
+        expect(guardrailUpdate.body.level).toBe('DEFAULT');
+        expect(guardrailUpdate.body.statusMessage).toBe('PASSED');
+    });
+    it('outcome=blocked should mark with ERROR level when enforced', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('RunnableSequence'), { input: 'test' }, chainRunId);
+        grHandler.traceGuardrail({
+            name: 'Input Moderation',
+            guardrailId: 'bedrock-guardrail-456',
+            outcome: 'blocked',
+            actionApplied: true,
+            action: 'GUARDRAIL_INTERVENED',
+            reason: 'policy_violation',
+            source: 'INPUT',
+            input: 'How to hack a system?',
+            output: 'Sorry, I cannot help with that.',
+            violations: [{ type: 'CONTENT_POLICY', category: 'VIOLENCE', action: 'BLOCKED' }],
+        });
+        const spanUpdates = grClient.getByType('span-update');
+        const guardrailUpdate = spanUpdates[spanUpdates.length - 1];
+        expect(guardrailUpdate.body.level).toBe('ERROR');
+        expect(guardrailUpdate.body.statusMessage).toBe('BLOCKED: policy_violation');
+        expect(guardrailUpdate.body.metadata.outcome).toBe('blocked');
+        expect(guardrailUpdate.body.metadata.actionApplied).toBe(true);
+        expect(guardrailUpdate.body.metadata.violations).toHaveLength(1);
+    });
+    it('outcome=blocked with actionApplied=false should note "not enforced"', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('RunnableSequence'), { input: 'test' }, chainRunId);
+        grHandler.traceGuardrail({
+            name: 'Input Moderation',
+            outcome: 'blocked',
+            actionApplied: false,
+            reason: 'policy_violation',
+            source: 'INPUT',
+            input: 'Some flagged content',
+        });
+        const spanUpdates = grClient.getByType('span-update');
+        const guardrailUpdate = spanUpdates[spanUpdates.length - 1];
+        expect(guardrailUpdate.body.level).toBe('ERROR');
+        expect(guardrailUpdate.body.statusMessage).toContain('not enforced');
+        expect(guardrailUpdate.body.metadata.actionApplied).toBe(false);
+    });
+    it('outcome=anonymized should mark with WARNING and include modified content', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('RunnableSequence'), { input: 'test' }, chainRunId);
+        grHandler.traceGuardrail({
+            name: 'Output Moderation',
+            outcome: 'anonymized',
+            actionApplied: true,
+            action: 'GUARDRAIL_INTERVENED',
+            reason: 'anonymized',
+            source: 'OUTPUT',
+            input: 'My email is john@example.com and SSN is 123-45-6789',
+            originalContent: 'My email is john@example.com and SSN is 123-45-6789',
+            modifiedContent: 'My email is [EMAIL] and SSN is [SSN]',
+            violations: [
+                { type: 'PII_POLICY', category: 'EMAIL', action: 'ANONYMIZED' },
+                { type: 'PII_POLICY', category: 'SSN', action: 'ANONYMIZED' },
+            ],
+        });
+        const spanUpdates = grClient.getByType('span-update');
+        const guardrailUpdate = spanUpdates[spanUpdates.length - 1];
+        expect(guardrailUpdate.body.level).toBe('WARNING');
+        expect(guardrailUpdate.body.statusMessage).toBe('ANONYMIZED: PII detected and masked');
+        // output should be the modified content
+        expect(guardrailUpdate.body.output).toBe('My email is [EMAIL] and SSN is [SSN]');
+        const meta = guardrailUpdate.body.metadata;
+        expect(meta.originalContent).toBe('My email is john@example.com and SSN is 123-45-6789');
+        expect(meta.modifiedContent).toBe('My email is [EMAIL] and SSN is [SSN]');
+        expect(meta.violations).toHaveLength(2);
+    });
+    it('outcome=intervened should mark with WARNING level', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('RunnableSequence'), { input: 'test' }, chainRunId);
+        grHandler.traceGuardrail({
+            name: 'Output Moderation',
+            outcome: 'intervened',
+            actionApplied: true,
+            action: 'GUARDRAIL_INTERVENED',
+            reason: 'intervened_passthrough',
+            source: 'OUTPUT',
+            input: 'Original response text',
+            modifiedContent: 'Modified response text',
+        });
+        const spanUpdates = grClient.getByType('span-update');
+        const guardrailUpdate = spanUpdates[spanUpdates.length - 1];
+        expect(guardrailUpdate.body.level).toBe('WARNING');
+        expect(guardrailUpdate.body.statusMessage).toBe('INTERVENED: intervened_passthrough');
+    });
+    it('traceGuardrail() should return null when no trace exists', () => {
+        const freshClient = new GuardrailMockClient();
+        const freshHandler = new ObservabilityCallbackHandler({
+            client: freshClient,
+        });
+        const result = freshHandler.traceGuardrail({
+            name: 'Pre-trace Guardrail',
+            outcome: 'passed',
+            actionApplied: false,
+            source: 'INPUT',
+        });
+        expect(result).toBeNull();
+        expect(freshClient.getByType('guardrail-create')).toHaveLength(0);
+    });
+    it('traceGuardrail() should use custom startTime and endTime', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('Chain'), { input: 'test' }, chainRunId);
+        const startTime = '2024-01-01T00:00:00.000Z';
+        const endTime = '2024-01-01T00:00:01.500Z';
+        grHandler.traceGuardrail({
+            name: 'Timed Guardrail',
+            outcome: 'passed',
+            actionApplied: false,
+            source: 'OUTPUT',
+            startTime,
+            endTime,
+        });
+        const guardrailEvents = grClient.getByType('guardrail-create');
+        expect(guardrailEvents[0].body.startTime).toBe(startTime);
+        const spanUpdates = grClient.getByType('span-update');
+        const lastUpdate = spanUpdates[spanUpdates.length - 1];
+        expect(lastUpdate.body.endTime).toBe(endTime);
+    });
+    it('should trace both input and output guardrails on the same trace', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('RunnableSequence'), { input: 'test' }, chainRunId);
+        const inputId = grHandler.traceGuardrail({
+            name: 'Input Moderation',
+            outcome: 'passed',
+            actionApplied: false,
+            source: 'INPUT',
+            input: 'What is 2+2?',
+        });
+        const outputId = grHandler.traceGuardrail({
+            name: 'Output Moderation',
+            outcome: 'passed',
+            actionApplied: false,
+            source: 'OUTPUT',
+            input: 'The answer is 4.',
+        });
+        expect(inputId).not.toBeNull();
+        expect(outputId).not.toBeNull();
+        expect(inputId).not.toBe(outputId);
+        const guardrailEvents = grClient.getByType('guardrail-create');
+        expect(guardrailEvents).toHaveLength(2);
+        const traceId = guardrailEvents[0].body.traceId;
+        expect(guardrailEvents[1].body.traceId).toBe(traceId);
+        expect(guardrailEvents[0].body.metadata.source).toBe('INPUT');
+        expect(guardrailEvents[1].body.metadata.source).toBe('OUTPUT');
+    });
+    it('should include full AWS Bedrock assessments and violations in metadata', async () => {
+        const chainRunId = makeUUID();
+        await grHandler.handleChainStart(grSerialized('Chain'), { input: 'test' }, chainRunId);
+        grHandler.traceGuardrail({
+            name: 'Detailed Guardrail',
+            outcome: 'blocked',
+            actionApplied: true,
+            action: 'GUARDRAIL_INTERVENED',
+            reason: 'policy_violation',
+            source: 'INPUT',
+            violations: [
+                { type: 'CONTENT_POLICY', category: 'VIOLENCE', confidence: 'HIGH', action: 'BLOCKED' },
+                { type: 'PII_POLICY', category: 'SSN', action: 'BLOCKED' },
+            ],
+            assessments: [
+                {
+                    contentPolicy: { filters: [{ type: 'VIOLENCE', confidence: 'HIGH', action: 'BLOCKED' }] },
+                    sensitiveInformationPolicy: { piiEntities: [{ type: 'SSN', action: 'BLOCKED' }] },
+                },
+            ],
+        });
+        const spanUpdates = grClient.getByType('span-update');
+        const lastUpdate = spanUpdates[spanUpdates.length - 1];
+        const meta = lastUpdate.body.metadata;
+        expect(meta.violations).toHaveLength(2);
+        expect(meta.assessments).toHaveLength(1);
+        expect(meta.violations[0]).toEqual({
+            type: 'CONTENT_POLICY', category: 'VIOLENCE', confidence: 'HIGH', action: 'BLOCKED',
+        });
+    });
+});
+// ---------------------------------------------------------------------------
+// 18. Guardrail tracing with debug logging — full pipeline with all 4 outcomes
+// ---------------------------------------------------------------------------
+describe('Guardrail tracing with debug output', () => {
+    it('should produce debug-friendly trace output for manual verification', async () => {
+        const debugClient = new GuardrailMockClient();
+        const debugHandler = new ObservabilityCallbackHandler({
+            client: debugClient,
+            traceName: 'guardrail-debug-test',
+            userId: 'user-123',
+            sessionId: 'session-456',
+            debug: true,
+        });
+        // 1. Chain starts (creates trace)
+        const chainRunId = makeUUID();
+        await debugHandler.handleChainStart(grSerialized('RunnableSequence'), { messages: [{ role: 'user', content: 'Explain quantum computing' }] }, chainRunId);
+        // 2. LLM call
+        const llmRunId = makeUUID();
+        await debugHandler.handleLLMStart(grSerialized('ChatOpenAI'), ['Explain quantum computing'], llmRunId, chainRunId);
+        const llmResult = {
+            generations: [[{ text: 'Quantum computing uses qubits...', generationInfo: {} }]],
+            llmOutput: {
+                tokenUsage: { promptTokens: 10, completionTokens: 25, totalTokens: 35 },
+                modelName: 'gpt-4o',
+            },
+        };
+        await debugHandler.handleLLMEnd(llmResult, llmRunId);
+        await debugHandler.handleChainEnd({ output: 'Quantum computing uses qubits...' }, chainRunId);
+        // 3. Input guardrail — passed
+        const inputGuardrailId = debugHandler.traceGuardrail({
+            name: 'Input Moderation (Bedrock)',
+            guardrailId: 'arn:aws:bedrock:us-east-1:123456:guardrail/abc123',
+            guardrailVersion: '3',
+            outcome: 'passed',
+            actionApplied: false,
+            action: 'NONE',
+            reason: 'passed',
+            source: 'INPUT',
+            input: 'Explain quantum computing',
+            startTime: '2024-06-15T10:00:00.000Z',
+            endTime: '2024-06-15T10:00:00.150Z',
+        });
+        // 4. Output guardrail — passed
+        const outputGuardrailId = debugHandler.traceGuardrail({
+            name: 'Output Moderation (Bedrock)',
+            guardrailId: 'arn:aws:bedrock:us-east-1:123456:guardrail/abc123',
+            guardrailVersion: '3',
+            outcome: 'passed',
+            actionApplied: false,
+            action: 'NONE',
+            reason: 'passed',
+            source: 'OUTPUT',
+            input: 'Quantum computing uses qubits...',
+            violations: [],
+            assessments: [{ topicPolicy: { topics: [] }, contentPolicy: { filters: [] } }],
+            startTime: '2024-06-15T10:00:01.000Z',
+            endTime: '2024-06-15T10:00:01.200Z',
+        });
+        expect(inputGuardrailId).not.toBeNull();
+        expect(outputGuardrailId).not.toBeNull();
+        console.log('\n=== SAMPLE GUARDRAIL TRACE OUTPUT ===');
+        debugClient.printEvents();
+        console.log('=== END TRACE ===\n');
+        // Verify complete event sequence
+        const types = debugClient.getEventTypes();
+        expect(types).toEqual([
+            'trace-create',
+            'chain-create',
+            'generation-create',
+            'generation-update',
+            'span-update', // chain end
+            'guardrail-create', // input guardrail
+            'span-update', // input guardrail update
+            'guardrail-create', // output guardrail
+            'span-update', // output guardrail update
+        ]);
+        // Verify trace ID consistency
+        const traceId = debugClient.getByType('trace-create')[0].body.id;
+        for (const evt of debugClient.events) {
+            const body = evt.body;
+            if (evt.type !== 'trace-create') {
+                expect(body.traceId).toBe(traceId);
+            }
+        }
+    });
+    it('should trace all 4 guardrail outcomes with correct levels', async () => {
+        const debugClient = new GuardrailMockClient();
+        const handler = new ObservabilityCallbackHandler({
+            client: debugClient,
+            debug: true,
+        });
+        // Create trace
+        const chainRunId = makeUUID();
+        await handler.handleChainStart(grSerialized('Chain'), { input: 'test' }, chainRunId);
+        // All 4 outcomes
+        handler.traceGuardrail({ name: 'Passed', outcome: 'passed', actionApplied: false, source: 'INPUT' });
+        handler.traceGuardrail({ name: 'Blocked', outcome: 'blocked', actionApplied: true, reason: 'policy_violation', source: 'INPUT' });
+        handler.traceGuardrail({ name: 'Anonymized', outcome: 'anonymized', actionApplied: true, reason: 'anonymized', source: 'OUTPUT', modifiedContent: '[EMAIL]' });
+        handler.traceGuardrail({ name: 'Intervened', outcome: 'intervened', actionApplied: true, reason: 'intervened_passthrough', source: 'OUTPUT' });
+        console.log('\n=== ALL 4 GUARDRAIL OUTCOMES ===');
+        debugClient.printEvents();
+        console.log('=== END ===\n');
+        const guardrailEvents = debugClient.getByType('guardrail-create');
+        expect(guardrailEvents).toHaveLength(4);
+        const spanUpdates = debugClient.getByType('span-update');
+        // 4 guardrail updates (chain not ended in this test)
+        expect(spanUpdates).toHaveLength(4);
+        // Check levels: passed=DEFAULT, blocked=ERROR, anonymized=WARNING, intervened=WARNING
+        const guardrailUpdates = spanUpdates;
+        expect(guardrailUpdates[0].body.level).toBe('DEFAULT');
+        expect(guardrailUpdates[1].body.level).toBe('ERROR');
+        expect(guardrailUpdates[2].body.level).toBe('WARNING');
+        expect(guardrailUpdates[3].body.level).toBe('WARNING');
+    });
+});
+//# sourceMappingURL=observability.integration.test.js.map