npm - @juspay/neurolink - Versions diffs - 9.54.6 → 9.54.7 - Mend

@juspay/neurolink 9.54.6 → 9.54.7

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (408) hide show

package/CHANGELOG.md +2 -0
package/dist/action/actionInputs.d.ts +1 -1
package/dist/adapters/video/directorPipeline.js +6 -0
package/dist/adapters/video/vertexVideoHandler.js +6 -0
package/dist/agent/directTools.d.ts +3 -23
package/dist/auth/AuthProviderFactory.d.ts +1 -3
package/dist/auth/anthropicOAuth.d.ts +4 -7
package/dist/auth/anthropicOAuth.js +23 -0
package/dist/auth/errors.d.ts +1 -1
package/dist/auth/index.d.ts +11 -0
package/dist/auth/index.js +14 -0
package/dist/auth/middleware/AuthMiddleware.d.ts +5 -60
package/dist/auth/middleware/AuthMiddleware.js +3 -0
package/dist/auth/middleware/rateLimitByUser.d.ts +4 -93
package/dist/auth/middleware/rateLimitByUser.js +4 -0
package/dist/auth/providers/BaseAuthProvider.d.ts +1 -1
package/dist/auth/providers/CognitoProvider.js +3 -0
package/dist/auth/providers/KeycloakProvider.js +3 -0
package/dist/auth/providers/auth0.d.ts +1 -1
package/dist/auth/sessionManager.d.ts +2 -0
package/dist/auth/sessionManager.js +53 -11
package/dist/auth/tokenStore.d.ts +2 -0
package/dist/auth/tokenStore.js +45 -4
package/dist/autoresearch/tools.d.ts +1 -16
package/dist/browser/neurolink.min.js +353 -353
package/dist/cli/commands/config.d.ts +3 -123
package/dist/cli/commands/config.js +4 -2
package/dist/cli/commands/evaluate.d.ts +1 -19
package/dist/cli/commands/proxy.d.ts +1 -1
package/dist/cli/commands/proxy.js +3 -0
package/dist/cli/commands/rag.js +3 -0
package/dist/cli/commands/setup-anthropic.d.ts +2 -6
package/dist/cli/commands/setup-anthropic.js +1 -1
package/dist/cli/commands/setup-azure.d.ts +2 -6
package/dist/cli/commands/setup-azure.js +1 -1
package/dist/cli/commands/setup-bedrock.d.ts +2 -6
package/dist/cli/commands/setup-bedrock.js +1 -1
package/dist/cli/commands/setup-gcp.d.ts +2 -6
package/dist/cli/commands/setup-google-ai.d.ts +2 -6
package/dist/cli/commands/setup-google-ai.js +1 -1
package/dist/cli/commands/setup-huggingface.d.ts +1 -5
package/dist/cli/commands/setup-mistral.d.ts +1 -5
package/dist/cli/commands/setup-openai.d.ts +2 -6
package/dist/cli/commands/setup-openai.js +1 -1
package/dist/cli/commands/setup.d.ts +1 -8
package/dist/cli/commands/task.js +1 -0
package/dist/cli/commands/voiceServer.d.ts +1 -4
package/dist/cli/loop/session.js +31 -10
package/dist/cli/utils/interactiveSetup.d.ts +2 -15
package/dist/cli/utils/videoFileUtils.d.ts +1 -15
package/dist/client/aiSdkAdapter.d.ts +1 -1
package/dist/client/aiSdkAdapter.js +1 -0
package/dist/client/httpClient.d.ts +1 -0
package/dist/client/httpClient.js +13 -0
package/dist/client/sseClient.d.ts +1 -0
package/dist/client/sseClient.js +29 -0
package/dist/client/streamingClient.d.ts +2 -0
package/dist/client/streamingClient.js +19 -0
package/dist/client/wsClient.d.ts +6 -0
package/dist/client/wsClient.js +90 -10
package/dist/context/budgetChecker.js +3 -1
package/dist/context/contextCompactor.js +163 -143
package/dist/context/fileSummarizationService.d.ts +1 -9
package/dist/context/summarizationEngine.js +29 -16
package/dist/core/baseProvider.js +124 -153
package/dist/core/infrastructure/baseRegistry.d.ts +1 -7
package/dist/core/modules/GenerationHandler.d.ts +3 -2
package/dist/core/modules/GenerationHandler.js +9 -1
package/dist/core/modules/StreamHandler.js +9 -0
package/dist/core/modules/ToolsManager.js +18 -2
package/dist/evaluation/BatchEvaluator.d.ts +1 -97
package/dist/evaluation/EvaluationAggregator.d.ts +1 -118
package/dist/evaluation/EvaluatorFactory.d.ts +1 -13
package/dist/evaluation/EvaluatorRegistry.d.ts +1 -50
package/dist/evaluation/errors/EvaluationError.d.ts +2 -27
package/dist/evaluation/hooks/langfuseAdapter.d.ts +1 -39
package/dist/evaluation/hooks/observabilityHooks.d.ts +3 -55
package/dist/evaluation/hooks/observabilityHooks.js +3 -0
package/dist/evaluation/pipeline/strategies/batchStrategy.d.ts +7 -61
package/dist/evaluation/pipeline/strategies/batchStrategy.js +7 -7
package/dist/evaluation/ragasEvaluator.js +54 -37
package/dist/evaluation/reporting/metricsCollector.d.ts +1 -60
package/dist/evaluation/reporting/reportGenerator.d.ts +1 -17
package/dist/evaluation/scorers/rule/contentSimilarityScorer.d.ts +1 -29
package/dist/evaluation/scorers/rule/formatScorer.d.ts +1 -42
package/dist/evaluation/scorers/rule/keywordCoverageScorer.d.ts +1 -19
package/dist/evaluation/scorers/rule/lengthScorer.d.ts +1 -33
package/dist/factories/providerFactory.d.ts +1 -16
package/dist/factories/providerFactory.js +2 -0
package/dist/image-gen/ImageGenService.d.ts +3 -0
package/dist/image-gen/ImageGenService.js +3 -0
package/dist/lib/action/actionInputs.d.ts +1 -1
package/dist/lib/adapters/video/directorPipeline.js +6 -0
package/dist/lib/adapters/video/vertexVideoHandler.js +6 -0
package/dist/lib/agent/directTools.d.ts +3 -23
package/dist/lib/auth/AuthProviderFactory.d.ts +1 -3
package/dist/lib/auth/anthropicOAuth.d.ts +4 -7
package/dist/lib/auth/anthropicOAuth.js +23 -0
package/dist/lib/auth/errors.d.ts +1 -1
package/dist/lib/auth/index.d.ts +11 -0
package/dist/lib/auth/index.js +14 -0
package/dist/lib/auth/middleware/AuthMiddleware.d.ts +5 -60
package/dist/lib/auth/middleware/AuthMiddleware.js +3 -0
package/dist/lib/auth/middleware/rateLimitByUser.d.ts +4 -93
package/dist/lib/auth/middleware/rateLimitByUser.js +4 -0
package/dist/lib/auth/providers/BaseAuthProvider.d.ts +1 -1
package/dist/lib/auth/providers/CognitoProvider.js +3 -0
package/dist/lib/auth/providers/KeycloakProvider.js +3 -0
package/dist/lib/auth/providers/auth0.d.ts +1 -1
package/dist/lib/auth/sessionManager.d.ts +2 -0
package/dist/lib/auth/sessionManager.js +53 -11
package/dist/lib/auth/tokenStore.d.ts +2 -0
package/dist/lib/auth/tokenStore.js +45 -4
package/dist/lib/autoresearch/tools.d.ts +1 -16
package/dist/lib/client/aiSdkAdapter.d.ts +1 -1
package/dist/lib/client/aiSdkAdapter.js +1 -0
package/dist/lib/client/httpClient.d.ts +1 -0
package/dist/lib/client/httpClient.js +13 -0
package/dist/lib/client/sseClient.d.ts +1 -0
package/dist/lib/client/sseClient.js +29 -0
package/dist/lib/client/streamingClient.d.ts +2 -0
package/dist/lib/client/streamingClient.js +19 -0
package/dist/lib/client/wsClient.d.ts +6 -0
package/dist/lib/client/wsClient.js +90 -10
package/dist/lib/context/budgetChecker.js +3 -1
package/dist/lib/context/contextCompactor.js +163 -143
package/dist/lib/context/fileSummarizationService.d.ts +1 -9
package/dist/lib/context/summarizationEngine.js +29 -16
package/dist/lib/core/baseProvider.js +124 -153
package/dist/lib/core/infrastructure/baseRegistry.d.ts +1 -7
package/dist/lib/core/modules/GenerationHandler.d.ts +3 -2
package/dist/lib/core/modules/GenerationHandler.js +9 -1
package/dist/lib/core/modules/StreamHandler.js +9 -0
package/dist/lib/core/modules/ToolsManager.js +18 -2
package/dist/lib/evaluation/BatchEvaluator.d.ts +1 -97
package/dist/lib/evaluation/EvaluationAggregator.d.ts +1 -118
package/dist/lib/evaluation/EvaluatorFactory.d.ts +1 -13
package/dist/lib/evaluation/EvaluatorRegistry.d.ts +1 -50
package/dist/lib/evaluation/errors/EvaluationError.d.ts +2 -27
package/dist/lib/evaluation/hooks/langfuseAdapter.d.ts +1 -39
package/dist/lib/evaluation/hooks/observabilityHooks.d.ts +3 -55
package/dist/lib/evaluation/hooks/observabilityHooks.js +3 -0
package/dist/lib/evaluation/pipeline/strategies/batchStrategy.d.ts +7 -61
package/dist/lib/evaluation/pipeline/strategies/batchStrategy.js +7 -7
package/dist/lib/evaluation/ragasEvaluator.js +54 -37
package/dist/lib/evaluation/reporting/metricsCollector.d.ts +1 -60
package/dist/lib/evaluation/reporting/reportGenerator.d.ts +1 -17
package/dist/lib/evaluation/scorers/rule/contentSimilarityScorer.d.ts +1 -29
package/dist/lib/evaluation/scorers/rule/formatScorer.d.ts +1 -42
package/dist/lib/evaluation/scorers/rule/keywordCoverageScorer.d.ts +1 -19
package/dist/lib/evaluation/scorers/rule/lengthScorer.d.ts +1 -33
package/dist/lib/factories/providerFactory.d.ts +1 -16
package/dist/lib/factories/providerFactory.js +2 -0
package/dist/lib/image-gen/ImageGenService.d.ts +3 -0
package/dist/lib/image-gen/ImageGenService.js +3 -0
package/dist/lib/mcp/batching/requestBatcher.js +99 -73
package/dist/lib/mcp/httpRateLimiter.js +3 -1
package/dist/lib/mcp/httpRetryHandler.js +3 -1
package/dist/lib/mcp/mcpClientFactory.js +3 -1
package/dist/lib/mcp/multiServerManager.d.ts +1 -14
package/dist/lib/mcp/servers/aiProviders/aiAnalysisTools.js +5 -1
package/dist/lib/mcp/servers/aiProviders/aiWorkflowTools.js +1 -0
package/dist/lib/mcp/toolDiscoveryService.js +70 -57
package/dist/lib/mcp/toolRegistry.js +11 -1
package/dist/lib/memory/memoryRetrievalTools.js +182 -141
package/dist/lib/neurolink.js +236 -40
package/dist/lib/observability/exporterRegistry.d.ts +3 -21
package/dist/lib/observability/exporters/sentryExporter.js +1 -0
package/dist/lib/observability/metricsAggregator.d.ts +1 -31
package/dist/lib/observability/tokenTracker.d.ts +7 -16
package/dist/lib/observability/tokenTracker.js +6 -4
package/dist/lib/observability/utils/spanSerializer.d.ts +5 -1
package/dist/lib/observability/utils/spanSerializer.js +24 -4
package/dist/lib/processors/base/BaseFileProcessor.js +66 -53
package/dist/lib/processors/document/ExcelProcessor.d.ts +1 -1
package/dist/lib/processors/errors/errorHelpers.d.ts +1 -31
package/dist/lib/processors/errors/errorSerializer.d.ts +1 -45
package/dist/lib/processors/registry/ProcessorRegistry.js +17 -6
package/dist/lib/providers/amazonBedrock.js +189 -15
package/dist/lib/providers/amazonSagemaker.js +25 -11
package/dist/lib/providers/anthropic.js +13 -0
package/dist/lib/providers/azureOpenai.js +2 -0
package/dist/lib/providers/googleAiStudio.js +82 -0
package/dist/lib/providers/googleVertex.js +52 -0
package/dist/lib/providers/huggingFace.js +2 -0
package/dist/lib/providers/litellm.js +2 -0
package/dist/lib/providers/mistral.js +2 -0
package/dist/lib/providers/ollama.js +84 -5
package/dist/lib/providers/openAI.d.ts +2 -0
package/dist/lib/providers/openAI.js +17 -6
package/dist/lib/providers/openRouter.js +2 -0
package/dist/lib/providers/openaiCompatible.js +2 -0
package/dist/lib/providers/sagemaker/detection.d.ts +1 -33
package/dist/lib/providers/sagemaker/diagnostics.d.ts +1 -25
package/dist/lib/providers/sagemaker/language-model.d.ts +1 -1
package/dist/lib/proxy/proxyConfig.js +4 -0
package/dist/lib/proxy/proxyEnv.d.ts +1 -17
package/dist/lib/proxy/proxyTracer.d.ts +1 -36
package/dist/lib/proxy/proxyTracer.js +9 -0
package/dist/lib/proxy/quietDetector.d.ts +1 -7
package/dist/lib/proxy/rawStreamCapture.d.ts +1 -10
package/dist/lib/proxy/requestLogger.d.ts +1 -21
package/dist/lib/proxy/sseInterceptor.d.ts +1 -66
package/dist/lib/proxy/sseInterceptor.js +6 -0
package/dist/lib/proxy/updateChecker.d.ts +1 -6
package/dist/lib/proxy/updateState.d.ts +1 -12
package/dist/lib/rag/chunkers/BaseChunker.js +36 -22
package/dist/lib/rag/chunking/jsonChunker.d.ts +1 -1
package/dist/lib/rag/errors/RAGError.d.ts +1 -2
package/dist/lib/rag/ragIntegration.js +45 -32
package/dist/lib/rag/reranker/reranker.js +151 -122
package/dist/lib/rag/retrieval/vectorQueryTool.js +79 -65
package/dist/lib/sdk/toolRegistration.d.ts +10 -44
package/dist/lib/sdk/toolRegistration.js +1 -1
package/dist/lib/server/middleware/abortSignal.d.ts +1 -11
package/dist/lib/server/middleware/auth.d.ts +1 -21
package/dist/lib/server/middleware/auth.js +12 -0
package/dist/lib/server/middleware/common.js +48 -32
package/dist/lib/server/middleware/deprecation.d.ts +1 -20
package/dist/lib/server/middleware/rateLimit.d.ts +1 -75
package/dist/lib/server/middleware/validation.d.ts +3 -81
package/dist/lib/server/middleware/validation.js +3 -0
package/dist/lib/server/openapi/generator.d.ts +1 -47
package/dist/lib/server/routes/agentRoutes.js +112 -57
package/dist/lib/server/routes/claudeProxyRoutes.d.ts +1 -6
package/dist/lib/server/routes/claudeProxyRoutes.js +127 -13
package/dist/lib/server/routes/healthRoutes.js +58 -12
package/dist/lib/server/routes/index.d.ts +1 -26
package/dist/lib/server/routes/mcpRoutes.js +40 -7
package/dist/lib/server/routes/memoryRoutes.js +22 -7
package/dist/lib/server/routes/openApiRoutes.js +30 -6
package/dist/lib/server/routes/toolRoutes.js +140 -68
package/dist/lib/server/streaming/dataStream.d.ts +1 -35
package/dist/lib/server/streaming/dataStream.js +15 -0
package/dist/lib/services/server/ai/observability/instrumentation.js +114 -14
package/dist/lib/session/globalSessionState.d.ts +1 -10
package/dist/lib/tasks/tools/taskTools.d.ts +2 -2
package/dist/lib/telemetry/traceContext.d.ts +9 -0
package/dist/lib/telemetry/traceContext.js +19 -0
package/dist/lib/telemetry/tracers.d.ts +2 -0
package/dist/lib/telemetry/tracers.js +2 -0
package/dist/lib/types/action.d.ts +2 -0
package/dist/lib/types/artifact.d.ts +7 -0
package/dist/lib/types/auth.d.ts +125 -18
package/dist/lib/types/autoresearch.d.ts +12 -0
package/dist/lib/types/cli.d.ts +415 -0
package/dist/lib/types/client.d.ts +34 -0
package/dist/lib/types/common.d.ts +12 -41
package/dist/lib/types/context.d.ts +5 -0
package/dist/lib/types/evaluation.d.ts +332 -1
package/dist/lib/types/file.d.ts +4 -0
package/dist/lib/types/mcp.d.ts +102 -2
package/dist/lib/types/middleware.d.ts +116 -0
package/dist/lib/types/multimodal.d.ts +65 -0
package/dist/lib/types/observability.d.ts +81 -0
package/dist/lib/types/processor.d.ts +47 -0
package/dist/lib/types/providers.d.ts +120 -16
package/dist/lib/types/proxy.d.ts +321 -1
package/dist/lib/types/rag.d.ts +22 -0
package/dist/lib/types/scorer.d.ts +141 -0
package/dist/lib/types/server.d.ts +99 -0
package/dist/lib/types/span.d.ts +2 -1
package/dist/lib/types/span.js +1 -0
package/dist/lib/types/tools.d.ts +44 -0
package/dist/lib/types/tts.d.ts +6 -0
package/dist/lib/types/utilities.d.ts +22 -0
package/dist/lib/types/workflow.d.ts +18 -0
package/dist/lib/utils/async/retry.d.ts +2 -8
package/dist/lib/utils/async/retry.js +9 -9
package/dist/lib/utils/imageCompressor.d.ts +1 -21
package/dist/lib/utils/imageCompressor.js +5 -1
package/dist/lib/utils/messageBuilder.d.ts +1 -1
package/dist/lib/utils/redis.d.ts +1 -4
package/dist/lib/utils/toolEndEmitter.d.ts +25 -0
package/dist/lib/utils/toolEndEmitter.js +65 -0
package/dist/lib/workflow/config.d.ts +7 -32
package/dist/lib/workflow/core/ensembleExecutor.js +28 -0
package/dist/lib/workflow/core/judgeScorer.js +23 -0
package/dist/lib/workflow/core/responseConditioner.js +17 -0
package/dist/lib/workflow/core/workflowRunner.d.ts +1 -19
package/dist/lib/workflow/core/workflowRunner.js +202 -147
package/dist/mcp/batching/requestBatcher.js +99 -73
package/dist/mcp/httpRateLimiter.js +3 -1
package/dist/mcp/httpRetryHandler.js +3 -1
package/dist/mcp/mcpClientFactory.js +3 -1
package/dist/mcp/multiServerManager.d.ts +1 -14
package/dist/mcp/servers/aiProviders/aiAnalysisTools.js +5 -1
package/dist/mcp/servers/aiProviders/aiWorkflowTools.js +1 -0
package/dist/mcp/toolDiscoveryService.js +70 -57
package/dist/mcp/toolRegistry.js +11 -1
package/dist/memory/memoryRetrievalTools.js +182 -141
package/dist/neurolink.js +236 -40
package/dist/observability/exporterRegistry.d.ts +3 -21
package/dist/observability/exporters/sentryExporter.js +1 -0
package/dist/observability/metricsAggregator.d.ts +1 -31
package/dist/observability/tokenTracker.d.ts +7 -16
package/dist/observability/tokenTracker.js +6 -4
package/dist/observability/utils/spanSerializer.d.ts +5 -1
package/dist/observability/utils/spanSerializer.js +24 -4
package/dist/processors/base/BaseFileProcessor.js +66 -53
package/dist/processors/document/ExcelProcessor.d.ts +1 -1
package/dist/processors/errors/errorHelpers.d.ts +1 -31
package/dist/processors/errors/errorSerializer.d.ts +1 -45
package/dist/processors/registry/ProcessorRegistry.js +17 -6
package/dist/providers/amazonBedrock.js +189 -15
package/dist/providers/amazonSagemaker.js +25 -11
package/dist/providers/anthropic.js +13 -0
package/dist/providers/azureOpenai.js +2 -0
package/dist/providers/googleAiStudio.js +82 -0
package/dist/providers/googleVertex.js +52 -0
package/dist/providers/huggingFace.js +2 -0
package/dist/providers/litellm.js +2 -0
package/dist/providers/mistral.js +2 -0
package/dist/providers/ollama.js +84 -5
package/dist/providers/openAI.d.ts +2 -0
package/dist/providers/openAI.js +17 -6
package/dist/providers/openRouter.js +2 -0
package/dist/providers/openaiCompatible.js +2 -0
package/dist/providers/sagemaker/detection.d.ts +1 -33
package/dist/providers/sagemaker/diagnostics.d.ts +1 -25
package/dist/providers/sagemaker/language-model.d.ts +1 -1
package/dist/proxy/proxyConfig.js +4 -0
package/dist/proxy/proxyEnv.d.ts +1 -17
package/dist/proxy/proxyTracer.d.ts +1 -36
package/dist/proxy/proxyTracer.js +9 -0
package/dist/proxy/quietDetector.d.ts +1 -7
package/dist/proxy/rawStreamCapture.d.ts +1 -10
package/dist/proxy/requestLogger.d.ts +1 -21
package/dist/proxy/sseInterceptor.d.ts +1 -66
package/dist/proxy/sseInterceptor.js +6 -0
package/dist/proxy/updateChecker.d.ts +1 -6
package/dist/proxy/updateState.d.ts +1 -12
package/dist/rag/chunkers/BaseChunker.js +36 -22
package/dist/rag/chunking/jsonChunker.d.ts +1 -1
package/dist/rag/errors/RAGError.d.ts +1 -2
package/dist/rag/ragIntegration.js +45 -32
package/dist/rag/reranker/reranker.js +151 -122
package/dist/rag/retrieval/vectorQueryTool.js +79 -65
package/dist/sdk/toolRegistration.d.ts +10 -44
package/dist/sdk/toolRegistration.js +1 -1
package/dist/server/middleware/abortSignal.d.ts +1 -11
package/dist/server/middleware/auth.d.ts +1 -21
package/dist/server/middleware/auth.js +12 -0
package/dist/server/middleware/common.js +48 -32
package/dist/server/middleware/deprecation.d.ts +1 -20
package/dist/server/middleware/rateLimit.d.ts +1 -75
package/dist/server/middleware/validation.d.ts +3 -81
package/dist/server/middleware/validation.js +3 -0
package/dist/server/openapi/generator.d.ts +1 -47
package/dist/server/routes/agentRoutes.js +112 -57
package/dist/server/routes/claudeProxyRoutes.d.ts +1 -6
package/dist/server/routes/claudeProxyRoutes.js +127 -13
package/dist/server/routes/healthRoutes.js +58 -12
package/dist/server/routes/index.d.ts +1 -26
package/dist/server/routes/mcpRoutes.js +40 -7
package/dist/server/routes/memoryRoutes.js +22 -7
package/dist/server/routes/openApiRoutes.js +30 -6
package/dist/server/routes/toolRoutes.js +140 -68
package/dist/server/streaming/dataStream.d.ts +1 -35
package/dist/server/streaming/dataStream.js +15 -0
package/dist/services/server/ai/observability/instrumentation.js +114 -14
package/dist/session/globalSessionState.d.ts +1 -10
package/dist/tasks/tools/taskTools.d.ts +2 -2
package/dist/telemetry/traceContext.d.ts +9 -0
package/dist/telemetry/traceContext.js +18 -0
package/dist/telemetry/tracers.d.ts +2 -0
package/dist/telemetry/tracers.js +2 -0
package/dist/types/action.d.ts +2 -0
package/dist/types/artifact.d.ts +7 -0
package/dist/types/auth.d.ts +125 -18
package/dist/types/autoresearch.d.ts +12 -0
package/dist/types/cli.d.ts +415 -0
package/dist/types/client.d.ts +34 -0
package/dist/types/common.d.ts +12 -41
package/dist/types/context.d.ts +5 -0
package/dist/types/evaluation.d.ts +332 -1
package/dist/types/file.d.ts +4 -0
package/dist/types/mcp.d.ts +102 -2
package/dist/types/middleware.d.ts +116 -0
package/dist/types/multimodal.d.ts +65 -0
package/dist/types/observability.d.ts +81 -0
package/dist/types/processor.d.ts +47 -0
package/dist/types/providers.d.ts +120 -16
package/dist/types/proxy.d.ts +321 -1
package/dist/types/rag.d.ts +22 -0
package/dist/types/scorer.d.ts +141 -0
package/dist/types/server.d.ts +99 -0
package/dist/types/span.d.ts +2 -1
package/dist/types/span.js +1 -0
package/dist/types/tools.d.ts +44 -0
package/dist/types/tts.d.ts +6 -0
package/dist/types/utilities.d.ts +22 -0
package/dist/types/workflow.d.ts +18 -0
package/dist/utils/async/retry.d.ts +2 -8
package/dist/utils/async/retry.js +9 -9
package/dist/utils/imageCompressor.d.ts +1 -21
package/dist/utils/imageCompressor.js +5 -1
package/dist/utils/messageBuilder.d.ts +1 -1
package/dist/utils/redis.d.ts +1 -4
package/dist/utils/toolEndEmitter.d.ts +25 -0
package/dist/utils/toolEndEmitter.js +64 -0
package/dist/workflow/config.d.ts +4 -29
package/dist/workflow/core/ensembleExecutor.js +28 -0
package/dist/workflow/core/judgeScorer.js +23 -0
package/dist/workflow/core/responseConditioner.js +17 -0
package/dist/workflow/core/workflowRunner.d.ts +1 -19
package/dist/workflow/core/workflowRunner.js +202 -147
package/package.json +2 -1

package/dist/lib/server/middleware/validation.d.ts CHANGED Viewed

@@ -2,69 +2,7 @@
  * Request Validation Middleware
  * Provides schema-based request validation for server adapters
  */
-import type { MiddlewareDefinition, ServerContext } from "../../types/index.js";
-import { ValidationError as ServerValidationError } from "../errors.js";
-/**
- * Validation configuration
- */
-type ValidationConfig = {
-    /** Schema for validating request body */
-    bodySchema?: ValidationSchema;
-    /** Schema for validating query parameters */
-    querySchema?: ValidationSchema;
-    /** Schema for validating path parameters */
-    paramsSchema?: ValidationSchema;
-    /** Schema for validating headers */
-    headersSchema?: ValidationSchema;
-    /**
-     * Custom validation function
-     * Throw ValidationError for invalid requests
-     */
-    customValidator?: (ctx: ServerContext) => Promise<void>;
-    /** Skip validation for certain paths */
-    skipPaths?: string[];
-    /** Custom error formatter */
-    errorFormatter?: (errors: ServerValidationError[]) => unknown;
-};
-/**
- * Simple validation schema
- * Can be extended with JSON Schema or Zod integration
- */
-type ValidationSchema = {
-    /** Required fields */
-    required?: string[];
-    /** Field type definitions */
-    properties?: Record<string, PropertySchema>;
-    /** Allow additional properties */
-    additionalProperties?: boolean;
-};
-/**
- * Property schema definition
- */
-type PropertySchema = {
-    /** Property type */
-    type: "string" | "number" | "boolean" | "object" | "array";
-    /** Minimum value (for numbers) or length (for strings/arrays) */
-    minimum?: number;
-    /** Maximum value (for numbers) or length (for strings/arrays) */
-    maximum?: number;
-    /** Minimum length for strings (alias for minimum) */
-    minLength?: number;
-    /** Maximum length for strings (alias for maximum) */
-    maxLength?: number;
-    /** Minimum items for arrays */
-    minItems?: number;
-    /** Maximum items for arrays */
-    maxItems?: number;
-    /** Pattern for string validation (regex) */
-    pattern?: string;
-    /** Enum of allowed values */
-    enum?: unknown[];
-    /** Default value */
-    default?: unknown;
-    /** Custom validation function */
-    validate?: (value: unknown) => boolean | string;
-};
+import type { ExtendedValidationSchema, MiddlewareDefinition, MiddlewareRequestSchema, PropertySchema, ValidationConfig } from "../../types/index.js";
 /**
  * Re-export ValidationError from errors for convenience
  */
@@ -105,7 +43,7 @@ export declare function createFieldValidator(fieldName: string, rules: PropertyS
  * });
  * ```
  */
-export declare function createBodyValidationMiddleware(schema: ValidationSchema): MiddlewareDefinition;
+export declare function createBodyValidationMiddleware(schema: MiddlewareRequestSchema): MiddlewareDefinition;
 /**
  * Create query-only validation middleware
  *
@@ -119,28 +57,12 @@ export declare function createBodyValidationMiddleware(schema: ValidationSchema)
  * });
  * ```
  */
-export declare function createQueryValidationMiddleware(schema: ValidationSchema): MiddlewareDefinition;
+export declare function createQueryValidationMiddleware(schema: MiddlewareRequestSchema): MiddlewareDefinition;
 /**
  * Create a combined validation middleware with full config support
  * Alias for createRequestValidationMiddleware for compatibility
  */
 export declare const createValidationMiddleware: typeof createRequestValidationMiddleware;
-/**
- * Extended property schema for common schemas
- */
-type ExtendedPropertySchema = PropertySchema & {
-    format?: string;
-};
-/**
- * Extended validation schema for common schemas
- */
-type ExtendedValidationSchema = {
-    type?: string;
-    format?: string;
-    required?: string[];
-    properties?: Record<string, ExtendedPropertySchema>;
-    additionalProperties?: boolean;
-};
 /**
  * Common validation schemas for reuse
  */

package/dist/lib/server/middleware/validation.js CHANGED Viewed

@@ -287,6 +287,9 @@ export function createQueryValidationMiddleware(schema) {
  * Alias for createRequestValidationMiddleware for compatibility
  */
 export const createValidationMiddleware = createRequestValidationMiddleware;
+// ============================================
+// Common Schemas
+// ============================================
 /**
  * Common validation schemas for reuse
  */

package/dist/lib/server/openapi/generator.d.ts CHANGED Viewed

@@ -2,52 +2,7 @@
  * OpenAPI 3.1 Specification Generator
  * Generates OpenAPI documentation from NeuroLink server routes
  */
-import type { JsonObject, RouteDefinition, ServerAdapterConfig } from "../../types/index.js";
-/**
- * OpenAPI generator configuration
- */
-type OpenAPIGeneratorConfig = {
-    /** API info override */
-    info?: {
-        title?: string;
-        version?: string;
-        description?: string;
-    };
-    /** Server configuration */
-    servers?: Array<{
-        url: string;
-        description?: string;
-    }>;
-    /** Include security schemes */
-    includeSecurity?: boolean;
-    /** Base path for all routes */
-    basePath?: string;
-    /** Additional tags */
-    additionalTags?: Array<{
-        name: string;
-        description: string;
-    }>;
-    /** Custom schemas to add */
-    customSchemas?: Record<string, JsonObject>;
-    /** Routes to document in the OpenAPI spec */
-    routes?: RouteDefinition[];
-};
-/**
- * Generated OpenAPI specification
- */
-type OpenAPISpec = {
-    openapi: "3.1.0";
-    info: JsonObject;
-    servers: JsonObject[];
-    tags: JsonObject[];
-    paths: Record<string, JsonObject>;
-    components: {
-        schemas: Record<string, JsonObject>;
-        securitySchemes?: Record<string, JsonObject>;
-        parameters?: Record<string, JsonObject>;
-    };
-    security?: JsonObject[];
-};
+import type { OpenAPIGeneratorConfig, OpenAPISpec, RouteDefinition, ServerAdapterConfig } from "../../types/index.js";
 /**
  * OpenAPI specification generator
  * Generates OpenAPI 3.1 compliant documentation from route definitions
@@ -104,4 +59,3 @@ export declare function generateOpenAPISpec(routes: RouteDefinition[], config?:
  * Generate OpenAPI spec from server adapter configuration
  */
 export declare function generateOpenAPIFromConfig(serverConfig: ServerAdapterConfig, routes?: RouteDefinition[]): OpenAPISpec;
-export {};

package/dist/lib/server/routes/agentRoutes.js CHANGED Viewed

@@ -2,7 +2,10 @@
  * Agent Routes
  * Endpoints for agent execution and streaming
  */
+import { SpanStatusCode } from "@opentelemetry/api";
 import { ProviderFactory } from "../../factories/providerFactory.js";
+import { withSpan } from "../../telemetry/withSpan.js";
+import { tracers } from "../../telemetry/tracers.js";
 import { createStreamRedactor } from "../utils/redaction.js";
 import { AgentExecuteRequestSchema, createErrorResponse as createError, EmbedManyRequestSchema, EmbedRequestSchema, validateRequest, } from "../utils/validation.js";
 /**
@@ -22,43 +25,53 @@ export function createAgentRoutes(basePath = "/api") {
                         return validation.error;
                     }
                     const request = validation.data;
-                    // Normalize input
-                    const input = typeof request.input === "string"
-                        ? { text: request.input }
-                        : request.input;
-                    const result = await ctx.neurolink.generate({
-                        input,
-                        provider: request.provider,
-                        model: request.model,
-                        systemPrompt: request.systemPrompt,
-                        temperature: request.temperature,
-                        maxTokens: request.maxTokens,
-                        // Note: tools should be passed as Record<string, Tool> in generate options
-                        // If request.tools is an array of tool names, we skip them
-                        context: {
-                            // When an authenticated user context exists (set by auth middleware),
-                            // always use its IDs to prevent caller-supplied impersonation.
-                            sessionId: ctx.user
-                                ? ctx.session?.id
-                                : (ctx.session?.id ?? request.sessionId),
-                            userId: ctx.user ? ctx.user.id : request.userId,
-                            userEmail: ctx.user?.email,
-                            userRoles: ctx.user?.roles,
-                            requestId: ctx.requestId,
+                    return withSpan({
+                        name: "neurolink.http.execute",
+                        tracer: tracers.http,
+                        attributes: {
+                            "http.route": "/api/agent/execute",
+                            "ai.provider": request.provider || "default",
+                            "ai.model": request.model || "default",
                         },
-                    });
-                    // Map tool calls from SDK format to API format
-                    const toolCalls = result.toolCalls?.map((tc) => ({
-                        name: tc.toolName,
-                        arguments: tc.args,
-                    }));
-                    return {
-                        content: result.content || "",
-                        provider: result.provider || request.provider || "unknown",
-                        model: result.model || request.model || "unknown",
-                        usage: result.usage,
-                        toolCalls,
-                    };
+                    }, async () => {
+                        // Normalize input
+                        const input = typeof request.input === "string"
+                            ? { text: request.input }
+                            : request.input;
+                        const result = await ctx.neurolink.generate({
+                            input,
+                            provider: request.provider,
+                            model: request.model,
+                            systemPrompt: request.systemPrompt,
+                            temperature: request.temperature,
+                            maxTokens: request.maxTokens,
+                            // Note: tools should be passed as Record<string, Tool> in generate options
+                            // If request.tools is an array of tool names, we skip them
+                            context: {
+                                // When an authenticated user context exists (set by auth middleware),
+                                // always use its IDs to prevent caller-supplied impersonation.
+                                sessionId: ctx.user
+                                    ? ctx.session?.id
+                                    : (ctx.session?.id ?? request.sessionId),
+                                userId: ctx.user ? ctx.user.id : request.userId,
+                                userEmail: ctx.user?.email,
+                                userRoles: ctx.user?.roles,
+                                requestId: ctx.requestId,
+                            },
+                        });
+                        // Map tool calls from SDK format to API format
+                        const toolCalls = result.toolCalls?.map((tc) => ({
+                            name: tc.toolName,
+                            arguments: tc.args,
+                        }));
+                        return {
+                            content: result.content || "",
+                            provider: result.provider || request.provider || "unknown",
+                            model: result.model || request.model || "unknown",
+                            usage: result.usage,
+                            toolCalls,
+                        };
+                    }); // end withSpan
                 },
                 description: "Execute agent with prompt",
                 tags: ["agent"],
@@ -99,11 +112,32 @@ export function createAgentRoutes(basePath = "/api") {
                     });
                     // Create redactor (no-op if redaction is not enabled)
                     const redactor = createStreamRedactor(ctx.redaction);
-                    // Wrap stream to apply redaction to each chunk
+                    // Wrap stream with a span that stays open for the full consumption
+                    // lifetime, not just the generator creation.
                     async function* redactedStream() {
-                        for await (const chunk of result.stream) {
-                            // Apply redaction to chunk (returns unchanged if redaction disabled)
-                            yield redactor(chunk);
+                        const streamSpan = tracers.http.startSpan("neurolink.http.stream", {
+                            attributes: {
+                                "http.route": "/api/agent/stream",
+                                "ai.provider": request.provider || "default",
+                                "ai.model": request.model || "default",
+                            },
+                        });
+                        try {
+                            for await (const chunk of result.stream) {
+                                yield redactor(chunk);
+                            }
+                            streamSpan.setStatus({ code: SpanStatusCode.OK });
+                        }
+                        catch (err) {
+                            streamSpan.recordException(err instanceof Error ? err : new Error(String(err)));
+                            streamSpan.setStatus({
+                                code: SpanStatusCode.ERROR,
+                                message: err instanceof Error ? err.message : String(err),
+                            });
+                            throw err;
+                        }
+                        finally {
+                            streamSpan.end();
                         }
                     }
                     return redactedStream();
@@ -136,14 +170,24 @@ export function createAgentRoutes(basePath = "/api") {
                     const request = validation.data;
                     try {
                         const providerName = request.provider || "openai";
-                        const provider = await ProviderFactory.createProvider(providerName, request.model);
-                        const embedding = await provider.embed(request.text, request.model);
-                        return {
-                            embedding,
-                            provider: providerName,
-                            model: request.model || "default",
-                            dimension: embedding.length,
-                        };
+                        return await withSpan({
+                            name: "neurolink.http.embed",
+                            tracer: tracers.http,
+                            attributes: {
+                                "http.route": "/api/agent/embed",
+                                "ai.provider": providerName,
+                                "ai.model": request.model || "default",
+                            },
+                        }, async () => {
+                            const provider = await ProviderFactory.createProvider(providerName, request.model);
+                            const embedding = await provider.embed(request.text, request.model);
+                            return {
+                                embedding,
+                                provider: providerName,
+                                model: request.model || "default",
+                                dimension: embedding.length,
+                            };
+                        });
                     }
                     catch (error) {
                         return createError("EXECUTION_FAILED", error instanceof Error
@@ -165,15 +209,26 @@ export function createAgentRoutes(basePath = "/api") {
                     const request = validation.data;
                     try {
                         const providerName = request.provider || "openai";
-                        const provider = await ProviderFactory.createProvider(providerName, request.model);
-                        const embeddings = await provider.embedMany(request.texts, request.model);
-                        return {
-                            embeddings,
-                            provider: providerName,
-                            model: request.model || "default",
-                            count: embeddings.length,
-                            dimension: embeddings[0]?.length ?? 0,
-                        };
+                        return await withSpan({
+                            name: "neurolink.http.embedMany",
+                            tracer: tracers.http,
+                            attributes: {
+                                "http.route": "/api/agent/embed-many",
+                                "ai.provider": providerName,
+                                "ai.model": request.model || "default",
+                                "ai.embed.count": request.texts.length,
+                            },
+                        }, async () => {
+                            const provider = await ProviderFactory.createProvider(providerName, request.model);
+                            const embeddings = await provider.embedMany(request.texts, request.model);
+                            return {
+                                embeddings,
+                                provider: providerName,
+                                model: request.model || "default",
+                                count: embeddings.length,
+                                dimension: embeddings[0]?.length ?? 0,
+                            };
+                        });
                     }
                     catch (error) {
                         return createError("EXECUTION_FAILED", error instanceof Error

package/dist/lib/server/routes/claudeProxyRoutes.d.ts CHANGED Viewed

@@ -10,7 +10,7 @@
  * Without a router, models are passed through to the Anthropic provider.
  */
 import type { ModelRouter } from "../../proxy/modelRouter.js";
-import type { ParsedClaudeRequest, RouteGroup } from "../../types/index.js";
+import type { ParsedClaudeError, ParsedClaudeRequest, RouteGroup } from "../../types/index.js";
 /**
  * Create Claude-compatible proxy routes.
  *
@@ -23,10 +23,6 @@ import type { ParsedClaudeRequest, RouteGroup } from "../../types/index.js";
  */
 export declare function createClaudeProxyRoutes(modelRouter?: ModelRouter, basePath?: string, accountStrategy?: "round-robin" | "fill-first", passthroughMode?: boolean): RouteGroup;
 export declare function getTransientSameAccountRetryDelayMs(retryNumber: number): number;
-type ParsedClaudeError = {
-    errorType?: string;
-    message?: string;
-};
 /**
  * Parse a Claude error payload when available.
  */
@@ -46,4 +42,3 @@ export declare function buildProxyFallbackOptions(parsed: ParsedClaudeRequest, o
  * carry transient HTML responses (e.g. 520 pages) inside `error.message`.
  */
 export declare function isTransientHttpFailure(status: number, errBody: string): boolean;
-export {};

package/dist/lib/server/routes/claudeProxyRoutes.js CHANGED Viewed

@@ -15,6 +15,8 @@ import { join } from "node:path";
 import { buildStableClaudeCodeBillingHeader, CLAUDE_CLI_USER_AGENT, CLAUDE_CODE_OAUTH_BETAS, getOrCreateClaudeCodeIdentity, parseClaudeCodeUserId, } from "../../auth/anthropicOAuth.js";
 import { parseQuotaHeaders, saveAccountQuota, } from "../../proxy/accountQuota.js";
 import { buildClaudeError, ClaudeStreamSerializer, generateToolUseId, parseClaudeRequest, serializeClaudeResponse, } from "../../proxy/claudeFormat.js";
+import { tracers } from "../../telemetry/tracers.js";
+import { withSpan } from "../../telemetry/withSpan.js";
 import { ProxyTracer, recordFallbackAttempt } from "../../proxy/proxyTracer.js";
 import { createRawStreamCapture } from "../../proxy/rawStreamCapture.js";
 import { logBodyCapture, logRequest, logRequestAttempt, logStreamError, } from "../../proxy/requestLogger.js";
@@ -51,7 +53,7 @@ const MAX_TRANSIENT_SAME_ACCOUNT_RETRIES = 2;
 const TRANSIENT_SAME_ACCOUNT_RETRY_DELAYS_MS = [250, 1_000];
 /** Maximum upstream 429 attempts per account before rotating to the next account.
  *  Total attempts per account = this + 1 (the initial call plus this many retries). */
-const MAX_RATE_LIMIT_SAME_ACCOUNT_RETRIES = 5;
+const MAX_RATE_LIMIT_SAME_ACCOUNT_RETRIES = 10;
 /** Max time to sleep between 429 retries. Caps large upstream retry-after values
  *  so we don't hold the client connection open for minutes. */
 const MAX_RATE_LIMIT_RETRY_DELAY_MS = 30_000;
@@ -62,6 +64,10 @@ const UPSTREAM_FETCH_TIMEOUT_MS = 15 * 60 * 1000; // 15 minutes
 const accountRuntimeState = new Map();
 /** Track whether we've run the one-time startup prune. */
 let startupPruneDone = false;
+/** Default cooling period when retries are exhausted and upstream didn't
+ *  provide a retry-after header. Short enough to recover quickly, long
+ *  enough to avoid immediately hammering the same account. */
+const DEFAULT_COOLING_PERIOD_MS = 60_000;
 /** Advance the primary account index when the current primary is exhausted
  *  (429 retries exhausted or auth failure). This is what makes fill-first work:
  *  we stick to one account until it's unusable. Only advances when the exhausted
@@ -76,6 +82,33 @@ function advancePrimaryIfCurrent(accountKey, enabledCount, primaryAccountKey) {
     }
     primaryAccountIndex = (primaryAccountIndex + 1) % enabledCount;
 }
+/** If the configured home primary (index 0) is no longer cooling, reset
+ *  primaryAccountIndex back to 0 so traffic returns to the preferred account
+ *  once its rate limit window expires. Called at the start of each request. */
+function maybeResetPrimaryToHome(enabledAccounts) {
+    if (enabledAccounts.length <= 1 || primaryAccountIndex === 0) {
+        return;
+    }
+    const homeState = accountRuntimeState.get(enabledAccounts[0].key);
+    if (!homeState ||
+        !homeState.coolingUntil ||
+        Date.now() >= homeState.coolingUntil) {
+        // Home account is no longer cooling — reset to it
+        primaryAccountIndex = 0;
+        if (homeState?.coolingUntil) {
+            homeState.coolingUntil = undefined;
+            logger.always(`[proxy] home primary account=${enabledAccounts[0].label} cooling expired, resetting primaryAccountIndex to 0`);
+        }
+    }
+}
+/** Check if an account is currently in its cooling window. */
+function isAccountCooling(accountKey) {
+    const state = accountRuntimeState.get(accountKey);
+    return !!state?.coolingUntil && Date.now() < state.coolingUntil;
+}
+// ---------------------------------------------------------------------------
+// OAuth polyfill helpers (extracted to reduce block nesting)
+// ---------------------------------------------------------------------------
 const snapshotCache = new Map();
 const SNAPSHOT_CACHE_TTL_MS = 5 * 60 * 1000; // 5 minutes
 const SNAPSHOT_STABLE_HEADERS = new Set([
@@ -2204,6 +2237,32 @@ async function handleAnthropicAuthRetry(args) {
             }
             const retryStatus = retryResp.status;
             const retryBody = await retryResp.text();
+            // Capture full response headers and body for all auth-retry errors.
+            // Redact sensitive headers and cap body size before persisting.
+            const retryRespHeaders = {};
+            retryResp.headers.forEach((value, key) => {
+                retryRespHeaders[key] = value;
+            });
+            const safeRetryHeaders = { ...retryRespHeaders };
+            delete safeRetryHeaders["authorization"];
+            delete safeRetryHeaders["x-api-key"];
+            const cappedRetryBody = retryBody.length > 4000
+                ? retryBody.slice(0, 4000) + "...[truncated]"
+                : retryBody;
+            tracer?.logUpstreamResponseHeaders(safeRetryHeaders);
+            tracer?.logUpstreamResponseBody(cappedRetryBody);
+            logProxyBody({
+                phase: "upstream_response",
+                headers: safeRetryHeaders,
+                body: cappedRetryBody,
+                bodySize: Buffer.byteLength(retryBody, "utf8"),
+                contentType: retryRespHeaders["content-type"] ?? "application/json",
+                account: account.label,
+                accountType: account.type,
+                attempt: attemptNumber,
+                responseStatus: retryStatus,
+                durationMs: Date.now() - fetchStartMs,
+            });
             authRetryError = `retry ${authRetry + 1}/${MAX_AUTH_RETRIES} failed with status ${retryStatus}`;
             currentLastError = retryBody;
             logger.debug(`[proxy] retry ${authRetry + 1} failed: ${retryStatus} ${retryBody.substring(0, 120)}`);
@@ -2775,7 +2834,7 @@ async function prepareAnthropicAccountAttempt(args) {
     };
 }
 async function fetchAnthropicAccountResponse(args) {
-    const { url, headers, finalBodyStr, account, accountState: _accountState2, enabledAccounts: _enabledAccounts, orderedAccounts: _orderedAccounts, tracer, logAttempt, currentLastError, currentSawRateLimit, currentSawNetworkError, upstreamSpan, } = args;
+    const { url, headers, finalBodyStr, account, accountState: _accountState2, enabledAccounts: _enabledAccounts, orderedAccounts: _orderedAccounts, tracer, logAttempt, logProxyBody, fetchStartMs, attemptNumber, currentLastError, currentSawRateLimit, currentSawNetworkError, upstreamSpan, } = args;
     let lastError = currentLastError;
     let sawRateLimit = currentSawRateLimit;
     let sawNetworkError = currentSawNetworkError;
@@ -2816,8 +2875,35 @@ async function fetchAnthropicAccountResponse(args) {
         sawRateLimit = true;
         const retryAfterMs = parseRetryAfterMs(response.headers.get("retry-after"));
         recordAttemptError(account.label, account.type, 429);
+        // Capture full response headers and body for diagnostics (parity with
+        // handleAnthropicNonOkResponse which does this for all other error statuses).
+        const errRespHeaders = {};
+        response.headers.forEach((value, key) => {
+            errRespHeaders[key] = value;
+        });
         lastError = await response.text();
-        logger.always(`[proxy] ← 429 account=${account.label} retry-after=${retryAfterMs}ms (upstream)`);
+        // Redact sensitive headers and cap body before persisting
+        const safe429Headers = { ...errRespHeaders };
+        delete safe429Headers["authorization"];
+        delete safe429Headers["x-api-key"];
+        const capped429Body = String(lastError).length > 4000
+            ? String(lastError).slice(0, 4000) + "...[truncated]"
+            : String(lastError);
+        tracer?.logUpstreamResponseHeaders(safe429Headers);
+        tracer?.logUpstreamResponseBody(capped429Body);
+        logProxyBody({
+            phase: "upstream_response",
+            headers: safe429Headers,
+            body: capped429Body,
+            bodySize: Buffer.byteLength(String(lastError), "utf8"),
+            contentType: errRespHeaders["content-type"] ?? "application/json",
+            account: account.label,
+            accountType: account.type,
+            attempt: attemptNumber,
+            responseStatus: 429,
+            durationMs: Date.now() - fetchStartMs,
+        });
+        logger.always(`[proxy] ← 429 account=${account.label} retry-after=${retryAfterMs}ms (upstream) ratelimit-status=${errRespHeaders["anthropic-ratelimit-unified-status"] ?? "unknown"}`);
         logAttempt(429, "rate_limit_error", String(lastError));
         tracer?.setError("rate_limit_error", String(lastError).slice(0, 500));
         tracer?.recordRetry(account.label, "rate_limit");
@@ -2866,9 +2952,13 @@ async function handleAnthropicRoutedClaudeRequest(args) {
         attemptNumber: 0,
     };
     const acctSelectionSpan = tracer?.startAccountSelection();
-    // No partition / cooldown gating — every account is always eligible.
-    // Retries are handled inline per-account using upstream retry-after.
-    accountLoop: for (const account of orderedAccounts) {
+    // Try to return to the home primary account if its cooling has expired.
+    maybeResetPrimaryToHome(enabledAccounts);
+    // Skip accounts that are still cooling from a recent 429-exhaustion,
+    // but keep them as last-resort if ALL accounts are cooling.
+    const nonCoolingAccounts = orderedAccounts.filter((a) => !isAccountCooling(a.key));
+    const effectiveAccounts = nonCoolingAccounts.length > 0 ? nonCoolingAccounts : orderedAccounts;
+    accountLoop: for (const account of effectiveAccounts) {
         const accountState = getOrCreateRuntimeState(account.key);
         let transientSameAccountRetries = 0;
         let rateLimitSameAccountRetries = 0;
@@ -2926,6 +3016,9 @@ async function handleAnthropicRoutedClaudeRequest(args) {
                 orderedAccounts,
                 tracer,
                 logAttempt,
+                logProxyBody,
+                fetchStartMs: preparedAttempt.fetchStartMs,
+                attemptNumber: loopState.attemptNumber,
                 currentLastError: loopState.lastError,
                 currentSawRateLimit: loopState.sawRateLimit,
                 currentSawNetworkError: loopState.sawNetworkError,
@@ -2948,8 +3041,11 @@ async function handleAnthropicRoutedClaudeRequest(args) {
                 // Rate-limit retries exhausted for this account — rotate
                 if (fetchResult.retrySameAccount &&
                     fetchResult.retryAfterMs !== undefined) {
+                    // Mark account as cooling so subsequent requests don't hammer it
+                    const coolingMs = Math.min(fetchResult.retryAfterMs || DEFAULT_COOLING_PERIOD_MS, DEFAULT_COOLING_PERIOD_MS);
+                    accountState.coolingUntil = Date.now() + coolingMs;
                     advancePrimaryIfCurrent(account.key, enabledAccounts.length, orderedAccounts[0]?.key);
-                    logger.always(`[proxy] exhausted ${MAX_RATE_LIMIT_SAME_ACCOUNT_RETRIES} rate-limit retries for account=${account.label}; rotating`);
+                    logger.always(`[proxy] exhausted ${MAX_RATE_LIMIT_SAME_ACCOUNT_RETRIES} rate-limit retries for account=${account.label}; cooling for ${coolingMs}ms, rotating`);
                     continue accountLoop;
                 }
                 // Transient error retry (network errors, 529 overloaded)
@@ -3052,6 +3148,10 @@ async function handleAnthropicRoutedClaudeRequest(args) {
                 }
                 break accountLoop;
             }
+            // Clear cooling on success — account is healthy again
+            if (accountState.coolingUntil) {
+                accountState.coolingUntil = undefined;
+            }
             const successResult = await handleAnthropicSuccessfulResponse({
                 ctx,
                 body,
@@ -3232,7 +3332,11 @@ export function createClaudeProxyRoutes(modelRouter, basePath = "", accountStrat
             {
                 method: "GET",
                 path: `${basePath}/v1/models`,
-                handler: async (_ctx) => {
+                handler: async (_ctx) => withSpan({
+                    name: "neurolink.http.claudeProxy.listModels",
+                    tracer: tracers.http,
+                    attributes: { "http.route": `${basePath}/v1/models` },
+                }, async () => {
                     const models = [
                         "claude-sonnet-4-20250514",
                         "claude-sonnet-4-5-20250929",
@@ -3248,7 +3352,7 @@ export function createClaudeProxyRoutes(modelRouter, basePath = "", accountStrat
                             owned_by: "anthropic",
                         })),
                     };
-                },
+                }),
                 description: "List available Claude models",
                 tags: ["claude-proxy", "models"],
             },
@@ -3258,9 +3362,16 @@ export function createClaudeProxyRoutes(modelRouter, basePath = "", accountStrat
             {
                 method: "POST",
                 path: `${basePath}/v1/messages/count_tokens`,
-                handler: async (ctx) => {
+                handler: async (ctx) => withSpan({
+                    name: "neurolink.http.claudeProxy.countTokens",
+                    tracer: tracers.http,
+                    attributes: {
+                        "http.route": `${basePath}/v1/messages/count_tokens`,
+                    },
+                }, async (span) => {
                     const body = ctx.body;
-                    if (!body?.model || !body?.messages) {
+                    if (typeof body?.model !== "string" ||
+                        !Array.isArray(body?.messages)) {
                         return buildClaudeError(400, "Missing required fields: model, messages");
                     }
                     // Simple estimation using character-to-token heuristic
@@ -3269,8 +3380,11 @@ export function createClaudeProxyRoutes(modelRouter, basePath = "", accountStrat
                         ? m.content
                         : JSON.stringify(m.content))
                         .join(" ");
-                    return { input_tokens: Math.ceil(text.length / 4) };
-                },
+                    const inputTokens = Math.ceil(text.length / 4);
+                    span.setAttribute("ai.model", body.model);
+                    span.setAttribute("gen_ai.usage.input_tokens", inputTokens);
+                    return { input_tokens: inputTokens };
+                }),
                 description: "Count tokens for a messages request",
                 tags: ["claude-proxy", "tokens"],
             },