npm - adaptive-memory-multi-model-router - Versions diffs - 2.14.49 → 2.14.52 - Mend

adaptive-memory-multi-model-router 2.14.49 → 2.14.52

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (605) hide show

package/.dockerignore +82 -0
package/.env.example +303 -0
package/.github/DISCUSSIONS_WELCOME.md +27 -0
package/.github/DISCUSSION_TEMPLATE.yml +5 -0
package/.github/FUNDING.yml +2 -0
package/.github/ISSUE_TEMPLATE/bug_report.md +94 -0
package/.github/ISSUE_TEMPLATE/config.yml +17 -0
package/.github/ISSUE_TEMPLATE/feature_request.md +71 -0
package/.github/PULL_REQUEST_TEMPLATE.md +71 -0
package/.github/dependabot.yml +9 -0
package/.github/workflows/ci.yml +263 -0
package/.github/workflows/codeql.yml +38 -0
package/.github/workflows/npm-publish.yml +20 -0
package/.github/workflows/pages.yml +37 -0
package/.github/workflows/stale.yml +54 -0
package/.publish-tick +1 -0
package/.well-known/ai-plugin.json +16 -0
package/AGENT_COUNCIL_FINDINGS.md +142 -0
package/ARCHITECTURE.md +346 -0
package/AUDIT_REPORT.md +28 -0
package/CODE_OF_CONDUCT.md +128 -0
package/CONTRIBUTING.md +50 -0
package/CONTRIBUTORS.md +20 -0
package/Dockerfile +53 -0
package/Dockerfile.proxy +33 -0
package/HEALTH_REPORT.md +118 -0
package/IMPROVEMENT_PLAN.md +107 -0
package/LANDING.md +43 -0
package/LAUNCH-PAIN-DRIVEN.md +339 -0
package/LAUNCH.md +337 -0
package/LAUNCH_CHECKLIST.md +141 -0
package/LAUNCH_SNAPSHOT.md +260 -0
package/MANIFESTO.md +41 -0
package/POPULARITY_BOOSTERS.md +285 -0
package/PR_STATUS_REPORT.md +148 -0
package/README.md +25 -14
package/REDESIGN.md +95 -0
package/RUNKIT.md +83 -0
package/SECURITY.md +29 -0
package/SUBMISSIONS.md +43 -0
package/_schema.html +53 -0
package/ai-plugin.json +16 -0
package/articles/AI_AGENT_LLM_ROUTING.md +150 -0
package/articles/CHINESE_DIRECTORIES.md +100 -0
package/articles/CHINESE_SUBMISSIONS_READY.md +322 -0
package/articles/COMPETITOR_ALERTS.md +31 -0
package/articles/COMPLETE_POSTING_DIRECTORY.md +147 -0
package/articles/CONTENT_STRUCTURE.md +292 -0
package/articles/DEVTO_COST_GUIDE.md +473 -0
package/articles/DEVTO_FINAL.md +416 -0
package/articles/DEVTO_MULTI_PROVIDER.md +542 -0
package/articles/DEVTO_READY.md +255 -0
package/articles/DEVTO_V2_ANNOUNCEMENT.md +160 -0
package/articles/DEVTO_VIRAL_GROWTH.md +280 -0
package/articles/FRESH_devto.md +460 -0
package/articles/FRESH_devto_2026_05.md +73 -0
package/articles/FRESH_hackernews.md +14 -0
package/articles/FRESH_reddit_ml.md +90 -0
package/articles/FRESH_reddit_node.md +198 -0
package/articles/FRESH_reddit_sideproject.md +72 -0
package/articles/FRESH_reddit_webdev.md +130 -0
package/articles/FROM_ZERO_TO_10K.md +107 -0
package/articles/HN_10X_BETTER.md +430 -0
package/articles/HN_ACCOUNT_GUIDE.md +21 -0
package/articles/HN_CHINESE_STYLE.md +308 -0
package/articles/HN_FINAL.md +148 -0
package/articles/HN_POSTED_VERSION.md +56 -0
package/articles/HN_POST_READY.md +137 -0
package/articles/HN_RESEARCH.md +364 -0
package/articles/HN_SHOW_routerarena.md +17 -0
package/articles/HN_TIMING_GUIDE.md +52 -0
package/articles/INDIEHACKERS_POST.md +52 -0
package/articles/INDIEHACKERS_READY.md +120 -0
package/articles/LLM_BENCHMARK_DEEP_DIVE.md +153 -0
package/articles/MASTER_POSTING_DIRECTORY.md +189 -0
package/articles/NEWSLETTER_SEND_NOW.md +259 -0
package/articles/NEWSLETTER_SUBMISSIONS.md +112 -0
package/articles/PAIN-DRIVEN-devto-v2.md +308 -0
package/articles/PAIN-DRIVEN-devto-v3.md +268 -0
package/articles/PAIN-DRIVEN-devto.md +242 -0
package/articles/PAIN-DRIVEN-hackernews-v2.md +138 -0
package/articles/PAIN-DRIVEN-hackernews-v3.md +151 -0
package/articles/PAIN-DRIVEN-hackernews.md +131 -0
package/articles/PAIN-DRIVEN-reddit-v2.md +301 -0
package/articles/PAIN-DRIVEN-reddit-v3.md +236 -0
package/articles/PAIN-DRIVEN-reddit.md +218 -0
package/articles/PAIN-DRIVEN-twitter-v2.md +110 -0
package/articles/PAIN-DRIVEN-twitter-v3.md +121 -0
package/articles/PAIN-DRIVEN-twitter.md +120 -0
package/articles/PORTKEY_VS_A3M.md +147 -0
package/articles/POSTING_KIT_2026_05.md +67 -0
package/articles/PRESS_KIT_routerarena.md +77 -0
package/articles/PRODUCTHUNT_LISTING.md +48 -0
package/articles/PRODUCTHUNT_READY.md +106 -0
package/articles/PR_PLAN_vault.md +125 -0
package/articles/REDDIT_FINAL.md +232 -0
package/articles/REDDIT_POST.md +67 -0
package/articles/REDDIT_SUBMISSION_READY.md +348 -0
package/articles/ROUTERARENA_9677.md +78 -0
package/articles/ROUTERARENA_LEADER.md +45 -0
package/articles/SHOW_HN_FINAL.md +29 -0
package/articles/TWEETS_10K_DOWNLOADS.md +47 -0
package/articles/TWEETS_BENCHMARK_FIRST.md +46 -0
package/articles/TWEETS_MCP_PLAY.md +51 -0
package/articles/TWEETS_SEQUENTIAL_BROKEN.md +49 -0
package/articles/TWEETS_WHY_BUILD.md +54 -0
package/articles/TWEETS_routerarena_leader.md +53 -0
package/articles/TWEET_STORM_READY.md +165 -0
package/articles/TWITTER_FINAL.md +167 -0
package/articles/WHY_10X_BETTER.md +261 -0
package/articles/WHY_CHINESE_STYLE_BETTER.md +323 -0
package/articles/ai-discoverability-llm-routing.md +210 -0
package/articles/devto-llm-routing.md +138 -0
package/articles/hackernews-show-hn.md +54 -0
package/articles/hashnode-llm-cost-optimization.md +125 -0
package/articles/hn_show_2026_05.md +11 -0
package/articles/medium-building-llm-router.md +205 -0
package/articles/reddit-ml.md +76 -0
package/articles/twitter-thread-cost-savings.md +50 -0
package/articles/youtube-tutorial-script.md +262 -0
package/assets/a3m_3blue1brown.mp4 +0 -0
package/assets/banner.svg +109 -0
package/assets/chart-cost-v2.svg +91 -0
package/assets/chart-cost-v3.svg +143 -0
package/assets/chart-features-v2.svg +132 -0
package/assets/chart-features-v3.svg +211 -0
package/assets/chart-growth-v2.svg +122 -0
package/assets/chart-growth-v3.svg +189 -0
package/assets/cost-comparison.svg +134 -0
package/assets/cost-simple.svg +64 -0
package/assets/demo-hn.gif +0 -0
package/assets/feature-matrix.svg +136 -0
package/assets/growth-chart-animated.svg +76 -0
package/assets/growth-chart.svg +82 -0
package/assets/growth-simple.svg +69 -0
package/assets/hero-diagram.svg +81 -0
package/assets/logo-new.svg +21 -0
package/assets/logo.svg +68 -0
package/assets/provider-comparison.svg +121 -0
package/assets/social-preview-new.svg +100 -0
package/assets/social-preview.svg +194 -0
package/assets/social-v2.svg +130 -0
package/assets/social-v3.svg +212 -0
package/benchmark-provider-results.json +245 -0
package/benchmark-results.json +54 -0
package/council-votes/architecture-vote.md +121 -0
package/council-votes/coverage-vote.md +93 -0
package/data/adaptive-benchmark.json +92 -0
package/data/benchmark-results.json +47 -0
package/data/labeled-benchmark.json +88 -0
package/demo/3blue1brown_video.py +285 -0
package/demo/3blue1brown_video_v2.py +310 -0
package/demo/IMPROVED_PROMPTS.md +229 -0
package/demo/VEO3_PROMPTS.md +269 -0
package/demo/VIDEO_PRODUCTION_GUIDE.md +333 -0
package/demo/a3m_3blue1brown.mp4 +0 -0
package/demo/asciinema-demo.sh +195 -0
package/demo/demo-hn.tape +74 -0
package/demo/demo-script.md +53 -0
package/demo/demo-script.sh +62 -0
package/demo/demo.svg +75 -0
package/demo/frame1_ai_data_center.png +0 -0
package/demo/frame1_sunset_video.mp4 +0 -0
package/demo/frame2_cost_comparison.png +0 -0
package/demo/frame2_cost_comparison_fallback.png +0 -0
package/demo/frame3_parallel_execution.png +0 -0
package/demo/frame3_parallel_execution_fallback.png +0 -0
package/demo/frame4_providers.png +0 -0
package/demo/frame4_providers_fallback.png +0 -0
package/demo/frame5_endcard.png +0 -0
package/demo/frame5_endcard_fallback.png +0 -0
package/demo/new_frame1_hook.png +0 -0
package/demo/new_frame2_proof.png +0 -0
package/demo/new_frame3_wow.png +0 -0
package/demo/new_frame4_social.png +0 -0
package/demo/new_frame5_cta.png +0 -0
package/demo/package.json +13 -0
package/demo/product-video-final.mp4 +0 -0
package/demo/product-video-hype-v1.mp4 +0 -0
package/demo/product-video-v1.mp4 +0 -0
package/demo/public/index.html +762 -0
package/demo/recording.cast +55 -0
package/demo/server.js +405 -0
package/demo-new.tape +71 -0
package/demo-real.sh +198 -0
package/demo-simple.tape +205 -0
package/demo.html +520 -0
package/demo.sh +85 -0
package/demo.tape +259 -0
package/dist/analytics/costAnalytics.d.ts.map +1 -0
package/dist/analytics/costAnalytics.js.map +1 -0
package/dist/benchmark/comprehensive.js.map +1 -0
package/dist/benchmark/reproducible.d.ts.map +1 -0
package/dist/benchmark/reproducible.js.map +1 -0
package/dist/cache/prefixCache.d.ts.map +1 -0
package/dist/cache/prefixCache.js.map +1 -0
package/dist/cache/responseCache.d.ts.map +1 -0
package/dist/cache/responseCache.js.map +1 -0
package/dist/cache/semanticCache.d.ts.map +1 -0
package/dist/cache/semanticCache.js.map +1 -0
package/dist/cli/setupWizard.d.ts.map +1 -0
package/dist/cli/setupWizard.js.map +1 -0
package/dist/cost/budgetEnforcer.d.ts.map +1 -0
package/dist/cost/budgetEnforcer.js.map +1 -0
package/dist/cost/costTracker.d.ts.map +1 -0
package/dist/cost/costTracker.js.map +1 -0
package/dist/ensemble/multiRoundDialog.js.map +1 -0
package/dist/ensemble/shapleyValue.js.map +1 -0
package/dist/integrations/langchainAdapter.d.ts.map +1 -0
package/dist/integrations/langchainAdapter.js.map +1 -0
package/dist/integrations/oauth.d.ts.map +1 -0
package/dist/integrations/oauth.js.map +1 -0
package/dist/integrations/scienceAdapter.js.map +1 -0
package/dist/memory/autoFetch.d.ts.map +1 -0
package/dist/memory/autoFetch.js.map +1 -0
package/dist/memory/episodicMemory.d.ts.map +1 -0
package/dist/memory/episodicMemory.js.map +1 -0
package/dist/memory/hybridMemory.js.map +1 -0
package/dist/memory/memoryTree.d.ts.map +1 -0
package/dist/memory/memoryTree.js.map +1 -0
package/dist/memory/obsidianVault.d.ts.map +1 -0
package/dist/memory/obsidianVault.js.map +1 -0
package/dist/memory/reasoningBank.js.map +1 -0
package/dist/observability/changeWatch.d.ts.map +1 -0
package/dist/observability/changeWatch.js.map +1 -0
package/dist/observability/fatigueDetector.d.ts.map +1 -0
package/dist/observability/fatigueDetector.js.map +1 -0
package/dist/observability/index.d.ts.map +1 -0
package/dist/observability/index.js.map +1 -0
package/dist/observability/metrics.d.ts.map +1 -0
package/dist/observability/metrics.js.map +1 -0
package/dist/observability/middleware.d.ts.map +1 -0
package/dist/observability/middleware.js.map +1 -0
package/dist/observability/tracer.d.ts.map +1 -0
package/dist/observability/tracer.js.map +1 -0
package/dist/observability/types.d.ts.map +1 -0
package/dist/observability/types.js.map +1 -0
package/dist/orchestration/haloOrchestrator.d.ts.map +1 -0
package/dist/orchestration/haloOrchestrator.js.map +1 -0
package/dist/orchestration/mctsWorkflow.d.ts.map +1 -0
package/dist/orchestration/mctsWorkflow.js.map +1 -0
package/dist/providers/localProvider.d.ts.map +1 -0
package/dist/providers/localProvider.js.map +1 -0
package/dist/providers/providerConfig.d.ts.map +1 -0
package/dist/providers/providerConfig.js.map +1 -0
package/dist/providers/registry.d.ts.map +1 -0
package/dist/providers/registry.js.map +1 -0
package/dist/routing/advancedRouter.d.ts.map +1 -0
package/dist/routing/advancedRouter.js +1 -1
package/dist/routing/advancedRouter.js.map +1 -0
package/dist/routing/crossModelValidation.d.ts.map +1 -0
package/dist/routing/crossModelValidation.js.map +1 -0
package/dist/routing/providerHealth.d.ts.map +1 -0
package/dist/routing/providerHealth.js.map +1 -0
package/dist/routing/providerRetry.d.ts.map +1 -0
package/dist/routing/providerRetry.js.map +1 -0
package/dist/scripts/banner.js +29 -0
package/dist/security/guardrails.d.ts.map +1 -0
package/dist/security/guardrails.js.map +1 -0
package/dist/server/dashboard.d.ts.map +1 -0
package/dist/server/dashboard.js.map +1 -0
package/dist/server/modelMapper.d.ts.map +1 -0
package/dist/server/modelMapper.js.map +1 -0
package/dist/server/proxyServer.d.ts.map +1 -0
package/dist/server/proxyServer.js.map +1 -0
package/dist/skills/__tests__/skill_manager.test.d.ts +2 -0
package/dist/skills/__tests__/skill_manager.test.d.ts.map +1 -0
package/dist/skills/__tests__/skill_manager.test.js +268 -0
package/dist/skills/__tests__/skill_manager.test.js.map +1 -0
package/dist/tools/tmlpdTools.d.ts.map +1 -0
package/dist/tools/tmlpdTools.js.map +1 -0
package/dist/tui/dashboard.d.ts.map +1 -0
package/dist/tui/dashboard.js.map +1 -0
package/dist/tui/index.d.ts.map +1 -0
package/dist/tui/index.js.map +1 -0
package/dist/utils/batchProcessor.d.ts.map +1 -0
package/dist/utils/batchProcessor.js.map +1 -0
package/dist/utils/compression.d.ts.map +1 -0
package/dist/utils/compression.js.map +1 -0
package/dist/utils/costUtils.d.ts.map +1 -0
package/dist/utils/costUtils.js.map +1 -0
package/dist/utils/reliability.d.ts.map +1 -0
package/dist/utils/reliability.js.map +1 -0
package/dist/utils/sorting.d.ts.map +1 -0
package/dist/utils/sorting.js.map +1 -0
package/dist/utils/speculativeDecoding.d.ts.map +1 -0
package/dist/utils/speculativeDecoding.js.map +1 -0
package/dist/utils/tokenUtils.d.ts.map +1 -0
package/dist/utils/tokenUtils.js.map +1 -0
package/docs/.nojekyll +0 -0
package/docs/ANALYSIS_PRINCIPLES.md +162 -0
package/docs/API.md +855 -0
package/docs/ARCHITECTURAL-IMPROVEMENTS-2025.md +1391 -0
package/docs/ARCHITECTURAL-IMPROVEMENTS-REVISED-2025.md +1051 -0
package/docs/BENCHMARK.md +170 -0
package/docs/CHINESE_PROVIDER_RELIABILITY.md +37 -0
package/docs/CITATIONS.md +74 -0
package/docs/CLAIMS_AND_EVIDENCE.md +58 -0
package/docs/CONFIGURATION.md +476 -0
package/docs/COUNCIL_DECISION.json +816 -0
package/docs/COUNCIL_SUMMARY.md +319 -0
package/docs/COUNCIL_V2.2_DECISION.md +416 -0
package/docs/ENGINEERING_SPEC.md +55 -0
package/docs/FACTORY_RESET.md +34 -0
package/docs/GEO.md +66 -0
package/docs/GEO_OPTIMIZATION.md +30 -0
package/docs/GEO_ROOT_CAUSE.md +136 -0
package/docs/GEO_STATUS.md +85 -0
package/docs/GEO_TEST_RESULTS.md +176 -0
package/docs/HN_CHECKLIST.md +38 -0
package/docs/HN_FOUNDER_COMMENT.md +17 -0
package/docs/HN_SUBMISSION_FINAL.md +180 -0
package/docs/HN_SUBMISSION_V3.md +56 -0
package/docs/IMPROVEMENT_ROADMAP.md +515 -0
package/docs/INTEGRATIONS.md +420 -0
package/docs/LANGCHAIN_INTEGRATION.md +147 -0
package/docs/LLM_COUNCIL_DECISION.md +508 -0
package/docs/MIDDLEWARE_CHAIN.md +35 -0
package/docs/PROMO_CHECKLIST.md +200 -0
package/docs/QUICKSTART.md +271 -0
package/docs/QUICK_START.md +43 -0
package/docs/QUICK_START_VISIBILITY.md +782 -0
package/docs/REDDIT_GAP_ANALYSIS.md +299 -0
package/docs/RELEASE_CHECKLIST.md +32 -0
package/docs/REPRODUCIBILITY.md +63 -0
package/docs/RESEARCH_BACKED_IMPROVEMENTS.md +1180 -0
package/docs/ROUTING_RUBRIC.md +197 -0
package/docs/SEO_AUDIT.md +186 -0
package/docs/SOCIAL_LISTENING.md +219 -0
package/docs/TMLPD_QNA.md +751 -0
package/docs/TMLPD_V2.1_COMPLETE.md +763 -0
package/docs/TMLPD_V2.2_RESEARCH_ROADMAP.md +754 -0
package/docs/UPDATE_TOPICS.md +15 -0
package/docs/USE_CASES.md +59 -0
package/docs/V2.2_IMPLEMENTATION_COMPLETE.md +446 -0
package/docs/V2_IMPLEMENTATION_GUIDE.md +388 -0
package/docs/VERCEL_AI_SDK.md +209 -0
package/docs/VISIBILITY_ADOPTION_PLAN.md +1005 -0
package/docs/_config.yml +49 -0
package/docs/ai-plugin.json +16 -0
package/docs/api.html +513 -0
package/docs/architecture-diagram.md +40 -0
package/docs/benchmark-chart.png +0 -0
package/docs/benchmark.html +387 -0
package/docs/blog/routerarena-9677.html +92 -0
package/docs/blog/routerarena-number-one.html +73 -0
package/docs/cli-cheatsheet.md +339 -0
package/docs/compare.md +109 -0
package/docs/comparison-litellm.md +88 -0
package/docs/comparison.md +108 -0
package/docs/cost-chart-ascii.md +42 -0
package/docs/cost-comparison-chart.svg +88 -0
package/docs/curl-examples.md +247 -0
package/docs/demo-auto.html +264 -0
package/docs/demo.html +416 -0
package/docs/geo/GENERATIVE_ENGINE_OPTIMIZATION.md +232 -0
package/docs/index.html +507 -0
package/docs/launch-content/LAUNCH_EXECUTION_CHECKLIST.md +421 -0
package/docs/launch-content/README.md +457 -0
package/docs/launch-content/assets/cost_comparison_100_tasks.png +0 -0
package/docs/launch-content/assets/cumulative_savings.png +0 -0
package/docs/launch-content/assets/parallel_speedup.png +0 -0
package/docs/launch-content/assets/provider_pricing_comparison.png +0 -0
package/docs/launch-content/assets/task_breakdown_comparison.png +0 -0
package/docs/launch-content/generate_charts.py +313 -0
package/docs/launch-content/hn_show_post.md +139 -0
package/docs/launch-content/partner_outreach_templates.md +745 -0
package/docs/launch-content/reddit_posts.md +467 -0
package/docs/launch-content/twitter_thread.txt +460 -0
package/{llms.txt.bak → docs/llms.txt} +6 -6
package/docs/npm-downloads-chart.svg +43 -0
package/docs/openapi.json +139 -0
package/docs/openapi.yaml +1318 -0
package/docs/quick-start.html +366 -0
package/docs/robots.txt +52 -0
package/docs/sitemap.xml +57 -0
package/docs/styles.css +682 -0
package/docs/well-known/ai-plugin.json +16 -0
package/docs/wellknown/ai-plugin.json +16 -0
package/docs-site/assets/og-banner.svg +194 -0
package/docs-site/index.html +632 -0
package/eval/README.md +46 -0
package/eval/baselines/main.json +12 -0
package/eval/benchmark_dataset.jsonl +16 -0
package/eval/check_golden_routes.js +64 -0
package/eval/datasets/catalog.json +33 -0
package/eval/datasets/slices/cn_provider_reliability_v1.jsonl +3 -0
package/eval/datasets/slices/cost_pressure_v1.jsonl +3 -0
package/eval/datasets/slices/safety_guardrails_v1.jsonl +3 -0
package/eval/evals.json +199 -0
package/eval/fault_injection_thresholds.json +3 -0
package/eval/generate_report.js +128 -0
package/eval/golden_routes.json +114 -0
package/eval/lib/experiment_registry.js +24 -0
package/eval/run_eval.js +197 -0
package/eval/run_fault_injection.js +201 -0
package/eval/run_shadow_eval.js +85 -0
package/eval/thresholds.json +9 -0
package/examples/QUICKSTART.md +183 -0
package/examples/README.md +61 -0
package/examples/a3m-sdk.js +124 -0
package/examples/basic-route.js +54 -0
package/examples/chat-loop.js +202 -0
package/examples/classify-then-route.js +102 -0
package/examples/cost-compare.js +120 -0
package/examples/ensemble.js +160 -0
package/examples/whatsapp-telegram-bridge-demo.js +302 -0
package/examples/whatsapp-telegram-bridge.js +269 -0
package/hf-space/README.md +23 -0
package/hf-space/app.py +240 -0
package/hf-space/requirements.txt +1 -0
package/huggingface_space/README.md +35 -0
package/huggingface_space/app.py +126 -0
package/huggingface_space/create_space.py +208 -0
package/huggingface_space/requirements.txt +1 -0
package/index.html +1 -1
package/mcp-server/README.md +188 -0
package/mcp-server/package.json +29 -0
package/mcp-server/src/index.ts +744 -0
package/mcp-server/tsconfig.json +19 -0
package/openclaw-alexa-bridge/ALL_REMAINING_FIXES_PLAN.md +313 -0
package/openclaw-alexa-bridge/REMAINING_FIXES_SUMMARY.md +277 -0
package/openclaw-alexa-bridge/src/alexa_handler_no_tmlpd.js +1234 -0
package/openclaw-alexa-bridge/test_fixes.js +77 -0
package/package.json +76 -272
package/playground/README.md +51 -0
package/playground/codesandbox.json +12 -0
package/playground/index.js +39 -0
package/proxy/README.md +227 -0
package/proxy/package-lock.json +831 -0
package/proxy/package.json +17 -0
package/proxy/rate-limit.js +145 -0
package/proxy/rate-limit.test.js +311 -0
package/proxy/server.js +970 -0
package/python/README.md +102 -0
package/python/a3m/__init__.py +6 -0
package/python/a3m/client.py +190 -0
package/python/a3m/models.py +40 -0
package/python/a3m/sync_client.py +61 -0
package/python/examples.py +53 -0
package/python/integrations.py +330 -0
package/python/pyproject.toml +23 -0
package/python/setup.py +28 -0
package/python/tmlpd.py +369 -0
package/qna/REDDIT_GAP_ANALYSIS.md +299 -0
package/qna/TMLPD_QNA.md +751 -0
package/research/FINDING_001_safety.md +28 -0
package/research/FINDING_002_error_diversity.md +32 -0
package/research/FINDING_003_confidence_weighted_voting.md +32 -0
package/research/FINDING_004_cross_model_semantic_detection.md +37 -0
package/research/FINDING_005_knowledge_gap_orthogonality.md +34 -0
package/research/HALLUCINATION_RESEARCH.md +27 -0
package/research/ensemble-voting.md +324 -0
package/research/loss-functions.md +545 -0
package/research-log.md +49 -0
package/scripts/banner.js +29 -0
package/scripts/benchmark-local-routerarena.ts +176 -0
package/scripts/benchmark.js +145 -0
package/scripts/benchmark.sh +61 -0
package/scripts/compare-providers.sh +230 -0
package/scripts/content-planner.js +25 -0
package/scripts/create-labeled-benchmark.ts +105 -0
package/scripts/cross_post.py +443 -0
package/scripts/local-router-benchmark.ts +154 -0
package/scripts/post-all.sh +41 -0
package/scripts/publish_fcc.py +106 -0
package/scripts/push-to-gitee.sh +25 -0
package/scripts/routerarena_ensemble.js +144 -0
package/scripts/routing-benchmark-v2.js +373 -0
package/scripts/routing-benchmark-v3.js +118 -0
package/scripts/routing-benchmark.js +462 -0
package/scripts/run-labeled-benchmark.mjs +104 -0
package/scripts/run-mmlu-benchmark.js +176 -0
package/scripts/run-provider-benchmark.js +244 -0
package/scripts/update-npm-badges.js +158 -0
package/skill/SKILL.md +238 -0
package/src/__tests__/integration/tmpld_integration.test.py +540 -0
package/src/ensemble.ts +2 -0
package/src/routing/advancedRouter.ts +1 -1
package/src/skills/__tests__/skill_manager.test.ts +328 -0
package/submissions/benchmarks/ALL_PLATFORMS_SUBMISSION.md +94 -0
package/submissions/benchmarks/LLMROUTERBENCH_SUBMISSION.md +121 -0
package/submissions/benchmarks/MMRBENCH_SUBMISSION.md +94 -0
package/submissions/benchmarks/ROUTERARENA_UPDATE.md +83 -0
package/submissions/benchmarks/ROUTERBENCH_SUBMISSION.md +225 -0
package/test-council/1-structure-tests.test.js +353 -0
package/test-council/1-structure-tests.test.ts +353 -0
package/test-council/2-edge-case-tests.test.ts +361 -0
package/test-council/3-performance-tests.test.ts +652 -0
package/test-council/4-integration-tests.test.ts +391 -0
package/test-council/5-agent-council-eval.test.ts +413 -0
package/test-council/AGENT_COUNCIL_ARCHITECTURE.md +349 -0
package/test-council/TEST_COUNCIL_REPORT.md +201 -0
package/test-council/agents/edge-case-agent.ts +363 -0
package/test-council/agents/performance-agent.ts +426 -0
package/test-council/agents/structure-agent.ts +227 -0
package/test-council/council.md +183 -0
package/tests/__mocks__/tokenUtils.ts +8 -0
package/tests/memory/episodicMemory.test.ts +227 -0
package/tests/package-lock.json +1785 -0
package/tests/package.json +19 -0
package/tests/routing/ensembleVoting.test.ts +236 -0
package/tests/routing/providerRetry.test.ts +360 -0
package/tests/routing/queryTypePresets.test.ts +208 -0
package/tests/security/guardrailEngine.test.ts +700 -0
package/tests/tsconfig.json +21 -0
package/tests/vitest.config.ts +18 -0
package/tmlpd-pi-extension/README.md +66 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.d.ts +114 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.js +285 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.js.map +1 -0
package/tmlpd-pi-extension/dist/cache/responseCache.d.ts +58 -0
package/tmlpd-pi-extension/dist/cache/responseCache.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/cache/responseCache.js +153 -0
package/tmlpd-pi-extension/dist/cache/responseCache.js.map +1 -0
package/tmlpd-pi-extension/dist/cli.js +59 -0
package/tmlpd-pi-extension/dist/cost/costTracker.d.ts +95 -0
package/tmlpd-pi-extension/dist/cost/costTracker.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/cost/costTracker.js +240 -0
package/tmlpd-pi-extension/dist/cost/costTracker.js.map +1 -0
package/tmlpd-pi-extension/dist/index.d.ts +723 -0
package/tmlpd-pi-extension/dist/index.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/index.js +239 -0
package/tmlpd-pi-extension/dist/index.js.map +1 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.d.ts +82 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.js +145 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.js.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.d.ts +102 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.js +207 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.js.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.d.ts +85 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.js +210 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.js.map +1 -0
package/tmlpd-pi-extension/dist/providers/localProvider.d.ts +102 -0
package/tmlpd-pi-extension/dist/providers/localProvider.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/providers/localProvider.js +338 -0
package/tmlpd-pi-extension/dist/providers/localProvider.js.map +1 -0
package/tmlpd-pi-extension/dist/providers/registry.d.ts +55 -0
package/tmlpd-pi-extension/dist/providers/registry.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/providers/registry.js +138 -0
package/tmlpd-pi-extension/dist/providers/registry.js.map +1 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.d.ts +68 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.js +332 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.js.map +1 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.d.ts +101 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.js +368 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.d.ts +96 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.js +170 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/compression.d.ts +61 -0
package/tmlpd-pi-extension/dist/utils/compression.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/compression.js +281 -0
package/tmlpd-pi-extension/dist/utils/compression.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/reliability.d.ts +74 -0
package/tmlpd-pi-extension/dist/utils/reliability.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/reliability.js +177 -0
package/tmlpd-pi-extension/dist/utils/reliability.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts +117 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js +246 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts +50 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.js +124 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.js.map +1 -0
package/tmlpd-pi-extension/examples/QUICKSTART.md +183 -0
package/tmlpd-pi-extension/package-lock.json +79 -0
package/tmlpd-pi-extension/package.json +172 -0
package/tmlpd-pi-extension/python/examples.py +53 -0
package/tmlpd-pi-extension/python/integrations.py +330 -0
package/tmlpd-pi-extension/python/setup.py +28 -0
package/tmlpd-pi-extension/python/tmlpd.py +369 -0
package/tmlpd-pi-extension/qna/REDDIT_GAP_ANALYSIS.md +299 -0
package/tmlpd-pi-extension/qna/TMLPD_QNA.md +751 -0
package/tmlpd-pi-extension/skill/SKILL.md +238 -0
package/tmlpd-pi-extension/src/cache/responseCache.ts +147 -0
package/tmlpd-pi-extension/src/cost/costTracker.ts +302 -0
package/tmlpd-pi-extension/src/index.ts +232 -0
package/tmlpd-pi-extension/src/memory/episodicMemory.ts +257 -0
package/tmlpd-pi-extension/src/orchestration/haloOrchestrator.ts +266 -0
package/tmlpd-pi-extension/src/orchestration/mctsWorkflow.ts +262 -0
package/tmlpd-pi-extension/src/providers/localProvider.ts +406 -0
package/tmlpd-pi-extension/src/providers/registry.ts +164 -0
package/tmlpd-pi-extension/src/routing/ensembleVoting.ts +159 -0
package/tmlpd-pi-extension/src/routing/queryTypePresets.ts +136 -0
package/tmlpd-pi-extension/src/tools/tmlpdTools.ts +433 -0
package/tmlpd-pi-extension/src/utils/batchProcessor.ts +232 -0
package/tmlpd-pi-extension/src/utils/compression.ts +325 -0
package/tmlpd-pi-extension/src/utils/reliability.ts +221 -0
package/tmlpd-pi-extension/src/utils/tokenUtils.ts +145 -0
package/tmlpd-pi-extension/tsconfig.json +18 -0
package/tsconfig.build.json +29 -0
package/tsconfig.json +18 -0
package/README.md.bak +0 -1185
package/src/routing/advancedRouter.ts.bak +0 -650
package/test.js.bak +0 -376
/package/{llms-full.txt.bak → docs/llms-full.txt} +0 -0

package/tests/package.json ADDED Viewed

@@ -0,0 +1,19 @@
+{
+  "name": "a3m-router-tests",
+  "version": "1.0.0",
+  "private": true,
+  "type": "module",
+  "scripts": {
+    "test": "vitest run",
+    "test:watch": "vitest",
+    "test:coverage": "vitest run --coverage"
+  },
+  "devDependencies": {
+    "esbuild": "^0.28.1",
+    "typescript": "^5.8.0",
+    "vitest": "^4.1.9"
+  },
+  "dependencies": {
+    "nanoid": "^5.0.0"
+  }
+}

package/tests/routing/ensembleVoting.test.ts ADDED Viewed

@@ -0,0 +1,236 @@
+import { describe, it, expect, vi } from 'vitest';
+import {
+  executeEnsemble,
+  mergeComplementary,
+  recordFeedback,
+} from '../../tmlpd-pi-extension/src/routing/ensembleVoting';
+describe('executeEnsemble', () => {
+  const defaultExecutors: Record<string, (q: string, s: string, c: string) => Promise<string | null>> = {
+    groq: vi.fn().mockResolvedValue(
+      'Simple answer with no details.'
+    ),
+    nvidia: vi.fn().mockResolvedValue(
+      'Detailed answer including 42 numerical references. The API endpoint app.ts handles requests. ' +
+      '* Point one\n* Point two\n* Point three\n* Point four\n* Point five\n' +
+      'The system uses Docker, Redis, and GCS for infrastructure. npm install is required.'
+    ),
+  };
+  it('scores detailed responses higher than short ones', async () => {
+    const result = await executeEnsemble(
+      'test query',
+      'system prompt',
+      '',
+      defaultExecutors,
+      { providers: ['groq', 'nvidia'] }
+    );
+    expect(result.scores['nvidia']).toBeGreaterThan(result.scores['groq']);
+    expect(result.winner).toBe('nvidia');
+  });
+  it('selects the provider with the highest score as winner', async () => {
+    const executors = {
+      low: vi.fn().mockResolvedValue('Hi'),
+      mid: vi.fn().mockResolvedValue('A moderate answer with some text.'),
+      high: vi.fn().mockResolvedValue(
+        'Excellent comprehensive response. Contains 3 key points. The API integration uses app.ts. ' +
+        '* Point A\n* Point B\n* Point C\n* Point D\n* Point E'
+      ),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['low', 'mid', 'high'] }
+    );
+    expect(result.winner).toBe('high');
+  });
+  it('handles providers returning null (errors)', async () => {
+    const executors = {
+      good: vi.fn().mockResolvedValue('Valid answer here.'),
+      bad: vi.fn().mockRejectedValue(new Error('API failure')),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['good', 'bad'] }
+    );
+    expect(result.allResults['good']).toBe('Valid answer here.');
+    expect(result.allResults['bad']).toBeNull();
+    expect(result.scores['bad']).toBe(0);
+    expect(result.winner).toBe('good');
+  });
+  it('handles all providers failing', async () => {
+    const executors = {
+      a: vi.fn().mockRejectedValue(new Error('fail')),
+      b: vi.fn().mockRejectedValue(new Error('fail')),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['a', 'b'] }
+    );
+    expect(result.best).toBe('');
+    expect(Object.values(result.scores).every(s => s === 0)).toBe(true);
+  });
+  it('applies length penalty for very short responses', async () => {
+    const executors = {
+      short: vi.fn().mockResolvedValue('Hi'),
+      normal: vi.fn().mockResolvedValue('A normal length answer with several words in it.'),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['short', 'normal'] }
+    );
+    expect(result.scores["short"]).toBeLessThanOrEqual(result.scores["normal"]);
+  });
+  it('applies specificity bonus for responses with numbers', async () => {
+    const executors = {
+      vague: vi.fn().mockResolvedValue('The system works well and is quite good.'),
+      specific: vi.fn().mockResolvedValue('The system processes 42 requests per second with 99.9% uptime.'),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['vague', 'specific'] }
+    );
+    expect(result.scores['specific']).toBeGreaterThan(result.scores['vague']);
+  });
+  it('applies structure bonus for multi-line responses', async () => {
+    const executors = {
+      oneLine: vi.fn().mockResolvedValue('Just a single line answer here.'),
+      multiLine: vi.fn().mockResolvedValue('Line one\nLine two\nLine three\nLine four\nLine five'),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['oneLine', 'multiLine'] }
+    );
+    expect(result.scores['multiLine']).toBeGreaterThan(result.scores['oneLine']);
+  });
+  it('includes timing information in result', async () => {
+    const executors = {
+      fast: vi.fn().mockImplementation(
+        () => new Promise(r => setTimeout(() => r('Quick answer.'), 5))
+      ),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['fast'] }
+    );
+    expect(result.timing.totalMs).toBeGreaterThanOrEqual(0);
+    expect(result.timing.perProvider['fast']).toBeGreaterThanOrEqual(0);
+  });
+  it('produces reasoning string explaining winner selection', async () => {
+    const executors = {
+      a: vi.fn().mockResolvedValue('Answer A with some detail.'),
+      b: vi.fn().mockResolvedValue('Answer B with more specific 42 details and technical API references.'),
+    };
+    const result = await executeEnsemble(
+      'query',
+      'sys',
+      '',
+      executors,
+      { providers: ['a', 'b'] }
+    );
+    expect(result.reasoning).toBeTruthy();
+    expect(result.reasoning).toContain(result.winner);
+  });
+});
+describe('mergeComplementary', () => {
+  it('merges multiple results into sections', () => {
+    const merged = mergeComplementary(['Answer one', 'Answer two']);
+    expect(merged).toContain('### Provider 1');
+    expect(merged).toContain('### Provider 2');
+    expect(merged).toContain('Answer one');
+    expect(merged).toContain('Answer two');
+    expect(merged).toContain('---');
+  });
+  it('filters out empty results', () => {
+    const merged = mergeComplementary(['Valid', '', 'Also valid']);
+    expect(merged).toContain('### Provider 1');
+    expect(merged).toContain('### Provider 2');
+    expect(merged).not.toContain('### Provider 3');
+  });
+  it('truncates at maxLength', () => {
+    const long = 'A'.repeat(3000);
+    const merged = mergeComplementary([long, long], 500);
+    expect(merged.length).toBeLessThanOrEqual(500);
+  });
+  it('returns empty string for all-empty input', () => {
+    expect(mergeComplementary([])).toBe('');
+    expect(mergeComplementary(['', '', null as unknown as string])).toBe('');
+  });
+});
+describe('recordFeedback', () => {
+  it('increments good count for helpful feedback', () => {
+    const history: Record<string, { good: number; bad: number }> = {};
+    const updated = recordFeedback('groq', true, history);
+    expect(updated['groq'].good).toBe(1);
+    expect(updated['groq'].bad).toBe(0);
+  });
+  it('increments bad count for unhelpful feedback', () => {
+    const history: Record<string, { good: number; bad: number }> = { groq: { good: 1, bad: 0 } };
+    const updated = recordFeedback('groq', false, history);
+    expect(updated['groq'].good).toBe(1);
+    expect(updated['groq'].bad).toBe(1);
+  });
+  it('initializes history entry if missing', () => {
+    const history: Record<string, { good: number; bad: number }> = {};
+    const updated = recordFeedback('new-provider', true, history);
+    expect(updated['new-provider']).toEqual({ good: 1, bad: 0 });
+  });
+  it('returns the same history object (mutates in place)', () => {
+    const history: Record<string, { good: number; bad: number }> = {};
+    const updated = recordFeedback('groq', true, history);
+    expect(updated).toBe(history);
+  });
+});

package/tests/routing/providerRetry.test.ts ADDED Viewed

@@ -0,0 +1,360 @@
+import { describe, it, expect, vi, beforeEach } from 'vitest';
+// Mock tokenUtils BEFORE importing providerRetry
+vi.mock('../../src/utils/tokenUtils', () => ({
+  countTokens: (text: string) => {
+    if (!text || text.length === 0) return 0;
+    return Math.ceil(text.trim().split(/\s+/).length * 1.3);
+  },
+  estimateTokens: (text: string) => {
+    if (!text || text.length === 0) return 0;
+    return Math.ceil(text.trim().split(/\s+/).length * 1.3);
+  },
+}));
+import {
+  ProviderRetryHandler,
+  createRetryHandler,
+  DEFAULT_RETRY_CONFIG,
+  DEFAULT_PROVIDER_CONFIG,
+  PROVIDER_CONTEXT_LIMITS,
+  RetryConfig,
+  ProviderRetryConfig,
+} from '../../src/routing/providerRetry';
+// ============================================================
+// HELPERS
+// ============================================================
+function expectInRange(actual: number, min: number, max: number, label: string): void {
+  expect(actual >= min && actual <= max).toBe(true);
+}
+// ============================================================
+// SUITE
+// ============================================================
+describe('ProviderRetryHandler', () => {
+  let handler: ProviderRetryHandler;
+  beforeEach(() => {
+    handler = new ProviderRetryHandler();
+  });
+  describe('constructor', () => {
+    it('initializes with default configs', () => {
+      expect(handler).toBeInstanceOf(ProviderRetryHandler);
+    });
+    it('initializes with custom provider configs', () => {
+      const custom: ProviderRetryConfig = {
+        customProvider: {
+          timeout: 5000,
+          retry: { maxRetries: 2, initialDelayMs: 500, maxDelayMs: 10000, backoffMultiplier: 2 },
+          rateLimitRetries: 3,
+        },
+      };
+      const customHandler = new ProviderRetryHandler(custom);
+      const cfg = customHandler.getConfig('customProvider');
+      expect(cfg.timeout).toBe(5000);
+    });
+  });
+  describe('getConfig', () => {
+    it('returns deepseek config with correct values', () => {
+      const cfg = handler.getConfig('deepseek');
+      expect(cfg.timeout).toBe(30000);
+      expect(cfg.retry.maxRetries).toBe(5);
+      expect(cfg.rateLimitRetries).toBe(3);
+    });
+    it('returns groq config with short timeout', () => {
+      const cfg = handler.getConfig('groq');
+      expect(cfg.timeout).toBe(10000);
+      expect(cfg.retry.maxRetries).toBe(2);
+      expect(cfg.rateLimitRetries).toBe(1);
+    });
+    it('falls back to default for unknown providers', () => {
+      const cfg = handler.getConfig('nonexistent');
+      expect(cfg.timeout).toBe(15000);
+      expect(cfg.retry.maxRetries).toBe(3);
+    });
+  });
+  describe('configureProvider', () => {
+    it('adds a new custom provider', () => {
+      handler.configureProvider('my-provider', {
+        timeout: 9999,
+        retry: { maxRetries: 10, initialDelayMs: 100, maxDelayMs: 5000, backoffMultiplier: 1.5 },
+        rateLimitRetries: 5,
+      });
+      const cfg = handler.getConfig('my-provider');
+      expect(cfg.timeout).toBe(9999);
+      expect(cfg.retry.maxRetries).toBe(10);
+      expect(cfg.retry.initialDelayMs).toBe(100);
+      expect(cfg.rateLimitRetries).toBe(5);
+    });
+    it('overrides existing provider partially', () => {
+      handler.configureProvider('groq', { timeout: 50000 });
+      const cfg = handler.getConfig('groq');
+      expect(cfg.timeout).toBe(50000);
+      // Other values unchanged
+      expect(cfg.retry.maxRetries).toBe(2);
+      expect(cfg.rateLimitRetries).toBe(1);
+    });
+  });
+  describe('isRetryableError', () => {
+    it('returns true for common transient errors', () => {
+      expect(handler.isRetryableError({ code: 'ECONNRESET' })).toBe(true);
+      expect(handler.isRetryableError({ code: 'ETIMEDOUT' })).toBe(true);
+      expect(handler.isRetryableError({ code: 'ECONNREFUSED' })).toBe(true);
+      expect(handler.isRetryableError({ code: 'EAI_AGAIN' })).toBe(true);
+    });
+    it('returns true for 5xx status codes', () => {
+      expect(handler.isRetryableError({ status: 500 })).toBe(true);
+      expect(handler.isRetryableError({ status: 502 })).toBe(true);
+      expect(handler.isRetryableError({ status: 503 })).toBe(true);
+      expect(handler.isRetryableError({ status: 504 })).toBe(true);
+    });
+    it('returns true for 429 rate limit', () => {
+      expect(handler.isRetryableError({ status: 429 })).toBe(true);
+      expect(handler.isRetryableError({ statusCode: 429 })).toBe(true);
+    });
+    it('returns false for 4xx client errors', () => {
+      expect(handler.isRetryableError({ status: 400 })).toBe(false);
+      expect(handler.isRetryableError({ status: 404 })).toBe(false);
+    });
+    it('returns false for permanent provider state errors', () => {
+      expect(handler.isRetryableError({ status: 401 })).toBe(false);
+      expect(handler.isRetryableError({ status: 403 })).toBe(false);
+      expect(handler.isRetryableError({ message: 'insufficient balance' })).toBe(false);
+      expect(handler.isRetryableError({ message: 'invalid API key' })).toBe(false);
+      expect(handler.isRetryableError({ message: 'quota exhausted' })).toBe(false);
+    });
+    it('returns false for null/undefined error', () => {
+      expect(handler.isRetryableError(null)).toBe(false);
+      expect(handler.isRetryableError(undefined)).toBe(false);
+    });
+  });
+  describe('isRateLimitError', () => {
+    it('detects 429 in status field', () => {
+      expect(handler.isRateLimitError({ status: 429 })).toBe(true);
+    });
+    it('detects 429 in statusCode field', () => {
+      expect(handler.isRateLimitError({ statusCode: 429 })).toBe(true);
+    });
+    it('returns false for non-429 errors', () => {
+      expect(handler.isRateLimitError({ status: 200 })).toBe(false);
+      expect(handler.isRateLimitError({ status: 500 })).toBe(false);
+      expect(handler.isRateLimitError({})).toBe(false);
+    });
+  });
+  describe('calculateBackoffDelay', () => {
+    const defaultConfig: RetryConfig = {
+      maxRetries: 3,
+      initialDelayMs: 1000,
+      maxDelayMs: 30000,
+      backoffMultiplier: 2,
+      retryableErrors: ['ECONNRESET'],
+    };
+    it('returns delay in range [0.5*base, base] for attempt 0', () => {
+      const delay = handler.calculateBackoffDelay(0, defaultConfig);
+      // base = 1000, jitter = [500, 1000]
+      expectInRange(delay, 500, 1000, 'Attempt 0 delay');
+    });
+    it('returns delay in range [0.5*base, base] for attempt 1', () => {
+      const delay = handler.calculateBackoffDelay(1, defaultConfig);
+      // base = 1000 * 2^1 = 2000, jitter = [1000, 2000]
+      expectInRange(delay, 1000, 2000, 'Attempt 1 delay');
+    });
+    it('returns delay in range [0.5*base, base] for attempt 2', () => {
+      const delay = handler.calculateBackoffDelay(2, defaultConfig);
+      // base = 1000 * 2^2 = 4000, jitter = [2000, 4000]
+      expectInRange(delay, 2000, 4000, 'Attempt 2 delay');
+    });
+    it('caps delay at maxDelayMs', () => {
+      const cappedConfig: RetryConfig = { ...defaultConfig, maxDelayMs: 5000 };
+      const delay = handler.calculateBackoffDelay(10, cappedConfig);
+      expect(delay).toBeLessThanOrEqual(5000);
+    });
+    it('respects Retry-After header for 429 errors', () => {
+      const rateLimitError = {
+        status: 429,
+        headers: { 'retry-after': '5' },
+      };
+      const delay = handler.calculateBackoffDelay(0, defaultConfig, rateLimitError);
+      // Retry-After: 5 seconds = 5000ms, with some tolerance
+      expectInRange(delay, 4500, 5500, 'Retry-After delay');
+    });
+  });
+  describe('validateContextWindow', () => {
+    it('returns valid for short prompts', () => {
+      const result = handler.validateContextWindow('openai', 'Short prompt');
+      expect(result.valid).toBe(true);
+    });
+    it('returns invalid for long prompts on small-context providers', () => {
+      const longText = Array(10000).join('word '); // ~9 chars * 10000 = ~90K chars
+      const result = handler.validateContextWindow('cerebras', longText);
+      expect(result.valid).toBe(false);
+      expect(result.reason).toBeTruthy();
+      expect(result.suggestedProvider).toBeTruthy();
+    });
+    it('suggests a provider with larger context when validation fails', () => {
+      const longText = Array(10000).join('word ');
+      const result = handler.validateContextWindow('cerebras', longText);
+      expect(result.suggestedProvider).toBeTruthy();
+      const suggestedLimit = PROVIDER_CONTEXT_LIMITS[result.suggestedProvider!] || 0;
+      const cerebrasLimit = PROVIDER_CONTEXT_LIMITS['cerebras'] || 0;
+      expect(suggestedLimit).toBeGreaterThan(cerebrasLimit);
+    });
+    it('returns valid for large prompts on large-context providers', () => {
+      const longText = Array(10000).join('word ');
+      const result = handler.validateContextWindow('minimax', longText);
+      expect(result.valid).toBe(true);
+    });
+    it('accepts explicit token count parameter', () => {
+      const result = handler.validateContextWindow('groq', 'test', 100);
+      expect(result.valid).toBe(true);
+    });
+  });
+  describe('stats tracking', () => {
+    it('starts with zeroed stats', () => {
+      const stats = handler.getStats('openai');
+      expect(stats.totalRequests).toBe(0);
+      expect(stats.successfulRequests).toBe(0);
+      expect(stats.failedRequests).toBe(0);
+      expect(stats.totalRetries).toBe(0);
+    });
+    it('getAllStats returns all providers', () => {
+      const allStats = handler.getAllStats();
+      expect(allStats['openai']).toBeDefined();
+      expect(allStats['deepseek']).toBeDefined();
+      expect(allStats['groq']).toBeDefined();
+      expect(Object.keys(allStats).length).toBeGreaterThan(5);
+    });
+    it('resetStats clears single provider', () => {
+      handler.resetStats('openai');
+      const stats = handler.getStats('openai');
+      expect(stats.totalRequests).toBe(0);
+    });
+    it('resetStats with no arg clears all', () => {
+      handler.resetStats();
+      const allStats = handler.getAllStats();
+      for (const stats of Object.values(allStats)) {
+        expect(stats.totalRequests).toBe(0);
+      }
+    });
+  });
+  describe('executeWithRetry', () => {
+    it('succeeds on first attempt', async () => {
+      const fn = vi.fn().mockResolvedValue('success');
+      const result = await handler.executeWithRetry('groq', fn);
+      expect(result).toBe('success');
+      expect(fn).toHaveBeenCalledTimes(1);
+    });
+    it('retries on transient errors then succeeds', async () => {
+      const fn = vi.fn()
+        .mockRejectedValueOnce({ code: 'ECONNRESET', message: 'Connection reset' })
+        .mockRejectedValueOnce({ code: 'ECONNRESET', message: 'Connection reset' })
+        .mockResolvedValue('success after retry');
+      const result = await handler.executeWithRetry('groq', fn, {
+        onRetry: vi.fn(),
+      });
+      expect(result).toBe('success after retry');
+      expect(fn).toHaveBeenCalledTimes(3);
+    });
+    it('fails after exhausting retries', async () => {
+      const fn = vi.fn().mockRejectedValue({ code: 'ECONNRESET', message: 'Persistent failure' });
+      await expect(
+        handler.executeWithRetry('groq', fn)
+      ).rejects.toThrow();
+      expect(fn).toHaveBeenCalledTimes(3); // initial + 2 retries (groq maxRetries=2)
+    });
+    it('does not retry on non-retryable errors', async () => {
+      const fn = vi.fn().mockRejectedValue({ status: 401, message: 'Unauthorized' });
+      await expect(
+        handler.executeWithRetry('groq', fn)
+      ).rejects.toThrow();
+      expect(fn).toHaveBeenCalledTimes(1);
+    });
+    it('calls onRetry callback on each retry', async () => {
+      const fn = vi.fn()
+        .mockRejectedValueOnce({ code: 'ECONNRESET' })
+        .mockResolvedValue('ok');
+      const onRetry = vi.fn();
+      await handler.executeWithRetry('groq', fn, { onRetry });
+      expect(onRetry).toHaveBeenCalledTimes(1);
+      expect(onRetry).toHaveBeenCalledWith(1, { code: 'ECONNRESET' }, expect.any(Number));
+    });
+    it('respects custom timeout', async () => {
+      const slowFn = vi.fn().mockImplementation(
+        () => new Promise(r => setTimeout(r, 100))
+      );
+      // Short timeout should reject
+      await expect(
+        handler.executeWithRetry('groq', slowFn, { timeout: 5 })
+      ).rejects.toThrow(/timed out/i);
+    });
+  });
+  describe('PROVIDER_CONTEXT_LIMITS', () => {
+    it('contains expected providers', () => {
+      expect(PROVIDER_CONTEXT_LIMITS['openai']).toBe(128000);
+      expect(PROVIDER_CONTEXT_LIMITS['anthropic']).toBe(200000);
+      expect(PROVIDER_CONTEXT_LIMITS['minimax']).toBe(1000000);
+      expect(PROVIDER_CONTEXT_LIMITS['groq']).toBe(32000);
+      expect(PROVIDER_CONTEXT_LIMITS['default']).toBe(8192);
+    });
+  });
+  describe('createRetryHandler', () => {
+    it('creates handler with custom configs', () => {
+      const custom = createRetryHandler({
+        testProv: {
+          timeout: 1000,
+          retry: { maxRetries: 1, initialDelayMs: 100, maxDelayMs: 5000, backoffMultiplier: 2 },
+          rateLimitRetries: 1,
+        },
+      });
+      const cfg = custom.getConfig('testProv');
+      expect(cfg.timeout).toBe(1000);
+    });
+  });
+});