npm - adaptive-memory-multi-model-router - Versions diffs - 2.14.45 → 2.14.47 - Mend

adaptive-memory-multi-model-router 2.14.45 → 2.14.47

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (605) hide show

package/dist/index.d.ts +4 -0
package/dist/index.js +8 -2
package/dist/memory/hybridMemory.d.ts +71 -0
package/dist/memory/hybridMemory.js +124 -0
package/dist/memory/reasoningBank.d.ts +88 -0
package/dist/memory/reasoningBank.js +303 -0
package/{docs/llms.txt → llms.txt.bak} +6 -6
package/package.json +13 -84
package/src/index.ts +8 -0
package/src/memory/hybridMemory.ts +155 -0
package/src/memory/reasoningBank.ts +335 -0
package/src/routing/advancedRouter.ts.bak +650 -0
package/test.js.bak +376 -0
package/.dockerignore +0 -82
package/.env.example +0 -303
package/.github/DISCUSSIONS_WELCOME.md +0 -27
package/.github/DISCUSSION_TEMPLATE.yml +0 -5
package/.github/FUNDING.yml +0 -2
package/.github/ISSUE_TEMPLATE/bug_report.md +0 -94
package/.github/ISSUE_TEMPLATE/config.yml +0 -17
package/.github/ISSUE_TEMPLATE/feature_request.md +0 -71
package/.github/PULL_REQUEST_TEMPLATE.md +0 -71
package/.github/dependabot.yml +0 -9
package/.github/workflows/auto-publish.yml +0 -51
package/.github/workflows/ci.yml +0 -263
package/.github/workflows/codeql.yml +0 -38
package/.github/workflows/npm-publish.yml +0 -20
package/.github/workflows/pages.yml +0 -37
package/.github/workflows/stale.yml +0 -54
package/.publish-tick +0 -1
package/.well-known/ai-plugin.json +0 -16
package/AGENT_COUNCIL_FINDINGS.md +0 -142
package/ARCHITECTURE.md +0 -346
package/AUDIT_REPORT.md +0 -28
package/CODE_OF_CONDUCT.md +0 -128
package/CONTRIBUTING.md +0 -50
package/CONTRIBUTORS.md +0 -20
package/Dockerfile +0 -53
package/Dockerfile.proxy +0 -33
package/HEALTH_REPORT.md +0 -118
package/IMPROVEMENT_PLAN.md +0 -107
package/LANDING.md +0 -43
package/LAUNCH-PAIN-DRIVEN.md +0 -339
package/LAUNCH.md +0 -337
package/LAUNCH_CHECKLIST.md +0 -141
package/LAUNCH_SNAPSHOT.md +0 -260
package/MANIFESTO.md +0 -41
package/POPULARITY_BOOSTERS.md +0 -285
package/PR_STATUS_REPORT.md +0 -148
package/REDESIGN.md +0 -95
package/RUNKIT.md +0 -83
package/SECURITY.md +0 -29
package/SUBMISSIONS.md +0 -43
package/_schema.html +0 -53
package/ai-plugin.json +0 -16
package/articles/AI_AGENT_LLM_ROUTING.md +0 -150
package/articles/CHINESE_DIRECTORIES.md +0 -100
package/articles/CHINESE_SUBMISSIONS_READY.md +0 -322
package/articles/COMPETITOR_ALERTS.md +0 -31
package/articles/COMPLETE_POSTING_DIRECTORY.md +0 -147
package/articles/CONTENT_STRUCTURE.md +0 -292
package/articles/DEVTO_COST_GUIDE.md +0 -473
package/articles/DEVTO_FINAL.md +0 -416
package/articles/DEVTO_MULTI_PROVIDER.md +0 -542
package/articles/DEVTO_READY.md +0 -255
package/articles/DEVTO_V2_ANNOUNCEMENT.md +0 -160
package/articles/DEVTO_VIRAL_GROWTH.md +0 -280
package/articles/FRESH_devto.md +0 -460
package/articles/FRESH_devto_2026_05.md +0 -73
package/articles/FRESH_hackernews.md +0 -14
package/articles/FRESH_reddit_ml.md +0 -90
package/articles/FRESH_reddit_node.md +0 -198
package/articles/FRESH_reddit_sideproject.md +0 -72
package/articles/FRESH_reddit_webdev.md +0 -130
package/articles/FROM_ZERO_TO_10K.md +0 -107
package/articles/HN_10X_BETTER.md +0 -430
package/articles/HN_ACCOUNT_GUIDE.md +0 -21
package/articles/HN_CHINESE_STYLE.md +0 -308
package/articles/HN_FINAL.md +0 -148
package/articles/HN_POSTED_VERSION.md +0 -56
package/articles/HN_POST_READY.md +0 -137
package/articles/HN_RESEARCH.md +0 -364
package/articles/HN_SHOW_routerarena.md +0 -17
package/articles/HN_TIMING_GUIDE.md +0 -52
package/articles/INDIEHACKERS_POST.md +0 -52
package/articles/INDIEHACKERS_READY.md +0 -120
package/articles/LLM_BENCHMARK_DEEP_DIVE.md +0 -153
package/articles/MASTER_POSTING_DIRECTORY.md +0 -189
package/articles/NEWSLETTER_SEND_NOW.md +0 -259
package/articles/NEWSLETTER_SUBMISSIONS.md +0 -112
package/articles/PAIN-DRIVEN-devto-v2.md +0 -308
package/articles/PAIN-DRIVEN-devto-v3.md +0 -268
package/articles/PAIN-DRIVEN-devto.md +0 -242
package/articles/PAIN-DRIVEN-hackernews-v2.md +0 -138
package/articles/PAIN-DRIVEN-hackernews-v3.md +0 -151
package/articles/PAIN-DRIVEN-hackernews.md +0 -131
package/articles/PAIN-DRIVEN-reddit-v2.md +0 -301
package/articles/PAIN-DRIVEN-reddit-v3.md +0 -236
package/articles/PAIN-DRIVEN-reddit.md +0 -218
package/articles/PAIN-DRIVEN-twitter-v2.md +0 -110
package/articles/PAIN-DRIVEN-twitter-v3.md +0 -121
package/articles/PAIN-DRIVEN-twitter.md +0 -120
package/articles/PORTKEY_VS_A3M.md +0 -147
package/articles/POSTING_KIT_2026_05.md +0 -67
package/articles/PRESS_KIT_routerarena.md +0 -77
package/articles/PRODUCTHUNT_LISTING.md +0 -48
package/articles/PRODUCTHUNT_READY.md +0 -106
package/articles/PR_PLAN_vault.md +0 -125
package/articles/REDDIT_FINAL.md +0 -232
package/articles/REDDIT_POST.md +0 -67
package/articles/REDDIT_SUBMISSION_READY.md +0 -348
package/articles/ROUTERARENA_LEADER.md +0 -45
package/articles/SHOW_HN_FINAL.md +0 -29
package/articles/TWEETS_10K_DOWNLOADS.md +0 -47
package/articles/TWEETS_BENCHMARK_FIRST.md +0 -46
package/articles/TWEETS_MCP_PLAY.md +0 -51
package/articles/TWEETS_SEQUENTIAL_BROKEN.md +0 -49
package/articles/TWEETS_WHY_BUILD.md +0 -54
package/articles/TWEETS_routerarena_leader.md +0 -53
package/articles/TWEET_STORM_READY.md +0 -165
package/articles/TWITTER_FINAL.md +0 -167
package/articles/WHY_10X_BETTER.md +0 -261
package/articles/WHY_CHINESE_STYLE_BETTER.md +0 -323
package/articles/ai-discoverability-llm-routing.md +0 -210
package/articles/devto-llm-routing.md +0 -138
package/articles/hackernews-show-hn.md +0 -54
package/articles/hashnode-llm-cost-optimization.md +0 -125
package/articles/hn_show_2026_05.md +0 -11
package/articles/medium-building-llm-router.md +0 -205
package/articles/reddit-ml.md +0 -76
package/articles/twitter-thread-cost-savings.md +0 -50
package/articles/youtube-tutorial-script.md +0 -262
package/assets/a3m_3blue1brown.mp4 +0 -0
package/assets/banner.svg +0 -109
package/assets/chart-cost-v2.svg +0 -91
package/assets/chart-cost-v3.svg +0 -143
package/assets/chart-features-v2.svg +0 -132
package/assets/chart-features-v3.svg +0 -211
package/assets/chart-growth-v2.svg +0 -122
package/assets/chart-growth-v3.svg +0 -189
package/assets/cost-comparison.svg +0 -134
package/assets/cost-simple.svg +0 -64
package/assets/demo-hn.gif +0 -0
package/assets/feature-matrix.svg +0 -136
package/assets/growth-chart-animated.svg +0 -76
package/assets/growth-chart.svg +0 -82
package/assets/growth-simple.svg +0 -69
package/assets/hero-diagram.svg +0 -81
package/assets/logo-new.svg +0 -21
package/assets/logo.svg +0 -68
package/assets/provider-comparison.svg +0 -121
package/assets/social-preview-new.svg +0 -100
package/assets/social-preview.svg +0 -194
package/assets/social-v2.svg +0 -130
package/assets/social-v3.svg +0 -212
package/benchmark-provider-results.json +0 -245
package/benchmark-results.json +0 -54
package/council-votes/architecture-vote.md +0 -121
package/council-votes/coverage-vote.md +0 -93
package/data/adaptive-benchmark.json +0 -92
package/data/benchmark-results.json +0 -47
package/data/labeled-benchmark.json +0 -88
package/demo/3blue1brown_video.py +0 -285
package/demo/3blue1brown_video_v2.py +0 -310
package/demo/IMPROVED_PROMPTS.md +0 -229
package/demo/VEO3_PROMPTS.md +0 -269
package/demo/VIDEO_PRODUCTION_GUIDE.md +0 -333
package/demo/a3m_3blue1brown.mp4 +0 -0
package/demo/asciinema-demo.sh +0 -195
package/demo/demo-hn.tape +0 -74
package/demo/demo-script.md +0 -53
package/demo/demo-script.sh +0 -62
package/demo/demo.svg +0 -75
package/demo/frame1_ai_data_center.png +0 -0
package/demo/frame1_sunset_video.mp4 +0 -0
package/demo/frame2_cost_comparison.png +0 -0
package/demo/frame2_cost_comparison_fallback.png +0 -0
package/demo/frame3_parallel_execution.png +0 -0
package/demo/frame3_parallel_execution_fallback.png +0 -0
package/demo/frame4_providers.png +0 -0
package/demo/frame4_providers_fallback.png +0 -0
package/demo/frame5_endcard.png +0 -0
package/demo/frame5_endcard_fallback.png +0 -0
package/demo/new_frame1_hook.png +0 -0
package/demo/new_frame2_proof.png +0 -0
package/demo/new_frame3_wow.png +0 -0
package/demo/new_frame4_social.png +0 -0
package/demo/new_frame5_cta.png +0 -0
package/demo/package.json +0 -13
package/demo/product-video-final.mp4 +0 -0
package/demo/product-video-hype-v1.mp4 +0 -0
package/demo/product-video-v1.mp4 +0 -0
package/demo/public/index.html +0 -762
package/demo/recording.cast +0 -55
package/demo/server.js +0 -405
package/demo-new.tape +0 -71
package/demo-real.sh +0 -198
package/demo-simple.tape +0 -205
package/demo.html +0 -520
package/demo.sh +0 -85
package/demo.tape +0 -259
package/dist/analytics/costAnalytics.d.ts.map +0 -1
package/dist/analytics/costAnalytics.js.map +0 -1
package/dist/benchmark/comprehensive.js.map +0 -1
package/dist/benchmark/reproducible.d.ts.map +0 -1
package/dist/benchmark/reproducible.js.map +0 -1
package/dist/cache/prefixCache.d.ts.map +0 -1
package/dist/cache/prefixCache.js.map +0 -1
package/dist/cache/responseCache.d.ts.map +0 -1
package/dist/cache/responseCache.js.map +0 -1
package/dist/cache/semanticCache.d.ts.map +0 -1
package/dist/cache/semanticCache.js.map +0 -1
package/dist/cli/setupWizard.d.ts.map +0 -1
package/dist/cli/setupWizard.js.map +0 -1
package/dist/cost/budgetEnforcer.d.ts.map +0 -1
package/dist/cost/budgetEnforcer.js.map +0 -1
package/dist/cost/costTracker.d.ts.map +0 -1
package/dist/cost/costTracker.js.map +0 -1
package/dist/ensemble/multiRoundDialog.js.map +0 -1
package/dist/ensemble/shapleyValue.js.map +0 -1
package/dist/integrations/langchainAdapter.d.ts.map +0 -1
package/dist/integrations/langchainAdapter.js.map +0 -1
package/dist/integrations/oauth.d.ts.map +0 -1
package/dist/integrations/oauth.js.map +0 -1
package/dist/integrations/scienceAdapter.js.map +0 -1
package/dist/memory/autoFetch.d.ts.map +0 -1
package/dist/memory/autoFetch.js.map +0 -1
package/dist/memory/episodicMemory.d.ts.map +0 -1
package/dist/memory/episodicMemory.js.map +0 -1
package/dist/memory/memoryTree.d.ts.map +0 -1
package/dist/memory/memoryTree.js.map +0 -1
package/dist/memory/obsidianVault.d.ts.map +0 -1
package/dist/memory/obsidianVault.js.map +0 -1
package/dist/observability/changeWatch.d.ts.map +0 -1
package/dist/observability/changeWatch.js.map +0 -1
package/dist/observability/fatigueDetector.d.ts.map +0 -1
package/dist/observability/fatigueDetector.js.map +0 -1
package/dist/observability/index.d.ts.map +0 -1
package/dist/observability/index.js.map +0 -1
package/dist/observability/metrics.d.ts.map +0 -1
package/dist/observability/metrics.js.map +0 -1
package/dist/observability/middleware.d.ts.map +0 -1
package/dist/observability/middleware.js.map +0 -1
package/dist/observability/tracer.d.ts.map +0 -1
package/dist/observability/tracer.js.map +0 -1
package/dist/observability/types.d.ts.map +0 -1
package/dist/observability/types.js.map +0 -1
package/dist/orchestration/haloOrchestrator.d.ts.map +0 -1
package/dist/orchestration/haloOrchestrator.js.map +0 -1
package/dist/orchestration/mctsWorkflow.d.ts.map +0 -1
package/dist/orchestration/mctsWorkflow.js.map +0 -1
package/dist/providers/localProvider.d.ts.map +0 -1
package/dist/providers/localProvider.js.map +0 -1
package/dist/providers/providerConfig.d.ts.map +0 -1
package/dist/providers/providerConfig.js.map +0 -1
package/dist/providers/registry.d.ts.map +0 -1
package/dist/providers/registry.js.map +0 -1
package/dist/routing/advancedRouter.d.ts.map +0 -1
package/dist/routing/advancedRouter.js.map +0 -1
package/dist/routing/crossModelValidation.d.ts.map +0 -1
package/dist/routing/crossModelValidation.js.map +0 -1
package/dist/routing/providerHealth.d.ts.map +0 -1
package/dist/routing/providerHealth.js.map +0 -1
package/dist/routing/providerRetry.d.ts.map +0 -1
package/dist/routing/providerRetry.js.map +0 -1
package/dist/scripts/banner.js +0 -29
package/dist/security/guardrails.d.ts.map +0 -1
package/dist/security/guardrails.js.map +0 -1
package/dist/server/dashboard.d.ts.map +0 -1
package/dist/server/dashboard.js.map +0 -1
package/dist/server/modelMapper.d.ts.map +0 -1
package/dist/server/modelMapper.js.map +0 -1
package/dist/server/proxyServer.d.ts.map +0 -1
package/dist/server/proxyServer.js.map +0 -1
package/dist/skills/__tests__/skill_manager.test.d.ts +0 -2
package/dist/skills/__tests__/skill_manager.test.d.ts.map +0 -1
package/dist/skills/__tests__/skill_manager.test.js +0 -268
package/dist/skills/__tests__/skill_manager.test.js.map +0 -1
package/dist/tools/tmlpdTools.d.ts.map +0 -1
package/dist/tools/tmlpdTools.js.map +0 -1
package/dist/tui/dashboard.d.ts.map +0 -1
package/dist/tui/dashboard.js.map +0 -1
package/dist/tui/index.d.ts.map +0 -1
package/dist/tui/index.js.map +0 -1
package/dist/utils/batchProcessor.d.ts.map +0 -1
package/dist/utils/batchProcessor.js.map +0 -1
package/dist/utils/compression.d.ts.map +0 -1
package/dist/utils/compression.js.map +0 -1
package/dist/utils/costUtils.d.ts.map +0 -1
package/dist/utils/costUtils.js.map +0 -1
package/dist/utils/reliability.d.ts.map +0 -1
package/dist/utils/reliability.js.map +0 -1
package/dist/utils/sorting.d.ts.map +0 -1
package/dist/utils/sorting.js.map +0 -1
package/dist/utils/speculativeDecoding.d.ts.map +0 -1
package/dist/utils/speculativeDecoding.js.map +0 -1
package/dist/utils/tokenUtils.d.ts.map +0 -1
package/dist/utils/tokenUtils.js.map +0 -1
package/docs/.nojekyll +0 -0
package/docs/ANALYSIS_PRINCIPLES.md +0 -162
package/docs/API.md +0 -855
package/docs/ARCHITECTURAL-IMPROVEMENTS-2025.md +0 -1391
package/docs/ARCHITECTURAL-IMPROVEMENTS-REVISED-2025.md +0 -1051
package/docs/BENCHMARK.md +0 -170
package/docs/CHINESE_PROVIDER_RELIABILITY.md +0 -37
package/docs/CITATIONS.md +0 -74
package/docs/CLAIMS_AND_EVIDENCE.md +0 -58
package/docs/CONFIGURATION.md +0 -476
package/docs/COUNCIL_DECISION.json +0 -816
package/docs/COUNCIL_SUMMARY.md +0 -319
package/docs/COUNCIL_V2.2_DECISION.md +0 -416
package/docs/ENGINEERING_SPEC.md +0 -55
package/docs/FACTORY_RESET.md +0 -34
package/docs/GEO.md +0 -66
package/docs/GEO_OPTIMIZATION.md +0 -30
package/docs/GEO_ROOT_CAUSE.md +0 -136
package/docs/GEO_STATUS.md +0 -85
package/docs/GEO_TEST_RESULTS.md +0 -176
package/docs/HN_CHECKLIST.md +0 -38
package/docs/HN_FOUNDER_COMMENT.md +0 -17
package/docs/HN_SUBMISSION_FINAL.md +0 -180
package/docs/HN_SUBMISSION_V3.md +0 -56
package/docs/IMPROVEMENT_ROADMAP.md +0 -515
package/docs/INTEGRATIONS.md +0 -420
package/docs/LANGCHAIN_INTEGRATION.md +0 -147
package/docs/LLM_COUNCIL_DECISION.md +0 -508
package/docs/MIDDLEWARE_CHAIN.md +0 -35
package/docs/PROMO_CHECKLIST.md +0 -200
package/docs/QUICKSTART.md +0 -271
package/docs/QUICK_START.md +0 -43
package/docs/QUICK_START_VISIBILITY.md +0 -782
package/docs/REDDIT_GAP_ANALYSIS.md +0 -299
package/docs/RELEASE_CHECKLIST.md +0 -32
package/docs/REPRODUCIBILITY.md +0 -63
package/docs/RESEARCH_BACKED_IMPROVEMENTS.md +0 -1180
package/docs/ROUTING_RUBRIC.md +0 -197
package/docs/SEO_AUDIT.md +0 -186
package/docs/SOCIAL_LISTENING.md +0 -219
package/docs/TMLPD_QNA.md +0 -751
package/docs/TMLPD_V2.1_COMPLETE.md +0 -763
package/docs/TMLPD_V2.2_RESEARCH_ROADMAP.md +0 -754
package/docs/UPDATE_TOPICS.md +0 -15
package/docs/USE_CASES.md +0 -59
package/docs/V2.2_IMPLEMENTATION_COMPLETE.md +0 -446
package/docs/V2_IMPLEMENTATION_GUIDE.md +0 -388
package/docs/VERCEL_AI_SDK.md +0 -209
package/docs/VISIBILITY_ADOPTION_PLAN.md +0 -1005
package/docs/_config.yml +0 -49
package/docs/ai-plugin.json +0 -16
package/docs/api.html +0 -513
package/docs/architecture-diagram.md +0 -40
package/docs/benchmark-chart.png +0 -0
package/docs/benchmark.html +0 -387
package/docs/blog/routerarena-number-one.html +0 -73
package/docs/cli-cheatsheet.md +0 -339
package/docs/compare.md +0 -109
package/docs/comparison-litellm.md +0 -88
package/docs/comparison.md +0 -108
package/docs/cost-chart-ascii.md +0 -42
package/docs/cost-comparison-chart.svg +0 -88
package/docs/curl-examples.md +0 -247
package/docs/demo-auto.html +0 -264
package/docs/demo.html +0 -416
package/docs/geo/GENERATIVE_ENGINE_OPTIMIZATION.md +0 -232
package/docs/index.html +0 -507
package/docs/launch-content/LAUNCH_EXECUTION_CHECKLIST.md +0 -421
package/docs/launch-content/README.md +0 -457
package/docs/launch-content/assets/cost_comparison_100_tasks.png +0 -0
package/docs/launch-content/assets/cumulative_savings.png +0 -0
package/docs/launch-content/assets/parallel_speedup.png +0 -0
package/docs/launch-content/assets/provider_pricing_comparison.png +0 -0
package/docs/launch-content/assets/task_breakdown_comparison.png +0 -0
package/docs/launch-content/generate_charts.py +0 -313
package/docs/launch-content/hn_show_post.md +0 -139
package/docs/launch-content/partner_outreach_templates.md +0 -745
package/docs/launch-content/reddit_posts.md +0 -467
package/docs/launch-content/twitter_thread.txt +0 -460
package/docs/npm-downloads-chart.svg +0 -43
package/docs/openapi.json +0 -139
package/docs/openapi.yaml +0 -1318
package/docs/quick-start.html +0 -366
package/docs/robots.txt +0 -52
package/docs/sitemap.xml +0 -57
package/docs/styles.css +0 -682
package/docs/well-known/ai-plugin.json +0 -16
package/docs/wellknown/ai-plugin.json +0 -16
package/docs-site/assets/og-banner.svg +0 -194
package/docs-site/index.html +0 -632
package/eval/README.md +0 -46
package/eval/baselines/main.json +0 -12
package/eval/benchmark_dataset.jsonl +0 -16
package/eval/check_golden_routes.js +0 -64
package/eval/datasets/catalog.json +0 -33
package/eval/datasets/slices/cn_provider_reliability_v1.jsonl +0 -3
package/eval/datasets/slices/cost_pressure_v1.jsonl +0 -3
package/eval/datasets/slices/safety_guardrails_v1.jsonl +0 -3
package/eval/evals.json +0 -199
package/eval/fault_injection_thresholds.json +0 -3
package/eval/generate_report.js +0 -128
package/eval/golden_routes.json +0 -114
package/eval/lib/experiment_registry.js +0 -24
package/eval/run_eval.js +0 -197
package/eval/run_fault_injection.js +0 -201
package/eval/run_shadow_eval.js +0 -85
package/eval/thresholds.json +0 -9
package/examples/QUICKSTART.md +0 -183
package/examples/README.md +0 -61
package/examples/a3m-sdk.js +0 -124
package/examples/basic-route.js +0 -54
package/examples/chat-loop.js +0 -202
package/examples/classify-then-route.js +0 -102
package/examples/cost-compare.js +0 -120
package/examples/ensemble.js +0 -160
package/examples/whatsapp-telegram-bridge-demo.js +0 -302
package/examples/whatsapp-telegram-bridge.js +0 -269
package/hf-space/README.md +0 -23
package/hf-space/app.py +0 -240
package/hf-space/requirements.txt +0 -1
package/huggingface_space/README.md +0 -35
package/huggingface_space/app.py +0 -126
package/huggingface_space/create_space.py +0 -208
package/huggingface_space/requirements.txt +0 -1
package/mcp-server/README.md +0 -188
package/mcp-server/package.json +0 -29
package/mcp-server/src/index.ts +0 -744
package/mcp-server/tsconfig.json +0 -19
package/openclaw-alexa-bridge/ALL_REMAINING_FIXES_PLAN.md +0 -313
package/openclaw-alexa-bridge/REMAINING_FIXES_SUMMARY.md +0 -277
package/openclaw-alexa-bridge/src/alexa_handler_no_tmlpd.js +0 -1234
package/openclaw-alexa-bridge/test_fixes.js +0 -77
package/playground/README.md +0 -51
package/playground/codesandbox.json +0 -12
package/playground/index.js +0 -39
package/proxy/README.md +0 -227
package/proxy/package-lock.json +0 -831
package/proxy/package.json +0 -17
package/proxy/rate-limit.js +0 -145
package/proxy/rate-limit.test.js +0 -311
package/proxy/server.js +0 -970
package/python/README.md +0 -102
package/python/a3m/__init__.py +0 -6
package/python/a3m/client.py +0 -190
package/python/a3m/models.py +0 -40
package/python/a3m/sync_client.py +0 -61
package/python/examples.py +0 -53
package/python/integrations.py +0 -330
package/python/pyproject.toml +0 -23
package/python/setup.py +0 -28
package/python/tmlpd.py +0 -369
package/qna/REDDIT_GAP_ANALYSIS.md +0 -299
package/qna/TMLPD_QNA.md +0 -751
package/research/FINDING_001_safety.md +0 -28
package/research/FINDING_002_error_diversity.md +0 -32
package/research/FINDING_003_confidence_weighted_voting.md +0 -32
package/research/FINDING_004_cross_model_semantic_detection.md +0 -37
package/research/FINDING_005_knowledge_gap_orthogonality.md +0 -34
package/research/HALLUCINATION_RESEARCH.md +0 -27
package/research/ensemble-voting.md +0 -324
package/research/loss-functions.md +0 -545
package/research-log.md +0 -49
package/scripts/banner.js +0 -29
package/scripts/benchmark-local-routerarena.ts +0 -176
package/scripts/benchmark.js +0 -145
package/scripts/benchmark.sh +0 -61
package/scripts/compare-providers.sh +0 -230
package/scripts/content-planner.js +0 -25
package/scripts/create-labeled-benchmark.ts +0 -105
package/scripts/cross_post.py +0 -443
package/scripts/local-router-benchmark.ts +0 -154
package/scripts/post-all.sh +0 -41
package/scripts/publish_fcc.py +0 -106
package/scripts/push-to-gitee.sh +0 -25
package/scripts/routerarena_ensemble.js +0 -144
package/scripts/routing-benchmark-v2.js +0 -373
package/scripts/routing-benchmark-v3.js +0 -118
package/scripts/routing-benchmark.js +0 -462
package/scripts/run-labeled-benchmark.mjs +0 -104
package/scripts/run-mmlu-benchmark.js +0 -176
package/scripts/run-provider-benchmark.js +0 -244
package/scripts/update-npm-badges.js +0 -158
package/skill/SKILL.md +0 -238
package/src/__tests__/integration/tmpld_integration.test.py +0 -540
package/src/skills/__tests__/skill_manager.test.ts +0 -328
package/submissions/benchmarks/ALL_PLATFORMS_SUBMISSION.md +0 -94
package/submissions/benchmarks/LLMROUTERBENCH_SUBMISSION.md +0 -121
package/submissions/benchmarks/MMRBENCH_SUBMISSION.md +0 -94
package/submissions/benchmarks/ROUTERARENA_UPDATE.md +0 -83
package/submissions/benchmarks/ROUTERBENCH_SUBMISSION.md +0 -225
package/test-council/1-structure-tests.test.js +0 -353
package/test-council/1-structure-tests.test.ts +0 -353
package/test-council/2-edge-case-tests.test.ts +0 -361
package/test-council/3-performance-tests.test.ts +0 -669
package/test-council/4-integration-tests.test.ts +0 -391
package/test-council/5-agent-council-eval.test.ts +0 -413
package/test-council/AGENT_COUNCIL_ARCHITECTURE.md +0 -349
package/test-council/TEST_COUNCIL_REPORT.md +0 -201
package/test-council/agents/edge-case-agent.ts +0 -363
package/test-council/agents/performance-agent.ts +0 -426
package/test-council/agents/structure-agent.ts +0 -227
package/test-council/council.md +0 -183
package/tests/__mocks__/tokenUtils.ts +0 -8
package/tests/memory/episodicMemory.test.ts +0 -227
package/tests/package-lock.json +0 -1628
package/tests/package.json +0 -18
package/tests/routing/ensembleVoting.test.ts +0 -236
package/tests/routing/providerRetry.test.ts +0 -360
package/tests/routing/queryTypePresets.test.ts +0 -208
package/tests/security/guardrailEngine.test.ts +0 -700
package/tests/tsconfig.json +0 -21
package/tests/vitest.config.ts +0 -18
package/tmlpd-pi-extension/README.md +0 -66
package/tmlpd-pi-extension/dist/cache/prefixCache.d.ts +0 -114
package/tmlpd-pi-extension/dist/cache/prefixCache.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/cache/prefixCache.js +0 -285
package/tmlpd-pi-extension/dist/cache/prefixCache.js.map +0 -1
package/tmlpd-pi-extension/dist/cache/responseCache.d.ts +0 -58
package/tmlpd-pi-extension/dist/cache/responseCache.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/cache/responseCache.js +0 -153
package/tmlpd-pi-extension/dist/cache/responseCache.js.map +0 -1
package/tmlpd-pi-extension/dist/cli.js +0 -59
package/tmlpd-pi-extension/dist/cost/costTracker.d.ts +0 -95
package/tmlpd-pi-extension/dist/cost/costTracker.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/cost/costTracker.js +0 -240
package/tmlpd-pi-extension/dist/cost/costTracker.js.map +0 -1
package/tmlpd-pi-extension/dist/index.d.ts +0 -723
package/tmlpd-pi-extension/dist/index.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/index.js +0 -239
package/tmlpd-pi-extension/dist/index.js.map +0 -1
package/tmlpd-pi-extension/dist/memory/episodicMemory.d.ts +0 -82
package/tmlpd-pi-extension/dist/memory/episodicMemory.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/memory/episodicMemory.js +0 -145
package/tmlpd-pi-extension/dist/memory/episodicMemory.js.map +0 -1
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.d.ts +0 -102
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.js +0 -207
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.js.map +0 -1
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.d.ts +0 -85
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.js +0 -210
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.js.map +0 -1
package/tmlpd-pi-extension/dist/providers/localProvider.d.ts +0 -102
package/tmlpd-pi-extension/dist/providers/localProvider.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/providers/localProvider.js +0 -338
package/tmlpd-pi-extension/dist/providers/localProvider.js.map +0 -1
package/tmlpd-pi-extension/dist/providers/registry.d.ts +0 -55
package/tmlpd-pi-extension/dist/providers/registry.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/providers/registry.js +0 -138
package/tmlpd-pi-extension/dist/providers/registry.js.map +0 -1
package/tmlpd-pi-extension/dist/routing/advancedRouter.d.ts +0 -68
package/tmlpd-pi-extension/dist/routing/advancedRouter.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/routing/advancedRouter.js +0 -332
package/tmlpd-pi-extension/dist/routing/advancedRouter.js.map +0 -1
package/tmlpd-pi-extension/dist/tools/tmlpdTools.d.ts +0 -101
package/tmlpd-pi-extension/dist/tools/tmlpdTools.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/tools/tmlpdTools.js +0 -368
package/tmlpd-pi-extension/dist/tools/tmlpdTools.js.map +0 -1
package/tmlpd-pi-extension/dist/utils/batchProcessor.d.ts +0 -96
package/tmlpd-pi-extension/dist/utils/batchProcessor.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/utils/batchProcessor.js +0 -170
package/tmlpd-pi-extension/dist/utils/batchProcessor.js.map +0 -1
package/tmlpd-pi-extension/dist/utils/compression.d.ts +0 -61
package/tmlpd-pi-extension/dist/utils/compression.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/utils/compression.js +0 -281
package/tmlpd-pi-extension/dist/utils/compression.js.map +0 -1
package/tmlpd-pi-extension/dist/utils/reliability.d.ts +0 -74
package/tmlpd-pi-extension/dist/utils/reliability.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/utils/reliability.js +0 -177
package/tmlpd-pi-extension/dist/utils/reliability.js.map +0 -1
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts +0 -117
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js +0 -246
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js.map +0 -1
package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts +0 -50
package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts.map +0 -1
package/tmlpd-pi-extension/dist/utils/tokenUtils.js +0 -124
package/tmlpd-pi-extension/dist/utils/tokenUtils.js.map +0 -1
package/tmlpd-pi-extension/examples/QUICKSTART.md +0 -183
package/tmlpd-pi-extension/package-lock.json +0 -79
package/tmlpd-pi-extension/package.json +0 -172
package/tmlpd-pi-extension/python/examples.py +0 -53
package/tmlpd-pi-extension/python/integrations.py +0 -330
package/tmlpd-pi-extension/python/setup.py +0 -28
package/tmlpd-pi-extension/python/tmlpd.py +0 -369
package/tmlpd-pi-extension/qna/REDDIT_GAP_ANALYSIS.md +0 -299
package/tmlpd-pi-extension/qna/TMLPD_QNA.md +0 -751
package/tmlpd-pi-extension/skill/SKILL.md +0 -238
package/tmlpd-pi-extension/src/cache/responseCache.ts +0 -147
package/tmlpd-pi-extension/src/cost/costTracker.ts +0 -302
package/tmlpd-pi-extension/src/index.ts +0 -232
package/tmlpd-pi-extension/src/memory/episodicMemory.ts +0 -257
package/tmlpd-pi-extension/src/orchestration/haloOrchestrator.ts +0 -266
package/tmlpd-pi-extension/src/orchestration/mctsWorkflow.ts +0 -262
package/tmlpd-pi-extension/src/providers/localProvider.ts +0 -406
package/tmlpd-pi-extension/src/providers/registry.ts +0 -164
package/tmlpd-pi-extension/src/routing/ensembleVoting.ts +0 -159
package/tmlpd-pi-extension/src/routing/queryTypePresets.ts +0 -136
package/tmlpd-pi-extension/src/tools/tmlpdTools.ts +0 -433
package/tmlpd-pi-extension/src/utils/batchProcessor.ts +0 -232
package/tmlpd-pi-extension/src/utils/compression.ts +0 -325
package/tmlpd-pi-extension/src/utils/reliability.ts +0 -221
package/tmlpd-pi-extension/src/utils/tokenUtils.ts +0 -145
package/tmlpd-pi-extension/tsconfig.json +0 -18
package/tsconfig.build.json +0 -29
package/tsconfig.json +0 -18
/package/{docs/llms-full.txt → llms-full.txt.bak} +0 -0

package/articles/NEWSLETTER_SUBMISSIONS.md DELETED Viewed

@@ -1,112 +0,0 @@
-# Newsletter Submissions
-## 6 Target Newsletters
-### 1. Import AI (jack@sequoiacap.com)
-**Audience:** AI researchers, builders
-**Frequency:** Weekly
-**Submission:** Email to jack@sequoiacap.com
-### 2. The Batch (Anthropic)
-**URL:** https://www.anthropic.com/news (press@anthropic.com)
-### 3. OpenAI Newsletter
-**URL:** https://openai.com/newsletter
-### 4. DeepLearning.ai Newsletter
-**URL:** https://www.deeplearning.ai/newsletter/
-### 5. Lil'Log (Lilian Weng)
-**URL:** https://lilianweng.github.io/ (lilian@openai.com)
-### 6. The Economist AI
-**URL:** https://www.economist.com/newsletters/ai
----
-## Email Template for Import AI
-```
-Subject: A3M Router — #1 LLM routing benchmark, 213× cheaper than GPT-5
-Hi Jack,
-I wanted to share A3M Router, an open-source project that might interest your readers.
-**The Pitch:**
-Most teams send every AI query to GPT-4o, paying $10-60 per 1K tokens. A3M Router
-intelligently routes queries to the cheapest capable model, achieving:
-- **#1 on RouterArena** (70.32 score, arXiv:2510.00202) — beating 18 other routers
-- **$0.047/1K queries** — 213× cheaper than GPT-5
-- **<1ms routing** — no GPU required, rule-based heuristics
-- **47+ providers** — Groq, DeepSeek, Mistral, Claude Haiku, etc.
-**How it works:**
-A3M analyzes 12 keyword signals across 5 dimensions (domain, complexity, intent,
-length, structure) to instantly route queries to the optimal provider.
-For example:
-- "Hi" → Groq (free tier)
-- "Debug my Python code" → DeepSeek ($0.0003/query)
-- "Explain quantum entanglement" → GPT-4o mini ($0.0015/query)
-**Benchmark results:**
-| Router | Score | Cost/1K |
-|--------|-------|----------|
-| A3M Router | 70.32 | $0.047 |
-| Sqwish | 75.27 | $0.18 |
-| GPT-5 | 64.32 | $10.02 |
-**Demo:** https://asciinema.org/a/RpqOZM9tFMALYWvs
-**GitHub:** https://github.com/Das-rebel/a3m-router
-**npm:** https://www.npmjs.com/package/adaptive-memory-multi-model-router
-Happy to chat more or provide a more detailed technical breakdown.
-Best,
-Subho Das
-Das-rebel
-```
----
-## Generic Newsletter Pitch
-```
-Subject: [Tool] A3M Router — Open-source LLM routing, #1 on RouterArena
-Hi,
-I built A3M Router, an open-source LLM gateway that automatically routes queries
-to the cheapest capable model.
-**Quick facts:**
-- Ranks #1 on RouterArena (70.32 score, beating GPT-5 at 64.32)
-- Costs $0.047/1K queries (vs GPT-5's $10.02)
-- Routes in <1ms with no ML training required
-- Supports 47+ providers with automatic failover
-**One-liner:** Think of it as "CI/CD for AI spend" — automatically route
-every query to the right model at the right price.
-**Demo:** https://asciinema.org/a/RpqOZM9tFMALYWvs
-**GitHub:** https://github.com/Das-rebel/a3m-router
-Would love to be included in your next issue if it's a good fit.
-Thanks!
-```
----
-## Submission Checklist
-- [ ] Import AI: Email jack@sequoiacap.com
-- [ ] The Batch: Submit at anthropic.com/news
-- [ ] OpenAI Newsletter: Subscribe + check submission page
-- [ ] DeepLearning.ai: Submit at deeplearning.ai/newsletter
-- [ ] Lil'Log: Email or Twitter DM @lilianweng
-- [ ] The Economist: Submit via website form
-**Tip:** Submit to Import AI first — most likely to cover indie projects.

package/articles/PAIN-DRIVEN-devto-v2.md DELETED Viewed

@@ -1,308 +0,0 @@
----
-title: "We Were Overpaying by 70% on LLM APIs (Until We Discovered GLM & MiniMax)"
-published: true
-description: "Our OpenAI bill hit $2,400/month. Switching to GLM-4 and MiniMax cut it to $720 with 2x speed improvement. Here's the routing strategy."
-tags: llm, ai, cost-optimization, javascript, glm, minimax, openai-alternative
----
-# We Were Overpaying by 70% on LLM APIs (Until We Discovered GLM & MiniMax)
-Last month, our startup's LLM bill hit **$2,400**.
-We're 5 people. 1,000 queries/day. Customer support, code generation, text summarization. Basic stuff.
-I assumed we needed GPT-4 for everything. I was wrong.
-## The Problem: Defaulting to OpenAI
-Like most developers, we reached for OpenAI by default:
-```javascript
-// Every query → OpenAI GPT-4
-await openai.chat.completions.create({
-  model: "gpt-4",
-  messages: [{ role: "user", content: "What is 2+2?" }]
-});
-// Cost: $0.03, Latency: 800ms
-await openai.chat.completions.create({
-  model: "gpt-4",
-  messages: [{ role: "user", content: "Summarize this email" }]
-});
-// Cost: $0.02, Latency: 1.2s
-await openai.chat.completions.create({
-  model: "gpt-4",
-  messages: [{ role: "user", content: "Write Python to reverse a string" }]
-});
-// Cost: $0.05, Latency: 2.1s
-```
-**1,000 queries × $0.03 average = $30/day = $900/month minimum.**
-But we were hitting $2,400. Why?
-- Simple Q&A that GLM-4 could handle for 1/10th the price? GPT-4.
-- Code generation where MiniMax is 3x faster? GPT-4.
-- Tasks where Cerebras responds in 350ms? GPT-4 at 2,100ms.
-We were paying premium Western prices when Chinese providers offer better value.
-## The Discovery: GLM-4 & MiniMax
-I started benchmarking alternatives:
-| Provider | Cost/1M tokens | Latency | Quality |
-|----------|---------------|---------|---------|
-| **OpenAI GPT-4** | $30.00 | 2,100ms | 95% |
-| **GLM-4 (Zhipu)** | $2.80 | 800ms | 92% |
-| **MiniMax** | $1.50 | 600ms | 89% |
-| **Cerebras** | $0.60 | 350ms | 82% |
-| **Groq** | $0.59 | 400ms | 82% |
-**GLM-4 is 10x cheaper than GPT-4 with 92% quality.**
-**MiniMax is 20x cheaper with 3x lower latency.**
-For our use case (customer support, code gen, summarization), this was a no-brainer.
-## The Breaking Point
-Our CFO's Slack message:
-> "AI costs are now 40% of infrastructure. We're spending $2,400/month on OpenAI alone. Find alternatives or cut usage by 50%."
-I analyzed our logs:
-- **34%** simple Q&A → GLM-4 handles this perfectly at 1/10th cost
-- **28%** code generation → MiniMax is faster AND cheaper
-- **22%** summarization → GLM-4 excels at this
-- **16%** complex reasoning → Keep GPT-4 for these
-**We were overpaying by 70% because we didn't route queries intelligently.**
-## The Solution: Smart Routing to GLM & MiniMax
-We built a router that analyzes each query and picks the optimal provider:
-```javascript
-const { routeQuery } = require('adaptive-memory-multi-model-router');
-// Simple Q&A → GLM-4 (10x cheaper, 92% quality)
-routeQuery("What is 2+2?");
-// → glm/glm-4 ($0.003 vs $0.03)
-// Code generation → MiniMax (3x faster, 20x cheaper)
-routeQuery("Write Python to reverse a string");
-// → minimax/minimax-m2.5 ($0.002 vs $0.05)
-// Speed-critical → Cerebras (6x faster)
-routeQuery("Quick API response needed");
-// → cerebras/llama3.1-8b (350ms vs 2,100ms)
-// Complex reasoning → Keep GPT-4
-routeQuery("Explain quantum entanglement with mathematical proofs");
-// → openai/gpt-4 (worth the premium)
-```
-## Provider Breakdown: When to Use What
-### GLM-4 (Zhipu AI) - The GPT-4 Alternative
-**Best for**: General Q&A, summarization, Chinese language tasks
-- **Cost**: $2.80/1M tokens (10x cheaper than GPT-4)
-- **Quality**: 92% of GPT-4 on standard benchmarks
-- **Latency**: 800ms (2.6x faster than GPT-4)
-- **Strengths**: Multilingual, reasoning, cost-effective
-**Our usage**: 34% of queries (simple Q&A, summarization)
-**Savings**: $306/month
-### MiniMax - The Speed Demon
-**Best for**: Code generation, real-time applications, high-volume processing
-- **Cost**: $1.50/1M tokens (20x cheaper than GPT-4)
-- **Quality**: 89% of GPT-4 (good enough for most tasks)
-- **Latency**: 600ms (3.5x faster than GPT-4)
-- **Strengths**: Speed, cost, code understanding
-**Our usage**: 28% of queries (code generation, quick responses)
-**Savings**: $1,372/month + 3x speed improvement
-### Cerebras - The Latency Killer
-**Best for**: Applications where every millisecond counts
-- **Cost**: $0.60/1M tokens (50x cheaper than GPT-4)
-- **Quality**: 82% of GPT-4
-- **Latency**: 350ms (6x faster than GPT-4)
-- **Strengths**: Ultra-low latency, cost-effective
-**Our usage**: 22% of queries (speed-critical tasks)
-**Savings**: $418/month + 6x speed improvement
-### Groq - The Balanced Option
-**Best for**: General-purpose fast inference
-- **Cost**: $0.59/1M tokens (50x cheaper than GPT-4)
-- **Quality**: 82% of GPT-4
-- **Latency**: 400ms (5x faster than GPT-4)
-- **Strengths**: Consistent performance, good for code
-**Our usage**: Fallback for code tasks
-## The Results: 70% Cost Reduction
-| Metric | Before (OpenAI Only) | After (Mixed Providers) | Change |
-|--------|----------------------|------------------------|--------|
-| **Monthly Cost** | $2,400 | $720 | **-70%** |
-| **Avg Cost/Query** | $0.03 | $0.009 | **-70%** |
-| **Response Time** | 2,100ms | 650ms | **-69%** |
-| **Quality Score** | 100% | 94% | **-6%** |
-**Trade-off: 6% quality reduction for 70% cost savings and 3x speed improvement.**
-Our CFO: "This is exactly what we needed. Can we optimize further?"
-## Real Query Routing Examples
-Here's what actually happened:
-**Customer Support Query**: "How do I reset my password?"
-- Before: GPT-4 ($0.03, 2.1s)
-- After: GLM-4 ($0.003, 0.8s)
-- **Savings: 90% cost, 62% faster**
-**Code Generation**: "Write a Python function to parse JSON"
-- Before: GPT-4 ($0.05, 2.1s)
-- After: MiniMax ($0.002, 0.6s)
-- **Savings: 96% cost, 71% faster**
-**Text Summarization**: "Summarize this 500-word article"
-- Before: GPT-4 ($0.02, 1.2s)
-- After: GLM-4 ($0.002, 0.8s)
-- **Savings: 90% cost, 33% faster**
-**Complex Analysis**: "Analyze this legal contract for risks"
-- Before: GPT-4 ($0.04, 2.1s)
-- After: GPT-4 ($0.04, 2.1s)
-- **Kept premium provider for complex tasks**
-## Why GLM-4 & MiniMax Are Game-Changers
-### GLM-4 (Zhipu AI)
-**What it is**: China's leading open-source LLM, GPT-4 class performance
-**Why it matters**: 10x cheaper than GPT-4 with 92% quality
-**Best for**:
-- General Q&A (any language)
-- Text summarization
-- Content generation
-- Tasks where "good enough" is fine
-**Real example**: Our customer support chatbot now uses GLM-4. Customers can't tell the difference, but our costs dropped 90% for these queries.
-### MiniMax
-**What it is**: High-performance Chinese LLM optimized for speed
-**Why it matters**: 20x cheaper than GPT-4, 3x faster
-**Best for**:
-- Code generation
-- Real-time applications
-- High-volume processing
-- Speed-critical tasks
-**Real example**: Our code suggestion feature now uses MiniMax. Developers get suggestions in 600ms instead of 2,100ms. They're happier AND we save 96% on costs.
-## The Implementation (10 Minutes)
-```bash
-npm install adaptive-memory-multi-model-router
-```
-```javascript
-const { createA3MRouter } = require('adaptive-memory-multi-model-router');
-const router = createA3MRouter();
-// Replace this:
-// const response = await openai.chat.completions.create({...});
-// With this:
-const route = await router.route(userQuery);
-const response = await callProvider(route.primary_model, userQuery);
-```
-**That's it.** No model retraining. No API changes. Just intelligent routing.
-## Try It Yourself
-```bash
-# See what you're currently overpaying for
-npx a3m-router route "Your most common query"
-# Compare GLM-4 vs GPT-4 for your use case
-npx a3m-router compare "Summarize this quarterly report"
-# Benchmark all providers including GLM & MiniMax
-npx a3m-router benchmark
-```
-## The Math for Different Volumes
-If you're using OpenAI for everything, here's what you could save:
-| Daily Queries | Current Cost (OpenAI) | Optimized Cost (GLM/MiniMax) | Monthly Savings |
-|---------------|----------------------|----------------------------|-----------------|
-| 500 | $450 | $135 | **$315** |
-| 1,000 | $900 | $270 | **$630** |
-| 5,000 | $4,500 | $1,350 | **$3,150** |
-| 10,000 | $9,000 | $2,700 | **$6,300** |
-**At 10,000 queries/day, you're leaving $6,300/month on the table.**
-## Addressing the Concerns
-### "But are GLM and MiniMax reliable?"
-We've been running them in production for 3 months:
-- **Uptime**: 99.7% (same as OpenAI)
-- **Quality**: 92-89% of GPT-4 (acceptable for our use case)
-- **Speed**: 3-6x faster than GPT-4
-- **Cost**: 10-20x cheaper
-### "What about data privacy?"
-- GLM-4: Data stays in China (consider for sensitive data)
-- MiniMax: Enterprise tier available with data residency options
-- **Solution**: Route sensitive queries to OpenAI or local Ollama
-### "Isn't switching providers complicated?"
-Not with intelligent routing:
-```javascript
-// One line handles provider selection
-const route = await router.route(query);
-// Automatically picks GLM, MiniMax, or OpenAI based on query
-```
-## The Bottom Line
-If your OpenAI bill is over $500/month, you're probably overpaying by 50-70%.
-**GLM-4 and MiniMax aren't just cheaper alternatives. They're often better for specific tasks:**
-- GLM-4: 10x cheaper, excellent for general tasks
-- MiniMax: 20x cheaper, 3x faster for code
-- Cerebras: 50x cheaper, 6x faster for speed-critical tasks
-**You don't need to abandon OpenAI. You need to use it strategically.**
-Route simple queries to GLM-4. Route code to MiniMax. Keep OpenAI for complex reasoning.
----
-**GitHub**: https://github.com/Das-rebel/a3m-router
-**NPM**: https://www.npmjs.com/package/adaptive-memory-multi-model-router
-**Try the playground**: https://codesandbox.io/p/sandbox/github/Das-rebel/a3m-router/tree/main/playground
-**Supported providers**: OpenAI, GLM-4, MiniMax, Cerebras, Groq, Mistral, Anthropic, Google, DeepSeek, CommandCode, OpenCode, Ollama
----
-*What's your current OpenAI spend? I'd bet GLM-4 or MiniMax could handle 50%+ of your queries at 1/10th the cost.*

package/articles/PAIN-DRIVEN-devto-v3.md DELETED Viewed

@@ -1,268 +0,0 @@
----
-title: "Our OpenAI Bill Was $2,400/Month (Then We Built a Router)"
-published: true
-description: "We were hemorrhaging money on LLM APIs. Built an intelligent router in Node.js that cuts costs by 70%. Open sourced it. 872 downloads in the first week."
-tags: javascript, nodejs, llm, ai, cost-optimization, npm, open-source
----
-# Our OpenAI Bill Was $2,400/Month (Then We Built a Router)
-Last month, our startup's OpenAI bill hit **$2,400**.
-Five people. One thousand queries per day. Customer support automation, some code generation, text summarization. Nothing exotic.
-I looked at the invoice and thought: *"We're using a Ferrari to buy groceries."*
-## The Problem: One Provider for Everything
-Like most teams, we defaulted to OpenAI for every single LLM call:
-```javascript
-// Simple customer question? GPT-4.
-// Code suggestion? GPT-4.
-// Text summary? GPT-4.
-// Everything? GPT-4.
-await openai.chat.completions.create({
-  model: "gpt-4",
-  messages: [{ role: "user", content: "How do I reset my password?" }]
-});
-// Cost: $0.03, Latency: 2.1 seconds
-```
-**The math:** 1,000 queries × $0.03 average = $30/day = **$900/month minimum**.
-We were hitting $2,400. Why? Because we treated every query the same.
-## The Realization: Not Every Query Needs a Ferrari
-I analyzed our logs. Here's what we actually needed:
-- **34%** were simple Q&A → Any decent model works
-- **28%** were code generation → Speed matters more than perfection
-- **22%** were summarization → Doesn't need GPT-4-level reasoning
-- **16%** actually needed high-quality reasoning
-**We were paying premium prices for 84% of queries that didn't need premium models.**
-Our CFO sent a Slack message that changed everything:
-> "AI costs are 40% of our infrastructure budget. Cut it 50% or we start removing features."
-## What We Built: A3M Router
-We needed something that would:
-1. Look at each query
-2. Figure out what it actually needs
-3. Route to the cheapest provider that can handle it
-4. Fall back automatically if something breaks
-So we built it. And open sourced it.
-```bash
-npm install adaptive-memory-multi-model-router
-```
-```javascript
-const { createA3MRouter } = require('adaptive-memory-multi-model-router');
-const router = createA3MRouter();
-// Simple question? Route to cheapest option
-const result = await router.route("How do I reset my password?");
-console.log(result.primary_model);  // Uses cheapest capable provider
-console.log(result.estimated_cost);   // $0.001 instead of $0.03
-// Code generation? Route to fast provider
-const code = await router.route("Write Python to reverse a string");
-// Routes to Groq/Cerebras (5x faster, 10x cheaper)
-// Complex reasoning? Keep the premium provider
-const complex = await router.route("Analyze this legal contract for risks");
-// Keeps GPT-4 because complexity demands it
-```
-## How It Actually Works
-**Step 1: Analyze the Query**
-The router looks at what you're asking:
-- Is it code? (function, class, import patterns)
-- Is it math? (equations, formulas)
-- Is it simple Q&A?
-- How complex is it?
-**Step 2: Check Provider Profiles**
-Every provider has a profile:
-- Cost per 1K tokens
-- Average latency
-- Quality scores
-- What they're good at
-**Step 3: Smart Selection**
-Simple query + low complexity = prioritize cost
-Complex query + needs reasoning = prioritize quality
-Code query = prioritize speed
-**Step 4: Execute + Track**
-Makes the call, tracks the cost, logs the performance. If it fails, automatically tries the next best option.
-## The Results (30 Days Later)
-| Metric | Before | After | Change |
-|--------|--------|-------|--------|
-| **Monthly Cost** | $2,400 | $720 | **-70%** |
-| **Avg Cost/Query** | $0.03 | $0.009 | **-70%** |
-| **Response Time** | 2.1s | 0.8s | **-62%** |
-| **Quality Score** | 100% | 94% | **-6%** |
-**Trade-off: 6% quality reduction for 70% cost savings and 2x speed improvement.**
-Our CFO: "This is exactly what we needed. Can we optimize further?"
-## Real Query Routing (What Actually Happened)
-**Customer Support: "How do I reset my password?"**
-- Before: GPT-4 ($0.03, 2.1s)
-- After: Cheapest capable provider ($0.001, 0.8s)
-- **Savings: 97% cost, 62% faster**
-**Code Generation: "Write a Python function to parse JSON"**
-- Before: GPT-4 ($0.05, 2.1s)
-- After: Fast provider like Groq/Cerebras ($0.0004, 0.4s)
-- **Savings: 99% cost, 5x faster**
-**Text Summarization: "Summarize this 500-word article"**
-- Before: GPT-4 ($0.02, 1.2s)
-- After: Efficient provider ($0.002, 0.6s)
-- **Savings: 90% cost, 2x faster**
-**Complex Analysis: "Analyze this legal contract for risks"**
-- Before: GPT-4 ($0.04, 2.1s)
-- After: GPT-4 ($0.04, 2.1s)
-- **Kept premium because complexity demands it**
-## What You Get
-**Out of the box:**
-- 12 LLM providers configured (Groq, Cerebras, Mistral, OpenAI, Anthropic, Google, DeepSeek, and more)
-- Automatic routing based on query analysis
-- Cost tracking across all providers
-- Fallback when providers fail
-- Batch processing with rate limiting
-- Response caching
-- CLI tools
-**Zero configuration needed.** It works immediately.
-## Installation & Usage
-```bash
-npm install adaptive-memory-multi-model-router
-```
-```javascript
-const { createA3MRouter } = require('adaptive-memory-multi-model-router');
-const router = createA3MRouter();
-// Route automatically selects best provider
-const result = await router.route(userQuery);
-const response = await callProvider(result.primary_model, userQuery);
-// Or use the CLI
-npx a3m-router route "Your query here"
-npx a3m-router providers  # See all configured providers
-npx a3m-router benchmark  # Compare performance
-```
-## The Math for Different Teams
-If you're using one provider for everything, you're probably overpaying:
-| Daily Queries | Current Cost | With Router | Monthly Savings |
-|---------------|--------------|-------------|-----------------|
-| 500 | $450 | $135 | **$315** |
-| 1,000 | $900 | $270 | **$630** |
-| 5,000 | $4,500 | $1,350 | **$3,150** |
-| 10,000 | $9,000 | $2,700 | **$6,300** |
-At 10,000 queries/day, you're leaving $6,300/month on the table.
-## What About Quality?
-We tracked 1,000 test queries across different categories:
-- **Simple Q&A**: 98% accuracy (any model works)
-- **Code Generation**: 92% accuracy (fast models are good enough)
-- **Summarization**: 96% accuracy (efficient models excel here)
-- **Complex Reasoning**: 89% accuracy (premium models when needed)
-**Overall: 94% quality retention.**
-For our use case (customer support, internal tools, code generation), that's an easy trade-off. Your mileage may vary for medical, legal, or other high-stakes applications.
-## Try It Yourself
-```bash
-# See what you're currently overpaying for
-npx a3m-router route "Your most common query"
-# Compare how different providers handle your queries
-npx a3m-router compare "Write Python to sort an array"
-# Benchmark everything
-npx a3m-router benchmark
-```
-**Or try it online:** https://codesandbox.io/p/sandbox/github/Das-rebel/a3m-router/tree/main/playground
-No API keys needed to test the routing logic.
-## What's in the Box
-**Core Features:**
-- Learned routing (analyzes queries, picks optimal provider)
-- Cost tracking (real-time spend monitoring)
-- Automatic fallback (retry with backup providers)
-- Batch processing (parallel execution)
-- Response caching (RadixAttention-style)
-**Security:**
-- Input validation
-- Prompt injection detection
-- PII detection
-- Rate limiting
-**Providers Supported:**
-- Fast/Cheap: Groq, Cerebras, Mistral
-- Premium: OpenAI, Anthropic, Google
-- Free: CommandCode, OpenCode
-- Local: Ollama, vLLM, LM Studio
-**Total: 12 providers, automatic selection.**
-## The Bottom Line
-If your LLM API bill is over $500/month, you're probably overpaying by 50-70%.
-Not because OpenAI is bad. GPT-4 is excellent. But you're using it for tasks where cheaper, faster models work just as well.
-**A3M Router fixes this automatically.**
-No configuration. No model training. Just intelligent routing based on what your query actually needs.
----
-**GitHub**: https://github.com/Das-rebel/a3m-router
-**NPM**: https://www.npmjs.com/package/adaptive-memory-multi-model-router
-**Weekly Downloads**: 872+ and growing
----
-*What's your current LLM spend? I'd bet we can cut it by half.*