npm - adaptive-memory-multi-model-router - Versions diffs - 1.2.2 → 1.3.1 - Mend

adaptive-memory-multi-model-router 1.2.2 → 1.3.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (195) hide show

package/LICENSE +21 -0
package/README.md +146 -66
package/dist/index.d.ts +1 -1
package/dist/index.js +1 -1
package/dist/integrations/airtable.js +20 -0
package/dist/integrations/discord.js +18 -0
package/dist/integrations/github.js +23 -0
package/dist/integrations/gmail.js +19 -0
package/dist/integrations/google-calendar.js +18 -0
package/dist/integrations/index.js +61 -0
package/dist/integrations/jira.js +21 -0
package/dist/integrations/linear.js +19 -0
package/dist/integrations/notion.js +19 -0
package/dist/integrations/slack.js +18 -0
package/dist/integrations/telegram.js +19 -0
package/dist/providers/registry.js +7 -3
package/docs/ARCHITECTURAL-IMPROVEMENTS-2025.md +1391 -0
package/docs/ARCHITECTURAL-IMPROVEMENTS-REVISED-2025.md +1051 -0
package/docs/CONFIGURATION.md +476 -0
package/docs/COUNCIL_DECISION.json +308 -0
package/docs/COUNCIL_SUMMARY.md +265 -0
package/docs/COUNCIL_V2.2_DECISION.md +416 -0
package/docs/IMPROVEMENT_ROADMAP.md +515 -0
package/docs/LLM_COUNCIL_DECISION.md +508 -0
package/docs/QUICK_START_VISIBILITY.md +782 -0
package/docs/REDDIT_GAP_ANALYSIS.md +299 -0
package/docs/RESEARCH_BACKED_IMPROVEMENTS.md +1180 -0
package/docs/TMLPD_QNA.md +751 -0
package/docs/TMLPD_V2.1_COMPLETE.md +763 -0
package/docs/TMLPD_V2.2_RESEARCH_ROADMAP.md +754 -0
package/docs/V2.2_IMPLEMENTATION_COMPLETE.md +446 -0
package/docs/V2_IMPLEMENTATION_GUIDE.md +388 -0
package/docs/VISIBILITY_ADOPTION_PLAN.md +1005 -0
package/docs/launch-content/LAUNCH_EXECUTION_CHECKLIST.md +421 -0
package/docs/launch-content/README.md +457 -0
package/docs/launch-content/assets/cost_comparison_100_tasks.png +0 -0
package/docs/launch-content/assets/cumulative_savings.png +0 -0
package/docs/launch-content/assets/parallel_speedup.png +0 -0
package/docs/launch-content/assets/provider_pricing_comparison.png +0 -0
package/docs/launch-content/assets/task_breakdown_comparison.png +0 -0
package/docs/launch-content/generate_charts.py +313 -0
package/docs/launch-content/hn_show_post.md +139 -0
package/docs/launch-content/partner_outreach_templates.md +745 -0
package/docs/launch-content/reddit_posts.md +467 -0
package/docs/launch-content/twitter_thread.txt +460 -0
package/examples/QUICKSTART.md +1 -1
package/openclaw-alexa-bridge/ALL_REMAINING_FIXES_PLAN.md +313 -0
package/openclaw-alexa-bridge/REMAINING_FIXES_SUMMARY.md +277 -0
package/openclaw-alexa-bridge/src/alexa_handler_no_tmlpd.js +1234 -0
package/openclaw-alexa-bridge/test_fixes.js +77 -0
package/package.json +120 -29
package/package.json.tmp +0 -0
package/qna/TMLPD_QNA.md +3 -3
package/skill/SKILL.md +2 -2
package/src/__tests__/integration/tmpld_integration.test.py +540 -0
package/src/agents/skill_enhanced_agent.py +318 -0
package/src/memory/__init__.py +15 -0
package/src/memory/agentic_memory.py +353 -0
package/src/memory/semantic_memory.py +444 -0
package/src/memory/simple_memory.py +466 -0
package/src/memory/working_memory.py +447 -0
package/src/orchestration/__init__.py +52 -0
package/src/orchestration/execution_engine.py +353 -0
package/src/orchestration/halo_orchestrator.py +367 -0
package/src/orchestration/mcts_workflow.py +498 -0
package/src/orchestration/role_assigner.py +473 -0
package/src/orchestration/task_planner.py +522 -0
package/src/providers/__init__.py +67 -0
package/src/providers/anthropic.py +304 -0
package/src/providers/base.py +241 -0
package/src/providers/cerebras.py +373 -0
package/src/providers/registry.py +476 -0
package/src/routing/__init__.py +30 -0
package/src/routing/universal_router.py +621 -0
package/src/skills/TMLPD-QUICKREF.md +210 -0
package/src/skills/TMLPD-SETUP-SUMMARY.md +157 -0
package/src/skills/TMLPD.md +540 -0
package/src/skills/__tests__/skill_manager.test.ts +328 -0
package/src/skills/skill_manager.py +385 -0
package/src/skills/test-tmlpd.sh +108 -0
package/src/skills/tmlpd-category.yaml +67 -0
package/src/skills/tmlpd-monitoring.yaml +188 -0
package/src/skills/tmlpd-phase.yaml +132 -0
package/src/state/__init__.py +17 -0
package/src/state/simple_checkpoint.py +508 -0
package/src/tmlpd_agent.py +464 -0
package/src/tmpld_v2.py +427 -0
package/src/workflows/__init__.py +18 -0
package/src/workflows/advanced_difficulty_classifier.py +377 -0
package/src/workflows/chaining_executor.py +417 -0
package/src/workflows/difficulty_integration.py +209 -0
package/src/workflows/orchestrator.py +469 -0
package/src/workflows/orchestrator_executor.py +456 -0
package/src/workflows/parallelization_executor.py +382 -0
package/src/workflows/router.py +311 -0
package/test_integration_simple.py +86 -0
package/test_mcts_workflow.py +150 -0
package/test_templd_integration.py +262 -0
package/test_universal_router.py +275 -0
package/tmlpd-pi-extension/README.md +36 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.d.ts +114 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.js +285 -0
package/tmlpd-pi-extension/dist/cache/prefixCache.js.map +1 -0
package/tmlpd-pi-extension/dist/cache/responseCache.d.ts +58 -0
package/tmlpd-pi-extension/dist/cache/responseCache.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/cache/responseCache.js +153 -0
package/tmlpd-pi-extension/dist/cache/responseCache.js.map +1 -0
package/tmlpd-pi-extension/dist/cli.js +59 -0
package/tmlpd-pi-extension/dist/cost/costTracker.d.ts +95 -0
package/tmlpd-pi-extension/dist/cost/costTracker.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/cost/costTracker.js +240 -0
package/tmlpd-pi-extension/dist/cost/costTracker.js.map +1 -0
package/tmlpd-pi-extension/dist/index.d.ts +723 -0
package/tmlpd-pi-extension/dist/index.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/index.js +239 -0
package/tmlpd-pi-extension/dist/index.js.map +1 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.d.ts +82 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.js +145 -0
package/tmlpd-pi-extension/dist/memory/episodicMemory.js.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.d.ts +102 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.js +207 -0
package/tmlpd-pi-extension/dist/orchestration/haloOrchestrator.js.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.d.ts +85 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.js +210 -0
package/tmlpd-pi-extension/dist/orchestration/mctsWorkflow.js.map +1 -0
package/tmlpd-pi-extension/dist/providers/localProvider.d.ts +102 -0
package/tmlpd-pi-extension/dist/providers/localProvider.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/providers/localProvider.js +338 -0
package/tmlpd-pi-extension/dist/providers/localProvider.js.map +1 -0
package/tmlpd-pi-extension/dist/providers/registry.d.ts +55 -0
package/tmlpd-pi-extension/dist/providers/registry.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/providers/registry.js +138 -0
package/tmlpd-pi-extension/dist/providers/registry.js.map +1 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.d.ts +68 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.js +332 -0
package/tmlpd-pi-extension/dist/routing/advancedRouter.js.map +1 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.d.ts +101 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.js +368 -0
package/tmlpd-pi-extension/dist/tools/tmlpdTools.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.d.ts +96 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.js +170 -0
package/tmlpd-pi-extension/dist/utils/batchProcessor.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/compression.d.ts +61 -0
package/tmlpd-pi-extension/dist/utils/compression.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/compression.js +281 -0
package/tmlpd-pi-extension/dist/utils/compression.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/reliability.d.ts +74 -0
package/tmlpd-pi-extension/dist/utils/reliability.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/reliability.js +177 -0
package/tmlpd-pi-extension/dist/utils/reliability.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts +117 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js +246 -0
package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js.map +1 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts +50 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts.map +1 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.js +124 -0
package/tmlpd-pi-extension/dist/utils/tokenUtils.js.map +1 -0
package/tmlpd-pi-extension/examples/QUICKSTART.md +183 -0
package/tmlpd-pi-extension/package-lock.json +75 -0
package/tmlpd-pi-extension/package.json +172 -0
package/tmlpd-pi-extension/python/examples.py +53 -0
package/tmlpd-pi-extension/python/integrations.py +330 -0
package/tmlpd-pi-extension/python/setup.py +28 -0
package/tmlpd-pi-extension/python/tmlpd.py +369 -0
package/tmlpd-pi-extension/qna/REDDIT_GAP_ANALYSIS.md +299 -0
package/tmlpd-pi-extension/qna/TMLPD_QNA.md +751 -0
package/tmlpd-pi-extension/skill/SKILL.md +238 -0
package/{src → tmlpd-pi-extension/src}/index.ts +1 -1
package/tmlpd-pi-extension/tsconfig.json +18 -0
package/demo/research-demo.js +0 -266
package/notebooks/quickstart.ipynb +0 -157
package/rust/tmlpd.h +0 -268
package/src/cache/prefixCache.ts +0 -365
package/src/routing/advancedRouter.ts +0 -406
package/src/utils/speculativeDecoding.ts +0 -344
/package/{src → tmlpd-pi-extension/src}/cache/responseCache.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/cost/costTracker.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/memory/episodicMemory.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/orchestration/haloOrchestrator.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/orchestration/mctsWorkflow.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/providers/localProvider.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/providers/registry.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/tools/tmlpdTools.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/utils/batchProcessor.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/utils/compression.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/utils/reliability.ts +0 -0
/package/{src → tmlpd-pi-extension/src}/utils/tokenUtils.ts +0 -0

package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts ADDED Viewed

@@ -0,0 +1,117 @@
+/**
+ * TMLPD Speculative Decoding
+ *
+ * Based on Medusa (arXiv:2401.10774) and EAGLE approaches
+ * Small draft model proposes tokens, large model verifies in parallel
+ * 2-3x faster generation with same quality
+ */
+export interface SpeculativeConfig {
+    draft_model: string;
+    target_model: string;
+    num_draft_tokens: number;
+    temperature?: number;
+    max_verify_tokens?: number;
+}
+export interface SpeculativeResult {
+    accepted: number;
+    rejected: number;
+    draft_tokens: number;
+    speedup: number;
+    final_text: string;
+}
+export interface DraftCandidate {
+    token: string;
+    probability: number;
+    position: number;
+}
+/**
+ * Medusa-style multi-token prediction heads
+ * Instead of separate draft model, uses speculative sampling
+ */
+export declare class MedusaPredictor {
+    private num_heads;
+    private temperature;
+    constructor(options?: {
+        num_heads?: number;
+        temperature?: number;
+    });
+    /**
+     * Generate k draft tokens from one forward pass
+     * In production, this uses actual Medusa prediction heads
+     */
+    generateDraftTokens(context: string, last_token: string, getLogits: (text: string) => Promise<Record<string, number>>): Promise<DraftCandidate[]>;
+    /**
+     * Verify draft tokens against target model
+     * Returns which tokens were accepted
+     */
+    verifyDraft(context: string, drafts: DraftCandidate[], targetLogits: (text: string) => Promise<Record<string, number>>): Promise<{
+        accepted: number[];
+        rejected: number[];
+    }>;
+}
+/**
+ * EAGLE-style speculative decoding
+ * Uses regression-based draft token prediction
+ */
+export declare class EagleSpeculative {
+    private num_draft_tokens;
+    constructor(num_draft_tokens?: number);
+    /**
+     * Generate draft sequence
+     * In production, this uses EAGLE's auto-regressive draft model
+     */
+    generateDraft(context: string, generateFn: (prompt: string) => Promise<string>): Promise<string[]>;
+    /**
+     * Verify draft with tree-based attention
+     * Multiple drafts are verified simultaneously
+     */
+    verifyDraftTree(context: string, drafts: string[], targetGenerate: (prompt: string) => Promise<string>): Promise<{
+        accepted: number;
+        text: string;
+    }>;
+}
+/**
+ * Simple speculative decoding wrapper
+ * Works with any model pair that supports continued generation
+ */
+export declare class SpeculativeDecoder {
+    private draft_threshold;
+    constructor(draft_threshold?: number);
+    /**
+     * Execute speculative decoding
+     *
+     * @param prompt - Input prompt
+     * @param draftFn - Function to generate draft completion (fast model)
+     * @param targetFn - Function to generate target completion (slow model)
+     * @param max_draft_tokens - Maximum tokens to draft
+     */
+    decode(prompt: string, draftFn: (prompt: string, max_tokens: number) => Promise<string>, targetFn: (prompt: string, max_tokens: number) => Promise<string>, max_draft_tokens?: number): Promise<SpeculativeResult>;
+    /**
+     * Execute with streaming (faster perceived latency)
+     */
+    decodeStreaming(prompt: string, draftFn: (prompt: string) => Promise<string>, targetFn: (prompt: string) => Promise<string>, onToken: (token: string, is_draft: boolean) => void, max_draft_tokens?: number): Promise<{
+        accepted: number;
+        final_text: string;
+    }>;
+}
+/**
+ * Batch speculative decoding
+ * Processes multiple prompts with speculative execution
+ */
+export declare function speculativeBatch(prompts: string[], draftFn: (prompt: string) => Promise<string>, targetFn: (prompt: string) => Promise<string>, options?: {
+    concurrency?: number;
+    max_draft_tokens?: number;
+}): Promise<SpeculativeResult[]>;
+/**
+ * Estimate speedup potential for a given prompt
+ */
+export declare function estimateSpeedupPotential(prompt_length: number, expected_completion_length: number, draft_speed_ms: number, target_speed_ms: number): number;
+declare const _default: {
+    MedusaPredictor: typeof MedusaPredictor;
+    EagleSpeculative: typeof EagleSpeculative;
+    SpeculativeDecoder: typeof SpeculativeDecoder;
+    speculativeBatch: typeof speculativeBatch;
+    estimateSpeedupPotential: typeof estimateSpeedupPotential;
+};
+export default _default;
+//# sourceMappingURL=speculativeDecoding.d.ts.map

package/tmlpd-pi-extension/dist/utils/speculativeDecoding.d.ts.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"speculativeDecoding.d.ts","sourceRoot":"","sources":["../../src/utils/speculativeDecoding.ts"],"names":[],"mappings":"AAAA;;;;;;GAMG;AAEH,MAAM,WAAW,iBAAiB;IAChC,WAAW,EAAE,MAAM,CAAC;IACpB,YAAY,EAAE,MAAM,CAAC;IACrB,gBAAgB,EAAE,MAAM,CAAC;IACzB,WAAW,CAAC,EAAE,MAAM,CAAC;IACrB,iBAAiB,CAAC,EAAE,MAAM,CAAC;CAC5B;AAED,MAAM,WAAW,iBAAiB;IAChC,QAAQ,EAAE,MAAM,CAAC;IACjB,QAAQ,EAAE,MAAM,CAAC;IACjB,YAAY,EAAE,MAAM,CAAC;IACrB,OAAO,EAAE,MAAM,CAAC;IAChB,UAAU,EAAE,MAAM,CAAC;CACpB;AAED,MAAM,WAAW,cAAc;IAC7B,KAAK,EAAE,MAAM,CAAC;IACd,WAAW,EAAE,MAAM,CAAC;IACpB,QAAQ,EAAE,MAAM,CAAC;CAClB;AAED;;;GAGG;AACH,qBAAa,eAAe;IAC1B,OAAO,CAAC,SAAS,CAAS;IAC1B,OAAO,CAAC,WAAW,CAAS;gBAEhB,OAAO,CAAC,EAAE;QACpB,SAAS,CAAC,EAAE,MAAM,CAAC;QACnB,WAAW,CAAC,EAAE,MAAM,CAAC;KACtB;IAKD;;;OAGG;IACG,mBAAmB,CACvB,OAAO,EAAE,MAAM,EACf,UAAU,EAAE,MAAM,EAClB,SAAS,EAAE,CAAC,IAAI,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,MAAM,EAAE,MAAM,CAAC,CAAC,GAC3D,OAAO,CAAC,cAAc,EAAE,CAAC;IAyB5B;;;OAGG;IACG,WAAW,CACf,OAAO,EAAE,MAAM,EACf,MAAM,EAAE,cAAc,EAAE,EACxB,YAAY,EAAE,CAAC,IAAI,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,MAAM,EAAE,MAAM,CAAC,CAAC,GAC9D,OAAO,CAAC;QAAE,QAAQ,EAAE,MAAM,EAAE,CAAC;QAAC,QAAQ,EAAE,MAAM,EAAE,CAAA;KAAE,CAAC;CAwBvD;AAED;;;GAGG;AACH,qBAAa,gBAAgB;IAC3B,OAAO,CAAC,gBAAgB,CAAS;gBAErB,gBAAgB,GAAE,MAAU;IAIxC;;;OAGG;IACG,aAAa,CACjB,OAAO,EAAE,MAAM,EACf,UAAU,EAAE,CAAC,MAAM,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,GAC9C,OAAO,CAAC,MAAM,EAAE,CAAC;IAiBpB;;;OAGG;IACG,eAAe,CACnB,OAAO,EAAE,MAAM,EACf,MAAM,EAAE,MAAM,EAAE,EAChB,cAAc,EAAE,CAAC,MAAM,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,GAClD,OAAO,CAAC;QAAE,QAAQ,EAAE,MAAM,CAAC;QAAC,IAAI,EAAE,MAAM,CAAA;KAAE,CAAC;CAwB/C;AAED;;;GAGG;AACH,qBAAa,kBAAkB;IAC7B,OAAO,CAAC,eAAe,CAAS;gBAEpB,eAAe,GAAE,MAAY;IAIzC;;;;;;;OAOG;IACG,MAAM,CACV,MAAM,EAAE,MAAM,EACd,OAAO,EAAE,CAAC,MAAM,EAAE,MAAM,EAAE,UAAU,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,EAChE,QAAQ,EAAE,CAAC,MAAM,EAAE,MAAM,EAAE,UAAU,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,EACjE,gBAAgB,GAAE,MAAU,GAC3B,OAAO,CAAC,iBAAiB,CAAC;IAkD7B;;OAEG;IACG,eAAe,CACnB,MAAM,EAAE,MAAM,EACd,OAAO,EAAE,CAAC,MAAM,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,EAC5C,QAAQ,EAAE,CAAC,MAAM,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,EAC7C,OAAO,EAAE,CAAC,KAAK,EAAE,MAAM,EAAE,QAAQ,EAAE,OAAO,KAAK,IAAI,EACnD,gBAAgB,GAAE,MAAU,GAC3B,OAAO,CAAC;QAAE,QAAQ,EAAE,MAAM,CAAC;QAAC,UAAU,EAAE,MAAM,CAAA;KAAE,CAAC;CAqBrD;AAED;;;GAGG;AACH,wBAAsB,gBAAgB,CACpC,OAAO,EAAE,MAAM,EAAE,EACjB,OAAO,EAAE,CAAC,MAAM,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,EAC5C,QAAQ,EAAE,CAAC,MAAM,EAAE,MAAM,KAAK,OAAO,CAAC,MAAM,CAAC,EAC7C,OAAO,CAAC,EAAE;IACR,WAAW,CAAC,EAAE,MAAM,CAAC;IACrB,gBAAgB,CAAC,EAAE,MAAM,CAAC;CAC3B,GACA,OAAO,CAAC,iBAAiB,EAAE,CAAC,CAiB9B;AAED;;GAEG;AACH,wBAAgB,wBAAwB,CACtC,aAAa,EAAE,MAAM,EACrB,0BAA0B,EAAE,MAAM,EAClC,cAAc,EAAE,MAAM,EACtB,eAAe,EAAE,MAAM,GACtB,MAAM,CAQR;;;;;;;;AAED,wBAME"}

package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js ADDED Viewed

@@ -0,0 +1,246 @@
+"use strict";
+/**
+ * TMLPD Speculative Decoding
+ *
+ * Based on Medusa (arXiv:2401.10774) and EAGLE approaches
+ * Small draft model proposes tokens, large model verifies in parallel
+ * 2-3x faster generation with same quality
+ */
+Object.defineProperty(exports, "__esModule", { value: true });
+exports.SpeculativeDecoder = exports.EagleSpeculative = exports.MedusaPredictor = void 0;
+exports.speculativeBatch = speculativeBatch;
+exports.estimateSpeedupPotential = estimateSpeedupPotential;
+/**
+ * Medusa-style multi-token prediction heads
+ * Instead of separate draft model, uses speculative sampling
+ */
+class MedusaPredictor {
+    num_heads;
+    temperature;
+    constructor(options) {
+        this.num_heads = options?.num_heads || 5;
+        this.temperature = options?.temperature || 0.7;
+    }
+    /**
+     * Generate k draft tokens from one forward pass
+     * In production, this uses actual Medusa prediction heads
+     */
+    async generateDraftTokens(context, last_token, getLogits) {
+        // Simulate getting logits for next token predictions
+        // In real Medusa, this comes from extra prediction heads
+        const prompt = context + last_token;
+        const logits = await getLogits(prompt);
+        const candidates = [];
+        const sorted = Object.entries(logits)
+            .sort((a, b) => b[1] - a[1])
+            .slice(0, this.num_heads);
+        for (let i = 0; i < sorted.length; i++) {
+            const [token, prob] = sorted[i];
+            // Apply temperature
+            const adjusted = Math.pow(prob, 1 / this.temperature);
+            candidates.push({
+                token,
+                probability: adjusted,
+                position: i + 1
+            });
+        }
+        return candidates;
+    }
+    /**
+     * Verify draft tokens against target model
+     * Returns which tokens were accepted
+     */
+    async verifyDraft(context, drafts, targetLogits) {
+        const accepted = [];
+        const rejected = [];
+        let current_context = context;
+        for (const draft of drafts) {
+            // Get target model's prediction for this position
+            const target_logits = await targetLogits(current_context);
+            const target_token = Object.entries(target_logits)
+                .sort((a, b) => b[1] - a[1])[0]?.[0];
+            // Accept if matches or probability is high enough
+            if (draft.token === target_token || draft.probability > 0.3) {
+                accepted.push(draft.position);
+                current_context += draft.token;
+            }
+            else {
+                rejected.push(draft.position);
+                break; // Reject rest of draft
+            }
+        }
+        return { accepted, rejected };
+    }
+}
+exports.MedusaPredictor = MedusaPredictor;
+/**
+ * EAGLE-style speculative decoding
+ * Uses regression-based draft token prediction
+ */
+class EagleSpeculative {
+    num_draft_tokens;
+    constructor(num_draft_tokens = 4) {
+        this.num_draft_tokens = num_draft_tokens;
+    }
+    /**
+     * Generate draft sequence
+     * In production, this uses EAGLE's auto-regressive draft model
+     */
+    async generateDraft(context, generateFn) {
+        const drafts = [];
+        let current = context;
+        for (let i = 0; i < this.num_draft_tokens; i++) {
+            // In EAGLE, draft is generated from a compressed hidden state
+            // Here we simulate with regular generation
+            const next = await generateFn(current);
+            drafts.push(next);
+            current += next;
+            if (next.trim().length === 0)
+                break;
+        }
+        return drafts;
+    }
+    /**
+     * Verify draft with tree-based attention
+     * Multiple drafts are verified simultaneously
+     */
+    async verifyDraftTree(context, drafts, targetGenerate) {
+        let current_context = context;
+        let accepted_count = 0;
+        for (const draft of drafts) {
+            // Target model generates one token at this position
+            const target_token = await targetGenerate(current_context);
+            // If draft matches target, accept
+            if (draft.startsWith(target_token) || draft === target_token) {
+                accepted_count++;
+                current_context += target_token;
+            }
+            else {
+                // Rejected - use target token
+                current_context += target_token;
+                if (accepted_count > 0)
+                    break;
+            }
+        }
+        return {
+            accepted: accepted_count,
+            text: current_context.slice(context.length)
+        };
+    }
+}
+exports.EagleSpeculative = EagleSpeculative;
+/**
+ * Simple speculative decoding wrapper
+ * Works with any model pair that supports continued generation
+ */
+class SpeculativeDecoder {
+    draft_threshold;
+    constructor(draft_threshold = 0.5) {
+        this.draft_threshold = draft_threshold;
+    }
+    /**
+     * Execute speculative decoding
+     *
+     * @param prompt - Input prompt
+     * @param draftFn - Function to generate draft completion (fast model)
+     * @param targetFn - Function to generate target completion (slow model)
+     * @param max_draft_tokens - Maximum tokens to draft
+     */
+    async decode(prompt, draftFn, targetFn, max_draft_tokens = 5) {
+        const start_time = Date.now();
+        // Phase 1: Generate draft with fast model
+        const draft_start = Date.now();
+        const draft_text = await draftFn(prompt, max_draft_tokens * 2);
+        const draft_time = Date.now() - draft_start;
+        // Phase 2: Verify with target model (single pass)
+        // Instead of verifying token-by-token, we use acceptance criteria
+        const target_start = Date.now();
+        const target_text = await targetFn(prompt, max_draft_tokens);
+        const target_time = Date.now() - target_start;
+        // Calculate acceptance rate
+        let accepted = 0;
+        let rejected = 0;
+        const draft_words = draft_text.split(/\s+/);
+        const target_words = target_text.split(/\s+/);
+        for (let i = 0; i < Math.min(draft_words.length, target_words.length); i++) {
+            // Simple word-level acceptance
+            if (draft_words[i].toLowerCase() === target_words[i].toLowerCase()) {
+                accepted++;
+            }
+            else {
+                rejected++;
+                break; // Stop at first rejection
+            }
+        }
+        // If draft was longer, those are rejected
+        rejected += Math.max(0, draft_words.length - target_words.length);
+        // Speedup: time_target / (time_draft + time_verification)
+        const total_time = draft_time + target_time;
+        const speedup = total_time > 0 ? (target_time / total_time) : 1;
+        // Use target text (higher quality) as final
+        const final_text = target_text;
+        return {
+            accepted,
+            rejected,
+            draft_tokens: draft_words.length,
+            speedup: Math.min(speedup, 3.0), // Cap at 3x
+            final_text
+        };
+    }
+    /**
+     * Execute with streaming (faster perceived latency)
+     */
+    async decodeStreaming(prompt, draftFn, targetFn, onToken, max_draft_tokens = 5) {
+        // Generate drafts first
+        const drafts = await draftFn(prompt + " ");
+        const draft_tokens = drafts.split(/\s+/);
+        let accepted = 0;
+        let final_text = "";
+        // Verify and stream tokens
+        for (const token of draft_tokens) {
+            if (accepted >= max_draft_tokens)
+                break;
+            // Emit draft token immediately (lower quality)
+            onToken(token, true);
+            final_text += token + " ";
+            accepted++;
+        }
+        return { accepted, final_text: final_text.trim() };
+    }
+}
+exports.SpeculativeDecoder = SpeculativeDecoder;
+/**
+ * Batch speculative decoding
+ * Processes multiple prompts with speculative execution
+ */
+async function speculativeBatch(prompts, draftFn, targetFn, options) {
+    const concurrency = options?.concurrency || 3;
+    const max_draft_tokens = options?.max_draft_tokens || 5;
+    const decoder = new SpeculativeDecoder();
+    const results = [];
+    // Process in batches
+    for (let i = 0; i < prompts.length; i += concurrency) {
+        const batch = prompts.slice(i, i + concurrency);
+        const batch_results = await Promise.all(batch.map(p => decoder.decode(p, draftFn, targetFn, max_draft_tokens)));
+        results.push(...batch_results);
+    }
+    return results;
+}
+/**
+ * Estimate speedup potential for a given prompt
+ */
+function estimateSpeedupPotential(prompt_length, expected_completion_length, draft_speed_ms, target_speed_ms) {
+    // If draft is much faster, potential is higher
+    const draft_vs_target = target_speed_ms / draft_speed_ms;
+    // But speculative decoding has overhead
+    const overhead_factor = 1.2; // 20% overhead
+    return Math.min(draft_vs_target / overhead_factor, 3.0);
+}
+exports.default = {
+    MedusaPredictor,
+    EagleSpeculative,
+    SpeculativeDecoder,
+    speculativeBatch,
+    estimateSpeedupPotential
+};
+//# sourceMappingURL=speculativeDecoding.js.map

package/tmlpd-pi-extension/dist/utils/speculativeDecoding.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"speculativeDecoding.js","sourceRoot":"","sources":["../../src/utils/speculativeDecoding.ts"],"names":[],"mappings":";AAAA;;;;;;GAMG;;;AA8RH,4CAyBC;AAKD,4DAaC;AAjTD;;;GAGG;AACH,MAAa,eAAe;IAClB,SAAS,CAAS;IAClB,WAAW,CAAS;IAE5B,YAAY,OAGX;QACC,IAAI,CAAC,SAAS,GAAG,OAAO,EAAE,SAAS,IAAI,CAAC,CAAC;QACzC,IAAI,CAAC,WAAW,GAAG,OAAO,EAAE,WAAW,IAAI,GAAG,CAAC;IACjD,CAAC;IAED;;;OAGG;IACH,KAAK,CAAC,mBAAmB,CACvB,OAAe,EACf,UAAkB,EAClB,SAA4D;QAE5D,qDAAqD;QACrD,yDAAyD;QACzD,MAAM,MAAM,GAAG,OAAO,GAAG,UAAU,CAAC;QACpC,MAAM,MAAM,GAAG,MAAM,SAAS,CAAC,MAAM,CAAC,CAAC;QAEvC,MAAM,UAAU,GAAqB,EAAE,CAAC;QACxC,MAAM,MAAM,GAAG,MAAM,CAAC,OAAO,CAAC,MAAM,CAAC;aAClC,IAAI,CAAC,CAAC,CAAC,EAAE,CAAC,EAAE,EAAE,CAAC,CAAC,CAAC,CAAC,CAAC,GAAG,CAAC,CAAC,CAAC,CAAC,CAAC;aAC3B,KAAK,CAAC,CAAC,EAAE,IAAI,CAAC,SAAS,CAAC,CAAC;QAE5B,KAAK,IAAI,CAAC,GAAG,CAAC,EAAE,CAAC,GAAG,MAAM,CAAC,MAAM,EAAE,CAAC,EAAE,EAAE,CAAC;YACvC,MAAM,CAAC,KAAK,EAAE,IAAI,CAAC,GAAG,MAAM,CAAC,CAAC,CAAC,CAAC;YAChC,oBAAoB;YACpB,MAAM,QAAQ,GAAG,IAAI,CAAC,GAAG,CAAC,IAAI,EAAE,CAAC,GAAG,IAAI,CAAC,WAAW,CAAC,CAAC;YACtD,UAAU,CAAC,IAAI,CAAC;gBACd,KAAK;gBACL,WAAW,EAAE,QAAQ;gBACrB,QAAQ,EAAE,CAAC,GAAG,CAAC;aAChB,CAAC,CAAC;QACL,CAAC;QAED,OAAO,UAAU,CAAC;IACpB,CAAC;IAED;;;OAGG;IACH,KAAK,CAAC,WAAW,CACf,OAAe,EACf,MAAwB,EACxB,YAA+D;QAE/D,MAAM,QAAQ,GAAa,EAAE,CAAC;QAC9B,MAAM,QAAQ,GAAa,EAAE,CAAC;QAE9B,IAAI,eAAe,GAAG,OAAO,CAAC;QAE9B,KAAK,MAAM,KAAK,IAAI,MAAM,EAAE,CAAC;YAC3B,kDAAkD;YAClD,MAAM,aAAa,GAAG,MAAM,YAAY,CAAC,eAAe,CAAC,CAAC;YAC1D,MAAM,YAAY,GAAG,MAAM,CAAC,OAAO,CAAC,aAAa,CAAC;iBAC/C,IAAI,CAAC,CAAC,CAAC,EAAE,CAAC,EAAE,EAAE,CAAC,CAAC,CAAC,CAAC,CAAC,GAAG,CAAC,CAAC,CAAC,CAAC,CAAC,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,CAAC;YAEvC,kDAAkD;YAClD,IAAI,KAAK,CAAC,KAAK,KAAK,YAAY,IAAI,KAAK,CAAC,WAAW,GAAG,GAAG,EAAE,CAAC;gBAC5D,QAAQ,CAAC,IAAI,CAAC,KAAK,CAAC,QAAQ,CAAC,CAAC;gBAC9B,eAAe,IAAI,KAAK,CAAC,KAAK,CAAC;YACjC,CAAC;iBAAM,CAAC;gBACN,QAAQ,CAAC,IAAI,CAAC,KAAK,CAAC,QAAQ,CAAC,CAAC;gBAC9B,MAAM,CAAE,uBAAuB;YACjC,CAAC;QACH,CAAC;QAED,OAAO,EAAE,QAAQ,EAAE,QAAQ,EAAE,CAAC;IAChC,CAAC;CACF;AA7ED,0CA6EC;AAED;;;GAGG;AACH,MAAa,gBAAgB;IACnB,gBAAgB,CAAS;IAEjC,YAAY,mBAA2B,CAAC;QACtC,IAAI,CAAC,gBAAgB,GAAG,gBAAgB,CAAC;IAC3C,CAAC;IAED;;;OAGG;IACH,KAAK,CAAC,aAAa,CACjB,OAAe,EACf,UAA+C;QAE/C,MAAM,MAAM,GAAa,EAAE,CAAC;QAC5B,IAAI,OAAO,GAAG,OAAO,CAAC;QAEtB,KAAK,IAAI,CAAC,GAAG,CAAC,EAAE,CAAC,GAAG,IAAI,CAAC,gBAAgB,EAAE,CAAC,EAAE,EAAE,CAAC;YAC/C,8DAA8D;YAC9D,2CAA2C;YAC3C,MAAM,IAAI,GAAG,MAAM,UAAU,CAAC,OAAO,CAAC,CAAC;YACvC,MAAM,CAAC,IAAI,CAAC,IAAI,CAAC,CAAC;YAClB,OAAO,IAAI,IAAI,CAAC;YAEhB,IAAI,IAAI,CAAC,IAAI,EAAE,CAAC,MAAM,KAAK,CAAC;gBAAE,MAAM;QACtC,CAAC;QAED,OAAO,MAAM,CAAC;IAChB,CAAC;IAED;;;OAGG;IACH,KAAK,CAAC,eAAe,CACnB,OAAe,EACf,MAAgB,EAChB,cAAmD;QAEnD,IAAI,eAAe,GAAG,OAAO,CAAC;QAC9B,IAAI,cAAc,GAAG,CAAC,CAAC;QAEvB,KAAK,MAAM,KAAK,IAAI,MAAM,EAAE,CAAC;YAC3B,oDAAoD;YACpD,MAAM,YAAY,GAAG,MAAM,cAAc,CAAC,eAAe,CAAC,CAAC;YAE3D,kCAAkC;YAClC,IAAI,KAAK,CAAC,UAAU,CAAC,YAAY,CAAC,IAAI,KAAK,KAAK,YAAY,EAAE,CAAC;gBAC7D,cAAc,EAAE,CAAC;gBACjB,eAAe,IAAI,YAAY,CAAC;YAClC,CAAC;iBAAM,CAAC;gBACN,8BAA8B;gBAC9B,eAAe,IAAI,YAAY,CAAC;gBAChC,IAAI,cAAc,GAAG,CAAC;oBAAE,MAAM;YAChC,CAAC;QACH,CAAC;QAED,OAAO;YACL,QAAQ,EAAE,cAAc;YACxB,IAAI,EAAE,eAAe,CAAC,KAAK,CAAC,OAAO,CAAC,MAAM,CAAC;SAC5C,CAAC;IACJ,CAAC;CACF;AA/DD,4CA+DC;AAED;;;GAGG;AACH,MAAa,kBAAkB;IACrB,eAAe,CAAS;IAEhC,YAAY,kBAA0B,GAAG;QACvC,IAAI,CAAC,eAAe,GAAG,eAAe,CAAC;IACzC,CAAC;IAED;;;;;;;OAOG;IACH,KAAK,CAAC,MAAM,CACV,MAAc,EACd,OAAgE,EAChE,QAAiE,EACjE,mBAA2B,CAAC;QAE5B,MAAM,UAAU,GAAG,IAAI,CAAC,GAAG,EAAE,CAAC;QAE9B,0CAA0C;QAC1C,MAAM,WAAW,GAAG,IAAI,CAAC,GAAG,EAAE,CAAC;QAC/B,MAAM,UAAU,GAAG,MAAM,OAAO,CAAC,MAAM,EAAE,gBAAgB,GAAG,CAAC,CAAC,CAAC;QAC/D,MAAM,UAAU,GAAG,IAAI,CAAC,GAAG,EAAE,GAAG,WAAW,CAAC;QAE5C,kDAAkD;QAClD,kEAAkE;QAClE,MAAM,YAAY,GAAG,IAAI,CAAC,GAAG,EAAE,CAAC;QAChC,MAAM,WAAW,GAAG,MAAM,QAAQ,CAAC,MAAM,EAAE,gBAAgB,CAAC,CAAC;QAC7D,MAAM,WAAW,GAAG,IAAI,CAAC,GAAG,EAAE,GAAG,YAAY,CAAC;QAE9C,4BAA4B;QAC5B,IAAI,QAAQ,GAAG,CAAC,CAAC;QACjB,IAAI,QAAQ,GAAG,CAAC,CAAC;QAEjB,MAAM,WAAW,GAAG,UAAU,CAAC,KAAK,CAAC,KAAK,CAAC,CAAC;QAC5C,MAAM,YAAY,GAAG,WAAW,CAAC,KAAK,CAAC,KAAK,CAAC,CAAC;QAE9C,KAAK,IAAI,CAAC,GAAG,CAAC,EAAE,CAAC,GAAG,IAAI,CAAC,GAAG,CAAC,WAAW,CAAC,MAAM,EAAE,YAAY,CAAC,MAAM,CAAC,EAAE,CAAC,EAAE,EAAE,CAAC;YAC3E,+BAA+B;YAC/B,IAAI,WAAW,CAAC,CAAC,CAAC,CAAC,WAAW,EAAE,KAAK,YAAY,CAAC,CAAC,CAAC,CAAC,WAAW,EAAE,EAAE,CAAC;gBACnE,QAAQ,EAAE,CAAC;YACb,CAAC;iBAAM,CAAC;gBACN,QAAQ,EAAE,CAAC;gBACX,MAAM,CAAE,0BAA0B;YACpC,CAAC;QACH,CAAC;QAED,0CAA0C;QAC1C,QAAQ,IAAI,IAAI,CAAC,GAAG,CAAC,CAAC,EAAE,WAAW,CAAC,MAAM,GAAG,YAAY,CAAC,MAAM,CAAC,CAAC;QAElE,0DAA0D;QAC1D,MAAM,UAAU,GAAG,UAAU,GAAG,WAAW,CAAC;QAC5C,MAAM,OAAO,GAAG,UAAU,GAAG,CAAC,CAAC,CAAC,CAAC,CAAC,WAAW,GAAG,UAAU,CAAC,CAAC,CAAC,CAAC,CAAC,CAAC;QAEhE,4CAA4C;QAC5C,MAAM,UAAU,GAAG,WAAW,CAAC;QAE/B,OAAO;YACL,QAAQ;YACR,QAAQ;YACR,YAAY,EAAE,WAAW,CAAC,MAAM;YAChC,OAAO,EAAE,IAAI,CAAC,GAAG,CAAC,OAAO,EAAE,GAAG,CAAC,EAAG,YAAY;YAC9C,UAAU;SACX,CAAC;IACJ,CAAC;IAED;;OAEG;IACH,KAAK,CAAC,eAAe,CACnB,MAAc,EACd,OAA4C,EAC5C,QAA6C,EAC7C,OAAmD,EACnD,mBAA2B,CAAC;QAE5B,wBAAwB;QACxB,MAAM,MAAM,GAAG,MAAM,OAAO,CAAC,MAAM,GAAG,GAAG,CAAC,CAAC;QAC3C,MAAM,YAAY,GAAG,MAAM,CAAC,KAAK,CAAC,KAAK,CAAC,CAAC;QAEzC,IAAI,QAAQ,GAAG,CAAC,CAAC;QACjB,IAAI,UAAU,GAAG,EAAE,CAAC;QAEpB,2BAA2B;QAC3B,KAAK,MAAM,KAAK,IAAI,YAAY,EAAE,CAAC;YACjC,IAAI,QAAQ,IAAI,gBAAgB;gBAAE,MAAM;YAExC,+CAA+C;YAC/C,OAAO,CAAC,KAAK,EAAE,IAAI,CAAC,CAAC;YACrB,UAAU,IAAI,KAAK,GAAG,GAAG,CAAC;YAE1B,QAAQ,EAAE,CAAC;QACb,CAAC;QAED,OAAO,EAAE,QAAQ,EAAE,UAAU,EAAE,UAAU,CAAC,IAAI,EAAE,EAAE,CAAC;IACrD,CAAC;CACF;AApGD,gDAoGC;AAED;;;GAGG;AACI,KAAK,UAAU,gBAAgB,CACpC,OAAiB,EACjB,OAA4C,EAC5C,QAA6C,EAC7C,OAGC;IAED,MAAM,WAAW,GAAG,OAAO,EAAE,WAAW,IAAI,CAAC,CAAC;IAC9C,MAAM,gBAAgB,GAAG,OAAO,EAAE,gBAAgB,IAAI,CAAC,CAAC;IAExD,MAAM,OAAO,GAAG,IAAI,kBAAkB,EAAE,CAAC;IACzC,MAAM,OAAO,GAAwB,EAAE,CAAC;IAExC,qBAAqB;IACrB,KAAK,IAAI,CAAC,GAAG,CAAC,EAAE,CAAC,GAAG,OAAO,CAAC,MAAM,EAAE,CAAC,IAAI,WAAW,EAAE,CAAC;QACrD,MAAM,KAAK,GAAG,OAAO,CAAC,KAAK,CAAC,CAAC,EAAE,CAAC,GAAG,WAAW,CAAC,CAAC;QAChD,MAAM,aAAa,GAAG,MAAM,OAAO,CAAC,GAAG,CACrC,KAAK,CAAC,GAAG,CAAC,CAAC,CAAC,EAAE,CAAC,OAAO,CAAC,MAAM,CAAC,CAAC,EAAE,OAAO,EAAE,QAAQ,EAAE,gBAAgB,CAAC,CAAC,CACvE,CAAC;QACF,OAAO,CAAC,IAAI,CAAC,GAAG,aAAa,CAAC,CAAC;IACjC,CAAC;IAED,OAAO,OAAO,CAAC;AACjB,CAAC;AAED;;GAEG;AACH,SAAgB,wBAAwB,CACtC,aAAqB,EACrB,0BAAkC,EAClC,cAAsB,EACtB,eAAuB;IAEvB,+CAA+C;IAC/C,MAAM,eAAe,GAAG,eAAe,GAAG,cAAc,CAAC;IAEzD,wCAAwC;IACxC,MAAM,eAAe,GAAG,GAAG,CAAC,CAAE,eAAe;IAE7C,OAAO,IAAI,CAAC,GAAG,CAAC,eAAe,GAAG,eAAe,EAAE,GAAG,CAAC,CAAC;AAC1D,CAAC;AAED,kBAAe;IACb,eAAe;IACf,gBAAgB;IAChB,kBAAkB;IAClB,gBAAgB;IAChB,wBAAwB;CACzB,CAAC"}

package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts ADDED Viewed

@@ -0,0 +1,50 @@
+/**
+ * TMLPD Token Utilities
+ *
+ * Token counting, cost estimation, and context management.
+ */
+export interface TokenCost {
+    input_per_1k: number;
+    output_per_1k: number;
+}
+export declare const MODEL_COSTS: Record<string, TokenCost>;
+/**
+ * Count tokens in text (approximate for English).
+ * Based on ~1.3 tokens per word for typical English text.
+ */
+export declare function countTokens(text: string, model?: string): number;
+/**
+ * Estimate cost for a prompt/completion pair.
+ */
+export declare function estimateCost(prompt_tokens: number, completion_tokens: number, model: string): number;
+/**
+ * Estimate cost from raw text (approximates both prompt and completion).
+ */
+export declare function estimateCostFromText(prompt: string, completion: string, model: string): number;
+/**
+ * Get cost info for a model.
+ */
+export declare function getModelCost(model: string): TokenCost;
+/**
+ * List all supported models with their costs.
+ */
+export declare function listModelsByCost(): Array<{
+    model: string;
+    input: number;
+    output: number;
+}>;
+/**
+ * Find cheapest models for a given task.
+ */
+export declare function findCheapestModels(task: "fast" | "quality" | "balanced" | "coding", count?: number): string[];
+declare const _default: {
+    countTokens: typeof countTokens;
+    estimateCost: typeof estimateCost;
+    estimateCostFromText: typeof estimateCostFromText;
+    getModelCost: typeof getModelCost;
+    listModelsByCost: typeof listModelsByCost;
+    findCheapestModels: typeof findCheapestModels;
+    MODEL_COSTS: Record<string, TokenCost>;
+};
+export default _default;
+//# sourceMappingURL=tokenUtils.d.ts.map

package/tmlpd-pi-extension/dist/utils/tokenUtils.d.ts.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"tokenUtils.d.ts","sourceRoot":"","sources":["../../src/utils/tokenUtils.ts"],"names":[],"mappings":"AAAA;;;;GAIG;AAEH,MAAM,WAAW,SAAS;IACxB,YAAY,EAAE,MAAM,CAAC;IACrB,aAAa,EAAE,MAAM,CAAC;CACvB;AAGD,eAAO,MAAM,WAAW,EAAE,MAAM,CAAC,MAAM,EAAE,SAAS,CA2BjD,CAAC;AAEF;;;GAGG;AACH,wBAAgB,WAAW,CAAC,IAAI,EAAE,MAAM,EAAE,KAAK,GAAE,MAAiB,GAAG,MAAM,CAqB1E;AAED;;GAEG;AACH,wBAAgB,YAAY,CAC1B,aAAa,EAAE,MAAM,EACrB,iBAAiB,EAAE,MAAM,EACzB,KAAK,EAAE,MAAM,GACZ,MAAM,CAOR;AAED;;GAEG;AACH,wBAAgB,oBAAoB,CAClC,MAAM,EAAE,MAAM,EACd,UAAU,EAAE,MAAM,EAClB,KAAK,EAAE,MAAM,GACZ,MAAM,CAMR;AAED;;GAEG;AACH,wBAAgB,YAAY,CAAC,KAAK,EAAE,MAAM,GAAG,SAAS,CAErD;AAED;;GAEG;AACH,wBAAgB,gBAAgB,IAAI,KAAK,CAAC;IAAE,KAAK,EAAE,MAAM,CAAC;IAAC,KAAK,EAAE,MAAM,CAAC;IAAC,MAAM,EAAE,MAAM,CAAA;CAAE,CAAC,CAQ1F;AAED;;GAEG;AACH,wBAAgB,kBAAkB,CAAC,IAAI,EAAE,MAAM,GAAG,SAAS,GAAG,UAAU,GAAG,QAAQ,EAAE,KAAK,GAAE,MAAU,GAAG,MAAM,EAAE,CAYhH;;;;;;;;;;AAED,wBAQE"}

package/tmlpd-pi-extension/dist/utils/tokenUtils.js ADDED Viewed

@@ -0,0 +1,124 @@
+"use strict";
+/**
+ * TMLPD Token Utilities
+ *
+ * Token counting, cost estimation, and context management.
+ */
+Object.defineProperty(exports, "__esModule", { value: true });
+exports.MODEL_COSTS = void 0;
+exports.countTokens = countTokens;
+exports.estimateCost = estimateCost;
+exports.estimateCostFromText = estimateCostFromText;
+exports.getModelCost = getModelCost;
+exports.listModelsByCost = listModelsByCost;
+exports.findCheapestModels = findCheapestModels;
+// Current provider rates (2024-2025)
+exports.MODEL_COSTS = {
+    // OpenAI
+    "gpt-4o": { input_per_1k: 2.50, output_per_1k: 10.00 },
+    "gpt-4o-mini": { input_per_1k: 0.15, output_per_1k: 0.60 },
+    "gpt-4-turbo": { input_per_1k: 10.00, output_per_1k: 30.00 },
+    "gpt-3.5-turbo": { input_per_1k: 0.50, output_per_1k: 1.50 },
+    // Anthropic
+    "claude-3.5-sonnet": { input_per_1k: 3.00, output_per_1k: 15.00 },
+    "claude-3-opus": { input_per_1k: 15.00, output_per_1k: 75.00 },
+    "claude-3-haiku": { input_per_1k: 0.25, output_per_1k: 1.25 },
+    // Google
+    "gemini-2.0-flash": { input_per_1k: 0.00, output_per_1k: 0.00 }, // Free
+    "gemini-1.5-pro": { input_per_1k: 1.25, output_per_1k: 5.00 },
+    "gemini-1.5-flash": { input_per_1k: 0.075, output_per_1k: 0.30 },
+    // Groq
+    "groq/llama-3.3-70b": { input_per_1k: 0.59, output_per_1k: 0.79 },
+    "groq/llama-3.1-8b": { input_per_1k: 0.05, output_per_1k: 0.08 },
+    // Cerebras
+    "cerebras/llama-3.3-70b": { input_per_1k: 0.60, output_per_1k: 0.60 },
+    // Mistral
+    "mistral-large": { input_per_1k: 2.00, output_per_1k: 6.00 },
+    "mistral-small": { input_per_1k: 0.20, output_per_1k: 0.60 },
+};
+/**
+ * Count tokens in text (approximate for English).
+ * Based on ~1.3 tokens per word for typical English text.
+ */
+function countTokens(text, model = "gpt-4o") {
+    if (!text || text.length === 0)
+        return 0;
+    // Use model-specific approximation if available
+    // Otherwise use generic word-based estimate
+    const words = text.trim().split(/\s+/).length;
+    // Fine-tune based on model family
+    if (model.includes("claude")) {
+        // Anthropic models: ~1.5 tokens per word
+        return Math.ceil(words * 1.5);
+    }
+    else if (model.includes("gemini")) {
+        // Google: ~1.2 tokens per word (SentencePiece)
+        return Math.ceil(words * 1.2);
+    }
+    else if (model.includes("llama")) {
+        // Llama: ~1.4 tokens per word (BPE)
+        return Math.ceil(words * 1.4);
+    }
+    // Default: ~1.3 tokens per word (GPT-4 average)
+    return Math.ceil(words * 1.3);
+}
+/**
+ * Estimate cost for a prompt/completion pair.
+ */
+function estimateCost(prompt_tokens, completion_tokens, model) {
+    const costs = exports.MODEL_COSTS[model] || exports.MODEL_COSTS["gpt-4o"];
+    const input_cost = (prompt_tokens / 1000) * costs.input_per_1k;
+    const output_cost = (completion_tokens / 1000) * costs.output_per_1k;
+    return input_cost + output_cost;
+}
+/**
+ * Estimate cost from raw text (approximates both prompt and completion).
+ */
+function estimateCostFromText(prompt, completion, model) {
+    const prompt_tokens = countTokens(prompt, model);
+    // Completion typically has higher token density
+    const completion_tokens = Math.ceil(countTokens(completion, model) * 1.2);
+    return estimateCost(prompt_tokens, completion_tokens, model);
+}
+/**
+ * Get cost info for a model.
+ */
+function getModelCost(model) {
+    return exports.MODEL_COSTS[model] || exports.MODEL_COSTS["gpt-4o"];
+}
+/**
+ * List all supported models with their costs.
+ */
+function listModelsByCost() {
+    return Object.entries(exports.MODEL_COSTS)
+        .map(([model, cost]) => ({
+        model,
+        input: cost.input_per_1k,
+        output: cost.output_per_1k
+    }))
+        .sort((a, b) => (a.input + a.output) - (b.input + b.output));
+}
+/**
+ * Find cheapest models for a given task.
+ */
+function findCheapestModels(task, count = 3) {
+    const sorted = listModelsByCost();
+    // Different profiles for different needs
+    const profiles = {
+        fast: sorted.filter(m => m.output < 1.0).slice(0, count).map(m => m.model),
+        quality: sorted.filter(m => m.output > 10).slice(0, count).map(m => m.model),
+        balanced: sorted.slice(0, count * 2).slice(count, count * 2).map(m => m.model),
+        coding: sorted.filter(m => m.model.includes("codex") || m.model.includes("claude") || m.model.includes("llama")).slice(0, count).map(m => m.model)
+    };
+    return profiles[task] || profiles.balanced;
+}
+exports.default = {
+    countTokens,
+    estimateCost,
+    estimateCostFromText,
+    getModelCost,
+    listModelsByCost,
+    findCheapestModels,
+    MODEL_COSTS: exports.MODEL_COSTS
+};
+//# sourceMappingURL=tokenUtils.js.map

package/tmlpd-pi-extension/dist/utils/tokenUtils.js.map ADDED Viewed

@@ -0,0 +1 @@

+ {"version":3,"file":"tokenUtils.js","sourceRoot":"","sources":["../../src/utils/tokenUtils.ts"],"names":[],"mappings":";AAAA;;;;GAIG;;;AAyCH,kCAqBC;AAKD,oCAWC;AAKD,oDAUC;AAKD,oCAEC;AAKD,4CAQC;AAKD,gDAYC;AA3HD,qCAAqC;AACxB,QAAA,WAAW,GAA8B;IACpD,SAAS;IACT,QAAQ,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,KAAK,EAAE;IACtD,aAAa,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IAC1D,aAAa,EAAE,EAAE,YAAY,EAAE,KAAK,EAAE,aAAa,EAAE,KAAK,EAAE;IAC5D,eAAe,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IAE5D,YAAY;IACZ,mBAAmB,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,KAAK,EAAE;IACjE,eAAe,EAAE,EAAE,YAAY,EAAE,KAAK,EAAE,aAAa,EAAE,KAAK,EAAE;IAC9D,gBAAgB,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IAE7D,SAAS;IACT,kBAAkB,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE,EAAG,OAAO;IACzE,gBAAgB,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IAC7D,kBAAkB,EAAE,EAAE,YAAY,EAAE,KAAK,EAAE,aAAa,EAAE,IAAI,EAAE;IAEhE,OAAO;IACP,oBAAoB,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IACjE,mBAAmB,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IAEhE,WAAW;IACX,wBAAwB,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IAErE,UAAU;IACV,eAAe,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;IAC5D,eAAe,EAAE,EAAE,YAAY,EAAE,IAAI,EAAE,aAAa,EAAE,IAAI,EAAE;CAC7D,CAAC;AAEF;;;GAGG;AACH,SAAgB,WAAW,CAAC,IAAY,EAAE,QAAgB,QAAQ;IAChE,IAAI,CAAC,IAAI,IAAI,IAAI,CAAC,MAAM,KAAK,CAAC;QAAE,OAAO,CAAC,CAAC;IAEzC,gDAAgD;IAChD,4CAA4C;IAC5C,MAAM,KAAK,GAAG,IAAI,CAAC,IAAI,EAAE,CAAC,KAAK,CAAC,KAAK,CAAC,CAAC,MAAM,CAAC;IAE9C,kCAAkC;IAClC,IAAI,KAAK,CAAC,QAAQ,CAAC,QAAQ,CAAC,EAAE,CAAC;QAC7B,yCAAyC;QACzC,OAAO,IAAI,CAAC,IAAI,CAAC,KAAK,GAAG,GAAG,CAAC,CAAC;IAChC,CAAC;SAAM,IAAI,KAAK,CAAC,QAAQ,CAAC,QAAQ,CAAC,EAAE,CAAC;QACpC,+CAA+C;QAC/C,OAAO,IAAI,CAAC,IAAI,CAAC,KAAK,GAAG,GAAG,CAAC,CAAC;IAChC,CAAC;SAAM,IAAI,KAAK,CAAC,QAAQ,CAAC,OAAO,CAAC,EAAE,CAAC;QACnC,oCAAoC;QACpC,OAAO,IAAI,CAAC,IAAI,CAAC,KAAK,GAAG,GAAG,CAAC,CAAC;IAChC,CAAC;IAED,gDAAgD;IAChD,OAAO,IAAI,CAAC,IAAI,CAAC,KAAK,GAAG,GAAG,CAAC,CAAC;AAChC,CAAC;AAED;;GAEG;AACH,SAAgB,YAAY,CAC1B,aAAqB,EACrB,iBAAyB,EACzB,KAAa;IAEb,MAAM,KAAK,GAAG,mBAAW,CAAC,KAAK,CAAC,IAAI,mBAAW,CAAC,QAAQ,CAAC,CAAC;IAE1D,MAAM,UAAU,GAAG,CAAC,aAAa,GAAG,IAAI,CAAC,GAAG,KAAK,CAAC,YAAY,CAAC;IAC/D,MAAM,WAAW,GAAG,CAAC,iBAAiB,GAAG,IAAI,CAAC,GAAG,KAAK,CAAC,aAAa,CAAC;IAErE,OAAO,UAAU,GAAG,WAAW,CAAC;AAClC,CAAC;AAED;;GAEG;AACH,SAAgB,oBAAoB,CAClC,MAAc,EACd,UAAkB,EAClB,KAAa;IAEb,MAAM,aAAa,GAAG,WAAW,CAAC,MAAM,EAAE,KAAK,CAAC,CAAC;IACjD,gDAAgD;IAChD,MAAM,iBAAiB,GAAG,IAAI,CAAC,IAAI,CAAC,WAAW,CAAC,UAAU,EAAE,KAAK,CAAC,GAAG,GAAG,CAAC,CAAC;IAE1E,OAAO,YAAY,CAAC,aAAa,EAAE,iBAAiB,EAAE,KAAK,CAAC,CAAC;AAC/D,CAAC;AAED;;GAEG;AACH,SAAgB,YAAY,CAAC,KAAa;IACxC,OAAO,mBAAW,CAAC,KAAK,CAAC,IAAI,mBAAW,CAAC,QAAQ,CAAC,CAAC;AACrD,CAAC;AAED;;GAEG;AACH,SAAgB,gBAAgB;IAC9B,OAAO,MAAM,CAAC,OAAO,CAAC,mBAAW,CAAC;SAC/B,GAAG,CAAC,CAAC,CAAC,KAAK,EAAE,IAAI,CAAC,EAAE,EAAE,CAAC,CAAC;QACvB,KAAK;QACL,KAAK,EAAE,IAAI,CAAC,YAAY;QACxB,MAAM,EAAE,IAAI,CAAC,aAAa;KAC3B,CAAC,CAAC;SACF,IAAI,CAAC,CAAC,CAAC,EAAE,CAAC,EAAE,EAAE,CAAC,CAAC,CAAC,CAAC,KAAK,GAAG,CAAC,CAAC,MAAM,CAAC,GAAG,CAAC,CAAC,CAAC,KAAK,GAAG,CAAC,CAAC,MAAM,CAAC,CAAC,CAAC;AACjE,CAAC;AAED;;GAEG;AACH,SAAgB,kBAAkB,CAAC,IAAgD,EAAE,QAAgB,CAAC;IACpG,MAAM,MAAM,GAAG,gBAAgB,EAAE,CAAC;IAElC,yCAAyC;IACzC,MAAM,QAAQ,GAAG;QACf,IAAI,EAAE,MAAM,CAAC,MAAM,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,MAAM,GAAG,GAAG,CAAC,CAAC,KAAK,CAAC,CAAC,EAAE,KAAK,CAAC,CAAC,GAAG,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,KAAK,CAAC;QAC1E,OAAO,EAAE,MAAM,CAAC,MAAM,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,MAAM,GAAG,EAAE,CAAC,CAAC,KAAK,CAAC,CAAC,EAAE,KAAK,CAAC,CAAC,GAAG,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,KAAK,CAAC;QAC5E,QAAQ,EAAE,MAAM,CAAC,KAAK,CAAC,CAAC,EAAE,KAAK,GAAG,CAAC,CAAC,CAAC,KAAK,CAAC,KAAK,EAAE,KAAK,GAAG,CAAC,CAAC,CAAC,GAAG,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,KAAK,CAAC;QAC9E,MAAM,EAAE,MAAM,CAAC,MAAM,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,KAAK,CAAC,QAAQ,CAAC,OAAO,CAAC,IAAI,CAAC,CAAC,KAAK,CAAC,QAAQ,CAAC,QAAQ,CAAC,IAAI,CAAC,CAAC,KAAK,CAAC,QAAQ,CAAC,OAAO,CAAC,CAAC,CAAC,KAAK,CAAC,CAAC,EAAE,KAAK,CAAC,CAAC,GAAG,CAAC,CAAC,CAAC,EAAE,CAAC,CAAC,CAAC,KAAK,CAAC;KACnJ,CAAC;IAEF,OAAO,QAAQ,CAAC,IAAI,CAAC,IAAI,QAAQ,CAAC,QAAQ,CAAC;AAC7C,CAAC;AAED,kBAAe;IACb,WAAW;IACX,YAAY;IACZ,oBAAoB;IACpB,YAAY;IACZ,gBAAgB;IAChB,kBAAkB;IAClB,WAAW,EAAX,mBAAW;CACZ,CAAC"}