npm - pi-free - Versions diffs - 2.1.1 → 2.2.0 - Mend

pi-free 2.1.1 → 2.2.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

package/CHANGELOG.md +22 -0
package/README.md +32 -4
package/banner.svg +1 -1
package/config.ts +644 -629
package/constants.ts +4 -0
package/index.ts +380 -378
package/lib/probe-cache.ts +8 -0
package/lib/provider-probe.ts +15 -0
package/package.json +5 -5
package/providers/bai/bai.ts +232 -0
package/providers/cline/cline-xml-bridge.ts +44 -15
package/providers/dynamic-built-in/index.ts +12 -0
package/providers/ollama/ollama.ts +13 -0
package/providers/routeway/routeway.ts +10 -0

package/index.ts CHANGED Viewed

@@ -1,378 +1,380 @@
-/**
- * Pi-Free Providers Index
- *
- * Provides free model filtering for ALL providers (built-in + extension)
- * plus unique free/paid providers not covered by pi's built-in providers.
- *
- * Unique providers:
- * - Kilo: OAuth-based free models
- * - Cline: Cline bot integration
- * - NVIDIA: NVIDIA NIM hosting (free tier available)
- * - Ollama Cloud: Ollama's cloud-hosted models with usage-based free tier
- * - ZenMux: Unified AI API gateway with 200+ models
- * - Codestral: Mistral's code-focused model via codestral.mistral.ai (free tier)
- * - DeepInfra: AI inference cloud ($5 trial credit)
- * - SambaNova: Fast inference on RDU hardware (free tier, no credit card)
- * - Together: Fast inference on 200+ open-source models ($1 trial credit)
- * - Routeway: OpenAI-compatible gateway with free `:free` models
- * - TokenRouter: OpenAI-compatible gateway routing to 90+ models
- * - LLM7: AI gateway (free default/fast selectors)
- */
-import type { ExtensionAPI } from "@earendil-works/pi-coding-agent";
-import { setupBuiltInProviderToggles } from "./lib/built-in-toggle.ts";
-import { createLogger } from "./lib/logger.ts";
-import {
-	processQuotaResponse,
-	formatQuotaStatus,
-} from "./lib/quota-monitor.ts";
-import {
-	startModelCall,
-	recordModelCall,
-	getAllTelemetry,
-	getTelemetryPath,
-	clearTelemetry,
-} from "./lib/telemetry.ts";
-import {
-	applyGlobalFilter,
-	getGlobalFreeOnly,
-	getProviderRegistry,
-	isFreeModel,
-	registerWithGlobalToggle,
-} from "./lib/registry.ts";
-// Import unique provider extensions (only providers NOT built into pi)
-import cline from "./providers/cline/cline.ts";
-import codestral from "./providers/codestral/codestral.ts";
-import crofai from "./providers/crofai/crofai.ts";
-import kilo from "./providers/kilo/kilo.ts";
-import llm7 from "./providers/llm7/llm7.ts";
-import deepinfra from "./providers/deepinfra/deepinfra.ts";
-import sambanova from "./providers/sambanova/sambanova.ts";
-import together from "./providers/together/together.ts";
-import novita from "./providers/novita/novita.ts";
-import routeway from "./providers/routeway/routeway.ts";
-import tokenRouter from "./providers/tokenrouter/tokenrouter.ts";
-import ollama from "./providers/ollama/ollama.ts";
-import zenmux from "./providers/zenmux/zenmux.ts";
-const _logger = createLogger("pi-free");
-// =============================================================================
-// Global Commands
-// =============================================================================
-function setupGlobalCommands(pi: ExtensionAPI) {
-	// /toggle-free - Global free-only mode toggle
-	pi.registerCommand("toggle-free", {
-		description: "Toggle global free-only mode for all providers",
-		handler: async (_args, ctx) => {
-			const current = getGlobalFreeOnly();
-			const next = !current;
-			applyGlobalFilter(next, { force: true });
-			const registry = getProviderRegistry();
-			const providerCount = registry.size;
-			if (next) {
-				const totalFree = [...registry.values()].reduce(
-					(sum, e) => sum + e.stored.free.length,
-					0,
-				);
-				ctx.ui.notify(
-					`Free-only mode: ON (${totalFree} free models across ${providerCount} providers)`,
-					"info",
-				);
-			} else {
-				const totalAll = [...registry.values()].reduce(
-					(sum, e) => sum + (e.stored.all.length || e.stored.free.length),
-					0,
-				);
-				ctx.ui.notify(
-					`Free-only mode: OFF (all ${totalAll} models visible across ${providerCount} providers)`,
-					"info",
-				);
-			}
-		},
-	});
-	// /free-providers - Show free model counts by provider
-	pi.registerCommand("free-providers", {
-		description: "Show free/paid model counts for all pi-free providers",
-		handler: async (_args, ctx) => {
-			const lines = ["📊 Pi-Free Providers:", ""];
-			const registry = getProviderRegistry();
-			// Providers known to not expose pricing via API (all models show as "free")
-			// OpenRouter and OpenCode expose actual pricing
-			const noPricingApi = new Set([
-				"mistral",
-				"xai",
-				"huggingface",
-				"groq",
-				"cerebras",
-			]);
-			// Freemium providers - all models share a free tier quota
-			const freemiumProviders = new Set(["sambanova", "ollama-cloud"]);
-			// Trial credit providers - one-time credits, otherwise paid
-			const trialCreditProviders = new Set(["deepinfra"]);
-			for (const [id, entry] of registry) {
-				const free = entry.stored.free.length;
-				const all = entry.stored.all.length || free;
-				const indicator = entry.hasKey ? "🔑" : "🆓";
-				const paid = all - free;
-				if (freemiumProviders.has(id)) {
-					// Freemium: all models share a free tier (e.g., 1,000 reqs/month)
-					lines.push(`${indicator} ${id}: ${all} models (freemium)`);
-				} else if (trialCreditProviders.has(id)) {
-					// Trial credit: one-time credits, otherwise paid
-					lines.push(`${indicator} ${id}: ${all} models ($5 trial credit)`);
-				} else if (noPricingApi.has(id)) {
-					// Provider doesn't expose pricing - can't determine free vs paid
-					lines.push(
-						`${indicator} ${id}: ${all} models (pricing not exposed by API)`,
-					);
-				} else if (paid === 0 && free > 0) {
-					// All models are actually free
-					lines.push(`${indicator} ${id}: ${free} free models`);
-				} else {
-					// Mix of free and paid
-					lines.push(
-						`${indicator} ${id}: ${free} free / ${paid} paid (${all} total)`,
-					);
-				}
-			}
-			if (registry.size === 0) {
-				lines.push("(No providers registered yet)");
-			}
-			ctx.ui.notify(lines.join("\n"), "info");
-		},
-	});
-	// /telemetry — Show model telemetry data
-	pi.registerCommand("free-telemetry", {
-		description:
-			"Show real-world performance data for free models (tokens/s, latency, success rate)",
-		handler: async (_args, ctx) => {
-			const allTelemetry = getAllTelemetry();
-			const entries = Object.entries(allTelemetry);
-			if (entries.length === 0) {
-				ctx.ui.notify(
-					"No telemetry data yet. Use some free models first!",
-					"info",
-				);
-				return;
-			}
-			// Sort by total calls descending
-			entries.sort((a, b) => b[1].totalCalls - a[1].totalCalls);
-			const lines = ["📊 Model Telemetry:", ""];
-			lines.push(
-				`${`Model`.padEnd(40)} ${`Calls`.padEnd(6)} ${`OK%`.padEnd(6)} ${`Lat`.padEnd(7)} ${`tok/s`.padEnd(7)} ${`Cost`}`,
-			);
-			lines.push(`─`.repeat(75));
-			for (const [key, t] of entries.slice(0, 20)) {
-				const name = key.length > 38 ? key.slice(0, 35) + "..." : key;
-				const calls = String(t.totalCalls).padStart(5);
-				const ok = `${t.successRate}%`.padStart(5);
-				const lat =
-					t.avgLatencyMs > 0
-						? `${t.avgLatencyMs}ms`.padStart(6)
-						: "—".padStart(6);
-				const tps =
-					t.avgTokensPerSecond > 0
-						? `${t.avgTokensPerSecond}`.padStart(6)
-						: "—".padStart(6);
-				const cost =
-					t.totalCost > 0
-						? `$${t.totalCost.toFixed(4)}`.padStart(8)
-						: "free".padStart(8);
-				lines.push(`${name.padEnd(40)} ${calls} ${ok} ${lat} ${tps} ${cost}`);
-			}
-			lines.push("", `File: ${getTelemetryPath()}`);
-			ctx.ui.notify(lines.join("\n"), "info");
-		},
-	});
-	// /clear-free-telemetry — Clear all telemetry data
-	pi.registerCommand("clear-free-telemetry", {
-		description: "Clear all model telemetry data",
-		handler: async (_args, ctx) => {
-			await clearTelemetry();
-			ctx.ui.notify("Telemetry data cleared", "info");
-		},
-	});
-}
-// =============================================================================
-// Quota Monitoring
-// =============================================================================
-function setupQuotaMonitoring(pi: ExtensionAPI) {
-	// Capture rate-limit headers from every provider response
-	// eslint-disable-next-line @typescript-eslint/no-explicit-any
-	(pi as any).on(
-		"after_provider_response",
-		(event: { status: number; headers: Record<string, string> }, ctx: any) => {
-			const providerId = ctx.model?.provider;
-			if (!providerId) return;
-			processQuotaResponse(providerId, event.headers);
-			// Update status bar with quota for the active provider
-			const status = formatQuotaStatus(providerId);
-			if (status) {
-				ctx.ui.setStatus("quota", status);
-			}
-		},
-	);
-	// Clear quota status when switching away from a provider
-	pi.on("model_select", (_event, ctx) => {
-		const providerId = ctx.model?.provider;
-		if (!providerId) {
-			ctx.ui.setStatus("quota", undefined);
-			return;
-		}
-		// Show cached quota on provider switch (if still fresh)
-		const status = formatQuotaStatus(providerId);
-		ctx.ui.setStatus("quota", status);
-	});
-}
-// =============================================================================
-// Model Telemetry
-// =============================================================================
-function setupTelemetry(pi: ExtensionAPI) {
-	// Only track telemetry for FREE models (uses same isFreeModel logic as model filtering)
-	// eslint-disable-next-line @typescript-eslint/no-explicit-any
-	(pi as any).on("before_agent_start", (_event: any, ctx: any) => {
-		if (!ctx.model) return;
-		if (!isFreeModel(ctx.model as any)) return;
-		const provider = ctx.model?.provider;
-		const model = ctx.model?.id;
-		if (provider && model) {
-			startModelCall(provider, model);
-		}
-	});
-	// Record telemetry when a turn completes
-	pi.on("turn_end", async (event, ctx) => {
-		if (!ctx.model) return;
-		if (!isFreeModel(ctx.model as any)) return;
-		const msg = (
-			event as {
-				message?: {
-					role?: string;
-					model?: string;
-					usage?: {
-						input?: number;
-						output?: number;
-						totalTokens?: number;
-						cost?: { total?: number };
-					};
-					stopReason?: string;
-					errorMessage?: string;
-				};
-			}
-		).message;
-		if (msg?.role !== "assistant") return;
-		const provider = ctx.model?.provider;
-		const model = msg.model || ctx.model?.id;
-		if (!provider || !model) return;
-		const usage = msg.usage;
-		const inputTokens = usage?.input ?? 0;
-		const outputTokens = usage?.output ?? 0;
-		const totalTokens = usage?.totalTokens ?? inputTokens + outputTokens;
-		const cost = usage?.cost?.total ?? 0;
-		const isError = msg.stopReason === "error" || !!msg.errorMessage;
-		await recordModelCall(
-			provider,
-			model,
-			{ input: inputTokens, output: outputTokens, totalTokens },
-			cost,
-			{
-				success: !isError,
-				stopReason: msg.stopReason,
-				errorMessage: msg.errorMessage,
-			},
-		);
-	});
-}
-// =============================================================================
-// Main Entry Point
-// =============================================================================
-export default async function piFreeEntry(pi: ExtensionAPI) {
-	const globalFreeOnly = getGlobalFreeOnly();
-	_logger.info(`[pi-free] Initializing (global free-only: ${globalFreeOnly})`);
-	// Setup global commands first
-	setupGlobalCommands(pi);
-	// Setup quota monitoring (passive, no extra API calls)
-	setupQuotaMonitoring(pi);
-	// Setup model telemetry (tracks real-world performance)
-	setupTelemetry(pi);
-	// Load all unique providers
-	// Each provider will register itself with the global toggle system
-	await Promise.allSettled([
-		kilo(pi),
-		ollama(pi),
-		cline(pi),
-		zenmux(pi),
-		crofai(pi),
-		codestral(pi),
-		llm7(pi),
-		deepinfra(pi),
-		sambanova(pi),
-		together(pi),
-		novita(pi),
-		routeway(pi),
-		tokenRouter(pi),
-	]);
-	// Setup dynamic built-in providers (Mistral, Groq, Cerebras, xAI, Hugging Face,
-	// OpenRouter/OpenCode from Pi auth, and FastRouter public model discovery)
-	const { setupDynamicBuiltInProviders } = await import(
-		"./providers/dynamic-built-in/index.ts"
-	);
-	await setupDynamicBuiltInProviders(pi);
-	// Setup toggles for pi's built-in providers (e.g., OpenCode)
-	setupBuiltInProviderToggles(pi);
-	// Apply initial global filter if free-only mode is enabled
-	if (globalFreeOnly) {
-		_logger.info("[pi-free] Applying initial free-only filter");
-		applyGlobalFilter(true);
-	}
-	const registry = getProviderRegistry();
-	_logger.info(`[pi-free] Loaded with ${registry.size} providers`);
-}
-// Re-export registry helpers so consumers don't need deep imports
-export {
-	applyGlobalFilter,
-	getGlobalFreeOnly,
-	getProviderRegistry,
-	isFreeModel,
-	registerWithGlobalToggle,
-};
+/**
+ * Pi-Free Providers Index
+ *
+ * Provides free model filtering for ALL providers (built-in + extension)
+ * plus unique free/paid providers not covered by pi's built-in providers.
+ *
+ * Unique providers:
+ * - Kilo: OAuth-based free models
+ * - Cline: Cline bot integration
+ * - NVIDIA: NVIDIA NIM hosting (free tier available)
+ * - Ollama Cloud: Ollama's cloud-hosted models with usage-based free tier
+ * - ZenMux: Unified AI API gateway with 200+ models
+ * - Codestral: Mistral's code-focused model via codestral.mistral.ai (free tier)
+ * - DeepInfra: AI inference cloud ($5 trial credit)
+ * - SambaNova: Fast inference on RDU hardware (free tier, no credit card)
+ * - Together: Fast inference on 200+ open-source models ($1 trial credit)
+ * - Routeway: OpenAI-compatible gateway with free `:free` models
+ * - TokenRouter: OpenAI-compatible gateway routing to 90+ models
+ * - LLM7: AI gateway (free default/fast selectors)
+ */
+import type { ExtensionAPI } from "@earendil-works/pi-coding-agent";
+import { setupBuiltInProviderToggles } from "./lib/built-in-toggle.ts";
+import { createLogger } from "./lib/logger.ts";
+import {
+	processQuotaResponse,
+	formatQuotaStatus,
+} from "./lib/quota-monitor.ts";
+import {
+	startModelCall,
+	recordModelCall,
+	getAllTelemetry,
+	getTelemetryPath,
+	clearTelemetry,
+} from "./lib/telemetry.ts";
+import {
+	applyGlobalFilter,
+	getGlobalFreeOnly,
+	getProviderRegistry,
+	isFreeModel,
+	registerWithGlobalToggle,
+} from "./lib/registry.ts";
+// Import unique provider extensions (only providers NOT built into pi)
+import cline from "./providers/cline/cline.ts";
+import codestral from "./providers/codestral/codestral.ts";
+import crofai from "./providers/crofai/crofai.ts";
+import kilo from "./providers/kilo/kilo.ts";
+import llm7 from "./providers/llm7/llm7.ts";
+import deepinfra from "./providers/deepinfra/deepinfra.ts";
+import sambanova from "./providers/sambanova/sambanova.ts";
+import together from "./providers/together/together.ts";
+import novita from "./providers/novita/novita.ts";
+import routeway from "./providers/routeway/routeway.ts";
+import tokenRouter from "./providers/tokenrouter/tokenrouter.ts";
+import ollama from "./providers/ollama/ollama.ts";
+import zenmux from "./providers/zenmux/zenmux.ts";
+import bai from "./providers/bai/bai.ts";
+const _logger = createLogger("pi-free");
+// =============================================================================
+// Global Commands
+// =============================================================================
+function setupGlobalCommands(pi: ExtensionAPI) {
+	// /toggle-free - Global free-only mode toggle
+	pi.registerCommand("toggle-free", {
+		description: "Toggle global free-only mode for all providers",
+		handler: async (_args, ctx) => {
+			const current = getGlobalFreeOnly();
+			const next = !current;
+			applyGlobalFilter(next, { force: true });
+			const registry = getProviderRegistry();
+			const providerCount = registry.size;
+			if (next) {
+				const totalFree = [...registry.values()].reduce(
+					(sum, e) => sum + e.stored.free.length,
+					0,
+				);
+				ctx.ui.notify(
+					`Free-only mode: ON (${totalFree} free models across ${providerCount} providers)`,
+					"info",
+				);
+			} else {
+				const totalAll = [...registry.values()].reduce(
+					(sum, e) => sum + (e.stored.all.length || e.stored.free.length),
+					0,
+				);
+				ctx.ui.notify(
+					`Free-only mode: OFF (all ${totalAll} models visible across ${providerCount} providers)`,
+					"info",
+				);
+			}
+		},
+	});
+	// /free-providers - Show free model counts by provider
+	pi.registerCommand("free-providers", {
+		description: "Show free/paid model counts for all pi-free providers",
+		handler: async (_args, ctx) => {
+			const lines = ["📊 Pi-Free Providers:", ""];
+			const registry = getProviderRegistry();
+			// Providers known to not expose pricing via API (all models show as "free")
+			// OpenRouter and OpenCode expose actual pricing
+			const noPricingApi = new Set([
+				"mistral",
+				"xai",
+				"huggingface",
+				"groq",
+				"cerebras",
+			]);
+			// Freemium providers - all models share a free tier quota
+			const freemiumProviders = new Set(["sambanova", "ollama-cloud"]);
+			// Trial credit providers - one-time credits, otherwise paid
+			const trialCreditProviders = new Set(["deepinfra"]);
+			for (const [id, entry] of registry) {
+				const free = entry.stored.free.length;
+				const all = entry.stored.all.length || free;
+				const indicator = entry.hasKey ? "🔑" : "🆓";
+				const paid = all - free;
+				if (freemiumProviders.has(id)) {
+					// Freemium: all models share a free tier (e.g., 1,000 reqs/month)
+					lines.push(`${indicator} ${id}: ${all} models (freemium)`);
+				} else if (trialCreditProviders.has(id)) {
+					// Trial credit: one-time credits, otherwise paid
+					lines.push(`${indicator} ${id}: ${all} models ($5 trial credit)`);
+				} else if (noPricingApi.has(id)) {
+					// Provider doesn't expose pricing - can't determine free vs paid
+					lines.push(
+						`${indicator} ${id}: ${all} models (pricing not exposed by API)`,
+					);
+				} else if (paid === 0 && free > 0) {
+					// All models are actually free
+					lines.push(`${indicator} ${id}: ${free} free models`);
+				} else {
+					// Mix of free and paid
+					lines.push(
+						`${indicator} ${id}: ${free} free / ${paid} paid (${all} total)`,
+					);
+				}
+			}
+			if (registry.size === 0) {
+				lines.push("(No providers registered yet)");
+			}
+			ctx.ui.notify(lines.join("\n"), "info");
+		},
+	});
+	// /telemetry — Show model telemetry data
+	pi.registerCommand("free-telemetry", {
+		description:
+			"Show real-world performance data for free models (tokens/s, latency, success rate)",
+		handler: async (_args, ctx) => {
+			const allTelemetry = getAllTelemetry();
+			const entries = Object.entries(allTelemetry);
+			if (entries.length === 0) {
+				ctx.ui.notify(
+					"No telemetry data yet. Use some free models first!",
+					"info",
+				);
+				return;
+			}
+			// Sort by total calls descending
+			entries.sort((a, b) => b[1].totalCalls - a[1].totalCalls);
+			const lines = ["📊 Model Telemetry:", ""];
+			lines.push(
+				`${`Model`.padEnd(40)} ${`Calls`.padEnd(6)} ${`OK%`.padEnd(6)} ${`Lat`.padEnd(7)} ${`tok/s`.padEnd(7)} ${`Cost`}`,
+			);
+			lines.push(`─`.repeat(75));
+			for (const [key, t] of entries.slice(0, 20)) {
+				const name = key.length > 38 ? key.slice(0, 35) + "..." : key;
+				const calls = String(t.totalCalls).padStart(5);
+				const ok = `${t.successRate}%`.padStart(5);
+				const lat =
+					t.avgLatencyMs > 0
+						? `${t.avgLatencyMs}ms`.padStart(6)
+						: "—".padStart(6);
+				const tps =
+					t.avgTokensPerSecond > 0
+						? `${t.avgTokensPerSecond}`.padStart(6)
+						: "—".padStart(6);
+				const cost =
+					t.totalCost > 0
+						? `$${t.totalCost.toFixed(4)}`.padStart(8)
+						: "free".padStart(8);
+				lines.push(`${name.padEnd(40)} ${calls} ${ok} ${lat} ${tps} ${cost}`);
+			}
+			lines.push("", `File: ${getTelemetryPath()}`);
+			ctx.ui.notify(lines.join("\n"), "info");
+		},
+	});
+	// /clear-free-telemetry — Clear all telemetry data
+	pi.registerCommand("clear-free-telemetry", {
+		description: "Clear all model telemetry data",
+		handler: async (_args, ctx) => {
+			await clearTelemetry();
+			ctx.ui.notify("Telemetry data cleared", "info");
+		},
+	});
+}
+// =============================================================================
+// Quota Monitoring
+// =============================================================================
+function setupQuotaMonitoring(pi: ExtensionAPI) {
+	// Capture rate-limit headers from every provider response
+	// eslint-disable-next-line @typescript-eslint/no-explicit-any
+	(pi as any).on(
+		"after_provider_response",
+		(event: { status: number; headers: Record<string, string> }, ctx: any) => {
+			const providerId = ctx.model?.provider;
+			if (!providerId) return;
+			processQuotaResponse(providerId, event.headers);
+			// Update status bar with quota for the active provider
+			const status = formatQuotaStatus(providerId);
+			if (status) {
+				ctx.ui.setStatus("quota", status);
+			}
+		},
+	);
+	// Clear quota status when switching away from a provider
+	pi.on("model_select", (_event, ctx) => {
+		const providerId = ctx.model?.provider;
+		if (!providerId) {
+			ctx.ui.setStatus("quota", undefined);
+			return;
+		}
+		// Show cached quota on provider switch (if still fresh)
+		const status = formatQuotaStatus(providerId);
+		ctx.ui.setStatus("quota", status);
+	});
+}
+// =============================================================================
+// Model Telemetry
+// =============================================================================
+function setupTelemetry(pi: ExtensionAPI) {
+	// Only track telemetry for FREE models (uses same isFreeModel logic as model filtering)
+	// eslint-disable-next-line @typescript-eslint/no-explicit-any
+	(pi as any).on("before_agent_start", (_event: any, ctx: any) => {
+		if (!ctx.model) return;
+		if (!isFreeModel(ctx.model as any)) return;
+		const provider = ctx.model?.provider;
+		const model = ctx.model?.id;
+		if (provider && model) {
+			startModelCall(provider, model);
+		}
+	});
+	// Record telemetry when a turn completes
+	pi.on("turn_end", async (event, ctx) => {
+		if (!ctx.model) return;
+		if (!isFreeModel(ctx.model as any)) return;
+		const msg = (
+			event as {
+				message?: {
+					role?: string;
+					model?: string;
+					usage?: {
+						input?: number;
+						output?: number;
+						totalTokens?: number;
+						cost?: { total?: number };
+					};
+					stopReason?: string;
+					errorMessage?: string;
+				};
+			}
+		).message;
+		if (msg?.role !== "assistant") return;
+		const provider = ctx.model?.provider;
+		const model = msg.model || ctx.model?.id;
+		if (!provider || !model) return;
+		const usage = msg.usage;
+		const inputTokens = usage?.input ?? 0;
+		const outputTokens = usage?.output ?? 0;
+		const totalTokens = usage?.totalTokens ?? inputTokens + outputTokens;
+		const cost = usage?.cost?.total ?? 0;
+		const isError = msg.stopReason === "error" || !!msg.errorMessage;
+		await recordModelCall(
+			provider,
+			model,
+			{ input: inputTokens, output: outputTokens, totalTokens },
+			cost,
+			{
+				success: !isError,
+				stopReason: msg.stopReason,
+				errorMessage: msg.errorMessage,
+			},
+		);
+	});
+}
+// =============================================================================
+// Main Entry Point
+// =============================================================================
+export default async function piFreeEntry(pi: ExtensionAPI) {
+	const globalFreeOnly = getGlobalFreeOnly();
+	_logger.info(`[pi-free] Initializing (global free-only: ${globalFreeOnly})`);
+	// Setup global commands first
+	setupGlobalCommands(pi);
+	// Setup quota monitoring (passive, no extra API calls)
+	setupQuotaMonitoring(pi);
+	// Setup model telemetry (tracks real-world performance)
+	setupTelemetry(pi);
+	// Load all unique providers
+	// Each provider will register itself with the global toggle system
+	await Promise.allSettled([
+		kilo(pi),
+		ollama(pi),
+		cline(pi),
+		zenmux(pi),
+		crofai(pi),
+		codestral(pi),
+		llm7(pi),
+		deepinfra(pi),
+		sambanova(pi),
+		together(pi),
+		novita(pi),
+		routeway(pi),
+		tokenRouter(pi),
+		bai(pi),
+	]);
+	// Setup dynamic built-in providers (Mistral, Groq, Cerebras, xAI, Hugging Face,
+	// OpenRouter/OpenCode from Pi auth, and FastRouter public model discovery)
+	const { setupDynamicBuiltInProviders } = await import(
+		"./providers/dynamic-built-in/index.ts"
+	);
+	await setupDynamicBuiltInProviders(pi);
+	// Setup toggles for pi's built-in providers (e.g., OpenCode)
+	setupBuiltInProviderToggles(pi);
+	// Apply initial global filter if free-only mode is enabled
+	if (globalFreeOnly) {
+		_logger.info("[pi-free] Applying initial free-only filter");
+		applyGlobalFilter(true);
+	}
+	const registry = getProviderRegistry();
+	_logger.info(`[pi-free] Loaded with ${registry.size} providers`);
+}
+// Re-export registry helpers so consumers don't need deep imports
+export {
+	applyGlobalFilter,
+	getGlobalFreeOnly,
+	getProviderRegistry,
+	isFreeModel,
+	registerWithGlobalToggle,
+};