npm - @jupyterlite/ai - Versions diffs - 0.15.0 → 0.16.0 - Mend

@jupyterlite/ai 0.15.0 → 0.16.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (36) hide show

package/lib/agent.d.ts +5 -1
package/lib/agent.js +53 -7
package/lib/chat-model.js +8 -2
package/lib/components/index.d.ts +1 -1
package/lib/components/index.js +1 -1
package/lib/components/{token-usage-display.d.ts → usage-display.d.ts} +11 -11
package/lib/components/usage-display.js +109 -0
package/lib/index.js +5 -5
package/lib/models/settings-model.js +1 -0
package/lib/providers/built-in-providers.js +5 -0
package/lib/providers/generated-context-windows.d.ts +8 -0
package/lib/providers/generated-context-windows.js +96 -0
package/lib/providers/model-info.d.ts +3 -0
package/lib/providers/model-info.js +58 -0
package/lib/tokens.d.ts +21 -0
package/lib/tokens.js +7 -7
package/lib/widgets/ai-settings.js +9 -0
package/lib/widgets/main-area-chat.js +3 -3
package/lib/widgets/provider-config-dialog.js +18 -5
package/package.json +3 -2
package/schema/settings-model.json +11 -0
package/src/agent.ts +79 -7
package/src/chat-model.ts +7 -4
package/src/components/index.ts +1 -1
package/src/components/usage-display.tsx +208 -0
package/src/index.ts +5 -9
package/src/models/settings-model.ts +1 -0
package/src/providers/built-in-providers.ts +5 -0
package/src/providers/generated-context-windows.ts +102 -0
package/src/providers/model-info.ts +88 -0
package/src/tokens.ts +33 -7
package/src/widgets/ai-settings.tsx +42 -0
package/src/widgets/main-area-chat.ts +3 -3
package/src/widgets/provider-config-dialog.tsx +45 -5
package/lib/components/token-usage-display.js +0 -72
package/src/components/token-usage-display.tsx +0 -137

package/lib/agent.d.ts CHANGED Viewed

@@ -160,9 +160,13 @@ export declare class AgentManager implements IAgentManager {
      */
     generateResponse(message: string): Promise<void>;
     /**
-     * Updates token usage statistics.
+     * Updates cumulative token usage statistics from a completed model step.
      */
     private _updateTokenUsage;
+    /**
+     * Gets the configured context window for the active provider.
+     */
+    private _getActiveContextWindow;
     /**
      * Initializes the AI agent with current settings and tools.
      * Sets up the agent with model configuration, tools, and MCP tools.

package/lib/agent.js CHANGED Viewed

@@ -3,6 +3,7 @@ import { PromiseDelegate } from '@lumino/coreutils';
 import { Signal } from '@lumino/signaling';
 import { ToolLoopAgent, stepCountIs } from 'ai';
 import { createModel } from './providers/models';
+import { getEffectiveContextWindow } from './providers/model-info';
 import { createProviderTools } from './providers/provider-tools';
 import { SECRETS_NAMESPACE } from './tokens';
 /**
@@ -256,7 +257,14 @@ export class AgentManager {
         return this._activeProvider;
     }
     set activeProvider(value) {
+        const previousProvider = this._activeProvider;
         this._activeProvider = value;
+        // Reset request-level context estimate only when switching between providers.
+        if (previousProvider && previousProvider !== value) {
+            this._tokenUsage.lastRequestInputTokens = undefined;
+        }
+        this._tokenUsage.contextWindow = this._getActiveContextWindow();
+        this._tokenUsageChanged.emit(this._tokenUsage);
         this.initializeAgent();
         this._activeProviderChanged.emit(this._activeProvider);
     }
@@ -315,7 +323,11 @@ export class AgentManager {
         await this._streaming.promise;
         // Clear history and token usage
         this._history = [];
-        this._tokenUsage = { inputTokens: 0, outputTokens: 0 };
+        this._tokenUsage = {
+            inputTokens: 0,
+            outputTokens: 0,
+            contextWindow: this._getActiveContextWindow()
+        };
         this._tokenUsageChanged.emit(this._tokenUsage);
     }
     /**
@@ -420,9 +432,20 @@ export class AgentManager {
                     abortSignal: this._controller.signal
                 });
                 const streamResult = await this._processStreamResult(result);
-                // Get response messages and update token usage
+                if (streamResult.aborted) {
+                    try {
+                        const responseMessages = await result.response;
+                        if (responseMessages.messages?.length) {
+                            this._history.push(...Private.sanitizeModelMessages(responseMessages.messages));
+                        }
+                    }
+                    catch {
+                        // Aborting before a step finishes leaves no completed response to persist.
+                    }
+                    break;
+                }
+                // Get response messages for completed steps.
                 const responseMessages = await result.response;
-                this._updateTokenUsage(await result.usage);
                 // Add response messages to history
                 if (responseMessages.messages?.length) {
                     responseHistory.push(...responseMessages.messages);
@@ -462,14 +485,25 @@ export class AgentManager {
         }
     }
     /**
-     * Updates token usage statistics.
+     * Updates cumulative token usage statistics from a completed model step.
      */
-    _updateTokenUsage(usage) {
+    _updateTokenUsage(usage, lastRequestInputTokens) {
+        const contextWindow = this._getActiveContextWindow();
+        const estimatedRequestInputTokens = lastRequestInputTokens ?? usage?.inputTokens;
         if (usage) {
             this._tokenUsage.inputTokens += usage.inputTokens ?? 0;
             this._tokenUsage.outputTokens += usage.outputTokens ?? 0;
-            this._tokenUsageChanged.emit(this._tokenUsage);
         }
+        this._tokenUsage.lastRequestInputTokens = estimatedRequestInputTokens;
+        this._tokenUsage.contextWindow = contextWindow;
+        this._tokenUsageChanged.emit(this._tokenUsage);
+    }
+    /**
+     * Gets the configured context window for the active provider.
+     */
+    _getActiveContextWindow() {
+        const activeProviderConfig = this._settingsModel.getProvider(this._activeProvider);
+        return getEffectiveContextWindow(activeProviderConfig, this._providerRegistry);
     }
     /**
      * Initializes the AI agent with current settings and tools.
@@ -521,6 +555,9 @@ export class AgentManager {
         const activeProviderInfo = activeProviderConfig && this._providerRegistry
             ? this._providerRegistry.getProviderInfo(activeProviderConfig.provider)
             : null;
+        const contextWindow = getEffectiveContextWindow(activeProviderConfig, this._providerRegistry);
+        this._tokenUsage.contextWindow = contextWindow;
+        this._tokenUsageChanged.emit(this._tokenUsage);
         const temperature = activeProviderConfig?.parameters?.temperature ?? DEFAULT_TEMPERATURE;
         const maxTokens = activeProviderConfig?.parameters?.maxOutputTokens;
         const maxTurns = activeProviderConfig?.parameters?.maxTurns ?? DEFAULT_MAX_TURNS;
@@ -599,7 +636,10 @@ ${richOutputWorkflowInstruction}`;
     async _processStreamResult(result) {
         let fullResponse = '';
         let currentMessageId = null;
-        const processResult = { approvalProcessed: false };
+        const processResult = {
+            approvalProcessed: false,
+            aborted: false
+        };
         for await (const part of result.fullStream) {
             switch (part.type) {
                 case 'text-delta':
@@ -654,6 +694,12 @@ ${richOutputWorkflowInstruction}`;
                     }
                     await this._handleApprovalRequest(part, processResult);
                     break;
+                case 'finish-step':
+                    this._updateTokenUsage(part.usage, part.usage.inputTokens);
+                    break;
+                case 'abort':
+                    processResult.aborted = true;
+                    break;
                 // Ignore: text-start, text-end, finish, error, and others
                 default:
                     break;

package/lib/chat-model.js CHANGED Viewed

@@ -258,7 +258,7 @@ export class AIChatModel extends AbstractChatModel {
             return false;
         }
         const contentModel = await this._contentsManager
-            .get(filepath, { content: true })
+            .get(filepath, { content: true, type: 'file', format: 'text' })
             .catch(() => {
             if (!silent) {
                 console.log(`There is no backup for chat '${this.name}'`);
@@ -268,7 +268,13 @@ export class AIChatModel extends AbstractChatModel {
         if (!contentModel) {
             return false;
         }
-        const content = JSON.parse(contentModel.content);
+        let content;
+        try {
+            content = JSON.parse(contentModel.content);
+        }
+        catch (e) {
+            throw `Error when parsing the chat ${filepath}\n${e}`;
+        }
         if (content.metadata?.provider) {
             if (this._settingsModel.getProvider(content.metadata.provider)) {
                 this._agentManager.activeProvider = content.metadata.provider;

package/lib/components/index.d.ts CHANGED Viewed

@@ -2,5 +2,5 @@ export * from './clear-button';
 export * from './completion-status';
 export * from './model-select';
 export * from './stop-button';
-export * from './token-usage-display';
+export * from './usage-display';
 export * from './tool-select';

package/lib/components/index.js CHANGED Viewed

@@ -2,5 +2,5 @@ export * from './clear-button';
 export * from './completion-status';
 export * from './model-select';
 export * from './stop-button';
-export * from './token-usage-display';
+export * from './usage-display';
 export * from './tool-select';

package/lib/components/{token-usage-display.d.ts → usage-display.d.ts} RENAMED Viewed

@@ -4,9 +4,9 @@ import React from 'react';
 import { ISignal } from '@lumino/signaling';
 import type { IAISettingsModel, ITokenUsage } from '../tokens';
 /**
- * Props for the TokenUsageDisplay component.
+ * Props for the UsageDisplay component.
  */
-export interface ITokenUsageDisplayProps {
+export interface IUsageDisplayProps {
     /**
      * The token usage changed signal
      */
@@ -25,24 +25,24 @@ export interface ITokenUsageDisplayProps {
     translator: TranslationBundle;
 }
 /**
- * React component that displays token usage information.
- * Shows input/output token counts with up/down arrows.
- * Only renders when token usage display is enabled in settings.
+ * React component that displays usage information.
+ * Shows input/output token counts and optional estimated context usage.
+ * Only renders when token or context usage display is enabled in settings.
  */
-export declare const TokenUsageDisplay: React.FC<ITokenUsageDisplayProps>;
+export declare const UsageDisplay: React.FC<IUsageDisplayProps>;
 /**
- * JupyterLab widget wrapper for the TokenUsageDisplay component.
+ * JupyterLab widget wrapper for the UsageDisplay component.
  * Extends ReactWidget to integrate with the JupyterLab widget system.
  */
-export declare class TokenUsageWidget extends ReactWidget {
+export declare class UsageWidget extends ReactWidget {
     /**
-     * Creates a new TokenUsageWidget instance.
+     * Creates a new UsageWidget instance.
      * @param options - Configuration options containing required models
      */
-    constructor(options: ITokenUsageDisplayProps);
+    constructor(options: IUsageDisplayProps);
     /**
      * Renders the React component within the widget.
-     * @returns The TokenUsageDisplay React element
+     * @returns The UsageDisplay React element
      */
     protected render(): React.ReactElement;
     private _options;

package/lib/components/usage-display.js ADDED Viewed

@@ -0,0 +1,109 @@
+import { ReactWidget, UseSignal } from '@jupyterlab/ui-components';
+import React from 'react';
+/**
+ * React component that displays usage information.
+ * Shows input/output token counts and optional estimated context usage.
+ * Only renders when token or context usage display is enabled in settings.
+ */
+export const UsageDisplay = ({ tokenUsageChanged, settingsModel, initialTokenUsage, translator: trans }) => {
+    const formatContextPercent = (value) => {
+        return Math.round(value).toLocaleString();
+    };
+    const badgeStyle = {
+        display: 'flex',
+        alignItems: 'center',
+        gap: '6px',
+        fontSize: '12px',
+        color: 'var(--jp-ui-font-color2)',
+        padding: '4px 8px',
+        backgroundColor: 'var(--jp-layout-color1)',
+        border: '1px solid var(--jp-border-color1)',
+        borderRadius: '4px',
+        whiteSpace: 'nowrap'
+    };
+    return (React.createElement(UseSignal, { signal: settingsModel.stateChanged, initialArgs: undefined }, () => {
+        const config = settingsModel.config;
+        const showTokenUsage = config.showTokenUsage;
+        const showContextUsage = config.showContextUsage;
+        if (!showTokenUsage && !showContextUsage) {
+            return null;
+        }
+        return (React.createElement(UseSignal, { signal: tokenUsageChanged, initialArgs: initialTokenUsage }, (_, tokenUsage) => {
+            if (!tokenUsage) {
+                return null;
+            }
+            const total = tokenUsage.inputTokens + tokenUsage.outputTokens;
+            const hasKnownContextWindow = showContextUsage && tokenUsage.contextWindow !== undefined;
+            const contextUsagePercent = tokenUsage.lastRequestInputTokens !== undefined &&
+                tokenUsage.contextWindow !== undefined &&
+                tokenUsage.contextWindow > 0
+                ? Math.max(0, Math.min(100, (tokenUsage.lastRequestInputTokens /
+                    tokenUsage.contextWindow) *
+                    100))
+                : undefined;
+            const hasContextEstimate = hasKnownContextWindow &&
+                contextUsagePercent !== undefined &&
+                tokenUsage.lastRequestInputTokens !== undefined;
+            const contextLabel = hasContextEstimate
+                ? `${formatContextPercent(contextUsagePercent)}%`
+                : hasKnownContextWindow
+                    ? '0%'
+                    : '?';
+            const contextTitle = hasContextEstimate
+                ? trans.__('Context Usage (estimated): %1% (%2 / %3 tokens)', formatContextPercent(contextUsagePercent), tokenUsage.lastRequestInputTokens.toLocaleString(), tokenUsage.contextWindow.toLocaleString())
+                : hasKnownContextWindow
+                    ? trans.__('Context usage estimate will appear after the next request. Showing 0% until then. Context window: %1 tokens', tokenUsage.contextWindow.toLocaleString())
+                    : trans.__('Context Usage unavailable. Configure a context window for the active provider/model to enable estimation.');
+            return (React.createElement("div", { style: {
+                    display: 'flex',
+                    alignItems: 'center',
+                    gap: '6px'
+                } },
+                showTokenUsage && (React.createElement("span", { style: badgeStyle, title: trans.__('Token Usage - Sent: %1, Received: %2, Total: %3', tokenUsage.inputTokens.toLocaleString(), tokenUsage.outputTokens.toLocaleString(), total.toLocaleString()) },
+                    React.createElement("span", { style: {
+                            display: 'flex',
+                            alignItems: 'center',
+                            gap: '2px'
+                        } },
+                        React.createElement("span", null, "\u2191"),
+                        React.createElement("span", null, tokenUsage.inputTokens.toLocaleString())),
+                    React.createElement("span", { style: {
+                            display: 'flex',
+                            alignItems: 'center',
+                            gap: '2px'
+                        } },
+                        React.createElement("span", null, "\u2193"),
+                        React.createElement("span", null, tokenUsage.outputTokens.toLocaleString())))),
+                showContextUsage && (React.createElement("span", { style: badgeStyle, title: contextTitle },
+                    React.createElement("span", { style: {
+                            display: 'flex',
+                            alignItems: 'center',
+                            gap: '2px'
+                        } },
+                        React.createElement("span", null, "ctx"),
+                        React.createElement("span", null, contextLabel))))));
+        }));
+    }));
+};
+/**
+ * JupyterLab widget wrapper for the UsageDisplay component.
+ * Extends ReactWidget to integrate with the JupyterLab widget system.
+ */
+export class UsageWidget extends ReactWidget {
+    /**
+     * Creates a new UsageWidget instance.
+     * @param options - Configuration options containing required models
+     */
+    constructor(options) {
+        super();
+        this._options = options;
+    }
+    /**
+     * Renders the React component within the widget.
+     * @returns The UsageDisplay React element
+     */
+    render() {
+        return React.createElement(UsageDisplay, { ...this._options });
+    }
+    _options;
+}

package/lib/index.js CHANGED Viewed

@@ -25,7 +25,7 @@ import { ChatModelHandler } from './chat-model-handler';
 import { CommandIds, IAgentManagerFactory, IAISettingsModel, IChatModelHandler, IDiffManager, IProviderRegistry, IToolRegistry, ISkillRegistry, SECRETS_NAMESPACE } from './tokens';
 import { anthropicProvider, googleProvider, mistralProvider, openaiProvider, genericProvider } from './providers/built-in-providers';
 import { AICompletionProvider } from './completion';
-import { clearItem, createModelSelectItem, createToolSelectItem, stopItem, CompletionStatusWidget, TokenUsageWidget } from './components';
+import { clearItem, createModelSelectItem, createToolSelectItem, stopItem, CompletionStatusWidget, UsageWidget } from './components';
 import { AISettingsModel } from './models/settings-model';
 import { loadSkillsFromPaths, SkillRegistry } from './skills';
 import { DiffManager } from './diff-manager';
@@ -338,7 +338,7 @@ const plugin = {
             app.commands.commandChanged.connect(onCommandChanged);
             chatPanel.disposed.connect(disconnectSettingsButtonListener);
         }
-        let tokenUsageWidget = null;
+        let usageWidget = null;
         chatPanel.chatOpened.connect((_, widget) => {
             const model = widget.model;
             // Add the widget to the tracker.
@@ -351,14 +351,14 @@ const plugin = {
             // Update the tracker if the active provider changed.
             model.agentManager.activeProviderChanged.connect(saveTracker);
             // Update the token usage widget.
-            tokenUsageWidget?.dispose();
-            tokenUsageWidget = new TokenUsageWidget({
+            usageWidget?.dispose();
+            usageWidget = new UsageWidget({
                 tokenUsageChanged: model.tokenUsageChanged,
                 settingsModel,
                 initialTokenUsage: model.agentManager.tokenUsage,
                 translator: trans
             });
-            chatPanel.current?.toolbar.insertBefore('markRead', 'token-usage', tokenUsageWidget);
+            chatPanel.current?.toolbar.insertBefore('markRead', 'usage', usageWidget);
             if (model.saveAvailable) {
                 const saveChatButton = new SaveComponentWidget({
                     model,

package/lib/models/settings-model.js CHANGED Viewed

@@ -13,6 +13,7 @@ export class AISettingsModel extends VDomModel {
         toolsEnabled: true,
         sendWithShiftEnter: false,
         showTokenUsage: false,
+        showContextUsage: false,
         showCellDiff: true,
         showFileDiff: true,
         diffDisplayMode: 'split',

package/lib/providers/built-in-providers.js CHANGED Viewed

@@ -3,6 +3,7 @@ import { createGoogleGenerativeAI } from '@ai-sdk/google';
 import { createMistral } from '@ai-sdk/mistral';
 import { createOpenAI } from '@ai-sdk/openai';
 import { createOpenAICompatible } from '@ai-sdk/openai-compatible';
+import { BUILT_IN_PROVIDER_MODEL_INFO } from './generated-context-windows';
 /**
  * Anthropic provider
  */
@@ -26,6 +27,7 @@ export const anthropicProvider = {
         'claude-sonnet-4-0',
         'claude-sonnet-4-20250514'
     ],
+    modelInfo: BUILT_IN_PROVIDER_MODEL_INFO.anthropic,
     supportsBaseURL: true,
     supportsHeaders: true,
     providerToolCapabilities: {
@@ -72,6 +74,7 @@ export const googleProvider = {
         'gemini-flash-latest',
         'gemini-flash-lite-latest'
     ],
+    modelInfo: BUILT_IN_PROVIDER_MODEL_INFO.google,
     supportsBaseURL: true,
     factory: (options) => {
         if (!options.apiKey) {
@@ -107,6 +110,7 @@ export const mistralProvider = {
         'codestral-latest',
         'devstral-latest'
     ],
+    modelInfo: BUILT_IN_PROVIDER_MODEL_INFO.mistral,
     supportsBaseURL: true,
     factory: (options) => {
         if (!options.apiKey) {
@@ -175,6 +179,7 @@ export const openaiProvider = {
         'gpt-3.5-turbo',
         'gpt-3.5-turbo-0125'
     ],
+    modelInfo: BUILT_IN_PROVIDER_MODEL_INFO.openai,
     supportsBaseURL: true,
     supportsHeaders: true,
     providerToolCapabilities: {

package/lib/providers/generated-context-windows.d.ts ADDED Viewed

@@ -0,0 +1,8 @@
+/**
+ * This file is generated by `jlpm sync:model-context-windows`.
+ * Source: https://models.dev/api.json
+ * Backed by: https://github.com/anomalyco/models.dev
+ * Generated: 2026-04-08T16:23:34.080Z
+ */
+import type { IProviderModelInfo } from '../tokens';
+export declare const BUILT_IN_PROVIDER_MODEL_INFO: Record<string, Record<string, IProviderModelInfo>>;

package/lib/providers/generated-context-windows.js ADDED Viewed

@@ -0,0 +1,96 @@
+/**
+ * This file is generated by `jlpm sync:model-context-windows`.
+ * Source: https://models.dev/api.json
+ * Backed by: https://github.com/anomalyco/models.dev
+ * Generated: 2026-04-08T16:23:34.080Z
+ */
+export const BUILT_IN_PROVIDER_MODEL_INFO = {
+    anthropic: {
+        'claude-opus-4-6': { contextWindow: 1000000 },
+        'claude-sonnet-4-6': { contextWindow: 1000000 },
+        'claude-opus-4-5': { contextWindow: 200000 },
+        'claude-opus-4-5-20251101': { contextWindow: 200000 },
+        'claude-sonnet-4-5': { contextWindow: 200000 },
+        'claude-sonnet-4-5-20250929': { contextWindow: 200000 },
+        'claude-haiku-4-5': { contextWindow: 200000 },
+        'claude-haiku-4-5-20251001': { contextWindow: 200000 },
+        'claude-opus-4-1': { contextWindow: 200000 },
+        'claude-opus-4-1-20250805': { contextWindow: 200000 },
+        'claude-opus-4-0': { contextWindow: 200000 },
+        'claude-opus-4-20250514': { contextWindow: 200000 },
+        'claude-sonnet-4-0': { contextWindow: 200000 },
+        'claude-sonnet-4-20250514': { contextWindow: 200000 }
+    },
+    google: {
+        'gemini-3.1-pro-preview': { contextWindow: 1048576 },
+        'gemini-3.1-pro-preview-customtools': { contextWindow: 1048576 },
+        'gemini-3.1-flash-image-preview': { contextWindow: 131072 },
+        'gemini-3.1-flash-lite-preview': { contextWindow: 1048576 },
+        'gemini-3-flash-preview': { contextWindow: 1048576 },
+        'gemini-2.5-pro': { contextWindow: 1048576 },
+        'gemini-2.5-flash': { contextWindow: 1048576 },
+        'gemini-2.5-flash-image': { contextWindow: 32768 },
+        'gemini-2.5-flash-lite': { contextWindow: 1048576 },
+        'gemini-flash-latest': { contextWindow: 1048576 },
+        'gemini-flash-lite-latest': { contextWindow: 1048576 }
+    },
+    mistral: {
+        'mistral-large-latest': { contextWindow: 262144 },
+        'mistral-medium-latest': { contextWindow: 128000 },
+        'mistral-medium-2508': { contextWindow: 262144 },
+        'mistral-small-latest': { contextWindow: 256000 },
+        'mistral-small-2506': { contextWindow: 128000 },
+        'ministral-3b-latest': { contextWindow: 128000 },
+        'ministral-8b-latest': { contextWindow: 128000 },
+        'magistral-small-latest': { contextWindow: 128000 },
+        'magistral-medium-latest': { contextWindow: 128000 },
+        'pixtral-large-latest': { contextWindow: 128000 },
+        'codestral-latest': { contextWindow: 256000 },
+        'devstral-latest': { contextWindow: 262144 },
+        'devstral-2512': { contextWindow: 262144 }
+    },
+    openai: {
+        'gpt-5.4': { contextWindow: 1050000 },
+        'gpt-5.4-mini': { contextWindow: 400000 },
+        'gpt-5.4-nano': { contextWindow: 400000 },
+        'gpt-5.2': { contextWindow: 400000 },
+        'gpt-5.2-2025-12-11': { contextWindow: 400000 },
+        'gpt-5.2-chat-latest': { contextWindow: 128000 },
+        'gpt-5.2-pro': { contextWindow: 400000 },
+        'gpt-5.2-pro-2025-12-11': { contextWindow: 400000 },
+        'gpt-5.2-codex': { contextWindow: 400000 },
+        'gpt-5.1': { contextWindow: 400000 },
+        'gpt-5.1-2025-11-13': { contextWindow: 400000 },
+        'gpt-5.1-chat-latest': { contextWindow: 128000 },
+        'gpt-5': { contextWindow: 400000 },
+        'gpt-5-2025-08-07': { contextWindow: 400000 },
+        'gpt-5-chat-latest': { contextWindow: 400000 },
+        'gpt-5-mini': { contextWindow: 400000 },
+        'gpt-5-mini-2025-08-07': { contextWindow: 400000 },
+        'gpt-5-nano': { contextWindow: 400000 },
+        'gpt-5-nano-2025-08-07': { contextWindow: 400000 },
+        'o4-mini': { contextWindow: 200000 },
+        'o4-mini-2025-04-16': { contextWindow: 200000 },
+        'o3-pro': { contextWindow: 200000 },
+        o3: { contextWindow: 200000 },
+        'o3-2025-04-16': { contextWindow: 200000 },
+        'o3-mini': { contextWindow: 200000 },
+        'o3-mini-2025-01-31': { contextWindow: 200000 },
+        o1: { contextWindow: 200000 },
+        'o1-2024-12-17': { contextWindow: 200000 },
+        'gpt-4.1': { contextWindow: 1047576 },
+        'gpt-4.1-2025-04-14': { contextWindow: 1047576 },
+        'gpt-4.1-mini': { contextWindow: 1047576 },
+        'gpt-4.1-mini-2025-04-14': { contextWindow: 1047576 },
+        'gpt-4.1-nano': { contextWindow: 1047576 },
+        'gpt-4.1-nano-2025-04-14': { contextWindow: 1047576 },
+        'gpt-4o': { contextWindow: 128000 },
+        'gpt-4o-2024-05-13': { contextWindow: 128000 },
+        'gpt-4o-2024-08-06': { contextWindow: 128000 },
+        'gpt-4o-2024-11-20': { contextWindow: 128000 },
+        'gpt-4o-mini': { contextWindow: 128000 },
+        'gpt-4o-mini-2024-07-18': { contextWindow: 128000 },
+        'gpt-3.5-turbo': { contextWindow: 16385 },
+        'gpt-3.5-turbo-0125': { contextWindow: 16385 }
+    }
+};

package/lib/providers/model-info.d.ts ADDED Viewed

@@ -0,0 +1,3 @@
+import type { IProviderConfig, IProviderInfo, IProviderModelInfo, IProviderRegistry } from '../tokens';
+export declare function getProviderModelInfo(providerInfo: IProviderInfo | null | undefined, model: string | undefined): IProviderModelInfo | undefined;
+export declare function getEffectiveContextWindow(providerConfig: IProviderConfig | undefined, providerRegistry?: IProviderRegistry): number | undefined;

package/lib/providers/model-info.js ADDED Viewed

@@ -0,0 +1,58 @@
+const DATE_SUFFIX = /^(.*)-\d{4}-\d{2}-\d{2}$/;
+const SHORT_VERSION_SUFFIX = /^(.*)-\d{4}$/;
+// Treat rolling aliases and dated releases as the same model family so they
+// can share provider metadata such as context windows.
+function normalizeModelId(modelId) {
+    if (modelId.endsWith('-latest')) {
+        return modelId.slice(0, -7);
+    }
+    const dateSuffixMatch = modelId.match(DATE_SUFFIX);
+    if (dateSuffixMatch) {
+        return dateSuffixMatch[1];
+    }
+    const shortVersionSuffixMatch = modelId.match(SHORT_VERSION_SUFFIX);
+    if (shortVersionSuffixMatch) {
+        return shortVersionSuffixMatch[1];
+    }
+    return modelId;
+}
+function getCandidateModelIds(modelId) {
+    const candidates = [modelId];
+    const normalizedModelId = normalizeModelId(modelId);
+    candidates.push(normalizedModelId);
+    if (normalizedModelId !== modelId) {
+        candidates.push(`${normalizedModelId}-latest`);
+    }
+    return [...new Set(candidates)];
+}
+export function getProviderModelInfo(providerInfo, model) {
+    if (!providerInfo || !model) {
+        return undefined;
+    }
+    const modelInfo = providerInfo.modelInfo;
+    if (!modelInfo) {
+        return undefined;
+    }
+    for (const candidateId of getCandidateModelIds(model)) {
+        if (modelInfo[candidateId]) {
+            return modelInfo[candidateId];
+        }
+    }
+    const normalizedModelId = normalizeModelId(model);
+    // As a last resort, match any known model entry that normalizes to the same
+    // base ID, even if the exact alias/version string differs.
+    return Object.entries(modelInfo).find(([candidateId]) => {
+        return normalizeModelId(candidateId) === normalizedModelId;
+    })?.[1];
+}
+export function getEffectiveContextWindow(providerConfig, providerRegistry) {
+    if (!providerConfig) {
+        return undefined;
+    }
+    if (providerConfig.parameters?.contextWindow !== undefined) {
+        return providerConfig.parameters.contextWindow;
+    }
+    const providerInfo = providerRegistry?.getProviderInfo(providerConfig.provider);
+    return getProviderModelInfo(providerInfo, providerConfig.model)
+        ?.contextWindow;
+}

package/lib/tokens.d.ts CHANGED Viewed

@@ -153,6 +153,12 @@ export interface IProviderToolCapabilities {
 /**
  * Provider information
  */
+export interface IProviderModelInfo {
+    /**
+     * Default context window for the model in tokens.
+     */
+    contextWindow?: number;
+}
 export interface IProviderInfo {
     /**
      * Unique identifier for the provider
@@ -173,6 +179,10 @@ export interface IProviderInfo {
      * Default model names for this provider
      */
     defaultModels: string[];
+    /**
+     * Optional per-model metadata keyed by model ID.
+     */
+    modelInfo?: Record<string, IProviderModelInfo>;
     /**
      * Whether this provider supports custom base URLs
      */
@@ -246,6 +256,7 @@ export interface IProviderParameters {
     temperature?: number;
     maxOutputTokens?: number;
     maxTurns?: number;
+    contextWindow?: number;
     supportsFillInMiddle?: boolean;
     useFilterText?: boolean;
 }
@@ -282,6 +293,7 @@ export interface IAIConfig {
     toolsEnabled: boolean;
     sendWithShiftEnter: boolean;
     showTokenUsage: boolean;
+    showContextUsage: boolean;
     commandsRequiringApproval: string[];
     commandsAutoRenderMimeBundles: string[];
     trustedMimeTypesForAutoRender: string[];
@@ -633,6 +645,15 @@ export interface ITokenUsage {
      * Number of output tokens generated (completion tokens)
      */
     outputTokens: number;
+    /**
+     * Estimated prompt tokens used by the most recent model request.
+     * This is based on the final step of the latest request.
+     */
+    lastRequestInputTokens?: number;
+    /**
+     * Configured context window size for the active provider/model.
+     */
+    contextWindow?: number;
 }
 /**
  * The string that replaces a secret key in settings.