npm - claude-connect - Versions diffs - 0.1.8 → 0.1.10 - Mend

claude-connect 0.1.8 → 0.1.10

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (8) hide show

package/README.md +20 -3
package/package.json +1 -1
package/src/data/catalog-store.js +69 -0
package/src/gateway/server.js +5 -0
package/src/lib/claude-settings.js +19 -3
package/src/lib/provider-rate-limit.js +109 -0
package/src/lib/theme.js +23 -0
package/src/wizard.js +23 -2

package/README.md CHANGED Viewed

@@ -1,11 +1,15 @@
 # Claude Connect
-> Conecta `Claude Code` con `OpenCode Go`, `Zen`, `Kimi`, `DeepSeek`, `Ollama`, `OpenAI`, `Inception Labs`, `OpenRouter` y `Qwen` desde una interfaz de consola clara, rápida y reversible.
+> Conecta `Claude Code` con `OpenCode Go`, `Zen`, `Kimi`, `DeepSeek`, `Z.AI`, `Ollama`, `OpenAI`, `Inception Labs`, `OpenRouter` y `Qwen` desde una interfaz de consola clara, rápida y reversible.
 [![npm version](https://img.shields.io/npm/v/claude-connect?style=for-the-badge&logo=npm&color=cb3837)](https://www.npmjs.com/package/claude-connect)
 [![node](https://img.shields.io/badge/node-%3E%3D22-2f7d32?style=for-the-badge&logo=node.js&logoColor=white)](https://nodejs.org/)
 [![license](https://img.shields.io/badge/license-MIT-0f172a?style=for-the-badge)](./LICENSE)
-[![providers](https://img.shields.io/badge/providers-OpenCode%20Go%20%7C%20Zen%20%7C%20Kimi%20%7C%20DeepSeek%20%7C%20Ollama%20%7C%20OpenAI%20%7C%20Inception%20Labs%20%7C%20OpenRouter%20%7C%20Qwen-0ea5e9?style=for-the-badge)](https://www.npmjs.com/package/claude-connect)
+[![providers](https://img.shields.io/badge/providers-OpenCode%20Go%20%7C%20Zen%20%7C%20Kimi%20%7C%20DeepSeek%20%7C%20Z.AI%20%7C%20Ollama%20%7C%20OpenAI%20%7C%20Inception%20Labs%20%7C%20OpenRouter%20%7C%20Qwen-0ea5e9?style=for-the-badge)](https://www.npmjs.com/package/claude-connect)
+<p align="center">
+  <img src="./ezgif-871b2bc9267494c5.gif" alt="Claude Connect demo" width="980" />
+</p>
 ## Why Claude Connect
@@ -13,7 +17,7 @@
 ### Highlights
-- `OpenCode Go`, `Zen`, `Kimi`, `DeepSeek`, `Ollama`, `OpenAI`, `Inception Labs`, `OpenRouter` y `Qwen` listos desde el primer arranque
+- `OpenCode Go`, `Zen`, `Kimi`, `DeepSeek`, `Z.AI`, `Ollama`, `OpenAI`, `Inception Labs`, `OpenRouter` y `Qwen` listos desde el primer arranque
 - soporte para `Token` y `OAuth` cuando el proveedor lo permite
 - API keys compartidas por proveedor para no repetir el mismo token en cada modelo
 - activación reversible sobre la instalación real de `Claude Code`
@@ -78,12 +82,14 @@ Al activar:
 - `Zen` usa conexión directa o gateway según el modelo elegido
 - `Kimi` usa gateway local y reenvia al endpoint Anthropic de `https://api.kimi.com/coding/`
 - `DeepSeek` apunta a `https://api.deepseek.com/anthropic`
+- `Z.AI` apunta a `https://api.z.ai/api/anthropic`
 - `Ollama` pide una URL local o remota, valida `/api/tags` y usa el gateway local sobre `.../api/chat`
 - `OpenAI` usa el gateway local sobre `https://api.openai.com/v1/chat/completions`
 - `Inception Labs` usa el gateway local sobre `https://api.inceptionlabs.ai/v1/chat/completions`
 - `OpenRouter` usa `openrouter/free` por gateway sobre `https://openrouter.ai/api/v1`
 - `Qwen` apunta al gateway local `http://127.0.0.1:4310/anthropic`
 - para algunos modelos con limites conocidos, el gateway ahora ajusta `max_tokens` y bloquea prompts sobredimensionados antes de que el upstream devuelva errores opacos
+- para `Inception Labs`, el gateway tambien respeta un presupuesto local de input tokens por minuto para reducir errores de `Rate limit reached`
 ## Providers
@@ -93,6 +99,7 @@ Al activar:
 | `Zen` | `Claude*` de Zen + modelos `chat/completions` de Zen | `Token` | Mixta |
 | `Kimi` | `kimi-for-coding` | `Token` | Gateway local |
 | `DeepSeek` | `deepseek-chat`, `deepseek-reasoner` | `Token` | Directa |
+| `Z.AI` | `glm-5.1`, `glm-4.7`, `glm-4.5-air` | `Token` | Directa |
 | `Ollama` | modelos descubiertos desde tu servidor | `Servidor Ollama` | Gateway local |
 | `OpenAI` | `gpt-5.4`, `gpt-5.4-mini`, `gpt-5.3-codex`, `gpt-5.2-codex`, `gpt-5.2`, `gpt-5.1-codex-max`, `gpt-5.1-codex-mini` | `Token` | Gateway local |
 | `Inception Labs` | `mercury-2` | `Token` | Gateway local |
@@ -126,12 +133,14 @@ Nota sobre `Inception Labs`:
 - esta primera integracion expone solo `mercury-2`, que es el modelo chat-compatible oficial en `v1/chat/completions`
 - `mercury-2` se trata como modelo solo texto en Claude Connect; si envias una imagen, la app ahora corta la peticion con un mensaje claro
 - Claude Connect aplica presupuesto preventivo de contexto para `mercury-2` usando ventana `128K` y salida maxima `16,384`
+- Claude Connect tambien aplica una ventana deslizante local de `400,000` input tokens por minuto para reducir rechazos del upstream por rate limit
 - `Mercury Edit 2` no se publica todavia en Claude Connect porque usa endpoints `fim/edit` que no encajan con Claude Code en esta arquitectura
 - autenticacion soportada: `API key`
 - referencias oficiales:
   - https://docs.inceptionlabs.ai/get-started/get-started
   - https://docs.inceptionlabs.ai/get-started/authentication
   - https://docs.inceptionlabs.ai/get-started/models
+  - https://docs.inceptionlabs.ai/get-started/rate-limits
 Nota sobre `DeepSeek`:
@@ -140,6 +149,14 @@ Nota sobre `DeepSeek`:
   - https://api-docs.deepseek.com/quick_start/pricing/
   - https://api-docs.deepseek.com/guides/reasoning_model
+Nota sobre `Z.AI`:
+- usa el endpoint Anthropic-compatible oficial `https://api.z.ai/api/anthropic`
+- Claude Connect fija `API_TIMEOUT_MS=3000000`
+- al activar un perfil de `Z.AI`, tambien mapea `ANTHROPIC_DEFAULT_HAIKU_MODEL`, `ANTHROPIC_DEFAULT_SONNET_MODEL` y `ANTHROPIC_DEFAULT_OPUS_MODEL` al modelo elegido para que Claude Code use `GLM` de forma consistente
+- referencias oficiales:
+  - https://docs.z.ai/devpack/tool/claude
 Nota sobre `Ollama`:
 - la URL del servidor se define al crear la conexión

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "claude-connect",
-  "version": "0.1.8",
+  "version": "0.1.10",
   "description": "CLI para configurar Claude Code con proveedores de modelos externos",
   "author": "wmcarlosv",
   "type": "module",

package/src/data/catalog-store.js CHANGED Viewed

@@ -528,6 +528,75 @@ const seedProviders = [
       }
     ]
   },
+  {
+    id: 'zai',
+    name: 'Z.AI',
+    vendor: 'Zhipu AI',
+    description: 'GLM Coding Plan para Claude Code usando el endpoint Anthropic-compatible oficial de z.ai.',
+    docsUrl: 'https://docs.z.ai/devpack/tool/claude',
+    docsVerifiedAt: '2026-04-04',
+    baseUrl: 'https://api.z.ai/api/anthropic',
+    defaultModelId: 'glm-5.1',
+    defaultAuthMethodId: 'token',
+    defaultApiKeyEnvVar: 'ZAI_API_KEY',
+    models: [
+      {
+        id: 'glm-5.1',
+        name: 'GLM-5.1',
+        category: 'Coding',
+        contextWindow: 'Auto',
+        summary: 'Modelo recomendado de la documentacion oficial de z.ai para usuarios Max que quieren usar GLM-5.1 en Claude Code.',
+        upstreamModelId: 'glm-5.1',
+        transportMode: 'direct',
+        apiStyle: 'anthropic',
+        apiBaseUrl: 'https://api.z.ai/api/anthropic',
+        apiPath: '/v1/messages',
+        authEnvMode: 'auth_token',
+        sortOrder: 1,
+        isDefault: 1
+      },
+      {
+        id: 'glm-4.7',
+        name: 'GLM-4.7',
+        category: 'General',
+        contextWindow: 'Auto',
+        summary: 'Modelo default recomendado por z.ai para Opus y Sonnet dentro del GLM Coding Plan.',
+        upstreamModelId: 'glm-4.7',
+        transportMode: 'direct',
+        apiStyle: 'anthropic',
+        apiBaseUrl: 'https://api.z.ai/api/anthropic',
+        apiPath: '/v1/messages',
+        authEnvMode: 'auth_token',
+        sortOrder: 2,
+        isDefault: 0
+      },
+      {
+        id: 'glm-4.5-air',
+        name: 'GLM-4.5-Air',
+        category: 'Fast',
+        contextWindow: 'Auto',
+        summary: 'Modelo ligero recomendado por z.ai para la clase Haiku dentro del GLM Coding Plan.',
+        upstreamModelId: 'glm-4.5-air',
+        transportMode: 'direct',
+        apiStyle: 'anthropic',
+        apiBaseUrl: 'https://api.z.ai/api/anthropic',
+        apiPath: '/v1/messages',
+        authEnvMode: 'auth_token',
+        sortOrder: 3,
+        isDefault: 0
+      }
+    ],
+    authMethods: [
+      {
+        id: 'token',
+        name: 'Token',
+        description: 'Conexion por API key contra el endpoint Anthropic-compatible oficial de z.ai.',
+        credentialKind: 'env_var',
+        sortOrder: 1,
+        isDefault: 1
+      }
+    ]
+  },
   {
     id: 'ollama',
     name: 'Ollama',

package/src/gateway/server.js CHANGED Viewed

@@ -27,6 +27,7 @@ import { readSwitchState } from '../lib/claude-settings.js';
 import { enforceModelTokenBudget } from '../lib/model-budget.js';
 import { readOAuthToken, refreshOAuthToken } from '../lib/oauth.js';
 import { readProfileFile } from '../lib/profile.js';
+import { reserveProviderInputTokens } from '../lib/provider-rate-limit.js';
 import { readManagedProviderTokenSecret, readManagedTokenSecret } from '../lib/secrets.js';
 const projectRoot = path.resolve(path.dirname(fileURLToPath(import.meta.url)), '..', '..');
@@ -509,6 +510,10 @@ async function handleMessages(request, response) {
     body: rawBody,
     profile: context.profile
   });
+  await reserveProviderInputTokens({
+    profile: context.profile,
+    inputTokens: estimateTokenCountFromAnthropicRequest(body)
+  });
   if (context.upstreamApiStyle === 'anthropic') {
     const upstreamResponse = await forwardAnthropicMessage({

package/src/lib/claude-settings.js CHANGED Viewed

@@ -154,6 +154,13 @@ export async function resolveClaudeTransportForProfile({
       extraEnv.ANTHROPIC_DEFAULT_HAIKU_MODEL = profile.model.id;
     }
+    if (profile.provider.id === 'zai') {
+      extraEnv.API_TIMEOUT_MS = '3000000';
+      extraEnv.ANTHROPIC_DEFAULT_HAIKU_MODEL = profile.model.id;
+      extraEnv.ANTHROPIC_DEFAULT_SONNET_MODEL = profile.model.id;
+      extraEnv.ANTHROPIC_DEFAULT_OPUS_MODEL = profile.model.id;
+    }
     if (profile.provider.id === 'kimi') {
       extraEnv.ENABLE_TOOL_SEARCH = 'false';
     }
@@ -220,6 +227,8 @@ export function buildClaudeSettingsForProfile({
   delete env.ENABLE_TOOL_SEARCH;
   delete env.ANTHROPIC_MODEL;
   delete env.ANTHROPIC_DEFAULT_HAIKU_MODEL;
+  delete env.ANTHROPIC_DEFAULT_SONNET_MODEL;
+  delete env.ANTHROPIC_DEFAULT_OPUS_MODEL;
   Object.assign(env, extraEnv);
@@ -259,9 +268,16 @@ export async function activateClaudeProfile({ profile, gatewayBaseUrl = 'http://
   const currentAccount = await readClaudeAccount();
   const currentCredentials = await readJsonIfExists(claudeCredentialsPath);
   const currentState = await readSwitchState();
-  const originalSettings = currentState?.originalSettings ?? currentSettings;
-  const originalAccount = currentState?.originalAccount ?? currentAccount;
-  const originalCredentials = currentState && Object.prototype.hasOwnProperty.call(currentState, 'originalCredentials')
+  const canReuseActiveSnapshot = currentState?.active === true;
+  const originalSettings = canReuseActiveSnapshot
+    ? currentState?.originalSettings ?? currentSettings
+    : currentSettings;
+  const originalAccount = canReuseActiveSnapshot
+    ? currentState?.originalAccount ?? currentAccount
+    : currentAccount;
+  const originalCredentials = canReuseActiveSnapshot
+    && currentState
+    && Object.prototype.hasOwnProperty.call(currentState, 'originalCredentials')
     ? currentState.originalCredentials
     : currentCredentials;
   const transport = await resolveClaudeTransportForProfile({

package/src/lib/provider-rate-limit.js ADDED Viewed

@@ -0,0 +1,109 @@
+function getProviderId(profile) {
+  return profile?.provider?.id ?? '';
+}
+function getProviderInputTokensPerMinute(profile) {
+  const providerId = getProviderId(profile);
+  if (providerId === 'inception') {
+    return 400_000;
+  }
+  return null;
+}
+const recentReservations = [];
+function pruneReservations(now) {
+  for (let index = recentReservations.length - 1; index >= 0; index -= 1) {
+    if (now - recentReservations[index].timestamp >= 60_000) {
+      recentReservations.splice(index, 1);
+    }
+  }
+}
+function sumReservedTokens(profile, now) {
+  const providerId = getProviderId(profile);
+  return recentReservations.reduce((total, entry) => {
+    if (entry.providerId !== providerId) {
+      return total;
+    }
+    if (now - entry.timestamp >= 60_000) {
+      return total;
+    }
+    return total + entry.tokens;
+  }, 0);
+}
+function earliestExpiryForProvider(profile, now) {
+  const providerId = getProviderId(profile);
+  let minExpiry = null;
+  for (const entry of recentReservations) {
+    if (entry.providerId !== providerId) {
+      continue;
+    }
+    const expiry = entry.timestamp + 60_000;
+    if (expiry <= now) {
+      continue;
+    }
+    if (minExpiry == null || expiry < minExpiry) {
+      minExpiry = expiry;
+    }
+  }
+  return minExpiry;
+}
+export function resetProviderRateLimitState() {
+  recentReservations.length = 0;
+}
+export async function reserveProviderInputTokens({
+  profile,
+  inputTokens,
+  now = () => Date.now(),
+  sleep = (ms) => new Promise((resolve) => setTimeout(resolve, ms))
+}) {
+  const tokensPerMinute = getProviderInputTokensPerMinute(profile);
+  if (!tokensPerMinute) {
+    return;
+  }
+  if (inputTokens > tokensPerMinute) {
+    throw new Error(
+      `${profile.provider.name} rechazo la solicitud porque la entrada estimada excede el limite de ${tokensPerMinute.toLocaleString('en-US')} tokens por minuto. Usa /compact o /clear antes de continuar.`
+    );
+  }
+  while (true) {
+    const currentTime = now();
+    pruneReservations(currentTime);
+    const usedTokens = sumReservedTokens(profile, currentTime);
+    if (usedTokens + inputTokens <= tokensPerMinute) {
+      recentReservations.push({
+        providerId: getProviderId(profile),
+        tokens: inputTokens,
+        timestamp: currentTime
+      });
+      return;
+    }
+    const nextExpiry = earliestExpiryForProvider(profile, currentTime);
+    if (nextExpiry == null) {
+      throw new Error(`No se pudo reservar presupuesto de tokens para ${profile.provider.name}.`);
+    }
+    const waitMs = Math.max(250, nextExpiry - currentTime + 25);
+    await sleep(waitMs);
+  }
+}

package/src/lib/theme.js CHANGED Viewed

@@ -17,10 +17,33 @@ export const colors = {
   bold: '\x1b[1m'
 };
+export function rgb(r, g, b) {
+  return `\x1b[38;2;${r};${g};${b}m`;
+}
 export function colorize(text, ...tokens) {
   return `${tokens.join('')}${text}${RESET}`;
 }
+export function gradientizeLines(lines, palette) {
+  if (!Array.isArray(lines) || lines.length === 0) {
+    return [];
+  }
+  if (!Array.isArray(palette) || palette.length === 0) {
+    return [...lines];
+  }
+  if (palette.length === 1) {
+    return lines.map((line) => colorize(line, palette[0], colors.bold));
+  }
+  return lines.map((line, index) => {
+    const paletteIndex = Math.round((index / Math.max(1, lines.length - 1)) * (palette.length - 1));
+    return colorize(line, palette[paletteIndex], colors.bold);
+  });
+}
 export function stripAnsi(value) {
   return value.replace(/\x1B\[[0-?]*[ -/]*[@-~]/g, '');
 }

package/src/wizard.js CHANGED Viewed

@@ -34,7 +34,26 @@ import {
   selectFromList,
   waitForAnyKey
 } from './lib/terminal.js';
-import { colorize, colors } from './lib/theme.js';
+import { colorize, colors, gradientizeLines, rgb } from './lib/theme.js';
+function buildBrandWordmark() {
+  const wordmark = [
+    '  ██████╗██╗      █████╗ ██╗   ██╗██████╗ ███████╗',
+    '  ██╔════╝██║     ██╔══██╗██║   ██║██╔══██╗██╔════╝',
+    '  ██║     ██║     ███████║██║   ██║██║  ██║█████╗  ',
+    '  ██║     ██║     ██╔══██║██║   ██║██║  ██║██╔══╝  ',
+    '  ╚██████╗███████╗██║  ██║╚██████╔╝██████╔╝███████╗',
+    '   ╚═════╝╚══════╝╚═╝  ╚═╝ ╚═════╝ ╚═════╝ ╚══════╝',
+    '                 C L A U D E   ·   C O N N E C T'
+  ];
+  return gradientizeLines(wordmark, [
+    rgb(103, 232, 249),
+    rgb(56, 189, 248),
+    rgb(59, 130, 246),
+    rgb(14, 165, 233)
+  ]);
+}
 function isBack(value) {
   return value === navigation.BACK;
@@ -229,6 +248,8 @@ function renderWelcome() {
       title: 'Conecta Claude Code con otros modelos',
       subtitle: 'Flujo guiado, catalogo SQLite y perfiles locales listos para reutilizar.',
       body: [
+        ...buildBrandWordmark(),
+        '',
         colorize('Experiencia inicial', colors.bold, colors.accentSoft),
         colorize('1. Elegir proveedor desde la base local', colors.soft),
         colorize('2. Elegir modelo y tipo de conexion', colors.soft),
@@ -236,7 +257,7 @@ function renderWelcome() {
         colorize('4. Guardar perfil y credenciales locales', colors.soft),
         '',
         colorize('Catalogo actual', colors.bold, colors.accentSoft),
-        colorize('OpenCode Go, Zen, Kimi, DeepSeek, Ollama, OpenAI, OpenRouter y Qwen ya vienen almacenados en SQLite.', colors.soft),
+        colorize('OpenCode Go, Zen, Kimi, DeepSeek, Z.AI, Ollama, OpenAI, Inception Labs, OpenRouter y Qwen ya vienen almacenados en SQLite.', colors.soft),
         '',
         colorize('Seguridad', colors.bold, colors.accentSoft),
         colorize('El token OAuth se guarda localmente y el modo Token puede guardarse una sola vez por proveedor.', colors.soft)