npm - jeo-code - Versions diffs - 0.1.0 → 0.4.5 - Mend

jeo-code 0.1.0 → 0.4.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (177) hide show

package/README.ja.md +160 -0
package/README.ko.md +160 -0
package/README.md +115 -297
package/README.zh.md +160 -0
package/package.json +11 -6
package/scripts/install.sh +28 -28
package/scripts/uninstall.sh +17 -15
package/src/AGENTS.md +50 -0
package/src/agent/AGENTS.md +49 -0
package/src/agent/bash-fixups.ts +103 -0
package/src/agent/compaction.ts +410 -19
package/src/agent/config-schema.ts +119 -5
package/src/agent/context-files.ts +314 -17
package/src/agent/dev/AGENTS.md +36 -0
package/src/agent/dev/advanced-analyzer.ts +12 -0
package/src/agent/dev/evolution-bridge.ts +82 -0
package/src/agent/dev/evolution-logger.ts +41 -0
package/src/agent/dev/self-analysis.ts +64 -0
package/src/agent/dev/self-improve.ts +24 -0
package/src/agent/dev/spec-automation.ts +49 -0
package/src/agent/engine.ts +808 -54
package/src/agent/hooks.ts +273 -0
package/src/agent/loop.ts +21 -1
package/src/agent/memory.ts +201 -0
package/src/agent/model-recency.ts +32 -0
package/src/agent/output-minimizer.ts +108 -0
package/src/agent/output-util.ts +64 -0
package/src/agent/plan.ts +187 -0
package/src/agent/seed.ts +52 -0
package/src/agent/session.ts +235 -21
package/src/agent/state.ts +286 -39
package/src/agent/step-budget.ts +232 -0
package/src/agent/subagents.ts +223 -26
package/src/agent/task-tool.ts +272 -0
package/src/agent/todo-tool.ts +87 -0
package/src/agent/tokenizer.ts +117 -0
package/src/agent/tool-registry.ts +54 -0
package/src/agent/tools.ts +624 -103
package/src/agent/web-search.ts +538 -0
package/src/ai/AGENTS.md +44 -0
package/src/ai/index.ts +1 -0
package/src/ai/model-catalog-compat.ts +3 -1
package/src/ai/model-catalog.ts +74 -9
package/src/ai/model-discovery.ts +215 -17
package/src/ai/model-manager.ts +346 -32
package/src/ai/model-picker.ts +1 -1
package/src/ai/model-registry.ts +4 -2
package/src/ai/pricing.ts +84 -0
package/src/ai/provider-registry.ts +23 -0
package/src/ai/provider-status.ts +60 -16
package/src/ai/providers/AGENTS.md +42 -0
package/src/ai/providers/anthropic.ts +250 -31
package/src/ai/providers/antigravity.ts +219 -0
package/src/ai/providers/errors.ts +15 -1
package/src/ai/providers/gemini.ts +196 -13
package/src/ai/providers/ollama.ts +37 -7
package/src/ai/providers/openai-responses.ts +173 -0
package/src/ai/providers/openai.ts +64 -12
package/src/ai/sse.ts +4 -1
package/src/ai/types.ts +18 -1
package/src/auth/AGENTS.md +41 -0
package/src/auth/callback-server.ts +6 -1
package/src/auth/flows/AGENTS.md +32 -0
package/src/auth/flows/antigravity.ts +151 -0
package/src/auth/flows/google-project.ts +190 -0
package/src/auth/flows/google.ts +39 -18
package/src/auth/flows/index.ts +15 -5
package/src/auth/flows/openai.ts +2 -2
package/src/auth/oauth.ts +8 -0
package/src/auth/refresh.ts +44 -27
package/src/auth/storage.ts +149 -26
package/src/auth/types.ts +1 -1
package/src/autopilot.ts +362 -0
package/src/bun-imports.d.ts +4 -0
package/src/cli/AGENTS.md +39 -0
package/src/cli/runner.ts +148 -14
package/src/cli.ts +13 -4
package/src/commands/AGENTS.md +40 -0
package/src/commands/approve.ts +62 -3
package/src/commands/auth.ts +167 -25
package/src/commands/chat.ts +37 -8
package/src/commands/deep-interview.ts +633 -175
package/src/commands/doctor.ts +84 -37
package/src/commands/evolve-core.ts +18 -0
package/src/commands/evolve.ts +2 -1
package/src/commands/export.ts +176 -0
package/src/commands/gjc.ts +52 -0
package/src/commands/launch.ts +3549 -240
package/src/commands/mcp.ts +3 -3
package/src/commands/ooo-seed.ts +19 -0
package/src/commands/ralplan.ts +253 -35
package/src/commands/resume.ts +1 -1
package/src/commands/session.ts +183 -0
package/src/commands/setup-helpers.ts +10 -3
package/src/commands/setup.ts +57 -16
package/src/commands/skills.ts +78 -18
package/src/commands/state.ts +198 -0
package/src/commands/status.ts +84 -0
package/src/commands/team.ts +340 -212
package/src/commands/ultragoal.ts +122 -61
package/src/commands/update.ts +244 -0
package/src/ledger.ts +270 -0
package/src/mcp/AGENTS.md +38 -0
package/src/mcp/server.ts +115 -14
package/src/mcp/tools.ts +42 -22
package/src/md-modules.d.ts +4 -0
package/src/prompts/AGENTS.md +41 -0
package/src/prompts/agents/AGENTS.md +35 -0
package/src/prompts/agents/architect.md +35 -0
package/src/prompts/agents/critic.md +37 -0
package/src/prompts/agents/executor.md +36 -0
package/src/prompts/agents/planner.md +37 -0
package/src/prompts/skills/AGENTS.md +36 -0
package/src/prompts/skills/deep-dive/AGENTS.md +31 -0
package/src/prompts/skills/deep-dive/SKILL.md +13 -0
package/src/prompts/skills/deep-interview/AGENTS.md +31 -0
package/src/prompts/skills/deep-interview/SKILL.md +12 -0
package/src/prompts/skills/gjc/AGENTS.md +31 -0
package/src/prompts/skills/gjc/SKILL.md +15 -0
package/src/prompts/skills/ralplan/AGENTS.md +31 -0
package/src/prompts/skills/ralplan/SKILL.md +11 -0
package/src/prompts/skills/team/AGENTS.md +31 -0
package/src/prompts/skills/team/SKILL.md +11 -0
package/src/prompts/skills/ultragoal/AGENTS.md +31 -0
package/src/prompts/skills/ultragoal/SKILL.md +11 -0
package/src/skills/AGENTS.md +38 -0
package/src/skills/catalog.ts +565 -31
package/src/tui/AGENTS.md +43 -0
package/src/tui/app.ts +1181 -92
package/src/tui/components/AGENTS.md +42 -0
package/src/tui/components/ascii-art.ts +257 -15
package/src/tui/components/autocomplete.ts +98 -16
package/src/tui/components/autopilot-status.ts +65 -0
package/src/tui/components/category-index.ts +49 -0
package/src/tui/components/code-view.ts +54 -11
package/src/tui/components/color.ts +171 -2
package/src/tui/components/config-panel.ts +82 -15
package/src/tui/components/duration.ts +38 -0
package/src/tui/components/evolution.ts +3 -3
package/src/tui/components/footer.ts +91 -42
package/src/tui/components/forge.ts +426 -31
package/src/tui/components/hints.ts +54 -0
package/src/tui/components/hud.ts +73 -0
package/src/tui/components/index.ts +4 -0
package/src/tui/components/input-box.ts +150 -0
package/src/tui/components/layout.ts +11 -3
package/src/tui/components/live-model-picker.ts +108 -0
package/src/tui/components/markdown-table.ts +140 -0
package/src/tui/components/markdown-text.ts +97 -0
package/src/tui/components/meter.ts +4 -1
package/src/tui/components/model-picker.ts +3 -2
package/src/tui/components/provider-picker.ts +3 -2
package/src/tui/components/section.ts +70 -0
package/src/tui/components/select-list.ts +40 -10
package/src/tui/components/skill-picker.ts +25 -0
package/src/tui/components/slash.ts +244 -21
package/src/tui/components/status.ts +272 -11
package/src/tui/components/step-timeline.ts +218 -0
package/src/tui/components/stream.ts +26 -9
package/src/tui/components/themes.ts +212 -6
package/src/tui/components/todo-card.ts +47 -0
package/src/tui/components/tool-list.ts +58 -12
package/src/tui/components/transcript.ts +120 -0
package/src/tui/components/update-box.ts +31 -0
package/src/tui/components/welcome.ts +162 -0
package/src/tui/components/width.ts +163 -0
package/src/tui/monitoring/AGENTS.md +31 -0
package/src/tui/monitoring/hud-view.ts +55 -0
package/src/tui/renderer.ts +112 -3
package/src/tui/terminal.ts +40 -33
package/src/util/AGENTS.md +39 -0
package/src/util/clipboard-image.ts +118 -0
package/src/util/env.ts +12 -0
package/src/util/provider-error.ts +78 -0
package/src/util/retry.ts +91 -6
package/src/util/update-check.ts +64 -0
package/src/commands/models.ts +0 -104

package/src/ai/model-manager.ts CHANGED Viewed

@@ -1,3 +1,4 @@
+import { providerRegistry } from "./provider-registry";
 import { OAUTH_FLOW_REGISTRY } from "../auth/flows";
 import { readGlobalConfig } from "../agent/state";
 import { resolveCredential, type AuthProvider, type Credential } from "../auth";
@@ -5,18 +6,23 @@ import { anthropicAdapter } from "./providers/anthropic";
 import { openaiAdapter } from "./providers/openai";
 import { geminiAdapter } from "./providers/gemini";
 import { ollamaAdapter } from "./providers/ollama";
+import { antigravityAdapter } from "./providers/antigravity";
 import type { CallOptions, Message, ProviderAdapter, ProviderName } from "./types";
 import { expandAlias, resolveModelId, effectiveAliasesFor } from "./model-registry";
 import { findCatalogEntry, type ModelCatalogEntry } from "./model-catalog-compat";
+import { toProviderModel, CODEX_MODELS } from "./model-catalog";
 import { withRetry, defaultRetryable, type RetryOptions } from "../util/retry";
+import { jeoEnv } from "../util/env";
 import type { Config } from "../agent/state";
-const ADAPTERS: Record<ProviderName, ProviderAdapter> = {
-  anthropic: anthropicAdapter,
-  openai: openaiAdapter,
-  gemini: geminiAdapter,
-  ollama: ollamaAdapter,
-};
+// Initialize Provider Registry
+providerRegistry.register("anthropic", anthropicAdapter);
+providerRegistry.register("openai", openaiAdapter);
+providerRegistry.register("gemini", geminiAdapter);
+providerRegistry.register("antigravity", antigravityAdapter);
+providerRegistry.register("ollama", ollamaAdapter);
 export function resolveProvider(model: string): ProviderName {
   // Catalog is authoritative for known ids (correct even when heuristics would
@@ -25,11 +31,50 @@ export function resolveProvider(model: string): ProviderName {
   if (entry) return entry.provider;
   const m = (model ?? "").toLowerCase();
   if (m.startsWith("ollama/")) return "ollama";
+  if (m.startsWith("antigravity/")) return "antigravity";
   // OpenAI: explicit prefix, any GPT, or a reasoning model (o1/o3/o4-mini, o1-preview…).
   if (m.startsWith("openai/") || m.includes("gpt") || /(^|\/)o\d/.test(m)) return "openai";
   if (m.startsWith("google/") || m.includes("gemini")) return "gemini";
   return "anthropic";
 }
+const PROVIDER_ID_PREFIX: Record<ProviderName, string> = {
+  anthropic: "anthropic/",
+  openai: "openai/",
+  gemini: "google/",
+  antigravity: "antigravity/",
+  ollama: "ollama/",
+};
+/**
+ * Pin-time provider qualification: when a picked live model id would route to a
+ * DIFFERENT provider than the list it came from (e.g. ollama's `qwen2.5:0.5b` → anthropic,
+ * ollama's `gpt-oss:20b` → openai), prefix it so resolveProvider routes correctly.
+ * Adapters strip these prefixes on the wire. Ids that already route correctly
+ * (catalog ids, aliases, prefixed ids) pass through unchanged.
+ */
+export function qualifyModelId(model: string, provider: ProviderName): string {
+  const id = (model ?? "").trim();
+  if (!id) return id;
+  return resolveProvider(id) === provider ? id : `${PROVIDER_ID_PREFIX[provider]}${id}`;
+}
+/**
+ * Wire id for a (possibly provider-qualified) model id: a catalog canonical maps
+ * to the exact provider id (claude-sonnet-4-5 → claude-sonnet-4-5-20250929);
+ * live/provider/prefixed ids pass through unchanged (adapters strip prefixes).
+ */
+export function providerModelFor(model: string): string {
+  if (
+    model.startsWith("ollama/") ||
+    model.startsWith("openai/") ||
+    model.startsWith("anthropic/") ||
+    model.startsWith("google/") ||
+    model.startsWith("antigravity/")
+  ) {
+    return model;
+  }
+  return toProviderModel(model, resolveProvider(model));
+}
 /** Map the configured thinking level to a default max-token budget. */
 export function thinkingMaxTokens(level?: "minimal" | "low" | "medium" | "high" | "xhigh"): number {
@@ -40,6 +85,17 @@ export function thinkingMaxTokens(level?: "minimal" | "low" | "medium" | "high"
   return 4000;
 }
+/** Map the thinking level to an OpenAI reasoning-effort tier. `minimal` maps to `low`
+ *  (the lowest tier o-series reliably accepts; gpt-5's `minimal` is opt-in via options). */
+export function thinkingToReasoningEffort(
+  level?: "minimal" | "low" | "medium" | "high" | "xhigh",
+): "low" | "medium" | "high" | undefined {
+  if (!level) return undefined;
+  if (level === "minimal" || level === "low") return "low";
+  if (level === "high" || level === "xhigh") return "high";
+  return "medium";
+}
 /** Describe a model id: alias expansion + the provider it routes to. For `/model` + diagnostics. */
 export async function describeModel(input: string): Promise<{ input: string; resolved: string; provider: ProviderName }> {
   const resolved = await resolveModelId(input);
@@ -85,25 +141,123 @@ export interface ModelManager {
   resolveProvider: typeof resolveProvider;
 }
-const ALIAS_DEFAULTS = { fast: "ollama/qwen2.5:0.5b", local: "ollama/qwen2.5:0.5b", sonnet: "claude-3-5-sonnet", gpt: "gpt-4o", flash: "gemini-2.5-flash" };
+const ALIAS_DEFAULTS = { fast: "ollama/qwen2.5:0.5b", local: "ollama/qwen2.5:0.5b", sonnet: "claude-sonnet-4-5", opus: "claude-opus-4-5", haiku: "claude-haiku-4-5", gpt: "gpt-5.5", flash: "gemini-2.5-flash" };
 /**
  * Build retry options from a config `retry` budget (gjc parity). `requestMaxRetries`
  * counts retries (not the initial request), so total `withRetry` attempts =
- * requestMaxRetries + 1. When unset, the `withRetry` defaults apply (3 attempts).
- * `maxDelayMs` caps backoff when provided.
+ * requestMaxRetries + 1. When unset, the `withRetry` defaults apply (3 attempts),
+ * but rate-limit (429) errors get a more generous budget + a backoff floor so a
+ * transient per-minute window can clear instead of the very first 429 instantly
+ * exhausting auto-retry. A server-directed retry delay above the five-minute
+ * budget is surfaced immediately with its reset hint instead of being capped and
+ * retried pointlessly. Explicit config (`requestMaxRetries`/`maxDelayMs`) always
+ * wins and disables the matching rate-limit default.
+ * `maxDelayMs` caps per-attempt backoff when provided.
  */
-export function resolveRetryOptions(retry: Config["retry"]): RetryOptions {
+const DEFAULT_RATE_LIMIT_RETRIES = 6; // total attempts for 429 (initial + 5 retries)
+// 429 floor when the server sends no Retry-After. Escalates per attempt inside
+// withRetry (2s → 4s → 8s → 16s → 30s ≈ 60s total), spanning a per-minute window.
+const DEFAULT_RATE_LIMIT_MIN_DELAY_MS = 2000;
+// GJC parity for server-directed 429s: retry short windows, but do not hang a CLI
+// through long subscription/account resets.
+const DEFAULT_RATE_LIMIT_MAX_SERVER_DELAY_MS = 5 * 60 * 1000;
+export function resolveRetryOptions(retry: Config["retry"], kind: "request" | "stream" = "request"): RetryOptions {
   const opts: RetryOptions = { isRetryable: defaultRetryable };
-  if (typeof retry?.requestMaxRetries === "number") {
-    opts.retries = retry.requestMaxRetries + 1;
+  let targetRetries: number | undefined;
+  if (kind === "request") {
+    if (typeof retry?.requestMaxRetries === "number") {
+      targetRetries = retry.requestMaxRetries;
+    } else if (typeof retry?.maxRetries === "number") {
+      targetRetries = retry.maxRetries;
+    }
+  } else if (kind === "stream") {
+    if (typeof retry?.streamMaxRetries === "number") {
+      targetRetries = retry.streamMaxRetries;
+    } else if (typeof retry?.maxRetries === "number") {
+      targetRetries = retry.maxRetries;
+    }
+  }
+  if (typeof targetRetries === "number") {
+    opts.retries = targetRetries + 1;
   }
-  if (typeof retry?.maxDelayMs === "number") {
-    opts.maxDelayMs = retry.maxDelayMs;
+  if (typeof retry?.maxDelayMs === "number") opts.maxDelayMs = retry.maxDelayMs;
+  // 429 attempt budget: explicit rateLimitRetries wins; else mirror the resolved
+  // budget (no bonus); else the generous default so a transient window can clear.
+  if (typeof retry?.rateLimitRetries === "number") {
+    opts.rateLimitRetries = retry.rateLimitRetries + 1;
+  } else if (typeof targetRetries === "number") {
+    opts.rateLimitRetries = targetRetries + 1;
+  } else {
+    opts.rateLimitRetries = DEFAULT_RATE_LIMIT_RETRIES;
+  }
+  // 429 backoff floor: explicit wins; else default UNLESS the user pinned maxDelayMs.
+  if (typeof retry?.rateLimitMinDelayMs === "number") opts.rateLimitMinDelayMs = retry.rateLimitMinDelayMs;
+  else if (typeof retry?.maxDelayMs !== "number") opts.rateLimitMinDelayMs = DEFAULT_RATE_LIMIT_MIN_DELAY_MS;
+  opts.rateLimitMaxServerDelayMs = DEFAULT_RATE_LIMIT_MAX_SERVER_DELAY_MS;
+  // Config-driven fail-fast overrides: a status in `failFastStatuses` or a message
+  // matching any `failFastPattern` is forced non-retryable, layered on top of the
+  // chosen predicate (which still decides everything else). gjc parity for pinning a
+  // normally-transient class (e.g. 503) to abort instead of riding the backoff ladder.
+  const failFastStatuses = retry?.failFastStatuses;
+  const failFastPatterns = retry?.failFastPatterns;
+  if ((failFastStatuses && failFastStatuses.length > 0) || (failFastPatterns && failFastPatterns.length > 0)) {
+    const base = opts.isRetryable ?? defaultRetryable;
+    const statusSet = new Set(failFastStatuses ?? []);
+    const lowered = (failFastPatterns ?? []).map(p => p.toLowerCase());
+    opts.isRetryable = (err: unknown, attempt: number): boolean => {
+      if (err && typeof err === "object") {
+        const raw = (err as { status?: unknown }).status;
+        const status = typeof raw === "number" ? raw : (typeof raw === "string" ? Number(raw) : NaN);
+        if (!Number.isNaN(status) && statusSet.has(status)) return false;
+      }
+      if (lowered.length > 0) {
+        const msg = err instanceof Error
+          ? err.message
+          : (typeof err === "object" && err !== null && typeof (err as { message?: unknown }).message === "string"
+            ? (err as { message: string }).message
+            : String(err));
+        const lowerMsg = msg.toLowerCase();
+        if (lowered.some(p => lowerMsg.includes(p))) return false;
+      }
+      return base(err, attempt);
+    };
   }
   return opts;
 }
+/**
+ * Pick the credential to actually use for a provider call / live discovery.
+ * An API key is the broader, documented path, so it wins whenever present.
+ * Every bundled OAuth flow is now served end-to-end (Anthropic Messages,
+ * OpenAI ChatGPT/Codex Responses, Gemini/Antigravity Cloud Code Assist); the
+ * guard below only fires for a future flow that ships before its adapter.
+ */
+export function effectiveCredentialForProvider(
+  provider: AuthProvider,
+  credential: Credential,
+  config: Pick<Config, "providers">,
+  model: string,
+): Credential {
+  if (credential.kind === "oauth") {
+    const apiKey = config.providers[provider];
+    if (apiKey) return { kind: "api_key", provider, token: apiKey };
+    if (OAUTH_FLOW_REGISTRY[provider]?.verifiedEndToEnd === false) {
+      throw new Error(
+        `Provider '${provider}' has only an OAuth token, but its OAuth backend is not compatible with the bundled adapter. Set ${provider.toUpperCase()}_API_KEY (or run 'jeo setup') to use ${model}.`,
+      );
+    }
+  }
+  return credential;
+}
 interface Resolved {
   adapter: ProviderAdapter;
   callOptions: CallOptions;
@@ -111,12 +265,34 @@ interface Resolved {
   retry: RetryOptions;
 }
-async function resolveCall(options: Partial<CallOptions>): Promise<Resolved> {
+/**
+ * The credential to actually use for a provider call. A configured local OpenAI-compatible base
+ * URL must use the standard /chat/completions path, but the openai adapter dispatches on
+ * `credential.kind === "oauth"` → the hardcoded Codex backend, which drops the base URL. So when a
+ * base URL is set we downgrade an OAuth credential to the configured api key, else keyless — making
+ * discovery (which honors the base URL) and execution agree. All other cases pass through unchanged.
+ */
+export function credentialForCall(
+  provider: ProviderName,
+  effective: Credential,
+  config: Pick<Config, "providers">,
+  baseUrl: string | undefined,
+): Credential {
+  const isLocalOpenAi = provider === "openai" && !!baseUrl;
+  if (isLocalOpenAi && effective.kind === "oauth") {
+    return config.providers.openai
+      ? { kind: "api_key", provider: "openai", token: config.providers.openai }
+      : { kind: "none", provider: "openai" };
+  }
+  return effective;
+}
+async function resolveCall(options: Partial<CallOptions>, kind: "request" | "stream" = "request"): Promise<Resolved> {
   const config = await readGlobalConfig();
   const aliases = { ...((config as { modelAliases?: Record<string, string> }).modelAliases ?? {}) };
   const model = expandAlias(options.model ?? config.defaultModel, { ...ALIAS_DEFAULTS, ...aliases });
   const provider = resolveProvider(model);
-  const adapter = ADAPTERS[provider];
+  const adapter = providerRegistry.get(provider)!;
   const baseUrl =
     options.baseUrl ??
@@ -124,7 +300,9 @@ async function resolveCall(options: Partial<CallOptions>): Promise<Resolved> {
     (provider === "ollama" ? config.ollamaBaseUrl : undefined);
   const callOptions: CallOptions = {
-    model,
+    // Map a catalog canonical (e.g. claude-3-5-sonnet) to the exact wire id the
+    // provider accepts (claude-3-5-sonnet-20241022); live/provider ids pass through.
+    model: providerModelFor(model),
     systemPrompt: options.systemPrompt,
     temperature: options.temperature ?? 0.2,
     maxTokens: options.maxTokens ?? thinkingMaxTokens(config.thinkingLevel),
@@ -132,30 +310,149 @@ async function resolveCall(options: Partial<CallOptions>): Promise<Resolved> {
     baseUrl,
     onUsage: options.onUsage,
     signal: options.signal,
+    reasoningEffort: options.reasoningEffort ?? thinkingToReasoningEffort(config.thinkingLevel),
   };
+  // Caller-supplied retry sink rides on the config-derived retry budget so the
+  // engine/TUI can surface "rate limited — retrying in Ns" instead of a silent wait.
+  // gjc parity: `requestMaxRetries` governs non-stream calls; `streamMaxRetries`
+  // governs the stream site's replay-safe pre-first-chunk loop (retryableStream
+  // never replays after the first emitted chunk). Both fall back to `maxRetries`,
+  // and an unset stream budget keeps the conservative withRetry default — the
+  // generous gjc default of 100 only applies when the user configures it.
+  const retry: RetryOptions = { ...resolveRetryOptions(config.retry, kind), ...(options.onRetry ? { onRetry: options.onRetry } : {}) };
   if (provider === "ollama") {
-    return { adapter, callOptions, credential: { kind: "none", provider: "openai" }, retry: resolveRetryOptions(config.retry) };
+    return { adapter, callOptions, credential: { kind: "none", provider: "openai" }, retry };
   }
-  const credential = await resolveCredential(provider as AuthProvider);
-  let effective = credential;
-  if (effective.kind === "oauth" && OAUTH_FLOW_REGISTRY[provider as AuthProvider]?.verifiedEndToEnd === false) {
-    const apiKey = config.providers[provider as AuthProvider];
-    if (apiKey) {
-      effective = { kind: "api_key", provider: provider as AuthProvider, token: apiKey };
-    } else {
-      throw new Error(`Provider '${provider}' has only an OAuth token, but its OAuth backend is not compatible with the bundled adapter. Set ${provider.toUpperCase()}_API_KEY (or run 'joc setup') to use ${model}.`);
+  if (provider === "antigravity") {
+    // Prefer the dedicated Antigravity login (its client is what the agent
+    // backend authorizes); fall back to a gemini-cli OAuth token for users with
+    // their own project/permissions.
+    let credential = await resolveCredential("antigravity");
+    if (credential.kind !== "oauth") credential = await resolveCredential("gemini");
+    if (credential.kind !== "oauth") {
+      throw new Error("Antigravity models use Google OAuth. Run 'jeo auth login antigravity' (recommended) or 'jeo auth login gemini', then retry — the Google Cloud projectId is discovered automatically.");
     }
+    return { adapter, callOptions, credential, retry };
   }
+  const credentialProvider = provider as AuthProvider;
+  const credential = await resolveCredential(credentialProvider);
+  const effective = effectiveCredentialForProvider(credentialProvider, credential, config, model);
   const isLocalOpenAi = provider === "openai" && !!baseUrl;
+  if (provider === "openai" && effective.kind === "oauth" && !isLocalOpenAi && !CODEX_MODELS.includes(model)) {
+    throw new Error(
+      "OpenAI OAuth 자격증명은 Codex 모델(gpt-5.5/gpt-5.4)만 지원. OPENAI_API_KEY를 설정하거나 모델을 변경하세요"
+    );
+  }
   if (effective.kind === "none" && !isLocalOpenAi) {
     throw new Error(
-      `No credential for provider '${provider}'. Run 'joc setup', 'joc auth login', or set ${provider.toUpperCase()}_API_KEY / ${provider.toUpperCase()}_OAUTH_TOKEN.`
+      `No credential for provider '${provider}'. Run 'jeo setup', 'jeo auth login', or set ${provider.toUpperCase()}_API_KEY / ${provider.toUpperCase()}_OAUTH_TOKEN.`
     );
   }
-  return { adapter, callOptions, credential: effective, retry: resolveRetryOptions(config.retry) };
+  return { adapter, callOptions, credential: credentialForCall(provider, effective, config, baseUrl), retry };
+}
+/** Hard cap for a single non-streaming provider request (service-readiness: a
+ *  blackholed/unreachable provider must not hang the agent or `jeo team`). */
+const DEFAULT_CALL_TIMEOUT_MS = 120_000;
+/** Per-chunk idle cap for streaming: a stream that emits NOTHING for this long is
+ *  aborted, but a healthy long generation (chunks keep arriving) runs unbounded —
+ *  unlike a single wall-clock cap that would kill a long-but-active stream. */
+const STREAM_IDLE_TIMEOUT_MS = 120_000;
+/** Combine two abort signals into one. Preserves BOTH even when `AbortSignal.any`
+ *  is unavailable (manual fallback), so neither the caller's cancel nor the timeout
+ *  is silently dropped. */
+function composeAbort(a: AbortSignal | undefined, b: AbortSignal): AbortSignal {
+  if (!a) return b;
+  if (typeof AbortSignal.any === "function") return AbortSignal.any([a, b]);
+  if (a.aborted || b.aborted) return AbortSignal.abort();
+  const ctrl = new AbortController();
+  // Memory hygiene: `a` is typically the TURN-long abort signal — a once-listener
+  // per model call would otherwise accumulate on it for the whole turn. Detach
+  // BOTH listeners as soon as either side fires.
+  const onAbort = () => {
+    a.removeEventListener("abort", onAbort);
+    b.removeEventListener("abort", onAbort);
+    ctrl.abort();
+  };
+  a.addEventListener("abort", onAbort, { once: true });
+  b.addEventListener("abort", onAbort, { once: true });
+  return ctrl.signal;
+}
+/** Compose the caller's signal (if any) with a fresh per-attempt timeout. */
+function withTimeout(signal: AbortSignal | undefined, ms: number): AbortSignal {
+  return composeAbort(signal, AbortSignal.timeout(ms));
+}
+/**
+ * Stream wrapper that retries ONLY the initial connection — before any chunk is
+ * yielded — so a transient 429/5xx on stream connect recovers (the non-streaming
+ * call path already retried; the stream path previously had no retry). A failure
+ * after the first token propagates (retrying would duplicate emitted output).
+ */
+export interface StreamIdleOptions {
+  /** Abort + reject if no chunk arrives within this many ms (per-chunk, not total). */
+  idleMs: number;
+  /** Optional OVERALL wall-clock deadline (epoch ms) — round-14, architect #7.
+   *  Default absent: per-chunk idle alone keeps long ACTIVE generations alive.
+   *  Non-interactive contexts opt in (JEO_STREAM_MAX_MS) so a slow-drip stream
+   *  (one token every idleMs-ε) cannot run unbounded. */
+  deadlineAt?: number;
+  onIdle?: () => void;
+}
+/** `iter.next()`, racing the per-chunk idle timeout AND (when set) the overall deadline. */
+async function nextMaybeIdle(iter: AsyncIterator<string>, idle?: StreamIdleOptions): Promise<IteratorResult<string>> {
+  if (!idle) return iter.next();
+  const remaining = idle.deadlineAt !== undefined ? idle.deadlineAt - Date.now() : Infinity;
+  if (remaining <= 0) {
+    idle.onIdle?.();
+    throw new Error(`stream exceeded the overall deadline (JEO_STREAM_MAX_MS) — slow-drip stream aborted`);
+  }
+  const waitMs = Math.min(idle.idleMs, remaining);
+  const deadlineFires = remaining < idle.idleMs;
+  let timer: ReturnType<typeof setTimeout> | undefined;
+  const timeout = new Promise<never>((_, reject) => {
+    timer = setTimeout(() => {
+      idle.onIdle?.();
+      reject(new Error(deadlineFires
+        ? `stream exceeded the overall deadline (JEO_STREAM_MAX_MS) — slow-drip stream aborted`
+        : `stream idle for ${idle.idleMs}ms (no chunk)`));
+    }, waitMs);
+  });
+  try {
+    return await Promise.race([iter.next(), timeout]);
+  } finally {
+    if (timer) clearTimeout(timer);
+  }
+}
+/** Opt-in overall stream wall-clock from the environment; undefined = off (default). */
+export function streamMaxMs(env?: Record<string, string | undefined>): number | undefined {
+  const raw = jeoEnv("STREAM_MAX_MS", env);
+  const n = raw !== undefined ? parseInt(raw, 10) : NaN;
+  return Number.isFinite(n) && n > 0 ? n : undefined;
+}
+export async function* retryableStream(
+  makeIter: () => AsyncIterator<string>,
+  retry: RetryOptions,
+  idle?: StreamIdleOptions,
+): AsyncGenerator<string> {
+  const { iter, first } = await withRetry(async () => {
+    const it = makeIter();
+    const f = await nextMaybeIdle(it, idle);
+    return { iter: it, first: f };
+  }, retry);
+  if (!first.done) {
+    yield first.value;
+    for (let n = await nextMaybeIdle(iter, idle); !n.done; n = await nextMaybeIdle(iter, idle)) yield n.value;
+  }
 }
 export function createModelManager(): ModelManager {
@@ -163,15 +460,32 @@ export function createModelManager(): ModelManager {
     resolveProvider,
     async call(messages, options = {}) {
       const { adapter, callOptions, credential, retry } = await resolveCall(options);
-      return withRetry(() => adapter.call(messages, callOptions, credential), retry);
+      return withRetry(() => adapter.call(messages, { ...callOptions, signal: withTimeout(callOptions.signal, DEFAULT_CALL_TIMEOUT_MS) }, credential), retry);
     },
     async *stream(messages, options = {}) {
-      const { adapter, callOptions, credential, retry } = await resolveCall(options);
+      const { adapter, callOptions, credential, retry } = await resolveCall(options, "stream");
       if (adapter.stream) {
-        yield* adapter.stream(messages, callOptions, credential);
+        const streamFn = adapter.stream.bind(adapter);
+        // Per-attempt abort controller fired by the idle timeout — so a stalled stream
+        // is cancelled, but a long, actively-emitting generation is NOT killed by a
+        // total wall-clock cap. The caller's signal (Ctrl-C) is preserved via composeAbort.
+        // JEO_STREAM_MAX_MS opts in to an OVERALL deadline (round-14): non-interactive
+        // runs can bound a slow-drip stream the per-chunk idle alone never catches.
+        let attempt: AbortController | null = null;
+        const makeIter = () => {
+          attempt = new AbortController();
+          const signal = composeAbort(callOptions.signal, attempt.signal);
+          return streamFn(messages, { ...callOptions, signal }, credential)[Symbol.asyncIterator]();
+        };
+        const maxMs = streamMaxMs();
+        yield* retryableStream(makeIter, retry, {
+          idleMs: STREAM_IDLE_TIMEOUT_MS,
+          ...(maxMs !== undefined ? { deadlineAt: Date.now() + maxMs } : {}),
+          onIdle: () => attempt?.abort(),
+        });
       } else {
         // Fallback: providers without streaming yield the full response as one chunk.
-        yield await withRetry(() => adapter.call(messages, callOptions, credential), retry);
+        yield await withRetry(() => adapter.call(messages, { ...callOptions, signal: withTimeout(callOptions.signal, DEFAULT_CALL_TIMEOUT_MS) }, credential), retry);
       }
     },
   };

package/src/ai/model-picker.ts CHANGED Viewed

@@ -2,7 +2,7 @@
  * Model picker — turn a live discovery result set into a flat, 1-based pick list
  * so the TUI can select a model by number (`/model #3`) or by a fuzzy substring
  * (`/model gpt-4`). Pure functions over `ProviderModelsResult[]`, so they are
- * fully unit-testable and shared by `/model`, `/models`, and `/provider`.
+ * fully unit-testable and shared by `/model` and `/provider`.
  */
 import type { ProviderModelsResult } from "./model-discovery";
 import type { ProviderName } from "./types";

package/src/ai/model-registry.ts CHANGED Viewed

@@ -9,8 +9,10 @@ export interface ModelAliases {
 export const BUILTIN_ALIASES: ModelAliases = {
   fast: "ollama/qwen2.5:0.5b",
   local: "ollama/qwen2.5:0.5b",
-  sonnet: "claude-3-5-sonnet",
-  gpt: "gpt-4o",
+  sonnet: "claude-sonnet-4-5",
+  opus: "claude-opus-4-5",
+  haiku: "claude-haiku-4-5",
+  gpt: "gpt-5.5",
   flash: "gemini-2.5-flash",
 };

package/src/ai/pricing.ts ADDED Viewed

@@ -0,0 +1,84 @@
+/**
+ * Static per-model price table for live `$` cost accounting (consensus-seed P1.B3).
+ *
+ * Prices are USD per 1,000,000 tokens, split input/output, and are MAINTAINED MANUALLY
+ * here (no network lookup) — update against each provider's public pricing page. Matching
+ * is by model-family substring so versioned ids (e.g. `claude-sonnet-4-5-20250929`) resolve
+ * without an exact-id table. An UNKNOWN model returns `null` so the caller shows token
+ * counts only and never fabricates a dollar figure.
+ */
+export interface ModelPrice {
+  /** USD per 1M input tokens. */
+  inPerM: number;
+  /** USD per 1M output tokens. */
+  outPerM: number;
+}
+export interface TokenUsage {
+  inputTokens: number;
+  outputTokens: number;
+}
+/**
+ * Family price table. Order matters: the FIRST substring that matches the lowercased
+ * model id wins, so list more-specific families before generic ones.
+ */
+const PRICE_TABLE: ReadonlyArray<readonly [pattern: string, price: ModelPrice]> = [
+  // Anthropic Claude
+  ["claude-opus", { inPerM: 15, outPerM: 75 }],
+  ["claude-sonnet", { inPerM: 3, outPerM: 15 }],
+  ["claude-haiku", { inPerM: 0.8, outPerM: 4 }],
+  ["opus", { inPerM: 15, outPerM: 75 }],
+  ["sonnet", { inPerM: 3, outPerM: 15 }],
+  ["haiku", { inPerM: 0.8, outPerM: 4 }],
+  // OpenAI o-series (reasoning) — pricier; match before generic gpt
+  ["o3", { inPerM: 2, outPerM: 8 }],
+  ["o4", { inPerM: 2, outPerM: 8 }],
+  ["o1", { inPerM: 15, outPerM: 60 }],
+  // OpenAI GPT
+  ["gpt-5", { inPerM: 1.25, outPerM: 10 }],
+  ["gpt-4o-mini", { inPerM: 0.15, outPerM: 0.6 }],
+  ["gpt-4o", { inPerM: 2.5, outPerM: 10 }],
+  ["gpt-4", { inPerM: 2.5, outPerM: 10 }],
+  ["gpt", { inPerM: 1.25, outPerM: 10 }],
+  // Google Gemini
+  ["gemini-2.5-pro", { inPerM: 1.25, outPerM: 10 }],
+  ["gemini-1.5-pro", { inPerM: 1.25, outPerM: 5 }],
+  ["gemini-2.5-flash", { inPerM: 0.3, outPerM: 2.5 }],
+  ["gemini-2.0-flash", { inPerM: 0.1, outPerM: 0.4 }],
+  ["gemini", { inPerM: 0.3, outPerM: 2.5 }],
+];
+/** Resolve the price for a model id by family substring, or `null` when unknown. */
+export function priceForModel(model: string | undefined): ModelPrice | null {
+  if (!model) return null;
+  const id = model.toLowerCase();
+  // Strip a leading `provider/` qualifier (e.g. `ollama/qwen`, `antigravity/...`).
+  const bare = id.includes("/") ? id.slice(id.indexOf("/") + 1) : id;
+  for (const [pattern, price] of PRICE_TABLE) {
+    if (bare.includes(pattern)) return price;
+  }
+  return null;
+}
+/**
+ * USD cost for a turn's token usage on `model`, or `null` when the model has no known
+ * price (caller then shows tokens only). Local/keyless models (ollama/*) and unlisted
+ * families return null by design — there is no real dollar cost to display.
+ */
+export function costForUsage(model: string | undefined, usage: TokenUsage | null | undefined): number | null {
+  if (!usage) return null;
+  const price = priceForModel(model);
+  if (!price) return null;
+  const cost = (usage.inputTokens / 1_000_000) * price.inPerM + (usage.outputTokens / 1_000_000) * price.outPerM;
+  return Number.isFinite(cost) ? cost : null;
+}
+/** Format a USD cost compactly: `$0.42`, `$1.20`, `$12.3`, `<$0.01` for tiny non-zero. */
+export function formatCost(usd: number): string {
+  if (usd <= 0) return "$0.00";
+  if (usd < 0.01) return "<$0.01";
+  if (usd < 10) return `$${usd.toFixed(2)}`;
+  if (usd < 100) return `$${usd.toFixed(1)}`;
+  return `$${Math.round(usd)}`;
+}

package/src/ai/provider-registry.ts ADDED Viewed

@@ -0,0 +1,23 @@
+import type { ProviderAdapter, ProviderName } from "./types";
+/**
+ * Provider Registry: Central hub for managing and loading LLM providers.
+ * Decouples model-manager from specific provider implementations.
+ */
+class ProviderRegistry {
+  private adapters = new Map<ProviderName, ProviderAdapter>();
+  register(name: ProviderName, adapter: ProviderAdapter) {
+    this.adapters.set(name, adapter);
+  }
+  get(name: ProviderName): ProviderAdapter | undefined {
+    return this.adapters.get(name);
+  }
+  listProviders(): ProviderName[] {
+    return Array.from(this.adapters.keys());
+  }
+}
+export const providerRegistry = new ProviderRegistry();