npm - @kkelly-offical/kkcode - Versions diffs - 0.1.7 → 0.2.3-preview.1 - Mend

@kkelly-offical/kkcode 0.1.7 → 0.2.3-preview.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (166) hide show

package/LICENSE +674 -674
package/README.md +474 -387
package/package.json +50 -46
package/src/agent/agent.mjs +228 -220
package/src/agent/custom-agent-loader.mjs +6 -3
package/src/agent/generator.mjs +2 -2
package/src/agent/prompt/assistant.txt +12 -0
package/src/agent/prompt/bug-hunter.txt +89 -89
package/src/agent/prompt/frontend-designer.txt +58 -58
package/src/agent/prompt/guide.txt +1 -1
package/src/agent/prompt/longagent-blueprint-agent.txt +83 -83
package/src/agent/prompt/longagent-coding-agent.txt +37 -37
package/src/agent/prompt/longagent-debugging-agent.txt +46 -46
package/src/agent/prompt/longagent-preview-agent.txt +63 -63
package/src/command/custom-commands.mjs +2 -2
package/src/commands/agent.mjs +1 -1
package/src/commands/background.mjs +145 -4
package/src/commands/chat.mjs +117 -76
package/src/commands/config.mjs +148 -1
package/src/commands/doctor.mjs +30 -6
package/src/commands/init.mjs +32 -6
package/src/commands/longagent.mjs +117 -0
package/src/commands/mcp.mjs +275 -43
package/src/commands/permission.mjs +1 -1
package/src/commands/session.mjs +195 -140
package/src/commands/skill.mjs +63 -0
package/src/commands/theme.mjs +1 -1
package/src/commands/update.mjs +32 -0
package/src/config/defaults.mjs +289 -260
package/src/config/import-config.mjs +1 -1
package/src/config/load-config.mjs +61 -4
package/src/config/schema.mjs +604 -574
package/src/context.mjs +4 -1
package/src/core/constants.mjs +97 -91
package/src/core/types.mjs +1 -1
package/src/github/api.mjs +78 -78
package/src/github/auth.mjs +294 -286
package/src/github/flow.mjs +298 -298
package/src/github/workspace.mjs +225 -212
package/src/index.mjs +87 -82
package/src/knowledge/frontend-aesthetics.txt +38 -38
package/src/mcp/client-http.mjs +139 -141
package/src/mcp/client-sse.mjs +297 -288
package/src/mcp/client-stdio.mjs +534 -533
package/src/mcp/constants.mjs +4 -2
package/src/mcp/registry.mjs +498 -479
package/src/mcp/stdio-framing.mjs +135 -133
package/src/mcp/tool-result.mjs +24 -24
package/src/observability/edit-diagnostics.mjs +449 -0
package/src/observability/index.mjs +42 -42
package/src/observability/metrics.mjs +165 -137
package/src/observability/tracer.mjs +137 -137
package/src/onboarding.mjs +209 -0
package/src/orchestration/background-manager.mjs +567 -372
package/src/orchestration/background-worker.mjs +419 -305
package/src/orchestration/interruption-reason.mjs +21 -0
package/src/orchestration/longagent-manager.mjs +197 -171
package/src/orchestration/stage-scheduler.mjs +733 -728
package/src/orchestration/subagent-router.mjs +7 -1
package/src/orchestration/task-scheduler.mjs +219 -7
package/src/permission/engine.mjs +1 -1
package/src/permission/exec-policy.mjs +370 -370
package/src/permission/file-edit-policy.mjs +108 -0
package/src/permission/prompt.mjs +1 -1
package/src/permission/rules.mjs +116 -7
package/src/plugin/builtin-hooks/post-edit-format.mjs +2 -1
package/src/plugin/builtin-hooks/post-edit-typecheck.mjs +104 -40
package/src/plugin/hook-bus.mjs +19 -5
package/src/plugin/manifest-loader.mjs +222 -0
package/src/provider/anthropic.mjs +396 -390
package/src/provider/ollama.mjs +7 -1
package/src/provider/openai.mjs +382 -340
package/src/provider/retry-policy.mjs +74 -68
package/src/provider/router.mjs +242 -241
package/src/provider/sse.mjs +104 -104
package/src/provider/wizard.mjs +556 -0
package/src/repl/capability-facade.mjs +30 -0
package/src/repl/command-surface.mjs +23 -0
package/src/repl/controller-entry.mjs +40 -0
package/src/repl/core-shell.mjs +208 -0
package/src/repl/dialog-router.mjs +87 -0
package/src/repl/input-engine.mjs +76 -0
package/src/repl/keymap.mjs +7 -0
package/src/repl/operator-surface.mjs +15 -0
package/src/repl/permission-flow.mjs +49 -0
package/src/repl/runtime-facade.mjs +36 -0
package/src/repl/slash-router.mjs +62 -0
package/src/repl/state-store.mjs +29 -0
package/src/repl/turn-controller.mjs +58 -0
package/src/repl/verification.mjs +23 -0
package/src/repl.mjs +3371 -2981
package/src/rules/load-rules.mjs +3 -3
package/src/runtime.mjs +1 -1
package/src/session/agent-transaction.mjs +86 -0
package/src/session/checkpoint.mjs +302 -302
package/src/session/compaction.mjs +298 -298
package/src/session/engine.mjs +417 -232
package/src/session/longagent-4stage.mjs +467 -460
package/src/session/longagent-hybrid.mjs +1344 -1097
package/src/session/longagent-plan.mjs +376 -365
package/src/session/longagent-project-memory.mjs +53 -53
package/src/session/longagent-scaffold.mjs +291 -291
package/src/session/longagent-task-bus.mjs +138 -54
package/src/session/longagent-utils.mjs +828 -472
package/src/session/longagent.mjs +911 -900
package/src/session/loop.mjs +1005 -930
package/src/session/prompt/agent.txt +25 -25
package/src/session/prompt/anthropic.txt +150 -150
package/src/session/prompt/beast.txt +1 -1
package/src/session/prompt/plan.txt +31 -31
package/src/session/prompt/qwen.txt +46 -46
package/src/session/recovery.mjs +21 -0
package/src/session/rollback.mjs +196 -195
package/src/session/routing-observability.mjs +72 -0
package/src/session/runtime-state.mjs +47 -0
package/src/session/store.mjs +523 -519
package/src/session/system-prompt.mjs +308 -273
package/src/session/task-validator.mjs +267 -267
package/src/session/usability-gates.mjs +2 -2
package/src/skill/builtin/commit.mjs +64 -64
package/src/skill/builtin/design.mjs +76 -76
package/src/skill/generator.mjs +18 -2
package/src/skill/registry.mjs +642 -390
package/src/storage/audit-store.mjs +18 -11
package/src/storage/event-log.mjs +7 -1
package/src/storage/ghost-commit-store.mjs +243 -245
package/src/storage/paths.mjs +17 -0
package/src/theme/default-theme.mjs +1 -1
package/src/theme/markdown.mjs +4 -0
package/src/theme/schema.mjs +1 -1
package/src/theme/status-bar.mjs +162 -158
package/src/tool/audit-wrapper.mjs +18 -2
package/src/tool/edit-transaction.mjs +23 -0
package/src/tool/executor.mjs +26 -1
package/src/tool/file-read-state.mjs +65 -0
package/src/tool/git-auto.mjs +526 -526
package/src/tool/git-full-auto.mjs +487 -478
package/src/tool/mutation-guard.mjs +54 -0
package/src/tool/prompt/edit.txt +3 -3
package/src/tool/prompt/multiedit.txt +1 -0
package/src/tool/prompt/notebookedit.txt +2 -1
package/src/tool/prompt/patch.txt +25 -24
package/src/tool/prompt/read.txt +3 -3
package/src/tool/prompt/sysinfo.txt +29 -0
package/src/tool/prompt/task.txt +66 -4
package/src/tool/prompt/write.txt +2 -2
package/src/tool/question-prompt.mjs +99 -93
package/src/tool/registry.mjs +1701 -1343
package/src/tool/task-tool.mjs +14 -6
package/src/ui/activity-renderer.mjs +667 -664
package/src/ui/repl-background-panel.mjs +7 -0
package/src/ui/repl-capability-panel.mjs +9 -0
package/src/ui/repl-dashboard.mjs +54 -4
package/src/ui/repl-help.mjs +110 -0
package/src/ui/repl-operator-panel.mjs +12 -0
package/src/ui/repl-route-feedback.mjs +35 -0
package/src/ui/repl-status-view.mjs +76 -0
package/src/ui/repl-task-panel.mjs +5 -0
package/src/ui/repl-transcript-panel.mjs +56 -0
package/src/ui/repl-turn-summary.mjs +135 -0
package/src/update/checker.mjs +184 -0
package/src/usage/pricing.mjs +122 -121
package/src/usage/usage-meter.mjs +1 -0
package/src/util/git.mjs +562 -519
package/src/util/template.mjs +6 -1
package/src/version.mjs +3 -0

package/src/provider/openai.mjs CHANGED Viewed

@@ -1,340 +1,382 @@
-import { ProviderError } from "../core/errors.mjs"
-import { requestWithRetry } from "./retry-policy.mjs"
-import { parseSSE } from "./sse.mjs"
-function sleep(ms) {
-  return new Promise((resolve) => setTimeout(resolve, ms))
-}
-function mapTools(tools) {
-  if (!tools || !tools.length) return undefined
-  return tools.map((tool) => ({
-    type: "function",
-    function: {
-      name: tool.name,
-      description: tool.description,
-      parameters: tool.inputSchema
-    }
-  }))
-}
-function mapContentBlock(block) {
-  if (block.type === "image" && block.data) {
-    return {
-      type: "image_url",
-      image_url: {
-        url: `data:${block.mediaType || "image/png"};base64,${block.data}`
-      }
-    }
-  }
-  return { type: "text", text: String(block.text || block.content || "") }
-}
-function mapMessages(messages) {
-  const mapped = []
-  for (const message of messages) {
-    const content = message.content
-    if (!Array.isArray(content)) {
-      mapped.push({ role: message.role, content: String(content || "") })
-      continue
-    }
-    // Check for native tool_use blocks (assistant message with tool calls)
-    const toolUseBlocks = content.filter((b) => b.type === "tool_use")
-    if (toolUseBlocks.length > 0 && message.role === "assistant") {
-      const textParts = content.filter((b) => b.type === "text").map((b) => b.text || "").join("\n")
-      mapped.push({
-        role: "assistant",
-        content: textParts || null,
-        tool_calls: toolUseBlocks.map((b) => ({
-          id: b.id,
-          type: "function",
-          function: {
-            name: b.name,
-            arguments: JSON.stringify(b.input || {})
-          }
-        }))
-      })
-      continue
-    }
-    // Check for tool_result blocks (user message with tool results)
-    const toolResultBlocks = content.filter((b) => b.type === "tool_result")
-    if (toolResultBlocks.length > 0) {
-      for (const result of toolResultBlocks) {
-        mapped.push({
-          role: "tool",
-          tool_call_id: result.tool_use_id,
-          content: String(result.content || "")
-        })
-      }
-      continue
-    }
-    // Regular array content (images, text)
-    mapped.push({ role: message.role, content: content.map(mapContentBlock) })
-  }
-  return mapped
-}
-function parseToolCalls(message) {
-  if (!Array.isArray(message?.tool_calls)) return []
-  return message.tool_calls
-    .filter((call) => call?.function?.name)
-    .map((call) => {
-      const raw = call.function.arguments || "{}"
-      let args = {}
-      try {
-        args = JSON.parse(raw)
-      } catch (parseErr) {
-        console.error(`[openai] tool_call JSON parse failed for "${call.function.name}": ${parseErr.message} (${raw.length} chars, first 200: ${raw.slice(0, 200)})`)
-        args = { __parse_error: true, __raw_length: raw.length, __error: parseErr.message }
-      }
-      return {
-        id: call.id || `tc_${Date.now()}_${Math.random().toString(36).slice(2, 8)}`,
-        name: call.function.name,
-        args
-      }
-    })
-}
-// Build system messages from structured blocks for optimal prefix caching.
-// OpenAI auto-caches matching prefixes — stable content first, dynamic last.
-function buildSystemMessages(system) {
-  if (!system) return []
-  if (system.blocks && Array.isArray(system.blocks)) {
-    const stable = []
-    const dynamic = []
-    for (const block of system.blocks) {
-      if (block.cacheable) stable.push(block.text)
-      else dynamic.push(block.text)
-    }
-    const msgs = []
-    if (stable.length) msgs.push({ role: "system", content: stable.join("\n\n") })
-    if (dynamic.length) msgs.push({ role: "system", content: dynamic.join("\n\n") })
-    return msgs
-  }
-  const text = typeof system === "string" ? system : system.text || String(system)
-  return text ? [{ role: "system", content: text }] : []
-}
-function timeoutSignal(ms, parentSignal = null) {
-  const own = AbortSignal.timeout(ms)
-  if (!parentSignal) return own
-  return AbortSignal.any([parentSignal, own])
-}
-export async function countTokensOpenAI(input) {
-  const { apiKey, baseUrl, model, system, messages, tools, timeoutMs = 10000 } = input
-  if (!apiKey) return null
-  const endpoint = `${baseUrl.replace(/\/$/, "")}/chat/completions`
-  const payload = {
-    model,
-    messages: [...buildSystemMessages(system), ...mapMessages(messages)],
-    tools: mapTools(tools),
-    max_tokens: 1,
-    stream: false
-  }
-  try {
-    const res = await fetch(endpoint, {
-      method: "POST",
-      headers: { "content-type": "application/json", authorization: `Bearer ${apiKey}` },
-      body: JSON.stringify(payload),
-      signal: AbortSignal.timeout(timeoutMs)
-    })
-    if (!res.ok) return null
-    const json = await res.json()
-    return json?.usage?.prompt_tokens ?? null
-  } catch {
-    return null
-  }
-}
-export async function requestOpenAI(input) {
-  const { apiKey, baseUrl, model, system, messages, tools, timeoutMs = 120000, maxTokens, retry = {}, signal = null } = input
-  if (!apiKey) {
-    throw new ProviderError(`missing API key for openai provider (env: ${input.apiKeyEnv || "unknown"})`, {
-      provider: "openai"
-    })
-  }
-  const payload = {
-    model,
-    messages: [...buildSystemMessages(system), ...mapMessages(messages)],
-    tools: mapTools(tools),
-    tool_choice: tools?.length ? "auto" : undefined,
-    ...(maxTokens ? { max_tokens: maxTokens } : {})
-  }
-  const endpoint = `${baseUrl.replace(/\/$/, "")}/chat/completions`
-  return requestWithRetry({
-    attempts: Number(retry.attempts ?? 3),
-    baseDelayMs: Number(retry.baseDelayMs ?? 800),
-    signal,
-    execute: async () => {
-      const response = await fetch(endpoint, {
-        method: "POST",
-        headers: {
-          "content-type": "application/json",
-          authorization: `Bearer ${apiKey}`
-        },
-        body: JSON.stringify(payload),
-        signal: timeoutSignal(timeoutMs, signal)
-      })
-      if (!response.ok) {
-        const text = await response.text().catch(() => "")
-        const error = new ProviderError(`openai request failed: ${response.status} ${text}`, {
-          provider: "openai",
-          model,
-          endpoint
-        })
-        error.httpStatus = response.status
-        throw error
-      }
-      const json = await response.json()
-      const message = json?.choices?.[0]?.message ?? {}
-      const promptTokens = json?.usage?.prompt_tokens ?? 0
-      const cachedTokens = json?.usage?.prompt_tokens_details?.cached_tokens ?? 0
-      const usage = {
-        input: promptTokens - cachedTokens,
-        output: json?.usage?.completion_tokens ?? 0,
-        cacheRead: cachedTokens,
-        cacheWrite: 0
-      }
-      const toolCalls = parseToolCalls(message)
-      const text = typeof message.content === "string" ? message.content : ""
-      return { text, usage, toolCalls }
-    }
-  })
-}
-export async function* requestOpenAIStream(input) {
-  const { apiKey, baseUrl, model, system, messages, tools, timeoutMs = 120000, streamIdleTimeoutMs = 120000, maxTokens, retry = {}, signal = null } = input
-  if (!apiKey) {
-    throw new ProviderError(`missing API key for openai provider (env: ${input.apiKeyEnv || "unknown"})`, {
-      provider: "openai"
-    })
-  }
-  const payload = {
-    model,
-    messages: [...buildSystemMessages(system), ...mapMessages(messages)],
-    tools: mapTools(tools),
-    tool_choice: tools?.length ? "auto" : undefined,
-    ...(maxTokens ? { max_tokens: maxTokens } : {}),
-    stream: true,
-    stream_options: { include_usage: true }
-  }
-  const endpoint = `${baseUrl.replace(/\/$/, "")}/chat/completions`
-  const attempts = Number(retry.attempts ?? 3)
-  const baseDelayMs = Number(retry.baseDelayMs ?? 800)
-  let response
-  for (let attempt = 1; attempt <= attempts; attempt++) {
-    try {
-      // Use a connection-only timeout for the initial fetch.
-      // Once headers arrive, clear it — the SSE idle timeout handles the streaming phase.
-      const connController = new AbortController()
-      const connTimer = setTimeout(() => connController.abort(), timeoutMs)
-      const fetchSignal = signal
-        ? AbortSignal.any([signal, connController.signal])
-        : connController.signal
-      response = await fetch(endpoint, {
-        method: "POST",
-        headers: {
-          "content-type": "application/json",
-          authorization: `Bearer ${apiKey}`
-        },
-        body: JSON.stringify(payload),
-        signal: fetchSignal
-      })
-      clearTimeout(connTimer)
-      if (!response.ok) {
-        const text = await response.text().catch(() => "")
-        const error = new ProviderError(`openai stream failed: ${response.status} ${text}`, {
-          provider: "openai", model, endpoint
-        })
-        error.httpStatus = response.status
-        throw error
-      }
-      break
-    } catch (err) {
-      clearTimeout(connTimer)
-      if (signal?.aborted) throw err
-      const isNetwork = err?.code === "ETIMEDOUT" || err?.code === "ECONNRESET" || err?.name === "AbortError"
-      if (!isNetwork || attempt >= attempts) throw err
-      await sleep(baseDelayMs * Math.pow(2, attempt - 1))
-    }
-  }
-  const toolBuffers = new Map()
-  let finishReason = null
-  for await (const { data } of parseSSE(response.body, signal, { idleTimeoutMs: streamIdleTimeoutMs })) {
-    let json
-    try { json = JSON.parse(data) } catch { continue }
-    if (json.usage) {
-      const pt = json.usage.prompt_tokens ?? 0
-      const ct = json.usage.prompt_tokens_details?.cached_tokens ?? 0
-      yield {
-        type: "usage",
-        usage: { input: pt - ct, output: json.usage.completion_tokens ?? 0, cacheRead: ct, cacheWrite: 0 }
-      }
-    }
-    const choice = json.choices?.[0]
-    if (choice?.finish_reason) {
-      finishReason = choice.finish_reason
-    }
-    const delta = choice?.delta
-    if (!delta) continue
-    if (delta.content) {
-      yield { type: "text", content: delta.content }
-    }
-    if (delta.tool_calls) {
-      for (const tc of delta.tool_calls) {
-        const idx = tc.index ?? 0
-        if (!toolBuffers.has(idx)) {
-          toolBuffers.set(idx, { id: "", name: "", argsJson: "" })
-        }
-        const buf = toolBuffers.get(idx)
-        if (tc.id) buf.id = tc.id
-        if (tc.function?.name) buf.name = tc.function.name
-        if (tc.function?.arguments) buf.argsJson += tc.function.arguments
-      }
-    }
-  }
-  for (const [, buf] of toolBuffers) {
-    const raw = buf.argsJson || "{}"
-    let args = {}
-    try {
-      args = JSON.parse(raw)
-    } catch (parseErr) {
-      console.error(`[openai] tool_call JSON parse failed for "${buf.name}": ${parseErr.message} (${raw.length} chars, first 200: ${raw.slice(0, 200)})`)
-      args = { __parse_error: true, __raw_length: raw.length, __error: parseErr.message }
-    }
-    yield {
-      type: "tool_call",
-      call: {
-        id: buf.id || `tc_${Date.now()}`,
-        name: buf.name,
-        args
-      }
-    }
-  }
-  // Normalize: "stop" → "end_turn", "length" → "max_tokens", "tool_calls" → "tool_use"
-  const normalizedReason = finishReason === "length" ? "max_tokens"
-    : finishReason === "tool_calls" ? "tool_use"
-    : finishReason === "stop" ? "end_turn"
-    : finishReason || "end_turn"
-  yield { type: "stop", reason: normalizedReason }
-}
+import { ProviderError } from "../core/errors.mjs"
+import { requestWithRetry } from "./retry-policy.mjs"
+import { parseSSE } from "./sse.mjs"
+function sleep(ms) {
+  return new Promise((resolve) => setTimeout(resolve, ms))
+}
+function mapTools(tools) {
+  if (!tools || !tools.length) return undefined
+  const mapped = tools.map((tool) => ({
+    type: "function",
+    function: {
+      name: tool.name,
+      description: tool.description,
+      parameters: tool.inputSchema
+    }
+  }))
+  // Cache tool definitions — they rarely change within a session
+  if (mapped.length > 0) {
+    mapped[mapped.length - 1].cache_control = { type: "ephemeral" }
+  }
+  return mapped
+}
+function mapContentBlock(block) {
+  if (block.type === "image" && block.data) {
+    return {
+      type: "image_url",
+      image_url: {
+        url: `data:${block.mediaType || "image/png"};base64,${block.data}`
+      }
+    }
+  }
+  return { type: "text", text: String(block.text || block.content || "") }
+}
+function mapMessages(messages) {
+  const mapped = []
+  for (const message of messages) {
+    const content = message.content
+    if (!Array.isArray(content)) {
+      mapped.push({ role: message.role, content: String(content || "") })
+      continue
+    }
+    // Check for native tool_use blocks (assistant message with tool calls)
+    const toolUseBlocks = content.filter((b) => b.type === "tool_use")
+    if (toolUseBlocks.length > 0 && message.role === "assistant") {
+      const textParts = content.filter((b) => b.type === "text").map((b) => b.text || "").join("\n")
+      mapped.push({
+        role: "assistant",
+        content: textParts || null,
+        tool_calls: toolUseBlocks.map((b) => ({
+          id: b.id,
+          type: "function",
+          function: {
+            name: b.name,
+            arguments: JSON.stringify(b.input || {})
+          }
+        }))
+      })
+      continue
+    }
+    // Check for tool_result blocks (user message with tool results)
+    const toolResultBlocks = content.filter((b) => b.type === "tool_result")
+    if (toolResultBlocks.length > 0) {
+      for (const result of toolResultBlocks) {
+        mapped.push({
+          role: "tool",
+          tool_call_id: result.tool_use_id,
+          content: String(result.content || "")
+        })
+      }
+      continue
+    }
+    // Regular array content (images, text)
+    mapped.push({ role: message.role, content: content.map(mapContentBlock) })
+  }
+  // Add cache_control to the last user message for multi-turn caching
+  for (let i = mapped.length - 1; i >= 0; i--) {
+    if (mapped[i].role === "user") {
+      const c = mapped[i].content
+      if (Array.isArray(c) && c.length) {
+        c[c.length - 1].cache_control = { type: "ephemeral" }
+      } else if (typeof c === "string") {
+        mapped[i].content = [{ type: "text", text: c, cache_control: { type: "ephemeral" } }]
+      }
+      break
+    }
+  }
+  return mapped
+}
+function parseToolCalls(message) {
+  if (!Array.isArray(message?.tool_calls)) return []
+  return message.tool_calls
+    .filter((call) => call?.function?.name)
+    .map((call) => {
+      const raw = call.function.arguments || "{}"
+      let args = {}
+      try {
+        args = JSON.parse(raw)
+      } catch (parseErr) {
+        console.error(`[openai] tool_call JSON parse failed for "${call.function.name}": ${parseErr.message} (${raw.length} chars, first 200: ${raw.slice(0, 200)})`)
+        args = { __parse_error: true, __raw_length: raw.length, __error: parseErr.message }
+      }
+      return {
+        id: call.id || `tc_${Date.now()}_${Math.random().toString(36).slice(2, 8)}`,
+        name: call.function.name,
+        args
+      }
+    })
+}
+// Build system messages from structured blocks with cache_control markers.
+// Stable content gets cache_control for prompt caching (OpenAI auto-cache + Qwen/compatible explicit cache).
+function buildSystemMessages(system) {
+  if (!system) return []
+  if (system.blocks && Array.isArray(system.blocks)) {
+    const stable = []
+    const dynamic = []
+    for (const block of system.blocks) {
+      if (block.cacheable) stable.push(block.text)
+      else dynamic.push(block.text)
+    }
+    const msgs = []
+    if (stable.length) {
+      msgs.push({
+        role: "system",
+        content: [{
+          type: "text",
+          text: stable.join("\n\n"),
+          cache_control: { type: "ephemeral" }
+        }]
+      })
+    }
+    if (dynamic.length) msgs.push({ role: "system", content: dynamic.join("\n\n") })
+    return msgs
+  }
+  const text = typeof system === "string" ? system : system.text || String(system)
+  if (!text) return []
+  return [{
+    role: "system",
+    content: [{ type: "text", text, cache_control: { type: "ephemeral" } }]
+  }]
+}
+function timeoutSignal(ms, parentSignal = null) {
+  const own = AbortSignal.timeout(ms)
+  if (!parentSignal) return own
+  return AbortSignal.any([parentSignal, own])
+}
+export async function countTokensOpenAI(input) {
+  const { apiKey, baseUrl, model, system, messages, tools, timeoutMs = 10000 } = input
+  if (!apiKey) return null
+  const endpoint = `${baseUrl.replace(/\/$/, "")}/chat/completions`
+  const payload = {
+    model,
+    messages: [...buildSystemMessages(system), ...mapMessages(messages)],
+    tools: mapTools(tools),
+    max_tokens: 1,
+    stream: false
+  }
+  try {
+    const res = await fetch(endpoint, {
+      method: "POST",
+      headers: { "content-type": "application/json", authorization: `Bearer ${apiKey}` },
+      body: JSON.stringify(payload),
+      signal: AbortSignal.timeout(timeoutMs)
+    })
+    if (!res.ok) return null
+    const json = await res.json()
+    return json?.usage?.prompt_tokens ?? null
+  } catch {
+    return null
+  }
+}
+export async function requestOpenAI(input) {
+  const { apiKey, baseUrl, model, system, messages, tools, timeoutMs = 120000, maxTokens, retry = {}, signal = null } = input
+  if (!apiKey) {
+    throw new ProviderError(`missing API key for openai provider (env: ${input.apiKeyEnv || "unknown"})`, {
+      provider: "openai"
+    })
+  }
+  const payload = {
+    model,
+    messages: [...buildSystemMessages(system), ...mapMessages(messages)],
+    tools: mapTools(tools),
+    tool_choice: tools?.length ? "auto" : undefined,
+    ...(maxTokens ? { max_tokens: maxTokens } : {})
+  }
+  const endpoint = `${baseUrl.replace(/\/$/, "")}/chat/completions`
+  return requestWithRetry({
+    attempts: Number(retry.attempts ?? 3),
+    baseDelayMs: Number(retry.baseDelayMs ?? 800),
+    signal,
+    execute: async () => {
+      const response = await fetch(endpoint, {
+        method: "POST",
+        headers: {
+          "content-type": "application/json",
+          authorization: `Bearer ${apiKey}`
+        },
+        body: JSON.stringify(payload),
+        signal: timeoutSignal(timeoutMs, signal)
+      })
+      if (!response.ok) {
+        const text = await response.text().catch(() => "")
+        const error = new ProviderError(`openai request failed: ${response.status} ${text}`, {
+          provider: "openai",
+          model,
+          endpoint
+        })
+        error.httpStatus = response.status
+        throw error
+      }
+      let json
+      try {
+        json = await response.json()
+      } catch (parseErr) {
+        throw new ProviderError(`openai response JSON parse failed: ${parseErr.message}`, { provider: "openai", model, endpoint })
+      }
+      const message = json?.choices?.[0]?.message ?? {}
+      const promptTokens = json?.usage?.prompt_tokens ?? 0
+      const details = json?.usage?.prompt_tokens_details || {}
+      const cachedTokens = details.cached_tokens ?? 0
+      const cacheWriteTokens = details.cache_creation_input_tokens ?? 0
+      const usage = {
+        input: promptTokens - cachedTokens,
+        output: json?.usage?.completion_tokens ?? 0,
+        cacheRead: cachedTokens,
+        cacheWrite: cacheWriteTokens
+      }
+      const toolCalls = parseToolCalls(message)
+      const text = typeof message.content === "string" ? message.content : ""
+      return { text, usage, toolCalls }
+    }
+  })
+}
+export async function* requestOpenAIStream(input) {
+  const { apiKey, baseUrl, model, system, messages, tools, timeoutMs = 120000, streamIdleTimeoutMs = 120000, maxTokens, retry = {}, signal = null } = input
+  if (!apiKey) {
+    throw new ProviderError(`missing API key for openai provider (env: ${input.apiKeyEnv || "unknown"})`, {
+      provider: "openai"
+    })
+  }
+  const payload = {
+    model,
+    messages: [...buildSystemMessages(system), ...mapMessages(messages)],
+    tools: mapTools(tools),
+    tool_choice: tools?.length ? "auto" : undefined,
+    ...(maxTokens ? { max_tokens: maxTokens } : {}),
+    stream: true,
+    stream_options: { include_usage: true }
+  }
+  const endpoint = `${baseUrl.replace(/\/$/, "")}/chat/completions`
+  const attempts = Number(retry.attempts ?? 3)
+  const baseDelayMs = Number(retry.baseDelayMs ?? 800)
+  let response
+  for (let attempt = 1; attempt <= attempts; attempt++) {
+    let connTimer = null
+    const connController = new AbortController()
+    try {
+      // Use a connection-only timeout for the initial fetch.
+      // Once headers arrive, clear it — the SSE idle timeout handles the streaming phase.
+      connTimer = setTimeout(() => connController.abort(), timeoutMs)
+      const fetchSignal = signal
+        ? AbortSignal.any([signal, connController.signal])
+        : connController.signal
+      response = await fetch(endpoint, {
+        method: "POST",
+        headers: {
+          "content-type": "application/json",
+          authorization: `Bearer ${apiKey}`
+        },
+        body: JSON.stringify(payload),
+        signal: fetchSignal
+      })
+      clearTimeout(connTimer)
+      if (!response.ok) {
+        const text = await response.text().catch(() => "")
+        const error = new ProviderError(`openai stream failed: ${response.status} ${text}`, {
+          provider: "openai", model, endpoint
+        })
+        error.httpStatus = response.status
+        throw error
+      }
+      break
+    } catch (err) {
+      clearTimeout(connTimer)
+      if (signal?.aborted) throw err
+      const isNetwork = err?.code === "ETIMEDOUT" || err?.code === "ECONNRESET" || err?.name === "AbortError"
+      if (!isNetwork || attempt >= attempts) throw err
+      await sleep(baseDelayMs * Math.pow(2, attempt - 1))
+    }
+  }
+  const toolBuffers = new Map()
+  let finishReason = null
+  for await (const { data } of parseSSE(response.body, signal, { idleTimeoutMs: streamIdleTimeoutMs })) {
+    let json
+    try { json = JSON.parse(data) } catch { continue }
+    if (json.usage) {
+      const pt = json.usage.prompt_tokens ?? 0
+      const details = json.usage.prompt_tokens_details || {}
+      const ct = details.cached_tokens ?? 0
+      const cw = details.cache_creation_input_tokens ?? 0
+      yield {
+        type: "usage",
+        usage: { input: pt - ct, output: json.usage.completion_tokens ?? 0, cacheRead: ct, cacheWrite: cw }
+      }
+    }
+    const choice = json.choices?.[0]
+    if (choice?.finish_reason) {
+      finishReason = choice.finish_reason
+    }
+    const delta = choice?.delta
+    if (!delta) continue
+    if (delta.content) {
+      yield { type: "text", content: delta.content }
+    }
+    if (delta.tool_calls) {
+      for (const tc of delta.tool_calls) {
+        const idx = tc.index ?? 0
+        if (!toolBuffers.has(idx)) {
+          toolBuffers.set(idx, { id: "", name: "", argsJson: "" })
+        }
+        const buf = toolBuffers.get(idx)
+        if (tc.id) buf.id = tc.id
+        if (tc.function?.name) buf.name = tc.function.name
+        if (tc.function?.arguments) buf.argsJson += tc.function.arguments
+      }
+    }
+  }
+  for (const [, buf] of toolBuffers) {
+    const raw = buf.argsJson || "{}"
+    let args = {}
+    try {
+      args = JSON.parse(raw)
+    } catch (parseErr) {
+      console.error(`[openai] tool_call JSON parse failed for "${buf.name}": ${parseErr.message} (${raw.length} chars, first 200: ${raw.slice(0, 200)})`)
+      args = { __parse_error: true, __raw_length: raw.length, __error: parseErr.message }
+    }
+    yield {
+      type: "tool_call",
+      call: {
+        id: buf.id || `tc_${Date.now()}`,
+        name: buf.name,
+        args
+      }
+    }
+  }
+  // Normalize: "stop" → "end_turn", "length" → "max_tokens", "tool_calls" → "tool_use"
+  const normalizedReason = finishReason === "length" ? "max_tokens"
+    : finishReason === "tool_calls" ? "tool_use"
+    : finishReason === "stop" ? "end_turn"
+    : finishReason || "end_turn"
+  yield { type: "stop", reason: normalizedReason }
+}