npm - @next-open-ai/openclawx - Versions diffs - 0.8.48 → 0.8.58 - Mend

@next-open-ai/openclawx 0.8.48 → 0.8.58

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (35) hide show

package/apps/desktop/renderer/dist/assets/index-M5VGUUpo.js +93 -0
package/apps/desktop/renderer/dist/assets/{index-BHY1xIZQ.css → index-y8oE2q_u.css} +1 -1
package/apps/desktop/renderer/dist/index.html +2 -2
package/dist/cli/cli.js +107 -0
package/dist/core/agent/agent-manager.js +4 -0
package/dist/core/config/desktop-config.d.ts +2 -1
package/dist/core/config/desktop-config.js +92 -26
package/dist/core/local-llm-server/download-model.d.ts +16 -0
package/dist/core/local-llm-server/download-model.js +37 -0
package/dist/core/local-llm-server/index.js +26 -5
package/dist/core/local-llm-server/llm-context.d.ts +9 -4
package/dist/core/local-llm-server/llm-context.js +35 -14
package/dist/core/local-llm-server/model-resolve.d.ts +8 -1
package/dist/core/local-llm-server/model-resolve.js +44 -12
package/dist/core/local-llm-server/server.js +11 -12
package/dist/core/local-llm-server/start-from-config.d.ts +5 -0
package/dist/core/local-llm-server/start-from-config.js +50 -0
package/dist/core/mcp/transport/stdio.d.ts +6 -0
package/dist/core/mcp/transport/stdio.js +107 -27
package/dist/core/memory/local-embedding-llama.js +2 -4
package/dist/gateway/methods/agent-chat.js +9 -0
package/dist/gateway/server.js +8 -51
package/dist/server/bootstrap.d.ts +1 -0
package/dist/server/bootstrap.js +3 -0
package/dist/server/config/config.controller.d.ts +25 -2
package/dist/server/config/config.controller.js +62 -12
package/dist/server/config/config.service.d.ts +4 -1
package/dist/server/config/config.service.js +62 -9
package/dist/server/config/local-models.service.d.ts +16 -1
package/dist/server/config/local-models.service.js +78 -46
package/package.json +1 -1
package/presets/preset-agents.json +6 -2
package/presets/preset-config.json +24 -6
package/apps/desktop/renderer/dist/assets/index-DQxlVuBe.js +0 -93
package/presets/workspaces/finance-expert/skills/akshare-helper/SKILL.md +0 -9

package/apps/desktop/renderer/dist/index.html CHANGED Viewed

@@ -11,8 +11,8 @@
     <link
         href="https://fonts.googleapis.com/css2?family=Inter:wght@300;400;500;600;700&family=Roboto+Mono:wght@400;500&display=swap"
         rel="stylesheet">
-  <script type="module" crossorigin src="/assets/index-DQxlVuBe.js"></script>
-  <link rel="stylesheet" crossorigin href="/assets/index-BHY1xIZQ.css">
+  <script type="module" crossorigin src="/assets/index-M5VGUUpo.js"></script>
+  <link rel="stylesheet" crossorigin href="/assets/index-y8oE2q_u.css">
 </head>
 <body>

package/dist/cli/cli.js CHANGED Viewed

@@ -6,6 +6,9 @@ import { Command } from "commander";
 import { getOpenbotAgentDir } from "../core/agent/agent-dir.js";
 import { run } from "../core/agent/run.js";
 import { loadDesktopAgentConfig, getBoundAgentIdForCli, setProviderApiKey, setDefaultModel, getDesktopConfigList, syncDesktopConfigToModelsJson, ensureDesktopConfigInitialized, } from "../core/config/desktop-config.js";
+import { downloadModel, DEFAULT_LLM_MODEL_URI, } from "../core/local-llm-server/download-model.js";
+import { startLocalLlmServer, stopLocalLlmServer, } from "../core/local-llm-server/index.js";
+import { LOCAL_LLM_CACHE_DIR, isModelFileInCache, toModelPathForStart, } from "../core/local-llm-server/model-resolve.js";
 import { writeGatewayPid, removeGatewayPidFile, serviceInstall, serviceUninstall, serviceStop, } from "./service.js";
 import { installExtension, listExtensions, uninstallExtension } from "./extension-cmd.js";
 const require = createRequire(import.meta.url);
@@ -218,6 +221,110 @@ extensionCmd
     .action((pkg) => {
     uninstallExtension(pkg);
 });
+// 本地模型：下载与启动服务
+const localCmd = program
+    .command("local")
+    .description("下载本地 GGUF 模型与启动本地 LLM 服务");
+localCmd
+    .command("download")
+    .description("下载推荐模型到 ~/.openbot/.cached_models/，不指定模型时下载 Qwen3-4B")
+    .argument("[modelUri]", "模型 URI（如 hf:Qwen/Qwen3-4B-GGUF/Qwen3-4B-Q4_K_M.gguf），不传则下载 Qwen3-4B")
+    .option("--mirror", "使用国内镜像 hf-mirror.com 下载")
+    .action(async (modelUri, opts) => {
+    const uri = (modelUri || "").trim() || DEFAULT_LLM_MODEL_URI;
+    console.log(`[openbot] 下载模型: ${uri}`);
+    if (opts.mirror)
+        console.log("[openbot] 使用国内镜像 hf-mirror.com");
+    try {
+        const path = await downloadModel(uri, {
+            useMirror: opts.mirror,
+            onProgress: (p) => {
+                const percent = p.totalSize ? Math.round((p.downloadedSize / p.totalSize) * 100) : (p.percent ?? 0);
+                const mb = (p.downloadedSize / 1024 / 1024).toFixed(1);
+                const totalMb = p.totalSize ? (p.totalSize / 1024 / 1024).toFixed(1) : "?";
+                process.stderr.write(`\r[openbot] 下载中 ${percent}% (${mb} / ${totalMb} MB)`);
+            },
+        });
+        console.log(`\n[openbot] 已保存: ${path}`);
+    }
+    catch (err) {
+        const msg = err instanceof Error ? err.message : String(err);
+        console.error("\n[openbot] 下载失败:", msg);
+        process.exit(1);
+    }
+});
+localCmd
+    .command("start")
+    .description("启动本地 LLM 服务（至少指定 --llm 或 --embedding 之一）")
+    .option("--llm <uriOrFile>", "LLM 模型：hf: URI 或已下载文件名，不传则使用桌面缺省模型")
+    .option("--embedding <uriOrFile>", "Embedding 模型：hf: URI 或已下载文件名（可选）")
+    .option("--context-size <n>", "上下文长度（token 数），默认 32768 或环境变量 LOCAL_LLM_CONTEXT_MAX", (v) => parseInt(v, 10) || 32768)
+    .option("--port <port>", "服务端口", "11435")
+    .action(async (opts) => {
+    let llmPath;
+    let embPath;
+    if (opts.llm?.trim()) {
+        const llmArg = opts.llm.trim();
+        if (!llmArg.startsWith("hf:") && !isModelFileInCache(llmArg, LOCAL_LLM_CACHE_DIR)) {
+            console.error("[openbot] 模型未下载或路径不存在，请先执行: openbot local download [modelUri]");
+            process.exit(1);
+        }
+        llmPath = toModelPathForStart(llmArg, LOCAL_LLM_CACHE_DIR);
+    }
+    else {
+        const agentConfig = await loadDesktopAgentConfig("default");
+        const defaultModel = agentConfig?.model?.trim();
+        if (defaultModel) {
+            llmPath = toModelPathForStart(defaultModel, LOCAL_LLM_CACHE_DIR);
+            if (!isModelFileInCache(defaultModel, LOCAL_LLM_CACHE_DIR)) {
+                console.error("[openbot] 缺省模型未下载，请先执行: openbot local download");
+                process.exit(1);
+            }
+        }
+    }
+    if (opts.embedding?.trim()) {
+        const embArg = opts.embedding.trim();
+        if (!embArg.startsWith("hf:") && !isModelFileInCache(embArg, LOCAL_LLM_CACHE_DIR)) {
+            console.error("[openbot] Embedding 模型未下载或路径不存在，请先执行: openbot local download <embedding-uri>");
+            process.exit(1);
+        }
+        embPath = toModelPathForStart(embArg, LOCAL_LLM_CACHE_DIR);
+    }
+    if (!llmPath && !embPath) {
+        console.error("[openbot] 请至少指定 --llm 或 --embedding，或先配置桌面缺省模型");
+        process.exit(1);
+    }
+    const contextSize = opts.contextSize ??
+        (process.env.LOCAL_LLM_CONTEXT_MAX ? parseInt(process.env.LOCAL_LLM_CONTEXT_MAX, 10) : undefined) ??
+        32768;
+    const port = parseInt(opts.port || "11435", 10);
+    try {
+        const handle = await startLocalLlmServer({
+            port,
+            llmModelPath: llmPath,
+            embeddingModelPath: embPath,
+            contextSize,
+        });
+        console.log(`[openbot] 本地模型服务已启动: ${handle.baseUrl}`);
+        console.log("[openbot] 按 Ctrl+C 停止服务");
+        await new Promise((resolve) => {
+            process.on("SIGINT", () => {
+                stopLocalLlmServer();
+                resolve();
+            });
+            process.on("SIGTERM", () => {
+                stopLocalLlmServer();
+                resolve();
+            });
+        });
+        process.exit(0);
+    }
+    catch (err) {
+        const msg = err instanceof Error ? err.message : String(err);
+        console.error("[openbot] 启动失败:", msg);
+        process.exit(1);
+    }
+});
 (async () => {
     await ensureDesktopConfigInitialized();
     await program.parseAsync(process.argv);

package/dist/core/agent/agent-manager.js CHANGED Viewed

@@ -230,6 +230,10 @@ For downloads, provide either a direct URL or a selector to click.`;
         if (apiKey) {
             authStorage.setRuntimeApiKey(provider, apiKey);
         }
+        // local 无需真实 API Key，显式设置占位凭证，避免 SDK 走默认凭证链（如 AWS）导致 "Could not load credentials from any providers"
+        if (provider === "local") {
+            authStorage.setRuntimeApiKey("local", process.env.OPENAI_API_KEY || "local");
+        }
         if (await authStorage.hasAuth(provider)) {
             const key = await authStorage.getApiKey(provider);
             if (key) {

package/dist/core/config/desktop-config.d.ts CHANGED Viewed

@@ -225,7 +225,8 @@ export declare function getDesktopConfigList(): Promise<DesktopConfigList>;
  */
 export declare function ensureProviderSupportFile(): Promise<void>;
 /**
- * CLI / Gateway 运行时调用，确保 config.json、provider-support.json、agents.json 均完成初始化。
+ * CLI / Gateway 运行时调用，确保 config.json、provider-support.json、agents.json 均完成初始化，
+ * 并同步到 agent 目录 models.json，供 pi ModelRegistry 解析 local 等模型与凭证。
  */
 export declare function ensureDesktopConfigInitialized(): Promise<void>;
 /**

package/dist/core/config/desktop-config.js CHANGED Viewed

@@ -218,6 +218,8 @@ export async function loadDesktopAgentConfig(agentId) {
             model = configured.modelId;
         }
     }
+    /** 是否从当前智能体自己的配置得到了模型（有 modelItemCode 或 provider/model）；若否，则使用的是全局默认 */
+    let agentHadOwnModel = false;
     let workspaceName = resolvedAgentId;
     let mcpServers;
     let mcpMaxResultTokens;
@@ -256,19 +258,28 @@ export async function loadDesktopAgentConfig(agentId) {
                     if (configured) {
                         provider = configured.provider;
                         model = configured.modelId;
+                        agentHadOwnModel = true;
                     }
                     else {
-                        if (agent.provider)
+                        if (agent.provider) {
                             provider = agent.provider;
-                        if (agent.model)
+                            agentHadOwnModel = true;
+                        }
+                        if (agent.model) {
                             model = agent.model;
+                            agentHadOwnModel = true;
+                        }
                     }
                 }
                 else {
-                    if (agent.provider)
+                    if (agent.provider) {
                         provider = agent.provider;
-                    if (agent.model)
+                        agentHadOwnModel = true;
+                    }
+                    if (agent.model) {
                         model = agent.model;
+                        agentHadOwnModel = true;
+                    }
                 }
             }
         }
@@ -276,6 +287,11 @@ export async function loadDesktopAgentConfig(agentId) {
             // ignore
         }
     }
+    // 本地 LLM 可用且当前智能体未配置自己的模型时，使用本地推理作为缺省，使所有智能体“拥有”该配置
+    if (!agentHadOwnModel && process.env.LOCAL_LLM_BASE_URL?.trim()) {
+        provider = "local";
+        model = "local-llm";
+    }
     const provConfig = config.providers?.[provider];
     const apiKey = provConfig?.apiKey && typeof provConfig.apiKey === "string" && provConfig.apiKey.trim()
         ? provConfig.apiKey.trim()
@@ -629,32 +645,54 @@ export async function ensureProviderSupportFile() {
         await writeFile(path, JSON.stringify(presetProviders, null, 2), "utf-8");
     }
 }
-/** 若 config.json 不存在则用 preset-config.json 初始化，若存在则浅合并补充新基础键值 */
+/** 预装本地推理缺省：推荐列表第一个 LLM（Qwen3-4B）对应的本地文件名，与 modelUriToFilename 一致 */
+const DEFAULT_LOCAL_LLM_MODEL_ID = "hf_Qwen_Qwen3-4B-GGUF_Qwen3-4B-Q4_K_M.gguf";
+const DEFAULT_LOCAL_MODEL_ITEM_CODE = "local-qwen3-4b";
+/** 代码内建默认：local provider + 本地 Qwen3-4B，首次与合并时优先保证存在 */
+const BUILTIN_DEFAULT_CONFIG = {
+    defaultProvider: "local",
+    defaultModel: DEFAULT_LOCAL_LLM_MODEL_ID,
+    defaultModelItemCode: DEFAULT_LOCAL_MODEL_ITEM_CODE,
+    defaultAgentId: DEFAULT_AGENT_ID,
+    maxAgentSessions: DEFAULT_MAX_AGENT_SESSIONS,
+    providers: {
+        local: { baseUrl: "http://127.0.0.1:11435/v1" },
+    },
+    configuredModels: [
+        {
+            provider: "local",
+            modelId: DEFAULT_LOCAL_LLM_MODEL_ID,
+            type: "llm",
+            alias: "Qwen3 4B Q4_K_M",
+            modelItemCode: DEFAULT_LOCAL_MODEL_ITEM_CODE,
+        },
+        {
+            provider: "local",
+            modelId: "hf_ggml-org_embeddinggemma-300M-GGUF_embeddinggemma-300M-Q8_0.gguf",
+            type: "embedding",
+            alias: "EmbeddingGemma 300M Q8 (768维)",
+            modelItemCode: "local-embeddinggemma-300m",
+        },
+    ],
+};
+/** 若 config.json 不存在则用 preset-config.json 初始化，若存在则浅合并补充新基础键值。预装 local provider + 本地 Qwen3-4B 模型并设为缺省；preset 与代码默认合并，保证 local 一定存在。 */
 async function ensureConfigJsonInitialized() {
     const presetPath = join(getPresetsDir(), "preset-config.json");
-    let presetConfig = {
-        defaultProvider: "ollama",
-        defaultModel: "qwen3:4b",
-        defaultAgentId: DEFAULT_AGENT_ID,
-        maxAgentSessions: DEFAULT_MAX_AGENT_SESSIONS,
-        providers: {
-            ollama: { baseUrl: "http://localhost:11434/v1" },
-        },
-        configuredModels: [
-            {
-                provider: "ollama",
-                modelId: "qwen3:4b",
-                type: "llm",
-                alias: "Qwen3 4B (本地)",
-                modelItemCode: "ollama:qwen3:4b",
-            },
-        ],
-    };
+    let presetConfig = { ...BUILTIN_DEFAULT_CONFIG };
     if (existsSync(presetPath)) {
         try {
             const data = JSON.parse(await readFile(presetPath, "utf-8"));
-            if (data.config)
-                presetConfig = data.config;
+            if (data.config && typeof data.config === "object") {
+                presetConfig = { ...BUILTIN_DEFAULT_CONFIG, ...data.config };
+                presetConfig.providers = { ...BUILTIN_DEFAULT_CONFIG.providers, ...(presetConfig.providers || {}) };
+                const hasLocalModel = (presetConfig.configuredModels || []).some((m) => m?.provider === "local" && (m?.modelId === DEFAULT_LOCAL_LLM_MODEL_ID || m?.modelItemCode === DEFAULT_LOCAL_MODEL_ITEM_CODE));
+                if (!hasLocalModel) {
+                    presetConfig.configuredModels = [
+                        ...(BUILTIN_DEFAULT_CONFIG.configuredModels || []),
+                        ...(presetConfig.configuredModels || []),
+                    ];
+                }
+            }
         }
         catch { }
     }
@@ -723,18 +761,46 @@ async function ensureAgentsJsonInitialized() {
             }
         }
     }
+    // 所有未单独配置模型的智能体使用 config 的缺省模型（预装为 local + Qwen3-4B）
+    const configPath = join(getDesktopDir(), "config.json");
+    if (existsSync(configPath)) {
+        try {
+            const configRaw = await readFile(configPath, "utf-8");
+            const configData = JSON.parse(configRaw);
+            const defProvider = configData.defaultProvider?.trim();
+            const defModel = configData.defaultModel?.trim();
+            const defCode = configData.defaultModelItemCode?.trim();
+            if (defProvider && defModel) {
+                for (const agent of currentData.agents) {
+                    const hasOwn = (agent.provider && String(agent.provider).trim()) || (agent.model && String(agent.model).trim()) || (agent.modelItemCode && String(agent.modelItemCode).trim());
+                    if (!hasOwn) {
+                        agent.provider = defProvider;
+                        agent.model = defModel;
+                        if (defCode)
+                            agent.modelItemCode = defCode;
+                        changed = true;
+                    }
+                }
+            }
+        }
+        catch { /* ignore */ }
+    }
     if (changed || !existsSync(agentsPath)) {
         await writeFile(agentsPath, JSON.stringify(currentData, null, 2), "utf-8");
     }
 }
 /**
- * CLI / Gateway 运行时调用，确保 config.json、provider-support.json、agents.json 均完成初始化。
+ * CLI / Gateway 运行时调用，确保 config.json、provider-support.json、agents.json 均完成初始化，
+ * 并同步到 agent 目录 models.json，供 pi ModelRegistry 解析 local 等模型与凭证。
  */
 export async function ensureDesktopConfigInitialized() {
     ensureDesktopDir();
     await ensureProviderSupportFile();
     await ensureConfigJsonInitialized();
     await ensureAgentsJsonInitialized();
+    await syncDesktopConfigToModelsJson().catch((err) => {
+        console.warn("[ensureDesktopConfigInitialized] syncDesktopConfigToModelsJson failed:", err);
+    });
 }
 /**
  * 取某 provider 在 provider-support 中的第一个 llm 模型 id；若无则返回第一个模型 id。

package/dist/core/local-llm-server/download-model.d.ts ADDED Viewed

@@ -0,0 +1,16 @@
+export declare const DEFAULT_LLM_MODEL_URI = "hf:Qwen/Qwen3-4B-GGUF/Qwen3-4B-Q4_K_M.gguf";
+export interface DownloadModelOptions {
+    useMirror?: boolean;
+    signal?: AbortSignal;
+    onProgress?: (p: {
+        downloadedSize: number;
+        totalSize: number;
+        percent: number;
+    }) => void;
+}
+/**
+ * 下载模型到本地缓存目录。
+ * @returns 解析后的本地文件路径
+ */
+export declare function downloadModel(modelUri: string, options?: DownloadModelOptions): Promise<string>;
+export declare function getResolvedBasename(modelUri: string): string;

package/dist/core/local-llm-server/download-model.js ADDED Viewed

@@ -0,0 +1,37 @@
+/**
+ * 本地模型下载（供 CLI 与 Nest LocalModelsService 复用）。
+ * 使用 node-llama-cpp resolveModelFile，缓存目录 ~/.openbot/.cached_models/。
+ */
+import { basename } from "node:path";
+import { LOCAL_LLM_CACHE_DIR } from "./model-resolve.js";
+export const DEFAULT_LLM_MODEL_URI = "hf:Qwen/Qwen3-4B-GGUF/Qwen3-4B-Q4_K_M.gguf";
+/**
+ * 下载模型到本地缓存目录。
+ * @returns 解析后的本地文件路径
+ */
+export async function downloadModel(modelUri, options = {}) {
+    const { resolveModelFile } = await import("node-llama-cpp");
+    const { useMirror = false, signal, onProgress } = options;
+    const hfToken = process.env.HF_TOKEN || process.env.HUGGING_FACE_TOKEN;
+    const opts = {
+        directory: LOCAL_LLM_CACHE_DIR,
+        endpoints: {
+            huggingFace: useMirror ? "https://hf-mirror.com/" : "https://huggingface.co/",
+        },
+    };
+    if (signal)
+        opts.signal = signal;
+    if (hfToken)
+        opts.headers = { Authorization: `Bearer ${hfToken}` };
+    if (onProgress) {
+        opts.onProgress = ({ downloadedSize, totalSize }) => {
+            const percent = totalSize ? Math.round((downloadedSize / totalSize) * 100) : 0;
+            onProgress({ downloadedSize, totalSize, percent });
+        };
+    }
+    const resolved = await resolveModelFile(modelUri, opts);
+    return resolved;
+}
+export function getResolvedBasename(modelUri) {
+    return basename(modelUri.replace(/^hf:[^/]+\//, "").replace(/\//g, "_"));
+}

package/dist/core/local-llm-server/index.js CHANGED Viewed

@@ -12,15 +12,27 @@ import { fileURLToPath } from "node:url";
 // ─── 子进程模式 ───────────────────────────────────────────────────────────────
 async function runChildProcess() {
     const port = parseInt(process.env.LOCAL_LLM_PORT ?? "11435", 10);
-    const llmModelPath = process.env.LOCAL_LLM_MODEL ?? "hf:Qwen/Qwen3-4B-GGUF/Qwen3-4B-Q4_K_M.gguf";
-    const embModelPath = process.env.LOCAL_EMB_MODEL ?? "hf:ggml-org/embeddinggemma-300M-GGUF/embeddinggemma-300M-Q8_0.gguf";
-    const contextSize = process.env.LOCAL_LLM_CONTEXT_SIZE != null ? parseInt(process.env.LOCAL_LLM_CONTEXT_SIZE, 10) : undefined;
+    const llmModelPath = process.env.LOCAL_LLM_MODEL?.trim() || undefined;
+    const embModelPath = process.env.LOCAL_EMB_MODEL?.trim() || undefined;
+    let contextSize = process.env.LOCAL_LLM_CONTEXT_SIZE != null ? parseInt(process.env.LOCAL_LLM_CONTEXT_SIZE, 10) : undefined;
+    if (contextSize == null && process.env.LOCAL_LLM_CONTEXT_MAX != null && String(process.env.LOCAL_LLM_CONTEXT_MAX).trim() !== '') {
+        contextSize = parseInt(process.env.LOCAL_LLM_CONTEXT_MAX, 10) || undefined;
+    }
+    if (!llmModelPath && !embModelPath) {
+        console.error("[local-llm] 未指定 LLM 或 Embedding 模型路径，至少需提供一个");
+        if (process.send)
+            process.send({ type: "error", message: "至少需指定 LOCAL_LLM_MODEL 或 LOCAL_EMB_MODEL" });
+        process.exit(1);
+    }
     const { initModels } = await import("./llm-context.js");
     const { createOpenAICompatServer } = await import("./server.js");
     try {
-        await initModels({ llmModelPath, embeddingModelPath: embModelPath, contextSize: contextSize ?? 32768 });
+        await initModels({
+            ...(llmModelPath ? { llmModelPath } : {}),
+            ...(embModelPath ? { embeddingModelPath: embModelPath } : {}),
+            contextSize: contextSize ?? 32768,
+        });
         await createOpenAICompatServer(port);
-        // 通知主进程已就绪
         if (process.send) {
             process.send({ type: "ready", port });
         }
@@ -113,6 +125,15 @@ export async function startLocalLlmServer(opts = {}) {
             catch { /* ignore */ }
         },
     };
+    // 子进程意外退出（崩溃、OOM 等）时清理 handle 与 env，避免后续请求继续连已死服务导致 "Connection error"
+    const onChildExit = (code, signal) => {
+        if (serverHandle)
+            serverHandle = null;
+        process.env.LOCAL_LLM_START_FAILED = "本地模型服务已退出，请重新点击「启动本地模型服务」";
+        delete process.env.LOCAL_LLM_BASE_URL;
+        console.warn("[local-llm] 子进程已退出 code=%s signal=%s，请重新启动本地模型服务", code, signal);
+    };
+    child.on("exit", onChildExit);
     console.log(`[local-llm] 本地服务就绪: ${serverHandle.baseUrl}`);
     return serverHandle;
 }

package/dist/core/local-llm-server/llm-context.d.ts CHANGED Viewed

@@ -1,8 +1,8 @@
 export interface LlmContextOptions {
-    /** LLM 推理模型路径或 hf: URI */
-    llmModelPath: string;
-    /** Embedding 模型路径或 hf: URI */
-    embeddingModelPath: string;
+    /** LLM 推理模型路径或 hf: URI，可选；不传则仅提供 embedding */
+    llmModelPath?: string;
+    /** Embedding 模型路径或 hf: URI，可选；不传则仅提供 chat */
+    embeddingModelPath?: string;
     /** GPU layers，-1 表示全部卸载到 GPU（Metal），0 表示纯 CPU */
     gpuLayers?: number;
     /** 上下文窗口大小，默认 32768（32K） */
@@ -57,4 +57,9 @@ export declare function chatCompletion(messages: ChatMessage[], tools: ToolDefin
  * 文本 embedding，返回 L2 归一化向量。
  */
 export declare function getEmbedding(text: string): Promise<number[]>;
+/** 是否至少加载了一个模型（LLM 或 Embedding） */
 export declare function isReady(): boolean;
+/** 是否有 LLM，可提供 chat/completions */
+export declare function isLlmReady(): boolean;
+/** 是否有 Embedding，可提供 embeddings */
+export declare function isEmbeddingReady(): boolean;

package/dist/core/local-llm-server/llm-context.js CHANGED Viewed

@@ -1,10 +1,8 @@
 /**
  * node-llama-cpp 模型实例管理。
- * 同时持有一个 LLM chat 模型和一个 embedding 模型，各自独立上下文。
- * 推理和 embedding 请求串行处理（同一模型不支持并发），两个模型之间可并发。
+ * 可只加载 LLM、只加载 Embedding、或两者都加载；有一个就启动一个，不因缺另一个而失败。
  */
-import { join } from "node:path";
-import { homedir } from "node:os";
+import { LOCAL_LLM_CACHE_DIR } from "./model-resolve.js";
 let llama = null;
 let llmModel = null;
 let embeddingModel = null;
@@ -26,16 +24,30 @@ async function getLlamaInstance(gpuLayers) {
 export async function initModels(opts) {
     storedContextSize = opts.contextSize ?? 32768;
     const { resolveModelFile } = await import("node-llama-cpp");
-    const cacheDir = join(homedir(), ".cache", "llama");
     const instance = await getLlamaInstance(opts.gpuLayers);
-    console.log("[local-llm] 加载 LLM 模型:", opts.llmModelPath);
-    const llmPath = await resolveModelFile(opts.llmModelPath, cacheDir);
-    llmModel = await instance.loadModel({ modelPath: llmPath });
-    console.log("[local-llm] 加载 Embedding 模型:", opts.embeddingModelPath);
-    const embPath = await resolveModelFile(opts.embeddingModelPath, cacheDir);
-    embeddingModel = await instance.loadModel({ modelPath: embPath });
-    embeddingCtx = await embeddingModel.createEmbeddingContext();
-    console.log("[local-llm] 模型加载完成");
+    const cacheDir = LOCAL_LLM_CACHE_DIR;
+    if (opts.llmModelPath?.trim()) {
+        console.log("[local-llm] 加载 LLM 模型:", opts.llmModelPath);
+        const llmPath = await resolveModelFile(opts.llmModelPath, cacheDir);
+        llmModel = await instance.loadModel({ modelPath: llmPath });
+    }
+    else {
+        llmModel = null;
+    }
+    if (opts.embeddingModelPath?.trim()) {
+        console.log("[local-llm] 加载 Embedding 模型:", opts.embeddingModelPath);
+        const embPath = await resolveModelFile(opts.embeddingModelPath, cacheDir);
+        embeddingModel = await instance.loadModel({ modelPath: embPath });
+        embeddingCtx = await embeddingModel.createEmbeddingContext();
+    }
+    else {
+        embeddingModel = null;
+        embeddingCtx = null;
+    }
+    console.log("[local-llm] 模型加载完成", {
+        llm: !!llmModel,
+        embedding: !!embeddingCtx,
+    });
 }
 /** 将 API 可能传来的 content（string | array 如 [{ type: "text", text: "..." }]）规范为 string，避免 node-llama-cpp LlamaText.fromJSON 收到对象抛 "Unknown value type: [object Object]" */
 function contentToString(content) {
@@ -216,6 +228,15 @@ export async function getEmbedding(text) {
     const norm = Math.sqrt(vec.reduce((s, v) => s + v * v, 0)) || 1;
     return vec.map((v) => v / norm);
 }
+/** 是否至少加载了一个模型（LLM 或 Embedding） */
 export function isReady() {
-    return llmModel !== null && embeddingCtx !== null;
+    return llmModel !== null || embeddingCtx !== null;
+}
+/** 是否有 LLM，可提供 chat/completions */
+export function isLlmReady() {
+    return llmModel !== null;
+}
+/** 是否有 Embedding，可提供 embeddings */
+export function isEmbeddingReady() {
+    return embeddingCtx !== null;
 }

package/dist/core/local-llm-server/model-resolve.d.ts CHANGED Viewed

@@ -2,6 +2,7 @@ export declare const LOCAL_LLM_CACHE_DIR: string;
 /**
  * 取 modelUri 的末尾文件名（用于与已安装文件灵活匹配：不同 node-llama-cpp 版本可能生成不同前缀）。
  * 例：hf:Qwen/Qwen3-4B-GGUF/Qwen3-4B-Q4_K_M.gguf → Qwen3-4B-Q4_K_M.gguf
+ * 例：hf_Qwen_Qwen3-4B-GGUF_Qwen3-4B-Q4_K_M.gguf → Qwen3-4B-Q4_K_M.gguf（文件名形式取最后一段 _ 之后）
  */
 export declare function modelUriBasename(modelUri: string): string;
 /**
@@ -9,12 +10,18 @@ export declare function modelUriBasename(modelUri: string): string;
  * 与 LocalModelsService.predictFilename 逻辑一致。
  */
 export declare function modelUriToFilename(modelUri: string): string;
+/**
+ * 在缓存目录中解析出实际存在的模型文件路径。
+ * 先尝试精确文件名，若无则按「以 modelUri 的末尾文件名结尾」匹配（与「已安装的本地模型」逻辑一致）。
+ */
+export declare function resolveModelPathInCache(modelIdOrUri: string, cacheDir?: string): string;
 /**
  * 检查指定模型（uri 或文件名）是否已存在于本地缓存目录。
+ * 支持精确文件名 或 以末尾 .gguf 文件名结尾的灵活匹配，与「已安装的本地模型」展示一致。
  */
 export declare function isModelFileInCache(modelIdOrUri: string, cacheDir?: string): boolean;
 /**
  * 将前端传入的模型标识（hf: URI 或已安装文件名）转为可传给 node-llama-cpp 的路径或 URI。
- * 若为纯文件名（如 hf_xxx.gguf），则返回缓存目录下的绝对路径。
+ * 若为纯文件名（如 hf_xxx.gguf），则返回缓存目录下的绝对路径；若实际磁盘文件名与配置不一致（如 node-llama-cpp 命名），则解析为真实路径。
  */
 export declare function toModelPathForStart(uriOrFilename: string, cacheDir?: string): string;

package/dist/core/local-llm-server/model-resolve.js CHANGED Viewed

@@ -1,20 +1,30 @@
 /**
- * 本地模型路径解析与文件存在性检查（与 ~/.cache/llama 及 node-llama-cpp 命名一致）。
+ * 本地模型路径解析与文件存在性检查。
+ * 缓存目录：~/.openbot/.cached_models/，与 openbot 配置同目录便于管理。
+ * 与「已安装的本地模型」展示一致：支持精确文件名 或 以末尾 .gguf 文件名结尾的灵活匹配（兼容 node-llama-cpp 不同命名）。
  */
 import { join } from "node:path";
-import { existsSync } from "node:fs";
+import { existsSync, readdirSync } from "node:fs";
 import { homedir } from "node:os";
-export const LOCAL_LLM_CACHE_DIR = join(homedir(), ".cache", "llama");
+export const LOCAL_LLM_CACHE_DIR = join(homedir(), ".openbot", ".cached_models");
 /**
  * 取 modelUri 的末尾文件名（用于与已安装文件灵活匹配：不同 node-llama-cpp 版本可能生成不同前缀）。
  * 例：hf:Qwen/Qwen3-4B-GGUF/Qwen3-4B-Q4_K_M.gguf → Qwen3-4B-Q4_K_M.gguf
+ * 例：hf_Qwen_Qwen3-4B-GGUF_Qwen3-4B-Q4_K_M.gguf → Qwen3-4B-Q4_K_M.gguf（文件名形式取最后一段 _ 之后）
  */
 export function modelUriBasename(modelUri) {
     const s = (modelUri || "").trim();
     if (!s)
         return "";
     const parts = s.replace(/\\/g, "/").split("/");
-    return parts[parts.length - 1] || s;
+    const last = parts[parts.length - 1] || s;
+    // 仅对无 "/" 的文件名形式（如 hf_X_Y_Z.gguf）取最后 _ 之后一段，以匹配 node-llama-cpp 可能生成的短文件名
+    if (!s.includes("/") && last.includes("_") && last.endsWith(".gguf")) {
+        const fromUnderscore = last.slice(last.lastIndexOf("_") + 1);
+        if (fromUnderscore.endsWith(".gguf"))
+            return fromUnderscore;
+    }
+    return last;
 }
 /**
  * 将 modelUri（hf:owner/repo/file.gguf）或文件名转为缓存目录下的文件名。
@@ -33,17 +43,38 @@ export function modelUriToFilename(modelUri) {
     return last ?? s;
 }
 /**
- * 检查指定模型（uri 或文件名）是否已存在于本地缓存目录。
+ * 在缓存目录中解析出实际存在的模型文件路径。
+ * 先尝试精确文件名，若无则按「以 modelUri 的末尾文件名结尾」匹配（与「已安装的本地模型」逻辑一致）。
  */
-export function isModelFileInCache(modelIdOrUri, cacheDir = LOCAL_LLM_CACHE_DIR) {
+export function resolveModelPathInCache(modelIdOrUri, cacheDir = LOCAL_LLM_CACHE_DIR) {
     const filename = modelUriToFilename(modelIdOrUri);
     if (!filename || !filename.endsWith(".gguf"))
-        return false;
-    return existsSync(join(cacheDir, filename));
+        return "";
+    const exactPath = join(cacheDir, filename);
+    if (existsSync(exactPath))
+        return exactPath;
+    const suffix = modelUriBasename(modelIdOrUri);
+    if (!suffix)
+        return "";
+    try {
+        const files = readdirSync(cacheDir);
+        const found = files.find((f) => f.endsWith(".gguf") && (f === suffix || f.endsWith(suffix)));
+        return found ? join(cacheDir, found) : "";
+    }
+    catch {
+        return "";
+    }
+}
+/**
+ * 检查指定模型（uri 或文件名）是否已存在于本地缓存目录。
+ * 支持精确文件名 或 以末尾 .gguf 文件名结尾的灵活匹配，与「已安装的本地模型」展示一致。
+ */
+export function isModelFileInCache(modelIdOrUri, cacheDir = LOCAL_LLM_CACHE_DIR) {
+    return resolveModelPathInCache(modelIdOrUri, cacheDir) !== "";
 }
 /**
  * 将前端传入的模型标识（hf: URI 或已安装文件名）转为可传给 node-llama-cpp 的路径或 URI。
- * 若为纯文件名（如 hf_xxx.gguf），则返回缓存目录下的绝对路径。
+ * 若为纯文件名（如 hf_xxx.gguf），则返回缓存目录下的绝对路径；若实际磁盘文件名与配置不一致（如 node-llama-cpp 命名），则解析为真实路径。
  */
 export function toModelPathForStart(uriOrFilename, cacheDir = LOCAL_LLM_CACHE_DIR) {
     const s = (uriOrFilename || "").trim();
@@ -51,8 +82,9 @@ export function toModelPathForStart(uriOrFilename, cacheDir = LOCAL_LLM_CACHE_DI
         return "";
     if (s.startsWith("hf:"))
         return s;
+    const resolved = resolveModelPathInCache(s, cacheDir);
+    if (resolved)
+        return resolved;
     const filename = modelUriToFilename(s);
-    if (!filename)
-        return s;
-    return join(cacheDir, filename);
+    return filename ? join(cacheDir, filename) : s;
 }