npm - web-agent-bridge - Versions diffs - 3.2.0 → 3.3.0 - Mend

web-agent-bridge 3.2.0 → 3.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (202) hide show

package/LICENSE +72 -72
package/README.ar.md +1286 -1152
package/README.md +1764 -1635
package/bin/agent-runner.js +474 -474
package/bin/cli.js +237 -138
package/bin/wab.js +80 -80
package/examples/bidi-agent.js +119 -119
package/examples/cross-site-agent.js +91 -91
package/examples/mcp-agent.js +94 -94
package/examples/next-app-router/README.md +44 -44
package/examples/puppeteer-agent.js +108 -108
package/examples/saas-dashboard/README.md +55 -55
package/examples/shopify-hydrogen/README.md +74 -74
package/examples/vision-agent.js +171 -171
package/examples/wordpress-elementor/README.md +77 -77
package/package.json +16 -3
package/public/.well-known/agent-tools.json +180 -180
package/public/.well-known/ai-assets.json +59 -59
package/public/.well-known/security.txt +8 -0
package/public/agent-workspace.html +349 -349
package/public/ai.html +198 -198
package/public/api.html +413 -412
package/public/browser.html +486 -486
package/public/commander-dashboard.html +243 -243
package/public/cookies.html +210 -210
package/public/css/agent-workspace.css +1713 -1713
package/public/css/premium.css +317 -317
package/public/css/styles.css +1235 -1235
package/public/dashboard.html +706 -706
package/public/dns.html +507 -0
package/public/docs.html +587 -587
package/public/feed.xml +89 -89
package/public/growth.html +463 -463
package/public/index.html +1070 -982
package/public/integrations.html +556 -0
package/public/js/agent-workspace.js +1740 -1740
package/public/js/auth-nav.js +31 -31
package/public/js/auth-redirect.js +12 -12
package/public/js/cookie-consent.js +56 -56
package/public/js/wab-demo-page.js +721 -721
package/public/js/ws-client.js +74 -74
package/public/llms-full.txt +360 -360
package/public/llms.txt +125 -125
package/public/login.html +85 -85
package/public/mesh-dashboard.html +328 -328
package/public/openapi.json +580 -580
package/public/phone-shield.html +281 -0
package/public/premium-dashboard.html +2489 -2489
package/public/premium.html +793 -793
package/public/privacy.html +297 -297
package/public/register.html +105 -105
package/public/robots.txt +87 -87
package/public/script/wab-consent.d.ts +36 -36
package/public/script/wab-consent.js +104 -104
package/public/script/wab-schema.js +131 -131
package/public/script/wab.d.ts +108 -108
package/public/script/wab.min.js +580 -580
package/public/security.txt +8 -0
package/public/terms.html +256 -256
package/script/ai-agent-bridge.js +1754 -1754
package/sdk/README.md +99 -99
package/sdk/agent-mesh.js +449 -449
package/sdk/commander.js +262 -262
package/sdk/index.d.ts +464 -464
package/sdk/index.js +12 -1
package/sdk/multi-agent.js +318 -318
package/sdk/package.json +1 -1
package/sdk/safety-shield.js +219 -0
package/sdk/schema-discovery.js +83 -83
package/server/adapters/index.js +520 -520
package/server/config/plans.js +367 -367
package/server/config/secrets.js +102 -102
package/server/control-plane/index.js +301 -301
package/server/data-plane/index.js +354 -354
package/server/index.js +531 -427
package/server/llm/index.js +404 -404
package/server/middleware/adminAuth.js +35 -35
package/server/middleware/auth.js +50 -50
package/server/middleware/featureGate.js +88 -88
package/server/middleware/rateLimits.js +100 -100
package/server/middleware/sensitiveAction.js +157 -0
package/server/migrations/001_add_analytics_indexes.sql +7 -7
package/server/migrations/002_premium_features.sql +418 -418
package/server/migrations/003_ads_integer_cents.sql +33 -33
package/server/migrations/004_agent_os.sql +158 -158
package/server/migrations/005_marketplace_metering.sql +126 -126
package/server/models/adapters/index.js +33 -33
package/server/models/adapters/mysql.js +183 -183
package/server/models/adapters/postgresql.js +172 -172
package/server/models/adapters/sqlite.js +7 -7
package/server/models/db.js +681 -681
package/server/observability/failure-analysis.js +337 -337
package/server/observability/index.js +394 -394
package/server/protocol/capabilities.js +223 -223
package/server/protocol/index.js +243 -243
package/server/protocol/schema.js +584 -584
package/server/registry/certification.js +271 -271
package/server/registry/index.js +326 -326
package/server/routes/admin-premium.js +671 -671
package/server/routes/admin.js +261 -261
package/server/routes/ads.js +130 -130
package/server/routes/agent-workspace.js +540 -540
package/server/routes/api.js +150 -150
package/server/routes/auth.js +71 -71
package/server/routes/billing.js +45 -45
package/server/routes/commander.js +316 -316
package/server/routes/demo-showcase.js +332 -332
package/server/routes/demo-store.js +154 -0
package/server/routes/discovery.js +417 -417
package/server/routes/gateway.js +173 -157
package/server/routes/license.js +251 -240
package/server/routes/mesh.js +469 -469
package/server/routes/noscript.js +543 -543
package/server/routes/premium-v2.js +686 -686
package/server/routes/premium.js +724 -724
package/server/routes/runtime.js +2148 -2147
package/server/routes/sovereign.js +465 -385
package/server/routes/universal.js +200 -185
package/server/routes/wab-api.js +850 -501
package/server/runtime/container-worker.js +111 -111
package/server/runtime/container.js +448 -448
package/server/runtime/distributed-worker.js +362 -362
package/server/runtime/event-bus.js +210 -210
package/server/runtime/index.js +253 -253
package/server/runtime/queue.js +599 -599
package/server/runtime/replay.js +666 -666
package/server/runtime/sandbox.js +266 -266
package/server/runtime/scheduler.js +534 -534
package/server/runtime/session-engine.js +293 -293
package/server/runtime/state-manager.js +188 -188
package/server/security/cross-site-redactor.js +196 -0
package/server/security/dry-run.js +180 -0
package/server/security/human-gate-rate-limit.js +147 -0
package/server/security/human-gate-transports.js +178 -0
package/server/security/human-gate.js +281 -0
package/server/security/index.js +368 -368
package/server/security/intent-engine.js +245 -0
package/server/security/reward-guard.js +171 -0
package/server/security/rollback-store.js +239 -0
package/server/security/token-scope.js +404 -0
package/server/security/url-policy.js +139 -0
package/server/services/agent-chat.js +506 -506
package/server/services/agent-learning.js +601 -575
package/server/services/agent-memory.js +625 -625
package/server/services/agent-mesh.js +555 -539
package/server/services/agent-symphony.js +717 -717
package/server/services/agent-tasks.js +1807 -1807
package/server/services/api-key-engine.js +292 -261
package/server/services/cluster.js +894 -894
package/server/services/commander.js +738 -738
package/server/services/edge-compute.js +440 -440
package/server/services/email.js +204 -204
package/server/services/hosted-runtime.js +205 -205
package/server/services/lfd.js +635 -635
package/server/services/local-ai.js +389 -389
package/server/services/marketplace.js +270 -270
package/server/services/metering.js +182 -182
package/server/services/modules/affiliate-intelligence.js +93 -93
package/server/services/modules/agent-firewall.js +90 -90
package/server/services/modules/bounty.js +89 -89
package/server/services/modules/collective-bargaining.js +92 -92
package/server/services/modules/dark-pattern.js +66 -66
package/server/services/modules/gov-intelligence.js +45 -45
package/server/services/modules/neural.js +55 -55
package/server/services/modules/notary.js +49 -49
package/server/services/modules/price-time-machine.js +86 -86
package/server/services/modules/protocol.js +104 -104
package/server/services/negotiation.js +439 -439
package/server/services/plugins.js +771 -771
package/server/services/price-intelligence.js +566 -566
package/server/services/price-shield.js +1137 -1137
package/server/services/reputation.js +465 -465
package/server/services/search-engine.js +357 -357
package/server/services/security.js +513 -513
package/server/services/self-healing.js +843 -843
package/server/services/sovereign-shield.js +542 -0
package/server/services/stripe.js +192 -192
package/server/services/swarm.js +788 -788
package/server/services/universal-scraper.js +662 -661
package/server/services/verification.js +481 -481
package/server/services/vision.js +1163 -1163
package/server/utils/cache.js +125 -125
package/server/utils/migrate.js +81 -81
package/server/utils/safe-fetch.js +228 -0
package/server/utils/secureFields.js +50 -50
package/server/ws.js +161 -161
package/templates/artisan-marketplace.yaml +104 -104
package/templates/book-price-scout.yaml +98 -98
package/templates/electronics-price-tracker.yaml +108 -108
package/templates/flight-deal-hunter.yaml +113 -113
package/templates/freelancer-direct.yaml +116 -116
package/templates/grocery-price-compare.yaml +93 -93
package/templates/hotel-direct-booking.yaml +113 -113
package/templates/local-services.yaml +98 -98
package/templates/olive-oil-tunisia.yaml +88 -88
package/templates/organic-farm-fresh.yaml +101 -101
package/templates/restaurant-direct.yaml +97 -97
package/public/score.html +0 -263
package/server/migrations/006_growth_suite.sql +0 -138
package/server/routes/growth.js +0 -962
package/server/services/fairness-engine.js +0 -409
package/server/services/fairness.js +0 -420

package/server/services/local-ai.js CHANGED Viewed

@@ -1,389 +1,389 @@
-/**
- * Local AI — Sovereign Intelligence Runtime
- *
- * Manages local AI models running on the user's own hardware.
- * Auto-detects Ollama, llama.cpp, and any OpenAI-compatible local endpoint.
- * Routes inference requests to the best available model based on capability,
- * context window, and current load.
- *
- * Supported Providers:
- *   - Ollama (http://localhost:11434)
- *   - llama.cpp server (http://localhost:8080)
- *   - Custom OpenAI-compatible endpoints
- *
- * All inference happens locally. No data leaves the device.
- */
-const crypto = require('crypto');
-const { db } = require('../models/db');
-// ─── Schema ──────────────────────────────────────────────────────────
-db.exec(`
-  CREATE TABLE IF NOT EXISTS local_models (
-    id TEXT PRIMARY KEY,
-    site_id TEXT NOT NULL,
-    provider TEXT NOT NULL,
-    model_name TEXT NOT NULL,
-    endpoint TEXT NOT NULL,
-    capabilities TEXT DEFAULT '["text"]',
-    context_window INTEGER DEFAULT 4096,
-    parameters TEXT DEFAULT '{}',
-    status TEXT DEFAULT 'available',
-    total_requests INTEGER DEFAULT 0,
-    total_tokens INTEGER DEFAULT 0,
-    avg_latency_ms REAL DEFAULT 0,
-    last_used TEXT,
-    last_probe TEXT,
-    created_at TEXT DEFAULT (datetime('now')),
-    UNIQUE(site_id, provider, model_name)
-  );
-  CREATE TABLE IF NOT EXISTS local_inference_log (
-    id TEXT PRIMARY KEY,
-    model_id TEXT NOT NULL,
-    task_type TEXT,
-    prompt_tokens INTEGER DEFAULT 0,
-    completion_tokens INTEGER DEFAULT 0,
-    latency_ms INTEGER DEFAULT 0,
-    success INTEGER DEFAULT 1,
-    created_at TEXT DEFAULT (datetime('now'))
-  );
-  CREATE INDEX IF NOT EXISTS idx_local_models_site ON local_models(site_id);
-  CREATE INDEX IF NOT EXISTS idx_local_models_status ON local_models(status);
-  CREATE INDEX IF NOT EXISTS idx_local_inference_model ON local_inference_log(model_id);
-`);
-// ─── Prepared Statements ─────────────────────────────────────────────
-const stmts = {
-  upsertModel: db.prepare("INSERT INTO local_models (id, site_id, provider, model_name, endpoint, capabilities, context_window, parameters) VALUES (?, ?, ?, ?, ?, ?, ?, ?) ON CONFLICT(site_id, provider, model_name) DO UPDATE SET endpoint = ?, capabilities = ?, context_window = ?, parameters = ?, status = 'available', last_probe = datetime('now')"),
-  getModel: db.prepare('SELECT * FROM local_models WHERE id = ?'),
-  getModels: db.prepare('SELECT * FROM local_models WHERE site_id = ? ORDER BY provider, model_name'),
-  getAvailableModels: db.prepare("SELECT * FROM local_models WHERE site_id = ? AND status = 'available' ORDER BY avg_latency_ms ASC"),
-  getModelsByCapability: db.prepare("SELECT * FROM local_models WHERE site_id = ? AND status = 'available' AND capabilities LIKE ? ORDER BY avg_latency_ms ASC"),
-  updateModelStatus: db.prepare('UPDATE local_models SET status = ?, last_probe = datetime(\'now\') WHERE id = ?'),
-  updateModelStats: db.prepare("UPDATE local_models SET total_requests = total_requests + 1, total_tokens = total_tokens + ?, avg_latency_ms = (avg_latency_ms * total_requests + ?) / (total_requests + 1), last_used = datetime('now') WHERE id = ?"),
-  insertLog: db.prepare('INSERT INTO local_inference_log (id, model_id, task_type, prompt_tokens, completion_tokens, latency_ms, success) VALUES (?, ?, ?, ?, ?, ?, ?)'),
-  getStats: db.prepare(`SELECT
-    (SELECT COUNT(*) FROM local_models WHERE site_id = ? AND status = 'available') as available_models,
-    (SELECT COUNT(*) FROM local_models WHERE site_id = ?) as total_models,
-    (SELECT SUM(total_requests) FROM local_models WHERE site_id = ?) as total_requests,
-    (SELECT SUM(total_tokens) FROM local_models WHERE site_id = ?) as total_tokens,
-    (SELECT AVG(avg_latency_ms) FROM local_models WHERE site_id = ? AND status = 'available') as avg_latency`),
-};
-// ─── Default Provider Endpoints ──────────────────────────────────────
-const PROVIDERS = {
-  ollama: { name: 'ollama', baseUrl: 'http://localhost:11434', tagsPath: '/api/tags', chatPath: '/api/chat', generatePath: '/api/generate' },
-  llamacpp: { name: 'llamacpp', baseUrl: 'http://localhost:8080', chatPath: '/v1/chat/completions', modelsPath: '/v1/models' },
-};
-// ─── Model Discovery ─────────────────────────────────────────────────
-/**
- * Probe local endpoints and register discovered models.
- */
-async function discoverModels(siteId, customEndpoints = []) {
-  const discovered = [];
-  // Probe Ollama
-  try {
-    const ollamaModels = await _probeOllama(PROVIDERS.ollama.baseUrl);
-    for (const m of ollamaModels) {
-      const result = _registerModel(siteId, 'ollama', m.name, PROVIDERS.ollama.baseUrl, m.capabilities, m.contextWindow, m.parameters);
-      discovered.push(result);
-    }
-  } catch (_) { /* Ollama not running */ }
-  // Probe llama.cpp
-  try {
-    const lcModels = await _probeLlamaCpp(PROVIDERS.llamacpp.baseUrl);
-    for (const m of lcModels) {
-      const result = _registerModel(siteId, 'llamacpp', m.name, PROVIDERS.llamacpp.baseUrl, m.capabilities, m.contextWindow, m.parameters);
-      discovered.push(result);
-    }
-  } catch (_) { /* llama.cpp not running */ }
-  // Probe custom endpoints
-  for (const ep of customEndpoints) {
-    try {
-      const models = await _probeOpenAICompatible(ep.url);
-      for (const m of models) {
-        const result = _registerModel(siteId, ep.name || 'custom', m.name, ep.url, m.capabilities, m.contextWindow, m.parameters);
-        discovered.push(result);
-      }
-    } catch (_) { /* endpoint not available */ }
-  }
-  return { discovered: discovered.length, models: discovered };
-}
-/**
- * Register a model manually.
- */
-function registerModel(siteId, provider, modelName, endpoint, capabilities = ['text'], contextWindow = 4096) {
-  return _registerModel(siteId, provider, modelName, endpoint, capabilities, contextWindow, {});
-}
-function _registerModel(siteId, provider, modelName, endpoint, capabilities, contextWindow, parameters) {
-  const id = crypto.randomUUID();
-  const caps = JSON.stringify(capabilities);
-  const params = JSON.stringify(parameters);
-  stmts.upsertModel.run(id, siteId, provider, modelName, endpoint, caps, contextWindow, params, endpoint, caps, contextWindow, params);
-  return { id, provider, modelName, endpoint, capabilities, contextWindow };
-}
-// ─── Inference ───────────────────────────────────────────────────────
-/**
- * Run inference on the best available local model.
- * @param {string} siteId
- * @param {string} prompt - The user prompt
- * @param {object} options - { capability, model, systemPrompt, temperature, maxTokens, stream }
- */
-async function infer(siteId, prompt, options = {}) {
-  const capability = options.capability || 'text';
-  // Select model
-  let model;
-  if (options.modelId) {
-    model = stmts.getModel.get(options.modelId);
-    if (!model || model.status !== 'available') throw new Error('Selected model unavailable');
-  } else {
-    const candidates = stmts.getModelsByCapability.all(siteId, `%${capability}%`);
-    if (candidates.length === 0) throw new Error(`No local model available for capability: ${capability}`);
-    model = candidates[0]; // Fastest by avg latency
-  }
-  const start = Date.now();
-  let result;
-  try {
-    const parsed = JSON.parse(model.parameters || '{}');
-    if (model.provider === 'ollama') {
-      result = await _inferOllama(model, prompt, options);
-    } else if (model.provider === 'llamacpp') {
-      result = await _inferLlamaCpp(model, prompt, options);
-    } else {
-      result = await _inferOpenAICompatible(model, prompt, options);
-    }
-  } catch (err) {
-    const latency = Date.now() - start;
-    stmts.insertLog.run(crypto.randomUUID(), model.id, capability, 0, 0, latency, 0);
-    throw err;
-  }
-  const latency = Date.now() - start;
-  const totalTokens = (result.promptTokens || 0) + (result.completionTokens || 0);
-  stmts.updateModelStats.run(totalTokens, latency, model.id);
-  stmts.insertLog.run(crypto.randomUUID(), model.id, capability, result.promptTokens || 0, result.completionTokens || 0, latency, 1);
-  return {
-    modelId: model.id,
-    provider: model.provider,
-    model: model.model_name,
-    response: result.text,
-    promptTokens: result.promptTokens || 0,
-    completionTokens: result.completionTokens || 0,
-    latencyMs: latency,
-  };
-}
-// ─── Model Management ────────────────────────────────────────────────
-function getModels(siteId) {
-  return stmts.getModels.all(siteId).map(_deserializeModel);
-}
-function getAvailableModels(siteId) {
-  return stmts.getAvailableModels.all(siteId).map(_deserializeModel);
-}
-function getModel(modelId) {
-  const row = stmts.getModel.get(modelId);
-  return row ? _deserializeModel(row) : null;
-}
-function updateModelStatus(modelId, status) {
-  stmts.updateModelStatus.run(status, modelId);
-}
-function getStats(siteId) {
-  const row = stmts.getStats.get(siteId, siteId, siteId, siteId, siteId);
-  return {
-    availableModels: row.available_models || 0,
-    totalModels: row.total_models || 0,
-    totalRequests: row.total_requests || 0,
-    totalTokens: row.total_tokens || 0,
-    avgLatency: row.avg_latency ? Math.round(row.avg_latency) : 0,
-  };
-}
-// ─── Provider-Specific Inference ─────────────────────────────────────
-async function _inferOllama(model, prompt, options) {
-  const body = {
-    model: model.model_name,
-    messages: [],
-    stream: false,
-    options: {},
-  };
-  if (options.systemPrompt) body.messages.push({ role: 'system', content: options.systemPrompt });
-  body.messages.push({ role: 'user', content: prompt });
-  if (options.temperature != null) body.options.temperature = options.temperature;
-  const res = await fetch(`${model.endpoint}/api/chat`, {
-    method: 'POST',
-    headers: { 'Content-Type': 'application/json' },
-    body: JSON.stringify(body),
-    signal: AbortSignal.timeout(options.timeout || 120000),
-  });
-  if (!res.ok) throw new Error(`Ollama error: ${res.status}`);
-  const data = await res.json();
-  return {
-    text: data.message?.content || '',
-    promptTokens: data.prompt_eval_count || 0,
-    completionTokens: data.eval_count || 0,
-  };
-}
-async function _inferLlamaCpp(model, prompt, options) {
-  const body = {
-    model: model.model_name,
-    messages: [],
-    max_tokens: options.maxTokens || 2048,
-    stream: false,
-  };
-  if (options.systemPrompt) body.messages.push({ role: 'system', content: options.systemPrompt });
-  body.messages.push({ role: 'user', content: prompt });
-  if (options.temperature != null) body.temperature = options.temperature;
-  const res = await fetch(`${model.endpoint}/v1/chat/completions`, {
-    method: 'POST',
-    headers: { 'Content-Type': 'application/json' },
-    body: JSON.stringify(body),
-    signal: AbortSignal.timeout(options.timeout || 120000),
-  });
-  if (!res.ok) throw new Error(`llama.cpp error: ${res.status}`);
-  const data = await res.json();
-  return {
-    text: data.choices?.[0]?.message?.content || '',
-    promptTokens: data.usage?.prompt_tokens || 0,
-    completionTokens: data.usage?.completion_tokens || 0,
-  };
-}
-async function _inferOpenAICompatible(model, prompt, options) {
-  const body = {
-    model: model.model_name,
-    messages: [],
-    max_tokens: options.maxTokens || 2048,
-    stream: false,
-  };
-  if (options.systemPrompt) body.messages.push({ role: 'system', content: options.systemPrompt });
-  body.messages.push({ role: 'user', content: prompt });
-  if (options.temperature != null) body.temperature = options.temperature;
-  const res = await fetch(`${model.endpoint}/v1/chat/completions`, {
-    method: 'POST',
-    headers: { 'Content-Type': 'application/json' },
-    body: JSON.stringify(body),
-    signal: AbortSignal.timeout(options.timeout || 120000),
-  });
-  if (!res.ok) throw new Error(`Inference error: ${res.status}`);
-  const data = await res.json();
-  return {
-    text: data.choices?.[0]?.message?.content || '',
-    promptTokens: data.usage?.prompt_tokens || 0,
-    completionTokens: data.usage?.completion_tokens || 0,
-  };
-}
-// ─── Provider Probing ────────────────────────────────────────────────
-async function _probeOllama(baseUrl) {
-  const res = await fetch(`${baseUrl}/api/tags`, { signal: AbortSignal.timeout(5000) });
-  if (!res.ok) return [];
-  const data = await res.json();
-  return (data.models || []).map(m => ({
-    name: m.name,
-    capabilities: _detectCapabilities(m.name),
-    contextWindow: m.details?.parameter_size ? _estimateContext(m.details.parameter_size) : 4096,
-    parameters: { size: m.size, family: m.details?.family },
-  }));
-}
-async function _probeLlamaCpp(baseUrl) {
-  const res = await fetch(`${baseUrl}/v1/models`, { signal: AbortSignal.timeout(5000) });
-  if (!res.ok) return [];
-  const data = await res.json();
-  return (data.data || []).map(m => ({
-    name: m.id,
-    capabilities: _detectCapabilities(m.id),
-    contextWindow: 4096,
-    parameters: {},
-  }));
-}
-async function _probeOpenAICompatible(baseUrl) {
-  const res = await fetch(`${baseUrl}/v1/models`, { signal: AbortSignal.timeout(5000) });
-  if (!res.ok) return [];
-  const data = await res.json();
-  return (data.data || []).map(m => ({
-    name: m.id,
-    capabilities: _detectCapabilities(m.id),
-    contextWindow: 4096,
-    parameters: {},
-  }));
-}
-// ─── Helpers ─────────────────────────────────────────────────────────
-function _detectCapabilities(modelName) {
-  const n = modelName.toLowerCase();
-  const caps = ['text'];
-  if (n.includes('vision') || n.includes('llava') || n.includes('bakllava')) caps.push('vision');
-  if (n.includes('code') || n.includes('codellama') || n.includes('deepseek-coder') || n.includes('starcoder')) caps.push('code');
-  if (n.includes('embed') || n.includes('nomic')) caps.push('embedding');
-  if (n.includes('mistral') || n.includes('mixtral')) caps.push('reasoning');
-  return caps;
-}
-function _estimateContext(paramSize) {
-  // Rough estimate: smaller models typically have smaller context
-  if (typeof paramSize === 'string') {
-    const num = parseFloat(paramSize);
-    if (num >= 70) return 32768;
-    if (num >= 13) return 8192;
-    return 4096;
-  }
-  return 4096;
-}
-function _deserializeModel(row) {
-  return {
-    ...row,
-    capabilities: JSON.parse(row.capabilities || '["text"]'),
-    parameters: JSON.parse(row.parameters || '{}'),
-  };
-}
-module.exports = {
-  discoverModels, registerModel, infer,
-  getModels, getAvailableModels, getModel, updateModelStatus,
-  getStats,
-};
+/**
+ * Local AI — Sovereign Intelligence Runtime
+ *
+ * Manages local AI models running on the user's own hardware.
+ * Auto-detects Ollama, llama.cpp, and any OpenAI-compatible local endpoint.
+ * Routes inference requests to the best available model based on capability,
+ * context window, and current load.
+ *
+ * Supported Providers:
+ *   - Ollama (http://localhost:11434)
+ *   - llama.cpp server (http://localhost:8080)
+ *   - Custom OpenAI-compatible endpoints
+ *
+ * All inference happens locally. No data leaves the device.
+ */
+const crypto = require('crypto');
+const { db } = require('../models/db');
+// ─── Schema ──────────────────────────────────────────────────────────
+db.exec(`
+  CREATE TABLE IF NOT EXISTS local_models (
+    id TEXT PRIMARY KEY,
+    site_id TEXT NOT NULL,
+    provider TEXT NOT NULL,
+    model_name TEXT NOT NULL,
+    endpoint TEXT NOT NULL,
+    capabilities TEXT DEFAULT '["text"]',
+    context_window INTEGER DEFAULT 4096,
+    parameters TEXT DEFAULT '{}',
+    status TEXT DEFAULT 'available',
+    total_requests INTEGER DEFAULT 0,
+    total_tokens INTEGER DEFAULT 0,
+    avg_latency_ms REAL DEFAULT 0,
+    last_used TEXT,
+    last_probe TEXT,
+    created_at TEXT DEFAULT (datetime('now')),
+    UNIQUE(site_id, provider, model_name)
+  );
+  CREATE TABLE IF NOT EXISTS local_inference_log (
+    id TEXT PRIMARY KEY,
+    model_id TEXT NOT NULL,
+    task_type TEXT,
+    prompt_tokens INTEGER DEFAULT 0,
+    completion_tokens INTEGER DEFAULT 0,
+    latency_ms INTEGER DEFAULT 0,
+    success INTEGER DEFAULT 1,
+    created_at TEXT DEFAULT (datetime('now'))
+  );
+  CREATE INDEX IF NOT EXISTS idx_local_models_site ON local_models(site_id);
+  CREATE INDEX IF NOT EXISTS idx_local_models_status ON local_models(status);
+  CREATE INDEX IF NOT EXISTS idx_local_inference_model ON local_inference_log(model_id);
+`);
+// ─── Prepared Statements ─────────────────────────────────────────────
+const stmts = {
+  upsertModel: db.prepare("INSERT INTO local_models (id, site_id, provider, model_name, endpoint, capabilities, context_window, parameters) VALUES (?, ?, ?, ?, ?, ?, ?, ?) ON CONFLICT(site_id, provider, model_name) DO UPDATE SET endpoint = ?, capabilities = ?, context_window = ?, parameters = ?, status = 'available', last_probe = datetime('now')"),
+  getModel: db.prepare('SELECT * FROM local_models WHERE id = ?'),
+  getModels: db.prepare('SELECT * FROM local_models WHERE site_id = ? ORDER BY provider, model_name'),
+  getAvailableModels: db.prepare("SELECT * FROM local_models WHERE site_id = ? AND status = 'available' ORDER BY avg_latency_ms ASC"),
+  getModelsByCapability: db.prepare("SELECT * FROM local_models WHERE site_id = ? AND status = 'available' AND capabilities LIKE ? ORDER BY avg_latency_ms ASC"),
+  updateModelStatus: db.prepare('UPDATE local_models SET status = ?, last_probe = datetime(\'now\') WHERE id = ?'),
+  updateModelStats: db.prepare("UPDATE local_models SET total_requests = total_requests + 1, total_tokens = total_tokens + ?, avg_latency_ms = (avg_latency_ms * total_requests + ?) / (total_requests + 1), last_used = datetime('now') WHERE id = ?"),
+  insertLog: db.prepare('INSERT INTO local_inference_log (id, model_id, task_type, prompt_tokens, completion_tokens, latency_ms, success) VALUES (?, ?, ?, ?, ?, ?, ?)'),
+  getStats: db.prepare(`SELECT
+    (SELECT COUNT(*) FROM local_models WHERE site_id = ? AND status = 'available') as available_models,
+    (SELECT COUNT(*) FROM local_models WHERE site_id = ?) as total_models,
+    (SELECT SUM(total_requests) FROM local_models WHERE site_id = ?) as total_requests,
+    (SELECT SUM(total_tokens) FROM local_models WHERE site_id = ?) as total_tokens,
+    (SELECT AVG(avg_latency_ms) FROM local_models WHERE site_id = ? AND status = 'available') as avg_latency`),
+};
+// ─── Default Provider Endpoints ──────────────────────────────────────
+const PROVIDERS = {
+  ollama: { name: 'ollama', baseUrl: 'http://localhost:11434', tagsPath: '/api/tags', chatPath: '/api/chat', generatePath: '/api/generate' },
+  llamacpp: { name: 'llamacpp', baseUrl: 'http://localhost:8080', chatPath: '/v1/chat/completions', modelsPath: '/v1/models' },
+};
+// ─── Model Discovery ─────────────────────────────────────────────────
+/**
+ * Probe local endpoints and register discovered models.
+ */
+async function discoverModels(siteId, customEndpoints = []) {
+  const discovered = [];
+  // Probe Ollama
+  try {
+    const ollamaModels = await _probeOllama(PROVIDERS.ollama.baseUrl);
+    for (const m of ollamaModels) {
+      const result = _registerModel(siteId, 'ollama', m.name, PROVIDERS.ollama.baseUrl, m.capabilities, m.contextWindow, m.parameters);
+      discovered.push(result);
+    }
+  } catch (_) { /* Ollama not running */ }
+  // Probe llama.cpp
+  try {
+    const lcModels = await _probeLlamaCpp(PROVIDERS.llamacpp.baseUrl);
+    for (const m of lcModels) {
+      const result = _registerModel(siteId, 'llamacpp', m.name, PROVIDERS.llamacpp.baseUrl, m.capabilities, m.contextWindow, m.parameters);
+      discovered.push(result);
+    }
+  } catch (_) { /* llama.cpp not running */ }
+  // Probe custom endpoints
+  for (const ep of customEndpoints) {
+    try {
+      const models = await _probeOpenAICompatible(ep.url);
+      for (const m of models) {
+        const result = _registerModel(siteId, ep.name || 'custom', m.name, ep.url, m.capabilities, m.contextWindow, m.parameters);
+        discovered.push(result);
+      }
+    } catch (_) { /* endpoint not available */ }
+  }
+  return { discovered: discovered.length, models: discovered };
+}
+/**
+ * Register a model manually.
+ */
+function registerModel(siteId, provider, modelName, endpoint, capabilities = ['text'], contextWindow = 4096) {
+  return _registerModel(siteId, provider, modelName, endpoint, capabilities, contextWindow, {});
+}
+function _registerModel(siteId, provider, modelName, endpoint, capabilities, contextWindow, parameters) {
+  const id = crypto.randomUUID();
+  const caps = JSON.stringify(capabilities);
+  const params = JSON.stringify(parameters);
+  stmts.upsertModel.run(id, siteId, provider, modelName, endpoint, caps, contextWindow, params, endpoint, caps, contextWindow, params);
+  return { id, provider, modelName, endpoint, capabilities, contextWindow };
+}
+// ─── Inference ───────────────────────────────────────────────────────
+/**
+ * Run inference on the best available local model.
+ * @param {string} siteId
+ * @param {string} prompt - The user prompt
+ * @param {object} options - { capability, model, systemPrompt, temperature, maxTokens, stream }
+ */
+async function infer(siteId, prompt, options = {}) {
+  const capability = options.capability || 'text';
+  // Select model
+  let model;
+  if (options.modelId) {
+    model = stmts.getModel.get(options.modelId);
+    if (!model || model.status !== 'available') throw new Error('Selected model unavailable');
+  } else {
+    const candidates = stmts.getModelsByCapability.all(siteId, `%${capability}%`);
+    if (candidates.length === 0) throw new Error(`No local model available for capability: ${capability}`);
+    model = candidates[0]; // Fastest by avg latency
+  }
+  const start = Date.now();
+  let result;
+  try {
+    const parsed = JSON.parse(model.parameters || '{}');
+    if (model.provider === 'ollama') {
+      result = await _inferOllama(model, prompt, options);
+    } else if (model.provider === 'llamacpp') {
+      result = await _inferLlamaCpp(model, prompt, options);
+    } else {
+      result = await _inferOpenAICompatible(model, prompt, options);
+    }
+  } catch (err) {
+    const latency = Date.now() - start;
+    stmts.insertLog.run(crypto.randomUUID(), model.id, capability, 0, 0, latency, 0);
+    throw err;
+  }
+  const latency = Date.now() - start;
+  const totalTokens = (result.promptTokens || 0) + (result.completionTokens || 0);
+  stmts.updateModelStats.run(totalTokens, latency, model.id);
+  stmts.insertLog.run(crypto.randomUUID(), model.id, capability, result.promptTokens || 0, result.completionTokens || 0, latency, 1);
+  return {
+    modelId: model.id,
+    provider: model.provider,
+    model: model.model_name,
+    response: result.text,
+    promptTokens: result.promptTokens || 0,
+    completionTokens: result.completionTokens || 0,
+    latencyMs: latency,
+  };
+}
+// ─── Model Management ────────────────────────────────────────────────
+function getModels(siteId) {
+  return stmts.getModels.all(siteId).map(_deserializeModel);
+}
+function getAvailableModels(siteId) {
+  return stmts.getAvailableModels.all(siteId).map(_deserializeModel);
+}
+function getModel(modelId) {
+  const row = stmts.getModel.get(modelId);
+  return row ? _deserializeModel(row) : null;
+}
+function updateModelStatus(modelId, status) {
+  stmts.updateModelStatus.run(status, modelId);
+}
+function getStats(siteId) {
+  const row = stmts.getStats.get(siteId, siteId, siteId, siteId, siteId);
+  return {
+    availableModels: row.available_models || 0,
+    totalModels: row.total_models || 0,
+    totalRequests: row.total_requests || 0,
+    totalTokens: row.total_tokens || 0,
+    avgLatency: row.avg_latency ? Math.round(row.avg_latency) : 0,
+  };
+}
+// ─── Provider-Specific Inference ─────────────────────────────────────
+async function _inferOllama(model, prompt, options) {
+  const body = {
+    model: model.model_name,
+    messages: [],
+    stream: false,
+    options: {},
+  };
+  if (options.systemPrompt) body.messages.push({ role: 'system', content: options.systemPrompt });
+  body.messages.push({ role: 'user', content: prompt });
+  if (options.temperature != null) body.options.temperature = options.temperature;
+  const res = await fetch(`${model.endpoint}/api/chat`, {
+    method: 'POST',
+    headers: { 'Content-Type': 'application/json' },
+    body: JSON.stringify(body),
+    signal: AbortSignal.timeout(options.timeout || 120000),
+  });
+  if (!res.ok) throw new Error(`Ollama error: ${res.status}`);
+  const data = await res.json();
+  return {
+    text: data.message?.content || '',
+    promptTokens: data.prompt_eval_count || 0,
+    completionTokens: data.eval_count || 0,
+  };
+}
+async function _inferLlamaCpp(model, prompt, options) {
+  const body = {
+    model: model.model_name,
+    messages: [],
+    max_tokens: options.maxTokens || 2048,
+    stream: false,
+  };
+  if (options.systemPrompt) body.messages.push({ role: 'system', content: options.systemPrompt });
+  body.messages.push({ role: 'user', content: prompt });
+  if (options.temperature != null) body.temperature = options.temperature;
+  const res = await fetch(`${model.endpoint}/v1/chat/completions`, {
+    method: 'POST',
+    headers: { 'Content-Type': 'application/json' },
+    body: JSON.stringify(body),
+    signal: AbortSignal.timeout(options.timeout || 120000),
+  });
+  if (!res.ok) throw new Error(`llama.cpp error: ${res.status}`);
+  const data = await res.json();
+  return {
+    text: data.choices?.[0]?.message?.content || '',
+    promptTokens: data.usage?.prompt_tokens || 0,
+    completionTokens: data.usage?.completion_tokens || 0,
+  };
+}
+async function _inferOpenAICompatible(model, prompt, options) {
+  const body = {
+    model: model.model_name,
+    messages: [],
+    max_tokens: options.maxTokens || 2048,
+    stream: false,
+  };
+  if (options.systemPrompt) body.messages.push({ role: 'system', content: options.systemPrompt });
+  body.messages.push({ role: 'user', content: prompt });
+  if (options.temperature != null) body.temperature = options.temperature;
+  const res = await fetch(`${model.endpoint}/v1/chat/completions`, {
+    method: 'POST',
+    headers: { 'Content-Type': 'application/json' },
+    body: JSON.stringify(body),
+    signal: AbortSignal.timeout(options.timeout || 120000),
+  });
+  if (!res.ok) throw new Error(`Inference error: ${res.status}`);
+  const data = await res.json();
+  return {
+    text: data.choices?.[0]?.message?.content || '',
+    promptTokens: data.usage?.prompt_tokens || 0,
+    completionTokens: data.usage?.completion_tokens || 0,
+  };
+}
+// ─── Provider Probing ────────────────────────────────────────────────
+async function _probeOllama(baseUrl) {
+  const res = await fetch(`${baseUrl}/api/tags`, { signal: AbortSignal.timeout(5000) });
+  if (!res.ok) return [];
+  const data = await res.json();
+  return (data.models || []).map(m => ({
+    name: m.name,
+    capabilities: _detectCapabilities(m.name),
+    contextWindow: m.details?.parameter_size ? _estimateContext(m.details.parameter_size) : 4096,
+    parameters: { size: m.size, family: m.details?.family },
+  }));
+}
+async function _probeLlamaCpp(baseUrl) {
+  const res = await fetch(`${baseUrl}/v1/models`, { signal: AbortSignal.timeout(5000) });
+  if (!res.ok) return [];
+  const data = await res.json();
+  return (data.data || []).map(m => ({
+    name: m.id,
+    capabilities: _detectCapabilities(m.id),
+    contextWindow: 4096,
+    parameters: {},
+  }));
+}
+async function _probeOpenAICompatible(baseUrl) {
+  const res = await fetch(`${baseUrl}/v1/models`, { signal: AbortSignal.timeout(5000) });
+  if (!res.ok) return [];
+  const data = await res.json();
+  return (data.data || []).map(m => ({
+    name: m.id,
+    capabilities: _detectCapabilities(m.id),
+    contextWindow: 4096,
+    parameters: {},
+  }));
+}
+// ─── Helpers ─────────────────────────────────────────────────────────
+function _detectCapabilities(modelName) {
+  const n = modelName.toLowerCase();
+  const caps = ['text'];
+  if (n.includes('vision') || n.includes('llava') || n.includes('bakllava')) caps.push('vision');
+  if (n.includes('code') || n.includes('codellama') || n.includes('deepseek-coder') || n.includes('starcoder')) caps.push('code');
+  if (n.includes('embed') || n.includes('nomic')) caps.push('embedding');
+  if (n.includes('mistral') || n.includes('mixtral')) caps.push('reasoning');
+  return caps;
+}
+function _estimateContext(paramSize) {
+  // Rough estimate: smaller models typically have smaller context
+  if (typeof paramSize === 'string') {
+    const num = parseFloat(paramSize);
+    if (num >= 70) return 32768;
+    if (num >= 13) return 8192;
+    return 4096;
+  }
+  return 4096;
+}
+function _deserializeModel(row) {
+  return {
+    ...row,
+    capabilities: JSON.parse(row.capabilities || '["text"]'),
+    parameters: JSON.parse(row.parameters || '{}'),
+  };
+}
+module.exports = {
+  discoverModels, registerModel, infer,
+  getModels, getAvailableModels, getModel, updateModelStatus,
+  getStats,
+};