npm - @softerist/heuristic-mcp - Versions diffs - 3.2.3 → 3.2.5 - Mend

@softerist/heuristic-mcp 3.2.3 → 3.2.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (46) hide show

package/README.md +387 -376
package/config.jsonc +800 -800
package/features/ann-config.js +102 -110
package/features/clear-cache.js +81 -84
package/features/find-similar-code.js +265 -286
package/features/hybrid-search.js +487 -536
package/features/index-codebase.js +3146 -3271
package/features/lifecycle.js +1011 -1063
package/features/package-version.js +277 -291
package/features/register.js +351 -370
package/features/resources.js +115 -130
package/features/set-workspace.js +214 -240
package/index.js +788 -781
package/lib/cache-ops.js +22 -22
package/lib/cache-utils.js +465 -519
package/lib/cache.js +1749 -1849
package/lib/call-graph.js +396 -396
package/lib/cli.js +232 -226
package/lib/config.js +1483 -1495
package/lib/constants.js +511 -493
package/lib/embed-query-process.js +206 -212
package/lib/embedding-process.js +434 -451
package/lib/embedding-worker.js +862 -934
package/lib/ignore-patterns.js +276 -316
package/lib/json-worker.js +14 -14
package/lib/json-writer.js +302 -310
package/lib/logging.js +133 -127
package/lib/memory-logger.js +13 -13
package/lib/onnx-backend.js +188 -193
package/lib/path-utils.js +18 -23
package/lib/project-detector.js +82 -84
package/lib/server-lifecycle.js +164 -147
package/lib/settings-editor.js +738 -739
package/lib/slice-normalize.js +25 -31
package/lib/tokenizer.js +168 -203
package/lib/utils.js +364 -409
package/lib/vector-store-binary.js +973 -991
package/lib/vector-store-sqlite.js +377 -414
package/lib/workspace-env.js +32 -34
package/mcp_config.json +9 -9
package/package.json +86 -86
package/scripts/clear-cache.js +20 -20
package/scripts/download-model.js +43 -43
package/scripts/mcp-launcher.js +49 -49
package/scripts/postinstall.js +12 -12
package/search-configs.js +36 -36

package/lib/slice-normalize.js CHANGED Viewed

@@ -1,31 +1,25 @@
-export function sliceAndNormalize(vector, targetDim) {
-  if (!targetDim || targetDim >= vector.length) {
-    return vector;
-  }
-  const sliced = vector.slice(0, targetDim);
-  let sumSquares = 0;
-  for (let i = 0; i < targetDim; i++) {
-    sumSquares += sliced[i] * sliced[i];
-  }
-  const norm = Math.sqrt(sumSquares);
-  if (norm > 0) {
-    for (let i = 0; i < targetDim; i++) {
-      sliced[i] /= norm;
-    }
-  }
-  return sliced;
-}
-export function toFloat32Array(vector) {
-  return new Float32Array(vector);
-}
+export function sliceAndNormalize(vector, targetDim) {
+  if (!targetDim || targetDim >= vector.length) {
+    return vector;
+  }
+  const sliced = vector.slice(0, targetDim);
+  let sumSquares = 0;
+  for (let i = 0; i < targetDim; i++) {
+    sumSquares += sliced[i] * sliced[i];
+  }
+  const norm = Math.sqrt(sumSquares);
+  if (norm > 0) {
+    for (let i = 0; i < targetDim; i++) {
+      sliced[i] /= norm;
+    }
+  }
+  return sliced;
+}
+export function toFloat32Array(vector) {
+  return new Float32Array(vector);
+}

package/lib/tokenizer.js CHANGED Viewed

@@ -1,203 +1,168 @@
-const IS_TEST_ENV = process.env.VITEST === 'true' || process.env.NODE_ENV === 'test';
-const MODEL_TOKEN_LIMITS_RAW = {
-  'jinaai/jina-embeddings-v2-base-code': 512,
-  default: 512,
-};
-export const MODEL_TOKEN_LIMITS = IS_TEST_ENV
-  ? { ...MODEL_TOKEN_LIMITS_RAW }
-  : Object.freeze({ ...MODEL_TOKEN_LIMITS_RAW });
-const DEFAULT_LIMIT = MODEL_TOKEN_LIMITS.default ?? 512;
-const MODEL_LIMITS_LC = new Map();
-for (const [k, v] of Object.entries(MODEL_TOKEN_LIMITS)) {
-  MODEL_LIMITS_LC.set(k.toLowerCase(), v);
-}
-function getModelTokenLimitFromLower(lowerName, originalName) {
-  if (typeof originalName === 'string') {
-    const direct = MODEL_TOKEN_LIMITS[originalName];
-    if (direct !== undefined) return direct;
-  }
-  const exact = MODEL_LIMITS_LC.get(lowerName);
-  if (exact !== undefined) return exact;
-  if (
-    lowerName.includes('jina') ||
-    lowerName.includes('nomic') ||
-    lowerName.includes('gte-large')
-  ) {
-    return 512;
-  }
-  if (lowerName.includes('gte-base') || lowerName.includes('gte-small')) {
-    return 512;
-  }
-  if (lowerName.includes('minilm')) {
-    return 512;
-  }
-  return DEFAULT_LIMIT;
-}
-export function getModelTokenLimit(modelName) {
-  if (typeof modelName !== 'string' || modelName.length === 0) return DEFAULT_LIMIT;
-  const direct = MODEL_TOKEN_LIMITS[modelName];
-  if (direct !== undefined) return direct;
-  const lower = modelName.toLowerCase();
-  return getModelTokenLimitFromLower(lower, modelName);
-}
-import { CHUNKING_PARAMS_CACHE_SIZE as MAX_CACHE_SIZE } from './constants.js';
-const chunkingParamsCache = new Map();
-export function getChunkingParams(modelName) {
-  const key = typeof modelName === 'string' && modelName.length ? modelName.toLowerCase() : '';
-  if (key === '') {
-    const maxTokens = DEFAULT_LIMIT;
-    const targetTokens = Math.trunc(maxTokens * 0.85);
-    const overlapTokens = Math.trunc(targetTokens * 0.18);
-    return { maxTokens, targetTokens, overlapTokens };
-  }
-  const cached = chunkingParamsCache.get(key);
-  if (cached) {
-    chunkingParamsCache.delete(key);
-    chunkingParamsCache.set(key, cached);
-    return cached;
-  }
-  const maxTokens = getModelTokenLimitFromLower(key, modelName);
-  const targetTokens = Math.trunc(maxTokens * 0.85);
-  const overlapTokens = Math.trunc(targetTokens * 0.18);
-  const params = { maxTokens, targetTokens, overlapTokens };
-  if (chunkingParamsCache.size >= MAX_CACHE_SIZE) {
-    const oldestKey = chunkingParamsCache.keys().next().value;
-    chunkingParamsCache.delete(oldestKey);
-  }
-  chunkingParamsCache.set(key, params);
-  return params;
-}
-const WS = new Uint8Array(128);
-WS[9] = 1;
-WS[10] = 1;
-WS[11] = 1;
-WS[12] = 1;
-WS[13] = 1;
-WS[32] = 1;
-const SPECIAL = new Uint8Array(128);
-const SPECIAL_CHARS = '{}()[];:,.<>!=+-*/%&|^~@#$"\'`\\';
-for (let i = 0; i < SPECIAL_CHARS.length; i++) {
-  SPECIAL[SPECIAL_CHARS.charCodeAt(i)] = 1;
-}
-function calcWordTokens(len) {
-  if (len <= 4) return 1;
-  if (len <= 10) return 2;
-  return (len + 3) >> 2;
-}
-export function estimateTokens(text, { includeSpecialTokens = true } = {}) {
-  if (typeof text !== 'string' || text.length === 0) return 0;
-  const len = text.length;
-  let tokenCount = includeSpecialTokens ? 2 : 0;
-  let specialCount = 0;
-  let wordStart = -1;
-  for (let i = 0; i < len; i++) {
-    const code = text.charCodeAt(i);
-    if (code < 128) {
-      if (WS[code]) {
-        if (wordStart !== -1) {
-          tokenCount += calcWordTokens(i - wordStart);
-          wordStart = -1;
-        }
-      } else {
-        specialCount += SPECIAL[code];
-        if (wordStart === -1) wordStart = i;
-      }
-      continue;
-    }
-    const isUnicodeWS =
-      code === 0x00a0 ||
-      code === 0x202f ||
-      (code >= 0x2000 && code <= 0x200a) ||
-      code === 0x3000 ||
-      code === 0x2028 ||
-      code === 0x2029 ||
-      code === 0x205f ||
-      code === 0x1680 ||
-      code === 0x180e ||
-      code === 0x0085 ||
-      code === 0xfeff;
-    if (isUnicodeWS) {
-      if (wordStart !== -1) {
-        tokenCount += calcWordTokens(i - wordStart);
-        wordStart = -1;
-      }
-    } else {
-      if (wordStart !== -1) {
-        tokenCount += calcWordTokens(i - wordStart);
-        wordStart = -1;
-      }
-      tokenCount++;
-    }
-  }
-  if (wordStart !== -1) {
-    tokenCount += calcWordTokens(len - wordStart);
-  }
-  tokenCount += specialCount >> 1;
-  return tokenCount;
-}
+const IS_TEST_ENV = process.env.VITEST === 'true' || process.env.NODE_ENV === 'test';
+const MODEL_TOKEN_LIMITS_RAW = {
+  'jinaai/jina-embeddings-v2-base-code': 512,
+  default: 512,
+};
+export const MODEL_TOKEN_LIMITS = IS_TEST_ENV
+  ? { ...MODEL_TOKEN_LIMITS_RAW }
+  : Object.freeze({ ...MODEL_TOKEN_LIMITS_RAW });
+const DEFAULT_LIMIT = MODEL_TOKEN_LIMITS.default ?? 512;
+const MODEL_LIMITS_LC = new Map();
+for (const [k, v] of Object.entries(MODEL_TOKEN_LIMITS)) {
+  MODEL_LIMITS_LC.set(k.toLowerCase(), v);
+}
+function getModelTokenLimitFromLower(lowerName, originalName) {
+  if (typeof originalName === 'string') {
+    const direct = MODEL_TOKEN_LIMITS[originalName];
+    if (direct !== undefined) return direct;
+  }
+  const exact = MODEL_LIMITS_LC.get(lowerName);
+  if (exact !== undefined) return exact;
+  if (
+    lowerName.includes('jina') ||
+    lowerName.includes('nomic') ||
+    lowerName.includes('gte-large')
+  ) {
+    return 512;
+  }
+  if (lowerName.includes('gte-base') || lowerName.includes('gte-small')) {
+    return 512;
+  }
+  if (lowerName.includes('minilm')) {
+    return 512;
+  }
+  return DEFAULT_LIMIT;
+}
+export function getModelTokenLimit(modelName) {
+  if (typeof modelName !== 'string' || modelName.length === 0) return DEFAULT_LIMIT;
+  const direct = MODEL_TOKEN_LIMITS[modelName];
+  if (direct !== undefined) return direct;
+  const lower = modelName.toLowerCase();
+  return getModelTokenLimitFromLower(lower, modelName);
+}
+import { CHUNKING_PARAMS_CACHE_SIZE as MAX_CACHE_SIZE } from './constants.js';
+const chunkingParamsCache = new Map();
+export function getChunkingParams(modelName) {
+  const key = typeof modelName === 'string' && modelName.length ? modelName.toLowerCase() : '';
+  if (key === '') {
+    const maxTokens = DEFAULT_LIMIT;
+    const targetTokens = Math.trunc(maxTokens * 0.85);
+    const overlapTokens = Math.trunc(targetTokens * 0.18);
+    return { maxTokens, targetTokens, overlapTokens };
+  }
+  const cached = chunkingParamsCache.get(key);
+  if (cached) {
+    chunkingParamsCache.delete(key);
+    chunkingParamsCache.set(key, cached);
+    return cached;
+  }
+  const maxTokens = getModelTokenLimitFromLower(key, modelName);
+  const targetTokens = Math.trunc(maxTokens * 0.85);
+  const overlapTokens = Math.trunc(targetTokens * 0.18);
+  const params = { maxTokens, targetTokens, overlapTokens };
+  if (chunkingParamsCache.size >= MAX_CACHE_SIZE) {
+    const oldestKey = chunkingParamsCache.keys().next().value;
+    chunkingParamsCache.delete(oldestKey);
+  }
+  chunkingParamsCache.set(key, params);
+  return params;
+}
+const WS = new Uint8Array(128);
+WS[9] = 1;
+WS[10] = 1;
+WS[11] = 1;
+WS[12] = 1;
+WS[13] = 1;
+WS[32] = 1;
+const SPECIAL = new Uint8Array(128);
+const SPECIAL_CHARS = '{}()[];:,.<>!=+-*/%&|^~@#$"\'`\\';
+for (let i = 0; i < SPECIAL_CHARS.length; i++) {
+  SPECIAL[SPECIAL_CHARS.charCodeAt(i)] = 1;
+}
+function calcWordTokens(len) {
+  if (len <= 4) return 1;
+  if (len <= 10) return 2;
+  return (len + 3) >> 2;
+}
+export function estimateTokens(text, { includeSpecialTokens = true } = {}) {
+  if (typeof text !== 'string' || text.length === 0) return 0;
+  const len = text.length;
+  let tokenCount = includeSpecialTokens ? 2 : 0;
+  let specialCount = 0;
+  let wordStart = -1;
+  for (let i = 0; i < len; i++) {
+    const code = text.charCodeAt(i);
+    if (code < 128) {
+      if (WS[code]) {
+        if (wordStart !== -1) {
+          tokenCount += calcWordTokens(i - wordStart);
+          wordStart = -1;
+        }
+      } else {
+        specialCount += SPECIAL[code];
+        if (wordStart === -1) wordStart = i;
+      }
+      continue;
+    }
+    const isUnicodeWS =
+      code === 0x00a0 ||
+      code === 0x202f ||
+      (code >= 0x2000 && code <= 0x200a) ||
+      code === 0x3000 ||
+      code === 0x2028 ||
+      code === 0x2029 ||
+      code === 0x205f ||
+      code === 0x1680 ||
+      code === 0x180e ||
+      code === 0x0085 ||
+      code === 0xfeff;
+    if (isUnicodeWS) {
+      if (wordStart !== -1) {
+        tokenCount += calcWordTokens(i - wordStart);
+        wordStart = -1;
+      }
+    } else {
+      if (wordStart !== -1) {
+        tokenCount += calcWordTokens(i - wordStart);
+        wordStart = -1;
+      }
+      tokenCount++;
+    }
+  }
+  if (wordStart !== -1) {
+    tokenCount += calcWordTokens(len - wordStart);
+  }
+  tokenCount += specialCount >> 1;
+  return tokenCount;
+}