npm - autosnippet - Versions diffs - 2.16.1 → 2.18.0 - Mend

autosnippet 2.16.1 → 2.18.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

package/dashboard/dist/assets/index-9byoG7kd.js +129 -0
package/dashboard/dist/index.html +1 -1
package/lib/cli/SetupService.js +24 -0
package/lib/cli/UpgradeService.js +51 -0
package/lib/external/mcp/handlers/search.js +24 -116
package/lib/http/routes/search.js +64 -23
package/lib/service/automation/handlers/SearchHandler.js +95 -6
package/lib/service/knowledge/KnowledgeService.js +3 -1
package/lib/service/search/CoarseRanker.js +6 -1
package/lib/service/search/InvertedIndex.js +4 -16
package/lib/service/search/MultiSignalRanker.js +6 -1
package/lib/service/search/SearchEngine.js +213 -25
package/package.json +1 -1
package/resources/native-ui/combined-window.swift +5 -5
package/dashboard/dist/assets/index-Cl1XJniU.js +0 -129

package/dashboard/dist/index.html CHANGED Viewed

@@ -5,7 +5,7 @@
     <link rel="icon" type="image/svg+xml" href="/vite.svg" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
     <title>AutoSnippet Dashboard</title>
-    <script type="module" crossorigin src="/assets/index-Cl1XJniU.js"></script>
+    <script type="module" crossorigin src="/assets/index-9byoG7kd.js"></script>
     <link rel="modulepreload" crossorigin href="/assets/yaml-qRaU8Ldn.js">
     <link rel="modulepreload" crossorigin href="/assets/syntax-highlighter-BkDyUteW.js">
     <link rel="modulepreload" crossorigin href="/assets/vendor-Ba1BZjav.js">

package/lib/cli/SetupService.js CHANGED Viewed

@@ -727,6 +727,30 @@ export class SetupService {
       console.log('   ✅ .gitignore += .autosnippet-drafts/');
     }
+    // ── 必须忽略：_draft_*.md（AI Agent 在项目根目录创建的草稿文件） ──
+    if (!content.includes('_draft_*.md')) {
+      content += `\n# AutoSnippet AI 草稿文件（项目根目录临时文件）\n_draft_*.md\n`;
+      changed = true;
+      console.log('   ✅ .gitignore += _draft_*.md');
+    }
+    // ── 必须忽略：常见系统 / 编辑器临时文件 ──
+    if (!content.includes('.DS_Store')) {
+      content += `\n# macOS 元数据\n.DS_Store\n`;
+      changed = true;
+      console.log('   ✅ .gitignore += .DS_Store');
+    }
+    if (!content.includes('nohup.out')) {
+      content += `nohup.out\n`;
+      changed = true;
+      console.log('   ✅ .gitignore += nohup.out');
+    }
+    if (!content.match(/\*\.sw[a-p]/)) {
+      content += `*.sw[a-p]\n`;
+      changed = true;
+      console.log('   ✅ .gitignore += *.sw[a-p]');
+    }
     // Skills 已迁移到 AutoSnippet/skills/（知识库目录内），自动跟随 Git
     // ── 清理旧版本的 .autosnippet/skills/ negation（已迁移，不再需要）──

package/lib/cli/UpgradeService.js CHANGED Viewed

@@ -377,6 +377,57 @@ export class UpgradeService {
       console.log('   ✅ 移除旧版 .autosnippet/skills/ 规则（已迁移到 AutoSnippet/skills/）');
     }
+    // ── v2.8.1: 新增缺失的 gitignore 规则 ──
+    // _draft_*.md — AI Agent 在项目根目录创建的草稿文件
+    if (!content.includes('_draft_*.md')) {
+      content += `\n# AutoSnippet AI 草稿文件（项目根目录临时文件）\n_draft_*.md\n`;
+      changed = true;
+      console.log('   ✅ += _draft_*.md');
+    }
+    // .DS_Store — macOS 元数据
+    if (!content.includes('.DS_Store')) {
+      content += `\n# macOS 元数据\n.DS_Store\n`;
+      changed = true;
+      console.log('   ✅ += .DS_Store');
+    }
+    // nohup.out — 后台进程输出
+    if (!content.includes('nohup.out')) {
+      content += `nohup.out\n`;
+      changed = true;
+      console.log('   ✅ += nohup.out');
+    }
+    // *.sw[a-p] — vim swap 文件
+    if (!content.match(/\*\.sw\[a-p\]/)) {
+      content += `*.sw[a-p]\n`;
+      changed = true;
+      console.log('   ✅ += *.sw[a-p]');
+    }
+    // .autosnippet-drafts/ — AI 草稿目录
+    if (!content.includes('.autosnippet-drafts')) {
+      content += `\n# AutoSnippet AI 草稿（临时）\n.autosnippet-drafts/\n`;
+      changed = true;
+      console.log('   ✅ += .autosnippet-drafts/');
+    }
+    // .env — 环境变量
+    if (!content.includes('.env') || (!content.match(/^\.env$/m) && !content.match(/^\.env\s/m))) {
+      content += `\n# AutoSnippet 环境变量（含 API Key，不入库）\n.env\n`;
+      changed = true;
+      console.log('   ✅ += .env');
+    }
+    // logs/ — 运行日志
+    if (!content.match(/^logs\/?$/m)) {
+      content += `\n# AutoSnippet 运行日志\nlogs/\n`;
+      changed = true;
+      console.log('   ✅ += logs/');
+    }
     // 确保 AutoSnippet/ 不被忽略
     const lines = content.split('\n');
     const hasIgnoreAS = lines.some(l => {

package/lib/external/mcp/handlers/search.js CHANGED Viewed

@@ -68,49 +68,19 @@ export async function search(ctx, args) {
   const query = args.query;
   const limit = args.limit || 10;
   const kind = args.kind || args.type || 'all';
-  let mode = args.mode || 'auto';
+  const mode = args.mode || 'auto';
-  let items;
-  let actualMode = mode;
-  if (mode === 'auto') {
-    // 同时做 BM25 + semantic，融合取最优
-    const [bm25Res, semRes] = await Promise.all([
-      engine.search(query, { mode: 'bm25', limit: limit * 2 }),
-      engine.search(query, { mode: 'semantic', limit: limit * 2 }).catch(() => null),
-    ]);
-    const bm25Items = bm25Res?.items || [];
-    const semItems = semRes?.items || [];
-    // 融合去重：以 id 为 key，取最高 score
-    const merged = new Map();
-    for (const it of bm25Items) {
-      merged.set(it.id, { ...it, _bm25Score: it.score || 0, _semScore: 0 });
-    }
-    for (const it of semItems) {
-      const existing = merged.get(it.id);
-      if (existing) {
-        existing._semScore = it.score || 0;
-        existing.score = Math.max(existing._bm25Score, existing._semScore);
-      } else {
-        merged.set(it.id, { ...it, _bm25Score: 0, _semScore: it.score || 0 });
-      }
-    }
-    items = [...merged.values()].sort((a, b) => b.score - a.score);
-    actualMode = semItems.length > 0 ? 'auto(bm25+semantic)' : 'auto(bm25-only)';
-  } else {
-    const result = await engine.search(query, { mode, limit: limit * 2, groupByKind: true });
-    items = result?.items || [];
-    actualMode = result?.mode || mode;
-  }
+  // 统一调用 SearchEngine（auto 模式内置 BM25+semantic 融合去重 + Ranking Pipeline）
+  const result = await engine.search(query, {
+    mode, limit: kind !== 'all' ? limit * 2 : limit, rank: true, groupByKind: true,
+  });
+  let items = result?.items || [];
+  const actualMode = result?.mode || mode;
   // kind 过滤
   items = filterByKind(items, kind);
   items = items.slice(0, limit);
-  // 清理内部字段
-  for (const it of items) { delete it._bm25Score; delete it._semScore; }
   const byKind = groupByKind(items);
   const elapsed = Date.now() - t0;
@@ -132,57 +102,31 @@ export async function search(ctx, args) {
 // ─── 2. autosnippet_context_search — 智能上下文搜索 ────────────
 /**
- * 智能上下文搜索 —— RetrievalFunnel 4 层漏斗 + SearchEngine 降级
+ * 智能上下文搜索 —— SearchEngine 内置 Ranking Pipeline
  *
  * 设计原则：MCP 调用方是外部 AI Agent，意图识别由 Agent 自行完成。
- * 本工具聚焦数据检索：RetrievalFunnel 多层精炼 → SearchEngine BM25 降级。
- * 不使用 AgentCoordinator 做意图分析。
+ * 本工具聚焦数据检索：BM25 召回 + CoarseRanker + MultiSignalRanker + 上下文加成
  *
  * 特色：byKind 分组、个性化推荐、会话连续性
  */
 export async function contextSearch(ctx, args) {
   const t0 = Date.now();
-  const query = args.query;
-  const limit = args.limit ?? 5;
-  let source = 'search-engine';
-  let items = [];
-  // 引擎只获取一次，两级降级共用
   const engine = getSearchEngine(ctx) || await getFallbackEngine(ctx);
+  const limit = args.limit ?? 5;
-  // ── 优先：RetrievalFunnel 4 层漏斗 ──
-  try {
-    const funnel = ctx.container.get('retrievalFunnel');
-    const rawResult = await engine.search(query, { mode: 'bm25', limit: limit * 3, groupByKind: true });
-    const candidates = rawResult?.items || [];
-    if (funnel && candidates.length > 0) {
-      const normalized = normalizeFunnelInput(candidates);
-      items = await funnel.execute(query, normalized, {
-        intent: 'search',
-        language: args.language,
-        sessionHistory: args.sessionHistory || [],
-      });
-      source = 'retrieval-funnel';
-    } else {
-      items = candidates;
-      source = 'search-engine';
-    }
-  } catch {
-    // Funnel 失败，继续降级
-  }
-  // ── 降级：直接 SearchEngine ──
-  if (items.length === 0) {
-    try {
-      const result = await engine.search(query, { mode: 'bm25', limit, groupByKind: true });
-      items = result?.items || [];
-      source = 'search-engine';
-    } catch { /* 如果连基础搜索也失败 */ }
-  }
+  const result = await engine.search(args.query, {
+    mode: 'bm25', limit, rank: true, groupByKind: true,
+    context: {
+      intent: 'search',
+      language: args.language,
+      sessionHistory: args.sessionHistory || [],
+    },
+  });
-  items = items.slice(0, limit);
+  const items = (result?.items || []).slice(0, limit);
   const byKind = groupByKind(items);
   const elapsed = Date.now() - t0;
+  const source = result?.ranked ? 'search-engine+ranking' : 'search-engine';
   return envelope({
     success: true,
@@ -199,35 +143,6 @@ export async function contextSearch(ctx, args) {
   });
 }
-/**
- * 将 SearchEngine 输出规范化为 RetrievalFunnel 期望的结构
- * SearchEngine 返回: { id, title, trigger, description, content, kind, status, score }
- * Funnel 期望:       { id, title, content, code, description, score, language, category, tags, ... }
- */
-function normalizeFunnelInput(items) {
-  return items.map(item => {
-    // 解析 content JSON → 可搜索文本
-    let contentText = '';
-    let codeText = '';
-    try {
-      const parsed = JSON.parse(item.content || '{}');
-      contentText = [parsed.rationale, parsed.markdown].filter(Boolean).join(' ');
-      codeText = parsed.pattern || '';
-    } catch { /* ignore */ }
-    return {
-      ...item,
-      content: contentText,
-      code: codeText,
-      // 将 SearchEngine 的 score 映射为 Funnel 需要的 bm25Score
-      bm25Score: item.score || 0,
-      // 信号补充（从 SearchEngine 结果推导，不完美但比 0 好）
-      qualityScore: item.status === 'active' ? 70 : 40,
-      usageCount: 0,   // SearchEngine 无此信息，留给 Funnel 默认
-    };
-  });
-}
 // ─── 3. autosnippet_keyword_search — SQL LIKE 精确匹配 ─────────
 /**
@@ -245,15 +160,11 @@ export async function keywordSearch(ctx, args) {
   const kind = args.kind || 'all';
   const result = await engine.search(query, {
-    mode: 'keyword',   // SQL LIKE —— 区别于 BM25
-    type: kind === 'rule' ? 'rule' : 'all',
-    limit,
-    groupByKind: true,
+    mode: 'keyword', limit, groupByKind: true,
   });
   let items = result?.items || [];
-  items = filterByKind(items, kind);
-  items = items.slice(0, limit);
+  items = filterByKind(items, kind).slice(0, limit);
   const byKind = groupByKind(items);
   const elapsed = Date.now() - t0;
@@ -289,15 +200,12 @@ export async function semanticSearch(ctx, args) {
   const kind = args.kind || 'all';
   const result = await engine.search(query, {
-    mode: 'semantic',
-    limit: limit * 2,
-    groupByKind: true,
+    mode: 'semantic', limit: limit * 2, rank: true, groupByKind: true,
   });
   let items = result?.items || [];
   const actualMode = result?.mode || 'semantic';
-  items = filterByKind(items, kind);
-  items = items.slice(0, limit);
+  items = filterByKind(items, kind).slice(0, limit);
   const byKind = groupByKind(items);
   const elapsed = Date.now() - t0;

package/lib/http/routes/search.js CHANGED Viewed

@@ -30,15 +30,13 @@ router.get('/', asyncHandler(async (req, res) => {
   const container = getServiceContainer();
-  // 如果指定了 mode (bm25/semantic)，使用 SearchEngine 直接搜索
-  if (mode === 'bm25' || mode === 'semantic' || mode === 'ranking') {
-    try {
-      const searchEngine = container.get('searchEngine');
-      const result = await searchEngine.search(q, { type, limit, mode, groupByKind });
-      return res.json({ success: true, data: result });
-    } catch (err) {
-      logger.warn('SearchEngine 搜索失败，降级到传统搜索', { mode, error: err.message });
-    }
+  // 所有模式优先通过 SearchEngine（含 auto/bm25/semantic/keyword/ranking）
+  try {
+    const searchEngine = container.get('searchEngine');
+    const result = await searchEngine.search(q, { type, limit, mode, groupByKind });
+    return res.json({ success: true, data: result });
+  } catch (err) {
+    logger.warn('SearchEngine 搜索失败，降级到传统搜索', { mode, error: err.message });
   }
   const results = {};
@@ -213,29 +211,72 @@ router.get('/graph/stats', asyncHandler(async (req, res) => {
 /**
  * POST /api/v1/search/context-aware
- * 上下文感知搜索
+ * 上下文感知搜索 — SearchEngine 内置 Ranking Pipeline（CoarseRanker + MultiSignalRanker + ContextBoost）
  */
 router.post('/context-aware', asyncHandler(async (req, res) => {
-  const { keyword, limit } = req.body;
+  const { keyword, limit, language, sessionHistory } = req.body;
   if (!keyword || !keyword.trim()) {
     throw new ValidationError('keyword is required');
   }
+  const t0 = Date.now();
   const container = getServiceContainer();
-  const knowledgeService = container.get('knowledgeService');
   const pageSize = Math.min(limit || 10, 100);
-  const list = await knowledgeService.search(keyword, { page: 1, pageSize });
-  const items = list.data || list.items || [];
-  const results = items.map(r => ({
-    name: (r.title || r.id) + '.md',
-    content: (r.content || {}).pattern || (r.content || {}).markdown || '',
-    similarity: 1,
-    authority: (r.quality || {}).overall || 0,
-    matchType: 'keyword',
-    qualityScore: (r.quality || {}).overall || 0,
-  }));
+  let results = [];
+  let source = 'knowledgeService';
+  // SearchEngine BM25 + 内置 Ranking Pipeline
+  try {
+    const searchEngine = container.get('searchEngine');
+    const result = await searchEngine.search(keyword, {
+      mode: 'bm25', limit: pageSize, rank: true,
+      context: { intent: 'search', language, sessionHistory: sessionHistory || [] },
+    });
+    const items = result?.items || [];
+    if (items.length > 0) {
+      source = result.ranked ? 'search-engine+ranking' : 'search-engine';
+      results = items.map(r => {
+        let contentStr = '';
+        try {
+          const c = typeof r.content === 'string' && r.content.startsWith('{') ? JSON.parse(r.content) : (r.content || {});
+          contentStr = c.pattern || c.markdown || c.code || '';
+        } catch { contentStr = r.content || r.code || ''; }
+        return {
+          name: (r.title || r.id) + '.md',
+          content: contentStr,
+          similarity: r.score || 0,
+          authority: r.authorityScore || 0,
+          matchType: result.ranked ? 'ranked' : 'bm25',
+          qualityScore: r.qualityScore || 0,
+          usageCount: r.usageCount || 0,
+        };
+      });
+    }
+  } catch (err) {
+    logger.warn('SearchEngine context-aware 失败，降级到 KnowledgeService', { error: err.message });
+  }
+  // 降级: KnowledgeService SQL LIKE
+  if (results.length === 0) {
+    try {
+      const knowledgeService = container.get('knowledgeService');
+      const list = await knowledgeService.search(keyword, { page: 1, pageSize });
+      const items = list.data || list.items || [];
+      results = items.map(r => ({
+        name: (r.title || r.id) + '.md',
+        content: (r.content || {}).pattern || (r.content || {}).markdown || '',
+        similarity: 1,
+        authority: (r.quality || {}).overall || 0,
+        matchType: 'keyword',
+        qualityScore: (r.quality || {}).overall || 0,
+      }));
+      source = 'knowledgeService';
+    } catch { /* 全部失败 */ }
+  }
+  const elapsed = Date.now() - t0;
   res.json({
     success: true,
-    data: { results, context: {}, total: list.total || results.length, hasAiEvaluation: false, searchTime: 0 },
+    data: { results, context: {}, total: results.length, hasAiEvaluation: false, searchTime: elapsed, source },
   });
 }));

package/lib/service/automation/handlers/SearchHandler.js CHANGED Viewed

@@ -26,7 +26,8 @@ export async function handleSearch(watcher, fullPath, relativePath, searchLine)
     const container = ServiceContainer.getInstance();
     const searchEngine = container.get('searchEngine');
-    // 诊断：输出索引状态
+    // 诊断：确保索引已构建后再输出状态
+    searchEngine.ensureIndex();
     const stats = searchEngine.getStats();
     if (stats.totalDocuments === 0) {
       console.log(`  ⚠️  知识库为空（索引 0 条记录），请先通过 asd setup / Dashboard 添加知识条目`);
@@ -34,14 +35,21 @@ export async function handleSearch(watcher, fullPath, relativePath, searchLine)
       console.log(`  📊 索引 ${stats.totalDocuments} 条知识`);
     }
-    // BM25 → keyword 逐级降级：空结果也触发降级（中文分词不足时 BM25 可能零命中）
+    // auto (BM25+semantic 融合 + Ranking Pipeline) → keyword (SQL LIKE) 降级链
+    // Xcode/IDE 场景: 传递 generate intent，让排序器使用代码生成权重
     try {
-      results = await searchEngine.search(query, { limit: 10, mode: 'bm25' });
+      results = await searchEngine.search(query, {
+        limit: 10, mode: 'auto', rank: true,
+        context: { intent: 'generate' },
+      });
+      // auto 零结果 → keyword (SQL LIKE) 兆底
       if (!results || (results.items || []).length === 0) {
         results = await searchEngine.search(query, { limit: 10, mode: 'keyword' });
       }
     } catch {
-      results = await searchEngine.search(query, { limit: 10, mode: 'keyword' });
+      try {
+        results = await searchEngine.search(query, { limit: 10, mode: 'keyword' });
+      } catch { /* 全部失败 */ }
     }
   } catch (err) {
     console.warn(`  ⚠️ 搜索失败: ${err.message}`);
@@ -52,6 +60,13 @@ export async function handleSearch(watcher, fullPath, relativePath, searchLine)
   const items = normalizeSearchResults(results);
+  // Xcode 代码插入场景: 有实际代码的结果优先展示
+  items.sort((a, b) => {
+    const aHasCode = a.code && a.code !== '(无预览内容)' && a.code.length > 30 ? 1 : 0;
+    const bHasCode = b.code && b.code !== '(无预览内容)' && b.code.length > 30 ? 1 : 0;
+    return bHasCode - aHasCode;
+  });
   if (items.length === 0) {
     console.log(`  ℹ️  未找到「${query}」的相关结果`);
     watcher._notify(`未找到「${query}」的相关结果`);
@@ -114,7 +129,21 @@ export function normalizeSearchResults(results) {
         if (Array.isArray(content.headers) && content.headers.length > 0) {
           headers = content.headers;
         }
-      } catch { /* ignore */ }
+        // 如果主字段为空，尝试从 Markdown 内容提取代码块
+        if (!code && content.markdown) {
+          const fenced = content.markdown.match(/```[\w]*\n([\s\S]*?)```/);
+          if (fenced) code = fenced[1].trim();
+        }
+      } catch {
+        // content 不是 JSON，可能是纯文本/代码 — 直接使用
+        if (typeof r.content === 'string' && r.content.length > 10) {
+          code = r.content.substring(0, 2000);
+        }
+      }
+    }
+    // 如果 Ranking Pipeline 已提取 code 字段，优先使用
+    if (!code && r.code && r.code.length > 5) {
+      code = r.code;
     }
     // V3: headers 是独立 JSON 列（字符串），优先解析
     if (headers.length === 0 && r.headers) {
@@ -137,9 +166,20 @@ export function normalizeSearchResults(results) {
       moduleName = r.moduleName || null;
     }
+    // ── 从 code 中分离 #import / @import / import 行，归入 headers ──
+    const finalCode = code || r.code || r.description || r.trigger || '(无预览内容)';
+    const { cleanedCode, extractedHeaders } = _separateImportsFromCode(finalCode);
+    if (extractedHeaders.length > 0) {
+      for (const h of extractedHeaders) {
+        if (!headers.some(existing => existing.trim() === h.trim())) {
+          headers.push(h);
+        }
+      }
+    }
     return {
       title: r.title || r.name || r.id || 'Recipe',
-      code: code || r.code || r.description || r.trigger || '(无预览内容)',
+      code: cleanedCode || '(无预览内容)',
       explanation: explanation || r.summary || r.description || '',
       headers,
       moduleName,
@@ -147,3 +187,52 @@ export function normalizeSearchResults(results) {
     };
   }).filter(item => item.title);
 }
+/**
+ * 从代码文本中分离出 import/include 行
+ *
+ * 只提取位于代码开头的连续 import 块（含中间空行），
+ * 代码正文中的 import（如注释或字符串里的）不做处理。
+ *
+ * 支持: #import, @import, #include, import (Swift)
+ */
+function _separateImportsFromCode(code) {
+  if (!code || code === '(无预览内容)') {
+    return { cleanedCode: code, extractedHeaders: [] };
+  }
+  const lines = code.split(/\r?\n/);
+  const importRe = /^\s*(#import\s|@import\s|#include\s|import\s)/;
+  const extractedHeaders = [];
+  let lastImportIdx = -1;
+  // 从开头扫描连续 import 块（允许中间有空行）
+  for (let i = 0; i < lines.length; i++) {
+    const trimmed = lines[i].trim();
+    if (!trimmed) {
+      // 空行：如果前面已有 import，继续扫描
+      if (lastImportIdx >= 0) continue;
+      // 前面没 import，遇到前导空行也继续
+      continue;
+    }
+    if (importRe.test(trimmed)) {
+      extractedHeaders.push(trimmed);
+      lastImportIdx = i;
+    } else {
+      // 遇到非 import 非空行，停止扫描
+      break;
+    }
+  }
+  if (extractedHeaders.length === 0) {
+    return { cleanedCode: code, extractedHeaders: [] };
+  }
+  // 移除开头的 import 行和紧随的空行
+  const remaining = lines.slice(lastImportIdx + 1);
+  // 去掉残留的前导空行
+  while (remaining.length > 0 && !remaining[0].trim()) {
+    remaining.shift();
+  }
+  const cleanedCode = remaining.join('\n').trim();
+  return { cleanedCode, extractedHeaders };
+}

package/lib/service/knowledge/KnowledgeService.js CHANGED Viewed

@@ -529,9 +529,11 @@ export class KnowledgeService {
       }
       // 构建 DB 更新
+      // 注意: 不在此处 JSON.stringify — repository.update() 内部
+      // 通过 _entityToRow() 统一执行序列化, 传入原始值即可
       const dbUpdates = {
         lifecycle:         entry.lifecycle,
-        lifecycleHistory:  JSON.stringify(entry.lifecycleHistory),
+        lifecycleHistory:  entry.lifecycleHistory,
         updatedAt:         entry.updatedAt,
       };

package/lib/service/search/CoarseRanker.js CHANGED Viewed

@@ -76,7 +76,12 @@ export class CoarseRanker {
   #computeFreshness(candidate) {
     const updated = candidate.updatedAt || candidate.lastModified || candidate.createdAt;
     if (!updated) return 0.5;
-    const ageDays = (Date.now() - new Date(updated).getTime()) / 86400000;
+    // 自动识别秒级/毫秒级 Unix 时间戳 (秒级 ≤ 9999999999 即 2286 年)
+    const ts = typeof updated === 'number' && updated > 0 && updated <= 9999999999
+      ? updated * 1000
+      : (typeof updated === 'number' ? updated : new Date(updated).getTime());
+    const ageDays = (Date.now() - ts) / 86400000;
+    if (ageDays < 0) return 1.0; // 未来时间戳视为最新
     return Math.exp(-0.693 * ageDays / 180); // 半衰期 180 天
   }

package/lib/service/search/InvertedIndex.js CHANGED Viewed

@@ -3,22 +3,10 @@
  * 构建和查询 token → docIndex 映射
  */
-/**
- * Unicode-aware 分词（含 camelCase 拆分 + 最小长度过滤）
- * 与 SearchEngine.tokenize 保持一致的拆分策略
- * @param {string} text
- * @returns {string[]}
- */
-export function tokenize(text) {
-  if (!text || typeof text !== 'string') return [];
-  // 拆分 camelCase/PascalCase（与 SearchEngine.tokenize 一致）
-  const expanded = text.replace(/([a-z])([A-Z])/g, '$1 $2');
-  const tokens = expanded
-    .toLowerCase()
-    .match(/[\p{L}\p{N}_]+/gu) || [];
-  // 过滤过短 token（≥2 字符），减少噪声
-  return tokens.filter(t => t.length >= 2);
-}
+// 使用 SearchEngine 的统一分词器（含完整 CJK 单字/bigram 支持）
+// 确保倒排索引与 BM25 搜索使用一致的分词策略，避免中文查询召回率差异
+import { tokenize } from './SearchEngine.js';
+export { tokenize };
 /**
  * 构建倒排索引

package/lib/service/search/MultiSignalRanker.js CHANGED Viewed

@@ -61,7 +61,12 @@ export class RecencySignal {
   compute(candidate) {
     const updated = candidate.updatedAt || candidate.lastModified || candidate.createdAt;
     if (!updated) return 0.5;
-    const ageMs = Date.now() - new Date(updated).getTime();
+    // 自动识别秒级/毫秒级 Unix 时间戳 (秒级 ≤ 9999999999 即 2286 年)
+    const ts = typeof updated === 'number' && updated > 0 && updated <= 9999999999
+      ? updated * 1000
+      : (typeof updated === 'number' ? updated : new Date(updated).getTime());
+    const ageMs = Date.now() - ts;
+    if (ageMs < 0) return 1.0; // 未来时间戳视为最新
     const ageDays = ageMs / (1000 * 60 * 60 * 24);
     // 指数衰减：半衰期 90 天
     return Math.exp(-0.693 * ageDays / 90);