npm - mcp-agentic-pipelines - Versions diffs - 1.0.1 - Mend

mcp-agentic-pipelines 1.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (119) hide show

package/.env.example +93 -0
package/README.md +258 -0
package/package.json +70 -0
package/packages/clinical/package.json +22 -0
package/packages/clinical/src/index.ts +262 -0
package/packages/clinical/tsconfig.json +13 -0
package/packages/core/package.json +21 -0
package/packages/core/src/config.ts +138 -0
package/packages/core/src/errors.ts +100 -0
package/packages/core/src/index.ts +104 -0
package/packages/core/src/llm-config.ts +213 -0
package/packages/core/src/logging.ts +66 -0
package/packages/core/src/python-bridge.ts +384 -0
package/packages/core/src/rate-limiter.ts +136 -0
package/packages/core/src/types.ts +203 -0
package/packages/core/src/validation.ts +101 -0
package/packages/core/tsconfig.json +10 -0
package/packages/deeppipe/package.json +21 -0
package/packages/deeppipe/src/index.ts +424 -0
package/packages/deeppipe/tsconfig.json +13 -0
package/packages/piste/package.json +20 -0
package/packages/piste/src/index.ts +48 -0
package/packages/piste/tsconfig.json +13 -0
package/packages/precis/package.json +20 -0
package/packages/precis/src/index.ts +67 -0
package/packages/precis/tsconfig.json +13 -0
package/packages/server/package.json +31 -0
package/packages/server/src/index.ts +427 -0
package/packages/server/tsconfig.json +17 -0
package/setup.mjs +141 -0
package/test.mjs +337 -0
package/vendors/clinical-intake/pipeline.mjs +349 -0
package/vendors/clinical-intake/questions/en.txt +9 -0
package/vendors/clinical-intake/questions/fr.txt +9 -0
package/vendors/piste/.env.example +73 -0
package/vendors/piste/app/core/__init__.py +4 -0
package/vendors/piste/app/core/config.py +83 -0
package/vendors/piste/app/core/debuglog.py +16 -0
package/vendors/piste/app/core/middleware.py +40 -0
package/vendors/piste/bridge_piste.py +301 -0
package/vendors/piste/pipeline/__init__.py +4 -0
package/vendors/piste/pipeline/compiler.py +68 -0
package/vendors/piste/pipeline/offline/__init__.py +28 -0
package/vendors/piste/pipeline/offline/verifaid_pipeline.py +247 -0
package/vendors/piste/pipeline/replay.py +15 -0
package/vendors/piste/pipeline/replay_engine.py +249 -0
package/vendors/piste/pipeline/signatures/__init__.py +4 -0
package/vendors/piste/pipeline/signatures/signatures.py +136 -0
package/vendors/piste/pipeline/stage1/__init__.py +21 -0
package/vendors/piste/pipeline/stage1/atomic_decomposer.py +61 -0
package/vendors/piste/pipeline/stage1/check_worthiness.py +100 -0
package/vendors/piste/pipeline/stage1/orchestrator.py +175 -0
package/vendors/piste/pipeline/stage1/test_stage1.py +162 -0
package/vendors/piste/pipeline/stage2/__init__.py +34 -0
package/vendors/piste/pipeline/stage2/blind_retriever.py +303 -0
package/vendors/piste/pipeline/stage2/canonical_mapper.py +124 -0
package/vendors/piste/pipeline/stage2/credibility_scorer.py +85 -0
package/vendors/piste/pipeline/stage2/orchestrator.py +311 -0
package/vendors/piste/pipeline/stage2/query_refiner.py +88 -0
package/vendors/piste/pipeline/stage2/search_decision.py +69 -0
package/vendors/piste/pipeline/stage2/test_stage2.py +265 -0
package/vendors/piste/pipeline/stage3/__init__.py +20 -0
package/vendors/piste/pipeline/stage3/classifier.py +79 -0
package/vendors/piste/pipeline/stage3/orchestrator.py +225 -0
package/vendors/piste/pipeline/stage3/test_stage3.py +101 -0
package/vendors/piste/pipeline/stage4/__init__.py +33 -0
package/vendors/piste/pipeline/stage4/criticality_gate.py +177 -0
package/vendors/piste/pipeline/stage4/orchestrator.py +269 -0
package/vendors/piste/pipeline/stage4/test_stage4.py +192 -0
package/vendors/piste/pipeline/stage4/verdict_aggregator.py +157 -0
package/vendors/piste/requirements.txt +53 -0
package/vendors/precis/backend/__init__.py +6 -0
package/vendors/precis/backend/agents/__init__.py +3 -0
package/vendors/precis/backend/agents/data_synthesis.py +105 -0
package/vendors/precis/backend/agents/dist_free_synth.py +97 -0
package/vendors/precis/backend/agents/exact_hash_retriever.py +327 -0
package/vendors/precis/backend/agents/fusion_ranker.py +64 -0
package/vendors/precis/backend/agents/guardrail.py +175 -0
package/vendors/precis/backend/agents/query_expander.py +89 -0
package/vendors/precis/backend/agents/radial_interpol.py +99 -0
package/vendors/precis/backend/agents/report_generator.py +92 -0
package/vendors/precis/backend/agents/semantic_reranker.py +135 -0
package/vendors/precis/backend/agents/stat_anomaly.py +93 -0
package/vendors/precis/backend/agents/vector_index.py +123 -0
package/vendors/precis/backend/agents/veri_score.py +341 -0
package/vendors/precis/backend/agents/work_order_extractor.py +205 -0
package/vendors/precis/backend/api/__init__.py +3 -0
package/vendors/precis/backend/api/routes/__init__.py +3 -0
package/vendors/precis/backend/config.py +88 -0
package/vendors/precis/backend/core/__init__.py +13 -0
package/vendors/precis/backend/core/hashing.py +22 -0
package/vendors/precis/backend/core/metrics.py +77 -0
package/vendors/precis/backend/core/multitoken.py +166 -0
package/vendors/precis/backend/core/pmi.py +54 -0
package/vendors/precis/backend/core/stemming.py +74 -0
package/vendors/precis/backend/core/tracing.py +150 -0
package/vendors/precis/backend/data/__init__.py +3 -0
package/vendors/precis/backend/data/chunker.py +57 -0
package/vendors/precis/backend/data/pdf_parser.py +42 -0
package/vendors/precis/backend/db/__init__.py +3 -0
package/vendors/precis/backend/db/models.py +173 -0
package/vendors/precis/backend/db/repository.py +269 -0
package/vendors/precis/backend/llm/__init__.py +3 -0
package/vendors/precis/backend/llm/anthropic_provider.py +39 -0
package/vendors/precis/backend/llm/base.py +147 -0
package/vendors/precis/backend/llm/deepseek_provider.py +43 -0
package/vendors/precis/backend/llm/factory.py +60 -0
package/vendors/precis/backend/llm/google_provider.py +39 -0
package/vendors/precis/backend/llm/ollama_provider.py +54 -0
package/vendors/precis/backend/llm/openai_provider.py +50 -0
package/vendors/precis/backend/main.py +677 -0
package/vendors/precis/backend/orchestrator/__init__.py +3 -0
package/vendors/precis/backend/orchestrator/planner.py +81 -0
package/vendors/precis/backend/orchestrator/router.py +319 -0
package/vendors/precis/backend/orchestrator/types.py +58 -0
package/vendors/precis/bridge_precis.py +185 -0
package/vendors/precis/data/sample_reports/README.md +8 -0
package/vendors/precis/data/seed_data.py +115 -0
package/vendors/precis/requirements.txt +19 -0

package/packages/core/src/rate-limiter.ts ADDED Viewed

@@ -0,0 +1,136 @@
+/**
+ * Token Bucket Rate Limiter
+ *
+ * Per-tool rate limiting using the token bucket algorithm.
+ * Different rate categories for costly vs read-only operations.
+ */
+import { RateLimitError } from './errors.js';
+// ── Token Bucket ─────────────────────────────────────────────────────
+export class TokenBucket {
+  private tokens: number;
+  private lastRefill: number;
+  constructor(
+    private readonly maxTokens: number,
+    private readonly refillRate: number, // tokens per second
+  ) {
+    this.tokens = maxTokens;
+    this.lastRefill = Date.now();
+  }
+  /**
+   * Attempt to consume tokens from the bucket.
+   * @returns true if tokens were available and consumed.
+   */
+  tryConsume(count: number = 1): boolean {
+    this.refill();
+    if (this.tokens >= count) {
+      this.tokens -= count;
+      return true;
+    }
+    return false;
+  }
+  /**
+   * Estimate milliseconds until the next token is available.
+   */
+  timeUntilNextToken(): number {
+    this.refill();
+    if (this.tokens >= 1) return 0;
+    // tokens is between 0 and 1 (fractional). Need (1 - tokens) worth of refill.
+    const needed = 1 - this.tokens;
+    return Math.ceil((needed / this.refillRate) * 1000);
+  }
+  private refill(): void {
+    const now = Date.now();
+    const elapsed = (now - this.lastRefill) / 1000;
+    this.tokens = Math.min(this.maxTokens, this.tokens + elapsed * this.refillRate);
+    this.lastRefill = now;
+  }
+}
+// ── Rate Limiter ─────────────────────────────────────────────────────
+/** Rate limit category — determines the token bucket parameters. */
+export type RateCategory = 'costly' | 'write' | 'read';
+const RATE_LIMITS: Record<RateCategory, { maxTokens: number; refillRate: number }> = {
+  costly: { maxTokens: 1, refillRate: 1 },      // 1 req/s
+  write:  { maxTokens: 5, refillRate: 5 },      // 5 req/s
+  read:   { maxTokens: 30, refillRate: 30 },    // 30 req/s
+};
+export class RateLimiter {
+  private buckets = new Map<string, TokenBucket>();
+  private enabled: boolean;
+  constructor(
+    private readonly defaultMaxRPS: number = 10,
+    enabled: boolean = true,
+  ) {
+    this.enabled = enabled;
+  }
+  /**
+   * Check and consume a rate limit token for a tool.
+   * Throws RateLimitError if limit exceeded.
+   *
+   * @param toolName - MCP tool name.
+   * @param category - Rate category override (auto-detected if omitted).
+   */
+  check(toolName: string, category?: RateCategory): void {
+    if (!this.enabled) return;
+    const bucket = this.getBucket(toolName, category);
+    if (!bucket.tryConsume()) {
+      const retryMs = bucket.timeUntilNextToken();
+      throw new RateLimitError(toolName, retryMs);
+    }
+  }
+  /**
+   * Create or retrieve a token bucket for a tool.
+   */
+  private getBucket(toolName: string, category?: RateCategory): TokenBucket {
+    if (!this.buckets.has(toolName)) {
+      const cat = category ?? this.detectCategory(toolName);
+      const limits = RATE_LIMITS[cat];
+      this.buckets.set(toolName, new TokenBucket(limits.maxTokens, limits.refillRate));
+    }
+    return this.buckets.get(toolName)!;
+  }
+  /**
+   * Auto-detect rate category from tool name prefix.
+   */
+  private detectCategory(toolName: string): RateCategory {
+    // Costly: full pipeline runs, audio processing
+    if (
+      toolName.startsWith('piste_fact_check') ||
+      toolName.startsWith('clinical_process') ||
+      toolName.startsWith('precis_query')
+    ) {
+      return 'costly';
+    }
+    // Write: ingestion, upload
+    if (
+      toolName.includes('ingest') ||
+      toolName.includes('upload') ||
+      toolName.includes('remove') ||
+      toolName.includes('extract')
+    ) {
+      return 'write';
+    }
+    // Read: everything else
+    return 'read';
+  }
+}
+/** Create a rate limiter from configuration. */
+export function createRateLimiter(enabled: boolean, maxRPS: number): RateLimiter {
+  return new RateLimiter(maxRPS, enabled);
+}

package/packages/core/src/types.ts ADDED Viewed

@@ -0,0 +1,203 @@
+/**
+ * Shared TypeScript Types
+ *
+ * Common types used across all integration packages.
+ */
+import type { ResolvedLLMConfig } from './llm-config.js';
+// ── MCP Tool Types ───────────────────────────────────────────────────
+/** Standard MCP tool response content item. */
+export interface MCPTextContent {
+  type: 'text';
+  text: string;
+}
+/** Standard MCP tool response. */
+export interface MCPToolResponse {
+  content: MCPTextContent[];
+  isError?: boolean;
+}
+/** MCP resource content. */
+export interface MCPResourceContent {
+  uri: string;
+  mimeType: string;
+  text?: string;
+  blob?: string;
+}
+/** Definition of a registered MCP tool. */
+export interface ToolDefinition {
+  name: string;
+  description: string;
+  inputSchema: Record<string, unknown>;
+}
+/** Definition of a registered MCP resource. */
+export interface ResourceDefinition {
+  uri: string;
+  name: string;
+  description: string;
+  mimeType: string;
+}
+/** Definition of a registered MCP prompt. */
+export interface PromptDefinition {
+  name: string;
+  description: string;
+  arguments?: Array<{
+    name: string;
+    description: string;
+    required: boolean;
+  }>;
+}
+// ── Health Status ────────────────────────────────────────────────────
+export interface ServiceHealth {
+  service: string;
+  status: 'healthy' | 'unhealthy' | 'disabled';
+  provider?: string;
+  model?: string;
+  error?: string;
+}
+// ── LLM Provider Info ────────────────────────────────────────────────
+export interface LLMProviderInfo {
+  provider: string;
+  baseUrl: string;
+  defaultModel: string;
+  isOpenAICompatible: boolean;
+  configured: boolean;
+}
+// ── Audio Types (Clinical Intake) ────────────────────────────────────
+export interface AudioTurn {
+  role: 'user' | 'assistant';
+  text: string;
+  audioBase64?: string;
+  turnNumber: number;
+}
+export interface ClinicalSession {
+  sessionId: string;
+  patientName: string;
+  lang: 'en' | 'fr';
+  turns: AudioTurn[];
+  createdAt: string;
+  isComplete: boolean;
+}
+// ── Search Types (DeepPipe) ──────────────────────────────────────────
+export interface SearchHit {
+  score: number;
+  source: string;
+  snippet?: string;
+  documentId: number;
+}
+export interface SearchResults {
+  hits: SearchHit[];
+  totalHits: number;
+  elapsedMs: number;
+}
+export interface StoredDocument {
+  id: number;
+  source: string;
+  wordCount: number;
+  indexedAt: string;
+  format?: string;
+}
+// ── Chat Types (DeepPipe RAG) ────────────────────────────────────────
+export interface ChatSource {
+  index: number;
+  documentId: number;
+  title: string;
+  sourcePath: string;
+  score: number;
+}
+export interface ChatContext {
+  grounded: boolean;
+  sources: ChatSource[];
+  messages: Array<{ role: string; content: string }>;
+}
+// ── Fact-Check Types (Piste) ─────────────────────────────────────────
+export type VerdictLabel =
+  | 'TRUE'
+  | 'MOSTLY_TRUE'
+  | 'HALF_TRUE'
+  | 'MOSTLY_FALSE'
+  | 'FALSE'
+  | 'PANTS_ON_FIRE'
+  | 'UNVERIFIABLE';
+export interface FactCheckVerdict {
+  runId: string;
+  claimId: string;
+  verdict: {
+    label: VerdictLabel;
+    distribution: Record<string, number>;
+    explanation: string;
+    sources: Array<{
+      url: string;
+      title: string;
+      classification: 'SUPPORTS' | 'REFUTES' | 'UNRELATED';
+    }>;
+  };
+  auditUrl: string;
+  elapsedMs: number;
+}
+// ── Precis Types (Agentic RAG) ───────────────────────────────────────
+export interface PrecisQueryResult {
+  status: 'success' | 'blocked' | 'error';
+  traceId: string;
+  plan?: {
+    subtasks: Array<{ id: string; type: string; query: string }>;
+    reasoning: string;
+  };
+  report?: Record<string, unknown>;
+  evaluation?: {
+    relevancy: number;
+    trust: number;
+    exhaustivity: number;
+    hallucinationRate: number;
+    citationCoverage: number;
+    flaggedIssues: string[];
+  };
+  guardrail?: {
+    action: 'pass' | 'flag' | 'redact' | 'block';
+    issues: string[];
+    requiresHumanReview: boolean;
+  };
+  error?: string;
+}
+// ── Work Order Types (Precis) ────────────────────────────────────────
+export interface WorkOrder {
+  id: string;
+  tailNumber: string;
+  workOrderNumber: string;
+  date: string;
+  aircraftModel: string;
+  partNumbers: string[];
+  mechanicId: string;
+  station: string;
+  hoursWorked: number;
+  inspectorStamp: string;
+  adSbReferences: string[];
+  fieldsExtracted: number;
+}

package/packages/core/src/validation.ts ADDED Viewed

@@ -0,0 +1,101 @@
+/**
+ * Runtime Input Validation
+ *
+ * Wraps Zod schemas for validating MCP tool input arguments.
+ * Returns structured ValidationErrors on failure.
+ */
+import { z, ZodError } from 'zod';
+import { ValidationError } from './errors.js';
+/**
+ * Validate tool arguments against a Zod schema.
+ * Throws ValidationError with field-level detail on failure.
+ *
+ * @param schema - Zod schema to validate against.
+ * @param args - Raw arguments from MCP tool call.
+ * @param toolName - Tool name for error context.
+ * @returns Parsed and typed arguments.
+ */
+export function validateArgs<T extends z.ZodType>(
+  schema: T,
+  args: unknown,
+  toolName: string,
+): z.infer<T> {
+  try {
+    return schema.parse(args ?? {});
+  } catch (error) {
+    if (error instanceof ZodError) {
+      const messages = error.errors
+        .map((e) => `${e.path.join('.') || '(root)'}: ${e.message}`)
+        .join('; ');
+      throw new ValidationError(toolName, messages);
+    }
+    throw new ValidationError(toolName, String(error));
+  }
+}
+/**
+ * Validate and sanitize a string input.
+ * Strips null bytes, normalizes Unicode, trims whitespace.
+ */
+export function sanitizeString(input: unknown, maxLength: number = 4000): string {
+  if (typeof input !== 'string') return '';
+  return input
+    .replace(/\u0000/g, '')          // Strip null bytes
+    .normalize('NFKC')                // Unicode normalization
+    .trim()
+    .slice(0, maxLength);
+}
+/**
+ * Validate that a base64 string is well-formed and within size limits.
+ */
+export function validateBase64(input: unknown, maxBytes: number = 10 * 1024 * 1024): { valid: true; buffer: Buffer } | { valid: false; error: string } {
+  if (typeof input !== 'string') {
+    return { valid: false, error: 'Input must be a base64-encoded string' };
+  }
+  // Estimate decoded size: base64 is ~4/3 of original
+  if (input.length > maxBytes * 1.4) {
+    return { valid: false, error: `Base64 input exceeds maximum size of ${Math.round(maxBytes / 1024 / 1024)} MB` };
+  }
+  try {
+    const buffer = Buffer.from(input, 'base64');
+    if (buffer.length > maxBytes) {
+      return { valid: false, error: `Decoded data exceeds maximum size of ${Math.round(maxBytes / 1024 / 1024)} MB` };
+    }
+    if (buffer.length === 0 && input.length > 0) {
+      return { valid: false, error: 'Invalid base64 encoding' };
+    }
+    return { valid: true, buffer };
+  } catch {
+    return { valid: false, error: 'Invalid base64 encoding' };
+  }
+}
+/**
+ * Clamp an integer value within [min, max], with a fallback for NaN.
+ */
+export function clampInt(raw: unknown, fallback: number, min: number, max: number): number {
+  const n = Number(raw ?? fallback);
+  if (Number.isNaN(n)) return fallback;
+  return Math.min(Math.max(Math.floor(n), min), max);
+}
+// ── Common reusable Zod schemas ──────────────────────────────────────
+/** Positive integer with bounds. */
+export const intSchema = (min: number, max: number, fallback: number) =>
+  z.coerce.number().int().min(min).max(max).default(fallback);
+/** Non-empty string with max length. */
+export const stringSchema = (maxLength: number = 4000) =>
+  z.string().min(1).max(maxLength).transform((s) => sanitizeString(s, maxLength));
+/** Language locale enum. */
+export const localeSchema = z.enum(['en', 'fr']);
+/** Base64-encoded data. */
+export const base64Schema = z.string().min(1);

package/packages/core/tsconfig.json ADDED Viewed

@@ -0,0 +1,10 @@
+{
+  "extends": "../../tsconfig.json",
+  "compilerOptions": {
+    "rootDir": "src",
+    "outDir": "dist",
+    "composite": true
+  },
+  "include": ["src/**/*"],
+  "exclude": ["dist", "__tests__"]
+}

package/packages/deeppipe/package.json ADDED Viewed

@@ -0,0 +1,21 @@
+{
+  "name": "@unified-mcp/deeppipe",
+  "version": "0.1.0",
+  "description": "DeepPipe integration for unified MCP server — document ingestion, full-text search, and RAG chat via @kordabjinan/deeppipe",
+  "type": "module",
+  "main": "./src/index.ts",
+  "types": "./src/index.ts",
+  "scripts": {
+    "build": "tsc -p tsconfig.json",
+    "typecheck": "tsc -p tsconfig.json --noEmit",
+    "test": "vitest run",
+    "test:watch": "vitest"
+  },
+  "dependencies": {
+    "@unified-mcp/core": "^0.1.0",
+    "@kordabjinan/deeppipe": "^0.1.0"
+  },
+  "devDependencies": {
+    "vitest": "^2.0.0"
+  }
+}