npm - @twelvehart/supermemory-runtime - Versions diffs - 1.0.0-next.0 - Mend

@twelvehart/supermemory-runtime 1.0.0-next.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (156) hide show

package/.env.example +57 -0
package/README.md +374 -0
package/dist/index.js +189 -0
package/dist/mcp/index.js +1132 -0
package/docker-compose.prod.yml +91 -0
package/docker-compose.yml +358 -0
package/drizzle/0000_dapper_the_professor.sql +159 -0
package/drizzle/0001_api_keys.sql +51 -0
package/drizzle/meta/0000_snapshot.json +1532 -0
package/drizzle/meta/_journal.json +13 -0
package/drizzle.config.ts +20 -0
package/package.json +114 -0
package/scripts/add-extraction-job.ts +122 -0
package/scripts/benchmark-pgvector.ts +122 -0
package/scripts/bootstrap.sh +209 -0
package/scripts/check-runtime-pack.ts +111 -0
package/scripts/claude-mcp-config.ts +336 -0
package/scripts/docker-entrypoint.sh +183 -0
package/scripts/doctor.ts +377 -0
package/scripts/init-db.sql +33 -0
package/scripts/install.sh +1110 -0
package/scripts/mcp-setup.ts +271 -0
package/scripts/migrations/001_create_pgvector_extension.sql +31 -0
package/scripts/migrations/002_create_memory_embeddings_table.sql +75 -0
package/scripts/migrations/003_create_hnsw_index.sql +94 -0
package/scripts/migrations/004_create_memory_embeddings_standalone.sql +70 -0
package/scripts/migrations/005_create_chunks_table.sql +95 -0
package/scripts/migrations/006_create_processing_queue.sql +45 -0
package/scripts/migrations/generate_test_data.sql +42 -0
package/scripts/migrations/phase1_comprehensive_test.sql +204 -0
package/scripts/migrations/run_migrations.sh +286 -0
package/scripts/migrations/test_hnsw_index.sql +255 -0
package/scripts/pre-commit-secrets +282 -0
package/scripts/run-extraction-worker.ts +46 -0
package/scripts/run-phase1-tests.sh +291 -0
package/scripts/setup.ts +222 -0
package/scripts/smoke-install.sh +12 -0
package/scripts/test-health-endpoint.sh +328 -0
package/src/api/index.ts +2 -0
package/src/api/middleware/auth.ts +80 -0
package/src/api/middleware/csrf.ts +308 -0
package/src/api/middleware/errorHandler.ts +166 -0
package/src/api/middleware/rateLimit.ts +360 -0
package/src/api/middleware/validation.ts +514 -0
package/src/api/routes/documents.ts +286 -0
package/src/api/routes/profiles.ts +237 -0
package/src/api/routes/search.ts +71 -0
package/src/api/stores/index.ts +58 -0
package/src/config/bootstrap-env.ts +3 -0
package/src/config/env.ts +71 -0
package/src/config/feature-flags.ts +25 -0
package/src/config/index.ts +140 -0
package/src/config/secrets.config.ts +291 -0
package/src/db/client.ts +92 -0
package/src/db/index.ts +73 -0
package/src/db/postgres.ts +72 -0
package/src/db/schema/chunks.schema.ts +31 -0
package/src/db/schema/containers.schema.ts +46 -0
package/src/db/schema/documents.schema.ts +49 -0
package/src/db/schema/embeddings.schema.ts +32 -0
package/src/db/schema/index.ts +11 -0
package/src/db/schema/memories.schema.ts +72 -0
package/src/db/schema/profiles.schema.ts +34 -0
package/src/db/schema/queue.schema.ts +59 -0
package/src/db/schema/relationships.schema.ts +42 -0
package/src/db/schema.ts +223 -0
package/src/db/worker-connection.ts +47 -0
package/src/index.ts +235 -0
package/src/mcp/CLAUDE.md +1 -0
package/src/mcp/index.ts +1380 -0
package/src/mcp/legacyState.ts +22 -0
package/src/mcp/rateLimit.ts +358 -0
package/src/mcp/resources.ts +309 -0
package/src/mcp/results.ts +104 -0
package/src/mcp/tools.ts +401 -0
package/src/queues/config.ts +119 -0
package/src/queues/index.ts +289 -0
package/src/sdk/client.ts +225 -0
package/src/sdk/errors.ts +266 -0
package/src/sdk/http.ts +560 -0
package/src/sdk/index.ts +244 -0
package/src/sdk/resources/base.ts +65 -0
package/src/sdk/resources/connections.ts +204 -0
package/src/sdk/resources/documents.ts +163 -0
package/src/sdk/resources/index.ts +10 -0
package/src/sdk/resources/memories.ts +150 -0
package/src/sdk/resources/search.ts +60 -0
package/src/sdk/resources/settings.ts +36 -0
package/src/sdk/types.ts +674 -0
package/src/services/chunking/index.ts +451 -0
package/src/services/chunking.service.ts +650 -0
package/src/services/csrf.service.ts +252 -0
package/src/services/documents.repository.ts +219 -0
package/src/services/documents.service.ts +191 -0
package/src/services/embedding.service.ts +404 -0
package/src/services/extraction.service.ts +300 -0
package/src/services/extractors/code.extractor.ts +451 -0
package/src/services/extractors/index.ts +9 -0
package/src/services/extractors/markdown.extractor.ts +461 -0
package/src/services/extractors/pdf.extractor.ts +315 -0
package/src/services/extractors/text.extractor.ts +118 -0
package/src/services/extractors/url.extractor.ts +243 -0
package/src/services/index.ts +235 -0
package/src/services/ingestion.service.ts +177 -0
package/src/services/llm/anthropic.ts +400 -0
package/src/services/llm/base.ts +460 -0
package/src/services/llm/contradiction-detector.service.ts +526 -0
package/src/services/llm/heuristics.ts +148 -0
package/src/services/llm/index.ts +309 -0
package/src/services/llm/memory-classifier.service.ts +383 -0
package/src/services/llm/memory-extension-detector.service.ts +523 -0
package/src/services/llm/mock.ts +470 -0
package/src/services/llm/openai.ts +398 -0
package/src/services/llm/prompts.ts +438 -0
package/src/services/llm/types.ts +373 -0
package/src/services/memory.repository.ts +1769 -0
package/src/services/memory.service.ts +1338 -0
package/src/services/memory.types.ts +234 -0
package/src/services/persistence/index.ts +295 -0
package/src/services/pipeline.service.ts +509 -0
package/src/services/profile.repository.ts +436 -0
package/src/services/profile.service.ts +560 -0
package/src/services/profile.types.ts +270 -0
package/src/services/relationships/detector.ts +1128 -0
package/src/services/relationships/index.ts +268 -0
package/src/services/relationships/memory-integration.ts +459 -0
package/src/services/relationships/strategies.ts +132 -0
package/src/services/relationships/types.ts +370 -0
package/src/services/search.service.ts +761 -0
package/src/services/search.types.ts +220 -0
package/src/services/secrets.service.ts +384 -0
package/src/services/vectorstore/base.ts +327 -0
package/src/services/vectorstore/index.ts +444 -0
package/src/services/vectorstore/memory.ts +286 -0
package/src/services/vectorstore/migration.ts +295 -0
package/src/services/vectorstore/mock.ts +403 -0
package/src/services/vectorstore/pgvector.ts +695 -0
package/src/services/vectorstore/types.ts +247 -0
package/src/startup.ts +389 -0
package/src/types/api.types.ts +193 -0
package/src/types/document.types.ts +103 -0
package/src/types/index.ts +241 -0
package/src/types/profile.base.ts +133 -0
package/src/utils/errors.ts +447 -0
package/src/utils/id.ts +15 -0
package/src/utils/index.ts +101 -0
package/src/utils/logger.ts +313 -0
package/src/utils/sanitization.ts +501 -0
package/src/utils/secret-validation.ts +273 -0
package/src/utils/synonyms.ts +188 -0
package/src/utils/validation.ts +581 -0
package/src/workers/chunking.worker.ts +242 -0
package/src/workers/embedding.worker.ts +358 -0
package/src/workers/extraction.worker.ts +346 -0
package/src/workers/indexing.worker.ts +505 -0
package/tsconfig.json +38 -0

package/src/services/llm/anthropic.ts ADDED Viewed

@@ -0,0 +1,400 @@
+/**
+ * Anthropic LLM Provider
+ *
+ * Implements LLM-based memory extraction using Anthropic's Claude models.
+ * Uses the Anthropic SDK with structured output prompting.
+ */
+import { getLogger } from '../../utils/logger.js'
+import { BaseLLMProvider, LLMError } from './base.js'
+import type {
+  AnthropicLLMConfig,
+  LLMProviderType,
+  ExtractedMemory,
+  DetectedRelationship,
+  ExtractionOptions,
+  RelationshipDetectionOptions,
+} from './types.js'
+import { LLMErrorCode } from './types.js'
+import type { MemoryType } from '../../types/index.js'
+import {
+  MEMORY_EXTRACTION_SYSTEM_PROMPT,
+  MEMORY_EXTRACTION_EXAMPLES,
+  RELATIONSHIP_DETECTION_SYSTEM_PROMPT,
+  RELATIONSHIP_DETECTION_EXAMPLES,
+  generateExtractionPrompt,
+  generateRelationshipPrompt,
+  normalizeJsonResponse,
+  parseExtractionResponse,
+  parseRelationshipResponse,
+} from './prompts.js'
+const logger = getLogger('AnthropicProvider')
+// ============================================================================
+// Default Configuration
+// ============================================================================
+const DEFAULT_ANTHROPIC_CONFIG: Partial<AnthropicLLMConfig> = {
+  model: 'claude-3-haiku-20240307',
+  maxTokens: 2000,
+  temperature: 0.1,
+  timeoutMs: 30000,
+  maxRetries: 3,
+  retryDelayMs: 1000,
+}
+// ============================================================================
+// Anthropic API Types (minimal, since we're not using the full SDK)
+// ============================================================================
+interface AnthropicMessage {
+  role: 'user' | 'assistant'
+  content: string
+}
+interface AnthropicResponse {
+  id: string
+  type: 'message'
+  role: 'assistant'
+  content: Array<{
+    type: 'text'
+    text: string
+  }>
+  model: string
+  stop_reason: string
+  usage: {
+    input_tokens: number
+    output_tokens: number
+  }
+}
+interface AnthropicError {
+  type: 'error'
+  error: {
+    type: string
+    message: string
+  }
+}
+// ============================================================================
+// Anthropic Provider Implementation
+// ============================================================================
+export class AnthropicLLMProvider extends BaseLLMProvider {
+  readonly type: LLMProviderType = 'anthropic'
+  private readonly apiKey?: string
+  private readonly model: string
+  private readonly baseUrl: string
+  constructor(config: AnthropicLLMConfig) {
+    super({
+      ...DEFAULT_ANTHROPIC_CONFIG,
+      ...config,
+    })
+    this.apiKey = config.apiKey
+    this.model = config.model ?? DEFAULT_ANTHROPIC_CONFIG.model!
+    this.baseUrl = config.baseUrl ?? 'https://api.anthropic.com'
+    logger.debug('Anthropic provider initialized', {
+      model: this.model,
+      hasApiKey: !!this.apiKey,
+    })
+  }
+  // ============================================================================
+  // Availability Check
+  // ============================================================================
+  isAvailable(): boolean {
+    return !!this.apiKey
+  }
+  // ============================================================================
+  // API Communication
+  // ============================================================================
+  private async callAnthropicAPI(
+    systemPrompt: string,
+    userMessage: string
+  ): Promise<{ content: string; usage: { input: number; output: number } }> {
+    if (!this.apiKey) {
+      throw LLMError.providerUnavailable('anthropic')
+    }
+    const messages: AnthropicMessage[] = [{ role: 'user', content: userMessage }]
+    const requestBody = {
+      model: this.model,
+      max_tokens: this.config.maxTokens,
+      temperature: this.config.temperature,
+      system: systemPrompt,
+      messages,
+    }
+    const controller = new AbortController()
+    const timeoutId = setTimeout(() => controller.abort(), this.config.timeoutMs)
+    try {
+      const response = await fetch(`${this.baseUrl}/v1/messages`, {
+        method: 'POST',
+        headers: {
+          'Content-Type': 'application/json',
+          'x-api-key': this.apiKey,
+          'anthropic-version': '2023-06-01',
+        },
+        body: JSON.stringify(requestBody),
+        signal: controller.signal,
+      })
+      clearTimeout(timeoutId)
+      if (!response.ok) {
+        const errorBody = (await response.json().catch(() => ({}))) as AnthropicError | Record<string, unknown>
+        throw this.handleAnthropicHttpError(response.status, errorBody)
+      }
+      // Parse and validate JSON response (with error handling for concurrent request corruption)
+      let data: AnthropicResponse
+      try {
+        data = (await response.json()) as AnthropicResponse
+      } catch (parseError) {
+        throw LLMError.invalidResponse(
+          'anthropic',
+          `JSON parse error: ${parseError instanceof Error ? parseError.message : String(parseError)}`
+        )
+      }
+      // Validate response structure (handles concurrent request JSON corruption)
+      if (!data || typeof data !== 'object') {
+        throw LLMError.invalidResponse('anthropic', 'Malformed JSON response')
+      }
+      if (!data.content || !Array.isArray(data.content)) {
+        throw LLMError.invalidResponse('anthropic', 'Invalid response structure: missing content array')
+      }
+      if (!data.content?.[0]?.text) {
+        throw LLMError.invalidResponse('anthropic', 'Empty response from model')
+      }
+      return {
+        content: data.content[0].text,
+        usage: {
+          input: data.usage.input_tokens,
+          output: data.usage.output_tokens,
+        },
+      }
+    } catch (error) {
+      clearTimeout(timeoutId)
+      if (error instanceof LLMError) {
+        throw error
+      }
+      if (error instanceof Error && error.name === 'AbortError') {
+        throw LLMError.timeout('anthropic')
+      }
+      throw this.handleAnthropicError(error)
+    }
+  }
+  // ============================================================================
+  // Memory Extraction
+  // ============================================================================
+  protected async doExtractMemories(
+    text: string,
+    options: ExtractionOptions
+  ): Promise<{
+    memories: ExtractedMemory[]
+    rawResponse?: string
+    tokensUsed?: { prompt: number; completion: number; total: number }
+  }> {
+    const systemPrompt = `${MEMORY_EXTRACTION_SYSTEM_PROMPT}\n\n${MEMORY_EXTRACTION_EXAMPLES}`
+    const userPrompt = generateExtractionPrompt(text, options)
+    const response = await this.callAnthropicAPI(systemPrompt, userPrompt)
+    const parsed = parseExtractionResponse(response.content)
+    // Filter by confidence if specified
+    let memories: ExtractedMemory[] = parsed.memories.map((m) => ({
+      content: m.content,
+      type: m.type,
+      confidence: m.confidence,
+      entities: m.entities.map((e) => ({
+        name: e.name,
+        type: e.type as 'person' | 'place' | 'organization' | 'date' | 'concept' | 'other',
+        mentions: 1,
+      })),
+      keywords: m.keywords,
+    }))
+    if (options.minConfidence) {
+      memories = memories.filter((m) => m.confidence >= options.minConfidence!)
+    }
+    if (options.maxMemories) {
+      memories = memories.slice(0, options.maxMemories)
+    }
+    return {
+      memories,
+      rawResponse: response.content,
+      tokensUsed: {
+        prompt: response.usage.input,
+        completion: response.usage.output,
+        total: response.usage.input + response.usage.output,
+      },
+    }
+  }
+  // ============================================================================
+  // Relationship Detection
+  // ============================================================================
+  protected async doDetectRelationships(
+    newMemory: { id: string; content: string; type: MemoryType },
+    existingMemories: Array<{ id: string; content: string; type: MemoryType }>,
+    options: RelationshipDetectionOptions
+  ): Promise<{
+    relationships: DetectedRelationship[]
+    supersededMemoryIds: string[]
+  }> {
+    // If no existing memories, return empty
+    if (existingMemories.length === 0) {
+      return { relationships: [], supersededMemoryIds: [] }
+    }
+    const systemPrompt = `${RELATIONSHIP_DETECTION_SYSTEM_PROMPT}\n\n${RELATIONSHIP_DETECTION_EXAMPLES}`
+    const userPrompt = generateRelationshipPrompt(newMemory, existingMemories, options)
+    const response = await this.callAnthropicAPI(systemPrompt, userPrompt)
+    const parsed = parseRelationshipResponse(response.content)
+    // Filter and validate relationships
+    let relationships: DetectedRelationship[] = parsed.relationships.map((r) => ({
+      sourceMemoryId: r.sourceMemoryId,
+      targetMemoryId: r.targetMemoryId,
+      type: r.type as DetectedRelationship['type'],
+      confidence: r.confidence,
+      reason: r.reason,
+    }))
+    if (options.minConfidence) {
+      relationships = relationships.filter((r) => r.confidence >= options.minConfidence!)
+    }
+    if (options.maxRelationships) {
+      relationships = relationships.slice(0, options.maxRelationships)
+    }
+    return {
+      relationships,
+      supersededMemoryIds: parsed.supersededMemoryIds,
+    }
+  }
+  // ============================================================================
+  // Generic JSON Task
+  // ============================================================================
+  protected async doGenerateJson(
+    systemPrompt: string,
+    userPrompt: string
+  ): Promise<{
+    rawResponse: string
+    tokensUsed?: { prompt: number; completion: number; total: number }
+  }> {
+    const response = await this.callAnthropicAPI(systemPrompt, userPrompt)
+    const normalized = normalizeJsonResponse(response.content)
+    return {
+      rawResponse: normalized,
+      tokensUsed: {
+        prompt: response.usage.input,
+        completion: response.usage.output,
+        total: response.usage.input + response.usage.output,
+      },
+    }
+  }
+  // ============================================================================
+  // Error Handling
+  // ============================================================================
+  private handleAnthropicHttpError(status: number, body: AnthropicError | Record<string, unknown>): LLMError {
+    const message =
+      'error' in body && typeof body.error === 'object' && body.error
+        ? ((body.error as { message?: string }).message ?? 'Unknown error')
+        : 'Unknown error'
+    // Rate limiting
+    if (status === 429) {
+      return LLMError.rateLimited('anthropic', 60000)
+    }
+    // Authentication errors
+    if (status === 401) {
+      return LLMError.invalidApiKey('anthropic')
+    }
+    // Content filtering (400 with specific message)
+    if (status === 400 && message.toLowerCase().includes('content')) {
+      return new LLMError('Content was filtered by Anthropic', LLMErrorCode.CONTENT_FILTERED, 'anthropic', false)
+    }
+    // Token limit exceeded
+    if (status === 400 && message.toLowerCase().includes('token')) {
+      return new LLMError('Token limit exceeded', LLMErrorCode.TOKEN_LIMIT_EXCEEDED, 'anthropic', false)
+    }
+    // Overloaded (503)
+    if (status === 529 || status === 503) {
+      return LLMError.providerUnavailable('anthropic')
+    }
+    // Server errors (retryable)
+    if (status >= 500) {
+      return LLMError.providerUnavailable('anthropic')
+    }
+    // Default
+    return LLMError.invalidResponse('anthropic', message)
+  }
+  private handleAnthropicError(error: unknown): LLMError {
+    if (error instanceof LLMError) {
+      return error
+    }
+    if (error instanceof Error) {
+      // Network errors
+      if (
+        error.message.includes('fetch') ||
+        error.message.includes('network') ||
+        error.message.includes('ECONNREFUSED')
+      ) {
+        return LLMError.providerUnavailable('anthropic')
+      }
+      return new LLMError(error.message, LLMErrorCode.PROVIDER_UNAVAILABLE, 'anthropic', true)
+    }
+    return new LLMError(String(error), LLMErrorCode.PROVIDER_UNAVAILABLE, 'anthropic', true)
+  }
+}
+// ============================================================================
+// Factory Function
+// ============================================================================
+/**
+ * Create an Anthropic LLM provider
+ */
+export function createAnthropicProvider(config: AnthropicLLMConfig): AnthropicLLMProvider {
+  return new AnthropicLLMProvider(config)
+}