npm - @twelvehart/supermemory-runtime - Versions diffs - 1.0.0-next.0 - Mend

@twelvehart/supermemory-runtime 1.0.0-next.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (156) hide show

package/.env.example +57 -0
package/README.md +374 -0
package/dist/index.js +189 -0
package/dist/mcp/index.js +1132 -0
package/docker-compose.prod.yml +91 -0
package/docker-compose.yml +358 -0
package/drizzle/0000_dapper_the_professor.sql +159 -0
package/drizzle/0001_api_keys.sql +51 -0
package/drizzle/meta/0000_snapshot.json +1532 -0
package/drizzle/meta/_journal.json +13 -0
package/drizzle.config.ts +20 -0
package/package.json +114 -0
package/scripts/add-extraction-job.ts +122 -0
package/scripts/benchmark-pgvector.ts +122 -0
package/scripts/bootstrap.sh +209 -0
package/scripts/check-runtime-pack.ts +111 -0
package/scripts/claude-mcp-config.ts +336 -0
package/scripts/docker-entrypoint.sh +183 -0
package/scripts/doctor.ts +377 -0
package/scripts/init-db.sql +33 -0
package/scripts/install.sh +1110 -0
package/scripts/mcp-setup.ts +271 -0
package/scripts/migrations/001_create_pgvector_extension.sql +31 -0
package/scripts/migrations/002_create_memory_embeddings_table.sql +75 -0
package/scripts/migrations/003_create_hnsw_index.sql +94 -0
package/scripts/migrations/004_create_memory_embeddings_standalone.sql +70 -0
package/scripts/migrations/005_create_chunks_table.sql +95 -0
package/scripts/migrations/006_create_processing_queue.sql +45 -0
package/scripts/migrations/generate_test_data.sql +42 -0
package/scripts/migrations/phase1_comprehensive_test.sql +204 -0
package/scripts/migrations/run_migrations.sh +286 -0
package/scripts/migrations/test_hnsw_index.sql +255 -0
package/scripts/pre-commit-secrets +282 -0
package/scripts/run-extraction-worker.ts +46 -0
package/scripts/run-phase1-tests.sh +291 -0
package/scripts/setup.ts +222 -0
package/scripts/smoke-install.sh +12 -0
package/scripts/test-health-endpoint.sh +328 -0
package/src/api/index.ts +2 -0
package/src/api/middleware/auth.ts +80 -0
package/src/api/middleware/csrf.ts +308 -0
package/src/api/middleware/errorHandler.ts +166 -0
package/src/api/middleware/rateLimit.ts +360 -0
package/src/api/middleware/validation.ts +514 -0
package/src/api/routes/documents.ts +286 -0
package/src/api/routes/profiles.ts +237 -0
package/src/api/routes/search.ts +71 -0
package/src/api/stores/index.ts +58 -0
package/src/config/bootstrap-env.ts +3 -0
package/src/config/env.ts +71 -0
package/src/config/feature-flags.ts +25 -0
package/src/config/index.ts +140 -0
package/src/config/secrets.config.ts +291 -0
package/src/db/client.ts +92 -0
package/src/db/index.ts +73 -0
package/src/db/postgres.ts +72 -0
package/src/db/schema/chunks.schema.ts +31 -0
package/src/db/schema/containers.schema.ts +46 -0
package/src/db/schema/documents.schema.ts +49 -0
package/src/db/schema/embeddings.schema.ts +32 -0
package/src/db/schema/index.ts +11 -0
package/src/db/schema/memories.schema.ts +72 -0
package/src/db/schema/profiles.schema.ts +34 -0
package/src/db/schema/queue.schema.ts +59 -0
package/src/db/schema/relationships.schema.ts +42 -0
package/src/db/schema.ts +223 -0
package/src/db/worker-connection.ts +47 -0
package/src/index.ts +235 -0
package/src/mcp/CLAUDE.md +1 -0
package/src/mcp/index.ts +1380 -0
package/src/mcp/legacyState.ts +22 -0
package/src/mcp/rateLimit.ts +358 -0
package/src/mcp/resources.ts +309 -0
package/src/mcp/results.ts +104 -0
package/src/mcp/tools.ts +401 -0
package/src/queues/config.ts +119 -0
package/src/queues/index.ts +289 -0
package/src/sdk/client.ts +225 -0
package/src/sdk/errors.ts +266 -0
package/src/sdk/http.ts +560 -0
package/src/sdk/index.ts +244 -0
package/src/sdk/resources/base.ts +65 -0
package/src/sdk/resources/connections.ts +204 -0
package/src/sdk/resources/documents.ts +163 -0
package/src/sdk/resources/index.ts +10 -0
package/src/sdk/resources/memories.ts +150 -0
package/src/sdk/resources/search.ts +60 -0
package/src/sdk/resources/settings.ts +36 -0
package/src/sdk/types.ts +674 -0
package/src/services/chunking/index.ts +451 -0
package/src/services/chunking.service.ts +650 -0
package/src/services/csrf.service.ts +252 -0
package/src/services/documents.repository.ts +219 -0
package/src/services/documents.service.ts +191 -0
package/src/services/embedding.service.ts +404 -0
package/src/services/extraction.service.ts +300 -0
package/src/services/extractors/code.extractor.ts +451 -0
package/src/services/extractors/index.ts +9 -0
package/src/services/extractors/markdown.extractor.ts +461 -0
package/src/services/extractors/pdf.extractor.ts +315 -0
package/src/services/extractors/text.extractor.ts +118 -0
package/src/services/extractors/url.extractor.ts +243 -0
package/src/services/index.ts +235 -0
package/src/services/ingestion.service.ts +177 -0
package/src/services/llm/anthropic.ts +400 -0
package/src/services/llm/base.ts +460 -0
package/src/services/llm/contradiction-detector.service.ts +526 -0
package/src/services/llm/heuristics.ts +148 -0
package/src/services/llm/index.ts +309 -0
package/src/services/llm/memory-classifier.service.ts +383 -0
package/src/services/llm/memory-extension-detector.service.ts +523 -0
package/src/services/llm/mock.ts +470 -0
package/src/services/llm/openai.ts +398 -0
package/src/services/llm/prompts.ts +438 -0
package/src/services/llm/types.ts +373 -0
package/src/services/memory.repository.ts +1769 -0
package/src/services/memory.service.ts +1338 -0
package/src/services/memory.types.ts +234 -0
package/src/services/persistence/index.ts +295 -0
package/src/services/pipeline.service.ts +509 -0
package/src/services/profile.repository.ts +436 -0
package/src/services/profile.service.ts +560 -0
package/src/services/profile.types.ts +270 -0
package/src/services/relationships/detector.ts +1128 -0
package/src/services/relationships/index.ts +268 -0
package/src/services/relationships/memory-integration.ts +459 -0
package/src/services/relationships/strategies.ts +132 -0
package/src/services/relationships/types.ts +370 -0
package/src/services/search.service.ts +761 -0
package/src/services/search.types.ts +220 -0
package/src/services/secrets.service.ts +384 -0
package/src/services/vectorstore/base.ts +327 -0
package/src/services/vectorstore/index.ts +444 -0
package/src/services/vectorstore/memory.ts +286 -0
package/src/services/vectorstore/migration.ts +295 -0
package/src/services/vectorstore/mock.ts +403 -0
package/src/services/vectorstore/pgvector.ts +695 -0
package/src/services/vectorstore/types.ts +247 -0
package/src/startup.ts +389 -0
package/src/types/api.types.ts +193 -0
package/src/types/document.types.ts +103 -0
package/src/types/index.ts +241 -0
package/src/types/profile.base.ts +133 -0
package/src/utils/errors.ts +447 -0
package/src/utils/id.ts +15 -0
package/src/utils/index.ts +101 -0
package/src/utils/logger.ts +313 -0
package/src/utils/sanitization.ts +501 -0
package/src/utils/secret-validation.ts +273 -0
package/src/utils/synonyms.ts +188 -0
package/src/utils/validation.ts +581 -0
package/src/workers/chunking.worker.ts +242 -0
package/src/workers/embedding.worker.ts +358 -0
package/src/workers/extraction.worker.ts +346 -0
package/src/workers/indexing.worker.ts +505 -0
package/tsconfig.json +38 -0

package/src/services/llm/openai.ts ADDED Viewed

@@ -0,0 +1,398 @@
+/**
+ * OpenAI LLM Provider
+ *
+ * Implements LLM-based memory extraction using OpenAI's GPT models.
+ * Uses JSON mode for reliable structured output.
+ */
+import OpenAI from 'openai'
+import { getLogger } from '../../utils/logger.js'
+import { BaseLLMProvider, LLMError } from './base.js'
+import type {
+  OpenAILLMConfig,
+  LLMProviderType,
+  ExtractedMemory,
+  DetectedRelationship,
+  ExtractionOptions,
+  RelationshipDetectionOptions,
+} from './types.js'
+import { LLMErrorCode } from './types.js'
+import type { MemoryType } from '../../types/index.js'
+import {
+  MEMORY_EXTRACTION_SYSTEM_PROMPT,
+  MEMORY_EXTRACTION_EXAMPLES,
+  RELATIONSHIP_DETECTION_SYSTEM_PROMPT,
+  RELATIONSHIP_DETECTION_EXAMPLES,
+  generateExtractionPrompt,
+  generateRelationshipPrompt,
+  normalizeJsonResponse,
+  parseExtractionResponse,
+  parseRelationshipResponse,
+} from './prompts.js'
+const logger = getLogger('OpenAIProvider')
+// ============================================================================
+// Default Configuration
+// ============================================================================
+const DEFAULT_OPENAI_CONFIG: Partial<OpenAILLMConfig> = {
+  model: 'gpt-4o-mini',
+  maxTokens: 2000,
+  temperature: 0.1,
+  timeoutMs: 30000,
+  maxRetries: 3,
+  retryDelayMs: 1000,
+}
+// ============================================================================
+// OpenAI Provider Implementation
+// ============================================================================
+export class OpenAILLMProvider extends BaseLLMProvider {
+  readonly type: LLMProviderType = 'openai'
+  private client: OpenAI | null = null
+  private readonly apiKey?: string
+  private readonly model: string
+  private readonly baseUrl?: string
+  private readonly organization?: string
+  constructor(config: OpenAILLMConfig) {
+    super({
+      ...DEFAULT_OPENAI_CONFIG,
+      ...config,
+    })
+    this.apiKey = config.apiKey
+    this.model = config.model ?? DEFAULT_OPENAI_CONFIG.model!
+    this.baseUrl = config.baseUrl
+    this.organization = config.organization
+    if (this.apiKey) {
+      this.client = new OpenAI({
+        apiKey: this.apiKey,
+        baseURL: this.baseUrl,
+        organization: this.organization,
+        timeout: this.config.timeoutMs,
+        maxRetries: 0, // We handle retries ourselves
+      })
+    }
+    logger.debug('OpenAI provider initialized', {
+      model: this.model,
+      hasApiKey: !!this.apiKey,
+    })
+  }
+  // ============================================================================
+  // Availability Check
+  // ============================================================================
+  isAvailable(): boolean {
+    return !!this.client && !!this.apiKey
+  }
+  // ============================================================================
+  // Memory Extraction
+  // ============================================================================
+  protected async doExtractMemories(
+    text: string,
+    options: ExtractionOptions
+  ): Promise<{
+    memories: ExtractedMemory[]
+    rawResponse?: string
+    tokensUsed?: { prompt: number; completion: number; total: number }
+  }> {
+    if (!this.client) {
+      throw LLMError.providerUnavailable('openai')
+    }
+    const userPrompt = generateExtractionPrompt(text, options)
+    try {
+      const response = await this.client.chat.completions.create({
+        model: this.model,
+        messages: [
+          {
+            role: 'system',
+            content: `${MEMORY_EXTRACTION_SYSTEM_PROMPT}\n\n${MEMORY_EXTRACTION_EXAMPLES}`,
+          },
+          {
+            role: 'user',
+            content: userPrompt,
+          },
+        ],
+        response_format: { type: 'json_object' },
+        temperature: this.config.temperature,
+        max_tokens: this.config.maxTokens,
+      })
+      const rawResponse = response.choices[0]?.message?.content
+      if (!rawResponse) {
+        throw LLMError.invalidResponse('openai', 'Empty response from model')
+      }
+      const parsed = parseExtractionResponse(rawResponse)
+      // Filter by confidence if specified
+      let memories: ExtractedMemory[] = parsed.memories.map((m) => ({
+        content: m.content,
+        type: m.type,
+        confidence: m.confidence,
+        entities: m.entities.map((e) => ({
+          name: e.name,
+          type: e.type as 'person' | 'place' | 'organization' | 'date' | 'concept' | 'other',
+          mentions: 1,
+        })),
+        keywords: m.keywords,
+      }))
+      if (options.minConfidence) {
+        memories = memories.filter((m) => m.confidence >= options.minConfidence!)
+      }
+      if (options.maxMemories) {
+        memories = memories.slice(0, options.maxMemories)
+      }
+      return {
+        memories,
+        rawResponse,
+        tokensUsed: response.usage
+          ? {
+              prompt: response.usage.prompt_tokens,
+              completion: response.usage.completion_tokens,
+              total: response.usage.total_tokens,
+            }
+          : undefined,
+      }
+    } catch (error) {
+      throw this.handleOpenAIError(error)
+    }
+  }
+  // ============================================================================
+  // Relationship Detection
+  // ============================================================================
+  protected async doDetectRelationships(
+    newMemory: { id: string; content: string; type: MemoryType },
+    existingMemories: Array<{ id: string; content: string; type: MemoryType }>,
+    options: RelationshipDetectionOptions
+  ): Promise<{
+    relationships: DetectedRelationship[]
+    supersededMemoryIds: string[]
+  }> {
+    if (!this.client) {
+      throw LLMError.providerUnavailable('openai')
+    }
+    // If no existing memories, return empty
+    if (existingMemories.length === 0) {
+      return { relationships: [], supersededMemoryIds: [] }
+    }
+    const userPrompt = generateRelationshipPrompt(newMemory, existingMemories, options)
+    try {
+      const response = await this.client.chat.completions.create({
+        model: this.model,
+        messages: [
+          {
+            role: 'system',
+            content: `${RELATIONSHIP_DETECTION_SYSTEM_PROMPT}\n\n${RELATIONSHIP_DETECTION_EXAMPLES}`,
+          },
+          {
+            role: 'user',
+            content: userPrompt,
+          },
+        ],
+        response_format: { type: 'json_object' },
+        temperature: this.config.temperature,
+        max_tokens: this.config.maxTokens,
+      })
+      const rawResponse = response.choices[0]?.message?.content
+      if (!rawResponse) {
+        throw LLMError.invalidResponse('openai', 'Empty response from model')
+      }
+      const parsed = parseRelationshipResponse(rawResponse)
+      // Filter and validate relationships
+      let relationships: DetectedRelationship[] = parsed.relationships.map((r) => ({
+        sourceMemoryId: r.sourceMemoryId,
+        targetMemoryId: r.targetMemoryId,
+        type: r.type as DetectedRelationship['type'],
+        confidence: r.confidence,
+        reason: r.reason,
+      }))
+      if (options.minConfidence) {
+        relationships = relationships.filter((r) => r.confidence >= options.minConfidence!)
+      }
+      if (options.maxRelationships) {
+        relationships = relationships.slice(0, options.maxRelationships)
+      }
+      return {
+        relationships,
+        supersededMemoryIds: parsed.supersededMemoryIds,
+      }
+    } catch (error) {
+      throw this.handleOpenAIError(error)
+    }
+  }
+  // ============================================================================
+  // Generic JSON Task
+  // ============================================================================
+  protected async doGenerateJson(
+    systemPrompt: string,
+    userPrompt: string
+  ): Promise<{
+    rawResponse: string
+    tokensUsed?: { prompt: number; completion: number; total: number }
+  }> {
+    if (!this.client) {
+      throw LLMError.providerUnavailable('openai')
+    }
+    try {
+      const response = await this.client.chat.completions.create({
+        model: this.model,
+        messages: [
+          { role: 'system', content: systemPrompt },
+          { role: 'user', content: userPrompt },
+        ],
+        response_format: { type: 'json_object' },
+        temperature: this.config.temperature,
+        max_tokens: this.config.maxTokens,
+      })
+      const rawResponse = response.choices[0]?.message?.content
+      if (!rawResponse) {
+        throw LLMError.invalidResponse('openai', 'Empty response from model')
+      }
+      const normalized = normalizeJsonResponse(rawResponse)
+      return {
+        rawResponse: normalized,
+        tokensUsed: response.usage
+          ? {
+              prompt: response.usage.prompt_tokens,
+              completion: response.usage.completion_tokens,
+              total: response.usage.total_tokens,
+            }
+          : undefined,
+      }
+    } catch (error) {
+      throw this.handleOpenAIError(error)
+    }
+  }
+  // ============================================================================
+  // Error Handling
+  // ============================================================================
+  private handleOpenAIError(error: unknown): LLMError {
+    if (error instanceof LLMError) {
+      return error
+    }
+    // Check for OpenAI API errors by checking error structure
+    if (this.isOpenAIApiError(error)) {
+      const status = error.status
+      const message = error.message
+      // Rate limiting
+      if (status === 429) {
+        const retryAfter = this.parseRetryAfter(error)
+        return LLMError.rateLimited('openai', retryAfter)
+      }
+      // Authentication errors
+      if (status === 401) {
+        return LLMError.invalidApiKey('openai')
+      }
+      // Content filtering
+      if (status === 400 && message.includes('content_filter')) {
+        return new LLMError('Content was filtered by OpenAI', LLMErrorCode.CONTENT_FILTERED, 'openai', false)
+      }
+      // Token limit
+      if (status === 400 && message.includes('maximum context length')) {
+        return new LLMError('Token limit exceeded', LLMErrorCode.TOKEN_LIMIT_EXCEEDED, 'openai', false)
+      }
+      // Server errors (retryable)
+      if (status && status >= 500) {
+        return LLMError.providerUnavailable('openai')
+      }
+      // Default to invalid response
+      return LLMError.invalidResponse('openai', message)
+    }
+    // Network or timeout errors
+    if (error instanceof Error) {
+      if (error.message.includes('timeout')) {
+        return LLMError.timeout('openai')
+      }
+      return new LLMError(error.message, LLMErrorCode.PROVIDER_UNAVAILABLE, 'openai', true)
+    }
+    return new LLMError(String(error), LLMErrorCode.PROVIDER_UNAVAILABLE, 'openai', true)
+  }
+  /**
+   * Type guard for OpenAI API errors
+   */
+  private isOpenAIApiError(
+    error: unknown
+  ): error is { status: number; message: string; headers?: Record<string, string> } {
+    return (
+      error !== null &&
+      typeof error === 'object' &&
+      'status' in error &&
+      typeof (error as Record<string, unknown>).status === 'number' &&
+      'message' in error &&
+      typeof (error as Record<string, unknown>).message === 'string'
+    )
+  }
+  private parseRetryAfter(error: {
+    status: number
+    message: string
+    headers?: Record<string, string>
+  }): number | undefined {
+    // Try to parse retry-after header or message
+    if (error.headers?.['retry-after']) {
+      const seconds = parseInt(error.headers['retry-after'], 10)
+      if (!Number.isNaN(seconds)) {
+        return seconds * 1000
+      }
+    }
+    // Default retry delay for rate limits
+    return 60000 // 1 minute
+  }
+}
+// ============================================================================
+// Factory Function
+// ============================================================================
+/**
+ * Create an OpenAI LLM provider
+ */
+export function createOpenAIProvider(config: OpenAILLMConfig): OpenAILLMProvider {
+  return new OpenAILLMProvider(config)
+}