npm - @delofarag/ai-utils - Versions diffs - 1.4.3 → 1.5.0 - Mend

@delofarag/ai-utils 1.4.3 → 1.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (122) hide show

package/README.md +354 -216
package/dist/heart/agent.d.ts +1 -1
package/dist/heart/agent.d.ts.map +1 -1
package/dist/heart/agent.js +3 -8
package/dist/heart/agent.js.map +1 -1
package/dist/heart/chain.d.ts +1 -1
package/dist/heart/chain.d.ts.map +1 -1
package/dist/heart/chain.js +4 -4
package/dist/heart/chain.js.map +1 -1
package/dist/heart/chatbot.d.ts +1 -1
package/dist/heart/memorychain.d.ts +2 -2
package/dist/heart/memorychain.js +6 -6
package/dist/heart/memorychain.js.map +1 -1
package/dist/heart/tools/zodios/ZodiosToolRegistry.d.ts +1 -1
package/dist/heart/tools/zodios/ZodiosToolRegistry.d.ts.map +1 -1
package/dist/helpers/chatbot.d.ts +33 -0
package/dist/helpers/chatbot.d.ts.map +1 -0
package/dist/helpers/chatbot.js +72 -0
package/dist/helpers/chatbot.js.map +1 -0
package/dist/helpers/helpers.d.ts +25 -0
package/dist/helpers/helpers.d.ts.map +1 -0
package/dist/helpers/helpers.js +43 -0
package/dist/helpers/helpers.js.map +1 -0
package/dist/helpers/llms.d.ts +92 -0
package/dist/helpers/llms.d.ts.map +1 -0
package/dist/helpers/llms.js +49 -0
package/dist/helpers/llms.js.map +1 -0
package/dist/helpers/memory.d.ts +91 -0
package/dist/helpers/memory.d.ts.map +1 -0
package/dist/helpers/memory.js +351 -0
package/dist/helpers/memory.js.map +1 -0
package/dist/helpers/rag.d.ts +42 -0
package/dist/helpers/rag.d.ts.map +1 -0
package/dist/helpers/rag.js +66 -0
package/dist/helpers/rag.js.map +1 -0
package/dist/helpers.d.ts +3 -3
package/dist/index.d.ts +10 -9
package/dist/index.d.ts.map +1 -1
package/dist/index.js +10 -9
package/dist/index.js.map +1 -1
package/dist/magic-funcs/answerers/ask.d.ts +18 -2
package/dist/magic-funcs/answerers/ask.d.ts.map +1 -1
package/dist/magic-funcs/answerers/ask.js +20 -9
package/dist/magic-funcs/answerers/ask.js.map +1 -1
package/dist/magic-funcs/answerers/websearch.d.ts +15 -0
package/dist/magic-funcs/answerers/websearch.d.ts.map +1 -1
package/dist/magic-funcs/answerers/websearch.js +15 -0
package/dist/magic-funcs/answerers/websearch.js.map +1 -1
package/dist/magic-funcs/evaluators/classify.d.ts +20 -1
package/dist/magic-funcs/evaluators/classify.d.ts.map +1 -1
package/dist/magic-funcs/evaluators/classify.js +22 -3
package/dist/magic-funcs/evaluators/classify.js.map +1 -1
package/dist/magic-funcs/evaluators/decide.d.ts +18 -0
package/dist/magic-funcs/evaluators/decide.d.ts.map +1 -1
package/dist/magic-funcs/evaluators/decide.js +21 -3
package/dist/magic-funcs/evaluators/decide.js.map +1 -1
package/dist/magic-funcs/optimizers/promptify.d.ts +18 -0
package/dist/magic-funcs/optimizers/promptify.d.ts.map +1 -1
package/dist/magic-funcs/optimizers/promptify.js +21 -3
package/dist/magic-funcs/optimizers/promptify.js.map +1 -1
package/dist/magic-funcs/optimizers/ragify.d.ts +16 -0
package/dist/magic-funcs/optimizers/ragify.d.ts.map +1 -1
package/dist/magic-funcs/optimizers/ragify.js +19 -3
package/dist/magic-funcs/optimizers/ragify.js.map +1 -1
package/dist/magic-funcs/parsers/extract.d.ts +23 -0
package/dist/magic-funcs/parsers/extract.d.ts.map +1 -1
package/dist/magic-funcs/parsers/extract.js +26 -3
package/dist/magic-funcs/parsers/extract.js.map +1 -1
package/dist/magic-funcs/parsers/rewrite.d.ts +19 -0
package/dist/magic-funcs/parsers/rewrite.d.ts.map +1 -1
package/dist/magic-funcs/parsers/rewrite.js +22 -2
package/dist/magic-funcs/parsers/rewrite.js.map +1 -1
package/dist/magic-funcs/parsers/structure.d.ts +22 -0
package/dist/magic-funcs/parsers/structure.d.ts.map +1 -1
package/dist/magic-funcs/parsers/structure.js +27 -4
package/dist/magic-funcs/parsers/structure.js.map +1 -1
package/dist/magic-funcs/parsers/summarize.d.ts +20 -0
package/dist/magic-funcs/parsers/summarize.d.ts.map +1 -1
package/dist/magic-funcs/parsers/summarize.js +23 -3
package/dist/magic-funcs/parsers/summarize.js.map +1 -1
package/dist/memory.d.ts +1 -1
package/dist/modalities/image-gen/generateImages.d.ts +56 -0
package/dist/modalities/image-gen/generateImages.d.ts.map +1 -0
package/dist/modalities/image-gen/generateImages.js +66 -0
package/dist/modalities/image-gen/generateImages.js.map +1 -0
package/dist/modalities/image-gen/helpers.d.ts +15 -0
package/dist/modalities/image-gen/helpers.d.ts.map +1 -0
package/dist/modalities/image-gen/helpers.js +17 -0
package/dist/modalities/image-gen/helpers.js.map +1 -0
package/dist/modalities/openrouter.d.ts +11 -0
package/dist/modalities/openrouter.d.ts.map +1 -0
package/dist/modalities/openrouter.js +39 -0
package/dist/modalities/openrouter.js.map +1 -0
package/dist/modalities/speech/VoiceEngine.d.ts +3 -0
package/dist/modalities/speech/VoiceEngine.d.ts.map +1 -0
package/dist/modalities/speech/VoiceEngine.js +3 -0
package/dist/modalities/speech/VoiceEngine.js.map +1 -0
package/dist/modalities/speech/stt/helpers.d.ts +3 -0
package/dist/modalities/speech/stt/helpers.d.ts.map +1 -0
package/dist/modalities/speech/stt/helpers.js +28 -0
package/dist/modalities/speech/stt/helpers.js.map +1 -0
package/dist/modalities/speech/stt/stt.d.ts +113 -0
package/dist/modalities/speech/stt/stt.d.ts.map +1 -0
package/dist/modalities/speech/stt/stt.js +177 -0
package/dist/modalities/speech/stt/stt.js.map +1 -0
package/dist/modalities/speech/tts/helpers.d.ts +12 -0
package/dist/modalities/speech/tts/helpers.d.ts.map +1 -0
package/dist/modalities/speech/tts/helpers.js +10 -0
package/dist/modalities/speech/tts/helpers.js.map +1 -0
package/dist/modalities/speech/tts/tts.d.ts +115 -0
package/dist/modalities/speech/tts/tts.d.ts.map +1 -0
package/dist/modalities/speech/tts/tts.js +142 -0
package/dist/modalities/speech/tts/tts.js.map +1 -0
package/dist/modalities/vision/helpers.d.ts +3 -0
package/dist/modalities/vision/helpers.d.ts.map +1 -0
package/dist/modalities/vision/helpers.js +7 -0
package/dist/modalities/vision/helpers.js.map +1 -0
package/dist/modalities/vision/vision.d.ts +55 -0
package/dist/modalities/vision/vision.d.ts.map +1 -0
package/dist/modalities/vision/vision.js +71 -0
package/dist/modalities/vision/vision.js.map +1 -0
package/package.json +7 -7

package/README.md CHANGED Viewed

@@ -1,369 +1,507 @@
 # @delofarag/ai-utils
-Ein Bauskasten für LLM-basierte Anwendungen: Chains, Agents, Memory, RAG, Magic-Funcs und mehr.
+Ein praktisches Utility-Package für LLM-Apps mit LangChain:
+- `Chain`, `MemoryChain`, `Agent`
+- RAG-Helper (FAISS, Supabase, In-Memory)
+- Tooling (`ToolRegistry`, `createRAGTool`, `tavilySearchTool`)
+- Magic-Funcs (Parser, Evaluator, Optimizer, Answerer)
+- Modalities (STT, TTS, Vision, Image Generation)
 ---
-## ⚠️ Disclaimer: Default-LLM & getLLM()
+## Standard-Default (wichtig)
-(btw. nutz zod/v3, neuere versionen sind buggy mit langchain)
+Im Package gilt als Standard-LLM-Default für die allgemeine Nutzung:
-**Für alle LLM-gebundenen Utils** (Chain, MemoryChain, Agent, Chatbot, magic-funcs) gilt:
+- **Provider:** `openrouter`
+- **Model:** `openai/gpt-5.4-mini`
-- **Default-Modell:** `llama-3.3-70b-versatile` von **ChatGroq**
-- **API-Key:** `process.env.CHATGROQ_API_KEY`
+Wenn du nichts explizit setzt, orientiere dich an diesem Default in deinen Aufrufen.
-**Wenn du `CHATGROQ_API_KEY` in deiner `.env` setzt und mit dem Modell zufrieden bist, musst du kein LLM übergeben** – alles funktioniert out-of-the-box.
+Für modality-spezifische Flows (`stt`, `tts`, `vision`, `image-gen`) wird zusätzlich mit `type` gearbeitet, damit passende Modelle gewählt werden koennen.
-Du kannst jederzeit ein eigenes LLM übergeben (z.B. anderes Modell, anderer Provider). Optimal dafür: die **`getLLM()`** Funktion aus `helpers.ts`. Sie ist eine Abstraktionsschicht für:
+---
-| Typ | Beispiel |
-|-----|----------|
-| **Groq** | `getLLM({ type: "groq", apikey: process.env.CHATGROQ_API_KEY!, model: "llama-3.3-70b-versatile" })` |
-| **OpenRouter** | `getLLM({ type: "openrouter", apikey: process.env.OPENROUTER_API_KEY!, model: "openai/gpt-4o-mini" })` |
-| **Ollama (lokal)** | `getLLM({ type: "local", model: "llama3.2:3b" })` |
+## Installation
+```bash
+npm i @delofarag/ai-utils
+```
 ---
-## Die 4 Hauptklassen
+## Environment Variables
+Empfohlen in `.env`:
-### 1. Chain
+```env
+OPENROUTER_API_KEY=...
+CHATGROQ_API_KEY=...
+TAVILY_API_KEY=...
+NEXT_PUBLIC_SUPABASE_URL=...
+NEXT_PUBLIC_SUPABASE_ANON_KEY=...
+SUPABASE_SERVICE_ROLE_KEY=...
+```
+### Welche Variable wofuer?
-**Was:** Stateless LLM-Chain mit strukturiertem Output (Zod-Schema) und optionalem RAG. Für `output` (Zod v3) kannst du **z.object()** oder **z.record()** verwenden.
+- `OPENROUTER_API_KEY`: OpenRouter-Modelle und Modalities
+- `CHATGROQ_API_KEY`: wenn du `provider: "chatgroq"` nutzt
+- `TAVILY_API_KEY`: `websearch()` / `tavilySearchTool`
+- Supabase-Variablen: fuer `createSupabaseVectoreStore()` und `getSupabaseVectorStore()`
-**Wann:** Einmalige Abfragen ohne Konversationsgedächtnis. Ideal für formularähnliche Eingabe → strukturierte Ausgabe.
+---
-**Initialisierung:**
+## Schnellstart: `getLLM()`
 ```ts
-import { Chain, DEFAULT_OUTPUT_SCHEMA } from "@delofarag/ai-utils"
+import { getLLM } from "@delofarag/ai-utils"
+const llm = getLLM({ provider: "openrouter", model: "openai/gpt-5.4-mini" })
+```
+Beispiele:
+```ts
+const llmOpenRouter = getLLM({ provider: "openrouter", model: "openai/gpt-5.4-mini" })
+const llmGroq = getLLM({ provider: "chatgroq", model: "llama-3.3-70b-versatile" })
+const llmLocal = getLLM({ provider: "local", model: "llama3.2:3b" })
+```
+Modality-spezifisch:
+```ts
+getLLM({ provider: "openrouter", type: "stt" })
+getLLM({ provider: "openrouter", type: "tts" })
+getLLM({ provider: "openrouter", type: "vision" })
+getLLM({ provider: "openrouter", type: "image-gen" })
+```
+---
+## Core Classes
+## 1) `Chain`
+Stateless LLM-Chain fuer strukturierte Ergebnisse.
+### Besseres Praxisbeispiel (custom output schema)
+```ts
+import { Chain, getLLM } from "@delofarag/ai-utils"
 import { z } from "zod/v3"
-const output = z.object({
-    output: z.string().describe("Deine Antwort"),
-    score: z.number().optional()
+const productBriefSchema = z.object({
+    title: z.string().describe("Kurzer Produktname"),
+    targetAudience: z.string().describe("Wer soll das Produkt nutzen?"),
+    keyBenefits: z.array(z.string()).describe("Top Vorteile"),
+    pricePositioning: z.enum(["budget", "mid", "premium"])
 })
-// alternativ: z.record(z.string()) für beliebige Key-Value-Struktur
 const chain = new Chain({
-    prompt: "Du bist ein hilfreicher Assistent.",
-    // llm optional – Default: Groq
-    output
+    llm: getLLM({ provider: "openrouter", model: "openai/gpt-5.4-mini" }),
+    prompt: "Du bist ein Product-Marketing-Assistent.",
+    output: productBriefSchema
 })
-const result = await chain.invoke({ input: "Was ist die Hauptstadt von Frankreich?" })
-// result: { output: "Paris", score?: number }
+const result = await chain.invoke({
+    product: "AI-Notizapp fuer Teams",
+    market: "DACH SaaS"
+})
 ```
-**RAG:** Mit `chain.setContext(vectorStore)` und `chain.addContext(["Text 1", "Text 2"])` wird automatisch Retrieval vor dem LLM-Call eingebaut.
+### RAG mit `Chain`
+```ts
+import { Chain, createFaissStore } from "@delofarag/ai-utils"
+import { z } from "zod/v3"
+const vectorStore = await createFaissStore(["Dokument A", "Dokument B"])
-**Warum so:** Chain ist die kleinste Einheit – nur Prompt + LLM + Output (Zod-Schema für .invoke()). Kein Memory, keine Tools. Einfach zu testen und zu komponieren.
+const chain = new Chain({
+    prompt: "Beantworte Fragen nur mit Kontext.",
+    output: z.object({ output: z.string() }),
+    vectorStore
+})
+await chain.addContext(["Dokument C"])
+const answer = await chain.invoke({ question: "Was steht in Dokument C?" })
+```
 ---
-### 2. MemoryChain
+## 2) `MemoryChain`
-**Was:** Chain mit Konversationsgedächtnis. Speichert User/AI-Messages pro `thread_id`.
+`Chain` + Conversation Memory ueber `thread_id`.
-**Wann:** Chat-ähnliche Flows, bei denen der Kontext der vorherigen Nachrichten wichtig ist.
+### Basis
-**Initialisierung:**
+```ts
+import { MemoryChain, getLLM } from "@delofarag/ai-utils"
+const memoryChain = new MemoryChain({
+    llm: getLLM({ provider: "openrouter", model: "openai/gpt-5.4-mini" }),
+    prompt: "Du bist ein hilfreicher Assistent."
+})
+await memoryChain.invoke({ thread_id: "u1", input: "Ich heisse Max." })
+const r2 = await memoryChain.invoke({ thread_id: "u1", input: "Wie heisse ich?" })
+```
+### RAG mit `MemoryChain`
 ```ts
-import { MemoryChain, SmartCheckpointSaver, MemorySaver, getLLM } from "@delofarag/ai-utils"
+import { MemoryChain, createFaissStore } from "@delofarag/ai-utils"
+import { z } from "zod/v3"
-const llm = getLLM({ type: "groq", apikey: process.env.CHATGROQ_API_KEY! })
+const vectorStore = await createFaissStore(["Policy A", "Policy B"])
 const memoryChain = new MemoryChain({
-    memory: new SmartCheckpointSaver(new MemorySaver(), { llm }),
-    prompt: "Du bist ein hilfreicher Assistent.",
-    llm
+    prompt: "Nutze Kontext und Gespraechshistorie.",
+    vectorStore,
+    output: z.object({ output: z.string() })
 })
-const result = await memoryChain.invoke({
-    thread_id: "user-123",
-    input: "Ich heiße Max."
-})
-const result2 = await memoryChain.invoke({
-    thread_id: "user-123",
-    input: "Wie heiße ich?"
+const response = await memoryChain.invoke({
+    thread_id: "support-77",
+    question: "Welche Regel steht in Policy B?"
 })
-// result2.output ≈ "Du heißt Max."
 ```
-**Alternativ:** Du kannst eine bestehende `Chain` übergeben: `new MemoryChain({ chain: myChain, memory })`.
+---
-**Warum so:** MemoryChain kapselt nur die Memory-Logik – History laden, an den Prompt anhängen, Response speichern. Die eigentliche LLM-Logik bleibt in der Chain.
+## 3) `Agent`
----
+Tool-using Agent auf Basis von `createReactAgent`.
-### 3. Agent
+### Basis
-**Was:** LLM mit Tools (z.B. Web-Suche, API-Calls, RAG). Nutzt LangGraphs `createReactAgent` unter der Haube.
+```ts
+import { Agent, ToolRegistry, getLLM } from "@delofarag/ai-utils"
+import { z } from "zod/v3"
-**Wann:** Wenn das LLM externe Aktionen ausführen soll (Suche, Rechner, Datenbank, etc.).
+const tools = new ToolRegistry([
+    {
+        name: "sum",
+        description: "Addiert zwei Zahlen",
+        schema: z.object({ a: z.number(), b: z.number() }),
+        func: ({ a, b }) => a + b
+    }
+]).allTools
-**Initialisierung:**
+const agent = new Agent({
+    llm: getLLM({ provider: "openrouter", model: "openai/gpt-5.4-mini" }),
+    prompt: "Du darfst Tools nutzen wenn noetig.",
+    tools
+})
+const result = await agent.invoke({ input: "Was ist 8 + 13?" })
+```
+### RAG mit `Agent` (als Tool)
 ```ts
-import { Agent, ToolRegistry, createRAGTool, createFaissStore, tavilySearchTool, getLLM } from "@delofarag/ai-utils"
+import { Agent, ToolRegistry, createRAGTool, createFaissStore } from "@delofarag/ai-utils"
-const vectorStore = await createFaissStore(["Dokumenteninhalt..."])
+const vectorStore = await createFaissStore(["Release Notes 2026-04", "Known Issues"])
 const ragTool = createRAGTool({
     vectorStore,
-    name: "search_context",
-    description: "Durchsucht den Kontext nach relevanten Informationen"
+    name: "search_docs",
+    description: "Sucht relevante Produktdokumente"
 })
 const registry = new ToolRegistry([
-    { name: "calculator", description: "...", schema: z.object({ a: z.number(), b: z.number() }), func: ({ a, b }) => a + b },
-    tavilySearchTool,
-    ragTool
+    {
+        name: "search_docs",
+        description: "Sucht relevante Produktdokumente",
+        schema: ragTool.schema as any,
+        func: ragTool.func as any
+    }
 ])
 const agent = new Agent({
-    prompt: "Du bist ein hilfreicher Assistent mit Zugang zu Tools.",
-    tools: registry.allTools,
-    llm: getLLM({ type: "groq" }),
-    memory: new SmartCheckpointSaver(new MemorySaver(), { llm }) // optional
+    prompt: "Nutze search_docs fuer faktenbasierte Antworten.",
+    tools: [...registry.allTools, ragTool]
 })
-const result = await agent.invoke({
-    thread_id: "session-1",  // nötig wenn memory gesetzt
-    input: "Was steht heute in den Nachrichten zu KI?"
-})
-agent.addTool(weiteresTool)  // Tools nachträglich hinzufügen
 ```
-**RAG:** RAG ist ein normales Tool – nutze `createRAGTool({ vectorStore, name, description })` und füge es zu `tools` hinzu oder via `agent.addTool()`.
+---
-**Warum so:** Der Agent entscheidet selbst, wann er Tools nutzt. RAG wird wie jedes andere Tool behandelt (kein setContext/addContext mehr).
+## Tool Registry (eigene Section)
----
+`ToolRegistry` konvertiert einfache Tool-Definitionen zu `DynamicStructuredTool` und bietet:
-### 4. Chatbot
+- `getTool(name)`
+- `getTools(...names)`
+- `allTools`
-**Was:** High-Level Wrapper – je nach Konfiguration entweder ein `MemoryChain` oder ein `Agent`. Discriminated Union: `tools` → Agent, `vectorStore` → MemoryChain.
+```ts
+import { ToolRegistry } from "@delofarag/ai-utils"
+import { z } from "zod/v3"
+const registry = new ToolRegistry([
+    {
+        name: "get_weather",
+        description: "Liefert Wetter fuer eine Stadt",
+        schema: z.object({ city: z.string() }),
+        func: async ({ city }) => `${city}: sonnig`
+    },
+    {
+        name: "get_time",
+        description: "Liefert aktuelle Zeit",
+        schema: z.object({}),
+        func: async () => new Date().toISOString()
+    }
+])
-**Wann:** Schnell einen chatbasierten Assistenten bauen, mit oder ohne Tools.
+const weatherTool = registry.getTool("get_weather")
+const tools = registry.allTools
+```
-**Initialisierung:**
+### Tavily Tooling
 ```ts
-import { Chatbot, createRAGTool, createFaissStore, tavilySearchTool, getLLM } from "@delofarag/ai-utils"
+import { tavilySearchTool, TavilySearch } from "@delofarag/ai-utils"
-// Ohne Tools, mit RAG → MemoryChain + vectorStore
-const vectorStore = await createFaissStore(["Kontextdaten..."])
-const simpleChatbot = new Chatbot({
-    llm: getLLM({ type: "groq" }),
-    prompt: "Du bist ein freundlicher Assistent.",
-    vectorStore
+const tavily = new TavilySearch({
+    tavilyApiKey: process.env.TAVILY_API_KEY,
+    maxResults: 5,
+    topic: "general",
+    includeAnswer: false
 })
-// Mit Tools → Agent (RAG als Tool möglich)
-const toolChatbot = new Chatbot({
-    llm: getLLM({ type: "groq" }),
-    tools: [
-        tavilySearchTool,
-        createRAGTool({ vectorStore, name: "search", description: "Durchsucht den Kontext" })
-    ],
-    prompt: "Du bist ein Assistent mit Webzugang."
-})
+const response = await tavily.invoke({ query: "latest AI regulation EU" })
+```
+---
+## Memory Section (ausfuehrlich)
-// Streaming-Chat
-for await (const chunk of simpleChatbot.chat({ input: "Hallo!", thread_id: "user-1" })) {
-    process.stdout.write(chunk)
-}
+### `MemorySaver` (in-memory, schnell fuer local/dev)
-// Interaktive Session (CLI)
-await simpleChatbot.session({ breakword: "exit", id: "session-1" })
+```ts
+import { MemorySaver, SmartCheckpointSaver, getLLM } from "@delofarag/ai-utils"
+const memory = new SmartCheckpointSaver(new MemorySaver(), {
+    llm: getLLM({ provider: "openrouter", model: "openai/gpt-5.4-mini" }),
+    messagesBeforeSummary: 12,
+    maxSummaries: 7
+})
 ```
-**Warum so:** Ein Einstiegspunkt für „einfach nur chatten“. Weniger Boilerplate als Chain/MemoryChain/Agent direkt zu bauen.
+### `SmartCheckpointSaver`
----
+Was es macht:
+- fasst alte Chatverlaeufe zusammen
+- reduziert Token-Kosten
+- erhaelt wichtige Fakten ueber mehrere Sessions
+Wichtige Optionen:
-## Tool-Registrys
+- `messagesBeforeSummary` (default `12`)
+- `maxSummaries` (default `7`)
+- `llm` (default OpenRouter `gpt-5.4-mini`)
+- `debug`
-### ToolRegistry (BasicToolRegistry) – empfohlen
+### `SupabaseCheckpointSaver`
-Registriert Tools mit `name`, `description`, `schema`, `func`. Perfekt für manuell definierte Tools.
+Persistiert Checkpoints in Supabase.
 ```ts
-import { ToolRegistry } from "@delofarag/ai-utils"
-import { z } from "zod/v3"
+import { SupabaseCheckpointSaver, type SupabaseCheckpointRow } from "@delofarag/ai-utils"
+import { SupabaseTable } from "@delofarag/supabase-utils"
-const registry = new ToolRegistry([
-    {
-        name: "greet",
-        description: "Begrüßt eine Person",
-        schema: z.object({ name: z.string() }),
-        func: ({ name }) => `Hallo, ${name}!`
-    }
-])
+const checkpointsTable = new SupabaseTable<SupabaseCheckpointRow>({
+    // ... deine SupabaseTable Konfiguration
+})
+const saver = new SupabaseCheckpointSaver(checkpointsTable)
+```
+Typischer Einsatz:
+```ts
+import { MemoryChain } from "@delofarag/ai-utils"
-const tool = registry.getTool("greet")
-const allTools = registry.allTools
+const memoryChain = new MemoryChain({
+    prompt: "Du bist ein Support Assistant.",
+    memory: saver
+})
 ```
-### ZodiosToolRegistry – noch experimentell
+---
+## RAG Utilities (Detail)
-Wandelt Zodios-API-Endpoints automatisch in Tools um. **Funktioniert derzeit nicht zuverlässig** – nur testen, nicht für Produktion.
+### Vector Stores
-### tavilySearchTool & TAVILY_API_KEY
+- `createRAMVectoreStore(data)`
+- `createSupabaseVectoreStore(data, config?)`
+- `getSupabaseVectorStore(config?)`
+- `createFaissStore(data, config?)`
+- `loadFaissStore({ path })`
+- `turn_to_docs(data)`
-Das `tavilySearchTool` ist ein vorgefertigtes Tool für Web-Suche via Tavily. Nutzung:
+### RAG Chain
-- **API-Key:** `process.env.TAVILY_API_KEY` (in `.env` setzen)
-- **Import:** `tavilySearchTool` aus `@delofarag/ai-utils`
-- **Beispiel:** Siehe Agent-Beispiel oben
+- `createRAGChain({ vectorStore, llm, prompt?, num_of_results_from_vdb? })`
+### RAG Tool
+- `createRAGTool({ vectorStore, name, description })`
+```ts
+import { createRAGTool, createFaissStore } from "@delofarag/ai-utils"
-Alternativ: `TavilySearch`-Klasse für direkten Aufruf (z.B. in `websearch()`).
+const vectorStore = await createFaissStore(["FAQ 1", "FAQ 2"])
+const ragTool = createRAGTool({
+    vectorStore,
+    name: "search_faq",
+    description: "Sucht in FAQ-Dokumenten"
+})
+```
 ---
 ## Magic-Funcs
-Kleine, wiederverwendbare LLM-Funktionen. **Struktur:** Immer `{ llm?, ...params }` – `llm` optional, sonst Default (Groq).
 ### Answerers
-- **ask(question)** – Einfache Frage → Textantwort
-- **websearch(query)** – Sucht im Web (Tavily), braucht `TAVILY_API_KEY`
+- `ask({ question, llm? })`
+- `websearch(query)` (braucht `TAVILY_API_KEY`)
 ### Evaluators
-- **classify({ data, classes, context? })** – Ordnet Input einer von mehreren Klassen zu
-- **decide({ material, kriteria_to_decide })** – Ja/Nein/Unclear plus Begründung
+- `classify({ data, classes, context?, llm? })`
+- `decide({ material, kriteria_to_decide, llm? })`
 ### Parsers
-- **extract({ data, schema, goal? })** – Extrahiert strukturierte Daten gemäß Zod-Schema
-- **structure({ data, into, retries? })** – Formatiert beliebigen Input in ein Zod-Schema
-- **rewrite({ data, instruction })** – Transformiert Text nach Anweisung
-- **summarize({ data, fokuss?, maxWords? })** – Fasst zusammen
+- `extract({ data, schema, goal?, llm? })`
+- `structure({ data, into, retries?, llm? })`
+- `rewrite({ data, instruction, llm? })`
+- `summarize({ data, fokuss?, maxWords?, llm? })`
 ### Optimizers
+- `promptify({ request, agentRole?, llm? })`
+- `ragify({ data, llm? })`
-- **promptify({ request, agentRole? })** – Erzeugt System-Prompts aus Nutzeranfragen
-- **ragify({ data })** – Optimiert Text für RAG (strukturierter, informationsdicht)
-**Beispiel – immer gleiche Struktur:**
+Beispiel:
 ```ts
 import { classify, extract, summarize } from "@delofarag/ai-utils"
 import { z } from "zod/v3"
-const klasse = await classify({
-    data: "Produktbewertung: Tolle Qualität!",
+const sentiment = await classify({
+    data: "Das Produkt ist wirklich gut.",
     classes: ["positiv", "negativ", "neutral"] as const
 })
-const infos = await extract({
-    data: "Max, 30 Jahre, Berlin",
-    schema: z.object({ name: z.string(), alter: z.number(), stadt: z.string() })
+const person = await extract({
+    data: "Max ist 30 und lebt in Berlin.",
+    schema: z.object({
+        name: z.string(),
+        age: z.number(),
+        city: z.string()
+    })
 })
-const kurz = await summarize({ data: langerText, maxWords: 50 })
+const short = await summarize({
+    data: "Sehr langer Text...",
+    maxWords: 50
+})
 ```
 ---
-## RAG-Implementierungen
+## Modalities
-**Vector Stores** (in `rag.ts`):
+### STT
-- **turn_to_docs(data)** – Wandelt Strings/Objekte in LangChain-`Document[]` um
-- **createSupabaseVectoreStore({ supabase, data, table_name?, RPC_function? })** – Supabase Vector Store aus Daten
-- **getSupabaseVectorStore({ supabase, table_name?, RPC_function? })** – Bestehenden Store holen
-- **createFaissStore({ data, save_path?, embeddings? })** – FAISS-Store (lokal, speicherbar)
-- **loadFaissStore({ path, embeddings? })** – FAISS-Store laden
+- `stt(...)`
+- `createSTTPhoneSocketSession(...)` fuer live phone socket chunks (Twilio/Telnyx-style)
-**RAG als Tool** (für Agent):
-- **createRAGTool({ vectorStore, name, description })** – Erzeugt ein Tool, mit dem der Agent den Vector Store durchsucht. In `tools` übergeben oder via `agent.addTool()`.
-**Retrieval-Chains** (in `rag.ts`):
-- **createRAGChain({ vectorStore, llm, prompt?, num_of_results_from_vdb? })** – Retrieval-Chain
-- **createRAGChainFromRetriever({ retriever, llm, prompt? })** – Alternative mit eigenem Retriever
-**Typischer Ablauf:**
-1. Vector Store erstellen: `createFaissStore({ data })` oder `createSupabaseVectoreStore({ data })`
-2. **Chain/MemoryChain:** `chain.setContext(vectorStore)` – RAG wird automatisch eingebaut. Optional `chain.addContext(weitereDaten)` für weitere Docs
-3. **Agent/Chatbot:** `createRAGTool({ vectorStore, name, description })` als Tool übergeben
----
+```ts
+import { stt } from "@delofarag/ai-utils"
-## Memory: SupabaseCheckpointSaver & SmartCheckpointSaver
+const result = await stt({
+    audio: "./call.wav",
+    prompt: "Transcribe in German."
+})
+```
-### SupabaseCheckpointSaver
+### TTS
-Speichert Checkpoints (inkl. Konversationsverlauf) in einer Supabase-Tabelle. Für persistente Chats über Sessions hinweg.
+- `tts(...)`
+- `streamTTSOverPhoneSocket(...)` fuer chunked outbound audio
 ```ts
-import { SupabaseCheckpointSaver, SupabaseCheckpointRow } from "@delofarag/ai-utils"
-import { SupabaseTable } from "@delofarag/supabase-utils"
+import { tts, streamTTSOverPhoneSocket } from "@delofarag/ai-utils"
-const table = new SupabaseTable<SupabaseCheckpointRow>({ /* ... */ })
-const saver = new SupabaseCheckpointSaver(table)
+const speech = await tts({
+    text: "Willkommen beim Support.",
+    model: "nova"
+})
-const memoryChain = new MemoryChain({
-    chain: myChain,
-    memory: saver
+await streamTTSOverPhoneSocket({
+    text: "Einen Moment bitte.",
+    model: "nova",
+    onChunk: async (chunk) => {
+        // socket send
+    }
 })
 ```
-**Hinweis:** Noch unter Test – Tabellen-Schema muss zu den Checkpoint-Strukturen passen.
+### Vision
-### SmartCheckpointSaver
+```ts
+import { vision } from "@delofarag/ai-utils"
-Wrapper um einen anderen `BaseCheckpointSaver` (z.B. `MemorySaver` oder `SupabaseCheckpointSaver`). Führt automatisch **Summarization** durch:
+const result = await vision({
+    prompt: "Was ist auf dem Bild zu sehen?",
+    images: ["https://example.com/photo.jpg"]
+})
+```
-- Nach `messagesBeforeSummary` User/AI-Nachrichten (Default: 12) wird die Konversation zusammengefasst
-- Die Zusammenfassung ersetzt die alten Messages → weniger Tokens, längerer Kontext
-- `maxSummaries` (Default: 7): Maximal so viele Summaries werden behalten. Sobald eine neue erstellt würde und das Limit überschritten wäre, wird die älteste Summary gelöscht (Rolling-Window)
+### Image Generation
 ```ts
-import { SmartCheckpointSaver, MemorySaver, getLLM } from "@delofarag/ai-utils"
+import { generateImages } from "@delofarag/ai-utils"
-const llm = getLLM({ type: "groq", apikey: process.env.CHATGROQ_API_KEY! })
-const memory = new SmartCheckpointSaver(new MemorySaver(), {
-    llm,
-    messagesBeforeSummary: 12,
-    maxSummaries: 7,
+const generated = await generateImages({
+    prompt: "Generate a clean product hero image",
+    imageConfig: { aspect_ratio: "16:9", image_size: "2K" }
 })
+```
+---
-const chatbot = new Chatbot({ llm, memory })
+## Session / Stream Helpers
+```ts
+import { session, StreamResponse } from "@delofarag/ai-utils"
 ```
-**Warum so:** Lange Chats blähen den Kontext auf. SmartCheckpointSaver hält die wichtigsten Infos in Zusammenfassungen und reduziert Token-Verbrauch.
+- `session({ streamable, ... })`: CLI-like interactive loop
+- `StreamResponse(asyncIterable)`: streambares NDJSON-HTTP-Response-Objekt
 ---
-## Kurzüberblick
-| Util | Zweck |
-|------|-------|
-| **Chain** | Stateless LLM + Schema, optional RAG (setContext/addContext) |
-| **MemoryChain** | Chain + Konversations-Memory pro thread_id, optional RAG |
-| **Agent** | LLM + Tools, optional Memory. RAG via createRAGTool + addTool |
-| **Chatbot** | Discriminated Union: tools → Agent, vectorStore → MemoryChain |
-| **ToolRegistry** | Tools registrieren (empfohlen) |
-| **tavilySearchTool** | Web-Suche (TAVILY_API_KEY) |
-| **Magic-Funcs** | ask, websearch, classify, decide, extract, structure, rewrite, summarize, promptify, ragify |
-| **RAG** | createRAGTool, Supabase/FAISS Vector Stores, createRAGChain |
-| **SupabaseCheckpointSaver** | Persistente Memory in Supabase |
-| **SmartCheckpointSaver** | Memory mit Auto-Summarization |
-| **getLLM()** | LLM aus Groq, OpenRouter oder Ollama |
+## Export Overview (high-level)
+Top-level Exports decken u. a. ab:
+- Helpers (`helpers`, `memory`, `rag`, `llms`, `chatbot`)
+- Core (`Agent`, `Chain`, `MemoryChain`)
+- Tools (`ToolRegistry`, `Tavily`, `RAGTool`, Zodios registries)
+- Magic-Funcs (answerers/evaluators/parsers/optimizers)
+- Modalities (`stt`, `tts`, `vision`, `generateImages`)
 ---
-## .env-Variablen
+## Empfehlungen
-| Variable | Verwendung |
-|----------|------------|
-| `CHATGROQ_API_KEY` | Default für alle LLM-Utils |
-| `TAVILY_API_KEY` | tavilySearchTool, websearch() |
+- Fuer strukturierte Outputs immer `zod/v3` verwenden.
+- Fuer Produktion API-Keys als ENV setzen, nicht hardcoden.
+- Bei langen Chats `SmartCheckpointSaver` verwenden.
+- RAG als Tool im `Agent` ist in der Praxis oft robuster als RAG-only Prompting.