npm - @workglow/ai - Versions diffs - 0.0.52 - Mend

@workglow/ai 0.0.52

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (67) hide show

package/LICENSE +201 -0
package/README.md +531 -0
package/dist/browser.js +1371 -0
package/dist/browser.js.map +30 -0
package/dist/bun.js +1398 -0
package/dist/bun.js.map +32 -0
package/dist/common.d.ts +15 -0
package/dist/common.d.ts.map +1 -0
package/dist/job/AiJob.d.ts +28 -0
package/dist/job/AiJob.d.ts.map +1 -0
package/dist/model/Model.d.ts +26 -0
package/dist/model/Model.d.ts.map +1 -0
package/dist/model/ModelRegistry.d.ts +9 -0
package/dist/model/ModelRegistry.d.ts.map +1 -0
package/dist/model/ModelRepository.d.ts +146 -0
package/dist/model/ModelRepository.d.ts.map +1 -0
package/dist/model/storage/InMemoryModelRepository.d.ts +18 -0
package/dist/model/storage/InMemoryModelRepository.d.ts.map +1 -0
package/dist/model/storage/IndexedDbModelRepository.d.ts +18 -0
package/dist/model/storage/IndexedDbModelRepository.d.ts.map +1 -0
package/dist/model/storage/PostgresModelRepository.d.ts +19 -0
package/dist/model/storage/PostgresModelRepository.d.ts.map +1 -0
package/dist/model/storage/SqliteModelRepository.d.ts +18 -0
package/dist/model/storage/SqliteModelRepository.d.ts.map +1 -0
package/dist/node.js +1397 -0
package/dist/node.js.map +32 -0
package/dist/provider/AiProviderRegistry.d.ts +35 -0
package/dist/provider/AiProviderRegistry.d.ts.map +1 -0
package/dist/source/Document.d.ts +56 -0
package/dist/source/Document.d.ts.map +1 -0
package/dist/source/DocumentConverter.d.ts +15 -0
package/dist/source/DocumentConverter.d.ts.map +1 -0
package/dist/source/DocumentConverterMarkdown.d.ts +13 -0
package/dist/source/DocumentConverterMarkdown.d.ts.map +1 -0
package/dist/source/DocumentConverterText.d.ts +13 -0
package/dist/source/DocumentConverterText.d.ts.map +1 -0
package/dist/source/MasterDocument.d.ts +27 -0
package/dist/source/MasterDocument.d.ts.map +1 -0
package/dist/source/index.d.ts +10 -0
package/dist/source/index.d.ts.map +1 -0
package/dist/task/DocumentSplitterTask.d.ts +58 -0
package/dist/task/DocumentSplitterTask.d.ts.map +1 -0
package/dist/task/DownloadModelTask.d.ts +118 -0
package/dist/task/DownloadModelTask.d.ts.map +1 -0
package/dist/task/TextEmbeddingTask.d.ts +268 -0
package/dist/task/TextEmbeddingTask.d.ts.map +1 -0
package/dist/task/TextGenerationTask.d.ts +140 -0
package/dist/task/TextGenerationTask.d.ts.map +1 -0
package/dist/task/TextQuestionAnswerTask.d.ts +124 -0
package/dist/task/TextQuestionAnswerTask.d.ts.map +1 -0
package/dist/task/TextRewriterTask.d.ts +113 -0
package/dist/task/TextRewriterTask.d.ts.map +1 -0
package/dist/task/TextSummaryTask.d.ts +95 -0
package/dist/task/TextSummaryTask.d.ts.map +1 -0
package/dist/task/TextTranslationTask.d.ts +158 -0
package/dist/task/TextTranslationTask.d.ts.map +1 -0
package/dist/task/VectorSimilarityTask.d.ts +334 -0
package/dist/task/VectorSimilarityTask.d.ts.map +1 -0
package/dist/task/base/AiTask.d.ts +47 -0
package/dist/task/base/AiTask.d.ts.map +1 -0
package/dist/task/base/AiTaskSchemas.d.ts +156 -0
package/dist/task/base/AiTaskSchemas.d.ts.map +1 -0
package/dist/task/index.d.ts +17 -0
package/dist/task/index.d.ts.map +1 -0
package/dist/types.d.ts +11 -0
package/dist/types.d.ts.map +1 -0
package/package.json +67 -0

package/README.md ADDED Viewed

@@ -0,0 +1,531 @@
+# @workglow/ai
+Core AI abstractions and functionality for Workglow AI task pipelines.
+## Overview
+The `@workglow/ai` package provides the core AI abstractions, job definitions, and task implementations that form the foundation of Workglow's AI task execution system. It defines the interfaces and base classes that AI providers implement, along with a comprehensive set of AI tasks ready for use.
+## Features
+- **Built-in AI Tasks**: Pre-implemented tasks for common AI operations
+- **Provider Interface**: Standard interface for AI service providers
+- **Model Management**: Complete system for managing AI models and their associations with tasks, and can persist with multiple storage backends
+- **Multi-Platform Support**: Works in browser, Node.js, and Bun environments
+- **Type Safety**: Full TypeScript support with comprehensive type definitions
+## Installation
+```bash
+bun add @workglow/ai
+```
+## Quick Start
+Here's a complete example of setting up and using the AI package with the Hugging Face Transformers ONNX provider from `@workglow/ai-provider`:
+```typescript
+import {
+  TextGenerationTask,
+  TextEmbeddingTask,
+  getGlobalModelRepository,
+  setGlobalModelRepository,
+  InMemoryModelRepository,
+  AiJob,
+} from "@workglow/ai";
+import { Workflow, getTaskQueueRegistry } from "@workglow/task-graph";
+import { JobQueue } from "@workglow/job-queue";
+import { HF_TRANSFORMERS_ONNX, register_HFT_InlineJobFns } from "@workglow/ai-provider";
+// 1. Set up a model repository
+const modelRepo = new InMemoryModelRepository();
+setGlobalModelRepository(modelRepo);
+// 2. Add a local ONNX model (Hugging Face Transformers)
+await modelRepo.addModel({
+  name: "onnx:Xenova/LaMini-Flan-T5-783M:q8",
+  url: "Xenova/LaMini-Flan-T5-783M",
+  provider: HF_TRANSFORMERS_ONNX,
+  availableOnBrowser: true,
+  availableOnServer: true,
+  contextWindow: 4096,
+  pipeline: "text2text-generation",
+});
+// 3. Connect models to tasks
+await modelRepo.connectTaskToModel("TextGenerationTask", "onnx:Xenova/LaMini-Flan-T5-783M:q8");
+// 4. Register provider functions (inline, same thread)
+await register_HFT_InlineJobFns();
+// 5. Set up job queue for the provider
+getTaskQueueRegistry().registerQueue(new JobQueue(HF_TRANSFORMERS_ONNX, AiJob));
+// 6. Create and run a workflow
+const workflow = new Workflow();
+const result = await workflow
+  .TextGenerationTask({
+    model: "onnx:Xenova/LaMini-Flan-T5-783M:q8",
+    prompt: "Write a short story about a robot learning to paint.",
+    maxTokens: 200,
+    temperature: 0.8,
+  })
+  .run();
+console.log(result.text);
+```
+## Available AI Tasks
+### Text Processing Tasks
+#### TextGenerationTask
+Generates text based on prompts using language models.
+```typescript
+import { TextGenerationTask } from "@workglow/ai";
+const task = new TextGenerationTask({
+  model: "onnx:Xenova/gpt2:q8",
+  prompt: "Explain quantum computing in simple terms",
+});
+const result = await task.run();
+// Output: { text: "Quantum computing is..." }
+```
+#### TextEmbeddingTask
+Generates vector embeddings for text using embedding models.
+```typescript
+import { TextEmbeddingTask } from "@workglow/ai";
+const task = new TextEmbeddingTask({
+  model: "onnx:Xenova/LaMini-Flan-T5-783M:q8",
+  text: "This is a sample text for embedding",
+});
+const result = await task.run();
+// Output: { vector: [0.1, -0.2, 0.3, ...] }
+```
+#### TextTranslationTask
+Translates text between different languages.
+```typescript
+import { TextTranslationTask } from "@workglow/ai";
+const task = new TextTranslationTask({
+  model: "translation-model",
+  text: "Hello, how are you?",
+  sourceLanguage: "en",
+  targetLanguage: "es",
+});
+const result = await task.run();
+// Output: { translatedText: "Hola, ¿cómo estás?" }
+```
+#### TextSummaryTask
+Generates summaries of longer text content.
+```typescript
+import { TextSummaryTask } from "@workglow/ai";
+const task = new TextSummaryTask({
+  model: "onnx:Falconsai/text_summarization:fp32",
+  text: "Long article content here...",
+  maxLength: 100,
+});
+const result = await task.run();
+// Output: { summary: "Brief summary of the article..." }
+```
+#### TextRewriterTask
+Rewrites text in different styles or tones.
+```typescript
+import { TextRewriterTask } from "@workglow/ai";
+const task = new TextRewriterTask({
+  model: "onnx:Xenova/LaMini-Flan-T5-783M:q8",
+  text: "This is a formal business proposal.",
+  style: "casual",
+});
+const result = await task.run();
+// Output: { rewrittenText: "This is a casual business idea..." }
+```
+#### TextQuestionAnswerTask
+Answers questions based on provided context.
+```typescript
+import { TextQuestionAnswerTask } from "@workglow/ai";
+const task = new TextQuestionAnswerTask({
+  model: "onnx:Xenova/distilbert-base-uncased-distilled-squad:q8",
+  context: "The capital of France is Paris. It has a population of about 2.1 million.",
+  question: "What is the population of Paris?",
+});
+const result = await task.run();
+// Output: { answer: "About 2.1 million" }
+```
+### Analysis Tasks
+#### VectorSimilarityTask
+Computes similarity between texts or embeddings.
+```typescript
+import { VectorSimilarityTask } from "@workglow/ai";
+const task = new VectorSimilarityTask({
+  model: "onnx:Supabase/gte-small:q8",
+  text1: "I love programming",
+  text2: "Coding is my passion",
+});
+const result = await task.run();
+// Output: { similarity: 0.85 }
+```
+### Document Processing Tasks
+#### DocumentSplitterTask
+Splits documents into smaller chunks for processing.
+```typescript
+import { DocumentSplitterTask } from "@workglow/ai";
+const task = new DocumentSplitterTask({
+  document: "Very long document content...",
+  chunkSize: 1000,
+  chunkOverlap: 200,
+});
+const result = await task.run();
+// Output: { chunks: ["chunk1...", "chunk2...", "chunk3..."] }
+```
+### Model Management Tasks
+#### DownloadModelTask
+Downloads and prepares AI models for use.
+```typescript
+import { DownloadModelTask } from "@workglow/ai";
+import { HF_TRANSFORMERS_ONNX } from "@workglow/ai-provider";
+const task = new DownloadModelTask({
+  modelName: "onnx:Xenova/LaMini-Flan-T5-783M:q8",
+  modelUrl: "Xenova/LaMini-Flan-T5-783M",
+  provider: HF_TRANSFORMERS_ONNX,
+});
+const result = await task.run();
+// Output: { status: "downloaded", path: "/models/..." }
+```
+## Model Management
+### Setting Up Models
+Models are managed through the `ModelRepository` system. You can use different storage backends:
+#### In-Memory Repository (Development)
+```typescript
+import { InMemoryModelRepository, setGlobalModelRepository } from "@workglow/ai";
+const modelRepo = new InMemoryModelRepository();
+setGlobalModelRepository(modelRepo);
+```
+#### IndexedDB Repository (Browser)
+```typescript
+import { IndexedDbModelRepository, setGlobalModelRepository } from "@workglow/ai";
+const modelRepo = new IndexedDbModelRepository("models", "task2models");
+setGlobalModelRepository(modelRepo);
+```
+#### SQLite Repository (Server)
+```typescript
+import { SqliteModelRepository, setGlobalModelRepository } from "@workglow/ai";
+const modelRepo = new SqliteModelRepository("./models.db");
+setGlobalModelRepository(modelRepo);
+```
+#### PostgreSQL Repository (Production)
+```typescript
+import { PostgresModelRepository, setGlobalModelRepository } from "@workglow/ai";
+import { Pool } from "pg";
+const pool = new Pool({
+  user: "username",
+  host: "localhost",
+  database: "mydb",
+  password: "password",
+  port: 5432,
+});
+const modelRepo = new PostgresModelRepository(pool);
+setGlobalModelRepository(modelRepo);
+```
+### Adding Models
+```typescript
+import { getGlobalModelRepository } from "@workglow/ai";
+import { HF_TRANSFORMERS_ONNX } from "@workglow/ai-provider";
+const modelRepo = getGlobalModelRepository();
+// Add an ONNX model from Hugging Face
+await modelRepo.addModel({
+  name: "onnx:Xenova/gpt2:q8",
+  url: "Xenova/gpt2",
+  provider: HF_TRANSFORMERS_ONNX,
+  availableOnBrowser: true,
+  availableOnServer: true,
+  contextWindow: 8192,
+});
+// Connect model to specific tasks
+await modelRepo.connectTaskToModel("TextGenerationTask", "onnx:Xenova/gpt2:q8");
+// Find models for a specific task
+const textGenModels = await modelRepo.findModelsByTask("TextGenerationTask");
+```
+## Provider Setup
+AI providers handle the actual execution of AI tasks. You need to register provider functions for each model provider and task type combination.
+### Basic Provider Registration
+```typescript
+import { register_HFT_InlineJobFns } from "@workglow/ai-provider";
+// Registers run functions for all supported AI tasks on the current thread
+await register_HFT_InlineJobFns();
+```
+### Worker-Based Provider Registration
+For compute-intensive tasks that should run in workers:
+```typescript
+// See `@workglow/ai-provider` exports for worker/client registration helpers
+// - register_HFT_WorkerJobFns (in worker)
+// - register_HFT_ClientJobFns (in main thread)
+```
+### Job Queue Setup
+Each provider needs a job queue for task execution:
+```typescript
+import { getTaskQueueRegistry } from "@workglow/task-graph";
+import { JobQueue } from "@workglow/job-queue";
+import { AiJob } from "@workglow/ai";
+import { HF_TRANSFORMERS_ONNX } from "@workglow/ai-provider";
+getTaskQueueRegistry().registerQueue(new JobQueue(HF_TRANSFORMERS_ONNX, AiJob));
+```
+## Workflow Integration
+AI tasks integrate seamlessly with Workglow workflows:
+```typescript
+import { Workflow } from "@workglow/task-graph";
+import { TextGenerationTask, TextEmbeddingTask, VectorSimilarityTask } from "@workglow/ai";
+const workflow = new Workflow();
+// Chain AI tasks together
+const result = await workflow
+  .TextGenerationTask({
+    model: "onnx:Xenova/gpt2:q8",
+    prompt: "Write about artificial intelligence",
+  })
+  .TextEmbeddingTask({
+    model: "onnx:Supabase/gte-small:q8",
+    text: workflow.previous().text, // Use previous task output
+  })
+  .VectorSimilarityTask({
+    model: "onnx:Supabase/gte-small:q8",
+    text1: "artificial intelligence",
+    embedding2: workflow.previous().vector, // Use embedding from previous task
+  })
+  .run();
+console.log("Final similarity score:", result.similarity);
+```
+## Document Processing
+The package includes document processing capabilities:
+```typescript
+import { Document, DocumentConverterMarkdown } from "@workglow/ai";
+// Create a document
+const doc = new Document("# My Document\n\nThis is content...", { title: "Sample Doc" });
+// Convert markdown to structured format
+const converter = new DocumentConverterMarkdown();
+const processedDoc = await converter.convert(doc);
+// Use with document splitter
+const splitter = new DocumentSplitterTask({
+  document: processedDoc.content,
+  chunkSize: 500,
+  chunkOverlap: 50,
+});
+const chunks = await splitter.run();
+```
+## Error Handling
+AI tasks include comprehensive error handling:
+```typescript
+import { TaskConfigurationError } from "@workglow/task-graph";
+try {
+  const task = new TextGenerationTask({
+    model: "nonexistent-model",
+    prompt: "Test prompt",
+  });
+  const result = await task.run();
+} catch (error) {
+  if (error instanceof TaskConfigurationError) {
+    console.error("Configuration error:", error.message);
+    // Handle missing model, invalid parameters, etc.
+  } else {
+    console.error("Runtime error:", error.message);
+    // Handle API failures, network issues, etc.
+  }
+}
+```
+## Advanced Configuration
+### Custom Model Validation
+Tasks automatically validate that specified models exist and are compatible:
+```typescript
+// Models are validated before task execution
+const task = new TextGenerationTask({
+  model: "onnx:Xenova/gpt2:q8", // Must exist in ModelRepository and be connected to TextGenerationTask
+  prompt: "Generate text",
+});
+// Validation happens during task.run()
+```
+### Progress Tracking
+Monitor AI task progress:
+```typescript
+const task = new TextGenerationTask({
+  model: "onnx:Xenova/gpt2:q8",
+  prompt: "Long generation task...",
+});
+task.on("progress", (progress, message, details) => {
+  console.log(`Progress: ${progress}% - ${message}`);
+});
+const result = await task.run();
+```
+### Task Cancellation
+All AI tasks support cancellation via AbortSignal:
+```typescript
+const controller = new AbortController();
+const task = new TextGenerationTask({
+  model: "onnx:Xenova/gpt2:q8",
+  prompt: "Generate text...",
+});
+// Cancel after 10 seconds
+setTimeout(() => controller.abort(), 10000);
+try {
+  const result = await task.run({ signal: controller.signal });
+} catch (error) {
+  if (error.name === "AbortError") {
+    console.log("Task was cancelled");
+  }
+}
+```
+## Environment-Specific Usage
+### Browser Usage
+```typescript
+import { IndexedDbModelRepository } from "@workglow/ai";
+// Use IndexedDB for persistent storage in browser
+const modelRepo = new IndexedDbModelRepository();
+```
+### Node.js Usage
+```typescript
+import { SqliteModelRepository } from "@workglow/ai";
+// Use SQLite for server-side storage
+const modelRepo = new SqliteModelRepository("./models.db");
+```
+### Bun Usage
+```typescript
+import { InMemoryModelRepository } from "@workglow/ai";
+// Direct imports work with Bun via conditional exports
+const modelRepo = new InMemoryModelRepository();
+```
+## Dependencies
+This package depends on:
+- `@workglow/job-queue` - Job queue system for task execution
+- `@workglow/storage` - Storage abstractions for model and data persistence
+- `@workglow/task-graph` - Task graph system for workflow management
+- `@workglow/util` - Utility functions and shared components, including JSON Schema types and utilities
+## License
+Apache 2.0 - See [LICENSE](./LICENSE) for details.