RubyGems - desiru - Versions diffs - 0.1.0 → 0.1.1 - Mend

desiru 0.1.0 → 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (98) hide show

checksums.yaml +4 -4
data/.env.example +34 -0
data/.rubocop.yml +7 -4
data/.ruby-version +1 -0
data/CLAUDE.md +4 -0
data/Gemfile +21 -2
data/Gemfile.lock +87 -12
data/README.md +295 -2
data/Rakefile +1 -0
data/db/migrations/001_create_initial_tables.rb +96 -0
data/db/migrations/002_create_job_results.rb +39 -0
data/desiru.db +0 -0
data/desiru.gemspec +2 -5
data/docs/background_processing_roadmap.md +87 -0
data/docs/job_scheduling.md +167 -0
data/dspy-analysis-swarm.yml +60 -0
data/dspy-feature-analysis.md +121 -0
data/examples/README.md +69 -0
data/examples/api_with_persistence.rb +122 -0
data/examples/assertions_example.rb +232 -0
data/examples/async_processing.rb +2 -0
data/examples/few_shot_learning.rb +1 -2
data/examples/graphql_api.rb +4 -2
data/examples/graphql_integration.rb +3 -3
data/examples/graphql_optimization_summary.md +143 -0
data/examples/graphql_performance_benchmark.rb +247 -0
data/examples/persistence_example.rb +102 -0
data/examples/react_agent.rb +203 -0
data/examples/rest_api.rb +173 -0
data/examples/rest_api_advanced.rb +333 -0
data/examples/scheduled_job_example.rb +116 -0
data/examples/simple_qa.rb +1 -2
data/examples/sinatra_api.rb +109 -0
data/examples/typed_signatures.rb +1 -2
data/graphql_optimization_summary.md +53 -0
data/lib/desiru/api/grape_integration.rb +284 -0
data/lib/desiru/api/persistence_middleware.rb +148 -0
data/lib/desiru/api/sinatra_integration.rb +217 -0
data/lib/desiru/api.rb +42 -0
data/lib/desiru/assertions.rb +74 -0
data/lib/desiru/async_status.rb +65 -0
data/lib/desiru/cache.rb +1 -1
data/lib/desiru/configuration.rb +2 -1
data/lib/desiru/errors.rb +160 -0
data/lib/desiru/field.rb +17 -14
data/lib/desiru/graphql/batch_loader.rb +85 -0
data/lib/desiru/graphql/data_loader.rb +242 -75
data/lib/desiru/graphql/enum_builder.rb +75 -0
data/lib/desiru/graphql/executor.rb +37 -4
data/lib/desiru/graphql/schema_generator.rb +62 -158
data/lib/desiru/graphql/type_builder.rb +138 -0
data/lib/desiru/graphql/type_cache_warmer.rb +91 -0
data/lib/desiru/jobs/async_predict.rb +1 -1
data/lib/desiru/jobs/base.rb +67 -0
data/lib/desiru/jobs/batch_processor.rb +6 -6
data/lib/desiru/jobs/retriable.rb +119 -0
data/lib/desiru/jobs/retry_strategies.rb +169 -0
data/lib/desiru/jobs/scheduler.rb +219 -0
data/lib/desiru/jobs/webhook_notifier.rb +242 -0
data/lib/desiru/models/anthropic.rb +164 -0
data/lib/desiru/models/base.rb +37 -3
data/lib/desiru/models/open_ai.rb +151 -0
data/lib/desiru/models/open_router.rb +161 -0
data/lib/desiru/module.rb +59 -9
data/lib/desiru/modules/chain_of_thought.rb +3 -3
data/lib/desiru/modules/majority.rb +51 -0
data/lib/desiru/modules/multi_chain_comparison.rb +204 -0
data/lib/desiru/modules/predict.rb +8 -1
data/lib/desiru/modules/program_of_thought.rb +139 -0
data/lib/desiru/modules/react.rb +273 -0
data/lib/desiru/modules/retrieve.rb +4 -2
data/lib/desiru/optimizers/base.rb +2 -4
data/lib/desiru/optimizers/bootstrap_few_shot.rb +2 -2
data/lib/desiru/optimizers/copro.rb +268 -0
data/lib/desiru/optimizers/knn_few_shot.rb +185 -0
data/lib/desiru/persistence/database.rb +71 -0
data/lib/desiru/persistence/models/api_request.rb +38 -0
data/lib/desiru/persistence/models/job_result.rb +138 -0
data/lib/desiru/persistence/models/module_execution.rb +37 -0
data/lib/desiru/persistence/models/optimization_result.rb +28 -0
data/lib/desiru/persistence/models/training_example.rb +25 -0
data/lib/desiru/persistence/models.rb +11 -0
data/lib/desiru/persistence/repositories/api_request_repository.rb +98 -0
data/lib/desiru/persistence/repositories/base_repository.rb +77 -0
data/lib/desiru/persistence/repositories/job_result_repository.rb +116 -0
data/lib/desiru/persistence/repositories/module_execution_repository.rb +85 -0
data/lib/desiru/persistence/repositories/optimization_result_repository.rb +67 -0
data/lib/desiru/persistence/repositories/training_example_repository.rb +102 -0
data/lib/desiru/persistence/repository.rb +29 -0
data/lib/desiru/persistence/setup.rb +77 -0
data/lib/desiru/persistence.rb +49 -0
data/lib/desiru/registry.rb +3 -5
data/lib/desiru/signature.rb +91 -24
data/lib/desiru/version.rb +1 -1
data/lib/desiru.rb +23 -8
data/missing-features-analysis.md +192 -0
metadata +63 -45
data/lib/desiru/models/raix_adapter.rb +0 -210

data/examples/api_with_persistence.rb ADDED Viewed

@@ -0,0 +1,122 @@
+#!/usr/bin/env ruby
+# frozen_string_literal: true
+require 'bundler/setup'
+require 'desiru'
+require 'desiru/persistence'
+require 'rack'
+# Configure Desiru
+Desiru.configure do |config|
+  config.default_model = Desiru::Models::OpenAI.new(
+    api_key: ENV['OPENAI_API_KEY'] || 'your-api-key',
+    model: 'gpt-3.5-turbo'
+  )
+end
+# Setup persistence
+puts "Setting up database..."
+Desiru::Persistence.database_url = 'sqlite://api_tracking.db'
+Desiru::Persistence.connect!
+Desiru::Persistence.migrate!
+# Define a simple module
+class TextAnalyzer < Desiru::Module
+  signature 'TextAnalyzer', 'Analyze text sentiment and key themes'
+  input 'text', type: 'string', desc: 'Text to analyze'
+  output 'sentiment', type: 'string', desc: 'Overall sentiment (positive/negative/neutral)'
+  output 'themes', type: 'list[string]', desc: 'Key themes identified'
+  output 'confidence', type: 'float', desc: 'Confidence score (0-1)'
+  def forward(_text:)
+    # Simulate analysis
+    {
+      sentiment: %w[positive negative neutral].sample,
+      themes: %w[technology business health education].sample(2),
+      confidence: rand(0.7..0.95).round(2)
+    }
+  end
+end
+# Create API with persistence tracking
+api = Desiru::API.create(framework: :sinatra) do
+  register_module '/analyze', TextAnalyzer.new,
+                  description: 'Analyze text sentiment and themes'
+end
+# Add persistence tracking
+app = api.with_persistence(enabled: true)
+# Add a simple UI endpoint
+ui_app = Rack::Builder.new do
+  use Desiru::API::PersistenceMiddleware
+  map '/' do
+    run lambda { |_env|
+      html = <<~HTML
+              <!DOCTYPE html>
+              <html>
+              <head>
+                <title>Desiru API with Persistence</title>
+                <style>
+                  body { font-family: Arial, sans-serif; margin: 40px; }
+                  .endpoint { background: #f0f0f0; padding: 10px; margin: 10px 0; }
+                  .stats { background: #e0f0ff; padding: 15px; margin: 20px 0; }
+                  pre { background: #f5f5f5; padding: 10px; overflow-x: auto; }
+                </style>
+              </head>
+              <body>
+                <h1>Desiru API with Persistence Tracking</h1>
+        #{'        '}
+                <div class="endpoint">
+                  <h2>Text Analysis Endpoint</h2>
+                  <p><strong>POST /api/v1/analyze</strong></p>
+                  <p>Analyze text sentiment and extract key themes</p>
+                  <pre>curl -X POST http://localhost:9294/api/v1/analyze \\
+        -H "Content-Type: application/json" \\
+        -d '{"text": "This is an amazing product that exceeds expectations!"}'</pre>
+                </div>
+        #{'        '}
+                <div class="stats">
+                  <h2>API Statistics</h2>
+                  <ul>
+                    <li>Total API Requests: #{Desiru::Persistence[:api_requests].count}</li>
+                    <li>Module Executions: #{Desiru::Persistence[:module_executions].count}</li>
+                    <li>Success Rate: #{Desiru::Persistence[:module_executions].success_rate}%</li>
+                    <li>Average Response Time: #{Desiru::Persistence[:api_requests].average_response_time || 0}s</li>
+                  </ul>
+                </div>
+        #{'        '}
+                <div class="endpoint">
+                  <h2>Recent Requests</h2>
+                  <ul>
+                    #{Desiru::Persistence[:api_requests].recent(5).map do |r|
+                      "<li>#{r.method} #{r.path} - #{r.status_code} (#{r.response_time ? "#{(r.response_time * 1000).round}ms" : 'N/A'})</li>"
+                    end.join("\n              ")}
+                  </ul>
+                </div>
+              </body>
+              </html>
+      HTML
+      [200, { 'Content-Type' => 'text/html' }, [html]]
+    }
+  end
+  map '/api' do
+    run app
+  end
+end
+puts "Starting API server with persistence tracking on http://localhost:9294"
+puts "\nEndpoints:"
+puts "  GET  /                - Web UI with statistics"
+puts "  POST /api/v1/analyze  - Text analysis endpoint"
+puts "  GET  /api/v1/health   - Health check"
+puts "\nAll API requests are automatically tracked in the database!"
+puts "Press Ctrl+C to stop the server"
+# Start the server
+Rack::Handler::WEBrick.run ui_app, Port: 9294

data/examples/assertions_example.rb ADDED Viewed

@@ -0,0 +1,232 @@
+#!/usr/bin/env ruby
+# frozen_string_literal: true
+require 'bundler/setup'
+require 'desiru'
+# Mock model for demonstration
+class MockModel
+  def complete(_messages:, **_options)
+    # Simple mock that returns predefined responses
+    { choices: [{ message: { content: "Mock response" } }] }
+  end
+end
+# Configure Desiru with assertions
+Desiru.configure do |config|
+  config.default_model = MockModel.new
+  config.logger = Logger.new($stdout).tap do |log|
+    log.level = Logger::INFO
+    log.formatter = proc do |severity, datetime, _, msg|
+      "[#{severity}] #{datetime}: #{msg}\n"
+    end
+  end
+end
+# Configure assertion behavior
+Desiru::Assertions.configure do |config|
+  config.max_assertion_retries = 2
+  config.assertion_retry_delay = 0.5
+end
+# Example 1: Module with confidence assertion
+class FactChecker < Desiru::Module
+  def forward(statement:)
+    # Simulate fact checking with confidence score
+    facts = [
+      { statement: "The sky is blue", confidence: 0.95 },
+      { statement: "Water boils at 100°C", confidence: 0.98 },
+      { statement: "Cats can fly", confidence: 0.1 },
+      { statement: "The Earth is flat", confidence: 0.05 }
+    ]
+    # Find confidence for the statement
+    fact = facts.find { |f| f[:statement].downcase == statement.downcase }
+    confidence = fact ? fact[:confidence] : rand(0.3..0.9)
+    result = {
+      statement: statement,
+      confidence: confidence,
+      verified: confidence > 0.7
+    }
+    # Assert high confidence for fact verification
+    Desiru.assert(
+      result[:confidence] > 0.7,
+      "Low confidence score: #{result[:confidence]}. Cannot verify statement."
+    )
+    result
+  end
+end
+# Example 2: Module with suggestions for best practices
+class CodeReviewer < Desiru::Module
+  def forward(code:, language:)
+    review = {
+      code: code,
+      language: language,
+      issues: [],
+      suggestions: []
+    }
+    # Simulate code analysis
+    if code.include?('TODO')
+      review[:issues] << "Found TODO comment"
+      review[:suggestions] << "Consider creating a ticket for TODO items"
+    end
+    if language == 'ruby' && !code.include?('frozen_string_literal')
+      review[:suggestions] << "Add frozen_string_literal pragma"
+    end
+    # Suggest having tests
+    Desiru.suggest(
+      code.include?('test') || code.include?('spec'),
+      "No tests found in the code. Consider adding test coverage."
+    )
+    # Suggest documentation
+    Desiru.suggest(
+      code.include?('#') || code.include?('/**'),
+      "No comments found. Consider adding documentation."
+    )
+    review[:score] = 100 - (review[:issues].length * 10)
+    review
+  end
+end
+# Example 3: Module combining assertions and suggestions
+class DataValidator < Desiru::Module
+  def forward(data:, schema:)
+    validation = {
+      data: data,
+      valid: true,
+      errors: [],
+      warnings: []
+    }
+    # Required field assertion
+    schema[:required]&.each do |field|
+      if !data.key?(field) || data[field].nil?
+        validation[:valid] = false
+        validation[:errors] << "Missing required field: #{field}"
+      end
+    end
+    # Assert data is valid
+    Desiru.assert(
+      validation[:valid],
+      "Data validation failed: #{validation[:errors].join(', ')}"
+    )
+    # Suggest best practices
+    if data.is_a?(Hash)
+      Desiru.suggest(
+        data.keys.all? { |k| k.is_a?(Symbol) },
+        "Consider using symbols for hash keys for better performance"
+      )
+    end
+    # Check data types (suggestions)
+    schema[:types]&.each do |field, expected_type|
+      next unless data.key?(field)
+      actual_type = data[field].class
+      Desiru.suggest(
+        actual_type == expected_type,
+        "Field '#{field}' is #{actual_type}, expected #{expected_type}"
+      )
+    end
+    validation
+  end
+end
+# Demonstrate the modules
+puts "=== Assertion Examples ==="
+puts
+# Example 1: Fact Checker with passing assertion
+puts "1. Fact Checker - Valid Statement:"
+fact_checker = FactChecker.new('statement:str -> statement:str, confidence:float, verified:bool')
+begin
+  result = fact_checker.call(statement: "Water boils at 100°C")
+  puts "  ✓ Statement: #{result[:statement]}"
+  puts "  ✓ Confidence: #{result[:confidence]}"
+  puts "  ✓ Verified: #{result[:verified]}"
+rescue Desiru::Assertions::AssertionError => e
+  puts "  ✗ Assertion failed: #{e.message}"
+end
+puts
+# Example 2: Fact Checker with failing assertion
+puts "2. Fact Checker - False Statement:"
+begin
+  result = fact_checker.call(statement: "Cats can fly")
+  puts "  ✓ Statement verified with confidence: #{result[:confidence]}"
+rescue Desiru::Assertions::AssertionError => e
+  puts "  ✗ Assertion failed after retries: #{e.message}"
+  puts "  ✗ Module: #{e.module_name}"
+  puts "  ✗ Retries: #{e.retry_count}"
+end
+puts
+# Example 3: Code Reviewer with suggestions
+puts "3. Code Reviewer - With Suggestions:"
+code_reviewer = CodeReviewer.new(
+  'code:str, language:str -> code:str, language:str, issues:list, suggestions:list, score:int'
+)
+code = <<~RUBY
+  def calculate_sum(numbers)
+    # TODO: Add validation
+    numbers.sum
+  end
+RUBY
+result = code_reviewer.call(code: code, language: 'ruby')
+puts "  Code review score: #{result[:score]}"
+puts "  Issues: #{result[:issues].join(', ')}"
+puts "  Suggestions: #{result[:suggestions].join(', ')}"
+puts
+# Example 4: Data Validator with mixed validations
+puts "4. Data Validator - Complete Example:"
+validator = DataValidator.new('data:dict, schema:dict -> data:dict, valid:bool, errors:list, warnings:list')
+schema = {
+  required: %i[name email],
+  types: {
+    name: String,
+    email: String,
+    age: Integer
+  }
+}
+# Valid data
+puts "  a) Valid data:"
+begin
+  valid_data = { name: "John Doe", email: "john@example.com", age: 30 }
+  result = validator.call(data: valid_data, schema: schema)
+  puts "    ✓ Validation passed"
+  puts "    ✓ Data is valid: #{result[:valid]}"
+rescue Desiru::Assertions::AssertionError => e
+  puts "    ✗ Validation failed: #{e.message}"
+end
+# Invalid data
+puts "  b) Invalid data (missing required field):"
+begin
+  invalid_data = { name: "Jane Doe", age: "twenty-five" }
+  validator.call(data: invalid_data, schema: schema)
+  puts "    ✓ Validation passed"
+rescue Desiru::Assertions::AssertionError => e
+  puts "    ✗ Validation failed: #{e.message}"
+end
+puts
+puts "=== Assertion Configuration ==="
+puts "Max assertion retries: #{Desiru::Assertions.configuration.max_assertion_retries}"
+puts "Retry delay: #{Desiru::Assertions.configuration.assertion_retry_delay}s"
+puts "Assertions logged: #{Desiru::Assertions.configuration.log_assertions}"

data/examples/async_processing.rb CHANGED Viewed

@@ -52,6 +52,8 @@ puts "   Status: Processing..."
 # Check if ready (non-blocking)
 sleep(0.1)
 puts "   Ready? #{result.ready?}"
+puts "   Status: #{result.status}"
+puts "   Progress: #{result.progress}%" if result.progress
 # Wait for result (blocking with timeout)
 begin

data/examples/few_shot_learning.rb CHANGED Viewed

@@ -6,8 +6,7 @@ require 'desiru'
 # Configure Desiru
 Desiru.configure do |config|
-  config.default_model = Desiru::Models::RaixAdapter.new(
-    provider: :openai,
+  config.default_model = Desiru::Models::OpenAI.new(
     model: 'gpt-3.5-turbo',
     api_key: ENV['OPENAI_API_KEY'] || raise('Please set OPENAI_API_KEY environment variable')
   )

data/examples/graphql_api.rb CHANGED Viewed

@@ -8,8 +8,10 @@ require 'desiru/graphql/executor'
 # Configure Desiru
 Desiru.configure do |config|
-  # Use a mock model for demonstration
-  config.default_model = Desiru::Models::RaixAdapter.new
+  # Use OpenAI model for demonstration
+  config.default_model = Desiru::Models::OpenAI.new(
+    api_key: ENV['OPENAI_API_KEY'] || raise('Please set OPENAI_API_KEY environment variable')
+  )
 end
 # Create some example modules

data/examples/graphql_integration.rb CHANGED Viewed

@@ -10,9 +10,9 @@ require 'desiru/graphql/schema_generator'
 # Configure Desiru
 Desiru.configure do |config|
-  config.default_model = Desiru::Models::RaixAdapter.new(
-    client: 'openai',
-    model: 'gpt-3.5-turbo'
+  config.default_model = Desiru::Models::OpenAI.new(
+    model: 'gpt-3.5-turbo',
+    api_key: ENV['OPENAI_API_KEY'] || raise('Please set OPENAI_API_KEY environment variable')
   )
 end

data/examples/graphql_optimization_summary.md ADDED Viewed

@@ -0,0 +1,143 @@
+# GraphQL DataLoader Optimization: Request Deduplication & Code Quality Improvements
+## Overview
+I've implemented request deduplication in the GraphQL DataLoader to prevent duplicate operations and improve performance. This optimization is particularly beneficial for GraphQL APIs that handle complex queries with repeated fields. Additionally, I've refactored the code for better maintainability and added VCR integration for reproducible testing.
+## Changes Made
+### 1. Enhanced DataLoader (`lib/desiru/graphql/data_loader.rb`)
+- Added `@pending_promises` tracking to detect duplicate requests
+- Added `@mutex` for thread-safe operations
+- Modified `perform_loads` to group identical requests and process only unique ones
+- All duplicate requests receive the same result, preventing redundant processing
+### 2. Updated BatchLoader
+- Added `check_pending_promise` method to detect existing promises for the same inputs
+- Modified `load` method to return existing promises for duplicate requests
+- Ensures thread-safe promise management
+### 3. Key Implementation Details
+**Deduplication Logic:**
+```ruby
+# Group by unique inputs to deduplicate
+unique_inputs_map = {}
+promises_by_inputs = Hash.new { |h, k| h[k] = [] }
+batch.each do |inputs, promise|
+  input_key = inputs.sort.to_h.hash
+  unique_inputs_map[input_key] = inputs
+  promises_by_inputs[input_key] << promise
+end
+# Process only unique inputs
+unique_inputs = unique_inputs_map.values
+```
+**Thread Safety:**
+- All shared state modifications are wrapped in mutex synchronization
+- Promise fulfillment is handled atomically
+- Concurrent duplicate requests are properly handled
+## Performance Impact
+The benchmark results show significant improvements:
+1. **Query with 6 fields (3 unique)**: 89.5% improvement
+2. **Nested query simulation**: 14.9% improvement
+3. **Large batch (50 fields, 10 unique)**: 6.1% improvement with 5:1 deduplication ratio
+## Benefits
+1. **Prevents N+1 Problems**: Multiple requests for the same data are automatically deduplicated
+2. **Improved Response Times**: Fewer actual module executions mean faster responses
+3. **Resource Efficiency**: Reduces load on backend systems and LLMs
+4. **Thread Safe**: Properly handles concurrent requests
+5. **Transparent**: Works automatically without changes to GraphQL schemas or queries
+## Testing
+Added comprehensive test coverage including:
+- Basic deduplication scenarios
+- Different request patterns
+- Cache interaction
+- Key ordering independence
+- Concurrent request handling
+- Thread safety verification
+All tests pass successfully.
+## Usage
+The optimization works automatically when using the GraphQL DataLoader:
+```ruby
+data_loader = Desiru::GraphQL::DataLoader.new
+executor = Desiru::GraphQL::Executor.new(schema, data_loader: data_loader)
+# Duplicate requests in the query are automatically deduplicated
+result = executor.execute(graphql_query)
+```
+## Code Quality Improvements
+### Refactored Complex Methods
+- Split `perform_loads` method into smaller, focused methods:
+  - `process_loader_batch` - Handles individual loader batches
+  - `deduplicate_batch` - Extracts deduplication logic
+  - `execute_batch` - Handles batch execution and error handling
+  - `fulfill_promises` - Manages promise fulfillment
+- Reduced method complexity from ABC size 43.69 to under 25
+- Improved code readability and maintainability
+### Architectural Improvements
+- **Extracted TypeBuilder Module**: Moved GraphQL type generation logic into a separate module
+  - Reduced SchemaGenerator class length by ~140 lines
+  - Better separation of concerns
+  - Improved testability and reusability
+- **Fixed Linting Issues**:
+  - Converted class variables to class instance variables in SchemaGenerator
+  - Fixed predicate method naming (`has_pending_loads?` → `pending_loads?`)
+  - Eliminated duplicate branch conditions in type resolution
+- **Maintained Performance**: All optimizations preserved with 83.9% improvement for duplicate requests
+### VCR Integration for Testing
+Added comprehensive VCR support for GraphQL testing:
+- **GraphQLVCRHelper** module for easy VCR configuration
+- Custom GraphQL operation matching for accurate cassette playback
+- Helpers for recording batch operations
+- Support for error recording and playback
+- Performance tracking across recordings
+**Note**: To use VCR integration, add these gems to your Gemfile:
+```ruby
+group :development, :test do
+  gem 'vcr', '~> 6.0'
+  gem 'webmock', '~> 3.0'
+end
+```
+Example usage:
+```ruby
+with_graphql_vcr('api_calls') do
+  result = executor.execute(graphql_query)
+  assert_graphql_success(result)
+end
+```
+Benefits:
+- Reproducible tests without hitting real APIs
+- Faster test execution with cassette playback
+- Easy debugging with recorded interactions
+- Consistent test results across environments
+## Future Optimizations
+Additional optimizations that could be implemented:
+1. Smarter cache key generation using content hashing
+2. Connection pooling for parallel batch processing
+3. Adaptive batch sizing based on load patterns
+4. Request prioritization for critical queries
+5. Metrics collection for monitoring deduplication effectiveness
+6. Integration with APM tools for performance tracking