RubyGems - dspy - Versions diffs - 0.3.1 → 0.4.0 - Mend

dspy 0.3.1 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (29) hide show

checksums.yaml +4 -4
data/README.md +69 -382
data/lib/dspy/chain_of_thought.rb +57 -0
data/lib/dspy/evaluate.rb +554 -0
data/lib/dspy/example.rb +203 -0
data/lib/dspy/few_shot_example.rb +81 -0
data/lib/dspy/instrumentation.rb +97 -8
data/lib/dspy/lm/adapter_factory.rb +6 -8
data/lib/dspy/lm.rb +5 -7
data/lib/dspy/predict.rb +32 -34
data/lib/dspy/prompt.rb +222 -0
data/lib/dspy/propose/grounded_proposer.rb +560 -0
data/lib/dspy/registry/registry_manager.rb +504 -0
data/lib/dspy/registry/signature_registry.rb +725 -0
data/lib/dspy/storage/program_storage.rb +442 -0
data/lib/dspy/storage/storage_manager.rb +331 -0
data/lib/dspy/subscribers/langfuse_subscriber.rb +669 -0
data/lib/dspy/subscribers/logger_subscriber.rb +120 -0
data/lib/dspy/subscribers/newrelic_subscriber.rb +686 -0
data/lib/dspy/subscribers/otel_subscriber.rb +538 -0
data/lib/dspy/teleprompt/data_handler.rb +107 -0
data/lib/dspy/teleprompt/mipro_v2.rb +790 -0
data/lib/dspy/teleprompt/simple_optimizer.rb +497 -0
data/lib/dspy/teleprompt/teleprompter.rb +336 -0
data/lib/dspy/teleprompt/utils.rb +380 -0
data/lib/dspy/version.rb +5 -0
data/lib/dspy.rb +16 -0
metadata +29 -12
data/lib/dspy/lm/adapters/ruby_llm_adapter.rb +0 -81

data/lib/dspy/example.rb ADDED Viewed

@@ -0,0 +1,203 @@
+# frozen_string_literal: true
+require 'sorbet-runtime'
+require_relative 'signature'
+module DSPy
+  # Represents a typed training/evaluation example with Signature validation
+  # Provides early validation and type safety for evaluation workflows
+  class Example
+    extend T::Sig
+    sig { returns(T.class_of(Signature)) }
+    attr_reader :signature_class
+    sig { returns(T::Struct) }
+    attr_reader :input
+    sig { returns(T::Struct) }
+    attr_reader :expected
+    sig { returns(T.nilable(String)) }
+    attr_reader :id
+    sig { returns(T.nilable(T::Hash[Symbol, T.untyped])) }
+    attr_reader :metadata
+    sig do
+      params(
+        signature_class: T.class_of(Signature),
+        input: T::Hash[Symbol, T.untyped],
+        expected: T::Hash[Symbol, T.untyped],
+        id: T.nilable(String),
+        metadata: T.nilable(T::Hash[Symbol, T.untyped])
+      ).void
+    end
+    def initialize(signature_class:, input:, expected:, id: nil, metadata: nil)
+      @signature_class = signature_class
+      @id = id
+      @metadata = metadata&.freeze
+      # Validate and create input struct
+      begin
+        @input = signature_class.input_struct_class.new(**input)
+      rescue ArgumentError => e
+        raise ArgumentError, "Invalid input for #{signature_class.name}: #{e.message}"
+      rescue TypeError => e
+        raise TypeError, "Type error in input for #{signature_class.name}: #{e.message}"
+      end
+      # Validate and create expected output struct
+      begin
+        @expected = signature_class.output_struct_class.new(**expected)
+      rescue ArgumentError => e
+        raise ArgumentError, "Invalid expected output for #{signature_class.name}: #{e.message}"
+      rescue TypeError => e
+        raise TypeError, "Type error in expected output for #{signature_class.name}: #{e.message}"
+      end
+    end
+    # Convert input struct to hash for program execution
+    sig { returns(T::Hash[Symbol, T.untyped]) }
+    def input_values
+      input_hash = {}
+      @input.class.props.keys.each do |key|
+        input_hash[key] = @input.send(key)
+      end
+      input_hash
+    end
+    # Convert expected struct to hash for comparison
+    sig { returns(T::Hash[Symbol, T.untyped]) }
+    def expected_values
+      expected_hash = {}
+      @expected.class.props.keys.each do |key|
+        expected_hash[key] = @expected.send(key)
+      end
+      expected_hash
+    end
+    # Check if prediction matches expected output using struct comparison
+    sig { params(prediction: T.untyped).returns(T::Boolean) }
+    def matches_prediction?(prediction)
+      return false unless prediction
+      # Compare each expected field with prediction
+      @expected.class.props.keys.all? do |key|
+        expected_value = @expected.send(key)
+        # Extract prediction value
+        prediction_value = case prediction
+                          when T::Struct
+                            prediction.respond_to?(key) ? prediction.send(key) : nil
+                          when Hash
+                            prediction[key] || prediction[key.to_s]
+                          else
+                            prediction.respond_to?(key) ? prediction.send(key) : nil
+                          end
+        expected_value == prediction_value
+      end
+    end
+    # Serialization for persistence and debugging
+    sig { returns(T::Hash[Symbol, T.untyped]) }
+    def to_h
+      result = {
+        signature_class: @signature_class.name,
+        input: input_values,
+        expected: expected_values
+      }
+      result[:id] = @id if @id
+      result[:metadata] = @metadata if @metadata
+      result
+    end
+    # Create Example from hash representation
+    sig do
+      params(
+        hash: T::Hash[Symbol, T.untyped],
+        signature_registry: T.nilable(T::Hash[String, T.class_of(Signature)])
+      ).returns(Example)
+    end
+    def self.from_h(hash, signature_registry: nil)
+      signature_class_name = hash[:signature_class]
+      # Resolve signature class
+      signature_class = if signature_registry && signature_registry[signature_class_name]
+                         signature_registry[signature_class_name]
+                       else
+                         # Try to resolve from constant
+                         Object.const_get(signature_class_name)
+                       end
+      new(
+        signature_class: signature_class,
+        input: hash[:input] || {},
+        expected: hash[:expected] || {},
+        id: hash[:id],
+        metadata: hash[:metadata]
+      )
+    end
+    # Batch validation for multiple examples
+    sig do
+      params(
+        signature_class: T.class_of(Signature),
+        examples_data: T::Array[T::Hash[Symbol, T.untyped]]
+      ).returns(T::Array[Example])
+    end
+    def self.validate_batch(signature_class, examples_data)
+      errors = []
+      examples = []
+      examples_data.each_with_index do |example_data, index|
+        begin
+          # Only support structured format with :input and :expected keys
+          unless example_data.key?(:input) && example_data.key?(:expected)
+            raise ArgumentError, "Example must have :input and :expected keys. Legacy flat format is no longer supported."
+          end
+          example = new(
+            signature_class: signature_class,
+            input: example_data[:input],
+            expected: example_data[:expected],
+            id: example_data[:id] || "example_#{index}"
+          )
+          examples << example
+        rescue => e
+          errors << "Example #{index}: #{e.message}"
+        end
+      end
+      unless errors.empty?
+        raise ArgumentError, "Validation errors:\n#{errors.join("\n")}"
+      end
+      examples
+    end
+    # Equality comparison
+    sig { params(other: T.untyped).returns(T::Boolean) }
+    def ==(other)
+      return false unless other.is_a?(Example)
+      @signature_class == other.signature_class &&
+        input_values == other.input_values &&
+        expected_values == other.expected_values
+    end
+    # String representation for debugging
+    sig { returns(String) }
+    def to_s
+      "DSPy::Example(#{@signature_class.name}) input=#{input_values} expected=#{expected_values}"
+    end
+    sig { returns(String) }
+    def inspect
+      to_s
+    end
+  end
+end

data/lib/dspy/few_shot_example.rb ADDED Viewed

@@ -0,0 +1,81 @@
+# frozen_string_literal: true
+require 'sorbet-runtime'
+module DSPy
+  class FewShotExample
+    extend T::Sig
+    sig { returns(T::Hash[Symbol, T.untyped]) }
+    attr_reader :input
+    sig { returns(T::Hash[Symbol, T.untyped]) }
+    attr_reader :output
+    sig { returns(T.nilable(String)) }
+    attr_reader :reasoning
+    sig do
+      params(
+        input: T::Hash[Symbol, T.untyped],
+        output: T::Hash[Symbol, T.untyped],
+        reasoning: T.nilable(String)
+      ).void
+    end
+    def initialize(input:, output:, reasoning: nil)
+      @input = input.freeze
+      @output = output.freeze
+      @reasoning = reasoning
+    end
+    sig { returns(String) }
+    def to_prompt_section
+      sections = []
+      sections << "## Input"
+      sections << "```json"
+      sections << JSON.pretty_generate(@input)
+      sections << "```"
+      if @reasoning
+        sections << "## Reasoning"
+        sections << @reasoning
+      end
+      sections << "## Output"
+      sections << "```json"
+      sections << JSON.pretty_generate(@output)
+      sections << "```"
+      sections.join("\n")
+    end
+    sig { returns(T::Hash[Symbol, T.untyped]) }
+    def to_h
+      result = {
+        input: @input,
+        output: @output
+      }
+      result[:reasoning] = @reasoning if @reasoning
+      result
+    end
+    sig { params(hash: T::Hash[Symbol, T.untyped]).returns(FewShotExample) }
+    def self.from_h(hash)
+      new(
+        input: hash[:input] || {},
+        output: hash[:output] || {},
+        reasoning: hash[:reasoning]
+      )
+    end
+    sig { params(other: T.untyped).returns(T::Boolean) }
+    def ==(other)
+      return false unless other.is_a?(FewShotExample)
+      @input == other.input &&
+        @output == other.output &&
+        @reasoning == other.reasoning
+    end
+  end
+end

data/lib/dspy/instrumentation.rb CHANGED Viewed

@@ -2,17 +2,34 @@
 require 'dry-monitor'
 require 'dry-configurable'
+require 'time'
 module DSPy
   # Core instrumentation module using dry-monitor for event emission
-  # Provides extension points for logging, Langfuse, New Relic, and custom monitoring
+  # Provides extension points for logging, OpenTelemetry, New Relic, Langfuse, and custom monitoring
   module Instrumentation
-    # Get the current logger subscriber instance (lazy initialization)
+    # Get a logger subscriber instance (creates new instance each time)
     def self.logger_subscriber
-      @logger_subscriber ||= begin
-        require_relative 'subscribers/logger_subscriber'
-        DSPy::Subscribers::LoggerSubscriber.new
-      end
+      require_relative 'subscribers/logger_subscriber'
+      DSPy::Subscribers::LoggerSubscriber.new
+    end
+    # Get an OpenTelemetry subscriber instance (creates new instance each time)
+    def self.otel_subscriber
+      require_relative 'subscribers/otel_subscriber'
+      DSPy::Subscribers::OtelSubscriber.new
+    end
+    # Get a New Relic subscriber instance (creates new instance each time)
+    def self.newrelic_subscriber
+      require_relative 'subscribers/newrelic_subscriber'
+      DSPy::Subscribers::NewrelicSubscriber.new
+    end
+    # Get a Langfuse subscriber instance (creates new instance each time)
+    def self.langfuse_subscriber
+      require_relative 'subscribers/langfuse_subscriber'
+      DSPy::Subscribers::LangfuseSubscriber.new
     end
     def self.notifications
@@ -29,6 +46,55 @@ module DSPy
         n.register_event('dspy.react.tool_call')
         n.register_event('dspy.react.iteration_complete')
         n.register_event('dspy.react.max_iterations')
+        # Evaluation events
+        n.register_event('dspy.evaluation.start')
+        n.register_event('dspy.evaluation.example')
+        n.register_event('dspy.evaluation.batch')
+        n.register_event('dspy.evaluation.batch_complete')
+        # Optimization events
+        n.register_event('dspy.optimization.start')
+        n.register_event('dspy.optimization.complete')
+        n.register_event('dspy.optimization.trial_start')
+        n.register_event('dspy.optimization.trial_complete')
+        n.register_event('dspy.optimization.bootstrap_start')
+        n.register_event('dspy.optimization.bootstrap_complete')
+        n.register_event('dspy.optimization.bootstrap_example')
+        n.register_event('dspy.optimization.minibatch_evaluation')
+        n.register_event('dspy.optimization.instruction_proposal_start')
+        n.register_event('dspy.optimization.instruction_proposal_complete')
+        n.register_event('dspy.optimization.error')
+        n.register_event('dspy.optimization.save')
+        n.register_event('dspy.optimization.load')
+        # Storage events
+        n.register_event('dspy.storage.save_start')
+        n.register_event('dspy.storage.save_complete')
+        n.register_event('dspy.storage.save_error')
+        n.register_event('dspy.storage.load_start')
+        n.register_event('dspy.storage.load_complete')
+        n.register_event('dspy.storage.load_error')
+        n.register_event('dspy.storage.delete')
+        n.register_event('dspy.storage.export')
+        n.register_event('dspy.storage.import')
+        n.register_event('dspy.storage.cleanup')
+        # Registry events
+        n.register_event('dspy.registry.register_start')
+        n.register_event('dspy.registry.register_complete')
+        n.register_event('dspy.registry.register_error')
+        n.register_event('dspy.registry.deploy_start')
+        n.register_event('dspy.registry.deploy_complete')
+        n.register_event('dspy.registry.deploy_error')
+        n.register_event('dspy.registry.rollback_start')
+        n.register_event('dspy.registry.rollback_complete')
+        n.register_event('dspy.registry.rollback_error')
+        n.register_event('dspy.registry.performance_update')
+        n.register_event('dspy.registry.export')
+        n.register_event('dspy.registry.import')
+        n.register_event('dspy.registry.auto_deployment')
+        n.register_event('dspy.registry.automatic_rollback')
       end
     end
@@ -75,6 +141,9 @@ module DSPy
     # Emit event without timing (for discrete events)
     def self.emit(event_name, payload = {})
+      # Handle nil payload
+      payload ||= {}
       enhanced_payload = payload.merge(
         timestamp: Time.now.iso8601,
         status: payload[:status] || 'success'
@@ -101,13 +170,33 @@ module DSPy
     end
     def self.emit_event(event_name, payload)
-      # Ensure logger subscriber is initialized
-      logger_subscriber
+      # Only emit events - subscribers self-register when explicitly created
       notifications.instrument(event_name, payload)
     end
     def self.setup_subscribers
       # Lazy initialization - will be created when first accessed
+      # Force initialization of enabled subscribers
+      logger_subscriber
+      # Only initialize if dependencies are available
+      begin
+        otel_subscriber if ENV['OTEL_EXPORTER_OTLP_ENDPOINT'] || defined?(OpenTelemetry)
+      rescue LoadError
+        # OpenTelemetry not available, skip
+      end
+      begin
+        newrelic_subscriber if defined?(NewRelic)
+      rescue LoadError
+        # New Relic not available, skip
+      end
+      begin
+        langfuse_subscriber if ENV['LANGFUSE_SECRET_KEY'] || defined?(Langfuse)
+      rescue LoadError
+        # Langfuse not available, skip
+      end
     end
   end
 end

data/lib/dspy/lm/adapter_factory.rb CHANGED Viewed

@@ -7,8 +7,7 @@ module DSPy
       # Maps provider prefixes to adapter classes
       ADAPTER_MAP = {
         'openai' => 'OpenAIAdapter',
-        'anthropic' => 'AnthropicAdapter',
-        'ruby_llm' => 'RubyLLMAdapter'
+        'anthropic' => 'AnthropicAdapter'
       }.freeze
       class << self
@@ -27,13 +26,12 @@ module DSPy
         # Parse model_id to determine provider and model
         def parse_model_id(model_id)
-          if model_id.include?('/')
-            provider, model = model_id.split('/', 2)
-            [provider, model]
-          else
-            # Legacy format: assume ruby_llm for backward compatibility
-            ['ruby_llm', model_id]
+          unless model_id.include?('/')
+            raise ArgumentError, "model_id must include provider (e.g., 'openai/gpt-4', 'anthropic/claude-3'). Legacy format without provider is no longer supported."
           end
+          provider, model = model_id.split('/', 2)
+          [provider, model]
         end
         def get_adapter_class(provider)

data/lib/dspy/lm.rb CHANGED Viewed

@@ -13,7 +13,6 @@ require_relative 'instrumentation/token_tracker'
 # Load adapters
 require_relative 'lm/adapters/openai_adapter'
 require_relative 'lm/adapters/anthropic_adapter'
-require_relative 'lm/adapters/ruby_llm_adapter'
 module DSPy
   class LM
@@ -80,13 +79,12 @@ module DSPy
     private
     def parse_model_id(model_id)
-      if model_id.include?('/')
-        provider, model = model_id.split('/', 2)
-        [provider, model]
-      else
-        # Legacy format: assume ruby_llm for backward compatibility
-        ['ruby_llm', model_id]
+      unless model_id.include?('/')
+        raise ArgumentError, "model_id must include provider (e.g., 'openai/gpt-4', 'anthropic/claude-3'). Legacy format without provider is no longer supported."
       end
+      provider, model = model_id.split('/', 2)
+      [provider, model]
     end
     def build_messages(inference_module, input_values)

data/lib/dspy/predict.rb CHANGED Viewed

@@ -3,6 +3,7 @@
 require 'sorbet-runtime'
 require_relative 'module'
 require_relative 'instrumentation'
+require_relative 'prompt'
 module DSPy
   # Exception raised when prediction fails validation
@@ -25,52 +26,49 @@ module DSPy
     sig { returns(T.class_of(Signature)) }
     attr_reader :signature_class
+    sig { returns(Prompt) }
+    attr_reader :prompt
     sig { params(signature_class: T.class_of(Signature)).void }
     def initialize(signature_class)
       super()
       @signature_class = signature_class
+      @prompt = Prompt.from_signature(signature_class)
     end
+    # Backward compatibility methods - delegate to prompt object
     sig { returns(String) }
     def system_signature
-      <<-PROMPT
-      Your input schema fields are:
-        ```json
-         #{JSON.generate(@signature_class.input_json_schema)}
-        ```
-      Your output schema fields are:
-        ```json
-          #{JSON.generate(@signature_class.output_json_schema)}
-        ````
-      All interactions will be structured in the following way, with the appropriate values filled in.
-      ## Input values
-        ```json
-         {input_values}
-        ```
-      ## Output values
-      Respond exclusively with the output schema fields in the json block below.
-        ```json
-          {output_values}
-        ```
-      In adhering to this structure, your objective is: #{@signature_class.description}
-      PROMPT
+      @prompt.render_system_prompt
     end
     sig { params(input_values: T::Hash[Symbol, T.untyped]).returns(String) }
     def user_signature(input_values)
-      <<-PROMPT
-        ## Input Values
-        ```json
-        #{JSON.generate(input_values)}
-        ```
-        Respond with the corresponding output schema fields wrapped in a ```json ``` block,
-         starting with the heading `## Output values`.
-      PROMPT
+      @prompt.render_user_prompt(input_values)
+    end
+    # New prompt-based interface for optimization
+    sig { params(new_prompt: Prompt).returns(Predict) }
+    def with_prompt(new_prompt)
+      # Create a new instance with the same signature but updated prompt
+      instance = self.class.new(@signature_class)
+      instance.instance_variable_set(:@prompt, new_prompt)
+      instance
+    end
+    sig { params(instruction: String).returns(Predict) }
+    def with_instruction(instruction)
+      with_prompt(@prompt.with_instruction(instruction))
+    end
+    sig { params(examples: T::Array[FewShotExample]).returns(Predict) }
+    def with_examples(examples)
+      with_prompt(@prompt.with_examples(examples))
+    end
+    sig { params(examples: T::Array[FewShotExample]).returns(Predict) }
+    def add_examples(examples)
+      with_prompt(@prompt.add_examples(examples))
     end
     sig { override.params(kwargs: T.untyped).returns(T.type_parameter(:O)) }