RubyGems - riffer - Versions diffs - 0.31.0 → 0.32.0 - Mend

riffer 0.31.0 → 0.32.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (213) hide show

checksums.yaml +4 -4
data/.agents/code-style.md +63 -4
data/.agents/rbs-inline.md +1 -6
data/.release-please-manifest.json +1 -1
data/AGENTS.md +1 -2
data/CHANGELOG.md +18 -0
data/docs/08_MESSAGES.md +1 -1
data/docs/14_MCP.md +50 -5
data/docs/providers/02_AMAZON_BEDROCK.md +14 -0
data/lib/riffer/agent/config.rb +42 -47
data/lib/riffer/agent/context.rb +70 -50
data/lib/riffer/agent/response.rb +4 -20
data/lib/riffer/agent/run.rb +28 -67
data/lib/riffer/agent/serializer.rb +22 -81
data/lib/riffer/agent/session/repair.rb +14 -40
data/lib/riffer/agent/session.rb +25 -67
data/lib/riffer/agent/structured_output/result.rb +3 -11
data/lib/riffer/agent/structured_output.rb +5 -13
data/lib/riffer/agent.rb +74 -192
data/lib/riffer/config.rb +34 -101
data/lib/riffer/evals/evaluator.rb +7 -27
data/lib/riffer/evals/evaluator_runner.rb +11 -19
data/lib/riffer/evals/judge.rb +4 -25
data/lib/riffer/evals/result.rb +1 -18
data/lib/riffer/evals/run_result.rb +0 -11
data/lib/riffer/evals/scenario_result.rb +0 -14
data/lib/riffer/evals.rb +0 -6
data/lib/riffer/guardrail.rb +4 -27
data/lib/riffer/guardrails/modification.rb +0 -10
data/lib/riffer/guardrails/result.rb +3 -30
data/lib/riffer/guardrails/runner.rb +5 -22
data/lib/riffer/guardrails/tripwire.rb +1 -19
data/lib/riffer/guardrails.rb +2 -4
data/lib/riffer/helpers/call_or_value.rb +4 -3
data/lib/riffer/helpers/class_name_converter.rb +3 -1
data/lib/riffer/helpers/dependencies.rb +5 -7
data/lib/riffer/helpers.rb +0 -5
data/lib/riffer/mcp/authenticated_tool.rb +9 -9
data/lib/riffer/mcp/client.rb +12 -17
data/lib/riffer/mcp/manifest.rb +13 -10
data/lib/riffer/mcp/registration.rb +2 -11
data/lib/riffer/mcp/registry.rb +44 -52
data/lib/riffer/mcp/search_tool.rb +53 -0
data/lib/riffer/mcp/tool_factory.rb +13 -18
data/lib/riffer/mcp.rb +12 -17
data/lib/riffer/messages/assistant.rb +2 -9
data/lib/riffer/messages/base.rb +46 -16
data/lib/riffer/messages/file_part.rb +32 -24
data/lib/riffer/messages/system.rb +0 -5
data/lib/riffer/messages/tool.rb +0 -10
data/lib/riffer/messages/user.rb +0 -10
data/lib/riffer/messages.rb +0 -7
data/lib/riffer/params/boolean.rb +2 -4
data/lib/riffer/params/param.rb +28 -39
data/lib/riffer/params.rb +9 -21
data/lib/riffer/providers/amazon_bedrock.rb +42 -28
data/lib/riffer/providers/anthropic.rb +4 -9
data/lib/riffer/providers/azure_open_ai.rb +3 -19
data/lib/riffer/providers/base.rb +13 -26
data/lib/riffer/providers/gemini.rb +4 -4
data/lib/riffer/providers/mock.rb +6 -26
data/lib/riffer/providers/open_ai.rb +6 -8
data/lib/riffer/providers/open_router.rb +4 -10
data/lib/riffer/providers/repository.rb +4 -3
data/lib/riffer/providers/token_usage.rb +9 -20
data/lib/riffer/providers.rb +0 -8
data/lib/riffer/runner/fibers.rb +10 -16
data/lib/riffer/runner/sequential.rb +1 -4
data/lib/riffer/runner/threaded.rb +3 -14
data/lib/riffer/runner.rb +2 -15
data/lib/riffer/skills/activate_tool.rb +2 -11
data/lib/riffer/skills/adapter.rb +4 -22
data/lib/riffer/skills/backend.rb +7 -21
data/lib/riffer/skills/config.rb +10 -31
data/lib/riffer/skills/context.rb +5 -20
data/lib/riffer/skills/filesystem_backend.rb +7 -25
data/lib/riffer/skills/frontmatter.rb +10 -28
data/lib/riffer/skills/markdown_adapter.rb +2 -9
data/lib/riffer/skills/xml_adapter.rb +2 -8
data/lib/riffer/stream_events/base.rb +1 -6
data/lib/riffer/stream_events/guardrail_modification.rb +1 -8
data/lib/riffer/stream_events/guardrail_tripwire.rb +1 -8
data/lib/riffer/stream_events/interrupt.rb +4 -7
data/lib/riffer/stream_events/reasoning_delta.rb +2 -4
data/lib/riffer/stream_events/reasoning_done.rb +2 -4
data/lib/riffer/stream_events/skill_activation.rb +2 -4
data/lib/riffer/stream_events/text_delta.rb +0 -2
data/lib/riffer/stream_events/text_done.rb +1 -3
data/lib/riffer/stream_events/token_usage_done.rb +1 -8
data/lib/riffer/stream_events/tool_call_delta.rb +2 -3
data/lib/riffer/stream_events/tool_call_done.rb +1 -3
data/lib/riffer/stream_events/web_search_done.rb +1 -3
data/lib/riffer/stream_events/web_search_status.rb +2 -3
data/lib/riffer/stream_events.rb +0 -10
data/lib/riffer/tool.rb +6 -13
data/lib/riffer/tools/response.rb +8 -4
data/lib/riffer/tools/runtime/fibers.rb +0 -3
data/lib/riffer/tools/runtime/inline.rb +1 -4
data/lib/riffer/tools/runtime/threaded.rb +0 -2
data/lib/riffer/tools/runtime.rb +5 -38
data/lib/riffer/tools/toolable.rb +5 -16
data/lib/riffer/tools.rb +0 -4
data/lib/riffer/version.rb +1 -1
data/lib/riffer.rb +7 -8
data/sig/generated/riffer/agent/config.rbs +29 -46
data/sig/generated/riffer/agent/context.rbs +40 -48
data/sig/generated/riffer/agent/response.rbs +4 -20
data/sig/generated/riffer/agent/run.rbs +12 -61
data/sig/generated/riffer/agent/serializer.rbs +21 -80
data/sig/generated/riffer/agent/session/repair.rbs +12 -40
data/sig/generated/riffer/agent/session.rbs +25 -67
data/sig/generated/riffer/agent/structured_output/result.rbs +2 -10
data/sig/generated/riffer/agent/structured_output.rbs +5 -12
data/sig/generated/riffer/agent.rbs +57 -186
data/sig/generated/riffer/config.rbs +34 -100
data/sig/generated/riffer/evals/evaluator.rbs +7 -27
data/sig/generated/riffer/evals/evaluator_runner.rbs +9 -19
data/sig/generated/riffer/evals/judge.rbs +4 -24
data/sig/generated/riffer/evals/result.rbs +1 -17
data/sig/generated/riffer/evals/run_result.rbs +0 -10
data/sig/generated/riffer/evals/scenario_result.rbs +0 -13
data/sig/generated/riffer/evals.rbs +0 -6
data/sig/generated/riffer/guardrail.rbs +4 -27
data/sig/generated/riffer/guardrails/modification.rbs +0 -10
data/sig/generated/riffer/guardrails/result.rbs +3 -30
data/sig/generated/riffer/guardrails/runner.rbs +5 -22
data/sig/generated/riffer/guardrails/tripwire.rbs +1 -19
data/sig/generated/riffer/guardrails.rbs +2 -4
data/sig/generated/riffer/helpers/call_or_value.rbs +4 -3
data/sig/generated/riffer/helpers/class_name_converter.rbs +1 -1
data/sig/generated/riffer/helpers/dependencies.rbs +3 -7
data/sig/generated/riffer/helpers.rbs +0 -5
data/sig/generated/riffer/mcp/authenticated_tool.rbs +5 -4
data/sig/generated/riffer/mcp/client.rbs +10 -16
data/sig/generated/riffer/mcp/manifest.rbs +9 -9
data/sig/generated/riffer/mcp/registration.rbs +2 -10
data/sig/generated/riffer/mcp/registry.rbs +11 -18
data/sig/generated/riffer/mcp/search_tool.rbs +26 -0
data/sig/generated/riffer/mcp/tool_factory.rbs +10 -15
data/sig/generated/riffer/mcp.rbs +10 -17
data/sig/generated/riffer/messages/assistant.rbs +2 -8
data/sig/generated/riffer/messages/base.rbs +11 -16
data/sig/generated/riffer/messages/file_part.rbs +13 -23
data/sig/generated/riffer/messages/system.rbs +0 -4
data/sig/generated/riffer/messages/tool.rbs +0 -9
data/sig/generated/riffer/messages/user.rbs +0 -9
data/sig/generated/riffer/messages.rbs +0 -7
data/sig/generated/riffer/params/boolean.rbs +2 -4
data/sig/generated/riffer/params/param.rbs +21 -39
data/sig/generated/riffer/params.rbs +9 -21
data/sig/generated/riffer/providers/amazon_bedrock.rbs +21 -25
data/sig/generated/riffer/providers/anthropic.rbs +2 -7
data/sig/generated/riffer/providers/azure_open_ai.rbs +3 -18
data/sig/generated/riffer/providers/base.rbs +9 -25
data/sig/generated/riffer/providers/gemini.rbs +0 -2
data/sig/generated/riffer/providers/mock.rbs +6 -26
data/sig/generated/riffer/providers/open_ai.rbs +1 -5
data/sig/generated/riffer/providers/open_router.rbs +4 -10
data/sig/generated/riffer/providers/repository.rbs +2 -3
data/sig/generated/riffer/providers/token_usage.rbs +6 -16
data/sig/generated/riffer/providers.rbs +0 -8
data/sig/generated/riffer/runner/fibers.rbs +8 -15
data/sig/generated/riffer/runner/sequential.rbs +1 -3
data/sig/generated/riffer/runner/threaded.rbs +3 -13
data/sig/generated/riffer/runner.rbs +2 -14
data/sig/generated/riffer/skills/activate_tool.rbs +2 -11
data/sig/generated/riffer/skills/adapter.rbs +4 -22
data/sig/generated/riffer/skills/backend.rbs +7 -21
data/sig/generated/riffer/skills/config.rbs +10 -31
data/sig/generated/riffer/skills/context.rbs +5 -20
data/sig/generated/riffer/skills/filesystem_backend.rbs +7 -24
data/sig/generated/riffer/skills/frontmatter.rbs +10 -27
data/sig/generated/riffer/skills/markdown_adapter.rbs +2 -9
data/sig/generated/riffer/skills/xml_adapter.rbs +2 -8
data/sig/generated/riffer/stream_events/base.rbs +1 -6
data/sig/generated/riffer/stream_events/guardrail_modification.rbs +1 -8
data/sig/generated/riffer/stream_events/guardrail_tripwire.rbs +1 -8
data/sig/generated/riffer/stream_events/interrupt.rbs +4 -7
data/sig/generated/riffer/stream_events/reasoning_delta.rbs +2 -4
data/sig/generated/riffer/stream_events/reasoning_done.rbs +2 -4
data/sig/generated/riffer/stream_events/skill_activation.rbs +2 -4
data/sig/generated/riffer/stream_events/text_delta.rbs +0 -2
data/sig/generated/riffer/stream_events/text_done.rbs +1 -3
data/sig/generated/riffer/stream_events/token_usage_done.rbs +1 -7
data/sig/generated/riffer/stream_events/tool_call_delta.rbs +2 -3
data/sig/generated/riffer/stream_events/tool_call_done.rbs +1 -3
data/sig/generated/riffer/stream_events/web_search_done.rbs +1 -3
data/sig/generated/riffer/stream_events/web_search_status.rbs +2 -3
data/sig/generated/riffer/stream_events.rbs +0 -10
data/sig/generated/riffer/tool.rbs +5 -12
data/sig/generated/riffer/tools/response.rbs +6 -4
data/sig/generated/riffer/tools/runtime/fibers.rbs +0 -3
data/sig/generated/riffer/tools/runtime/inline.rbs +1 -3
data/sig/generated/riffer/tools/runtime/threaded.rbs +0 -2
data/sig/generated/riffer/tools/runtime.rbs +5 -37
data/sig/generated/riffer/tools/toolable.rbs +4 -14
data/sig/generated/riffer/tools.rbs +0 -4
data/sig/generated/riffer.rbs +5 -4
data/sig/manual/riffer/agent/session/repair.rbs +5 -0
data/sig/manual/riffer/evals/evaluator_runner.rbs +5 -0
data/sig/manual/riffer/helpers/class_name_converter.rbs +5 -0
data/sig/manual/riffer/helpers/dependencies.rbs +5 -0
data/sig/manual/riffer/mcp/authenticated_tool.rbs +5 -0
data/sig/manual/riffer/mcp/registry.rbs +5 -0
data/sig/manual/riffer/mcp/tool_factory.rbs +5 -0
data/sig/manual/riffer/mcp.rbs +5 -0
data/sig/manual/riffer/providers/repository.rbs +5 -0
data/sig/manual/riffer.rbs +5 -0
metadata +17 -9
data/.agents/rdoc.md +0 -69
data/lib/riffer/messages/converter.rb +0 -90
data/sig/generated/riffer/messages/converter.rbs +0 -33
data/sig/manual/riffer/tools/toolable.rbs +0 -6

data/lib/riffer/config.rb CHANGED Viewed

@@ -2,20 +2,6 @@
 # rbs_inline: enabled
 # Configuration for the Riffer framework.
-#
-# Provides configuration options for AI providers and other settings.
-#
-#   Riffer.config.openai.api_key = "sk-..."
-#
-#   Riffer.config.amazon_bedrock.region = "us-east-1"
-#   Riffer.config.amazon_bedrock.api_token = "..."
-#
-#   Riffer.config.anthropic.api_key = "sk-ant-..."
-#
-#   Riffer.config.openrouter.api_key = "sk-or-..."
-#
-#   Riffer.config.evals.judge_model = "anthropic/claude-sonnet-4-20250514"
-#
 class Riffer::Config
   AmazonBedrock = Struct.new(:api_token, :region, keyword_init: true)
   Anthropic = Struct.new(:api_key, keyword_init: true)
@@ -27,22 +13,13 @@ class Riffer::Config
   Mcp = Struct.new(:credentials, :discovery_runner, keyword_init: true)
   # Skills-related global configuration.
-  #
-  # See <tt>Riffer.config.skills.default_activate_tool</tt> and
-  # <tt>Riffer.config.skills.default_backend</tt>.
   class Skills
-    # Default skill activation tool class.
-    #
-    # The tool class the LLM calls to activate a skill. Defaults to
-    # <tt>Riffer::Skills::ActivateTool</tt>. Per-agent override is available
-    # via <tt>skills do; activate_tool ...; end</tt>.
+    # The tool class the LLM calls to activate a skill; defaults to
+    # <tt>Riffer::Skills::ActivateTool</tt>.
     attr_reader :default_activate_tool #: singleton(Riffer::Tool)
-    # Default skills backend.
-    #
-    # Used by agents that declare a +skills+ block without specifying a
-    # backend. Accepts a Riffer::Skills::Backend instance or a Proc.
-    # Defaults to +nil+ (no global default).
+    # Default skills backend for agents that declare a +skills+ block without
+    # one; defaults to +nil+.
     attr_reader :default_backend #: (Riffer::Skills::Backend | Proc)?
     #--
@@ -52,10 +29,8 @@ class Riffer::Config
       @default_backend = nil
     end
-    # Sets the default skill activation tool class.
-    #
-    # Raises +Riffer::ArgumentError+ if the value is not a Riffer::Tool subclass.
-    #
+    # Sets the default skill activation tool class. Raises Riffer::ArgumentError
+    # on an invalid value.
     #--
     #: (singleton(Riffer::Tool)) -> void
     def default_activate_tool=(value)
@@ -63,11 +38,8 @@ class Riffer::Config
       @default_activate_tool = value
     end
-    # Sets the default skills backend.
-    #
-    # Raises +Riffer::ArgumentError+ if the value is not a
-    # Riffer::Skills::Backend instance, a Proc, or +nil+.
-    #
+    # Sets the default skills backend. Raises Riffer::ArgumentError on an
+    # invalid value.
     #--
     #: ((Riffer::Skills::Backend | Proc)?) -> void
     def default_backend=(value)
@@ -79,49 +51,38 @@ class Riffer::Config
   VALID_MESSAGE_ID_STRATEGIES = %i[none uuid uuidv7].freeze
-  # Amazon Bedrock configuration (Struct with +api_token+ and +region+).
+  # Amazon Bedrock configuration.
   attr_reader :amazon_bedrock #: Riffer::Config::AmazonBedrock
-  # Anthropic configuration (Struct with +api_key+).
+  # Anthropic configuration.
   attr_reader :anthropic #: Riffer::Config::Anthropic
-  # Azure OpenAI configuration (Struct with +api_key+ and +endpoint+).
+  # Azure OpenAI configuration.
   attr_reader :azure_openai #: Riffer::Config::AzureOpenAI
-  # Google Gemini configuration (Struct with +api_key+, +open_timeout+, and +read_timeout+).
+  # Google Gemini configuration.
   attr_reader :gemini #: Riffer::Config::Gemini
-  # OpenAI configuration (Struct with +api_key+).
+  # OpenAI configuration.
   attr_reader :openai #: Riffer::Config::OpenAI
-  # OpenRouter configuration (Struct with +api_key+).
+  # OpenRouter configuration.
   attr_reader :openrouter #: Riffer::Config::OpenRouter
-  # Evals configuration (Struct with +judge_model+).
+  # Evals configuration.
   attr_reader :evals #: Riffer::Config::Evals
-  # MCP configuration (Struct with +credentials+ and +discovery_runner+).
-  #
-  # +credentials+ is an optional Proc for per-run MCP +tools/call+ HTTP headers.
-  # Signature: +->(manifest:, matched_tags:, context:) { Hash or nil }+.
-  # +nil+ from the proc at tool-resolution time omits that server's tools; +nil+
-  # at tool-call time raises Riffer::Mcp::CredentialsDeniedError.
-  #
-  # +discovery_runner+ is the Riffer::Runner used to execute tool discovery
-  # (default +Runner::Sequential+).
+  # MCP configuration. +credentials+ is an optional Proc returning per-run
+  # +tools/call+ headers (or +nil+ to deny); +discovery_runner+ runs tool
+  # discovery.
   attr_reader :mcp #: Riffer::Config::Mcp
-  # Global tool runtime configuration (experimental).
-  #
-  # Accepts a Riffer::Tools::Runtime subclass, a Riffer::Tools::Runtime instance,
-  # or a Proc. Defaults to <tt>Riffer::Tools::Runtime::Inline.new</tt>.
+  # Global tool runtime configuration (experimental); defaults to
+  # <tt>Riffer::Tools::Runtime::Inline.new</tt>.
   attr_reader :tool_runtime #: (singleton(Riffer::Tools::Runtime) | Riffer::Tools::Runtime | Proc)
-  # Sets the global tool runtime.
-  #
-  # Raises +Riffer::ArgumentError+ if the value is not a valid runtime
-  # (ToolRuntime subclass, ToolRuntime instance, or Proc).
-  #
+  # Sets the global tool runtime. Raises Riffer::ArgumentError on an invalid
+  # value.
   #--
   #: ((singleton(Riffer::Tools::Runtime) | Riffer::Tools::Runtime | Proc)) -> void
   def tool_runtime=(value)
@@ -130,23 +91,16 @@ class Riffer::Config
     @tool_runtime = value
   end
-  # Skills-related global configuration. Returns a Riffer::Config::Skills
-  # object — see <tt>Riffer.config.skills.default_activate_tool</tt>.
+  # Skills-related global configuration.
   attr_reader :skills #: Riffer::Config::Skills
-  # Strategy for auto-generating message ids. One of +:none+ (default, no id),
-  # +:uuid+ (UUIDv4), or +:uuidv7+ (time-ordered UUIDv7).
-  #
-  # When set to anything other than +:none+, each +Riffer::Messages::Base+
-  # instance gets an +id+ populated at construction time, and seeded messages
-  # passed to +Riffer::Agent#generate+ must carry their own +:id+.
+  # Strategy for auto-generating message ids: +:none+ (default), +:uuid+, or
+  # +:uuidv7+. When not +:none+, messages get an +id+ at construction, and
+  # seeded messages passed to +Riffer::Agent#generate+ must carry their own.
   attr_reader :message_id_strategy #: Symbol
-  # Sets the message id strategy.
-  #
-  # Raises +Riffer::ArgumentError+ if the value is not one of
-  # +:none+, +:uuid+, or +:uuidv7+.
-  #
+  # Sets the message id strategy. Raises Riffer::ArgumentError unless the value
+  # is +:none+, +:uuid+, or +:uuidv7+.
   #--
   #: (Symbol) -> void
   def message_id_strategy=(value)
@@ -157,35 +111,14 @@ class Riffer::Config
     @message_id_strategy = value
   end
-  # Experimental: when +true+, riffer keeps the +tool_use+ ↔ +tool_result+
-  # invariant intact on its own.
-  #
-  # - On +Riffer::Agent#generate(messages_array)+, orphaned +tool_use+
-  #   exchanges and parentless +Riffer::Messages::Tool+ messages are
-  #   silently stripped from the seed. Pending tool calls on the resume
-  #   boundary (last assistant whose tail is purely Tool results) are
-  #   preserved for +execute_pending_tool_calls+.
-  # - On any interrupt (caller-issued +interrupt!+ or
-  #   +INTERRUPT_MAX_STEPS+), riffer fills any orphaned +tool_use+ with a
-  #   placeholder +Riffer::Messages::Tool+ carrying
-  #   +error_type: :interrupted+, leaving history valid for the next turn.
-  #   Filled call_ids are exposed on
-  #   +Riffer::Agent::Response#healed_tool_call_ids+ (and the streaming
-  #   +Riffer::StreamEvents::Interrupt+ event).
-  #
-  # Defaults to +false+ — the pre-healing behavior. Experimental: the
-  # surface and default may change without notice.
+  # Experimental: when +true+, riffer maintains the +tool_use+ ↔ +tool_result+
+  # invariant itself — stripping orphaned exchanges and filling interrupted
+  # ones. Defaults to +false+; the surface may change without notice.
   attr_reader :experimental_history_healing #: bool
-  # Sets the +experimental_history_healing+ flag.
-  #
-  # Coerces common boolean representations so values pulled from
-  # environment variables don't silently enable healing — the string
-  # +"false"+ is truthy in Ruby and would otherwise flip the flag on.
-  # Accepts +true+/+false+, +"true"+/+"false"+, +1+/+0+, +"1"+/+"0"+, and
-  # +nil+ (treated as +false+, the default). Raises
-  # +Riffer::ArgumentError+ for any other value.
-  #
+  # Sets the +experimental_history_healing+ flag, coercing boolean-ish values so
+  # an env-var +"false"+ (truthy in Ruby) doesn't silently enable healing.
+  # Raises Riffer::ArgumentError on an unrecognized value.
   #--
   #: (untyped) -> void
   def experimental_history_healing=(value)

data/lib/riffer/evals/evaluator.rb CHANGED Viewed

@@ -1,13 +1,9 @@
 # frozen_string_literal: true
 # rbs_inline: enabled
-# Base class for all evaluators in the Riffer framework.
-#
-# Provides a DSL for defining evaluator metadata and the evaluate method.
-# Simple evaluators only need to set +instructions+ — the base class
-# handles calling the judge automatically.
-#
-# See examples/evaluators/ for reference implementations.
+# Base class for all evaluators. Set +instructions+ and the base class calls
+# the judge automatically; override +#evaluate+ for custom logic. See
+# examples/evaluators/ for reference implementations.
 #
 #   class MyEvaluator < Riffer::Evals::Evaluator
 #     instructions "Assess medical accuracy of the response..."
@@ -54,18 +50,9 @@ class Riffer::Evals::Evaluator
     end
   end
-  # Evaluates an input/output pair.
-  #
-  # The default implementation calls the judge with the class-level +instructions+.
-  # Override this method for custom evaluation logic (e.g. rule-based evaluators).
-  #
-  # [input] the input to evaluate; String or Array of message hashes/Message objects.
-  # [output] the agent's response to evaluate.
-  # [ground_truth] optional reference answer for comparison.
-  # [messages] the full message history from the agent conversation.
-  #
-  # Raises NotImplementedError if neither +instructions+ is set nor +evaluate+ is overridden.
-  #
+  # Evaluates an input/output pair. The default calls the judge with the
+  # class-level +instructions+; override for custom logic (e.g. rule-based
+  # evaluators).
   #--
   #: (input: String | Array[Hash[Symbol, untyped] | Riffer::Messages::Base], output: String, ?ground_truth: String?, ?messages: Array[Riffer::Messages::Base]) -> Riffer::Evals::Result
   def evaluate(input:, output:, ground_truth: nil, messages: [])
@@ -84,12 +71,6 @@ class Riffer::Evals::Evaluator
   private
-  # Formats the input for the judge.
-  #
-  # String inputs are passed through as-is.
-  # Array inputs (message hashes or Message objects) are formatted
-  # as labeled role/content pairs separated by blank lines.
-  #
   #--
   #: (String | Array[Hash[Symbol, untyped] | Riffer::Messages::Base]) -> String
   def format_input(input)
@@ -122,8 +103,7 @@ class Riffer::Evals::Evaluator
     end
   end
-  # Helper to build a Result object.
-  #
+  # Builds a Result for this evaluator.
   #--
   #: (score: Float, ?reason: String?, ?metadata: Hash[Symbol, untyped]) -> Riffer::Evals::Result
   def result(score:, reason: nil, metadata: {})

data/lib/riffer/evals/evaluator_runner.rb CHANGED Viewed

@@ -3,10 +3,6 @@
 # Orchestrates running evaluators against an agent across multiple scenarios.
 #
-# Accepts an agent class, a list of scenarios, and evaluator classes.
-# Generates agent output for each scenario and runs all evaluators,
-# returning a RunResult with per-scenario details and aggregate scores.
-#
 #   result = Riffer::Evals::EvaluatorRunner.run(
 #     agent: MyAgent,
 #     scenarios: [
@@ -18,20 +14,14 @@
 #
 #   result.scores   # => { AnswerRelevancyEvaluator => 0.85 }
 #
-class Riffer::Evals::EvaluatorRunner
-  # Runs evaluators against an agent for the given scenarios.
-  #
-  # [agent] an Agent subclass (not an instance).
-  # [scenarios] array of hashes with +:input+, optional +:ground_truth+, and optional +:context+.
-  # [evaluators] array of Evaluator subclasses to run against each scenario.
-  # [context] optional hash passed to +agent.generate+. Per-scenario +:context+ takes precedence.
-  #
-  # Raises Riffer::ArgumentError if agent is not a Riffer::Agent subclass
-  # or any eval is not a Riffer::Evals::Evaluator subclass.
-  #
+module Riffer::Evals::EvaluatorRunner
+  extend self
+  # Runs evaluators against an agent for the given scenarios. Raises
+  # Riffer::ArgumentError on an invalid agent or evaluator.
   #--
   #: (agent: singleton(Riffer::Agent), scenarios: Array[Hash[Symbol, untyped]], evaluators: Array[singleton(Riffer::Evals::Evaluator)], ?context: Hash[Symbol, untyped]?) -> Riffer::Evals::RunResult
-  def self.run(agent:, scenarios:, evaluators:, context: nil)
+  def run(agent:, scenarios:, evaluators:, context: nil)
     validate_agent!(agent)
     validate_evaluators!(evaluators)
@@ -42,9 +32,11 @@ class Riffer::Evals::EvaluatorRunner
     Riffer::Evals::RunResult.new(scenario_results: scenario_results)
   end
+  private
   #--
   #: (singleton(Riffer::Agent)) -> void
-  private_class_method def self.validate_agent!(agent)
+  def validate_agent!(agent)
     return if agent.is_a?(Class) && agent < Riffer::Agent
     raise Riffer::ArgumentError, "agent must be a subclass of Riffer::Agent, got #{agent.inspect}"
@@ -52,7 +44,7 @@ class Riffer::Evals::EvaluatorRunner
   #--
   #: (Array[singleton(Riffer::Evals::Evaluator)]) -> void
-  private_class_method def self.validate_evaluators!(evaluators)
+  def validate_evaluators!(evaluators)
     evaluators.each do |evaluator_class|
       next if evaluator_class.is_a?(Class) && evaluator_class < Riffer::Evals::Evaluator
@@ -62,7 +54,7 @@ class Riffer::Evals::EvaluatorRunner
   #--
   #: (agent: singleton(Riffer::Agent), scenario: Hash[Symbol, untyped], evaluators: Array[singleton(Riffer::Evals::Evaluator)], ?context: Hash[Symbol, untyped]?) -> Riffer::Evals::ScenarioResult
-  private_class_method def self.run_scenario(agent:, scenario:, evaluators:, context: nil)
+  def run_scenario(agent:, scenario:, evaluators:, context: nil)
     input = scenario[:input]
     ground_truth = scenario[:ground_truth]
     resolved_context = scenario[:context] || context

data/lib/riffer/evals/judge.rb CHANGED Viewed

@@ -3,21 +3,8 @@
 require "json"
-# Executes LLM-as-judge evaluations using the provider infrastructure.
-#
-# The Judge class handles calling an LLM to evaluate agent outputs
-# and parsing the structured response. It uses tool calling internally
-# to get guaranteed structured output from the judge model.
-#
-#   judge = Riffer::Evals::Judge.new(model: "anthropic/claude-opus-4-5-20251101")
-#   result = judge.evaluate(
-#     instructions: "Assess answer relevancy...",
-#     input: "What is Ruby?",
-#     output: "Ruby is a programming language."
-#   )
-#   result[:score]  # => 0.85
-#   result[:reason] # => "The response is relevant..."
-#
+# Executes LLM-as-judge evaluations, using tool calling internally to get
+# structured output from the judge model.
 class Riffer::Evals::Judge
   # @rbs @provider_options: Hash[Symbol, untyped]
   # @rbs @provider_instance: Riffer::Providers::Base?
@@ -44,8 +31,7 @@ class Riffer::Evals::Judge
   # The model string (provider/model format).
   attr_reader :model #: String
-  # Initializes a new judge.
-  #
+  # Raises Riffer::ArgumentError unless +model+ is "provider/model" format.
   #--
   #: (model: String, ?provider_options: Hash[Symbol, untyped]) -> void
   def initialize(model:, provider_options: {})
@@ -58,14 +44,7 @@ class Riffer::Evals::Judge
     @provider_options = provider_options
   end
-  # Evaluates using the configured LLM.
-  #
-  # Composes system and user messages from the semantic fields:
-  # [instructions] evaluation criteria and scoring rubric.
-  # [input] the original input/question.
-  # [output] the agent's response to evaluate.
-  # [ground_truth] optional reference answer for comparison.
-  #
+  # Evaluates an input/output pair using the configured LLM.
   #--
   #: (instructions: String, input: String, output: String, ?ground_truth: String?) -> Hash[Symbol, untyped]
   def evaluate(instructions:, input:, output:, ground_truth: nil)

data/lib/riffer/evals/result.rb CHANGED Viewed

@@ -2,20 +2,6 @@
 # rbs_inline: enabled
 # Represents the result of a single evaluation.
-#
-# Contains the score, reason, and metadata from running an evaluator.
-#
-#   result = Riffer::Evals::Result.new(
-#     evaluator: AnswerRelevancyEvaluator,
-#     score: 0.85,
-#     reason: "The response addresses the question directly.",
-#     higher_is_better: true
-#   )
-#
-#   result.score           # => 0.85
-#   result.evaluator       # => AnswerRelevancyEvaluator
-#   result.higher_is_better # => true
-#
 class Riffer::Evals::Result
   # The evaluator class that produced this result.
   attr_reader :evaluator #: singleton(Riffer::Evals::Evaluator)
@@ -32,10 +18,7 @@ class Riffer::Evals::Result
   # Whether higher scores are better for this evaluator.
   attr_reader :higher_is_better #: bool
-  # Initializes a new evaluation result.
-  #
-  # Raises Riffer::ArgumentError if score is not between 0.0 and 1.0.
-  #
+  # Raises Riffer::ArgumentError if +score+ is not between 0.0 and 1.0.
   #--
   #: (evaluator: singleton(Riffer::Evals::Evaluator), score: Float, ?reason: String?, ?metadata: Hash[Symbol, untyped], ?higher_is_better: bool) -> void
   def initialize(evaluator:, score:, reason: nil, metadata: {}, higher_is_better: true)

data/lib/riffer/evals/run_result.rb CHANGED Viewed

@@ -2,21 +2,10 @@
 # rbs_inline: enabled
 # Represents the complete result of an evaluation run across multiple scenarios.
-#
-# Contains per-scenario results and provides aggregate scores.
-#
-#   run_result = Riffer::Evals::RunResult.new(
-#     scenario_results: [scenario_result1, scenario_result2]
-#   )
-#
-#   run_result.scores   # => { MyEvaluator => 0.85 }
-#
 class Riffer::Evals::RunResult
   # Per-scenario evaluation results.
   attr_reader :scenario_results #: Array[Riffer::Evals::ScenarioResult]
-  # Initializes a new run result.
-  #
   #--
   #: (scenario_results: Array[Riffer::Evals::ScenarioResult]) -> void
   def initialize(scenario_results:)

data/lib/riffer/evals/scenario_result.rb CHANGED Viewed

@@ -2,18 +2,6 @@
 # rbs_inline: enabled
 # Represents the result of evaluating a single scenario.
-#
-# Contains the input, output, ground truth, and individual evaluator results.
-#
-#   scenario_result = Riffer::Evals::ScenarioResult.new(
-#     input: "What is Ruby?",
-#     output: "A programming language.",
-#     ground_truth: "A programming language",
-#     results: [result1, result2]
-#   )
-#
-#   scenario_result.scores  # => { MyEvaluator => 0.85 }
-#
 class Riffer::Evals::ScenarioResult
   # The input that was evaluated.
   attr_reader :input #: String
@@ -30,8 +18,6 @@ class Riffer::Evals::ScenarioResult
   # The full message history from the agent conversation.
   attr_reader :messages #: Array[Riffer::Messages::Base]
-  # Initializes a new scenario result.
-  #
   #--
   #: (input: String, output: String, ground_truth: String?, results: Array[Riffer::Evals::Result], ?messages: Array[Riffer::Messages::Base]) -> void
   def initialize(input:, output:, ground_truth:, results:, messages: [])

data/lib/riffer/evals.rb CHANGED Viewed

@@ -1,11 +1,5 @@
 # frozen_string_literal: true
 # rbs_inline: enabled
-# Riffer::Evals provides LLM-as-judge evaluation capabilities.
-#
-# Evals allow you to measure the quality of agent outputs using
-# configurable evaluators and scenarios.
-#
-# See Riffer::Evals::Evaluator, Riffer::Evals::EvaluatorRunner, and Riffer::Evals::RunResult.
 module Riffer::Evals
 end

data/lib/riffer/guardrail.rb CHANGED Viewed

@@ -3,8 +3,6 @@
 # Base class for guardrails that process input and output in the agent pipeline.
 #
-# Subclass this to create custom guardrails:
-#
 #   class MyGuardrail < Riffer::Guardrail
 #     def process_input(messages, context:)
 #       # Return pass(messages), transform(modified_messages), or block(reason)
@@ -17,27 +15,16 @@
 #     end
 #   end
 class Riffer::Guardrail
-  # Processes input messages before they are sent to the LLM.
-  #
-  # Override this method in subclasses to implement input processing.
-  #
-  # [messages] the input messages.
-  # [context] optional context passed to the agent.
-  #
+  # Processes input messages before they're sent to the LLM; override in
+  # subclasses.
   #--
   #: (Array[Riffer::Messages::Base], context: untyped) -> Riffer::Guardrails::Result
   def process_input(messages, context:)
     pass(messages)
   end
-  # Processes output response after it is received from the LLM.
-  #
-  # Override this method in subclasses to implement output processing.
-  #
-  # [response] the LLM response.
-  # [messages] the conversation messages.
-  # [context] optional context passed to the agent.
-  #
+  # Processes the output response after it's received from the LLM; override in
+  # subclasses.
   #--
   #: (Riffer::Messages::Assistant, messages: Array[Riffer::Messages::Base], context: untyped) -> Riffer::Guardrails::Result
   def process_output(response, messages:, context:)
@@ -47,9 +34,6 @@ class Riffer::Guardrail
   protected
   # Creates a pass result that continues with unchanged data.
-  #
-  # [data] the original data to pass through.
-  #
   #--
   #: (untyped) -> Riffer::Guardrails::Result
   def pass(data)
@@ -57,9 +41,6 @@ class Riffer::Guardrail
   end
   # Creates a transform result that continues with transformed data.
-  #
-  # [data] the transformed data.
-  #
   #--
   #: (untyped) -> Riffer::Guardrails::Result
   def transform(data)
@@ -67,10 +48,6 @@ class Riffer::Guardrail
   end
   # Creates a block result that halts execution.
-  #
-  # [reason] the reason for blocking.
-  # [metadata] optional additional information.
-  #
   #--
   #: (String, ?metadata: Hash[Symbol, untyped]?) -> Riffer::Guardrails::Result
   def block(reason, metadata: nil)

data/lib/riffer/guardrails/modification.rb CHANGED Viewed

@@ -2,10 +2,6 @@
 # rbs_inline: enabled
 # Records a guardrail transformation event.
-#
-# When a guardrail transforms data (via +transform+), a Modification is
-# created to record which guardrail made the change, in which phase, and
-# which message indices were affected.
 class Riffer::Guardrails::Modification
   # The guardrail class that transformed data.
   attr_reader :guardrail #: singleton(Riffer::Guardrail)
@@ -16,12 +12,6 @@ class Riffer::Guardrails::Modification
   # The indices of messages that were changed.
   attr_reader :message_indices #: Array[Integer]
-  # Creates a new modification record.
-  #
-  # [guardrail] the guardrail class that transformed.
-  # [phase] :before or :after.
-  # [message_indices] indices of changed messages.
-  #
   #--
   #: (guardrail: singleton(Riffer::Guardrail), phase: Symbol, message_indices: Array[Integer]) -> void
   def initialize(guardrail:, phase:, message_indices:)

data/lib/riffer/guardrails/result.rb CHANGED Viewed

@@ -1,18 +1,8 @@
 # frozen_string_literal: true
 # rbs_inline: enabled
-# Represents the result of a guardrail execution.
-#
-# Results can be one of three types:
-# - pass: Continue with the original data unchanged
-# - transform: Continue with transformed data
-# - block: Halt execution with a reason
-#
-# Use the factory methods to create results:
-#
-#   Result.pass(data)
-#   Result.transform(data)
-#   Result.block(reason, metadata: nil)
+# Represents the result of a guardrail execution: +pass+ (continue unchanged),
+# +transform+ (continue with changed data), or +block+ (halt with a reason).
 class Riffer::Guardrails::Result
   TYPES = %i[pass transform block].freeze #: Array[Symbol]
@@ -27,9 +17,6 @@ class Riffer::Guardrails::Result
   class << self
     # Creates a pass result that continues with unchanged data.
-    #
-    # [data] the original data to pass through.
-    #
     #--
     #: (untyped) -> Riffer::Guardrails::Result
     def pass(data)
@@ -37,9 +24,6 @@ class Riffer::Guardrails::Result
     end
     # Creates a transform result that continues with transformed data.
-    #
-    # [data] the transformed data.
-    #
     #--
     #: (untyped) -> Riffer::Guardrails::Result
     def transform(data)
@@ -47,10 +31,6 @@ class Riffer::Guardrails::Result
     end
     # Creates a block result that halts execution.
-    #
-    # [reason] the reason for blocking.
-    # [metadata] optional additional information.
-    #
     #--
     #: (String, ?metadata: Hash[Symbol, untyped]?) -> Riffer::Guardrails::Result
     def block(reason, metadata: nil)
@@ -58,14 +38,7 @@ class Riffer::Guardrails::Result
     end
   end
-  # Creates a new result.
-  #
-  # [type] the result type (:pass, :transform, or :block).
-  # [data] the data or reason.
-  # [metadata] optional metadata for block results.
-  #
-  # Raises Riffer::ArgumentError if the result type is invalid.
-  #
+  # Raises Riffer::ArgumentError if +type+ is not :pass, :transform, or :block.
   #--
   #: (Symbol, untyped, ?metadata: Hash[Symbol, untyped]?) -> void
   def initialize(type, data, metadata: nil)