RubyGems - agent-harness - Versions diffs - 0.10.0 → 0.11.1 - Mend

agent-harness 0.10.0 → 0.11.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (19) hide show

checksums.yaml +4 -4
data/.release-please-manifest.json +1 -1
data/CHANGELOG.md +18 -0
data/lib/agent_harness/configuration.rb +137 -0
data/lib/agent_harness/conversation.rb +326 -0
data/lib/agent_harness/mcp_server.rb +32 -0
data/lib/agent_harness/openai_compatible_transport.rb +391 -0
data/lib/agent_harness/provider_runtime.rb +40 -4
data/lib/agent_harness/providers/adapter.rb +62 -3
data/lib/agent_harness/providers/anthropic.rb +30 -0
data/lib/agent_harness/providers/base.rb +173 -0
data/lib/agent_harness/providers/github_copilot.rb +61 -0
data/lib/agent_harness/sub_agent_config.rb +118 -0
data/lib/agent_harness/sub_agent_file_loader.rb +55 -0
data/lib/agent_harness/sub_agent_translator.rb +243 -0
data/lib/agent_harness/text_transport.rb +320 -13
data/lib/agent_harness/version.rb +1 -1
data/lib/agent_harness.rb +22 -0
metadata +6 -1

data/lib/agent_harness/openai_compatible_transport.rb ADDED Viewed

@@ -0,0 +1,391 @@
+# frozen_string_literal: true
+require "net/http"
+require "json"
+require "uri"
+module AgentHarness
+  # OpenAI-compatible HTTP transport for multi-turn chat completions.
+  #
+  # Supports any endpoint that implements the OpenAI chat completions API,
+  # including OpenAI, GitHub Models, OpenRouter, and other compatible services.
+  #
+  # @example Non-streaming
+  #   transport = AgentHarness::OpenAICompatibleTransport.new(
+  #     base_url: "https://api.openai.com/v1",
+  #     api_key: "sk-...",
+  #     model: "gpt-4o"
+  #   )
+  #   response = transport.chat(messages: [{ role: "user", content: "Hello" }])
+  #
+  # @example Streaming
+  #   transport.chat(messages: msgs, stream: true) do |chunk|
+  #     case chunk[:type]
+  #     when :text    then print chunk[:content]
+  #     when :usage   then puts "\nTokens: #{chunk[:input_tokens]}+#{chunk[:output_tokens]}"
+  #     when :done    then puts "Stream complete"
+  #     end
+  #   end
+  class OpenAICompatibleTransport
+    DEFAULT_TIMEOUT = 300
+    DEFAULT_MAX_TOKENS = 4096
+    USER_AGENT = "AgentHarness/1.0"
+    # @param base_url [String] API base URL (e.g. "https://api.openai.com/v1")
+    # @param api_key [String] bearer token for authentication
+    # @param model [String] default model identifier
+    # @param logger [Logger, nil] optional logger
+    def initialize(base_url:, api_key:, model:, logger: nil)
+      @base_url = base_url.chomp("/")
+      @api_key = api_key
+      @model = model
+      @logger = logger
+    end
+    # Send a chat completion request.
+    #
+    # Streaming chunks can be received via block, +on_chat_chunk+ proc,
+    # or an observer that responds to +on_chat_chunk+. When multiple
+    # receivers are provided, all receive every event.
+    #
+    # @param messages [Array<Hash>] conversation messages
+    # @param tools [Array<Hash>, nil] tool/function definitions
+    # @param stream [Boolean] whether to stream the response
+    # @param max_tokens [Integer, nil] maximum tokens in the response
+    # @param temperature [Float, nil] sampling temperature
+    # @param model [String, nil] model override for this request
+    # @param on_chat_chunk [Proc, nil] callback for structured streaming events
+    # @param observer [#on_chat_chunk, nil] observer receiving streaming events
+    # @yield [Hash] streaming chunks when stream: true
+    # @return [Response] the response
+    # @raise [AuthenticationError] on 401/403 responses
+    # @raise [RateLimitError] on 429 responses
+    # @raise [TimeoutError] on network timeouts
+    # @raise [ProviderError] on other HTTP errors
+    def chat(messages:, tools: nil, stream: false, max_tokens: nil, temperature: nil,
+      model: nil, on_chat_chunk: nil, observer: nil, &on_chunk)
+      max_tokens ||= DEFAULT_MAX_TOKENS
+      model ||= @model
+      uri = URI("#{@base_url}/chat/completions")
+      has_stream_receiver = on_chunk || on_chat_chunk || observer_responds_to?(observer, :on_chat_chunk)
+      request_stream = stream && has_stream_receiver
+      body = build_request_body(
+        messages: messages, tools: tools, stream: request_stream,
+        max_tokens: max_tokens, temperature: temperature, model: model
+      )
+      start_time = Time.now
+      if request_stream
+        combined = build_chat_chunk_callback(on_chunk, on_chat_chunk, observer)
+        result = make_streaming_request(uri, body, &combined)
+        duration = Time.now - start_time
+        build_streaming_response(result, duration: duration, model: model)
+      else
+        http_response = make_request(uri, body)
+        duration = Time.now - start_time
+        parse_response(http_response, duration: duration, model: model)
+      end
+    end
+    private
+    def build_request_body(messages:, tools:, stream:, max_tokens:, temperature:, model: nil)
+      body = {
+        model: model || @model,
+        max_tokens: max_tokens,
+        messages: messages
+      }
+      body[:temperature] = temperature if temperature
+      body[:tools] = tools if tools
+      body[:stream] = true if stream
+      body[:stream_options] = {include_usage: true} if stream
+      body
+    end
+    def make_request(uri, body)
+      http = build_http(uri)
+      request = build_post_request(uri, body)
+      @logger&.debug("[AgentHarness::OpenAICompatibleTransport] POST #{uri} model=#{body[:model]}")
+      http.request(request)
+    rescue Net::OpenTimeout, Net::ReadTimeout => e
+      raise TimeoutError.new(e.message, original_error: e)
+    rescue SocketError, Errno::ECONNREFUSED, Errno::ECONNRESET, IOError => e
+      raise ProviderError.new("HTTP connection error: #{e.message}", original_error: e)
+    end
+    def make_streaming_request(uri, body, &on_chunk)
+      http = build_http(uri)
+      request = build_post_request(uri, body)
+      @logger&.debug("[AgentHarness::OpenAICompatibleTransport] POST #{uri} model=#{body[:model]} stream=true")
+      accumulated = {content: +"", tool_calls: [], model: nil, usage: nil}
+      http.request(request) do |http_response|
+        status_code = http_response.code.to_i
+        unless status_code == 200
+          response_body = http_response.read_body
+          handle_error_response_raw(response_body, status_code)
+        end
+        parse_sse_stream(http_response, accumulated, &on_chunk)
+      end
+      accumulated
+    rescue Net::OpenTimeout, Net::ReadTimeout => e
+      raise TimeoutError.new(e.message, original_error: e)
+    rescue SocketError, Errno::ECONNREFUSED, Errno::ECONNRESET, IOError => e
+      raise ProviderError.new("HTTP connection error: #{e.message}", original_error: e)
+    end
+    def parse_sse_stream(http_response, accumulated, &on_chunk)
+      buffer = +""
+      http_response.read_body do |chunk|
+        buffer << chunk
+        while (line_end = buffer.index("\n"))
+          line = buffer.slice!(0, line_end + 1).strip
+          next if line.empty?
+          next unless line.start_with?("data: ")
+          data = line[6..]
+          next if data == "[DONE]"
+          begin
+            event = JSON.parse(data)
+          rescue JSON::ParserError => e
+            @logger&.warn("[AgentHarness::OpenAICompatibleTransport] Skipping malformed SSE event: #{e.message}")
+            next
+          end
+          process_stream_event(event, accumulated, &on_chunk)
+        end
+      end
+    end
+    def process_stream_event(event, accumulated, &on_chunk)
+      accumulated[:model] ||= event["model"]
+      if event["usage"]
+        usage = extract_usage(event)
+        accumulated[:usage] = usage
+        on_chunk.call({type: :usage, input_tokens: usage[:input], output_tokens: usage[:output]})
+        on_chunk.call({type: :done})
+        return
+      end
+      choice = event.dig("choices", 0)
+      return unless choice
+      delta = choice["delta"] || {}
+      if delta["content"]
+        accumulated[:content] << delta["content"]
+        on_chunk.call({type: :text, content: delta["content"]})
+      end
+      process_tool_call_delta(delta, accumulated, &on_chunk)
+      emit_tool_call_completions(choice, accumulated, &on_chunk)
+    end
+    def process_tool_call_delta(delta, accumulated, &on_chunk)
+      return unless delta["tool_calls"]
+      delta["tool_calls"].each do |tc_delta|
+        index = tc_delta["index"] || 0
+        if tc_delta["id"]
+          accumulated[:tool_calls][index] = {
+            id: tc_delta["id"],
+            name: tc_delta.dig("function", "name") || "",
+            arguments: +""
+          }
+        end
+        tc = accumulated[:tool_calls][index]
+        next unless tc
+        if tc_delta.dig("function", "arguments")
+          tc[:arguments] << tc_delta.dig("function", "arguments")
+        end
+        if tc_delta["id"]
+          on_chunk.call({
+            type: :tool_call_start,
+            id: tc_delta["id"],
+            name: tc_delta.dig("function", "name") || ""
+          })
+        elsif tc_delta.dig("function", "arguments")
+          on_chunk.call({
+            type: :tool_call_delta,
+            id: tc[:id],
+            arguments: tc_delta.dig("function", "arguments")
+          })
+        end
+      end
+    end
+    def emit_tool_call_completions(choice, accumulated, &on_chunk)
+      return unless choice["finish_reason"] == "tool_calls"
+      accumulated[:tool_calls].each do |tc|
+        next unless tc
+        on_chunk.call({
+          type: :tool_call_complete,
+          id: tc[:id],
+          name: tc[:name],
+          arguments: tc[:arguments]
+        })
+      end
+    end
+    def build_http(uri)
+      http = Net::HTTP.new(uri.host, uri.port)
+      http.use_ssl = (uri.scheme == "https")
+      http.open_timeout = [DEFAULT_TIMEOUT, 30].min
+      http.read_timeout = DEFAULT_TIMEOUT
+      http
+    end
+    def build_post_request(uri, body)
+      request = Net::HTTP::Post.new(uri)
+      request["Content-Type"] = "application/json"
+      request["Authorization"] = "Bearer #{@api_key}"
+      request["User-Agent"] = USER_AGENT
+      request.body = JSON.generate(body)
+      request
+    end
+    def parse_response(http_response, duration:, model:)
+      status_code = http_response.code.to_i
+      unless status_code == 200
+        handle_error_response(http_response, status_code)
+      end
+      body = JSON.parse(http_response.body)
+      output = extract_content(body)
+      tokens = extract_usage(body)
+      tool_calls = extract_tool_calls(body)
+      metadata = {transport: :http, stream: false}
+      metadata[:tool_calls] = tool_calls if tool_calls
+      Response.new(
+        output: output,
+        exit_code: 0,
+        duration: duration,
+        provider: :openai_compatible,
+        model: body["model"] || model,
+        tokens: tokens,
+        metadata: metadata
+      )
+    rescue JSON::ParserError => e
+      raise ProviderError.new(
+        "Invalid JSON in API response: #{e.message}",
+        original_error: e
+      )
+    end
+    def build_streaming_response(accumulated, duration:, model:)
+      tool_calls = accumulated[:tool_calls].compact
+      metadata = {transport: :http, stream: true}
+      metadata[:tool_calls] = tool_calls unless tool_calls.empty?
+      Response.new(
+        output: accumulated[:content],
+        exit_code: 0,
+        duration: duration,
+        provider: :openai_compatible,
+        model: accumulated[:model] || model,
+        tokens: accumulated[:usage],
+        metadata: metadata
+      )
+    end
+    def extract_content(body)
+      choice = body.dig("choices", 0)
+      return "" unless choice
+      choice.dig("message", "content") || ""
+    end
+    def extract_usage(body)
+      usage = body["usage"]
+      return nil unless usage
+      input = usage["prompt_tokens"] || 0
+      output = usage["completion_tokens"] || 0
+      {input: input, output: output, total: input + output}
+    end
+    def extract_tool_calls(body)
+      tool_calls = body.dig("choices", 0, "message", "tool_calls")
+      return nil unless tool_calls&.any?
+      tool_calls.map do |tc|
+        {
+          id: tc["id"],
+          name: tc.dig("function", "name"),
+          arguments: tc.dig("function", "arguments")
+        }
+      end
+    end
+    def build_chat_chunk_callback(on_chunk, on_chat_chunk, observer)
+      proc do |chunk|
+        on_chunk&.call(chunk)
+        on_chat_chunk&.call(chunk)
+        observer.on_chat_chunk(chunk) if observer_responds_to?(observer, :on_chat_chunk)
+      end
+    end
+    def observer_responds_to?(observer, method_name)
+      observer&.respond_to?(method_name)
+    end
+    def handle_error_response(http_response, status_code)
+      handle_error_response_raw(http_response.body, status_code)
+    end
+    def handle_error_response_raw(body_string, status_code)
+      message = begin
+        body = JSON.parse(body_string)
+        body.dig("error", "message") || body.dig("error", "type") || body_string
+      rescue JSON::ParserError
+        body_string
+      end
+      case status_code
+      when 401
+        raise AuthenticationError.new(
+          "API authentication failed: #{message}",
+          provider: :openai_compatible
+        )
+      when 403
+        raise AuthenticationError.new(
+          "API access forbidden: #{message}",
+          provider: :openai_compatible
+        )
+      when 429
+        raise RateLimitError.new(
+          "API rate limit exceeded: #{message}",
+          provider: :openai_compatible
+        )
+      when 400
+        raise ProviderError.new("Bad request: #{message}")
+      when 500, 502, 503
+        raise ProviderError.new("Server error (#{status_code}): #{message}")
+      else
+        raise ProviderError.new("HTTP #{status_code}: #{message}")
+      end
+    end
+  end
+end

data/lib/agent_harness/provider_runtime.rb CHANGED Viewed

@@ -25,7 +25,8 @@ module AgentHarness
   #     }
   #   )
   class ProviderRuntime
-    attr_reader :model, :base_url, :api_provider, :env, :flags, :metadata, :unset_env
+    attr_reader :model, :base_url, :api_provider, :env, :flags, :metadata, :unset_env,
+      :chat_base_url, :chat_model, :chat_api_key, :chat_max_tokens, :chat_tools
     # @param model [String, nil] model identifier override
     # @param base_url [String, nil] upstream API base URL override
@@ -34,7 +35,13 @@ module AgentHarness
     # @param flags [Array<String>] extra CLI flags to append
     # @param unset_env [Array<String>] environment variable names to remove from inherited env
     # @param metadata [Hash] arbitrary provider-specific data
-    def initialize(model: nil, base_url: nil, api_provider: nil, env: {}, flags: [], unset_env: [], metadata: {})
+    # @param chat_base_url [String, nil] override transport base URL for chat
+    # @param chat_model [String, nil] override model for chat
+    # @param chat_api_key [String, nil] override API key for chat
+    # @param chat_max_tokens [Integer, nil] max tokens for chat response
+    # @param chat_tools [Array<Hash>, nil] default tool definitions for chat requests
+    def initialize(model: nil, base_url: nil, api_provider: nil, env: {}, flags: [], unset_env: [], metadata: {},
+      chat_base_url: nil, chat_model: nil, chat_api_key: nil, chat_max_tokens: nil, chat_tools: nil)
       validate_optional_string!(:model, model)
       validate_optional_string!(:base_url, base_url)
       validate_optional_string!(:api_provider, api_provider)
@@ -90,6 +97,28 @@ module AgentHarness
       end
       @unset_env = normalized_unset_env.freeze
+      validate_optional_string!(:chat_base_url, chat_base_url)
+      validate_optional_string!(:chat_model, chat_model)
+      validate_optional_string!(:chat_api_key, chat_api_key)
+      unless chat_max_tokens.nil? || chat_max_tokens.is_a?(Integer)
+        raise ArgumentError, "chat_max_tokens must be an Integer or nil (got #{chat_max_tokens.class})"
+      end
+      unless chat_tools.nil? || chat_tools.is_a?(Array)
+        raise ArgumentError, "chat_tools must be an Array or nil (got #{chat_tools.class})"
+      end
+      normalized_chat_tools = chat_tools&.dup
+      normalized_chat_tools&.each_with_index do |tool, index|
+        unless tool.is_a?(Hash)
+          raise ArgumentError,
+            "chat_tools must be an Array of Hashes; invalid element at index #{index}: #{tool.inspect} (#{tool.class})"
+        end
+      end
+      @chat_base_url = chat_base_url
+      @chat_model = chat_model
+      @chat_api_key = chat_api_key
+      @chat_max_tokens = chat_max_tokens
+      @chat_tools = normalized_chat_tools&.freeze
       freeze
     end
@@ -112,7 +141,12 @@ module AgentHarness
         env: env_val.nil? ? {} : env_val,
         flags: flags_val.nil? ? [] : flags_val,
         unset_env: unset_env_val.nil? ? [] : unset_env_val,
-        metadata: metadata_val.nil? ? {} : metadata_val
+        metadata: metadata_val.nil? ? {} : metadata_val,
+        chat_base_url: hash_value(hash, :chat_base_url),
+        chat_model: hash_value(hash, :chat_model),
+        chat_api_key: hash_value(hash, :chat_api_key),
+        chat_max_tokens: hash_value(hash, :chat_max_tokens),
+        chat_tools: hash_value(hash, :chat_tools)
       )
     end
@@ -135,7 +169,9 @@ module AgentHarness
     # @return [Boolean]
     def empty?
       model.nil? && base_url.nil? && api_provider.nil? &&
-        env.empty? && flags.empty? && metadata.empty? && unset_env.empty?
+        env.empty? && flags.empty? && metadata.empty? && unset_env.empty? &&
+        chat_base_url.nil? && chat_model.nil? && chat_api_key.nil? && chat_max_tokens.nil? &&
+        chat_tools.nil?
     end
     private_class_method def self.hash_value(hash, key)

data/lib/agent_harness/providers/adapter.rb CHANGED Viewed

@@ -290,7 +290,8 @@ module AgentHarness
                 canonical_name: canonical_provider_name,
                 aliases: normalized_aliases
               )
-            }
+            },
+            chat: build_chat_metadata(provider)
           }
           deep_merge_metadata(metadata, sanitized_provider_metadata_overrides)
@@ -536,6 +537,32 @@ module AgentHarness
           default
         end
+        def build_chat_metadata(provider)
+          supported = provider_metadata_value(provider, :supports_chat?, default: false)
+          return {supported: false} unless supported
+          chat_meta = {supported: true}
+          if provider.respond_to?(:chat_models, true)
+            models = provider.chat_models
+            chat_meta[:models] = models if models.is_a?(Array)
+            chat_meta[:default_model] = models.first if models.is_a?(Array) && !models.empty?
+          end
+          # Use lightweight chat_transport_type to avoid instantiating the
+          # transport (which may trigger API key resolution / authentication
+          # as a side effect).
+          transport_type = provider_metadata_value(provider, :chat_transport_type, default: nil)
+          chat_meta[:transport] = transport_type
+          chat_meta
+        rescue => e
+          AgentHarness.logger&.debug(
+            "[AgentHarness::Providers::Adapter] chat metadata failed for #{provider_name}: #{e.class}"
+          )
+          {supported: false}
+        end
         def provider_display_name(provider, canonical_name: provider_name)
           if provider&.respond_to?(:display_name) &&
               provider.method(:display_name).owner != AgentHarness::Providers::Base
@@ -599,7 +626,7 @@ module AgentHarness
         end
         def default_supported_mcp_transports
-          []
+          %w[stdio]
         end
         def default_supports_sessions
@@ -849,9 +876,12 @@ module AgentHarness
       # Supported MCP transport types for this provider
       #
+      # Defaults to ["stdio"]. Providers that support HTTP/SSE transports
+      # should override this to include those transports.
+      #
       # @return [Array<String>] supported transports (e.g. ["stdio", "http"])
       def supported_mcp_transports
-        []
+        %w[stdio]
       end
       # Build provider-specific MCP flags/arguments for CLI invocation
@@ -917,6 +947,35 @@ module AgentHarness
         false
       end
+      # Check if provider supports multi-turn chat mode.
+      #
+      # Providers that return +true+ can accept conversation history
+      # and return streaming multi-turn responses via +send_chat_message+.
+      #
+      # @return [Boolean] true if the provider supports chat
+      def supports_chat?
+        false
+      end
+      # Returns the transport instance used for chat mode.
+      #
+      # Providers that support chat override this to return an appropriate
+      # transport (e.g. OpenAICompatibleTransport or TextTransport).
+      #
+      # @return [Object, nil] transport instance or nil if unsupported
+      def chat_transport
+        nil
+      end
+      # Returns the symbolic transport type for chat without instantiating
+      # the transport object. This avoids triggering API key resolution or
+      # other authentication side effects during metadata collection.
+      #
+      # @return [Symbol, nil] :openai_compatible, :anthropic, or nil
+      def chat_transport_type
+        nil
+      end
       # Check if provider supports dangerous mode
       #
       # @return [Boolean] true if dangerous mode is supported

data/lib/agent_harness/providers/anthropic.rb CHANGED Viewed

@@ -159,6 +159,10 @@ module AgentHarness
           MODEL_PATTERN.match?(family_name)
         end
+        def supports_chat?
+          true
+        end
         def smoke_test_contract
           Base::DEFAULT_SMOKE_TEST_CONTRACT
         end
@@ -410,6 +414,32 @@ module AgentHarness
         true
       end
+      CHAT_MODELS = %w[claude-sonnet-4-20250514 claude-haiku-4-20250414 claude-opus-4-20250514].freeze
+      def supports_chat?
+        true
+      end
+      def chat_models
+        CHAT_MODELS
+      end
+      def chat_transport
+        @chat_transport ||= TextTransport.new(api_key: resolve_text_mode_api_key, logger: @logger)
+      end
+      def build_runtime_chat_transport(runtime)
+        TextTransport.new(
+          base_url: runtime.chat_base_url || TextTransport::ANTHROPIC_API_URL,
+          api_key: runtime.chat_api_key || resolve_text_mode_api_key,
+          logger: @logger
+        )
+      end
+      def chat_transport_type
+        :anthropic
+      end
       def dangerous_mode_flags
         ["--dangerously-skip-permissions"]
       end