RubyGems - anima-core - Versions diffs - 1.3.0 → 1.5.0 - Mend

anima-core 1.3.0 → 1.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (175) hide show

checksums.yaml +4 -4
data/.reek.yml +23 -26
data/README.md +118 -104
data/agents/thoughts-analyzer.md +12 -7
data/anima-core.gemspec +1 -0
data/app/channels/session_channel.rb +38 -58
data/app/decorators/agent_message_decorator.rb +7 -2
data/app/decorators/message_decorator.rb +31 -100
data/app/decorators/pending_from_melete_decorator.rb +36 -0
data/app/decorators/pending_from_melete_goal_decorator.rb +13 -0
data/app/decorators/pending_from_melete_skill_decorator.rb +19 -0
data/app/decorators/pending_from_melete_workflow_decorator.rb +13 -0
data/app/decorators/pending_from_mneme_decorator.rb +44 -0
data/app/decorators/pending_message_decorator.rb +94 -0
data/app/decorators/pending_subagent_decorator.rb +46 -0
data/app/decorators/pending_tool_response_decorator.rb +51 -0
data/app/decorators/pending_user_message_decorator.rb +22 -0
data/app/decorators/system_message_decorator.rb +5 -0
data/app/decorators/tool_call_decorator.rb +16 -5
data/app/decorators/tool_response_decorator.rb +2 -2
data/app/decorators/user_message_decorator.rb +7 -2
data/app/jobs/count_tokens_job.rb +23 -0
data/app/jobs/drain_job.rb +169 -0
data/app/jobs/melete_enrichment_job/goal_change_listener.rb +52 -0
data/app/jobs/melete_enrichment_job.rb +48 -0
data/app/jobs/mneme_enrichment_job.rb +46 -0
data/app/jobs/tool_execution_job.rb +87 -0
data/app/models/concerns/token_estimation.rb +54 -0
data/app/models/goal.rb +23 -11
data/app/models/message.rb +46 -48
data/app/models/pending_message.rb +407 -12
data/app/models/pinned_message.rb +8 -3
data/app/models/session.rb +660 -566
data/app/models/snapshot.rb +11 -21
data/bin/inspect-cassette +157 -0
data/bin/release +212 -0
data/bin/with-llms +20 -0
data/config/application.rb +1 -0
data/config/database.yml +1 -0
data/config/initializers/event_subscribers.rb +71 -4
data/config/initializers/inflections.rb +3 -1
data/db/cable_structure.sql +9 -0
data/db/migrate/20260330120000_add_source_to_pending_messages.rb +8 -0
data/db/migrate/20260401180000_add_api_metrics_to_messages.rb +7 -0
data/db/migrate/20260401210935_remove_recalled_message_ids_from_sessions.rb +5 -0
data/db/migrate/20260403080031_add_initial_cwd_to_sessions.rb +5 -0
data/db/migrate/20260407170803_remove_viewport_message_ids_from_sessions.rb +5 -0
data/db/migrate/20260407180400_remove_mneme_snapshot_pointer_columns_from_sessions.rb +6 -0
data/db/migrate/20260411120553_add_token_count_to_pinned_messages.rb +5 -0
data/db/migrate/20260411172926_remove_active_skills_and_workflow_from_sessions.rb +6 -0
data/db/migrate/20260412110625_replace_processing_with_aasm_state.rb +6 -0
data/db/migrate/20260418150323_add_kind_and_message_type_to_pending_messages.rb +6 -0
data/db/migrate/20260419120000_add_drain_fields_to_pending_messages.rb +7 -0
data/db/migrate/20260419130000_drop_pending_messages_kind_default.rb +5 -0
data/db/migrate/20260419140000_add_drain_indexes_to_pending_messages.rb +8 -0
data/db/migrate/20260420100000_add_hud_visibility_to_sessions.rb +15 -0
data/db/queue_structure.sql +61 -0
data/db/structure.sql +133 -0
data/lib/agents/registry.rb +1 -1
data/lib/anima/cli.rb +41 -13
data/lib/anima/installer.rb +13 -0
data/lib/anima/settings.rb +16 -36
data/lib/anima/version.rb +1 -1
data/lib/events/authentication_required.rb +24 -0
data/lib/events/bounce_back.rb +4 -4
data/lib/events/eviction_completed.rb +28 -0
data/lib/events/goal_created.rb +28 -0
data/lib/events/goal_updated.rb +32 -0
data/lib/events/llm_responded.rb +35 -0
data/lib/events/message_created.rb +27 -0
data/lib/events/message_updated.rb +25 -0
data/lib/events/session_state_changed.rb +30 -0
data/lib/events/skill_activated.rb +28 -0
data/lib/events/start_melete.rb +36 -0
data/lib/events/start_mneme.rb +33 -0
data/lib/events/start_processing.rb +32 -0
data/lib/events/subagent_evicted.rb +31 -0
data/lib/events/subscribers/active_state_broadcaster.rb +27 -0
data/lib/events/subscribers/authentication_broadcaster.rb +34 -0
data/lib/events/subscribers/drain_kickoff.rb +20 -0
data/lib/events/subscribers/eviction_broadcaster.rb +26 -0
data/lib/events/subscribers/llm_response_handler.rb +111 -0
data/lib/events/subscribers/melete_kickoff.rb +24 -0
data/lib/events/subscribers/message_broadcaster.rb +34 -0
data/lib/events/subscribers/mneme_kickoff.rb +24 -0
data/lib/events/subscribers/mneme_scheduler.rb +21 -0
data/lib/events/subscribers/persister.rb +8 -9
data/lib/events/subscribers/session_state_broadcaster.rb +33 -0
data/lib/events/subscribers/subagent_message_router.rb +28 -34
data/lib/events/subscribers/subagent_visibility_broadcaster.rb +33 -0
data/lib/events/subscribers/tool_response_creator.rb +33 -0
data/lib/events/subscribers/transient_broadcaster.rb +1 -1
data/lib/events/tool_executed.rb +34 -0
data/lib/events/workflow_activated.rb +27 -0
data/lib/llm/client.rb +46 -199
data/lib/mcp/client_manager.rb +41 -46
data/lib/mcp/stdio_transport.rb +9 -5
data/lib/{analytical_brain → melete}/runner.rb +73 -68
data/lib/{analytical_brain → melete}/tools/activate_skill.rb +3 -3
data/lib/{analytical_brain → melete}/tools/assign_nickname.rb +3 -3
data/lib/{analytical_brain → melete}/tools/everything_is_ready.rb +2 -2
data/lib/{analytical_brain → melete}/tools/finish_goal.rb +6 -3
data/lib/melete/tools/goal_messaging.rb +29 -0
data/lib/{analytical_brain → melete}/tools/read_workflow.rb +4 -4
data/lib/{analytical_brain → melete}/tools/rename_session.rb +3 -3
data/lib/{analytical_brain → melete}/tools/set_goal.rb +6 -2
data/lib/{analytical_brain → melete}/tools/update_goal.rb +9 -5
data/lib/{analytical_brain.rb → melete.rb} +6 -3
data/lib/mneme/base_runner.rb +121 -0
data/lib/mneme/l2_runner.rb +14 -20
data/lib/mneme/recall_runner.rb +132 -0
data/lib/mneme/runner.rb +123 -165
data/lib/mneme/search.rb +104 -62
data/lib/mneme/tools/nothing_to_surface.rb +25 -0
data/lib/mneme/tools/save_snapshot.rb +2 -10
data/lib/mneme/tools/surface_memory.rb +89 -0
data/lib/mneme.rb +11 -5
data/lib/providers/anthropic.rb +112 -7
data/lib/shell_session.rb +290 -432
data/lib/skills/definition.rb +2 -2
data/lib/skills/registry.rb +1 -1
data/lib/tools/base.rb +16 -1
data/lib/tools/bash.rb +25 -55
data/lib/tools/edit.rb +2 -0
data/lib/tools/mark_goal_completed.rb +4 -5
data/lib/tools/read.rb +2 -0
data/lib/tools/registry.rb +85 -4
data/lib/tools/response_truncator.rb +1 -1
data/lib/tools/{recall.rb → search_messages.rb} +19 -21
data/lib/tools/spawn_specialist.rb +22 -14
data/lib/tools/spawn_subagent.rb +30 -20
data/lib/tools/subagent_prompts.rb +17 -19
data/lib/tools/think.rb +1 -1
data/lib/tools/{remember.rb → view_messages.rb} +10 -10
data/lib/tools/write.rb +2 -0
data/lib/tui/app.rb +393 -149
data/lib/tui/braille_spinner.rb +7 -7
data/lib/tui/cable_client.rb +9 -16
data/lib/tui/decorators/base_decorator.rb +47 -6
data/lib/tui/decorators/bash_decorator.rb +1 -1
data/lib/tui/decorators/edit_decorator.rb +4 -2
data/lib/tui/decorators/read_decorator.rb +4 -2
data/lib/tui/decorators/think_decorator.rb +2 -2
data/lib/tui/decorators/web_get_decorator.rb +1 -1
data/lib/tui/decorators/write_decorator.rb +4 -2
data/lib/tui/flash.rb +19 -14
data/lib/tui/formatting.rb +20 -9
data/lib/tui/input_buffer.rb +6 -6
data/lib/tui/message_store.rb +165 -28
data/lib/tui/performance_logger.rb +2 -3
data/lib/tui/screens/chat.rb +149 -79
data/lib/tui/settings.rb +93 -0
data/lib/workflows/definition.rb +3 -3
data/lib/workflows/registry.rb +1 -1
data/skills/github.md +38 -0
data/templates/config.toml +16 -32
data/templates/tui.toml +209 -0
data/workflows/review_pr.md +18 -14
metadata +98 -29
data/app/jobs/agent_request_job.rb +0 -199
data/app/jobs/analytical_brain_job.rb +0 -33
data/app/jobs/count_message_tokens_job.rb +0 -39
data/app/jobs/passive_recall_job.rb +0 -29
data/app/models/concerns/message/broadcasting.rb +0 -85
data/config/initializers/fts5_schema_dump.rb +0 -21
data/lib/agent_loop.rb +0 -186
data/lib/analytical_brain/tools/deactivate_skill.rb +0 -39
data/lib/analytical_brain/tools/deactivate_workflow.rb +0 -34
data/lib/environment_probe.rb +0 -232
data/lib/events/agent_message.rb +0 -11
data/lib/events/subscribers/message_collector.rb +0 -64
data/lib/events/tool_call.rb +0 -31
data/lib/events/tool_response.rb +0 -33
data/lib/mneme/compressed_viewport.rb +0 -200
data/lib/mneme/passive_recall.rb +0 -69

data/lib/mneme/tools/surface_memory.rb ADDED Viewed

@@ -0,0 +1,89 @@
+# frozen_string_literal: true
+module Mneme
+  module Tools
+    # Surfaces a past message into Aoide's next turn as a `from_mneme`
+    # phantom tool pair. Called by Mneme's recall loop when a search hit
+    # or a viewed message clears her relevance bar.
+    #
+    # The persisted {PendingMessage} carries the original +message_id+ in
+    # its +source_name+ (and through promotion ends up inside
+    # +tool_input.message_id+ of the phantom pair), so the same memory
+    # isn't re-surfaced on later cycles — Mneme::Search already excludes
+    # Aoide's viewport, and once a recall promotes it lives there.
+    #
+    # The muse explains +why+ she's surfacing this memory. The reason is
+    # logged but not shown to Aoide — keeping the surfaced content itself
+    # clean of meta-commentary.
+    class SurfaceMemory < ::Tools::Base
+      def self.tool_name = "surface_memory"
+      def self.description = "Surface a memory into Aoide's next turn. Use when a specific past message is genuinely useful for what she's working on now. Pass the message_id and a short reason — one sentence explaining why she needs this *now*."
+      def self.input_schema
+        {
+          type: "object",
+          properties: {
+            message_id: {type: "integer"},
+            why: {type: "string", description: "One-sentence justification — kept for logs, not shown to Aoide."}
+          },
+          required: %w[message_id why]
+        }
+      end
+      # @param main_session [Session] the session receiving the recall
+      def initialize(main_session:, **)
+        @main_session = main_session
+      end
+      def execute(input)
+        message_id = input["message_id"].to_i
+        why = input["why"].to_s.strip
+        message = Message.find_by(id: message_id)
+        return {error: "Message #{message_id} not found"} unless message
+        return {error: "Reason cannot be blank"} if why.empty?
+        content = render_snippet(message)
+        @main_session.pending_messages.create!(
+          content: content,
+          source_type: "recall",
+          source_name: message_id.to_s,
+          message_type: "from_mneme"
+        )
+        Mneme.logger.info("session=#{@main_session.id} — surfaced message #{message_id}: #{why}")
+        "Surfaced message #{message_id}."
+      end
+      private
+      # Formats the message as the text Aoide will read when the phantom
+      # pair promotes. Headed with origin metadata, bounded by the recall
+      # snippet-token budget so long messages don't blow out her viewport.
+      #
+      # @param message [Message]
+      # @return [String]
+      def render_snippet(message)
+        origin = message.session&.name.presence || "session ##{message.session_id}"
+        raw = extract_content(message)
+        max_chars = Anima::Settings.recall_max_snippet_tokens * TokenEstimation::BYTES_PER_TOKEN
+        "message #{message.id} (#{origin}): #{raw.truncate(max_chars)}"
+      end
+      def extract_content(message)
+        payload = message.payload
+        case message.message_type
+        when "user_message", "agent_message", "system_message"
+          payload["content"].to_s
+        when "tool_call"
+          payload.dig("tool_input", "thoughts").to_s
+        else
+          payload["content"].to_s
+        end
+      end
+    end
+  end
+end

data/lib/mneme.rb CHANGED Viewed

@@ -1,12 +1,18 @@
 # frozen_string_literal: true
-# Mneme — the memory department. Watches for viewport eviction and creates
-# summaries before context is lost. Named after the Greek Titaness of memory.
+# Mneme — the muse of memory. Watches for viewport eviction and creates
+# summaries before context is lost. One of the Three Muses: she remembers
+# while Melete prepares and Aoide performs.
 #
-# Mneme is the third event bus department alongside Nous (main agent) and
-# the Analytical Brain. It operates as a phantom LLM loop: observes the
-# main session, creates snapshots, but leaves no trace of its own reasoning.
+# Operates as a phantom LLM loop: observes the main session, creates
+# snapshots, but leaves no trace of her own reasoning.
 module Mneme
+  # Estimated token overhead for a synthetic +tool_use+/+tool_result+
+  # pair — the wrapper JSON that phantom promotions emit around their
+  # content (tool name, input hash, ids, framing). Added to the content's
+  # token estimate when sizing phantom pairs in the viewport.
+  TOOL_PAIR_OVERHEAD_TOKENS = 50
   # Dev-only logger that writes to log/mneme.log.
   # In non-development environments returns a null logger so
   # call sites don't need conditionals.

data/lib/providers/anthropic.rb CHANGED Viewed

@@ -17,6 +17,34 @@ module Providers
     # subscription tokens on Sonnet/Opus. Without it, /v1/messages returns 400.
     OAUTH_PASSPHRASE = "You are Claude Code, Anthropic's official CLI for Claude."
+    # Rate limit header names for extraction
+    RATE_LIMIT_HEADERS = {
+      "5h_status" => "Anthropic-Ratelimit-Unified-5h-Status",
+      "5h_reset" => "Anthropic-Ratelimit-Unified-5h-Reset",
+      "5h_utilization" => "Anthropic-Ratelimit-Unified-5h-Utilization",
+      "7d_status" => "Anthropic-Ratelimit-Unified-7d-Status",
+      "7d_reset" => "Anthropic-Ratelimit-Unified-7d-Reset",
+      "7d_utilization" => "Anthropic-Ratelimit-Unified-7d-Utilization"
+    }.freeze
+    # Response wrapper containing both the parsed body and API metrics.
+    # Behaves like a Hash for backward compatibility (delegates to body).
+    #
+    # @!attribute [r] body
+    #   @return [Hash] parsed API response
+    # @!attribute [r] api_metrics
+    #   @return [Hash, nil] rate limits and usage data
+    ApiResponse = Data.define(:body, :api_metrics) do
+      # Delegate Hash methods to body for backward compatibility.
+      # Callers using response["content"] continue to work unchanged.
+      def [](key) = body[key]
+      def dig(...) = body.dig(...)
+      def fetch(...) = body.fetch(...)
+      def key?(key) = body.key?(key)
+      def to_h = body
+      def to_json(...) = body.to_json(...)
+    end
     class Error < StandardError; end
     class AuthenticationError < Error; end
     class TokenFormatError < Error; end
@@ -76,13 +104,17 @@ module Providers
     # @param model [String] Anthropic model identifier
     # @param messages [Array<Hash>] conversation messages
     # @param max_tokens [Integer] maximum tokens in the response
+    # @param include_metrics [Boolean] when true, returns an {ApiResponse}
+    #   wrapper with both body and api_metrics; when false (default),
+    #   returns just the parsed body Hash for backward compatibility
     # @param options [Hash] additional parameters (e.g. +system:+, +tools:+)
-    # @return [Hash] parsed API response
+    # @return [Hash, ApiResponse] parsed API response, or wrapper with metrics
     # @raise [TransientError] on network failures or server errors (retryable)
     # @raise [AuthenticationError] on 401/403 (permanent)
     # @raise [Error] on other API errors
-    def create_message(model:, messages:, max_tokens:, **options)
+    def create_message(model:, messages:, max_tokens:, include_metrics: false, **options)
       wrap_system_prompt!(options)
+      annotate_last_message_for_caching!(messages)
       body = {model: model, messages: messages, max_tokens: max_tokens}.merge(options)
       response = self.class.post(
@@ -92,7 +124,7 @@ module Providers
         timeout: Anima::Settings.api_timeout
       )
-      handle_response(response)
+      handle_response(response, include_metrics: include_metrics)
     rescue Errno::ECONNRESET, Net::ReadTimeout, Net::OpenTimeout, SocketError, EOFError => network_error
       raise TransientError, "#{network_error.class}: #{network_error.message}"
     end
@@ -106,7 +138,6 @@ module Providers
     # @return [Integer] estimated input token count
     # @raise [Error] on API errors
     def count_tokens(model:, messages:, **options)
-      wrap_system_prompt!(options)
       body = {model: model, messages: messages}.merge(options)
       response = self.class.post(
@@ -159,16 +190,56 @@ module Providers
     # Wraps the system parameter in the array-of-blocks format required by
     # Anthropic for OAuth tokens. The passphrase block is always present;
     # the caller's prompt (if any) is appended as the second block.
+    # The last block is annotated with +cache_control+ so the API caches
+    # the entire system prefix (tools are evaluated before system).
     #
     # @param options [Hash] mutable options hash (modified in place)
     # @return [void]
     def wrap_system_prompt!(options)
       prompt = options[:system]
       blocks = [{type: "text", text: OAUTH_PASSPHRASE}]
-      blocks << {type: "text", text: prompt} if prompt
+      blocks << {type: "text", text: prompt, cache_control: {type: "ephemeral"}}
       options[:system] = blocks
     end
+    # Annotates the last message's last content block with +cache_control+
+    # so every subsequent API call in a tool-use loop hits the prefix cache.
+    # String content is normalized to array-of-blocks format since bare
+    # strings cannot carry +cache_control+ metadata.
+    #
+    # Clears stale breakpoints from earlier messages to stay within the
+    # Anthropic 4-breakpoint limit (tools + system consume 2).
+    #
+    # @param messages [Array<Hash>] mutable messages array (modified in place)
+    # @return [void]
+    def annotate_last_message_for_caching!(messages)
+      return if messages.empty?
+      clear_stale_cache_breakpoints!(messages[0...-1])
+      last_msg = messages.last
+      content = last_msg[:content]
+      case content
+      when String
+        last_msg[:content] = [{type: "text", text: content, cache_control: {type: "ephemeral"}}]
+      when Array
+        last_block = content.last
+        last_block[:cache_control] = {type: "ephemeral"} if last_block
+      end
+    end
+    # Removes +cache_control+ from content blocks in the given messages.
+    # Called before re-annotating the last message to stay within the
+    # Anthropic 4-breakpoint limit across tool-loop rounds.
+    def clear_stale_cache_breakpoints!(messages)
+      messages.each do |msg|
+        content = msg[:content]
+        next unless content.is_a?(Array)
+        content.each { |block| block.delete(:cache_control) if block.is_a?(Hash) }
+      end
+    end
     def request_headers
       {
         "Authorization" => "Bearer #{token}",
@@ -178,10 +249,13 @@ module Providers
       }
     end
-    def handle_response(response)
+    def handle_response(response, include_metrics: false)
       case response.code
       when 200
-        response.parsed_response
+        body = response.parsed_response
+        return body unless include_metrics
+        ApiResponse.new(body: body, api_metrics: extract_api_metrics(response))
       when 400
         raise Error, "Bad request: #{error_message(response)}"
       when 401
@@ -199,6 +273,37 @@ module Providers
       end
     end
+    # Extracts rate limit headers and usage data from an HTTParty response.
+    #
+    # @param response [HTTParty::Response] raw API response
+    # @return [Hash] with "rate_limits" and "usage" string keys
+    def extract_api_metrics(response)
+      {
+        "rate_limits" => extract_rate_limits(response.headers),
+        "usage" => response.parsed_response&.dig("usage")
+      }
+    end
+    # Extracts rate limit values from response headers.
+    #
+    # @param headers [Hash] HTTParty headers (case-insensitive)
+    # @return [Hash] normalized rate limit data
+    def extract_rate_limits(headers)
+      return {} unless headers
+      RATE_LIMIT_HEADERS.transform_values do |header_name|
+        # HTTParty headers are strings; VCR replays them as arrays
+        raw = headers[header_name]
+        value = raw.is_a?(Array) ? raw.first : raw
+        # Parse numeric values (utilization, reset timestamps)
+        case value
+        when /\A\d+\z/ then value.to_i
+        when /\A\d+\.\d+\z/ then value.to_f
+        else value
+        end
+      end
+    end
     def error_message(response)
       response.parsed_response&.dig("error", "message") || response.message
     rescue JSON::ParserError, NoMethodError