RubyGems - llm_cost_tracker - Versions diffs - 0.5.2 → 0.5.3 - Mend

llm_cost_tracker 0.5.2 → 0.5.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (50) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +16 -0
data/README.md +8 -3
data/docs/architecture.md +28 -0
data/docs/budgets.md +45 -0
data/docs/configuration.md +65 -0
data/docs/cookbook.md +185 -0
data/docs/dashboard-overview.png +0 -0
data/docs/dashboard.md +38 -0
data/docs/extending.md +32 -0
data/docs/operations.md +44 -0
data/docs/pricing.md +94 -0
data/docs/querying.md +36 -0
data/docs/streaming.md +70 -0
data/docs/technical/README.md +10 -0
data/docs/technical/data-flow.md +67 -0
data/docs/technical/extension-points.md +111 -0
data/docs/technical/module-map.md +197 -0
data/docs/technical/operational-notes.md +77 -0
data/docs/upgrading.md +46 -0
data/lib/llm_cost_tracker/capture_verifier.rb +71 -0
data/lib/llm_cost_tracker/configuration/instrumentation.rb +1 -1
data/lib/llm_cost_tracker/configuration/storage_backend.rb +26 -0
data/lib/llm_cost_tracker/configuration.rb +2 -1
data/lib/llm_cost_tracker/doctor/capture_check.rb +39 -0
data/lib/llm_cost_tracker/doctor.rb +6 -1
data/lib/llm_cost_tracker/integrations/anthropic.rb +41 -2
data/lib/llm_cost_tracker/integrations/openai.rb +66 -2
data/lib/llm_cost_tracker/integrations/registry.rb +33 -3
data/lib/llm_cost_tracker/integrations/stream_tracker.rb +166 -0
data/lib/llm_cost_tracker/llm_api_call.rb +2 -78
data/lib/llm_cost_tracker/llm_api_call_metrics.rb +63 -0
data/lib/llm_cost_tracker/parsers/openai_usage.rb +1 -1
data/lib/llm_cost_tracker/pricing/effective_prices.rb +75 -0
data/lib/llm_cost_tracker/pricing/explainer.rb +77 -0
data/lib/llm_cost_tracker/pricing/lookup.rb +110 -0
data/lib/llm_cost_tracker/pricing.rb +25 -108
data/lib/llm_cost_tracker/retention.rb +3 -9
data/lib/llm_cost_tracker/storage/active_record_backend.rb +115 -0
data/lib/llm_cost_tracker/storage/active_record_rollups.rb +42 -0
data/lib/llm_cost_tracker/storage/active_record_store.rb +26 -0
data/lib/llm_cost_tracker/storage/custom_backend.rb +32 -0
data/lib/llm_cost_tracker/storage/dispatcher.rb +11 -34
data/lib/llm_cost_tracker/storage/log_backend.rb +38 -0
data/lib/llm_cost_tracker/storage/registry.rb +63 -0
data/lib/llm_cost_tracker/tag_sql.rb +34 -0
data/lib/llm_cost_tracker/version.rb +1 -1
data/lib/llm_cost_tracker.rb +3 -0
data/lib/tasks/llm_cost_tracker.rake +49 -0
metadata +32 -2

data/lib/llm_cost_tracker/configuration.rb CHANGED Viewed

@@ -4,10 +4,12 @@ require_relative "errors"
 require_relative "tag_key"
 require_relative "value_helpers"
 require_relative "configuration/instrumentation"
+require_relative "configuration/storage_backend"
 module LlmCostTracker
   class Configuration
     include ConfigurationInstrumentation
+    include ConfigurationStorageBackend
     OPENAI_COMPATIBLE_PROVIDERS = { "openrouter.ai" => "openrouter", "api.deepseek.com" => "deepseek" }.freeze
@@ -18,7 +20,6 @@ module LlmCostTracker
     SHARED_SCALAR_ATTRIBUTES = %i[enabled custom_storage on_budget_exceeded monthly_budget daily_budget per_call_budget
                                   log_level prices_file max_tag_count max_tag_value_bytesize].freeze
     SHARED_ENUM_ATTRIBUTES = {
-      storage_backend: [STORAGE_BACKENDS, :log],
       budget_exceeded_behavior: [BUDGET_EXCEEDED_BEHAVIORS, :notify],
       storage_error_behavior: [STORAGE_ERROR_BEHAVIORS, :warn],
       unknown_pricing_behavior: [UNKNOWN_PRICING_BEHAVIORS, :warn]

data/lib/llm_cost_tracker/doctor/capture_check.rb ADDED Viewed

@@ -0,0 +1,39 @@
+# frozen_string_literal: true
+module LlmCostTracker
+  class Doctor
+    class CaptureCheck
+      def self.call(check_class)
+        new(check_class).call
+      end
+      def initialize(check_class)
+        @check_class = check_class
+      end
+      def call
+        config = LlmCostTracker.configuration
+        return disabled_check unless config.enabled
+        return integrations_check(config.instrumented_integrations) if config.instrumented_integrations.any?
+        check(:ok, "no SDK integrations enabled; Faraday middleware and manual capture remain available")
+      end
+      private
+      attr_reader :check_class
+      def disabled_check
+        check(:warn, "tracking is disabled; set config.enabled = true to record calls")
+      end
+      def integrations_check(integrations)
+        check(:ok, "SDK integrations enabled: #{integrations.join(', ')}")
+      end
+      def check(status, message)
+        check_class.new(status, "capture", message)
+      end
+    end
+  end
+end

data/lib/llm_cost_tracker/doctor.rb CHANGED Viewed

@@ -1,6 +1,7 @@
 # frozen_string_literal: true
 require_relative "price_freshness"
+require_relative "doctor/capture_check"
 module LlmCostTracker
   class Doctor
@@ -38,6 +39,7 @@ module LlmCostTracker
     def checks
       [
         configuration_check,
+        capture_check,
         *integration_checks,
         active_record_check,
         table_check,
@@ -51,9 +53,12 @@ module LlmCostTracker
     private
     def configuration_check
-      Check.new(:ok, "configuration", "storage_backend=#{LlmCostTracker.configuration.storage_backend.inspect}")
+      config = LlmCostTracker.configuration
+      Check.new(:ok, "configuration", "storage_backend=#{config.storage_backend.inspect}, enabled=#{config.enabled}")
     end
+    def capture_check = CaptureCheck.call(Check)
     def integration_checks
       LlmCostTracker::Integrations.checks.map do |check|
         Check.new(check.status, check.name.to_s, check.message)

data/lib/llm_cost_tracker/integrations/anthropic.rb CHANGED Viewed

@@ -1,6 +1,7 @@
 # frozen_string_literal: true
 require_relative "base"
+require_relative "stream_tracker"
 module LlmCostTracker
   module Integrations
@@ -16,11 +17,11 @@ module LlmCostTracker
         def patch_targets
           [
-            patch_target("Anthropic::Resources::Messages", with: MessagesPatch, methods: :create),
+            patch_target("Anthropic::Resources::Messages", with: MessagesPatch, methods: %i[create stream stream_raw]),
             patch_target(
               "Anthropic::Resources::Beta::Messages",
               with: MessagesPatch,
-              methods: :create,
+              methods: %i[create stream stream_raw],
               optional: true
             )
           ]
@@ -64,6 +65,28 @@ module LlmCostTracker
             ObjectReader.nested(usage, :output_tokens_details, :reasoning_tokens)
           )
         end
+        def track_stream(stream, collector:)
+          return stream unless active?
+          StreamTracker.wrap(
+            stream,
+            collector: collector,
+            active: -> { active? },
+            finish: ->(errored:) { finish_stream(collector, errored: errored) }
+          )
+        end
+        def stream_collector(request)
+          LlmCostTracker::StreamCollector.new(
+            provider: "anthropic",
+            model: request[:model] || request["model"]
+          )
+        end
+        def finish_stream(collector, errored:)
+          record_safely { collector.finish!(errored: errored) }
+        end
       end
       module MessagesPatch
@@ -78,6 +101,22 @@ module LlmCostTracker
           )
           message
         end
+        def stream(*args, **kwargs)
+          request = LlmCostTracker::Integrations::Anthropic.request_params(args, kwargs)
+          collector = LlmCostTracker::Integrations::Anthropic.stream_collector(request)
+          LlmCostTracker::Integrations::Anthropic.enforce_budget!
+          stream = super
+          LlmCostTracker::Integrations::Anthropic.track_stream(stream, collector: collector)
+        end
+        def stream_raw(*args, **kwargs)
+          request = LlmCostTracker::Integrations::Anthropic.request_params(args, kwargs)
+          collector = LlmCostTracker::Integrations::Anthropic.stream_collector(request)
+          LlmCostTracker::Integrations::Anthropic.enforce_budget!
+          stream = super
+          LlmCostTracker::Integrations::Anthropic.track_stream(stream, collector: collector)
+        end
       end
     end
   end

data/lib/llm_cost_tracker/integrations/openai.rb CHANGED Viewed

@@ -1,6 +1,7 @@
 # frozen_string_literal: true
 require_relative "base"
+require_relative "stream_tracker"
 module LlmCostTracker
   module Integrations
@@ -16,8 +17,16 @@ module LlmCostTracker
         def patch_targets
           [
-            patch_target("OpenAI::Resources::Responses", with: ResponsesPatch, methods: :create),
-            patch_target("OpenAI::Resources::Chat::Completions", with: ChatCompletionsPatch, methods: :create)
+            patch_target(
+              "OpenAI::Resources::Responses",
+              with: ResponsesPatch,
+              methods: %i[create stream stream_raw retrieve_streaming]
+            ),
+            patch_target(
+              "OpenAI::Resources::Chat::Completions",
+              with: ChatCompletionsPatch,
+              methods: %i[create stream_raw]
+            )
           ]
         end
@@ -70,6 +79,28 @@ module LlmCostTracker
         def regular_input_tokens(input_tokens, cache_read)
           [ObjectReader.integer(input_tokens) - cache_read.to_i, 0].max
         end
+        def track_stream(stream, collector:)
+          return stream unless active?
+          StreamTracker.wrap(
+            stream,
+            collector: collector,
+            active: -> { active? },
+            finish: ->(errored:) { finish_stream(collector, errored: errored) }
+          )
+        end
+        def stream_collector(request)
+          LlmCostTracker::StreamCollector.new(
+            provider: "openai",
+            model: request[:model] || request["model"]
+          )
+        end
+        def finish_stream(collector, errored:)
+          record_safely { collector.finish!(errored: errored) }
+        end
       end
       module ResponsesPatch
@@ -84,6 +115,31 @@ module LlmCostTracker
           )
           response
         end
+        def stream(*args, **kwargs)
+          request = LlmCostTracker::Integrations::Openai.request_params(args, kwargs)
+          collector = LlmCostTracker::Integrations::Openai.stream_collector(request)
+          LlmCostTracker::Integrations::Openai.enforce_budget!
+          stream = super
+          LlmCostTracker::Integrations::Openai.track_stream(stream, collector: collector)
+        end
+        def stream_raw(*args, **kwargs)
+          request = LlmCostTracker::Integrations::Openai.request_params(args, kwargs)
+          collector = LlmCostTracker::Integrations::Openai.stream_collector(request)
+          LlmCostTracker::Integrations::Openai.enforce_budget!
+          stream = super
+          LlmCostTracker::Integrations::Openai.track_stream(stream, collector: collector)
+        end
+        def retrieve_streaming(response_id, *args, **kwargs)
+          request = LlmCostTracker::Integrations::Openai.request_params(args, kwargs)
+          collector = LlmCostTracker::Integrations::Openai.stream_collector(request)
+          collector.provider_response_id = response_id
+          LlmCostTracker::Integrations::Openai.enforce_budget!
+          stream = super
+          LlmCostTracker::Integrations::Openai.track_stream(stream, collector: collector)
+        end
       end
       module ChatCompletionsPatch
@@ -98,6 +154,14 @@ module LlmCostTracker
           )
           response
         end
+        def stream_raw(*args, **kwargs)
+          request = LlmCostTracker::Integrations::Openai.request_params(args, kwargs)
+          collector = LlmCostTracker::Integrations::Openai.stream_collector(request)
+          LlmCostTracker::Integrations::Openai.enforce_budget!
+          stream = super
+          LlmCostTracker::Integrations::Openai.track_stream(stream, collector: collector)
+        end
       end
     end
   end

data/lib/llm_cost_tracker/integrations/registry.rb CHANGED Viewed

@@ -1,5 +1,8 @@
 # frozen_string_literal: true
+require "monitor"
+require_relative "../errors"
 require_relative "openai"
 require_relative "anthropic"
 require_relative "ruby_llm"
@@ -7,14 +10,22 @@ require_relative "ruby_llm"
 module LlmCostTracker
   module Integrations
     module Registry
-      INTEGRATIONS = {
+      DEFAULT_INTEGRATIONS = {
         openai: Openai,
         anthropic: Anthropic,
         ruby_llm: RubyLlm
       }.freeze
+      MUTEX = Monitor.new
       module_function
+      def register(name, integration)
+        key = name.to_sym
+        validate_integration!(integration)
+        MUTEX.synchronize { @integrations = integrations.merge(key => integration).freeze }
+        integration
+      end
       def install!(names = LlmCostTracker.configuration.instrumented_integrations)
         normalize(names).each { |name| fetch(name).install }
       end
@@ -30,13 +41,32 @@ module LlmCostTracker
       end
       def fetch(name)
-        INTEGRATIONS.fetch(name.to_sym) do
-          message = "Unknown integration: #{name.inspect}. Use one of: #{INTEGRATIONS.keys.join(', ')}"
+        integrations.fetch(name.to_sym) do
+          message = "Unknown integration: #{name.inspect}. Use one of: #{names.join(', ')}"
           raise LlmCostTracker::Error, message
         end
       end
+      def names
+        integrations.keys
+      end
+      def reset!
+        MUTEX.synchronize { @integrations = DEFAULT_INTEGRATIONS.dup.freeze }
+      end
+      def integrations
+        @integrations || MUTEX.synchronize { @integrations ||= DEFAULT_INTEGRATIONS.dup.freeze }
+      end
+      def validate_integration!(integration)
+        return if integration.respond_to?(:install) && integration.respond_to?(:status)
+        raise ArgumentError, "integration must respond to install and status"
+      end
     end
+    def self.register(name, integration) = Registry.register(name, integration)
     def self.install! = Registry.install!
     def self.checks = Registry.checks
   end

data/lib/llm_cost_tracker/integrations/stream_tracker.rb ADDED Viewed

@@ -0,0 +1,166 @@
+# frozen_string_literal: true
+require "monitor"
+require_relative "../logging"
+require_relative "../stream_collector"
+require_relative "../value_helpers"
+require_relative "object_reader"
+module LlmCostTracker
+  module Integrations
+    class StreamTracker
+      def self.wrap(stream, collector:, active:, finish: nil) = new(stream, collector, active, finish).wrap
+      def initialize(stream, collector, active, finish)
+        @stream = stream
+        @collector = collector
+        @active = active
+        @finish = finish || proc { |errored:| @collector.finish!(errored: errored) }
+        @finished = false
+        @capture_failed = false
+        @monitor = Monitor.new
+      end
+      def wrap
+        return @stream unless @stream
+        iterator_wrapped = @stream.instance_variable_defined?(:@iterator) && wrap_iterator?
+        wrap_each if !iterator_wrapped && @stream.respond_to?(:each)
+        @stream
+      rescue StandardError => e
+        Logging.warn("stream integration failed to install wrapper: #{e.class}: #{e.message}")
+        @stream
+      end
+      private
+      def wrap_iterator?
+        iterator = @stream.instance_variable_get(:@iterator)
+        return false unless iterator.respond_to?(:each)
+        @stream.instance_variable_set(:@iterator, tracked_iterator(iterator))
+        true
+      end
+      def wrap_each
+        tracker = self
+        original_each = @stream.method(:each)
+        @stream.define_singleton_method(:each) do |&block|
+          next enum_for(:each) unless block
+          tracker.__send__(:each_from, original_each, &block)
+        end
+      end
+      def tracked_iterator(iterator)
+        Enumerator.new do |yielder|
+          each_from(iterator) { |event| yielder << event }
+        end
+      end
+      def each_from(iterable)
+        errored = false
+        iterate(iterable) do |event|
+          capture(event)
+          yield event
+        end
+      rescue StandardError
+        errored = true
+        raise
+      ensure
+        finish!(errored: errored)
+      end
+      def iterate(iterable, &)
+        if iterable.respond_to?(:each)
+          iterable.each(&)
+        else
+          iterable.call(&)
+        end
+      end
+      def capture(event)
+        payload = normalize(event_payload(event))
+        @collector.event(payload, type: event_type(event, payload))
+      rescue StandardError => e
+        warn_capture_failure(e)
+      end
+      def event_payload(event)
+        if event.respond_to?(:deep_to_h)
+          event.deep_to_h
+        elsif event.respond_to?(:to_h)
+          event.to_h
+        else
+          event_attributes(event)
+        end
+      end
+      def event_attributes(event)
+        %i[type id model usage response message].each_with_object({}) do |key, attributes|
+          value = ObjectReader.read(event, key)
+          attributes[key] = value unless value.nil?
+        end
+      end
+      def event_type(event, payload)
+        value = ObjectReader.first(event, :type) || payload["type"]
+        value&.to_s
+      end
+      def normalize(value)
+        case value
+        when Hash
+          value.each_with_object({}) do |(key, nested), normalized|
+            normalized[key.to_s] = normalize(nested)
+          end
+        when Array
+          value.map { |nested| normalize(nested) }
+        when Symbol
+          value.to_s
+        when NilClass
+          nil
+        else
+          converted = object_hash(value)
+          converted ? normalize(converted) : ValueHelpers.deep_dup(value)
+        end
+      end
+      def object_hash(value)
+        if value.respond_to?(:deep_to_h)
+          value.deep_to_h
+        elsif value.respond_to?(:to_h)
+          value.to_h
+        end
+      rescue StandardError
+        nil
+      end
+      def warn_capture_failure(error)
+        should_warn = @monitor.synchronize do
+          next false if @capture_failed
+          @capture_failed = true
+          true
+        end
+        return unless should_warn
+        Logging.warn("stream integration failed to capture event: #{error.class}: #{error.message}")
+      end
+      def finish!(errored:)
+        should_finish = @monitor.synchronize do
+          next false if @finished
+          @finished = true
+          true
+        end
+        return unless should_finish && @active.call
+        @finish.call(errored: errored)
+      end
+    end
+  end
+end

data/lib/llm_cost_tracker/llm_api_call.rb CHANGED Viewed

@@ -2,9 +2,9 @@
 require "active_record"
+require_relative "llm_api_call_metrics"
 require_relative "period_grouping"
 require_relative "tag_accessors"
-require_relative "tag_key"
 require_relative "tag_query"
 require_relative "tags_column"
@@ -12,6 +12,7 @@ module LlmCostTracker
   class LlmApiCall < ActiveRecord::Base
     extend PeriodGrouping
     extend TagsColumn
+    extend LlmApiCallMetrics
     include TagAccessors
     self.table_name = "llm_api_calls"
@@ -55,82 +56,5 @@ module LlmCostTracker
     def self.by_tags(tags)
       TagQuery.apply(self, tags)
     end
-    def self.total_cost
-      sum(:total_cost).to_f
-    end
-    def self.total_tokens
-      sum(:total_tokens).to_i
-    end
-    def self.cost_by_model
-      group(:model).sum(:total_cost)
-    end
-    def self.cost_by_provider
-      group(:provider).sum(:total_cost)
-    end
-    def self.group_by_tag(key)
-      group(Arel.sql(tag_value_expression(key)))
-    end
-    def self.cost_by_tag(key, limit: nil)
-      relation = group_by_tag(key).order(Arel.sql("COALESCE(SUM(total_cost), 0) DESC"))
-      relation = relation.limit(limit) if limit
-      costs = relation.sum(:total_cost).each_with_object(Hash.new(0.0)) do |(tag_value, cost), grouped|
-        grouped[tag_value_label(tag_value)] += cost.to_f
-      end
-      costs.sort_by { |_label, cost| -cost }.to_h
-    end
-    def self.average_latency_ms
-      return nil unless latency_column?
-      average(:latency_ms)&.to_f
-    end
-    def self.latency_by_model
-      return {} unless latency_column?
-      group(:model).average(:latency_ms).transform_values(&:to_f)
-    end
-    def self.latency_by_provider
-      return {} unless latency_column?
-      group(:provider).average(:latency_ms).transform_values(&:to_f)
-    end
-    def self.tag_value_label(value)
-      value.nil? || value == "" ? "(untagged)" : value.to_s
-    end
-    def self.tag_value_expression(key, table_name: quoted_table_name)
-      key = validated_tag_key(key)
-      column = "#{table_name}.#{connection.quote_column_name('tags')}"
-      case connection.adapter_name
-      when /postgres/i
-        json_column = tags_jsonb_column? ? column : "(#{column})::jsonb"
-        "#{json_column}->>#{connection.quote(key)}"
-      when /mysql/i
-        "JSON_UNQUOTE(JSON_EXTRACT(#{column}, #{connection.quote(json_path(key))}))"
-      else
-        "json_extract(#{column}, #{connection.quote(json_path(key))})"
-      end
-    end
-    def self.validated_tag_key(key)
-      TagKey.validate!(key)
-    end
-    private_class_method :validated_tag_key
-    def self.json_path(key)
-      "$.\"#{key}\""
-    end
-    private_class_method :json_path
   end
 end

data/lib/llm_cost_tracker/llm_api_call_metrics.rb ADDED Viewed

@@ -0,0 +1,63 @@
+# frozen_string_literal: true
+require_relative "tag_sql"
+module LlmCostTracker
+  module LlmApiCallMetrics
+    def total_cost
+      sum(:total_cost).to_f
+    end
+    def total_tokens
+      sum(:total_tokens).to_i
+    end
+    def cost_by_model
+      group(:model).sum(:total_cost)
+    end
+    def cost_by_provider
+      group(:provider).sum(:total_cost)
+    end
+    def group_by_tag(key)
+      group(Arel.sql(tag_value_expression(key)))
+    end
+    def cost_by_tag(key, limit: nil)
+      relation = group_by_tag(key).order(Arel.sql("COALESCE(SUM(total_cost), 0) DESC"))
+      relation = relation.limit(limit) if limit
+      costs = relation.sum(:total_cost).each_with_object(Hash.new(0.0)) do |(tag_value, cost), grouped|
+        grouped[tag_value_label(tag_value)] += cost.to_f
+      end
+      costs.sort_by { |_label, cost| -cost }.to_h
+    end
+    def average_latency_ms
+      return nil unless latency_column?
+      average(:latency_ms)&.to_f
+    end
+    def latency_by_model
+      return {} unless latency_column?
+      group(:model).average(:latency_ms).transform_values(&:to_f)
+    end
+    def latency_by_provider
+      return {} unless latency_column?
+      group(:provider).average(:latency_ms).transform_values(&:to_f)
+    end
+    def tag_value_label(value)
+      TagSql.value_label(value)
+    end
+    def tag_value_expression(key, table_name: quoted_table_name)
+      TagSql.value_expression(self, key, table_name: table_name)
+    end
+  end
+end

data/lib/llm_cost_tracker/parsers/openai_usage.rb CHANGED Viewed

@@ -61,7 +61,7 @@ module LlmCostTracker
       def detect_stream_usage(events)
         find_event_value(events, reverse: true) do |data|
-          usage = data["usage"]
+          usage = data["usage"] || data.dig("response", "usage")
           usage if usage.is_a?(Hash)
         end
       end