RubyGems - llm_cost_tracker - Versions diffs - 0.7.0 → 0.7.2 - Mend

llm_cost_tracker 0.7.0 → 0.7.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (174) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +31 -0
data/README.md +21 -16
data/app/assets/llm_cost_tracker/application.css +3 -0
data/app/controllers/llm_cost_tracker/application_controller.rb +22 -4
data/app/controllers/llm_cost_tracker/calls_controller.rb +6 -11
data/app/controllers/llm_cost_tracker/dashboard_controller.rb +2 -1
data/app/controllers/llm_cost_tracker/data_quality_controller.rb +5 -1
data/app/controllers/llm_cost_tracker/models_controller.rb +0 -1
data/app/controllers/llm_cost_tracker/tags_controller.rb +1 -8
data/app/helpers/llm_cost_tracker/application_helper.rb +2 -1
data/app/helpers/llm_cost_tracker/dashboard_filter_helper.rb +1 -2
data/app/helpers/llm_cost_tracker/dashboard_filter_options_helper.rb +1 -1
data/app/helpers/llm_cost_tracker/dashboard_query_helper.rb +10 -27
data/app/helpers/llm_cost_tracker/token_usage_helper.rb +58 -0
data/app/models/llm_cost_tracker/ingestion/event.rb +13 -0
data/app/models/llm_cost_tracker/ingestion/lease.rb +11 -0
data/app/models/llm_cost_tracker/ledger/call.rb +45 -0
data/app/models/llm_cost_tracker/ledger/call_metrics.rb +66 -0
data/app/models/llm_cost_tracker/ledger/period/grouping.rb +71 -0
data/app/models/llm_cost_tracker/ledger/period/total.rb +13 -0
data/app/models/llm_cost_tracker/ledger/tags/accessors.rb +19 -0
data/app/services/llm_cost_tracker/dashboard/data_quality.rb +111 -94
data/app/services/llm_cost_tracker/dashboard/date_range.rb +2 -2
data/app/services/llm_cost_tracker/dashboard/filter.rb +7 -18
data/app/services/llm_cost_tracker/dashboard/overview_stats.rb +58 -67
data/app/services/llm_cost_tracker/dashboard/pagination.rb +59 -0
data/app/services/llm_cost_tracker/dashboard/params.rb +26 -0
data/app/services/llm_cost_tracker/dashboard/provider_breakdown.rb +18 -20
data/app/services/llm_cost_tracker/dashboard/spend_anomaly.rb +4 -13
data/app/services/llm_cost_tracker/dashboard/tag_breakdown.rb +28 -61
data/app/services/llm_cost_tracker/dashboard/tag_key_explorer.rb +8 -21
data/app/services/llm_cost_tracker/dashboard/time_series.rb +1 -1
data/app/services/llm_cost_tracker/dashboard/top_models.rb +12 -47
data/app/views/llm_cost_tracker/calls/index.html.erb +12 -18
data/app/views/llm_cost_tracker/calls/show.html.erb +30 -32
data/app/views/llm_cost_tracker/dashboard/index.html.erb +17 -19
data/app/views/llm_cost_tracker/data_quality/index.html.erb +108 -135
data/app/views/llm_cost_tracker/models/index.html.erb +8 -9
data/app/views/llm_cost_tracker/shared/setup_required.html.erb +13 -2
data/app/views/llm_cost_tracker/tags/show.html.erb +20 -20
data/lib/llm_cost_tracker/budget.rb +8 -20
data/lib/llm_cost_tracker/capture/stream.rb +9 -0
data/lib/llm_cost_tracker/capture/stream_collector.rb +189 -0
data/lib/llm_cost_tracker/{integrations → capture}/stream_tracker.rb +41 -73
data/lib/llm_cost_tracker/configuration/instrumentation.rb +3 -7
data/lib/llm_cost_tracker/configuration.rb +33 -36
data/lib/llm_cost_tracker/doctor/capture_verifier.rb +61 -0
data/lib/llm_cost_tracker/doctor/check.rb +7 -0
data/lib/llm_cost_tracker/doctor/ingestion_check.rb +22 -59
data/lib/llm_cost_tracker/doctor/price_check.rb +60 -0
data/lib/llm_cost_tracker/doctor.rb +63 -71
data/lib/llm_cost_tracker/errors.rb +4 -15
data/lib/llm_cost_tracker/event.rb +6 -6
data/lib/llm_cost_tracker/generators/llm_cost_tracker/add_token_usage_generator.rb +42 -0
data/lib/llm_cost_tracker/generators/llm_cost_tracker/install_generator.rb +2 -0
data/lib/llm_cost_tracker/generators/llm_cost_tracker/prices_generator.rb +7 -7
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/add_period_totals_to_llm_cost_tracker.rb.erb +3 -3
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/add_token_usage_to_llm_api_calls.rb.erb +22 -0
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/create_llm_api_calls.rb.erb +9 -14
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/initializer.rb.erb +0 -4
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/upgrade_llm_api_call_cost_precision.rb.erb +12 -1
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/upgrade_llm_api_call_tags_to_jsonb.rb.erb +2 -2
data/lib/llm_cost_tracker/{storage/active_record_inbox_batch.rb → ingestion/batch.rb} +21 -20
data/lib/llm_cost_tracker/ingestion/inbox.rb +105 -0
data/lib/llm_cost_tracker/{storage/active_record_ingestor_lease.rb → ingestion/lease_claim.rb} +5 -7
data/lib/llm_cost_tracker/{storage/active_record_ingestor.rb → ingestion/worker.rb} +38 -48
data/lib/llm_cost_tracker/ingestion.rb +129 -0
data/lib/llm_cost_tracker/integrations/anthropic.rb +66 -31
data/lib/llm_cost_tracker/integrations/base.rb +73 -34
data/lib/llm_cost_tracker/integrations/openai.rb +43 -37
data/lib/llm_cost_tracker/integrations/ruby_llm.rb +40 -30
data/lib/llm_cost_tracker/integrations.rb +43 -0
data/lib/llm_cost_tracker/ledger/period/totals.rb +66 -0
data/lib/llm_cost_tracker/{storage/active_record_periods.rb → ledger/period.rb} +2 -2
data/lib/llm_cost_tracker/ledger/rollups/batch.rb +43 -0
data/lib/llm_cost_tracker/ledger/rollups/upsert_sql.rb +46 -0
data/lib/llm_cost_tracker/ledger/rollups.rb +87 -0
data/lib/llm_cost_tracker/ledger/schema/adapter.rb +51 -0
data/lib/llm_cost_tracker/ledger/schema/calls.rb +101 -0
data/lib/llm_cost_tracker/ledger/schema/period_totals.rb +32 -0
data/lib/llm_cost_tracker/ledger/store.rb +60 -0
data/lib/llm_cost_tracker/ledger/tags/query.rb +29 -0
data/lib/llm_cost_tracker/ledger/tags/sql.rb +33 -0
data/lib/llm_cost_tracker/ledger.rb +13 -0
data/lib/llm_cost_tracker/logging.rb +3 -6
data/lib/llm_cost_tracker/middleware/faraday.rb +88 -46
data/lib/llm_cost_tracker/parsers/anthropic.rb +62 -29
data/lib/llm_cost_tracker/parsers/base.rb +12 -21
data/lib/llm_cost_tracker/parsers/gemini.rb +50 -25
data/lib/llm_cost_tracker/parsers/openai.rb +27 -5
data/lib/llm_cost_tracker/parsers/openai_compatible.rb +14 -4
data/lib/llm_cost_tracker/parsers/openai_usage.rb +58 -25
data/lib/llm_cost_tracker/parsers/sse.rb +4 -7
data/lib/llm_cost_tracker/parsers.rb +20 -0
data/lib/llm_cost_tracker/prices.json +361 -36
data/lib/llm_cost_tracker/pricing/components.rb +37 -0
data/lib/llm_cost_tracker/pricing/effective_prices.rb +46 -50
data/lib/llm_cost_tracker/pricing/explainer.rb +25 -30
data/lib/llm_cost_tracker/pricing/lookup.rb +67 -46
data/lib/llm_cost_tracker/pricing/registry.rb +156 -0
data/lib/llm_cost_tracker/pricing/sync/fetcher.rb +107 -0
data/lib/llm_cost_tracker/pricing/sync/registry_diff.rb +53 -0
data/lib/llm_cost_tracker/pricing/sync/registry_loader.rb +63 -0
data/lib/llm_cost_tracker/pricing/sync/registry_writer.rb +31 -0
data/lib/llm_cost_tracker/pricing/sync.rb +159 -0
data/lib/llm_cost_tracker/pricing/unknown.rb +46 -0
data/lib/llm_cost_tracker/pricing.rb +33 -32
data/lib/llm_cost_tracker/railtie.rb +7 -8
data/lib/llm_cost_tracker/report/data.rb +72 -0
data/lib/llm_cost_tracker/report/formatter.rb +69 -0
data/lib/llm_cost_tracker/report.rb +8 -8
data/lib/llm_cost_tracker/retention.rb +27 -10
data/lib/llm_cost_tracker/tags/context.rb +35 -0
data/lib/llm_cost_tracker/tags/key.rb +18 -0
data/lib/llm_cost_tracker/tags/sanitizer.rb +68 -0
data/lib/llm_cost_tracker/token_usage.rb +67 -0
data/lib/llm_cost_tracker/tracker.rb +39 -69
data/lib/llm_cost_tracker/usage_capture.rb +37 -0
data/lib/llm_cost_tracker/version.rb +1 -1
data/lib/llm_cost_tracker.rb +56 -78
data/lib/tasks/llm_cost_tracker.rake +18 -13
metadata +54 -58
data/app/services/llm_cost_tracker/dashboard/data_quality_aggregate.rb +0 -81
data/app/services/llm_cost_tracker/pagination.rb +0 -57
data/lib/llm_cost_tracker/active_record_adapter.rb +0 -53
data/lib/llm_cost_tracker/capture_verifier.rb +0 -64
data/lib/llm_cost_tracker/cost.rb +0 -12
data/lib/llm_cost_tracker/doctor/capture_check.rb +0 -39
data/lib/llm_cost_tracker/event_metadata.rb +0 -52
data/lib/llm_cost_tracker/generators/llm_cost_tracker/add_usage_breakdown_generator.rb +0 -29
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/add_usage_breakdown_to_llm_api_calls.rb.erb +0 -29
data/lib/llm_cost_tracker/inbox_event.rb +0 -9
data/lib/llm_cost_tracker/ingestor_lease.rb +0 -9
data/lib/llm_cost_tracker/integrations/object_reader.rb +0 -56
data/lib/llm_cost_tracker/integrations/registry.rb +0 -71
data/lib/llm_cost_tracker/llm_api_call.rb +0 -60
data/lib/llm_cost_tracker/llm_api_call_metrics.rb +0 -63
data/lib/llm_cost_tracker/parameter_hash.rb +0 -33
data/lib/llm_cost_tracker/parsed_usage.rb +0 -72
data/lib/llm_cost_tracker/parsers/registry.rb +0 -58
data/lib/llm_cost_tracker/period_grouping.rb +0 -67
data/lib/llm_cost_tracker/period_total.rb +0 -9
data/lib/llm_cost_tracker/price_freshness.rb +0 -38
data/lib/llm_cost_tracker/price_registry.rb +0 -144
data/lib/llm_cost_tracker/price_sync/fetcher.rb +0 -104
data/lib/llm_cost_tracker/price_sync/registry_diff.rb +0 -51
data/lib/llm_cost_tracker/price_sync/registry_loader.rb +0 -61
data/lib/llm_cost_tracker/price_sync/registry_writer.rb +0 -29
data/lib/llm_cost_tracker/price_sync.rb +0 -144
data/lib/llm_cost_tracker/report_data.rb +0 -94
data/lib/llm_cost_tracker/report_formatter.rb +0 -67
data/lib/llm_cost_tracker/request_url.rb +0 -20
data/lib/llm_cost_tracker/storage/active_record_backend.rb +0 -167
data/lib/llm_cost_tracker/storage/active_record_connection_cleanup.rb +0 -13
data/lib/llm_cost_tracker/storage/active_record_inbox.rb +0 -160
data/lib/llm_cost_tracker/storage/active_record_period_totals.rb +0 -84
data/lib/llm_cost_tracker/storage/active_record_rollup_batch.rb +0 -41
data/lib/llm_cost_tracker/storage/active_record_rollup_upsert_sql.rb +0 -42
data/lib/llm_cost_tracker/storage/active_record_rollups.rb +0 -146
data/lib/llm_cost_tracker/storage/active_record_store.rb +0 -145
data/lib/llm_cost_tracker/storage/writer.rb +0 -35
data/lib/llm_cost_tracker/stream_capture.rb +0 -7
data/lib/llm_cost_tracker/stream_collector.rb +0 -199
data/lib/llm_cost_tracker/tag_accessors.rb +0 -15
data/lib/llm_cost_tracker/tag_context.rb +0 -52
data/lib/llm_cost_tracker/tag_key.rb +0 -16
data/lib/llm_cost_tracker/tag_query.rb +0 -43
data/lib/llm_cost_tracker/tag_sanitizer.rb +0 -81
data/lib/llm_cost_tracker/tag_sql.rb +0 -34
data/lib/llm_cost_tracker/tags_column.rb +0 -105
data/lib/llm_cost_tracker/unknown_pricing.rb +0 -54
data/lib/llm_cost_tracker/usage_breakdown.rb +0 -30
data/lib/llm_cost_tracker/value_helpers.rb +0 -40

data/lib/llm_cost_tracker/middleware/faraday.rb CHANGED Viewed

@@ -2,10 +2,10 @@
 require "faraday"
 require "json"
+require "uri"
 require_relative "../logging"
-require_relative "../request_url"
-require_relative "../stream_capture"
+require_relative "../capture/stream"
 module LlmCostTracker
   module Middleware
@@ -20,51 +20,59 @@ module LlmCostTracker
         request_url  = request_env.url.to_s
         request_body = read_body(request_env.body) || ""
-        parser       = Parsers::Registry.find_for(request_url)
+        parser       = Parsers.find_for(request_url)
         streaming    = parser&.streaming_request?(request_url, request_body)
         stream_buffer = install_stream_tap(request_env) if streaming
         Tracker.enforce_budget! if parser
-        started_at = monotonic_time
+        context_tags, metadata = tag_snapshot(request_env) if parser
+        started_at = Process.clock_gettime(Process::CLOCK_MONOTONIC)
         @app.call(request_env).on_complete do |response_env|
           process(
             parser: parser,
-            request_env: request_env,
             request_url: request_url,
             request_body: request_body,
             response_env: response_env,
-            latency_ms: elapsed_ms(started_at),
+            latency_ms: ((Process.clock_gettime(Process::CLOCK_MONOTONIC) - started_at) * 1000).round,
             streaming: streaming,
-            stream_buffer: stream_buffer
+            stream_buffer: stream_buffer,
+            context_tags: context_tags,
+            metadata: metadata
           )
         end
       end
       private
-      def process(parser:, request_env:, request_url:, request_body:, response_env:,
-                  latency_ms:, streaming:, stream_buffer:)
+      def process(parser:, request_url:, request_body:, response_env:,
+                  latency_ms:, streaming:, stream_buffer:, context_tags:, metadata:)
         return unless parser
         parsed =
           if streaming
-            parse_stream(parser, request_url, request_body, response_env, stream_buffer)
+            parse_stream(
+              parser: parser,
+              request_url: request_url,
+              request_body: request_body,
+              response_env: response_env,
+              stream_buffer: stream_buffer
+            )
           else
-            parse_response(parser, request_url, request_body, response_env)
+            parse_response(
+              parser: parser,
+              request_url: request_url,
+              request_body: request_body,
+              response_env: response_env
+            )
           end
         return unless parsed
         Tracker.record(
-          provider: parsed.provider,
-          model: parsed.model,
-          input_tokens: parsed.input_tokens,
-          output_tokens: parsed.output_tokens,
+          capture: parsed,
           latency_ms: latency_ms,
-          stream: parsed.stream,
-          usage_source: parsed.usage_source,
-          provider_response_id: parsed.provider_response_id,
-          metadata: resolved_tags(request_env).merge(parsed.metadata)
+          metadata: metadata,
+          context_tags: context_tags
         )
       rescue LlmCostTracker::Error
         raise
@@ -72,49 +80,72 @@ module LlmCostTracker
         Logging.warn("Error processing response: #{e.class}: #{e.message}")
       end
-      def parse_response(parser, request_url, request_body, response_env)
+      def parse_response(parser:, request_url:, request_body:, response_env:)
         response_body = read_body(response_env.body)
         unless response_body
           Logging.warn(
-            "Unable to read response body for #{RequestUrl.label(request_url)}; " \
+            "Unable to read response body for #{request_url_label(request_url)}; " \
             "known streaming responses are captured automatically, or via LlmCostTracker.track_stream " \
             "for custom clients."
           )
           return nil
         end
-        parser.parse(request_url, request_body, response_env.status, response_body)
+        parser.parse(
+          request_url: request_url,
+          request_body: request_body,
+          response_status: response_env.status,
+          response_body: response_body,
+          response_headers: response_env.response_headers
+        )
       end
-      def parse_stream(parser, request_url, request_body, response_env, stream_buffer)
+      def parse_stream(parser:, request_url:, request_body:, response_env:, stream_buffer:)
         if stream_buffer&.dig(:overflowed)
           Logging.warn(capture_warning(request_url, stream_buffer))
-          return parser.parse_stream(request_url, request_body, response_env.status, [])
+          return parser.parse_stream(
+            request_url: request_url,
+            request_body: request_body,
+            response_status: response_env.status,
+            response_headers: response_env.response_headers
+          )
         end
         body = stream_buffer&.dig(:buffer)&.string
-        body = read_body(response_env.body) if body.nil? || body.empty?
+        body = read_body(response_env.body) if body.blank?
-        if body.nil? || body.empty?
+        if body.blank?
           Logging.warn(capture_warning(request_url, stream_buffer))
-          return parser.parse_stream(request_url, request_body, response_env.status, [])
+          return parser.parse_stream(
+            request_url: request_url,
+            request_body: request_body,
+            response_status: response_env.status,
+            response_headers: response_env.response_headers
+          )
         end
         events = Parsers::SSE.parse(body)
-        parser.parse_stream(request_url, request_body, response_env.status, events)
+        parser.parse_stream(
+          request_url: request_url,
+          request_body: request_body,
+          response_status: response_env.status,
+          events: events,
+          response_headers: response_env.response_headers
+        )
       end
       def install_stream_tap(request_env)
-        return nil unless request_env.respond_to?(:request) && request_env.request
+        request = request_env.try(:request)
+        return nil unless request
-        original = request_env.request.on_data
+        original = request.on_data
         return nil unless original
         state = { buffer: StringIO.new, bytes: 0, overflowed: false }
-        request_env.request.on_data = proc do |chunk, size, env|
+        request.on_data = proc do |chunk, size, env|
           chunk = chunk.to_s
           unless state[:overflowed]
-            if state[:bytes] + chunk.bytesize <= StreamCapture::LIMIT_BYTES
+            if state[:bytes] + chunk.bytesize <= Capture::Stream::LIMIT_BYTES
               state[:buffer] << chunk
               state[:bytes] += chunk.bytesize
             else
@@ -136,38 +167,49 @@ module LlmCostTracker
         when nil then ""
         when Hash, Array then body.to_json
         else
-          body.respond_to?(:to_str) ? body.to_str : nil
+          body.try(:to_str)
         end
       end
       def resolved_tags(request_env)
-        tags = @tags.respond_to?(:call) ? call_tags(request_env) : @tags
+        tags =
+          if @tags.respond_to?(:call)
+            @tags.arity.zero? ? @tags.call : @tags.call(request_env)
+          else
+            @tags
+          end
         return {} if tags.nil?
         tags.to_h
       end
-      def call_tags(request_env)
-        @tags.arity.zero? ? @tags.call : @tags.call(request_env)
-      end
-      def monotonic_time
-        Process.clock_gettime(Process::CLOCK_MONOTONIC)
-      end
-      def elapsed_ms(started_at)
-        ((monotonic_time - started_at) * 1000).round
+      def tag_snapshot(request_env)
+        [LlmCostTracker::Tags::Context.tags, resolved_tags(request_env)]
+      rescue StandardError => e
+        Logging.warn("Error resolving request tags: #{e.class}: #{e.message}")
+        [{}, {}]
       end
       def capture_warning(request_url, stream_buffer)
         unless stream_buffer&.dig(:overflowed)
-          return "Unable to capture streaming response for #{RequestUrl.label(request_url)}; " \
+          return "Unable to capture streaming response for #{request_url_label(request_url)}; " \
                  "recording usage_source=unknown. Use LlmCostTracker.track_stream for manual capture."
         end
-        "Streaming response for #{RequestUrl.label(request_url)} exceeded #{StreamCapture::LIMIT_BYTES} bytes; " \
+        "Streaming response for #{request_url_label(request_url)} exceeded #{Capture::Stream::LIMIT_BYTES} bytes; " \
           "recording usage_source=unknown. Use LlmCostTracker.track_stream for manual capture."
       end
+      def request_url_label(value)
+        uri = URI.parse(value.to_s)
+        uri.query = nil
+        uri.fragment = nil
+        uri.try(:user=, nil)
+        uri.try(:password=, nil)
+        uri.to_s
+      rescue URI::InvalidURIError
+        value.to_s.split("?", 2).first
+      end
     end
   end
 end

data/lib/llm_cost_tracker/parsers/anthropic.rb CHANGED Viewed

@@ -15,7 +15,7 @@ module LlmCostTracker
         %w[anthropic]
       end
-      def parse(_request_url, request_body, response_status, response_body)
+      def parse(request_body:, response_status:, response_body:, **)
         return nil unless response_status == 200
         response = safe_json_parse(response_body)
@@ -24,36 +24,38 @@ module LlmCostTracker
         request = safe_json_parse(request_body)
         cache_read = usage["cache_read_input_tokens"].to_i
-        cache_write = usage["cache_creation_input_tokens"].to_i
-        ParsedUsage.build(
+        UsageCapture.build(
           provider: "anthropic",
           provider_response_id: response["id"],
+          pricing_mode: pricing_mode(request: request, response: response, usage: usage),
           model: response["model"] || request["model"],
-          input_tokens: usage["input_tokens"].to_i,
-          output_tokens: usage["output_tokens"].to_i,
-          total_tokens: usage["input_tokens"].to_i + usage["output_tokens"].to_i + cache_read + cache_write,
-          cache_read_input_tokens: usage["cache_read_input_tokens"],
-          cache_write_input_tokens: usage["cache_creation_input_tokens"],
+          token_usage: token_usage(usage: usage, cache_read: cache_read),
           usage_source: :response
         )
       end
-      def parse_stream(_request_url, request_body, response_status, events)
+      def parse_stream(response_status:, request_body: nil, events: [], **)
         return nil unless response_status == 200
         request = safe_json_parse(request_body)
-        model = stream_model(events) || request["model"]
+        model = find_event_value(events) { |data| data.dig("message", "model") } || request["model"]
         usage = stream_usage(events)
-        response_id = stream_response_id(events)
+        response_id = find_event_value(events) { |data| data.dig("message", "id") || data["id"] }
         if usage
-          build_stream_result(model, usage, response_id)
+          build_stream_result(
+            model: model,
+            usage: usage,
+            response_id: response_id,
+            pricing_mode: pricing_mode(request: request, response: nil, usage: usage)
+          )
         else
           build_unknown_stream_usage(
             provider: "anthropic",
             model: model,
-            provider_response_id: response_id
+            provider_response_id: response_id,
+            pricing_mode: pricing_mode(request: request, response: nil, usage: usage)
           )
         end
       end
@@ -75,33 +77,64 @@ module LlmCostTracker
         end
       end
-      def stream_model(events)
-        find_event_value(events) { |data| data.dig("message", "model") }
-      end
+      def build_stream_result(model:, usage:, response_id:, pricing_mode:)
+        cache_read = usage["cache_read_input_tokens"].to_i
-      def stream_response_id(events)
-        find_event_value(events) { |data| data.dig("message", "id") || data["id"] }
+        UsageCapture.build(
+          provider: "anthropic",
+          provider_response_id: response_id,
+          pricing_mode: pricing_mode,
+          model: model,
+          token_usage: token_usage(usage: usage, cache_read: cache_read),
+          stream: true,
+          usage_source: :stream_final
+        )
       end
-      def build_stream_result(model, usage, response_id)
+      def token_usage(usage:, cache_read:)
         input = usage["input_tokens"].to_i
         output = usage["output_tokens"].to_i
-        cache_read = usage["cache_read_input_tokens"].to_i
-        cache_write = usage["cache_creation_input_tokens"].to_i
+        cache_creation = usage["cache_creation"]
+        if cache_creation.is_a?(Hash)
+          cache_write = cache_creation["ephemeral_5m_input_tokens"].to_i
+          cache_write_1h = cache_creation["ephemeral_1h_input_tokens"].to_i
+        else
+          cache_write = usage["cache_creation_input_tokens"].to_i
+          cache_write_1h = 0
+        end
-        ParsedUsage.build(
-          provider: "anthropic",
-          provider_response_id: response_id,
-          model: model,
+        TokenUsage.build(
           input_tokens: input,
           output_tokens: output,
-          total_tokens: input + output + cache_read + cache_write,
+          total_tokens: input + output + cache_read + cache_write + cache_write_1h,
           cache_read_input_tokens: usage["cache_read_input_tokens"],
-          cache_write_input_tokens: usage["cache_creation_input_tokens"],
-          stream: true,
-          usage_source: :stream_final
+          cache_write_input_tokens: cache_write,
+          cache_write_1h_input_tokens: cache_write_1h
         )
       end
+      def pricing_mode(request:, response:, usage:)
+        modes = []
+        speed = usage&.fetch("speed", nil) || response&.fetch("speed", nil) || request["speed"]
+        service_tier = usage&.fetch("service_tier", nil) ||
+                       response&.fetch("service_tier", nil) ||
+                       request["service_tier"]
+        modes << Pricing.normalize_mode(speed)
+        modes << Pricing.normalize_mode(service_tier)
+        modes << "data_residency" if inference_geo(request: request, response: response, usage: usage) == "us"
+        modes = modes.compact.uniq
+        modes.empty? ? nil : modes.join("_")
+      end
+      def inference_geo(request:, response:, usage:)
+        (
+          usage&.fetch("inference_geo", nil) ||
+          response&.fetch("inference_geo", nil) ||
+          request["inference_geo"]
+        ).to_s
+      end
     end
   end
 end

data/lib/llm_cost_tracker/parsers/base.rb CHANGED Viewed

@@ -1,12 +1,13 @@
 # frozen_string_literal: true
+require "active_support/core_ext/object/blank"
 require "json"
 require "uri"
 module LlmCostTracker
   module Parsers
     class Base
-      def parse(request_url, request_body, response_status, response_body)
+      def parse(**)
         raise NotImplementedError
       end
@@ -19,23 +20,22 @@ module LlmCostTracker
       end
       def streaming_request?(_request_url, request_body)
-        return false if request_body.nil?
+        return false if request_body.blank?
         body = request_body.to_s
-        return false if body.empty?
         request = safe_json_parse(body)
         request.is_a?(Hash) && request["stream"] == true
       end
-      def parse_stream(_request_url, _request_body, _response_status, _events)
+      def parse_stream(**)
         nil
       end
       private
       def safe_json_parse(body)
-        return {} if body.nil? || body.empty?
+        return {} if body.blank?
         JSON.parse(body)
       rescue JSON::ParserError
@@ -49,7 +49,7 @@ module LlmCostTracker
       def match_uri?(url, hosts: nil, exact_paths: nil, path_includes: nil, path_suffixes: nil, path_pattern: nil)
         uri_matches?(url) do |uri|
-          host_match = hosts.nil? || host_matches?(uri, hosts)
+          host_match = hosts.nil? || hosts.include?(uri.host.to_s.downcase)
           path_match = path_matches?(
             uri,
             exact_paths: exact_paths,
@@ -69,10 +69,6 @@ module LlmCostTracker
         nil
       end
-      def host_matches?(uri, hosts)
-        hosts.include?(uri.host.to_s.downcase)
-      end
       def path_matches?(uri, exact_paths: nil, path_includes: nil, path_suffixes: nil, path_pattern: nil)
         path = uri.path.to_s
         matches = true
@@ -98,28 +94,23 @@ module LlmCostTracker
       def find_event_value(events, reverse: false)
         each_event_data(events, reverse:) do |data|
           value = yield(data)
-          return value if event_value_present?(value)
+          return value if value.present?
         end
         nil
       end
-      def build_unknown_stream_usage(provider:, model:, provider_response_id:)
-        ParsedUsage.build(
+      def build_unknown_stream_usage(provider:, model:, provider_response_id:, pricing_mode: nil)
+        UsageCapture.build(
           provider: provider,
           provider_response_id: provider_response_id,
-          model: model || ParsedUsage::UNKNOWN_MODEL,
-          input_tokens: 0,
-          output_tokens: 0,
-          total_tokens: 0,
+          pricing_mode: pricing_mode,
+          model: model || UsageCapture::UNKNOWN_MODEL,
+          token_usage: TokenUsage.build(input_tokens: 0, output_tokens: 0, total_tokens: 0),
           stream: true,
           usage_source: :unknown
         )
       end
-      def event_value_present?(value)
-        !value.nil? && (!value.respond_to?(:empty?) || !value.empty?)
-      end
     end
   end
 end

data/lib/llm_cost_tracker/parsers/gemini.rb CHANGED Viewed

@@ -18,63 +18,74 @@ module LlmCostTracker
       end
       def streaming_request?(request_url, request_body)
-        return true if streaming_url?(request_url)
+        return true if match_uri?(request_url, path_pattern: STREAM_PATH_PATTERN)
         super
       end
-      def parse(request_url, _request_body, response_status, response_body)
+      def parse(request_url:, request_body:, response_status:, response_body:, response_headers: nil)
         return nil unless response_status == 200
         response = safe_json_parse(response_body)
         usage    = response["usageMetadata"]
         return nil unless usage
-        build_parsed_usage(
-          request_url,
-          usage,
+        request = safe_json_parse(request_body)
+        build_usage_capture(
+          request_url: request_url,
+          usage: usage,
           usage_source: :response,
-          provider_response_id: response["responseId"]
+          provider_response_id: response["responseId"],
+          pricing_mode: pricing_mode(request: request, response_headers: response_headers)
         )
       end
-      def parse_stream(request_url, _request_body, response_status, events)
+      def parse_stream(response_status:, request_url: nil, request_body: nil, events: [], response_headers: nil)
         return nil unless response_status == 200
+        request = safe_json_parse(request_body)
         usage = merged_stream_usage(events)
         model = extract_model_from_url(request_url)
         response_id = stream_response_id(events)
+        mode = pricing_mode(request: request, response_headers: response_headers)
         if usage
-          build_parsed_usage(
-            request_url,
-            usage,
+          build_usage_capture(
+            request_url: request_url,
+            usage: usage,
             stream: true,
             usage_source: :stream_final,
-            provider_response_id: response_id
+            provider_response_id: response_id,
+            pricing_mode: mode
           )
         else
           build_unknown_stream_usage(
             provider: "gemini",
             model: model,
-            provider_response_id: response_id
+            provider_response_id: response_id,
+            pricing_mode: mode
           )
         end
       end
       private
-      def build_parsed_usage(request_url, usage, usage_source:, stream: false, provider_response_id: nil)
+      def build_usage_capture(request_url:, usage:, usage_source:, stream: false, provider_response_id: nil,
+                              pricing_mode: nil)
         cache_read = usage["cachedContentTokenCount"].to_i
+        tool_use_prompt = usage["toolUsePromptTokenCount"].to_i
-        ParsedUsage.build(
+        UsageCapture.build(
           provider: "gemini",
           model: extract_model_from_url(request_url),
-          input_tokens: [usage["promptTokenCount"].to_i - cache_read, 0].max,
-          output_tokens: output_tokens(usage),
-          total_tokens: total_tokens(usage, cache_read),
-          cache_read_input_tokens: usage["cachedContentTokenCount"],
-          hidden_output_tokens: usage["thoughtsTokenCount"],
+          pricing_mode: pricing_mode,
+          token_usage: TokenUsage.build(
+            input_tokens: [usage["promptTokenCount"].to_i - cache_read, 0].max + tool_use_prompt,
+            output_tokens: output_tokens(usage),
+            total_tokens: total_tokens(usage: usage, cache_read: cache_read, tool_use_prompt: tool_use_prompt),
+            cache_read_input_tokens: usage["cachedContentTokenCount"],
+            hidden_output_tokens: usage["thoughtsTokenCount"]
+          ),
           stream: stream,
           usage_source: usage_source,
           provider_response_id: provider_response_id
@@ -92,21 +103,17 @@ module LlmCostTracker
         usage["candidatesTokenCount"].to_i + usage["thoughtsTokenCount"].to_i
       end
-      def total_tokens(usage, cache_read)
+      def total_tokens(usage:, cache_read:, tool_use_prompt:)
         total = usage["totalTokenCount"]
         return total.to_i unless total.nil?
-        [usage["promptTokenCount"].to_i - cache_read, 0].max + cache_read + output_tokens(usage)
+        [usage["promptTokenCount"].to_i - cache_read, 0].max + cache_read + tool_use_prompt + output_tokens(usage)
       end
       def stream_response_id(events)
         find_event_value(events) { |data| data["responseId"] }
       end
-      def streaming_url?(request_url)
-        match_uri?(request_url, path_pattern: STREAM_PATH_PATTERN)
-      end
       def extract_model_from_url(url)
         uri = parsed_uri(url)
         return nil unless uri
@@ -114,6 +121,24 @@ module LlmCostTracker
         match = uri.path.match(%r{/models/([^/:]+)})
         match && match[1]
       end
+      def pricing_mode(request:, response_headers:)
+        response_tier = response_header(response_headers, "x-gemini-service-tier")
+        response_mode = Pricing.normalize_mode(response_tier)
+        return response_mode if response_mode
+        request_mode = Pricing.normalize_mode(
+          request["service_tier"] ||
+          request["serviceTier"] ||
+          request.dig("config", "service_tier") ||
+          request.dig("config", "serviceTier")
+        )
+        request_mode == "flex" ? request_mode : nil
+      end
+      def response_header(headers, name)
+        headers.to_h.find { |key, _value| key.to_s.downcase == name }&.last
+      end
     end
   end
 end

data/lib/llm_cost_tracker/parsers/openai.rb CHANGED Viewed

@@ -8,7 +8,19 @@ module LlmCostTracker
     class Openai < Base
       include OpenaiUsage
-      HOSTS = %w[api.openai.com].freeze
+      HOSTS = %w[
+        api.openai.com
+        us.api.openai.com
+        eu.api.openai.com
+        au.api.openai.com
+        ca.api.openai.com
+        jp.api.openai.com
+        in.api.openai.com
+        sg.api.openai.com
+        kr.api.openai.com
+        gb.api.openai.com
+        ae.api.openai.com
+      ].freeze
       TRACKED_PATHS = %w[/v1/chat/completions /v1/completions /v1/embeddings /v1/responses].freeze
       def match?(url)
@@ -19,12 +31,22 @@ module LlmCostTracker
         %w[openai]
       end
-      def parse(request_url, request_body, response_status, response_body)
-        parse_openai_usage(request_url, request_body, response_status, response_body)
+      def parse(request_url:, request_body:, response_status:, response_body:, **)
+        parse_openai_usage(
+          request_url: request_url,
+          request_body: request_body,
+          response_status: response_status,
+          response_body: response_body
+        )
       end
-      def parse_stream(request_url, request_body, response_status, events)
-        parse_openai_stream_usage(request_url, request_body, response_status, events)
+      def parse_stream(response_status:, request_url: nil, request_body: nil, events: [], **)
+        parse_openai_stream_usage(
+          request_url: request_url,
+          request_body: request_body,
+          response_status: response_status,
+          events: events
+        )
       end
       private