RubyGems - llm_cost_tracker - Versions diffs - 0.7.0 → 0.7.1 - Mend

llm_cost_tracker 0.7.0 → 0.7.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (172) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +16 -0
data/README.md +11 -9
data/app/assets/llm_cost_tracker/application.css +3 -0
data/app/controllers/llm_cost_tracker/application_controller.rb +22 -4
data/app/controllers/llm_cost_tracker/calls_controller.rb +6 -11
data/app/controllers/llm_cost_tracker/dashboard_controller.rb +2 -1
data/app/controllers/llm_cost_tracker/data_quality_controller.rb +5 -1
data/app/controllers/llm_cost_tracker/models_controller.rb +0 -1
data/app/controllers/llm_cost_tracker/tags_controller.rb +1 -8
data/app/helpers/llm_cost_tracker/application_helper.rb +2 -1
data/app/helpers/llm_cost_tracker/dashboard_filter_helper.rb +1 -2
data/app/helpers/llm_cost_tracker/dashboard_filter_options_helper.rb +1 -1
data/app/helpers/llm_cost_tracker/dashboard_query_helper.rb +10 -27
data/app/helpers/llm_cost_tracker/token_usage_helper.rb +58 -0
data/app/models/llm_cost_tracker/ingestion/event.rb +13 -0
data/app/models/llm_cost_tracker/ingestion/lease.rb +11 -0
data/app/models/llm_cost_tracker/ledger/call.rb +45 -0
data/app/models/llm_cost_tracker/ledger/call_metrics.rb +66 -0
data/app/models/llm_cost_tracker/ledger/period/grouping.rb +71 -0
data/app/models/llm_cost_tracker/ledger/period/total.rb +13 -0
data/app/models/llm_cost_tracker/ledger/tags/accessors.rb +19 -0
data/app/services/llm_cost_tracker/dashboard/data_quality.rb +111 -94
data/app/services/llm_cost_tracker/dashboard/date_range.rb +2 -2
data/app/services/llm_cost_tracker/dashboard/filter.rb +7 -18
data/app/services/llm_cost_tracker/dashboard/overview_stats.rb +58 -67
data/app/services/llm_cost_tracker/dashboard/pagination.rb +59 -0
data/app/services/llm_cost_tracker/dashboard/params.rb +26 -0
data/app/services/llm_cost_tracker/dashboard/provider_breakdown.rb +18 -20
data/app/services/llm_cost_tracker/dashboard/spend_anomaly.rb +4 -13
data/app/services/llm_cost_tracker/dashboard/tag_breakdown.rb +28 -61
data/app/services/llm_cost_tracker/dashboard/tag_key_explorer.rb +8 -21
data/app/services/llm_cost_tracker/dashboard/time_series.rb +1 -1
data/app/services/llm_cost_tracker/dashboard/top_models.rb +12 -47
data/app/views/llm_cost_tracker/calls/index.html.erb +12 -18
data/app/views/llm_cost_tracker/calls/show.html.erb +30 -32
data/app/views/llm_cost_tracker/dashboard/index.html.erb +17 -19
data/app/views/llm_cost_tracker/data_quality/index.html.erb +108 -135
data/app/views/llm_cost_tracker/models/index.html.erb +8 -9
data/app/views/llm_cost_tracker/shared/setup_required.html.erb +13 -2
data/app/views/llm_cost_tracker/tags/show.html.erb +20 -20
data/lib/llm_cost_tracker/budget.rb +8 -20
data/lib/llm_cost_tracker/capture/stream.rb +9 -0
data/lib/llm_cost_tracker/capture/stream_collector.rb +182 -0
data/lib/llm_cost_tracker/{integrations → capture}/stream_tracker.rb +40 -72
data/lib/llm_cost_tracker/configuration/instrumentation.rb +3 -7
data/lib/llm_cost_tracker/configuration.rb +28 -35
data/lib/llm_cost_tracker/doctor/capture_verifier.rb +61 -0
data/lib/llm_cost_tracker/doctor/check.rb +7 -0
data/lib/llm_cost_tracker/doctor/ingestion_check.rb +22 -59
data/lib/llm_cost_tracker/doctor/price_check.rb +60 -0
data/lib/llm_cost_tracker/doctor.rb +63 -71
data/lib/llm_cost_tracker/errors.rb +4 -15
data/lib/llm_cost_tracker/event.rb +6 -6
data/lib/llm_cost_tracker/generators/llm_cost_tracker/add_token_usage_generator.rb +42 -0
data/lib/llm_cost_tracker/generators/llm_cost_tracker/install_generator.rb +2 -0
data/lib/llm_cost_tracker/generators/llm_cost_tracker/prices_generator.rb +7 -7
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/add_period_totals_to_llm_cost_tracker.rb.erb +3 -3
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/add_token_usage_to_llm_api_calls.rb.erb +22 -0
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/create_llm_api_calls.rb.erb +9 -14
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/initializer.rb.erb +0 -4
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/upgrade_llm_api_call_cost_precision.rb.erb +12 -1
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/upgrade_llm_api_call_tags_to_jsonb.rb.erb +2 -2
data/lib/llm_cost_tracker/{storage/active_record_inbox_batch.rb → ingestion/batch.rb} +21 -20
data/lib/llm_cost_tracker/ingestion/inbox.rb +105 -0
data/lib/llm_cost_tracker/{storage/active_record_ingestor_lease.rb → ingestion/lease_claim.rb} +5 -7
data/lib/llm_cost_tracker/{storage/active_record_ingestor.rb → ingestion/worker.rb} +38 -48
data/lib/llm_cost_tracker/ingestion.rb +129 -0
data/lib/llm_cost_tracker/integrations/anthropic.rb +52 -34
data/lib/llm_cost_tracker/integrations/base.rb +73 -34
data/lib/llm_cost_tracker/integrations/openai.rb +45 -39
data/lib/llm_cost_tracker/integrations/ruby_llm.rb +40 -30
data/lib/llm_cost_tracker/integrations.rb +43 -0
data/lib/llm_cost_tracker/ledger/period/totals.rb +66 -0
data/lib/llm_cost_tracker/{storage/active_record_periods.rb → ledger/period.rb} +2 -2
data/lib/llm_cost_tracker/ledger/rollups/batch.rb +43 -0
data/lib/llm_cost_tracker/ledger/rollups/upsert_sql.rb +46 -0
data/lib/llm_cost_tracker/ledger/rollups.rb +87 -0
data/lib/llm_cost_tracker/ledger/schema/adapter.rb +51 -0
data/lib/llm_cost_tracker/ledger/schema/calls.rb +101 -0
data/lib/llm_cost_tracker/ledger/schema/period_totals.rb +32 -0
data/lib/llm_cost_tracker/ledger/store.rb +60 -0
data/lib/llm_cost_tracker/ledger/tags/query.rb +29 -0
data/lib/llm_cost_tracker/ledger/tags/sql.rb +33 -0
data/lib/llm_cost_tracker/ledger.rb +13 -0
data/lib/llm_cost_tracker/logging.rb +3 -6
data/lib/llm_cost_tracker/middleware/faraday.rb +35 -36
data/lib/llm_cost_tracker/parsers/anthropic.rb +38 -27
data/lib/llm_cost_tracker/parsers/base.rb +10 -19
data/lib/llm_cost_tracker/parsers/gemini.rb +15 -16
data/lib/llm_cost_tracker/parsers/openai_usage.rb +24 -19
data/lib/llm_cost_tracker/parsers/sse.rb +4 -7
data/lib/llm_cost_tracker/parsers.rb +20 -0
data/lib/llm_cost_tracker/prices.json +52 -11
data/lib/llm_cost_tracker/pricing/components.rb +37 -0
data/lib/llm_cost_tracker/pricing/effective_prices.rb +40 -50
data/lib/llm_cost_tracker/pricing/explainer.rb +12 -23
data/lib/llm_cost_tracker/pricing/lookup.rb +24 -25
data/lib/llm_cost_tracker/pricing/registry.rb +156 -0
data/lib/llm_cost_tracker/pricing/sync/fetcher.rb +107 -0
data/lib/llm_cost_tracker/pricing/sync/registry_diff.rb +53 -0
data/lib/llm_cost_tracker/pricing/sync/registry_loader.rb +63 -0
data/lib/llm_cost_tracker/pricing/sync/registry_writer.rb +31 -0
data/lib/llm_cost_tracker/pricing/sync.rb +143 -0
data/lib/llm_cost_tracker/pricing/unknown.rb +46 -0
data/lib/llm_cost_tracker/pricing.rb +33 -32
data/lib/llm_cost_tracker/railtie.rb +7 -8
data/lib/llm_cost_tracker/report/data.rb +72 -0
data/lib/llm_cost_tracker/report/formatter.rb +69 -0
data/lib/llm_cost_tracker/report.rb +8 -8
data/lib/llm_cost_tracker/retention.rb +27 -10
data/lib/llm_cost_tracker/tags/context.rb +35 -0
data/lib/llm_cost_tracker/tags/key.rb +18 -0
data/lib/llm_cost_tracker/tags/sanitizer.rb +68 -0
data/lib/llm_cost_tracker/token_usage.rb +67 -0
data/lib/llm_cost_tracker/tracker.rb +38 -70
data/lib/llm_cost_tracker/usage_capture.rb +37 -0
data/lib/llm_cost_tracker/version.rb +1 -1
data/lib/llm_cost_tracker.rb +56 -78
data/lib/tasks/llm_cost_tracker.rake +18 -13
metadata +54 -58
data/app/services/llm_cost_tracker/dashboard/data_quality_aggregate.rb +0 -81
data/app/services/llm_cost_tracker/pagination.rb +0 -57
data/lib/llm_cost_tracker/active_record_adapter.rb +0 -53
data/lib/llm_cost_tracker/capture_verifier.rb +0 -64
data/lib/llm_cost_tracker/cost.rb +0 -12
data/lib/llm_cost_tracker/doctor/capture_check.rb +0 -39
data/lib/llm_cost_tracker/event_metadata.rb +0 -52
data/lib/llm_cost_tracker/generators/llm_cost_tracker/add_usage_breakdown_generator.rb +0 -29
data/lib/llm_cost_tracker/generators/llm_cost_tracker/templates/add_usage_breakdown_to_llm_api_calls.rb.erb +0 -29
data/lib/llm_cost_tracker/inbox_event.rb +0 -9
data/lib/llm_cost_tracker/ingestor_lease.rb +0 -9
data/lib/llm_cost_tracker/integrations/object_reader.rb +0 -56
data/lib/llm_cost_tracker/integrations/registry.rb +0 -71
data/lib/llm_cost_tracker/llm_api_call.rb +0 -60
data/lib/llm_cost_tracker/llm_api_call_metrics.rb +0 -63
data/lib/llm_cost_tracker/parameter_hash.rb +0 -33
data/lib/llm_cost_tracker/parsed_usage.rb +0 -72
data/lib/llm_cost_tracker/parsers/registry.rb +0 -58
data/lib/llm_cost_tracker/period_grouping.rb +0 -67
data/lib/llm_cost_tracker/period_total.rb +0 -9
data/lib/llm_cost_tracker/price_freshness.rb +0 -38
data/lib/llm_cost_tracker/price_registry.rb +0 -144
data/lib/llm_cost_tracker/price_sync/fetcher.rb +0 -104
data/lib/llm_cost_tracker/price_sync/registry_diff.rb +0 -51
data/lib/llm_cost_tracker/price_sync/registry_loader.rb +0 -61
data/lib/llm_cost_tracker/price_sync/registry_writer.rb +0 -29
data/lib/llm_cost_tracker/price_sync.rb +0 -144
data/lib/llm_cost_tracker/report_data.rb +0 -94
data/lib/llm_cost_tracker/report_formatter.rb +0 -67
data/lib/llm_cost_tracker/request_url.rb +0 -20
data/lib/llm_cost_tracker/storage/active_record_backend.rb +0 -167
data/lib/llm_cost_tracker/storage/active_record_connection_cleanup.rb +0 -13
data/lib/llm_cost_tracker/storage/active_record_inbox.rb +0 -160
data/lib/llm_cost_tracker/storage/active_record_period_totals.rb +0 -84
data/lib/llm_cost_tracker/storage/active_record_rollup_batch.rb +0 -41
data/lib/llm_cost_tracker/storage/active_record_rollup_upsert_sql.rb +0 -42
data/lib/llm_cost_tracker/storage/active_record_rollups.rb +0 -146
data/lib/llm_cost_tracker/storage/active_record_store.rb +0 -145
data/lib/llm_cost_tracker/storage/writer.rb +0 -35
data/lib/llm_cost_tracker/stream_capture.rb +0 -7
data/lib/llm_cost_tracker/stream_collector.rb +0 -199
data/lib/llm_cost_tracker/tag_accessors.rb +0 -15
data/lib/llm_cost_tracker/tag_context.rb +0 -52
data/lib/llm_cost_tracker/tag_key.rb +0 -16
data/lib/llm_cost_tracker/tag_query.rb +0 -43
data/lib/llm_cost_tracker/tag_sanitizer.rb +0 -81
data/lib/llm_cost_tracker/tag_sql.rb +0 -34
data/lib/llm_cost_tracker/tags_column.rb +0 -105
data/lib/llm_cost_tracker/unknown_pricing.rb +0 -54
data/lib/llm_cost_tracker/usage_breakdown.rb +0 -30
data/lib/llm_cost_tracker/value_helpers.rb +0 -40

data/lib/llm_cost_tracker/parsers/anthropic.rb CHANGED Viewed

@@ -24,17 +24,13 @@ module LlmCostTracker
         request = safe_json_parse(request_body)
         cache_read = usage["cache_read_input_tokens"].to_i
-        cache_write = usage["cache_creation_input_tokens"].to_i
-        ParsedUsage.build(
+        UsageCapture.build(
           provider: "anthropic",
           provider_response_id: response["id"],
+          pricing_mode: pricing_mode(request, response, usage),
           model: response["model"] || request["model"],
-          input_tokens: usage["input_tokens"].to_i,
-          output_tokens: usage["output_tokens"].to_i,
-          total_tokens: usage["input_tokens"].to_i + usage["output_tokens"].to_i + cache_read + cache_write,
-          cache_read_input_tokens: usage["cache_read_input_tokens"],
-          cache_write_input_tokens: usage["cache_creation_input_tokens"],
+          token_usage: token_usage(usage, cache_read),
           usage_source: :response
         )
       end
@@ -43,17 +39,18 @@ module LlmCostTracker
         return nil unless response_status == 200
         request = safe_json_parse(request_body)
-        model = stream_model(events) || request["model"]
+        model = find_event_value(events) { |data| data.dig("message", "model") } || request["model"]
         usage = stream_usage(events)
-        response_id = stream_response_id(events)
+        response_id = find_event_value(events) { |data| data.dig("message", "id") || data["id"] }
         if usage
-          build_stream_result(model, usage, response_id)
+          build_stream_result(model, usage, response_id, pricing_mode(request, nil, usage))
         else
           build_unknown_stream_usage(
             provider: "anthropic",
             model: model,
-            provider_response_id: response_id
+            provider_response_id: response_id,
+            pricing_mode: pricing_mode(request, nil, usage)
           )
         end
       end
@@ -75,33 +72,47 @@ module LlmCostTracker
         end
       end
-      def stream_model(events)
-        find_event_value(events) { |data| data.dig("message", "model") }
-      end
+      def build_stream_result(model, usage, response_id, pricing_mode)
+        cache_read = usage["cache_read_input_tokens"].to_i
-      def stream_response_id(events)
-        find_event_value(events) { |data| data.dig("message", "id") || data["id"] }
+        UsageCapture.build(
+          provider: "anthropic",
+          provider_response_id: response_id,
+          pricing_mode: pricing_mode,
+          model: model,
+          token_usage: token_usage(usage, cache_read),
+          stream: true,
+          usage_source: :stream_final
+        )
       end
-      def build_stream_result(model, usage, response_id)
+      def token_usage(usage, cache_read)
         input = usage["input_tokens"].to_i
         output = usage["output_tokens"].to_i
-        cache_read = usage["cache_read_input_tokens"].to_i
-        cache_write = usage["cache_creation_input_tokens"].to_i
+        cache_creation = usage["cache_creation"]
+        if cache_creation.is_a?(Hash)
+          cache_write = cache_creation["ephemeral_5m_input_tokens"].to_i
+          cache_write_1h = cache_creation["ephemeral_1h_input_tokens"].to_i
+        else
+          cache_write = usage["cache_creation_input_tokens"].to_i
+          cache_write_1h = 0
+        end
-        ParsedUsage.build(
-          provider: "anthropic",
-          provider_response_id: response_id,
-          model: model,
+        TokenUsage.build(
           input_tokens: input,
           output_tokens: output,
-          total_tokens: input + output + cache_read + cache_write,
+          total_tokens: input + output + cache_read + cache_write + cache_write_1h,
           cache_read_input_tokens: usage["cache_read_input_tokens"],
-          cache_write_input_tokens: usage["cache_creation_input_tokens"],
-          stream: true,
-          usage_source: :stream_final
+          cache_write_input_tokens: cache_write,
+          cache_write_1h_input_tokens: cache_write_1h
         )
       end
+      def pricing_mode(request, response, usage)
+        usage&.fetch("service_tier", nil) ||
+          response&.fetch("service_tier", nil) ||
+          request["service_tier"]
+      end
     end
   end
 end

data/lib/llm_cost_tracker/parsers/base.rb CHANGED Viewed

@@ -1,5 +1,6 @@
 # frozen_string_literal: true
+require "active_support/core_ext/object/blank"
 require "json"
 require "uri"
@@ -19,10 +20,9 @@ module LlmCostTracker
       end
       def streaming_request?(_request_url, request_body)
-        return false if request_body.nil?
+        return false if request_body.blank?
         body = request_body.to_s
-        return false if body.empty?
         request = safe_json_parse(body)
         request.is_a?(Hash) && request["stream"] == true
@@ -35,7 +35,7 @@ module LlmCostTracker
       private
       def safe_json_parse(body)
-        return {} if body.nil? || body.empty?
+        return {} if body.blank?
         JSON.parse(body)
       rescue JSON::ParserError
@@ -49,7 +49,7 @@ module LlmCostTracker
       def match_uri?(url, hosts: nil, exact_paths: nil, path_includes: nil, path_suffixes: nil, path_pattern: nil)
         uri_matches?(url) do |uri|
-          host_match = hosts.nil? || host_matches?(uri, hosts)
+          host_match = hosts.nil? || hosts.include?(uri.host.to_s.downcase)
           path_match = path_matches?(
             uri,
             exact_paths: exact_paths,
@@ -69,10 +69,6 @@ module LlmCostTracker
         nil
       end
-      def host_matches?(uri, hosts)
-        hosts.include?(uri.host.to_s.downcase)
-      end
       def path_matches?(uri, exact_paths: nil, path_includes: nil, path_suffixes: nil, path_pattern: nil)
         path = uri.path.to_s
         matches = true
@@ -98,28 +94,23 @@ module LlmCostTracker
       def find_event_value(events, reverse: false)
         each_event_data(events, reverse:) do |data|
           value = yield(data)
-          return value if event_value_present?(value)
+          return value if value.present?
         end
         nil
       end
-      def build_unknown_stream_usage(provider:, model:, provider_response_id:)
-        ParsedUsage.build(
+      def build_unknown_stream_usage(provider:, model:, provider_response_id:, pricing_mode: nil)
+        UsageCapture.build(
           provider: provider,
           provider_response_id: provider_response_id,
-          model: model || ParsedUsage::UNKNOWN_MODEL,
-          input_tokens: 0,
-          output_tokens: 0,
-          total_tokens: 0,
+          pricing_mode: pricing_mode,
+          model: model || UsageCapture::UNKNOWN_MODEL,
+          token_usage: TokenUsage.build(input_tokens: 0, output_tokens: 0, total_tokens: 0),
           stream: true,
           usage_source: :unknown
         )
       end
-      def event_value_present?(value)
-        !value.nil? && (!value.respond_to?(:empty?) || !value.empty?)
-      end
     end
   end
 end

data/lib/llm_cost_tracker/parsers/gemini.rb CHANGED Viewed

@@ -18,7 +18,7 @@ module LlmCostTracker
       end
       def streaming_request?(request_url, request_body)
-        return true if streaming_url?(request_url)
+        return true if match_uri?(request_url, path_pattern: STREAM_PATH_PATTERN)
         super
       end
@@ -30,7 +30,7 @@ module LlmCostTracker
         usage    = response["usageMetadata"]
         return nil unless usage
-        build_parsed_usage(
+        build_usage_capture(
           request_url,
           usage,
           usage_source: :response,
@@ -46,7 +46,7 @@ module LlmCostTracker
         response_id = stream_response_id(events)
         if usage
-          build_parsed_usage(
+          build_usage_capture(
             request_url,
             usage,
             stream: true,
@@ -64,17 +64,20 @@ module LlmCostTracker
       private
-      def build_parsed_usage(request_url, usage, usage_source:, stream: false, provider_response_id: nil)
+      def build_usage_capture(request_url, usage, usage_source:, stream: false, provider_response_id: nil)
         cache_read = usage["cachedContentTokenCount"].to_i
+        tool_use_prompt = usage["toolUsePromptTokenCount"].to_i
-        ParsedUsage.build(
+        UsageCapture.build(
           provider: "gemini",
           model: extract_model_from_url(request_url),
-          input_tokens: [usage["promptTokenCount"].to_i - cache_read, 0].max,
-          output_tokens: output_tokens(usage),
-          total_tokens: total_tokens(usage, cache_read),
-          cache_read_input_tokens: usage["cachedContentTokenCount"],
-          hidden_output_tokens: usage["thoughtsTokenCount"],
+          token_usage: TokenUsage.build(
+            input_tokens: [usage["promptTokenCount"].to_i - cache_read, 0].max + tool_use_prompt,
+            output_tokens: output_tokens(usage),
+            total_tokens: total_tokens(usage, cache_read, tool_use_prompt),
+            cache_read_input_tokens: usage["cachedContentTokenCount"],
+            hidden_output_tokens: usage["thoughtsTokenCount"]
+          ),
           stream: stream,
           usage_source: usage_source,
           provider_response_id: provider_response_id
@@ -92,21 +95,17 @@ module LlmCostTracker
         usage["candidatesTokenCount"].to_i + usage["thoughtsTokenCount"].to_i
       end
-      def total_tokens(usage, cache_read)
+      def total_tokens(usage, cache_read, tool_use_prompt)
         total = usage["totalTokenCount"]
         return total.to_i unless total.nil?
-        [usage["promptTokenCount"].to_i - cache_read, 0].max + cache_read + output_tokens(usage)
+        [usage["promptTokenCount"].to_i - cache_read, 0].max + cache_read + tool_use_prompt + output_tokens(usage)
       end
       def stream_response_id(events)
         find_event_value(events) { |data| data["responseId"] }
       end
-      def streaming_url?(request_url)
-        match_uri?(request_url, path_pattern: STREAM_PATH_PATTERN)
-      end
       def extract_model_from_url(url)
         uri = parsed_uri(url)
         return nil unless uri

data/lib/llm_cost_tracker/parsers/openai_usage.rb CHANGED Viewed

@@ -15,15 +15,12 @@ module LlmCostTracker
         request = safe_json_parse(request_body)
         cache_read = cache_read_input_tokens(usage)
-        ParsedUsage.build(
+        UsageCapture.build(
           provider: provider_for(request_url),
           provider_response_id: response["id"],
+          pricing_mode: response["service_tier"] || request["service_tier"],
           model: response["model"] || request["model"],
-          input_tokens: regular_input_tokens(usage, cache_read),
-          output_tokens: (usage["completion_tokens"] || usage["output_tokens"]).to_i,
-          total_tokens: total_tokens(usage, cache_read),
-          cache_read_input_tokens: cache_read,
-          hidden_output_tokens: hidden_output_tokens(usage),
+          token_usage: token_usage(usage, cache_read),
           usage_source: :response
         )
       end
@@ -32,21 +29,20 @@ module LlmCostTracker
         return nil unless response_status == 200
         request = safe_json_parse(request_body)
-        model = detect_stream_model(events) || request["model"]
+        model =
+          find_event_value(events) { |data| data["model"] || data.dig("response", "model") } || request["model"]
         usage = detect_stream_usage(events)
-        response_id = detect_stream_response_id(events)
+        response_id = find_event_value(events) { |data| data["id"] || data.dig("response", "id") }
+        pricing_mode = stream_pricing_mode(events) || request["service_tier"]
         if usage
           cache_read = cache_read_input_tokens(usage)
-          ParsedUsage.build(
+          UsageCapture.build(
             provider: provider_for(request_url),
             provider_response_id: response_id,
+            pricing_mode: pricing_mode,
             model: model,
-            input_tokens: regular_input_tokens(usage, cache_read),
-            output_tokens: (usage["completion_tokens"] || usage["output_tokens"]).to_i,
-            total_tokens: total_tokens(usage, cache_read),
-            cache_read_input_tokens: cache_read,
-            hidden_output_tokens: hidden_output_tokens(usage),
+            token_usage: token_usage(usage, cache_read),
             stream: true,
             usage_source: :stream_final
           )
@@ -54,7 +50,8 @@ module LlmCostTracker
           build_unknown_stream_usage(
             provider: provider_for(request_url),
             model: model,
-            provider_response_id: response_id
+            provider_response_id: response_id,
+            pricing_mode: pricing_mode
           )
         end
       end
@@ -66,12 +63,20 @@ module LlmCostTracker
         end
       end
-      def detect_stream_model(events)
-        find_event_value(events) { |data| data["model"] || data.dig("response", "model") }
+      def stream_pricing_mode(events)
+        find_event_value(events, reverse: true) do |data|
+          data["service_tier"] || data.dig("response", "service_tier")
+        end
       end
-      def detect_stream_response_id(events)
-        find_event_value(events) { |data| data["id"] || data.dig("response", "id") }
+      def token_usage(usage, cache_read)
+        TokenUsage.build(
+          input_tokens: regular_input_tokens(usage, cache_read),
+          output_tokens: (usage["completion_tokens"] || usage["output_tokens"]).to_i,
+          total_tokens: total_tokens(usage, cache_read),
+          cache_read_input_tokens: cache_read,
+          hidden_output_tokens: hidden_output_tokens(usage)
+        )
       end
       def regular_input_tokens(usage, cache_read)

data/lib/llm_cost_tracker/parsers/sse.rb CHANGED Viewed

@@ -1,5 +1,6 @@
 # frozen_string_literal: true
+require "active_support/core_ext/object/blank"
 require "json"
 module LlmCostTracker
@@ -9,9 +10,9 @@ module LlmCostTracker
       class << self
         def parse(body)
-          return [] if body.nil? || body.empty?
+          return [] if body.blank?
-          return parse_json_array(body) if probably_json_array?(body)
+          return parse_json_array(body) if body.lstrip.start_with?("[")
           parse_event_stream(body)
         end
@@ -65,16 +66,12 @@ module LlmCostTracker
         end
         def decode_data(payload)
-          return payload if payload.empty?
+          return payload if payload.blank?
           JSON.parse(payload)
         rescue JSON::ParserError
           payload
         end
-        def probably_json_array?(body)
-          body.lstrip.start_with?("[")
-        end
       end
     end
   end

data/lib/llm_cost_tracker/parsers.rb ADDED Viewed

@@ -0,0 +1,20 @@
+# frozen_string_literal: true
+module LlmCostTracker
+  module Parsers
+    BUILT_INS = [Openai.new, OpenaiCompatible.new, Anthropic.new, Gemini.new].freeze
+    module_function
+    def find_for(url)
+      BUILT_INS.find { |parser| parser.match?(url) }
+    end
+    def find_for_provider(provider)
+      provider_name = provider.to_s.downcase
+      BUILT_INS.find do |parser|
+        Array(parser.provider_names).map { |name| name.to_s.downcase }.include?(provider_name)
+      end
+    end
+  end
+end

data/lib/llm_cost_tracker/prices.json CHANGED Viewed

@@ -17,6 +17,7 @@
       "output": 5.0,
       "cache_read_input": 0.1,
       "cache_write_input": 1.25,
+      "cache_write_1h_input": 2.0,
       "batch_input": 0.5,
       "batch_output": 2.5
     },
@@ -25,6 +26,7 @@
       "output": 75.0,
       "cache_read_input": 1.5,
       "cache_write_input": 18.75,
+      "cache_write_1h_input": 30.0,
       "batch_input": 7.5,
       "batch_output": 37.5
     },
@@ -33,6 +35,7 @@
       "output": 75.0,
       "cache_read_input": 1.5,
       "cache_write_input": 18.75,
+      "cache_write_1h_input": 30.0,
       "batch_input": 7.5,
       "batch_output": 37.5
     },
@@ -41,6 +44,7 @@
       "output": 25.0,
       "cache_read_input": 0.5,
       "cache_write_input": 6.25,
+      "cache_write_1h_input": 10.0,
       "batch_input": 2.5,
       "batch_output": 12.5
     },
@@ -49,6 +53,7 @@
       "output": 25.0,
       "cache_read_input": 0.5,
       "cache_write_input": 6.25,
+      "cache_write_1h_input": 10.0,
       "batch_input": 2.5,
       "batch_output": 12.5
     },
@@ -57,6 +62,7 @@
       "output": 25.0,
       "cache_read_input": 0.5,
       "cache_write_input": 6.25,
+      "cache_write_1h_input": 10.0,
       "batch_input": 2.5,
       "batch_output": 12.5
     },
@@ -65,6 +71,7 @@
       "output": 15.0,
       "cache_read_input": 0.3,
       "cache_write_input": 3.75,
+      "cache_write_1h_input": 6.0,
       "batch_input": 1.5,
       "batch_output": 7.5
     },
@@ -73,6 +80,7 @@
       "output": 15.0,
       "cache_read_input": 0.3,
       "cache_write_input": 3.75,
+      "cache_write_1h_input": 6.0,
       "batch_input": 1.5,
       "batch_output": 7.5
     },
@@ -81,6 +89,7 @@
       "output": 15.0,
       "cache_read_input": 0.3,
       "cache_write_input": 3.75,
+      "cache_write_1h_input": 6.0,
       "batch_input": 1.5,
       "batch_output": 7.5
     },
@@ -89,7 +98,8 @@
       "cache_read_input": 0.025,
       "output": 0.4,
       "batch_input": 0.05,
-      "batch_output": 0.2
+      "batch_output": 0.2,
+      "batch_cache_read_input": 0.025
     },
     "gemini/gemini-2.0-flash-lite": {
       "input": 0.075,
@@ -101,25 +111,32 @@
       "input": 0.3,
       "output": 2.5,
       "cache_read_input": 0.03,
-      "cache_write_input": 0.083333333333,
       "batch_input": 0.15,
-      "batch_output": 1.25
+      "batch_output": 1.25,
+      "batch_cache_read_input": 0.03
     },
     "gemini/gemini-2.5-flash-lite": {
       "input": 0.1,
       "output": 0.4,
       "cache_read_input": 0.01,
-      "cache_write_input": 0.083333333333,
       "batch_input": 0.05,
-      "batch_output": 0.2
+      "batch_output": 0.2,
+      "batch_cache_read_input": 0.01
     },
     "gemini/gemini-2.5-pro": {
       "input": 1.25,
       "output": 10.0,
       "cache_read_input": 0.125,
-      "cache_write_input": 0.375,
       "batch_input": 0.625,
-      "batch_output": 5.0
+      "batch_output": 5.0,
+      "batch_cache_read_input": 0.125,
+      "_context_price_threshold_tokens": 200000,
+      "above_context_input": 2.5,
+      "above_context_output": 15.0,
+      "above_context_cache_read_input": 0.25,
+      "above_context_batch_input": 1.25,
+      "above_context_batch_output": 7.5,
+      "above_context_batch_cache_read_input": 0.25
     },
     "openai/gpt-3.5-turbo": {
       "input": 0.5,
@@ -276,7 +293,14 @@
       "cache_read_input": 0.25,
       "batch_input": 1.25,
       "batch_output": 7.5,
-      "batch_cache_read_input": 0.13
+      "batch_cache_read_input": 0.13,
+      "_context_price_threshold_tokens": 272000,
+      "above_context_input": 5.0,
+      "above_context_output": 22.5,
+      "above_context_cache_read_input": 0.5,
+      "above_context_batch_input": 2.5,
+      "above_context_batch_output": 11.25,
+      "above_context_batch_cache_read_input": 0.25
     },
     "openai/gpt-5.4-mini": {
       "input": 0.75,
@@ -298,7 +322,12 @@
       "input": 30.0,
       "output": 180.0,
       "batch_input": 15.0,
-      "batch_output": 90.0
+      "batch_output": 90.0,
+      "_context_price_threshold_tokens": 272000,
+      "above_context_input": 60.0,
+      "above_context_output": 270.0,
+      "above_context_batch_input": 30.0,
+      "above_context_batch_output": 135.0
     },
     "openai/gpt-5.5": {
       "input": 5.0,
@@ -306,13 +335,23 @@
       "cache_read_input": 0.5,
       "batch_input": 2.5,
       "batch_output": 15.0,
-      "batch_cache_read_input": 0.25
+      "batch_cache_read_input": 0.25,
+      "_context_price_threshold_tokens": 272000,
+      "above_context_input": 10.0,
+      "above_context_output": 45.0,
+      "above_context_cache_read_input": 1.0,
+      "above_context_batch_input": 5.0,
+      "above_context_batch_output": 22.5,
+      "above_context_batch_cache_read_input": 0.5
     },
     "openai/gpt-5.5-pro": {
       "input": 30.0,
       "output": 180.0,
       "batch_input": 15.0,
-      "batch_output": 90.0
+      "batch_output": 90.0,
+      "_context_price_threshold_tokens": 272000,
+      "above_context_input": 60.0,
+      "above_context_output": 270.0
     },
     "openai/o1": {
       "input": 15.0,
@@ -352,6 +391,7 @@
     "anthropic/claude-haiku-3-5": {
       "input": 0.8,
       "cache_write_input": 1.0,
+      "cache_write_1h_input": 1.6,
       "cache_read_input": 0.08,
       "output": 4.0,
       "batch_input": 0.4,
@@ -360,6 +400,7 @@
     "anthropic/claude-haiku-3": {
       "input": 0.25,
       "cache_write_input": 0.3,
+      "cache_write_1h_input": 0.5,
       "cache_read_input": 0.03,
       "output": 1.25,
       "batch_input": 0.125,

data/lib/llm_cost_tracker/pricing/components.rb ADDED Viewed

@@ -0,0 +1,37 @@
+# frozen_string_literal: true
+module LlmCostTracker
+  module Pricing
+    Component = Data.define(:price_key, :token_key, :cost_key)
+    COMPONENTS = [
+      Component.new(
+        price_key: :input,
+        token_key: :input_tokens,
+        cost_key: :input_cost
+      ),
+      Component.new(
+        price_key: :cache_read_input,
+        token_key: :cache_read_input_tokens,
+        cost_key: :cache_read_input_cost
+      ),
+      Component.new(
+        price_key: :cache_write_input,
+        token_key: :cache_write_input_tokens,
+        cost_key: :cache_write_input_cost
+      ),
+      Component.new(
+        price_key: :cache_write_1h_input,
+        token_key: :cache_write_1h_input_tokens,
+        cost_key: :cache_write_1h_input_cost
+      ),
+      Component.new(
+        price_key: :output,
+        token_key: :output_tokens,
+        cost_key: :output_cost
+      )
+    ].freeze
+    COST_KEYS = (COMPONENTS.map(&:cost_key) + %i[total_cost]).freeze
+  end
+end