RubyGems - karafka - Versions diffs - 2.4.18 → 2.5.0 - Mend

karafka 2.4.18 → 2.5.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (159) hide show

checksums.yaml +4 -4
data/.github/CODEOWNERS +3 -0
data/.github/workflows/ci.yml +59 -15
data/.github/workflows/push.yml +35 -0
data/.github/workflows/verify-action-pins.yml +16 -0
data/.ruby-version +1 -1
data/CHANGELOG.md +75 -0
data/Gemfile +2 -2
data/Gemfile.lock +72 -53
data/LICENSE-COMM +2 -2
data/README.md +1 -1
data/Rakefile +4 -0
data/bin/clean_kafka +43 -0
data/bin/integrations +20 -6
data/bin/rspecs +15 -3
data/bin/verify_kafka_warnings +35 -0
data/bin/verify_topics_naming +27 -0
data/config/locales/errors.yml +5 -1
data/config/locales/pro_errors.yml +13 -2
data/docker-compose.yml +1 -1
data/examples/payloads/avro/.gitkeep +0 -0
data/examples/payloads/json/sample_set_01/enrollment_event.json +579 -0
data/examples/payloads/json/sample_set_01/ingestion_event.json +30 -0
data/examples/payloads/json/sample_set_01/transaction_event.json +17 -0
data/examples/payloads/json/sample_set_01/user_event.json +11 -0
data/karafka.gemspec +3 -8
data/lib/karafka/active_job/current_attributes.rb +1 -1
data/lib/karafka/active_job/job_extensions.rb +4 -1
data/lib/karafka/admin/acl.rb +5 -1
data/lib/karafka/admin/configs.rb +5 -1
data/lib/karafka/admin.rb +89 -42
data/lib/karafka/base_consumer.rb +17 -8
data/lib/karafka/cli/base.rb +8 -2
data/lib/karafka/cli/topics/align.rb +7 -4
data/lib/karafka/cli/topics/base.rb +17 -0
data/lib/karafka/cli/topics/create.rb +9 -7
data/lib/karafka/cli/topics/delete.rb +4 -2
data/lib/karafka/cli/topics/help.rb +39 -0
data/lib/karafka/cli/topics/repartition.rb +4 -2
data/lib/karafka/cli/topics.rb +10 -3
data/lib/karafka/cli.rb +2 -0
data/lib/karafka/connection/client.rb +39 -9
data/lib/karafka/connection/listener.rb +24 -12
data/lib/karafka/connection/messages_buffer.rb +1 -1
data/lib/karafka/connection/proxy.rb +4 -1
data/lib/karafka/constraints.rb +3 -3
data/lib/karafka/contracts/base.rb +3 -2
data/lib/karafka/contracts/config.rb +5 -1
data/lib/karafka/contracts/topic.rb +1 -1
data/lib/karafka/errors.rb +46 -2
data/lib/karafka/helpers/async.rb +3 -1
data/lib/karafka/helpers/interval_runner.rb +8 -0
data/lib/karafka/instrumentation/callbacks/rebalance.rb +5 -1
data/lib/karafka/instrumentation/logger_listener.rb +95 -32
data/lib/karafka/instrumentation/proctitle_listener.rb +5 -1
data/lib/karafka/instrumentation/vendors/datadog/metrics_listener.rb +2 -2
data/lib/karafka/instrumentation/vendors/kubernetes/base_listener.rb +17 -2
data/lib/karafka/instrumentation/vendors/kubernetes/liveness_listener.rb +29 -6
data/lib/karafka/instrumentation/vendors/kubernetes/swarm_liveness_listener.rb +9 -0
data/lib/karafka/messages/builders/batch_metadata.rb +1 -1
data/lib/karafka/pro/cleaner.rb +8 -0
data/lib/karafka/pro/cli/parallel_segments/base.rb +89 -0
data/lib/karafka/pro/cli/parallel_segments/collapse.rb +164 -0
data/lib/karafka/pro/cli/parallel_segments/distribute.rb +164 -0
data/lib/karafka/pro/cli/parallel_segments.rb +60 -0
data/lib/karafka/pro/connection/manager.rb +5 -8
data/lib/karafka/pro/encryption.rb +12 -1
data/lib/karafka/pro/instrumentation/performance_tracker.rb +1 -1
data/lib/karafka/pro/iterator/expander.rb +5 -3
data/lib/karafka/pro/iterator/tpl_builder.rb +23 -0
data/lib/karafka/pro/loader.rb +10 -0
data/lib/karafka/pro/processing/coordinator.rb +4 -1
data/lib/karafka/pro/processing/coordinators/errors_tracker.rb +32 -3
data/lib/karafka/pro/processing/coordinators/filters_applier.rb +11 -0
data/lib/karafka/pro/processing/filters/base.rb +10 -2
data/lib/karafka/pro/processing/filters/expirer.rb +5 -0
data/lib/karafka/pro/processing/filters/inline_insights_delayer.rb +2 -2
data/lib/karafka/pro/processing/filters/virtual_limiter.rb +5 -0
data/lib/karafka/pro/processing/parallel_segments/filters/base.rb +73 -0
data/lib/karafka/pro/processing/parallel_segments/filters/default.rb +85 -0
data/lib/karafka/pro/processing/parallel_segments/filters/mom.rb +66 -0
data/lib/karafka/pro/processing/partitioner.rb +1 -13
data/lib/karafka/pro/processing/piping/consumer.rb +13 -13
data/lib/karafka/pro/processing/strategies/aj/dlq_ftr_lrj_mom.rb +1 -1
data/lib/karafka/pro/processing/strategies/aj/dlq_ftr_lrj_mom_vp.rb +1 -1
data/lib/karafka/pro/processing/strategies/aj/dlq_lrj_mom.rb +1 -1
data/lib/karafka/pro/processing/strategies/aj/dlq_lrj_mom_vp.rb +1 -1
data/lib/karafka/pro/processing/strategies/aj/ftr_lrj_mom_vp.rb +1 -1
data/lib/karafka/pro/processing/strategies/aj/lrj_mom_vp.rb +1 -1
data/lib/karafka/pro/processing/strategies/default.rb +36 -8
data/lib/karafka/pro/processing/strategies/dlq/default.rb +15 -10
data/lib/karafka/pro/processing/strategies/dlq/ftr_lrj.rb +1 -1
data/lib/karafka/pro/processing/strategies/dlq/ftr_lrj_mom.rb +1 -1
data/lib/karafka/pro/processing/strategies/dlq/lrj.rb +3 -1
data/lib/karafka/pro/processing/strategies/dlq/lrj_mom.rb +1 -1
data/lib/karafka/pro/processing/strategies/ftr/default.rb +1 -1
data/lib/karafka/pro/processing/strategies/lrj/default.rb +4 -1
data/lib/karafka/pro/processing/strategies/lrj/ftr.rb +1 -1
data/lib/karafka/pro/processing/strategies/lrj/ftr_mom.rb +1 -1
data/lib/karafka/pro/processing/strategies/lrj/mom.rb +1 -1
data/lib/karafka/pro/processing/virtual_partitions/distributors/balanced.rb +50 -0
data/lib/karafka/pro/processing/virtual_partitions/distributors/base.rb +29 -0
data/lib/karafka/pro/processing/virtual_partitions/distributors/consistent.rb +27 -0
data/lib/karafka/pro/recurring_tasks/contracts/config.rb +8 -4
data/lib/karafka/pro/recurring_tasks/dispatcher.rb +3 -3
data/lib/karafka/pro/recurring_tasks/setup/config.rb +7 -2
data/lib/karafka/pro/recurring_tasks.rb +21 -2
data/lib/karafka/pro/routing/features/dead_letter_queue/topic.rb +1 -1
data/lib/karafka/pro/routing/features/multiplexing/config.rb +1 -0
data/lib/karafka/pro/routing/features/multiplexing/contracts/topic.rb +17 -0
data/lib/karafka/pro/routing/features/multiplexing/proxy.rb +5 -2
data/lib/karafka/pro/routing/features/multiplexing/subscription_group.rb +8 -1
data/lib/karafka/pro/routing/features/parallel_segments/builder.rb +47 -0
data/lib/karafka/pro/routing/features/parallel_segments/config.rb +27 -0
data/lib/karafka/pro/routing/features/parallel_segments/consumer_group.rb +83 -0
data/lib/karafka/pro/routing/features/parallel_segments/contracts/consumer_group.rb +49 -0
data/lib/karafka/pro/routing/features/parallel_segments/topic.rb +43 -0
data/lib/karafka/pro/routing/features/parallel_segments.rb +24 -0
data/lib/karafka/pro/routing/features/patterns/pattern.rb +1 -1
data/lib/karafka/pro/routing/features/recurring_tasks/builder.rb +2 -2
data/lib/karafka/pro/routing/features/scheduled_messages/builder.rb +10 -6
data/lib/karafka/pro/routing/features/swarm/contracts/routing.rb +3 -2
data/lib/karafka/pro/routing/features/swarm.rb +4 -1
data/lib/karafka/pro/routing/features/virtual_partitions/config.rb +20 -2
data/lib/karafka/pro/routing/features/virtual_partitions/contracts/topic.rb +1 -0
data/lib/karafka/pro/routing/features/virtual_partitions/topic.rb +8 -2
data/lib/karafka/pro/scheduled_messages/consumer.rb +61 -26
data/lib/karafka/pro/scheduled_messages/daily_buffer.rb +9 -6
data/lib/karafka/pro/scheduled_messages/deserializers/headers.rb +7 -1
data/lib/karafka/pro/scheduled_messages/dispatcher.rb +2 -1
data/lib/karafka/pro/scheduled_messages/max_epoch.rb +15 -6
data/lib/karafka/pro/scheduled_messages/proxy.rb +15 -3
data/lib/karafka/pro/scheduled_messages/serializer.rb +2 -4
data/lib/karafka/pro/scheduled_messages/state.rb +20 -23
data/lib/karafka/pro/scheduled_messages/tracker.rb +34 -8
data/lib/karafka/pro/scheduled_messages.rb +17 -1
data/lib/karafka/processing/coordinators_buffer.rb +1 -0
data/lib/karafka/processing/strategies/default.rb +4 -4
data/lib/karafka/routing/builder.rb +12 -3
data/lib/karafka/routing/features/base/expander.rb +8 -2
data/lib/karafka/routing/features/dead_letter_queue/contracts/topic.rb +1 -0
data/lib/karafka/routing/subscription_group.rb +1 -1
data/lib/karafka/runner.rb +7 -1
data/lib/karafka/server.rb +21 -18
data/lib/karafka/setup/attributes_map.rb +2 -0
data/lib/karafka/setup/config.rb +40 -7
data/lib/karafka/setup/defaults_injector.rb +26 -1
data/lib/karafka/status.rb +6 -1
data/lib/karafka/swarm/node.rb +31 -0
data/lib/karafka/swarm/supervisor.rb +9 -2
data/lib/karafka/templates/karafka.rb.erb +14 -1
data/lib/karafka/version.rb +1 -1
data/lib/karafka.rb +17 -9
data/renovate.json +14 -2
metadata +41 -40
checksums.yaml.gz.sig +0 -0
data/certs/cert.pem +0 -26
data.tar.gz.sig +0 -0
metadata.gz.sig +0 -0

data/lib/karafka/pro/scheduled_messages/dispatcher.rb CHANGED Viewed

@@ -70,7 +70,8 @@ module Karafka
           config.producer.produce_async(
             topic: "#{@topic}#{config.states_postfix}",
             payload: @serializer.state(tracker),
-            key: 'state',
+            # We use the state as a key, so we always have one state transition data available
+            key: "#{tracker.state}_state",
             partition: @partition,
             headers: { 'zlib' => 'true' }
           )

data/lib/karafka/pro/scheduled_messages/max_epoch.rb CHANGED Viewed

@@ -10,22 +10,31 @@ module Karafka
       # until which messages were dispatched by us. This allows us to quickly skip those messages
       # during recovery, because we do know, they were dispatched.
       class MaxEpoch
+        # We always give a bit of a buffer when using the max dispatch epoch because while we
+        # are dispatching messages, we could also later receive data for time close to our
+        # dispatch times. This is why when reloading days we give ourselves one hour of a window
+        # that we will keep until tombstones expire them. This prevents edge cases race-conditions
+        # when multiple scheduled events scheduled close to each other would bump epoch in such a
+        # way, that it would end up ignoring certain events.
+        GRACE_PERIOD = 60 * 60
+        private_constant :GRACE_PERIOD
+        # @return [Integer] max epoch recorded
+        attr_reader :to_i
         def initialize
           @max = -1
+          @to_i = @max
         end
         # Updates epoch if bigger than current max
         # @param new_max [Integer] potential new max epoch
         def update(new_max)
-          return unless new_max
           return unless new_max > @max
           @max = new_max
-        end
-        # @return [Integer] max epoch recorded
-        def to_i
-          @max
+          @to_i = @max - GRACE_PERIOD
         end
       end
     end

data/lib/karafka/pro/scheduled_messages/proxy.rb CHANGED Viewed

@@ -60,7 +60,11 @@ module Karafka
             # We need to ensure that the message we want to proxy is fully legit. Otherwise, since
             # we envelope details like target topic, we could end up having incorrect data to
             # schedule
-            MSG_CONTRACT.validate!(message, WaterDrop::Errors::MessageInvalidError)
+            MSG_CONTRACT.validate!(
+              message,
+              WaterDrop::Errors::MessageInvalidError,
+              scope: %w[scheduled_messages message]
+            )
             headers = (message[:headers] || {}).merge(
               'schedule_schema_version' => ScheduledMessages::SCHEMA_VERSION,
@@ -166,9 +170,17 @@ module Karafka
           # complies with our requirements
           # @param proxy_message [Hash] our message envelope
           def validate!(proxy_message)
-            POST_CONTRACT.validate!(proxy_message)
+            POST_CONTRACT.validate!(
+              proxy_message,
+              scope: %w[scheduled_messages message]
+            )
             # After proxy specific validations we also ensure, that the final form is correct
-            MSG_CONTRACT.validate!(proxy_message, WaterDrop::Errors::MessageInvalidError)
+            MSG_CONTRACT.validate!(
+              proxy_message,
+              WaterDrop::Errors::MessageInvalidError,
+              scope: %w[scheduled_messages message]
+            )
           end
         end
       end

data/lib/karafka/pro/scheduled_messages/serializer.rb CHANGED Viewed

@@ -16,10 +16,8 @@ module Karafka
         def state(tracker)
           data = {
             schema_version: ScheduledMessages::STATES_SCHEMA_VERSION,
-            dispatched_at: float_now,
-            state: tracker.state,
-            daily: tracker.daily
-          }
+            dispatched_at: float_now
+          }.merge(tracker.to_h)
           compress(
             serialize(data)

data/lib/karafka/pro/scheduled_messages/state.rb CHANGED Viewed

@@ -15,38 +15,35 @@ module Karafka
       # - loaded - state in which we finished loading all the schedules and we can dispatch
       #   messages when the time comes and we can process real-time incoming schedules and
       #   changes to schedules as they appear in the stream.
+      # - shutdown - the states are no longer available as the consumer has shut down
       class State
-        # @param loaded [nil, false, true] is the state loaded or not yet. `nil` indicates, it is
-        #   a fresh, pre-seek state.
-        def initialize(loaded = nil)
-          @loaded = loaded
-        end
+        # Available states scheduling of messages may be in
+        STATES = %w[
+          fresh
+          loading
+          loaded
+          stopped
+        ].freeze
-        # @return [Boolean] are we in a fresh, pre-bootstrap state
-        def fresh?
-          @loaded.nil?
-        end
+        private_constant :STATES
-        # Marks the current state as fully loaded
-        def loaded!
-          @loaded = true
+        def initialize
+          @state = 'fresh'
         end
-        # @return [Boolean] are we in a loaded state
-        def loaded?
-          @loaded == true
+        STATES.each do |state|
+          define_method :"#{state}!" do
+            @state = state
+          end
+          define_method :"#{state}?" do
+            @state == state
+          end
         end
         # @return [String] current state string representation
         def to_s
-          case @loaded
-          when nil
-            'fresh'
-          when false
-            'loading'
-          when true
-            'loaded'
-          end
+          @state
         end
       end
     end

data/lib/karafka/pro/scheduled_messages/tracker.rb CHANGED Viewed

@@ -10,25 +10,40 @@ module Karafka
       #
       # It provides accurate today dispatch taken from daily buffer and estimates for future days
       class Tracker
-        # @return [Hash<String, Integer>]
-        attr_reader :daily
         # @return [String] current state
         attr_accessor :state
+        attr_writer :reloads
+        # @return [Integer] time epoch when this tracker was started
+        attr_reader :started_at
         def initialize
           @daily = Hash.new { |h, k| h[k] = 0 }
-          @created_at = Time.now.to_i
+          @started_at = Time.now.to_i
+          @offsets = { low: -1, high: -1 }
+          @state = 'fresh'
+          @reloads = 0
         end
-        # Accurate (because coming from daily buffer) number of things to schedule
+        # Tracks offsets of visited messages
+        #
+        # @param message [Karafka::Messages::Message]
+        def offsets(message)
+          message_offset = message.offset
+          @offsets[:low] = message_offset if @offsets[:low].negative?
+          @offsets[:high] = message.offset
+        end
+        # Accurate (because coming from daily buffer) number of things to schedule daily
         #
         # @param sum [Integer]
         def today=(sum)
-          @daily[epoch_to_date(@created_at)] = sum
+          @daily[epoch_to_date(@started_at)] = sum
         end
-        # Tracks message dispatch
+        # Tracks future message dispatch
         #
         # It is only relevant for future days as for today we use accurate metrics from the daily
         # buffer
@@ -37,12 +52,23 @@ module Karafka
         #   tombstone message. Tombstone messages cancellations are not tracked because it would
         #   drastically increase complexity. For given day we use the accurate counter and for
         #   future days we use estimates.
-        def track(message)
+        def future(message)
           epoch = message.headers['schedule_target_epoch']
           @daily[epoch_to_date(epoch)] += 1
         end
+        # @return [Hash] hash with details that we want to expose
+        def to_h
+          {
+            state: @state,
+            offsets: @offsets,
+            daily: @daily,
+            started_at: @started_at,
+            reloads: @reloads
+          }.freeze
+        end
         private
         # @param epoch [Integer] epoch time

data/lib/karafka/pro/scheduled_messages.rb CHANGED Viewed

@@ -51,7 +51,23 @@ module Karafka
         # @param config [Karafka::Core::Configurable::Node] root node config
         def post_setup(config)
-          RecurringTasks::Contracts::Config.new.validate!(config.to_h)
+          ScheduledMessages::Contracts::Config.new.validate!(
+            config.to_h,
+            scope: %w[config]
+          )
+        end
+        # Basically since we may have custom producers configured that are not the same as the
+        # default one, we hold a reference to old pre-fork producer. This means, that when we
+        # initialize it again in post-fork, as long as user uses defaults we should re-inherit
+        # it from the default config.
+        #
+        # @param config [Karafka::Core::Configurable::Node]
+        # @param pre_fork_producer [WaterDrop::Producer]
+        def post_fork(config, pre_fork_producer)
+          return unless config.scheduled_messages.producer == pre_fork_producer
+          config.scheduled_messages.producer = config.producer
         end
       end
     end

data/lib/karafka/processing/coordinators_buffer.rb CHANGED Viewed

@@ -22,6 +22,7 @@ module Karafka
       # @param topic_name [String] topic name
       # @param partition [Integer] partition number
+      # @return [Karafka::Processing::Coordinator] found or created coordinator
       def find_or_create(topic_name, partition)
         @coordinators[topic_name][partition] ||= begin
           routing_topic = @topics.find(topic_name)

data/lib/karafka/processing/strategies/default.rb CHANGED Viewed

@@ -55,8 +55,8 @@ module Karafka
           # seek offset can be nil only in case `#seek` was invoked with offset reset request
           # In case like this we ignore marking
           return true if seek_offset.nil?
-          # Ignore earlier offsets than the one we already committed
-          return true if seek_offset > message.offset
+          # Ignore double markings of the same offset
+          return true if (seek_offset - 1) == message.offset
           return false if revoked?
           return revoked? unless client.mark_as_consumed(message)
@@ -74,8 +74,8 @@ module Karafka
           # seek offset can be nil only in case `#seek` was invoked with offset reset request
           # In case like this we ignore marking
           return true if seek_offset.nil?
-          # Ignore earlier offsets than the one we already committed
-          return true if seek_offset > message.offset
+          # Ignore double markings of the same offset
+          return true if (seek_offset - 1) == message.offset
           return false if revoked?
           return revoked? unless client.mark_as_consumed!(message)

data/lib/karafka/routing/builder.rb CHANGED Viewed

@@ -50,15 +50,24 @@ module Karafka
           # Ensures high-level routing details consistency
           # Contains checks that require knowledge about all the consumer groups to operate
-          Contracts::Routing.new.validate!(map(&:to_h))
+          Contracts::Routing.new.validate!(
+            map(&:to_h),
+            scope: %w[routes]
+          )
           each do |consumer_group|
             # Validate consumer group settings
-            Contracts::ConsumerGroup.new.validate!(consumer_group.to_h)
+            Contracts::ConsumerGroup.new.validate!(
+              consumer_group.to_h,
+              scope: ['routes', consumer_group.name]
+            )
             # and then its topics settings
             consumer_group.topics.each do |topic|
-              Contracts::Topic.new.validate!(topic.to_h)
+              Contracts::Topic.new.validate!(
+                topic.to_h,
+                scope: ['routes', consumer_group.name, topic.name]
+              )
             end
             # Initialize subscription groups after all the routing is done

data/lib/karafka/routing/features/base/expander.rb CHANGED Viewed

@@ -38,13 +38,19 @@ module Karafka
                 each do |consumer_group|
                   if scope::Contracts.const_defined?('ConsumerGroup', false)
-                    scope::Contracts::ConsumerGroup.new.validate!(consumer_group.to_h)
+                    scope::Contracts::ConsumerGroup.new.validate!(
+                      consumer_group.to_h,
+                      scope: ['routes', consumer_group.name]
+                    )
                   end
                   next unless scope::Contracts.const_defined?('Topic', false)
                   consumer_group.topics.each do |topic|
-                    scope::Contracts::Topic.new.validate!(topic.to_h)
+                    scope::Contracts::Topic.new.validate!(
+                      topic.to_h,
+                      scope: ['routes', consumer_group.name, topic.name]
+                    )
                   end
                 end

data/lib/karafka/routing/features/dead_letter_queue/contracts/topic.rb CHANGED Viewed

@@ -46,6 +46,7 @@ module Karafka
               # When topic is set to false, it means we just want to skip dispatch on DLQ
               next if topic == false
               next if topic.is_a?(String) && topic_regexp.match?(topic)
+              next if topic == :strategy
               [[%i[dead_letter_queue topic], :format]]
             end

data/lib/karafka/routing/subscription_group.rb CHANGED Viewed

@@ -30,7 +30,7 @@ module Karafka
             @group_counter ||= 0
             @group_counter += 1
-            ::Digest::MD5.hexdigest(
+            ::Digest::SHA256.hexdigest(
               @group_counter.to_s
             )[0..11]
           end

data/lib/karafka/runner.rb CHANGED Viewed

@@ -4,6 +4,7 @@ module Karafka
   # Class used to run the Karafka listeners in separate threads
   class Runner
     include Helpers::ConfigImporter.new(
+      worker_thread_priority: %i[worker_thread_priority],
       manager: %i[internal connection manager],
       conductor: %i[internal connection conductor],
       jobs_queue_class: %i[internal processing jobs_queue_class]
@@ -26,7 +27,12 @@ module Karafka
       # Register all the listeners so they can be started and managed
       manager.register(listeners)
-      workers.each_with_index { |worker, i| worker.async_call("karafka.worker##{i}") }
+      workers.each_with_index do |worker, i|
+        worker.async_call(
+          "karafka.worker##{i}",
+          worker_thread_priority
+        )
+      end
       # We aggregate threads here for a supervised shutdown process
       Karafka::Server.workers = workers

data/lib/karafka/server.rb CHANGED Viewed

@@ -9,6 +9,15 @@ module Karafka
     private_constant :FORCEFUL_SHUTDOWN_WAIT
+    extend Helpers::ConfigImporter.new(
+      cli_contract: %i[internal cli contract],
+      activity_manager: %i[internal routing activity_manager],
+      supervision_sleep: %i[internal supervision_sleep],
+      shutdown_timeout: %i[shutdown_timeout],
+      forceful_exit_code: %i[internal forceful_exit_code],
+      process: %i[internal process]
+    )
     class << self
       # Set of consuming threads. Each consumer thread contains a single consumer
       attr_accessor :listeners
@@ -30,6 +39,9 @@ module Karafka
       # as not everything is possible when operating in non-standalone mode, etc.
       attr_accessor :execution_mode
+      # id of the server. Useful for logging when we want to reference things issued by the server.
+      attr_accessor :id
       # Method which runs app
       def run
         self.listeners = []
@@ -39,8 +51,9 @@ module Karafka
         # embedded
         # We cannot validate this during the start because config needs to be populated and routes
         # need to be defined.
-        config.internal.cli.contract.validate!(
-          config.internal.routing.activity_manager.to_h
+        cli_contract.validate!(
+          activity_manager.to_h,
+          scope: %w[cli]
         )
         # We clear as we do not want parent handlers in case of working from fork
@@ -96,18 +109,18 @@ module Karafka
         Karafka::App.stop!
-        timeout = config.shutdown_timeout
+        timeout = shutdown_timeout
         # We check from time to time (for the timeout period) if all the threads finished
         # their work and if so, we can just return and normal shutdown process will take place
         # We divide it by 1000 because we use time in ms.
-        ((timeout / 1_000) * (1 / config.internal.supervision_sleep)).to_i.times do
+        ((timeout / 1_000) * (1 / supervision_sleep)).to_i.times do
           all_listeners_stopped = listeners.all?(&:stopped?)
           all_workers_stopped = workers.none?(&:alive?)
           return if all_listeners_stopped && all_workers_stopped
-          sleep(config.internal.supervision_sleep)
+          sleep(supervision_sleep)
         end
         raise Errors::ForcefulShutdownError
@@ -145,7 +158,7 @@ module Karafka
         return unless process.supervised?
         # exit! is not within the instrumentation as it would not trigger due to exit
-        Kernel.exit!(config.internal.forceful_exit_code)
+        Kernel.exit!(forceful_exit_code)
       ensure
         # We need to check if it wasn't an early exit to make sure that only on stop invocation
         # can change the status after everything is closed
@@ -169,23 +182,13 @@ module Karafka
         # in one direction
         Karafka::App.quiet!
       end
-      private
-      # @return [Karafka::Core::Configurable::Node] root config node
-      def config
-        Karafka::App.config
-      end
-      # @return [Karafka::Process] process wrapper instance used to catch system signal calls
-      def process
-        config.internal.process
-      end
     end
     # Always start with standalone so there always is a value for the execution mode.
     # This is overwritten quickly during boot, but just in case someone would reach it prior to
     # booting, we want to have the default value.
     self.execution_mode = :standalone
+    self.id = SecureRandom.hex(6)
   end
 end

data/lib/karafka/setup/attributes_map.rb CHANGED Viewed

@@ -73,6 +73,7 @@ module Karafka
         message.max.bytes
         metadata.broker.list
         metadata.max.age.ms
+        metadata.recovery.strategy
         oauthbearer_token_refresh_cb
         offset.store.method
         offset.store.path
@@ -207,6 +208,7 @@ module Karafka
         message.timeout.ms
         metadata.broker.list
         metadata.max.age.ms
+        metadata.recovery.strategy
         msg_order_cmp
         oauthbearer_token_refresh_cb
         opaque

data/lib/karafka/setup/config.rb CHANGED Viewed

@@ -73,6 +73,9 @@ module Karafka
       # Really useful when you want to ensure that all topics in routing are managed via
       # declaratives.
       setting :strict_declarative_topics, default: false
+      # Defaults to the CPU thread priority slice to -1 (50ms) to ensure that CPU intense
+      # processing does not affect other threads and prevents starvation
+      setting :worker_thread_priority, default: -1
       setting :oauth do
         # option [false, #call] Listener for using oauth bearer. This listener will be able to
@@ -128,11 +131,28 @@ module Karafka
         # option max_wait_time [Integer] We wait only for this amount of time before raising error
         # as we intercept this error and retry after checking that the operation was finished or
         # failed using external factor.
-        setting :max_wait_time, default: 1_000
-        # How many times should be try. 1 000 ms x 60 => 60 seconds wait in total and then we give
-        # up on pending operations
-        setting :max_attempts, default: 60
+        #
+        # For async this will finish immediately but for sync operations this will wait and we
+        # will get a confirmation. 60 seconds is ok for both cases as for async, the re-wait will
+        # kick in
+        setting :max_wait_time, default: 60 * 1_000
+        # How long should we wait on admin operation retrying before giving up and raising an
+        # error that result is not visible
+        setting :max_retries_duration, default: 60_000
+        # In case of fast-finished async work, this `retry_backoff` help us not re-query Kafka
+        # too fast after previous call to check the async operation results. Basically prevents
+        # us from spamming metadata requests to Kafka in a loop
+        setting :retry_backoff, default: 500
+        # option poll_timeout [Integer] time in ms
+        # How long should a poll wait before yielding on no results (rdkafka-ruby setting)
+        # Lower value can be especially useful when working with Web UI, because it allows for
+        # increased responsiveness. Many admin operations do not take 100ms but they wait on poll
+        # until then prior to finishing, blocking the execution. Lowering to 25 ms can
+        # improve responsiveness of the Web UI. 50ms is a good trade-off for admin.
+        setting :poll_timeout, default: 50
       end
       # Namespace for internal settings that should not be modified directly
@@ -211,6 +231,10 @@ module Karafka
           # How long should we wait before a critical listener recovery
           # Too short may cause endless rebalance loops
           setting :reset_backoff, default: 60_000
+          # Similar to the `#worker_thread_priority`. Listener threads do not operate for long
+          # time and release GVL on polling but we provide this for API consistency and some
+          # special edge cases.
+          setting :listener_thread_priority, default: 0
           # Settings that are altered by our client proxy layer
           setting :proxy do
@@ -282,6 +306,9 @@ module Karafka
           setting :jobs_builder, default: Processing::JobsBuilder.new
           # option coordinator [Class] work coordinator we want to user for processing coordination
           setting :coordinator_class, default: Processing::Coordinator
+          # option errors_tracker_class [Class, nil] errors tracker that is used by the coordinator
+          #   for granular error tracking. `nil` for OSS as it is not in use.
+          setting :errors_tracker_class, default: nil
           # option partitioner_class [Class] partitioner we use against a batch of data
           setting :partitioner_class, default: Processing::Partitioner
           # option strategy_selector [Object] processing strategy selector to be used
@@ -334,7 +361,10 @@ module Karafka
           configure(&block)
-          Contracts::Config.new.validate!(config.to_h)
+          Contracts::Config.new.validate!(
+            config.to_h,
+            scope: %w[config]
+          )
           configure_components
@@ -367,7 +397,10 @@ module Karafka
           config.producer ||= ::WaterDrop::Producer.new do |producer_config|
             # In some cases WaterDrop updates the config and we don't want our consumer config to
             # be polluted by those updates, that's why we copy
-            producer_config.kafka = AttributesMap.producer(config.kafka.dup)
+            producer_kafka = AttributesMap.producer(config.kafka.dup)
+            # We inject some defaults (mostly for dev) unless user defined them
+            Setup::DefaultsInjector.producer(producer_kafka)
+            producer_config.kafka = producer_kafka
             # We also propagate same listener to the default producer to make sure, that the
             # listener for oauth is also automatically used by the producer. That way we don't
             # have to configure it manually for the default producer

data/lib/karafka/setup/defaults_injector.rb CHANGED Viewed

@@ -36,7 +36,17 @@ module Karafka
         'topic.metadata.refresh.interval.ms': 5_000
       }.freeze
-      private_constant :CONSUMER_KAFKA_DEFAULTS, :CONSUMER_KAFKA_DEV_DEFAULTS
+      # Contains settings that should not be used in production but make life easier in dev
+      # It is applied only to the default producer. If users setup their own producers, then
+      # they have to set this by themselves.
+      PRODUCER_KAFKA_DEV_DEFAULTS = {
+        # For all of those same reasoning as for the consumer
+        'allow.auto.create.topics': 'true',
+        'topic.metadata.refresh.interval.ms': 5_000
+      }.freeze
+      private_constant :CONSUMER_KAFKA_DEFAULTS, :CONSUMER_KAFKA_DEV_DEFAULTS,
+                       :PRODUCER_KAFKA_DEV_DEFAULTS
       class << self
         # Propagates the kafka setting defaults unless they are already present for consumer config
@@ -58,6 +68,21 @@ module Karafka
             kafka_config[key] = value
           end
         end
+        # Propagates the kafka settings defaults unless they are already present for producer
+        # config. This makes it easier to set some values that users usually don't change but still
+        # allows them to overwrite the whole hash.
+        #
+        # @param kafka_config [Hash] kafka scoped config
+        def producer(kafka_config)
+          return if Karafka::App.env.production?
+          PRODUCER_KAFKA_DEV_DEFAULTS.each do |key, value|
+            next if kafka_config.key?(key)
+            kafka_config[key] = value
+          end
+        end
       end
     end
   end

data/lib/karafka/status.rb CHANGED Viewed

@@ -66,7 +66,12 @@ module Karafka
             return if initializing?
             conductor.signal
-            monitor.instrument("app.#{state}", caller: self)
+            monitor.instrument(
+              "app.#{state}",
+              caller: self,
+              server_id: Karafka::Server.id
+            )
           end
         end
       RUBY