RubyGems - karafka - Versions diffs - 1.4.13 → 2.0.0 - Mend

karafka 1.4.13 → 2.0.0

Files changed (170) hide show

checksums.yaml +4 -4
checksums.yaml.gz.sig +3 -3
data/.github/workflows/ci.yml +85 -30
data/.ruby-version +1 -1
data/CHANGELOG.md +268 -7
data/CONTRIBUTING.md +10 -19
data/Gemfile +6 -0
data/Gemfile.lock +44 -87
data/LICENSE +17 -0
data/LICENSE-COMM +89 -0
data/LICENSE-LGPL +165 -0
data/README.md +44 -48
data/bin/benchmarks +85 -0
data/bin/create_token +22 -0
data/bin/integrations +237 -0
data/bin/karafka +4 -0
data/bin/scenario +29 -0
data/bin/stress_many +13 -0
data/bin/stress_one +13 -0
data/bin/wait_for_kafka +20 -0
data/certs/karafka-pro.pem +11 -0
data/config/errors.yml +55 -40
data/docker-compose.yml +39 -3
data/karafka.gemspec +11 -17
data/lib/active_job/karafka.rb +21 -0
data/lib/active_job/queue_adapters/karafka_adapter.rb +26 -0
data/lib/karafka/active_job/consumer.rb +26 -0
data/lib/karafka/active_job/dispatcher.rb +38 -0
data/lib/karafka/active_job/job_extensions.rb +34 -0
data/lib/karafka/active_job/job_options_contract.rb +21 -0
data/lib/karafka/active_job/routing/extensions.rb +31 -0
data/lib/karafka/app.rb +15 -20
data/lib/karafka/base_consumer.rb +181 -31
data/lib/karafka/cli/base.rb +4 -4
data/lib/karafka/cli/info.rb +43 -9
data/lib/karafka/cli/install.rb +19 -10
data/lib/karafka/cli/server.rb +17 -42
data/lib/karafka/cli.rb +4 -11
data/lib/karafka/connection/client.rb +385 -90
data/lib/karafka/connection/listener.rb +246 -38
data/lib/karafka/connection/listeners_batch.rb +24 -0
data/lib/karafka/connection/messages_buffer.rb +84 -0
data/lib/karafka/connection/pauses_manager.rb +46 -0
data/lib/karafka/connection/raw_messages_buffer.rb +101 -0
data/lib/karafka/connection/rebalance_manager.rb +78 -0
data/lib/karafka/contracts/base.rb +17 -0
data/lib/karafka/contracts/config.rb +88 -11
data/lib/karafka/contracts/consumer_group.rb +21 -189
data/lib/karafka/contracts/consumer_group_topic.rb +34 -11
data/lib/karafka/contracts/server_cli_options.rb +19 -18
data/lib/karafka/contracts.rb +1 -1
data/lib/karafka/env.rb +46 -0
data/lib/karafka/errors.rb +21 -21
data/lib/karafka/helpers/async.rb +33 -0
data/lib/karafka/helpers/colorize.rb +20 -0
data/lib/karafka/helpers/multi_delegator.rb +2 -2
data/lib/karafka/instrumentation/callbacks/error.rb +40 -0
data/lib/karafka/instrumentation/callbacks/statistics.rb +41 -0
data/lib/karafka/instrumentation/logger_listener.rb +164 -0
data/lib/karafka/instrumentation/monitor.rb +13 -61
data/lib/karafka/instrumentation/notifications.rb +52 -0
data/lib/karafka/instrumentation/proctitle_listener.rb +3 -3
data/lib/karafka/instrumentation/vendors/datadog/dashboard.json +1 -0
data/lib/karafka/instrumentation/vendors/datadog/listener.rb +232 -0
data/lib/karafka/instrumentation.rb +21 -0
data/lib/karafka/licenser.rb +75 -0
data/lib/karafka/messages/batch_metadata.rb +45 -0
data/lib/karafka/messages/builders/batch_metadata.rb +40 -0
data/lib/karafka/messages/builders/message.rb +39 -0
data/lib/karafka/messages/builders/messages.rb +32 -0
data/lib/karafka/{params/params.rb → messages/message.rb} +7 -12
data/lib/karafka/messages/messages.rb +64 -0
data/lib/karafka/{params → messages}/metadata.rb +4 -6
data/lib/karafka/messages/seek.rb +9 -0
data/lib/karafka/patches/rdkafka/consumer.rb +22 -0
data/lib/karafka/pro/active_job/consumer.rb +46 -0
data/lib/karafka/pro/active_job/dispatcher.rb +61 -0
data/lib/karafka/pro/active_job/job_options_contract.rb +32 -0
data/lib/karafka/pro/base_consumer.rb +82 -0
data/lib/karafka/pro/contracts/base.rb +21 -0
data/lib/karafka/pro/contracts/consumer_group.rb +34 -0
data/lib/karafka/pro/contracts/consumer_group_topic.rb +33 -0
data/lib/karafka/pro/loader.rb +76 -0
data/lib/karafka/pro/performance_tracker.rb +80 -0
data/lib/karafka/pro/processing/coordinator.rb +72 -0
data/lib/karafka/pro/processing/jobs/consume_non_blocking.rb +37 -0
data/lib/karafka/pro/processing/jobs_builder.rb +32 -0
data/lib/karafka/pro/processing/partitioner.rb +60 -0
data/lib/karafka/pro/processing/scheduler.rb +56 -0
data/lib/karafka/pro/routing/builder_extensions.rb +30 -0
data/lib/karafka/pro/routing/topic_extensions.rb +38 -0
data/lib/karafka/pro.rb +13 -0
data/lib/karafka/process.rb +1 -0
data/lib/karafka/processing/coordinator.rb +88 -0
data/lib/karafka/processing/coordinators_buffer.rb +54 -0
data/lib/karafka/processing/executor.rb +118 -0
data/lib/karafka/processing/executors_buffer.rb +88 -0
data/lib/karafka/processing/jobs/base.rb +51 -0
data/lib/karafka/processing/jobs/consume.rb +42 -0
data/lib/karafka/processing/jobs/revoked.rb +22 -0
data/lib/karafka/processing/jobs/shutdown.rb +23 -0
data/lib/karafka/processing/jobs_builder.rb +29 -0
data/lib/karafka/processing/jobs_queue.rb +144 -0
data/lib/karafka/processing/partitioner.rb +22 -0
data/lib/karafka/processing/result.rb +29 -0
data/lib/karafka/processing/scheduler.rb +22 -0
data/lib/karafka/processing/worker.rb +88 -0
data/lib/karafka/processing/workers_batch.rb +27 -0
data/lib/karafka/railtie.rb +113 -0
data/lib/karafka/routing/builder.rb +15 -24
data/lib/karafka/routing/consumer_group.rb +11 -19
data/lib/karafka/routing/consumer_mapper.rb +1 -2
data/lib/karafka/routing/router.rb +1 -1
data/lib/karafka/routing/subscription_group.rb +53 -0
data/lib/karafka/routing/subscription_groups_builder.rb +53 -0
data/lib/karafka/routing/topic.rb +61 -24
data/lib/karafka/routing/topics.rb +38 -0
data/lib/karafka/runner.rb +51 -0
data/lib/karafka/serialization/json/deserializer.rb +6 -15
data/lib/karafka/server.rb +67 -26
data/lib/karafka/setup/config.rb +147 -175
data/lib/karafka/status.rb +14 -5
data/lib/karafka/templates/example_consumer.rb.erb +16 -0
data/lib/karafka/templates/karafka.rb.erb +15 -51
data/lib/karafka/time_trackers/base.rb +19 -0
data/lib/karafka/time_trackers/pause.rb +92 -0
data/lib/karafka/time_trackers/poll.rb +65 -0
data/lib/karafka/version.rb +1 -1
data/lib/karafka.rb +38 -17
data.tar.gz.sig +0 -0
metadata +118 -120
metadata.gz.sig +0 -0
data/MIT-LICENCE +0 -18
data/lib/karafka/assignment_strategies/round_robin.rb +0 -13
data/lib/karafka/attributes_map.rb +0 -63
data/lib/karafka/backends/inline.rb +0 -16
data/lib/karafka/base_responder.rb +0 -226
data/lib/karafka/cli/flow.rb +0 -48
data/lib/karafka/cli/missingno.rb +0 -19
data/lib/karafka/code_reloader.rb +0 -67
data/lib/karafka/connection/api_adapter.rb +0 -158
data/lib/karafka/connection/batch_delegator.rb +0 -55
data/lib/karafka/connection/builder.rb +0 -23
data/lib/karafka/connection/message_delegator.rb +0 -36
data/lib/karafka/consumers/batch_metadata.rb +0 -10
data/lib/karafka/consumers/callbacks.rb +0 -71
data/lib/karafka/consumers/includer.rb +0 -64
data/lib/karafka/consumers/responders.rb +0 -24
data/lib/karafka/consumers/single_params.rb +0 -15
data/lib/karafka/contracts/responder_usage.rb +0 -54
data/lib/karafka/fetcher.rb +0 -42
data/lib/karafka/helpers/class_matcher.rb +0 -88
data/lib/karafka/helpers/config_retriever.rb +0 -46
data/lib/karafka/helpers/inflector.rb +0 -26
data/lib/karafka/instrumentation/stdout_listener.rb +0 -140
data/lib/karafka/params/batch_metadata.rb +0 -26
data/lib/karafka/params/builders/batch_metadata.rb +0 -30
data/lib/karafka/params/builders/params.rb +0 -38
data/lib/karafka/params/builders/params_batch.rb +0 -25
data/lib/karafka/params/params_batch.rb +0 -60
data/lib/karafka/patches/ruby_kafka.rb +0 -47
data/lib/karafka/persistence/client.rb +0 -29
data/lib/karafka/persistence/consumers.rb +0 -45
data/lib/karafka/persistence/topics.rb +0 -48
data/lib/karafka/responders/builder.rb +0 -36
data/lib/karafka/responders/topic.rb +0 -55
data/lib/karafka/routing/topic_mapper.rb +0 -53
data/lib/karafka/serialization/json/serializer.rb +0 -31
data/lib/karafka/setup/configurators/water_drop.rb +0 -36
data/lib/karafka/templates/application_responder.rb.erb +0 -11

data/bin/benchmarks ADDED Viewed

@@ -0,0 +1,85 @@
+#!/usr/bin/env ruby
+# Runner for running given benchmark cases
+# Some of the cases require pre-populated data and we populate this in places that need it
+# In other cases we generate this data in a background process, so the partitions data stream
+# is consistent and we don't end up consuming huge batches of a single partition.
+require 'open3'
+require 'pathname'
+$LOAD_PATH.unshift(File.dirname(__FILE__))
+$LOAD_PATH.unshift(File.join(File.dirname(__FILE__), '..'))
+ROOT_PATH = Pathname.new(File.expand_path(File.join(File.dirname(__FILE__), '../')))
+# Load all the benchmarks
+benchmarks = Dir[ROOT_PATH.join('spec/benchmarks/**/*.rb')]
+# If filter is provided, apply
+benchmarks.delete_if { |name| !name.include?(ARGV[0]) } if ARGV[0]
+raise ArgumentError, "No benchmarks with filter: #{ARGV[0]}" if benchmarks.empty?
+# We may skip seeding if we are running the benchmarks multiple times, then since we do not
+# commit offsets we can skip generating more data
+if ENV['SEED']
+  require 'spec/benchmarks_helper'
+  # We need to setup karafka here to have producer for data seeding
+  setup_karafka
+  # This takes some time but needs to run only once per benchmark session
+  puts 'Seeding benchmarks data...'
+  producer = Karafka::App.producer
+  # We make our data json compatible so we can also benchmark serialization
+  elements = Array.new(100_000) { { a: :b }.to_json }
+  # We do not populate data of benchmarks_0_10 as we use it with life-stream data only
+  %w[
+    benchmarks_00_01
+    benchmarks_00_05
+  ].each do |topic_name|
+    partitions_count = topic_name.split('_').last.to_i
+    partitions_count.times do |partition|
+      puts "Seeding #{topic_name}:#{partition}"
+      elements.each_slice(10_000) do |data_slice|
+        data = data_slice.map do |data|
+          { topic: topic_name, payload: data, partition: partition }
+        end
+        producer.buffer_many(data)
+        producer.flush_sync
+      end
+    end
+  end
+end
+# Selects requested benchmarks and runs them one after another
+benchmarks.each do |benchmark_path|
+  puts "Running #{benchmark_path.gsub("#{ROOT_PATH}/spec/benchmarks/", '')}"
+  benchmark = "bundle exec ruby -r ./spec/benchmarks_helper.rb #{benchmark_path}"
+  Open3.popen3(benchmark) do |stdin, stdout, stderr, thread|
+    t1 = Thread.new do
+      while line = stdout.gets
+        puts(line)
+      end
+    rescue IOError
+    end
+    t2 = Thread.new do
+      while line = stderr.gets
+        puts(line)
+      end
+    rescue IOError
+    end
+    thread.join
+  end
+end

data/bin/create_token ADDED Viewed

@@ -0,0 +1,22 @@
+#!/usr/bin/env ruby
+require 'openssl'
+require 'base64'
+require 'json'
+require 'date'
+PRIVATE_KEY_LOCATION = File.join(Dir.home, '.ssh', 'karafka-pro', 'id_rsa')
+# Name of the entity that acquires the license
+ENTITY = ARGV[0]
+raise ArgumentError, 'Entity missing' if ENTITY.nil? || ENTITY.empty?
+pro_token_data = { entity: ENTITY }
+# This code uses my private key to generate a new token for Karafka Pro capabilities
+private_key = OpenSSL::PKey::RSA.new(File.read(PRIVATE_KEY_LOCATION))
+bin_key = private_key.private_encrypt(pro_token_data.to_json)
+puts Base64.encode64(bin_key)

data/bin/integrations ADDED Viewed

@@ -0,0 +1,237 @@
+#!/usr/bin/env ruby
+# Runner to run integration specs in parallel
+# Part of integration specs run pristine without bundler.
+# If we would run bundle exec when running this code, bundler would inject its own context
+# into them, messing things up heavily
+raise 'This code needs to be executed WITHOUT bundle exec' if Kernel.const_defined?(:Bundler)
+require 'open3'
+require 'fileutils'
+require 'pathname'
+require 'tmpdir'
+require 'etc'
+ROOT_PATH = Pathname.new(File.expand_path(File.join(File.dirname(__FILE__), '../')))
+# How many child processes with integration specs do we want to run in parallel
+# When the value is high, there's a problem with thread allocation on Github CI, tht is why
+# we limit it. Locally we can run a lot of those, as many of them have sleeps and do not use a lot
+# of CPU
+CONCURRENCY = ENV.key?('CI') ? 5 : Etc.nprocessors * 2
+# How may bytes do we want to keep from the stdout in the buffer for when we need to print it
+MAX_BUFFER_OUTPUT = 51_200
+# Abstraction around a single test scenario execution process
+class Scenario
+  # How long a scenario can run before we kill it
+  # This is a fail-safe just in case something would hang
+  MAX_RUN_TIME = 3 * 60 # 3 minutes tops
+  # There are rare cases where Karafka may force shutdown for some of the integration cases
+  # This includes exactly those
+  EXIT_CODES = {
+    default: [0],
+    'consumption/worker_critical_error_behaviour.rb' => [0, 2].freeze,
+    'shutdown/on_hanging_jobs_and_a_shutdown.rb' => [2].freeze,
+    'shutdown/on_hanging_on_shutdown_job_and_a_shutdown.rb' => [2].freeze,
+    'shutdown/on_hanging_listener_and_shutdown.rb' => [2].freeze
+  }.freeze
+  private_constant :MAX_RUN_TIME, :EXIT_CODES
+  # Creates scenario instance and runs in the background process
+  #
+  # @param path [String] path to the scenarios file
+  def initialize(path)
+    @path = path
+    # Last 1024 characters from stdout
+    @stdout_tail = ''
+  end
+  # Starts running given scenario in a separate process
+  def start
+    @stdin, @stdout, @stderr, @wait_thr = Open3.popen3(init_and_build_cmd)
+    @started_at = current_time
+  end
+  # @return [String] integration spec name
+  def name
+    @path.gsub("#{ROOT_PATH}/spec/integrations/", '')
+  end
+  # @return [Boolean] true if spec is pristine
+  def pristine?
+    scenario_dir = File.dirname(@path)
+    # If there is a Gemfile in a scenario directory, it means it is a pristine spec and we need
+    # to run bundle install, etc in order to run it
+    File.exist?(File.join(scenario_dir, 'Gemfile'))
+  end
+  # @return [Boolean] did this scenario finished or is it still running
+  def finished?
+    # If the thread is running too long, kill it
+    if current_time - @started_at > MAX_RUN_TIME
+      @wait_thr.kill
+      begin
+        Process.kill('TERM', pid)
+      # It may finish right after we want to kill it, that's why we ignore this
+      rescue Errno::ESRCH
+      end
+    end
+    # We read it so it won't grow as we use our default logger that prints to both test.log and
+    # to stdout. Otherwise after reaching the buffer size, it would hang
+    buffer = ''
+    @stdout.read_nonblock(MAX_BUFFER_OUTPUT, buffer, exception: false)
+    @stdout_tail << buffer
+    @stdout_tail = @stdout_tail[-MAX_BUFFER_OUTPUT..-1] || @stdout_tail
+    !@wait_thr.alive?
+  end
+  # @return [Boolean] did this scenario finish successfully or not
+  def success?
+    expected_exit_codes = EXIT_CODES[name] || EXIT_CODES[:default]
+    expected_exit_codes.include?(exit_code)
+  end
+  # @return [Integer] pid of the process of this scenario
+  def pid
+    @wait_thr.pid
+  end
+  # @return [Integer] exit code of the process running given scenario
+  def exit_code
+    # There may be no exit status if we killed the thread
+    @wait_thr.value&.exitstatus || 123
+  end
+  # Prints a status report when scenario is finished and stdout if it failed
+  def report
+    if success?
+      print "\e[#{32}m#{'.'}\e[0m"
+    else
+      buffer = ''
+      @stderr.read_nonblock(MAX_BUFFER_OUTPUT, buffer, exception: false)
+      puts
+      puts "\e[#{31}m#{'[FAILED]'}\e[0m #{name}"
+      puts "Exit code: #{exit_code}"
+      puts @stdout_tail
+      puts buffer
+      puts
+    end
+  end
+  private
+  # Sets up a proper environment for a given spec to run and returns the run command
+  # @return [String] run command
+  def init_and_build_cmd
+    # If there is a Gemfile in a scenario directory, it means it is a pristine spec and we need
+    # to run bundle install, etc in order to run it
+    if pristine?
+      scenario_dir = File.dirname(@path)
+      # We copy the spec into a temp dir, not to pollute the spec location with logs, etc
+      temp_dir = Dir.mktmpdir
+      file_name = File.basename(@path)
+      FileUtils.cp_r("#{scenario_dir}/.", temp_dir)
+      <<~CMD
+        cd #{temp_dir} &&
+        KARAFKA_GEM_DIR=#{ROOT_PATH} \
+        BUNDLE_AUTO_INSTALL=true \
+        PRISTINE_MODE=true \
+        bundle exec ruby -r #{ROOT_PATH}/spec/integrations_helper.rb #{file_name}
+      CMD
+    else
+      <<~CMD
+        KARAFKA_GEM_DIR=#{ROOT_PATH} \
+        bundle exec ruby -r ./spec/integrations_helper.rb #{@path}
+      CMD
+    end
+  end
+  # @return [Float] current machine time
+  def current_time
+    Process.clock_gettime(Process::CLOCK_MONOTONIC)
+  end
+end
+# Load all the specs
+specs = Dir[ROOT_PATH.join('spec/integrations/**/*.rb')]
+# If filters is provided, apply
+# Allows to provide several filters one after another and applies all of them
+ARGV.each do |filter|
+  specs.delete_if { |name| !name.include?(filter) }
+end
+raise ArgumentError, "No integration specs with filters: #{ARGV.join(', ')}" if specs.empty?
+# Randomize order
+seed = (ENV['SEED'] || rand(0..10_000)).to_i
+puts "Random seed: #{seed}"
+scenarios = specs
+            .shuffle(random: Random.new(seed))
+            .map { |integration_test| Scenario.new(integration_test) }
+regulars = scenarios.reject(&:pristine?)
+pristine = scenarios.select(&:pristine?)
+active_scenarios = []
+finished_scenarios = []
+while finished_scenarios.size < scenarios.size
+  # If we have space to run another scenario, we add it
+  if active_scenarios.size < CONCURRENCY
+    scenario = nil
+    # We can run only one pristine at the same time due to concurrency issues within bundler
+    # Since they usually take longer than others, we try to run them as fast as possible when there
+    # is a slot
+    scenario = pristine.pop unless active_scenarios.any?(&:pristine?)
+    scenario ||= regulars.pop
+    if scenario
+      scenario.start
+      active_scenarios << scenario
+    end
+  end
+  active_scenarios.select(&:finished?).each do |exited|
+    scenario = active_scenarios.delete(exited)
+    scenario.report
+    finished_scenarios << scenario
+  end
+  sleep(0.1)
+end
+failed_scenarios = finished_scenarios.reject(&:success?)
+# Report once more on the failed jobs
+# This will only list scenarios that failed without printing their stdout here.
+if failed_scenarios.empty?
+  puts
+else
+  puts "\nFailed scenarios:\n\n"
+  failed_scenarios.each do |scenario|
+    puts "\e[#{31}m#{'[FAILED]'}\e[0m #{scenario.name}"
+  end
+  puts
+  # Exit with 1 if not all scenarios were successful
+  exit 1
+end

data/bin/karafka CHANGED Viewed

@@ -2,6 +2,10 @@
 require 'karafka'
+# We set this to indicate, that the process in which we are (whatever it does) was started using
+# our bin/karafka cli
+ENV['KARAFKA_CLI'] = 'true'
 # If there is a boot file, we need to require it as we expect it to contain
 # Karafka app setup, routes, etc
 if File.exist?(Karafka.boot_file)

data/bin/scenario ADDED Viewed

@@ -0,0 +1,29 @@
+#!/usr/bin/env ruby
+# Runner for non-parallel execution of a single scenario.
+# It prints all the info stdout, etc and basically replaces itself with the scenario execution.
+# It is useful when we work with a single spec and we need all the debug info
+raise 'This code needs to be executed WITHOUT bundle exec' if Kernel.const_defined?(:Bundler)
+require 'open3'
+require 'fileutils'
+require 'pathname'
+require 'tmpdir'
+require 'etc'
+ROOT_PATH = Pathname.new(File.expand_path(File.join(File.dirname(__FILE__), '../')))
+# Load all the specs
+specs = Dir[ROOT_PATH.join('spec/integrations/**/*.rb')]
+# If filters is provided, apply
+# Allows to provide several filters one after another and applies all of them
+ARGV.each do |filter|
+  specs.delete_if { |name| !name.include?(filter) }
+end
+raise ArgumentError, "No integration specs with filters: #{ARGV.join(', ')}" if specs.empty?
+raise ArgumentError, "Many specs found with filters: #{ARGV.join(', ')}" if specs.size != 1
+exec("bundle exec ruby -r #{ROOT_PATH}/spec/integrations_helper.rb #{specs[0]}")

data/bin/stress_many ADDED Viewed

@@ -0,0 +1,13 @@
+#!/bin/bash
+# Runs integration specs in an endless loop
+# This allows us to ensure (after long enough time) that the integrations test suit is stable and
+# that there are no anomalies when running it for a long period of time
+set -e
+while :
+do
+  clear
+  bin/integrations $1
+done

data/bin/stress_one ADDED Viewed

@@ -0,0 +1,13 @@
+#!/bin/bash
+# Runs a single integration spec in an endless loop
+# This allows us to ensure (after long enough time) that the integration spec is stable and
+# that there are no anomalies when running it for a long period of time
+set -e
+while :
+do
+  clear
+  bin/scenario $1
+done

data/bin/wait_for_kafka ADDED Viewed

@@ -0,0 +1,20 @@
+#!/bin/bash
+# This script allows us to wait for Kafka docker to fully be ready
+# We consider it fully ready when all our topics that need to be created are created as expected
+KAFKA_NAME='karafka_20_kafka'
+ZOOKEEPER='zookeeper:2181'
+LIST_CMD="kafka-topics.sh --list --zookeeper $ZOOKEEPER"
+# Take the number of topics that we need to create prior to running anything
+TOPICS_COUNT=`cat docker-compose.yml | grep -E -i 'integrations_|benchmarks_' | wc -l`
+# And wait until all of them are created
+until (((`docker exec $KAFKA_NAME $LIST_CMD | wc -l`) >= $TOPICS_COUNT));
+do
+  echo "Waiting for Kafka to create all the needed topics..."
+  sleep 1
+done
+echo "All the needed topics created."

data/certs/karafka-pro.pem ADDED Viewed

@@ -0,0 +1,11 @@
+-----BEGIN RSA PUBLIC KEY-----
+MIIBigKCAYEApcd6ybskiNs9WUvBGVUE8GdWDehjZ9TyjSj/fDl/UcMYqY0R5YX9
+tnYxEwZZRMdVltKWxr88Qmshh1IQz6CpJVbcfYjt/158pSGPm+AUua6tkLqIvZDM
+ocFOMafmroI+BMuL+Zu5QH7HC2tkT16jclGYfMQkJjXVUQTk2UZr+94+8RlUz/CH
+Y6hPA7xPgIyPfyPCxz1VWzAwXwT++NCJQPBr5MqT84LNSEzUSlR9pFNShf3UCUT+
+8LWOvjFSNGmMMSsbo2T7/+dz9/FM02YG00EO0x04qteggwcaEYLFrigDN6/fM0ih
+BXZILnMUqC/qrfW2YFg4ZqKZJuxaALqqkPxrkBDYqoqcAloqn36jBSke6tc/2I/J
+2Afq3r53UoAbUH7h5I/L8YeaiA4MYjAuq724lHlrOmIr4D6yjYC0a1LGlPjLk869
+2nsVXNgomhVb071E6amR+rJJnfvkdZgCmEBFnqnBV5A1u4qgNsa2rVcD+gJRvb2T
+aQtjlQWKPx5xAgMBAAE=
+-----END RSA PUBLIC KEY-----

data/config/errors.yml CHANGED Viewed

@@ -1,41 +1,56 @@
 en:
-  dry_validation:
-    errors:
-      invalid_broker_schema: >
-        has an invalid format
-        Expected schema, host and port number
-        Example: kafka://127.0.0.1:9092 or kafka+ssl://127.0.0.1:9092
-      invalid_certificate: >
-        is not a valid certificate
-      invalid_certificate_from_path: >
-        is not a valid certificate
-      invalid_private_key: >
-        is not a valid private key
-      max_timeout_size_for_exponential: >
-        pause_timeout cannot be more than pause_max_timeout
-      max_wait_time_limit:
-        max_wait_time cannot be more than socket_timeout
-      topics_names_not_unique: >
-        all topic names within a single consumer group must be unique
-      ssl_client_cert_with_ssl_client_cert_key: >
-        Both ssl_client_cert and ssl_client_cert_key need to be provided
-      ssl_client_cert_key_with_ssl_client_cert: >
-        Both ssl_client_cert_key and ssl_client_cert need to be provided
-      ssl_client_cert_chain_with_ssl_client_cert: >
-        Both ssl_client_cert_chain and ssl_client_cert need to be provided
-      ssl_client_cert_chain_with_ssl_client_cert_key: >
-        Both ssl_client_cert_chain and ssl_client_cert_key need to be provided
-      ssl_client_cert_key_password_with_ssl_client_cert_key: >
-        Both ssl_client_cert_key_password and ssl_client_cert_key need to be provided
-      does_not_respond_to_token: >
-        needs to respond to a #token method
-      required_usage_count: >
-        Given topic must be used at least once
-      pid_already_exists: >
-        Pidfile already exists
-      consumer_groups_inclusion: >
-        Unknown consumer group
-      does_not_exist:
-        Given file does not exist or cannot be read
-      does_not_respond_to_call: >
-        needs to respond to a #call method
+  validations:
+    config:
+      missing: needs to be present
+      client_id_format: 'needs to be a string with a Kafka accepted format'
+      license.entity_format: needs to be a string
+      license.token_format: needs to be either false or a string
+      license.expires_on_format: needs to be a valid date
+      concurrency_format: needs to be an integer bigger than 0
+      consumer_mapper_format: needs to be present
+      consumer_persistence_format: needs to be either true or false
+      pause_timeout_format: needs to be an integer bigger than 0
+      pause_max_timeout_format: needs to be an integer bigger than 0
+      pause_with_exponential_backoff_format: needs to be either true or false
+      shutdown_timeout_format: needs to be an integer bigger than 0
+      max_wait_time_format: needs to be an integer bigger than 0
+      kafka_format: needs to be a filled hash
+      internal.status_format: needs to be present
+      internal.process_format: needs to be present
+      internal.routing.builder_format: needs to be present
+      internal.routing.subscription_groups_builder_format: needs to be present
+      key_must_be_a_symbol: All keys under the kafka settings scope need to be symbols
+      max_timeout_vs_pause_max_timeout: pause_timeout must be less or equal to pause_max_timeout
+      shutdown_timeout_vs_max_wait_time: shutdown_timeout must be more than max_wait_time
+    server_cli_options:
+      missing: needs to be present
+      consumer_groups_inclusion: Unknown consumer group
+    consumer_group_topic:
+      missing: needs to be present
+      name_format: 'needs to be a string with a Kafka accepted format'
+      deserializer_format: needs to be present
+      manual_offset_management_format: needs to be either true or false
+      consumer_format: needs to be present
+      id_format: 'needs to be a string with a Kafka accepted format'
+      initial_offset_format: needs to be either earliest or latest
+    consumer_group:
+      missing: needs to be present
+      topics_names_not_unique: all topic names within a single consumer group must be unique
+      id_format: 'needs to be a string with a Kafka accepted format'
+      topics_format: needs to be a non-empty array
+    job_options:
+      missing: needs to be present
+      dispatch_method_format: needs to be either :produce_async or :produce_sync
+      partitioner_format: 'needs to respond to #call'
+      partition_key_type_format: 'needs to be either :key or :partition_key'
+    test:
+      missing: needs to be present
+      id_format: needs to be a String
+    pro_consumer_group_topic:
+      consumer_format: needs to inherit from Karafka::Pro::BaseConsumer and not Karafka::Consumer

data/docker-compose.yml CHANGED Viewed

@@ -1,17 +1,53 @@
 version: '2'
 services:
   zookeeper:
+    container_name: karafka_20_zookeeper
     image: wurstmeister/zookeeper
     ports:
-      - "2181:2181"
+      - '2181:2181'
   kafka:
-    image: wurstmeister/kafka:1.0.1
+    container_name: karafka_20_kafka
+    image: wurstmeister/kafka
     ports:
-      - "9092:9092"
+      - '9092:9092'
     environment:
       KAFKA_ADVERTISED_HOST_NAME: localhost
       KAFKA_ADVERTISED_PORT: 9092
       KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181
       KAFKA_AUTO_CREATE_TOPICS_ENABLE: 'true'
+      KAFKA_CREATE_TOPICS:
+        "integrations_00_02:2:1,\
+         integrations_01_02:2:1,\
+         integrations_02_02:2:1,\
+         integrations_03_02:2:1,\
+         integrations_04_02:2:1,\
+         integrations_05_02:2:1,\
+         integrations_06_02:2:1,\
+         integrations_07_02:2:1,\
+         integrations_08_02:2:1,\
+         integrations_09_02:2:1,\
+         integrations_10_02:2:1,\
+         integrations_11_02:2:1,\
+         integrations_12_02:2:1,\
+         integrations_13_02:2:1,\
+         integrations_14_02:2:1,\
+         integrations_15_02:2:1,\
+         integrations_16_02:2:1,\
+         integrations_17_02:2:1,\
+         integrations_18_02:2:1,\
+         integrations_19_02:2:1,\
+         integrations_20_02:2:1,\
+         integrations_21_02:2:1,\
+         integrations_00_03:3:1,\
+         integrations_01_03:3:1,\
+         integrations_02_03:3:1,\
+         integrations_03_03:3:1,\
+         integrations_04_03:3:1,\
+         integrations_00_10:10:1,\
+         integrations_01_10:10:1,\
+         benchmarks_00_01:1:1,\
+         benchmarks_00_05:5:1,\
+         benchmarks_01_05:5:1,\
+         benchmarks_00_10:10:1"
     volumes:
       - /var/run/docker.sock:/var/run/docker.sock

data/karafka.gemspec CHANGED Viewed

@@ -5,29 +5,24 @@ $LOAD_PATH.unshift(lib) unless $LOAD_PATH.include?(lib)
 require 'karafka/version'
-# rubocop:disable Metrics/BlockLength
 Gem::Specification.new do |spec|
   spec.name        = 'karafka'
   spec.version     = ::Karafka::VERSION
   spec.platform    = Gem::Platform::RUBY
-  spec.authors     = ['Maciej Mensfeld', 'Pavlo Vavruk', 'Adam Gwozdowski']
-  spec.email       = %w[maciej@mensfeld.pl pavlo.vavruk@gmail.com adam99g@gmail.com]
+  spec.authors     = ['Maciej Mensfeld']
+  spec.email       = %w[maciej@mensfeld.pl]
   spec.homepage    = 'https://karafka.io'
-  spec.summary     = 'Ruby based framework for working with Apache Kafka'
+  spec.summary     = 'Efficient Kafka processing framework for Ruby and Rails'
   spec.description = 'Framework used to simplify Apache Kafka based Ruby applications development'
-  spec.license     = 'MIT'
+  spec.licenses    = ['LGPL-3.0', 'Commercial']
-  spec.add_dependency 'dry-configurable', '~> 0.13'
-  spec.add_dependency 'dry-inflector', '~> 0.2'
-  spec.add_dependency 'dry-monitor', '~> 0.5'
-  spec.add_dependency 'dry-validation', '~> 1.7'
-  spec.add_dependency 'envlogic', '~> 1.1'
-  spec.add_dependency 'ruby-kafka', '>= 1.3.0'
-  spec.add_dependency 'thor', '>= 1.1'
-  spec.add_dependency 'waterdrop', '~> 1.4'
-  spec.add_dependency 'zeitwerk', '~> 2.4'
+  spec.add_dependency 'karafka-core', '>= 2.0.2', '< 3.0.0'
+  spec.add_dependency 'rdkafka', '>= 0.12'
+  spec.add_dependency 'thor', '>= 0.20'
+  spec.add_dependency 'waterdrop', '>= 2.4.1', '< 3.0.0'
+  spec.add_dependency 'zeitwerk', '~> 2.3'
-  spec.required_ruby_version = '>= 2.7'
+  spec.required_ruby_version = '>= 2.7.0'
   if $PROGRAM_NAME.end_with?('gem')
     spec.signing_key = File.expand_path('~/.ssh/gem-private_key.pem')
@@ -35,7 +30,7 @@ Gem::Specification.new do |spec|
   spec.cert_chain    = %w[certs/mensfeld.pem]
   spec.files         = `git ls-files -z`.split("\x0").reject { |f| f.match(%r{^(spec)/}) }
-  spec.executables   = spec.files.grep(%r{^bin/}) { |f| File.basename(f) }
+  spec.executables   = %w[karafka]
   spec.require_paths = %w[lib]
   spec.metadata = {
@@ -43,4 +38,3 @@ Gem::Specification.new do |spec|
     'rubygems_mfa_required' => 'true'
   }
 end
-# rubocop:enable Metrics/BlockLength