RubyGems - sidekiq_cleaner - Versions diffs - 5.3.6 - Mend

sidekiq_cleaner 5.3.6

Files changed (122) hide show

checksums.yaml +7 -0
data/.circleci/config.yml +61 -0
data/.github/contributing.md +32 -0
data/.github/issue_template.md +11 -0
data/.gitignore +15 -0
data/.travis.yml +11 -0
data/3.0-Upgrade.md +70 -0
data/4.0-Upgrade.md +53 -0
data/5.0-Upgrade.md +56 -0
data/COMM-LICENSE +97 -0
data/Changes.md +1536 -0
data/Ent-Changes.md +238 -0
data/Gemfile +23 -0
data/LICENSE +9 -0
data/Pro-2.0-Upgrade.md +138 -0
data/Pro-3.0-Upgrade.md +44 -0
data/Pro-4.0-Upgrade.md +35 -0
data/Pro-Changes.md +759 -0
data/README.md +55 -0
data/Rakefile +9 -0
data/bin/sidekiq +18 -0
data/bin/sidekiqctl +20 -0
data/bin/sidekiqload +149 -0
data/cleaner/assets/images/favicon.ico +0 -0
data/cleaner/assets/images/logo.png +0 -0
data/cleaner/assets/images/status.png +0 -0
data/cleaner/assets/javascripts/application.js +172 -0
data/cleaner/assets/javascripts/dashboard.js +315 -0
data/cleaner/assets/stylesheets/application-rtl.css +246 -0
data/cleaner/assets/stylesheets/application.css +1144 -0
data/cleaner/assets/stylesheets/bootstrap-rtl.min.css +9 -0
data/cleaner/assets/stylesheets/bootstrap.css +5 -0
data/cleaner/locales/ar.yml +81 -0
data/cleaner/locales/cs.yml +78 -0
data/cleaner/locales/da.yml +68 -0
data/cleaner/locales/de.yml +69 -0
data/cleaner/locales/el.yml +68 -0
data/cleaner/locales/en.yml +81 -0
data/cleaner/locales/es.yml +70 -0
data/cleaner/locales/fa.yml +80 -0
data/cleaner/locales/fr.yml +78 -0
data/cleaner/locales/he.yml +79 -0
data/cleaner/locales/hi.yml +75 -0
data/cleaner/locales/it.yml +69 -0
data/cleaner/locales/ja.yml +80 -0
data/cleaner/locales/ko.yml +68 -0
data/cleaner/locales/nb.yml +77 -0
data/cleaner/locales/nl.yml +68 -0
data/cleaner/locales/pl.yml +59 -0
data/cleaner/locales/pt-br.yml +68 -0
data/cleaner/locales/pt.yml +67 -0
data/cleaner/locales/ru.yml +78 -0
data/cleaner/locales/sv.yml +68 -0
data/cleaner/locales/ta.yml +75 -0
data/cleaner/locales/uk.yml +76 -0
data/cleaner/locales/ur.yml +80 -0
data/cleaner/locales/zh-cn.yml +68 -0
data/cleaner/locales/zh-tw.yml +68 -0
data/cleaner/views/_footer.erb +20 -0
data/cleaner/views/_job_info.erb +88 -0
data/cleaner/views/_nav.erb +52 -0
data/cleaner/views/_paging.erb +23 -0
data/cleaner/views/_poll_link.erb +7 -0
data/cleaner/views/_status.erb +4 -0
data/cleaner/views/_summary.erb +40 -0
data/cleaner/views/busy.erb +98 -0
data/cleaner/views/dashboard.erb +75 -0
data/cleaner/views/dead.erb +34 -0
data/cleaner/views/errors.erb +84 -0
data/cleaner/views/layout.erb +40 -0
data/cleaner/views/morgue.erb +75 -0
data/cleaner/views/queue.erb +46 -0
data/cleaner/views/queues.erb +30 -0
data/cleaner/views/retries.erb +80 -0
data/cleaner/views/retry.erb +34 -0
data/cleaner/views/scheduled.erb +54 -0
data/cleaner/views/scheduled_job_info.erb +8 -0
data/cleaner-stats.png +0 -0
data/cleaner.png +0 -0
data/code_of_conduct.md +50 -0
data/lib/generators/sidekiq/templates/worker.rb.erb +9 -0
data/lib/generators/sidekiq/templates/worker_spec.rb.erb +6 -0
data/lib/generators/sidekiq/templates/worker_test.rb.erb +8 -0
data/lib/generators/sidekiq/worker_generator.rb +49 -0
data/lib/sidekiq/api.rb +940 -0
data/lib/sidekiq/cleaner/action.rb +89 -0
data/lib/sidekiq/cleaner/application.rb +385 -0
data/lib/sidekiq/cleaner/helpers.rb +325 -0
data/lib/sidekiq/cleaner/router.rb +100 -0
data/lib/sidekiq/cleaner.rb +214 -0
data/lib/sidekiq/cli.rb +445 -0
data/lib/sidekiq/client.rb +243 -0
data/lib/sidekiq/core_ext.rb +1 -0
data/lib/sidekiq/ctl.rb +221 -0
data/lib/sidekiq/delay.rb +42 -0
data/lib/sidekiq/exception_handler.rb +29 -0
data/lib/sidekiq/extensions/action_mailer.rb +57 -0
data/lib/sidekiq/extensions/active_record.rb +40 -0
data/lib/sidekiq/extensions/class_methods.rb +40 -0
data/lib/sidekiq/extensions/generic_proxy.rb +31 -0
data/lib/sidekiq/fetch.rb +81 -0
data/lib/sidekiq/job_logger.rb +25 -0
data/lib/sidekiq/job_retry.rb +262 -0
data/lib/sidekiq/launcher.rb +173 -0
data/lib/sidekiq/logging.rb +122 -0
data/lib/sidekiq/manager.rb +137 -0
data/lib/sidekiq/middleware/chain.rb +150 -0
data/lib/sidekiq/middleware/i18n.rb +42 -0
data/lib/sidekiq/middleware/server/active_record.rb +23 -0
data/lib/sidekiq/paginator.rb +43 -0
data/lib/sidekiq/processor.rb +279 -0
data/lib/sidekiq/rails.rb +58 -0
data/lib/sidekiq/redis_connection.rb +144 -0
data/lib/sidekiq/scheduled.rb +174 -0
data/lib/sidekiq/testing/inline.rb +29 -0
data/lib/sidekiq/testing.rb +333 -0
data/lib/sidekiq/util.rb +66 -0
data/lib/sidekiq/version.rb +4 -0
data/lib/sidekiq/worker.rb +220 -0
data/lib/sidekiq.rb +237 -0
data/sidekiq_cleaner.gemspec +21 -0
metadata +235 -0

data/lib/sidekiq/job_retry.rb ADDED Viewed

@@ -0,0 +1,262 @@
+# frozen_string_literal: true
+require 'sidekiq/scheduled'
+require 'sidekiq/api'
+module Sidekiq
+  ##
+  # Automatically retry jobs that fail in Sidekiq.
+  # Sidekiq's retry support assumes a typical development lifecycle:
+  #
+  #   0. Push some code changes with a bug in it.
+  #   1. Bug causes job processing to fail, Sidekiq's middleware captures
+  #      the job and pushes it onto a retry queue.
+  #   2. Sidekiq retries jobs in the retry queue multiple times with
+  #      an exponential delay, the job continues to fail.
+  #   3. After a few days, a developer deploys a fix. The job is
+  #      reprocessed successfully.
+  #   4. Once retries are exhausted, Sidekiq will give up and move the
+  #      job to the Dead Job Queue (aka morgue) where it must be dealt with
+  #      manually in the Web UI.
+  #   5. After 6 months on the DJQ, Sidekiq will discard the job.
+  #
+  # A job looks like:
+  #
+  #     { 'class' => 'HardWorker', 'args' => [1, 2, 'foo'], 'retry' => true }
+  #
+  # The 'retry' option also accepts a number (in place of 'true'):
+  #
+  #     { 'class' => 'HardWorker', 'args' => [1, 2, 'foo'], 'retry' => 5 }
+  #
+  # The job will be retried this number of times before giving up. (If simply
+  # 'true', Sidekiq retries 25 times)
+  #
+  # We'll add a bit more data to the job to support retries:
+  #
+  #  * 'queue' - the queue to use
+  #  * 'retry_count' - number of times we've retried so far.
+  #  * 'error_message' - the message from the exception
+  #  * 'error_class' - the exception class
+  #  * 'failed_at' - the first time it failed
+  #  * 'retried_at' - the last time it was retried
+  #  * 'backtrace' - the number of lines of error backtrace to store
+  #
+  # We don't store the backtrace by default as that can add a lot of overhead
+  # to the job and everyone is using an error service, right?
+  #
+  # The default number of retries is 25 which works out to about 3 weeks
+  # You can change the default maximum number of retries in your initializer:
+  #
+  #   Sidekiq.options[:max_retries] = 7
+  #
+  # or limit the number of retries for a particular worker with:
+  #
+  #    class MyWorker
+  #      include Sidekiq::Worker
+  #      sidekiq_options :retry => 10
+  #    end
+  #
+  class JobRetry
+    class Handled < ::RuntimeError; end
+    class Skip < Handled; end
+    include Sidekiq::Util
+    DEFAULT_MAX_RETRY_ATTEMPTS = 25
+    def initialize(options = {})
+      @max_retries = Sidekiq.options.merge(options).fetch(:max_retries, DEFAULT_MAX_RETRY_ATTEMPTS)
+    end
+    # The global retry handler requires only the barest of data.
+    # We want to be able to retry as much as possible so we don't
+    # require the worker to be instantiated.
+    def global(msg, queue)
+      yield
+    rescue Handled => ex
+      raise ex
+    rescue Sidekiq::Shutdown => ey
+      # ignore, will be pushed back onto queue during hard_shutdown
+      raise ey
+    rescue Exception => e
+      # ignore, will be pushed back onto queue during hard_shutdown
+      raise Sidekiq::Shutdown if exception_caused_by_shutdown?(e)
+      if msg['retry']
+        attempt_retry(nil, msg, queue, e)
+      else
+        Sidekiq.death_handlers.each do |handler|
+          begin
+            handler.call(msg, e)
+          rescue => handler_ex
+            handle_exception(handler_ex, { context: "Error calling death handler", job: msg })
+          end
+        end
+      end
+      raise Handled
+    end
+    # The local retry support means that any errors that occur within
+    # this block can be associated with the given worker instance.
+    # This is required to support the `sidekiq_retries_exhausted` block.
+    #
+    # Note that any exception from the block is wrapped in the Skip
+    # exception so the global block does not reprocess the error.  The
+    # Skip exception is unwrapped within Sidekiq::Processor#process before
+    # calling the handle_exception handlers.
+    def local(worker, msg, queue)
+      yield
+    rescue Handled => ex
+      raise ex
+    rescue Sidekiq::Shutdown => ey
+      # ignore, will be pushed back onto queue during hard_shutdown
+      raise ey
+    rescue Exception => e
+      # ignore, will be pushed back onto queue during hard_shutdown
+      raise Sidekiq::Shutdown if exception_caused_by_shutdown?(e)
+      if msg['retry'] == nil
+        msg['retry'] = worker.class.get_sidekiq_options['retry']
+      end
+      raise e unless msg['retry']
+      attempt_retry(worker, msg, queue, e)
+      # We've handled this error associated with this job, don't
+      # need to handle it at the global level
+      raise Skip
+    end
+    private
+    # Note that +worker+ can be nil here if an error is raised before we can
+    # instantiate the worker instance.  All access must be guarded and
+    # best effort.
+    def attempt_retry(worker, msg, queue, exception)
+      max_retry_attempts = retry_attempts_from(msg['retry'], @max_retries)
+      msg['queue'] = if msg['retry_queue']
+        msg['retry_queue']
+      else
+        queue
+      end
+      m = exception_message(exception)
+      if m.respond_to?(:scrub!)
+        m.force_encoding("utf-8")
+        m.scrub!
+      end
+      msg['error_message'] = m
+      msg['error_class'] = exception.class.name
+      count = if msg['retry_count']
+        msg['retried_at'] = Time.now.to_f
+        msg['retry_count'] += 1
+      else
+        msg['failed_at'] = Time.now.to_f
+        msg['retry_count'] = 0
+      end
+      if msg['backtrace'] == true
+        msg['error_backtrace'] = exception.backtrace
+      elsif !msg['backtrace']
+        # do nothing
+      elsif msg['backtrace'].to_i != 0
+        msg['error_backtrace'] = exception.backtrace[0...msg['backtrace'].to_i]
+      end
+      if count < max_retry_attempts
+        delay = delay_for(worker, count, exception)
+        # Logging here can break retries if the logging device raises ENOSPC #3979
+        #logger.debug { "Failure! Retry #{count} in #{delay} seconds" }
+        retry_at = Time.now.to_f + delay
+        payload = Sidekiq.dump_json(msg)
+        Sidekiq.redis do |conn|
+          conn.zadd('retry', retry_at.to_s, payload)
+        end
+      else
+        # Goodbye dear message, you (re)tried your best I'm sure.
+        retries_exhausted(worker, msg, exception)
+      end
+    end
+    def retries_exhausted(worker, msg, exception)
+      begin
+        block = worker && worker.sidekiq_retries_exhausted_block
+        block.call(msg, exception) if block
+      rescue => e
+        handle_exception(e, { context: "Error calling retries_exhausted", job: msg })
+      end
+      Sidekiq.death_handlers.each do |handler|
+        begin
+          handler.call(msg, exception)
+        rescue => e
+          handle_exception(e, { context: "Error calling death handler", job: msg })
+        end
+      end
+      send_to_morgue(msg) unless msg['dead'] == false
+    end
+    def send_to_morgue(msg)
+      logger.info { "Adding dead #{msg['class']} job #{msg['jid']}" }
+      payload = Sidekiq.dump_json(msg)
+      DeadSet.new.kill(payload, notify_failure: false)
+    end
+    def retry_attempts_from(msg_retry, default)
+      if msg_retry.is_a?(Integer)
+        msg_retry
+      else
+        default
+      end
+    end
+    def delay_for(worker, count, exception)
+      if worker && worker.sidekiq_retry_in_block
+        custom_retry_in = retry_in(worker, count, exception).to_i
+        return custom_retry_in if custom_retry_in > 0
+      end
+      seconds_to_delay(count)
+    end
+    # delayed_job uses the same basic formula
+    def seconds_to_delay(count)
+      (count ** 4) + 15 + (rand(30)*(count+1))
+    end
+    def retry_in(worker, count, exception)
+      begin
+        worker.sidekiq_retry_in_block.call(count, exception)
+      rescue Exception => e
+        handle_exception(e, { context: "Failure scheduling retry using the defined `sidekiq_retry_in` in #{worker.class.name}, falling back to default" })
+        nil
+      end
+    end
+    def exception_caused_by_shutdown?(e, checked_causes = [])
+      return false unless e.cause
+      # Handle circular causes
+      checked_causes << e.object_id
+      return false if checked_causes.include?(e.cause.object_id)
+      e.cause.instance_of?(Sidekiq::Shutdown) ||
+        exception_caused_by_shutdown?(e.cause, checked_causes)
+    end
+    # Extract message from exception.
+    # Set a default if the message raises an error
+    def exception_message(exception)
+      begin
+        # App code can stuff all sorts of crazy binary data into the error message
+        # that won't convert to JSON.
+        exception.message.to_s[0, 10_000]
+      rescue
+        "!!! ERROR MESSAGE THREW AN ERROR !!!".dup
+      end
+    end
+  end
+end

data/lib/sidekiq/launcher.rb ADDED Viewed

@@ -0,0 +1,173 @@
+# frozen_string_literal: true
+require 'sidekiq/manager'
+require 'sidekiq/fetch'
+require 'sidekiq/scheduled'
+module Sidekiq
+  # The Launcher is a very simple Actor whose job is to
+  # start, monitor and stop the core Actors in Sidekiq.
+  # If any of these actors die, the Sidekiq process exits
+  # immediately.
+  class Launcher
+    include Util
+    attr_accessor :manager, :poller, :fetcher
+    STATS_TTL = 5*365*24*60*60
+    def initialize(options)
+      @manager = Sidekiq::Manager.new(options)
+      @poller = Sidekiq::Scheduled::Poller.new
+      @done = false
+      @options = options
+    end
+    def run
+      @thread = safe_thread("heartbeat", &method(:start_heartbeat))
+      @poller.start
+      @manager.start
+    end
+    # Stops this instance from processing any more jobs,
+    #
+    def quiet
+      @done = true
+      @manager.quiet
+      @poller.terminate
+    end
+    # Shuts down the process.  This method does not
+    # return until all work is complete and cleaned up.
+    # It can take up to the timeout to complete.
+    def stop
+      deadline = ::Process.clock_gettime(::Process::CLOCK_MONOTONIC) + @options[:timeout]
+      @done = true
+      @manager.quiet
+      @poller.terminate
+      @manager.stop(deadline)
+      # Requeue everything in case there was a worker who grabbed work while stopped
+      # This call is a no-op in Sidekiq but necessary for Sidekiq Pro.
+      strategy = (@options[:fetch] || Sidekiq::BasicFetch)
+      strategy.bulk_requeue([], @options)
+      clear_heartbeat
+    end
+    def stopping?
+      @done
+    end
+    private unless $TESTING
+    def heartbeat
+      results = Sidekiq::CLI::PROCTITLES.map {|x| x.(self, to_data) }
+      results.compact!
+      $0 = results.join(' ')
+      ❤
+    end
+    def ❤
+      key = identity
+      fails = procd = 0
+      begin
+        fails = Processor::FAILURE.reset
+        procd = Processor::PROCESSED.reset
+        curstate = Processor::WORKER_STATE.dup
+        workers_key = "#{key}:workers"
+        nowdate = Time.now.utc.strftime("%Y-%m-%d")
+        Sidekiq.redis do |conn|
+          conn.multi do
+            conn.incrby("stat:processed", procd)
+            conn.incrby("stat:processed:#{nowdate}", procd)
+            conn.expire("stat:processed:#{nowdate}", STATS_TTL)
+            conn.incrby("stat:failed", fails)
+            conn.incrby("stat:failed:#{nowdate}", fails)
+            conn.expire("stat:failed:#{nowdate}", STATS_TTL)
+            conn.del(workers_key)
+            curstate.each_pair do |tid, hash|
+              conn.hset(workers_key, tid, Sidekiq.dump_json(hash))
+            end
+            conn.expire(workers_key, 60)
+          end
+        end
+        fails = procd = 0
+        _, exists, _, _, msg = Sidekiq.redis do |conn|
+          conn.multi do
+            conn.sadd('processes', key)
+            conn.exists(key)
+            conn.hmset(key, 'info', to_json, 'busy', curstate.size, 'beat', Time.now.to_f, 'quiet', @done)
+            conn.expire(key, 60)
+            conn.rpop("#{key}-signals")
+          end
+        end
+        # first heartbeat or recovering from an outage and need to reestablish our heartbeat
+        fire_event(:heartbeat) if !exists
+        return unless msg
+        ::Process.kill(msg, $$)
+      rescue => e
+        # ignore all redis/network issues
+        logger.error("heartbeat: #{e.message}")
+        # don't lose the counts if there was a network issue
+        Processor::PROCESSED.incr(procd)
+        Processor::FAILURE.incr(fails)
+      end
+    end
+    def start_heartbeat
+      while true
+        heartbeat
+        sleep 5
+      end
+      Sidekiq.logger.info("Heartbeat stopping...")
+    end
+    def to_data
+      @data ||= begin
+        {
+          'hostname' => hostname,
+          'started_at' => Time.now.to_f,
+          'pid' => $$,
+          'tag' => @options[:tag] || '',
+          'concurrency' => @options[:concurrency],
+          'queues' => @options[:queues].uniq,
+          'labels' => @options[:labels],
+          'identity' => identity,
+        }
+      end
+    end
+    def to_json
+      @json ||= begin
+        # this data changes infrequently so dump it to a string
+        # now so we don't need to dump it every heartbeat.
+        Sidekiq.dump_json(to_data)
+      end
+    end
+    def clear_heartbeat
+      # Remove record from Redis since we are shutting down.
+      # Note we don't stop the heartbeat thread; if the process
+      # doesn't actually exit, it'll reappear in the Web UI.
+      Sidekiq.redis do |conn|
+        conn.pipelined do
+          conn.srem('processes', identity)
+          conn.del("#{identity}:workers")
+        end
+      end
+    rescue
+      # best effort, ignore network errors
+    end
+  end
+end

data/lib/sidekiq/logging.rb ADDED Viewed

@@ -0,0 +1,122 @@
+# frozen_string_literal: true
+require 'time'
+require 'logger'
+require 'fcntl'
+module Sidekiq
+  module Logging
+    class Pretty < Logger::Formatter
+      SPACE = " "
+      # Provide a call() method that returns the formatted message.
+      def call(severity, time, program_name, message)
+        "#{time.utc.iso8601(3)} #{::Process.pid} TID-#{Sidekiq::Logging.tid}#{context} #{severity}: #{message}\n"
+      end
+      def context
+        c = Thread.current[:sidekiq_context]
+        " #{c.join(SPACE)}" if c && c.any?
+      end
+    end
+    class WithoutTimestamp < Pretty
+      def call(severity, time, program_name, message)
+        "#{::Process.pid} TID-#{Sidekiq::Logging.tid}#{context} #{severity}: #{message}\n"
+      end
+    end
+    def self.tid
+      Thread.current['sidekiq_tid'] ||= (Thread.current.object_id ^ ::Process.pid).to_s(36)
+    end
+    def self.job_hash_context(job_hash)
+      # If we're using a wrapper class, like ActiveJob, use the "wrapped"
+      # attribute to expose the underlying thing.
+      klass = job_hash['wrapped'] || job_hash["class"]
+      bid = job_hash['bid']
+      "#{klass} JID-#{job_hash['jid']}#{" BID-#{bid}" if bid}"
+    end
+    def self.with_job_hash_context(job_hash, &block)
+      with_context(job_hash_context(job_hash), &block)
+    end
+    def self.with_context(msg)
+      Thread.current[:sidekiq_context] ||= []
+      Thread.current[:sidekiq_context] << msg
+      yield
+    ensure
+      Thread.current[:sidekiq_context].pop
+    end
+    def self.initialize_logger(log_target = STDOUT)
+      oldlogger = defined?(@logger) ? @logger : nil
+      @logger = Logger.new(log_target)
+      @logger.level = Logger::INFO
+      @logger.formatter = ENV['DYNO'] ? WithoutTimestamp.new : Pretty.new
+      oldlogger.close if oldlogger && !$TESTING # don't want to close testing's STDOUT logging
+      @logger
+    end
+    def self.logger
+      defined?(@logger) ? @logger : initialize_logger
+    end
+    def self.logger=(log)
+      @logger = (log ? log : Logger.new(File::NULL))
+    end
+    # This reopens ALL logfiles in the process that have been rotated
+    # using logrotate(8) (without copytruncate) or similar tools.
+    # A +File+ object is considered for reopening if it is:
+    #   1) opened with the O_APPEND and O_WRONLY flags
+    #   2) the current open file handle does not match its original open path
+    #   3) unbuffered (as far as userspace buffering goes, not O_SYNC)
+    # Returns the number of files reopened
+    def self.reopen_logs
+      to_reopen = []
+      append_flags = File::WRONLY | File::APPEND
+      ObjectSpace.each_object(File) do |fp|
+        begin
+          if !fp.closed? && fp.stat.file? && fp.sync && (fp.fcntl(Fcntl::F_GETFL) & append_flags) == append_flags
+            to_reopen << fp
+          end
+        rescue IOError, Errno::EBADF
+        end
+      end
+      nr = 0
+      to_reopen.each do |fp|
+        orig_st = begin
+          fp.stat
+        rescue IOError, Errno::EBADF
+          next
+        end
+        begin
+          b = File.stat(fp.path)
+          next if orig_st.ino == b.ino && orig_st.dev == b.dev
+        rescue Errno::ENOENT
+        end
+        begin
+          File.open(fp.path, 'a') { |tmpfp| fp.reopen(tmpfp) }
+          fp.sync = true
+          nr += 1
+        rescue IOError, Errno::EBADF
+          # not much we can do...
+        end
+      end
+      nr
+    rescue RuntimeError => ex
+      # RuntimeError: ObjectSpace is disabled; each_object will only work with Class, pass -X+O to enable
+      puts "Unable to reopen logs: #{ex.message}"
+    end
+    def logger
+      Sidekiq::Logging.logger
+    end
+  end
+end

data/lib/sidekiq/manager.rb ADDED Viewed

@@ -0,0 +1,137 @@
+# frozen_string_literal: true
+require 'sidekiq/util'
+require 'sidekiq/processor'
+require 'sidekiq/fetch'
+require 'thread'
+require 'set'
+module Sidekiq
+  ##
+  # The Manager is the central coordination point in Sidekiq, controlling
+  # the lifecycle of the Processors.
+  #
+  # Tasks:
+  #
+  # 1. start: Spin up Processors.
+  # 3. processor_died: Handle job failure, throw away Processor, create new one.
+  # 4. quiet: shutdown idle Processors.
+  # 5. stop: hard stop the Processors by deadline.
+  #
+  # Note that only the last task requires its own Thread since it has to monitor
+  # the shutdown process.  The other tasks are performed by other threads.
+  #
+  class Manager
+    include Util
+    attr_reader :workers
+    attr_reader :options
+    def initialize(options={})
+      logger.debug { options.inspect }
+      @options = options
+      @count = options[:concurrency] || 10
+      raise ArgumentError, "Concurrency of #{@count} is not supported" if @count < 1
+      @done = false
+      @workers = Set.new
+      @count.times do
+        @workers << Processor.new(self)
+      end
+      @plock = Mutex.new
+    end
+    def start
+      @workers.each do |x|
+        x.start
+      end
+    end
+    def quiet
+      return if @done
+      @done = true
+      logger.info { "Terminating quiet workers" }
+      @workers.each { |x| x.terminate }
+      fire_event(:quiet, reverse: true)
+    end
+    # hack for quicker development / testing environment #2774
+    PAUSE_TIME = STDOUT.tty? ? 0.1 : 0.5
+    def stop(deadline)
+      quiet
+      fire_event(:shutdown, reverse: true)
+      # some of the shutdown events can be async,
+      # we don't have any way to know when they're done but
+      # give them a little time to take effect
+      sleep PAUSE_TIME
+      return if @workers.empty?
+      logger.info { "Pausing to allow workers to finish..." }
+      remaining = deadline - ::Process.clock_gettime(::Process::CLOCK_MONOTONIC)
+      while remaining > PAUSE_TIME
+        return if @workers.empty?
+        sleep PAUSE_TIME
+        remaining = deadline - ::Process.clock_gettime(::Process::CLOCK_MONOTONIC)
+      end
+      return if @workers.empty?
+      hard_shutdown
+    end
+    def processor_stopped(processor)
+      @plock.synchronize do
+        @workers.delete(processor)
+      end
+    end
+    def processor_died(processor, reason)
+      @plock.synchronize do
+        @workers.delete(processor)
+        unless @done
+          p = Processor.new(self)
+          @workers << p
+          p.start
+        end
+      end
+    end
+    def stopped?
+      @done
+    end
+    private
+    def hard_shutdown
+      # We've reached the timeout and we still have busy workers.
+      # They must die but their jobs shall live on.
+      cleanup = nil
+      @plock.synchronize do
+        cleanup = @workers.dup
+      end
+      if cleanup.size > 0
+        jobs = cleanup.map {|p| p.job }.compact
+        logger.warn { "Terminating #{cleanup.size} busy worker threads" }
+        logger.warn { "Work still in progress #{jobs.inspect}" }
+        # Re-enqueue unfinished jobs
+        # NOTE: You may notice that we may push a job back to redis before
+        # the worker thread is terminated. This is ok because Sidekiq's
+        # contract says that jobs are run AT LEAST once. Process termination
+        # is delayed until we're certain the jobs are back in Redis because
+        # it is worse to lose a job than to run it twice.
+        strategy = (@options[:fetch] || Sidekiq::BasicFetch)
+        strategy.bulk_requeue(jobs, @options)
+      end
+      cleanup.each do |processor|
+        processor.kill
+      end
+    end
+  end
+end