RubyGems - inst-jobs - Versions diffs - 2.3.1 → 2.4.8 - Mend

inst-jobs 2.3.1 → 2.4.8

Files changed (94) hide show

checksums.yaml +4 -4
data/db/migrate/20101216224513_create_delayed_jobs.rb +9 -7
data/db/migrate/20110531144916_cleanup_delayed_jobs_indexes.rb +8 -13
data/db/migrate/20110610213249_optimize_delayed_jobs.rb +8 -8
data/db/migrate/20110831210257_add_delayed_jobs_next_in_strand.rb +25 -25
data/db/migrate/20120510004759_delayed_jobs_delete_trigger_lock_for_update.rb +4 -8
data/db/migrate/20120531150712_drop_psql_jobs_pop_fn.rb +1 -3
data/db/migrate/20120607164022_delayed_jobs_use_advisory_locks.rb +11 -15
data/db/migrate/20120607181141_index_jobs_on_locked_by.rb +1 -1
data/db/migrate/20120608191051_add_jobs_run_at_index.rb +2 -2
data/db/migrate/20120927184213_change_delayed_jobs_handler_to_text.rb +1 -1
data/db/migrate/20140505215510_copy_failed_jobs_original_id.rb +2 -3
data/db/migrate/20150807133223_add_max_concurrent_to_jobs.rb +9 -13
data/db/migrate/20151210162949_improve_max_concurrent.rb +4 -8
data/db/migrate/20161206323555_add_back_default_string_limits_jobs.rb +3 -2
data/db/migrate/20181217155351_speed_up_max_concurrent_triggers.rb +13 -17
data/db/migrate/20200330230722_add_id_to_get_delayed_jobs_index.rb +8 -8
data/db/migrate/20200824222232_speed_up_max_concurrent_delete_trigger.rb +72 -77
data/db/migrate/20200825011002_add_strand_order_override.rb +93 -97
data/db/migrate/20210809145804_add_n_strand_index.rb +12 -0
data/db/migrate/20210812210128_add_singleton_column.rb +200 -0
data/db/migrate/20210917232626_add_delete_conflicting_singletons_before_unlock_trigger.rb +27 -0
data/exe/inst_jobs +3 -2
data/lib/delayed/backend/active_record.rb +204 -150
data/lib/delayed/backend/base.rb +107 -77
data/lib/delayed/batch.rb +11 -9
data/lib/delayed/cli.rb +98 -84
data/lib/delayed/core_ext/kernel.rb +4 -2
data/lib/delayed/daemon.rb +70 -74
data/lib/delayed/job_tracking.rb +26 -25
data/lib/delayed/lifecycle.rb +27 -24
data/lib/delayed/log_tailer.rb +17 -17
data/lib/delayed/logging.rb +13 -16
data/lib/delayed/message_sending.rb +43 -52
data/lib/delayed/performable_method.rb +6 -8
data/lib/delayed/periodic.rb +72 -65
data/lib/delayed/plugin.rb +2 -4
data/lib/delayed/pool.rb +198 -192
data/lib/delayed/server/helpers.rb +6 -6
data/lib/delayed/server.rb +51 -54
data/lib/delayed/settings.rb +93 -81
data/lib/delayed/testing.rb +21 -22
data/lib/delayed/version.rb +1 -1
data/lib/delayed/work_queue/in_process.rb +21 -17
data/lib/delayed/work_queue/parent_process/client.rb +55 -53
data/lib/delayed/work_queue/parent_process/server.rb +219 -208
data/lib/delayed/work_queue/parent_process.rb +52 -53
data/lib/delayed/worker/consul_health_check.rb +21 -19
data/lib/delayed/worker/health_check.rb +29 -22
data/lib/delayed/worker/null_health_check.rb +3 -1
data/lib/delayed/worker/process_helper.rb +8 -9
data/lib/delayed/worker.rb +271 -261
data/lib/delayed/yaml_extensions.rb +12 -10
data/lib/delayed_job.rb +37 -38
data/lib/inst-jobs.rb +1 -1
data/spec/active_record_job_spec.rb +129 -136
data/spec/delayed/cli_spec.rb +7 -7
data/spec/delayed/daemon_spec.rb +8 -8
data/spec/delayed/message_sending_spec.rb +16 -9
data/spec/delayed/periodic_spec.rb +13 -12
data/spec/delayed/server_spec.rb +38 -38
data/spec/delayed/settings_spec.rb +26 -25
data/spec/delayed/work_queue/in_process_spec.rb +7 -7
data/spec/delayed/work_queue/parent_process/client_spec.rb +16 -12
data/spec/delayed/work_queue/parent_process/server_spec.rb +43 -40
data/spec/delayed/work_queue/parent_process_spec.rb +21 -21
data/spec/delayed/worker/consul_health_check_spec.rb +22 -22
data/spec/delayed/worker/health_check_spec.rb +60 -52
data/spec/delayed/worker_spec.rb +28 -25
data/spec/sample_jobs.rb +45 -15
data/spec/shared/delayed_batch.rb +74 -67
data/spec/shared/delayed_method.rb +143 -102
data/spec/shared/performable_method.rb +39 -38
data/spec/shared/shared_backend.rb +550 -437
data/spec/shared/testing.rb +14 -14
data/spec/shared/worker.rb +155 -147
data/spec/shared_jobs_specs.rb +13 -13
data/spec/spec_helper.rb +46 -41
metadata +79 -53
data/lib/delayed/backend/redis/bulk_update.lua +0 -50
data/lib/delayed/backend/redis/destroy_job.lua +0 -2
data/lib/delayed/backend/redis/enqueue.lua +0 -29
data/lib/delayed/backend/redis/fail_job.lua +0 -5
data/lib/delayed/backend/redis/find_available.lua +0 -3
data/lib/delayed/backend/redis/functions.rb +0 -59
data/lib/delayed/backend/redis/get_and_lock_next_available.lua +0 -17
data/lib/delayed/backend/redis/includes/jobs_common.lua +0 -203
data/lib/delayed/backend/redis/job.rb +0 -528
data/lib/delayed/backend/redis/set_running.lua +0 -5
data/lib/delayed/backend/redis/tickle_strand.lua +0 -2
data/spec/gemfiles/52.gemfile +0 -7
data/spec/gemfiles/60.gemfile +0 -7
data/spec/gemfiles/61.gemfile +0 -7
data/spec/redis_job_spec.rb +0 -148

data/lib/delayed/worker/consul_health_check.rb CHANGED Viewed

@@ -1,23 +1,23 @@
 # frozen_string_literal: true
-require_relative 'health_check'
-require_relative 'process_helper'
-require 'socket'
+require_relative "health_check"
+require_relative "process_helper"
+require "socket"
 module Delayed
   class Worker
     class ConsulHealthCheck < HealthCheck
       self.type_name = :consul
-      CONSUL_CONFIG_KEYS = %w{url acl_token}.map(&:freeze).freeze
-      DEFAULT_SERVICE_NAME = 'inst-jobs_worker'.freeze
+      CONSUL_CONFIG_KEYS = %w[url acl_token].map(&:freeze).freeze
+      DEFAULT_SERVICE_NAME = "inst-jobs_worker"
       attr_reader :service_client, :health_client
       def initialize(*, **)
         super
         # Because we don't want the consul client to be a hard dependency we're
         # only requiring it once it's absolutely needed
-        require 'diplomat'
+        require "diplomat"
         if config.keys.any? { |k| CONSUL_CONFIG_KEYS.include?(k) }
           consul_config = Diplomat::Configuration.new.tap do |conf|
@@ -35,10 +35,10 @@ module Delayed
       def start
         @service_client.register({
-          id: worker_name,
-          name: service_name,
-          check: check_attributes
-        })
+                                   id: worker_name,
+                                   name: service_name,
+                                   check: check_attributes
+                                 })
       end
       def stop
@@ -48,27 +48,28 @@ module Delayed
       def live_workers
         # Filter out critical workers (probably nodes failing their serf health check)
         live_nodes = @health_client.service(service_name, {
-          filter: 'not Checks.Status == critical'
-        })
+                                              filter: "not Checks.Status == critical"
+                                            })
-        live_nodes.map { |n| n.Service['ID']}
+        live_nodes.map { |n| n.Service["ID"] }
       end
       private
       def check_attributes
         {
-          args: ['bash', '-c', check_script],
-          status: 'passing',
-          interval: @config.fetch(:check_interval, '5m'),
-          deregister_critical_service_after: @config.fetch(:deregister_service_delay, '10m'),
+          args: ["bash", "-c", check_script],
+          status: "passing",
+          interval: @config.fetch(:check_interval, "5m"),
+          deregister_critical_service_after: @config.fetch(:deregister_service_delay, "10m")
         }.tap do |h|
-          h[:docker_container_id] = docker_container_id if @config['docker']
+          h[:docker_container_id] = docker_container_id if @config["docker"]
         end
       end
       def check_script
         return @check_script if @check_script
         mtime = ProcessHelper.mtime(Process.pid)
         @check_script = ProcessHelper.check_script(Process.pid, mtime)
       end
@@ -77,12 +78,13 @@ module Delayed
       # cgroups for part of its magic and also uses the container id as the cgroup name
       def docker_container_id
         return @docker_container_id if @docker_container_id
         content = File.read("/proc/1/cgroup").split("\n")
         @docker_container_id = content.last.split("/").last
       end
       def service_name
-        @service_name ||= @config.fetch('service_name', DEFAULT_SERVICE_NAME)
+        @service_name ||= @config.fetch("service_name", DEFAULT_SERVICE_NAME)
       end
     end
   end

data/lib/delayed/worker/health_check.rb CHANGED Viewed

@@ -11,58 +11,65 @@ module Delayed
         def inherited(subclass)
           @subclasses << subclass
+          super
         end
         def build(type:, worker_name:, config: {})
           type = type.to_sym
           klass = @subclasses.find { |sc| sc.type_name == type }
           raise ArgumentError, "Unable to build a HealthCheck for type #{type}" unless klass
           klass.new(worker_name: worker_name, config: config)
         end
         def reschedule_abandoned_jobs
           return if Settings.worker_health_check_type == :none
           Delayed::Job.transaction do
             # this action is a special case, and SHOULD NOT be a periodic job
             # because if it gets wiped out suddenly during execution
-            # it can't go clean up it's abandoned self.  Therefore,
+            # it can't go clean up its abandoned self.  Therefore,
             # we expect it to get run from it's own process forked from the job pool
             # and we try to get an advisory lock when it runs.  If we succeed,
             # no other worker is trying to do this right now (and if we abandon the
             # operation, the transaction will end, releasing the advisory lock).
-            result = attempt_advisory_lock
+            result = Delayed::Job.attempt_advisory_lock("Delayed::Worker::HealthCheck#reschedule_abandoned_jobs")
             return unless result
+            horizon = 5.minutes.ago
             checker = Worker::HealthCheck.build(
               type: Settings.worker_health_check_type,
               config: Settings.worker_health_check_config,
-              worker_name: 'cleanup-crew'
+              worker_name: "cleanup-crew"
             )
             live_workers = checker.live_workers
-            Delayed::Job.running_jobs.each do |job|
-              # prefetched jobs have their own way of automatically unlocking themselves
-              next if job.locked_by.start_with?("prefetch:")
-              unless live_workers.include?(job.locked_by)
-                begin
-                  Delayed::Job.transaction do
-                    # double check that the job is still there. locked_by will immediately be reset
-                    # to nil in this transaction by Job#reschedule
-                    next unless Delayed::Job.where(id: job, locked_by: job.locked_by).update_all(locked_by: "abandoned job cleanup") == 1
-                    job.reschedule
-                  end
-                rescue
-                  ::Rails.logger.error "Failure rescheduling abandoned job #{job.id} #{$!.inspect}"
+            loop do
+              batch = Delayed::Job.running_jobs
+                                  .where("locked_at<?", horizon)
+                                  .where.not("locked_by LIKE 'prefetch:%'")
+                                  .where.not(locked_by: live_workers)
+                                  .limit(100)
+                                  .to_a
+              break if batch.empty?
+              batch.each do |job|
+                Delayed::Job.transaction do
+                  # double check that the job is still there. locked_by will immediately be reset
+                  # to nil in this transaction by Job#reschedule
+                  next unless Delayed::Job.where(id: job,
+                                                 locked_by: job.locked_by)
+                                          .update_all(locked_by: "abandoned job cleanup") == 1
+                  job.reschedule
                 end
               end
+            rescue
+              ::Rails.logger.error "Failure rescheduling abandoned job #{job.id} #{$!.inspect}"
             end
           end
         end
-        def attempt_advisory_lock
-          lock_name = "Delayed::Worker::HealthCheck#reschedule_abandoned_jobs"
-          conn = ActiveRecord::Base.connection
-          conn.select_value("SELECT pg_try_advisory_xact_lock(#{conn.quote_table_name('half_md5_as_bigint')}('#{lock_name}'));")
-        end
       end
       attr_accessor :config, :worker_name

data/lib/delayed/worker/null_health_check.rb CHANGED Viewed

@@ -13,7 +13,9 @@ module Delayed
         true
       end
-      def live_workers; []; end
+      def live_workers
+        []
+      end
     end
   end
 end

data/lib/delayed/worker/process_helper.rb CHANGED Viewed

@@ -3,14 +3,13 @@
 module Delayed
   class Worker
     module ProcessHelper
-      STAT_LINUX = 'stat --format=%%Y /proc/$WORKER_PID'
-      STAT_MAC = 'ps -o lstart -p $WORKER_PID'
+      STAT_LINUX = "stat --format=%%Y /proc/$WORKER_PID"
+      STAT_MAC = "ps -o lstart -p $WORKER_PID"
       STAT = RUBY_PLATFORM =~ /darwin/ ? STAT_MAC : STAT_LINUX
       ALIVE_CHECK_LINUX = '[ -d "/proc/$WORKER_PID" ]'
-      ALIVE_CHECK_MAC = 'ps -p $WORKER_PID > /dev/null'
+      ALIVE_CHECK_MAC = "ps -p $WORKER_PID > /dev/null"
       ALIVE_CHECK = RUBY_PLATFORM =~ /darwin/ ? ALIVE_CHECK_MAC : ALIVE_CHECK_LINUX
-      SCRIPT_TEMPLATE = <<-BASH.freeze
+      SCRIPT_TEMPLATE = <<-BASH
         WORKER_PID="%<pid>d" # an example, filled from ruby when the check is created
         ORIGINAL_MTIME="%<mtime>s" # an example, filled from ruby when the check is created
@@ -31,19 +30,19 @@ module Delayed
       def self.mtime(pid)
         if RUBY_PLATFORM =~ /darwin/
-          `ps -o lstart -p #{pid}`.sub(/\n$/, '').presence
+          `ps -o lstart -p #{pid}`.sub(/\n$/, "").presence
         else
           File::Stat.new("/proc/#{pid}").mtime.to_i.to_s rescue nil
         end
       end
       def self.check_script(pid, mtime)
-        sprintf(SCRIPT_TEMPLATE, {pid: pid, mtime: mtime})
+        format(SCRIPT_TEMPLATE, { pid: pid, mtime: mtime })
       end
       def self.process_is_still_running?(pid, mtime)
-        system(self.check_script(pid, mtime))
+        system(check_script(pid, mtime))
       end
     end
   end
-end
+end