RubyGems - inst-jobs - Versions diffs - 2.3.1 → 2.4.8 - Mend

inst-jobs 2.3.1 → 2.4.8

Files changed (94) hide show

checksums.yaml +4 -4
data/db/migrate/20101216224513_create_delayed_jobs.rb +9 -7
data/db/migrate/20110531144916_cleanup_delayed_jobs_indexes.rb +8 -13
data/db/migrate/20110610213249_optimize_delayed_jobs.rb +8 -8
data/db/migrate/20110831210257_add_delayed_jobs_next_in_strand.rb +25 -25
data/db/migrate/20120510004759_delayed_jobs_delete_trigger_lock_for_update.rb +4 -8
data/db/migrate/20120531150712_drop_psql_jobs_pop_fn.rb +1 -3
data/db/migrate/20120607164022_delayed_jobs_use_advisory_locks.rb +11 -15
data/db/migrate/20120607181141_index_jobs_on_locked_by.rb +1 -1
data/db/migrate/20120608191051_add_jobs_run_at_index.rb +2 -2
data/db/migrate/20120927184213_change_delayed_jobs_handler_to_text.rb +1 -1
data/db/migrate/20140505215510_copy_failed_jobs_original_id.rb +2 -3
data/db/migrate/20150807133223_add_max_concurrent_to_jobs.rb +9 -13
data/db/migrate/20151210162949_improve_max_concurrent.rb +4 -8
data/db/migrate/20161206323555_add_back_default_string_limits_jobs.rb +3 -2
data/db/migrate/20181217155351_speed_up_max_concurrent_triggers.rb +13 -17
data/db/migrate/20200330230722_add_id_to_get_delayed_jobs_index.rb +8 -8
data/db/migrate/20200824222232_speed_up_max_concurrent_delete_trigger.rb +72 -77
data/db/migrate/20200825011002_add_strand_order_override.rb +93 -97
data/db/migrate/20210809145804_add_n_strand_index.rb +12 -0
data/db/migrate/20210812210128_add_singleton_column.rb +200 -0
data/db/migrate/20210917232626_add_delete_conflicting_singletons_before_unlock_trigger.rb +27 -0
data/exe/inst_jobs +3 -2
data/lib/delayed/backend/active_record.rb +204 -150
data/lib/delayed/backend/base.rb +107 -77
data/lib/delayed/batch.rb +11 -9
data/lib/delayed/cli.rb +98 -84
data/lib/delayed/core_ext/kernel.rb +4 -2
data/lib/delayed/daemon.rb +70 -74
data/lib/delayed/job_tracking.rb +26 -25
data/lib/delayed/lifecycle.rb +27 -24
data/lib/delayed/log_tailer.rb +17 -17
data/lib/delayed/logging.rb +13 -16
data/lib/delayed/message_sending.rb +43 -52
data/lib/delayed/performable_method.rb +6 -8
data/lib/delayed/periodic.rb +72 -65
data/lib/delayed/plugin.rb +2 -4
data/lib/delayed/pool.rb +198 -192
data/lib/delayed/server/helpers.rb +6 -6
data/lib/delayed/server.rb +51 -54
data/lib/delayed/settings.rb +93 -81
data/lib/delayed/testing.rb +21 -22
data/lib/delayed/version.rb +1 -1
data/lib/delayed/work_queue/in_process.rb +21 -17
data/lib/delayed/work_queue/parent_process/client.rb +55 -53
data/lib/delayed/work_queue/parent_process/server.rb +219 -208
data/lib/delayed/work_queue/parent_process.rb +52 -53
data/lib/delayed/worker/consul_health_check.rb +21 -19
data/lib/delayed/worker/health_check.rb +29 -22
data/lib/delayed/worker/null_health_check.rb +3 -1
data/lib/delayed/worker/process_helper.rb +8 -9
data/lib/delayed/worker.rb +271 -261
data/lib/delayed/yaml_extensions.rb +12 -10
data/lib/delayed_job.rb +37 -38
data/lib/inst-jobs.rb +1 -1
data/spec/active_record_job_spec.rb +129 -136
data/spec/delayed/cli_spec.rb +7 -7
data/spec/delayed/daemon_spec.rb +8 -8
data/spec/delayed/message_sending_spec.rb +16 -9
data/spec/delayed/periodic_spec.rb +13 -12
data/spec/delayed/server_spec.rb +38 -38
data/spec/delayed/settings_spec.rb +26 -25
data/spec/delayed/work_queue/in_process_spec.rb +7 -7
data/spec/delayed/work_queue/parent_process/client_spec.rb +16 -12
data/spec/delayed/work_queue/parent_process/server_spec.rb +43 -40
data/spec/delayed/work_queue/parent_process_spec.rb +21 -21
data/spec/delayed/worker/consul_health_check_spec.rb +22 -22
data/spec/delayed/worker/health_check_spec.rb +60 -52
data/spec/delayed/worker_spec.rb +28 -25
data/spec/sample_jobs.rb +45 -15
data/spec/shared/delayed_batch.rb +74 -67
data/spec/shared/delayed_method.rb +143 -102
data/spec/shared/performable_method.rb +39 -38
data/spec/shared/shared_backend.rb +550 -437
data/spec/shared/testing.rb +14 -14
data/spec/shared/worker.rb +155 -147
data/spec/shared_jobs_specs.rb +13 -13
data/spec/spec_helper.rb +46 -41
metadata +79 -53
data/lib/delayed/backend/redis/bulk_update.lua +0 -50
data/lib/delayed/backend/redis/destroy_job.lua +0 -2
data/lib/delayed/backend/redis/enqueue.lua +0 -29
data/lib/delayed/backend/redis/fail_job.lua +0 -5
data/lib/delayed/backend/redis/find_available.lua +0 -3
data/lib/delayed/backend/redis/functions.rb +0 -59
data/lib/delayed/backend/redis/get_and_lock_next_available.lua +0 -17
data/lib/delayed/backend/redis/includes/jobs_common.lua +0 -203
data/lib/delayed/backend/redis/job.rb +0 -528
data/lib/delayed/backend/redis/set_running.lua +0 -5
data/lib/delayed/backend/redis/tickle_strand.lua +0 -2
data/spec/gemfiles/52.gemfile +0 -7
data/spec/gemfiles/60.gemfile +0 -7
data/spec/gemfiles/61.gemfile +0 -7
data/spec/redis_job_spec.rb +0 -148

data/lib/delayed/work_queue/parent_process/server.rb CHANGED Viewed

@@ -1,243 +1,254 @@
 # frozen_string_literal: true
 module Delayed
-module WorkQueue
-class ParentProcess
-  class Server
-    attr_reader :clients, :listen_socket
-    include Delayed::Logging
-    SIGNALS = %i{INT TERM QUIT}
-    def initialize(listen_socket, parent_pid: nil, config: Settings.parent_process)
-      @listen_socket = listen_socket
-      @parent_pid = parent_pid
-      @clients = {}
-      @waiting_clients = {}
-      @prefetched_jobs = {}
-      @config = config
-      @client_timeout = config['server_socket_timeout'] || 10.0 # left for backwards compat
-      @exit = false
-      @self_pipe = IO.pipe
-    end
+  module WorkQueue
+    class ParentProcess
+      class Server
+        attr_reader :clients, :listen_socket
+        include Delayed::Logging
+        SIGNALS = %i[INT TERM QUIT].freeze
+        def initialize(listen_socket, parent_pid: nil, config: Settings.parent_process)
+          @listen_socket = listen_socket
+          @parent_pid = parent_pid
+          @clients = {}
+          @waiting_clients = {}
+          @prefetched_jobs = {}
+          @config = config
+          @client_timeout = config["server_socket_timeout"] || 10.0 # left for backwards compat
+          @exit = false
+          @self_pipe = IO.pipe
+        end
-    def connected_clients
-      @clients.size
-    end
+        def connected_clients
+          @clients.size
+        end
-    def all_workers_idle?
-      !@clients.any? { |_, c| c.working }
-    end
+        def all_workers_idle?
+          @clients.none? { |_, c| c.working }
+        end
-    # run the server queue worker
-    # this method does not return, only exits or raises an exception
-    def run
-      logger.debug "Starting work queue process"
+        # run the server queue worker
+        # this method does not return, only exits or raises an exception
+        def run
+          logger.debug "Starting work queue process"
+          SIGNALS.each do |sig|
+            # We're not doing any aggressive exiting here since we really want
+            # prefetched jobs to be unlocked and we're going to wake up the process
+            # from the IO.select we're using to wait on clients.
+            trap(sig) do
+              @exit = true
+              @self_pipe[1].write_nonblock(".", exception: false)
+            end
+          end
-      SIGNALS.each do |sig|
-        # We're not doing any aggressive exiting here since we really want
-        # prefetched jobs to be unlocked and we're going to wake up the process
-        # from the IO.select we're using to wait on clients.
-        trap(sig) { @exit = true; @self_pipe[1].write_nonblock('.', exception: false) }
-      end
+          last_orphaned_prefetched_jobs_purge = Job.db_time_now - rand(15 * 60)
+          until exit?
+            run_once
+            if last_orphaned_prefetched_jobs_purge + (15 * 60) < Job.db_time_now
+              Job.unlock_orphaned_prefetched_jobs
+              last_orphaned_prefetched_jobs_purge = Job.db_time_now
+            end
+          end
+        rescue => e
+          logger.error "WorkQueue Server died: #{e.inspect}"
+          raise
+        ensure
+          unlock_all_prefetched_jobs
+        end
-      last_orphaned_prefetched_jobs_purge = Job.db_time_now - rand(15 * 60)
-      while !exit?
-        run_once
-        if last_orphaned_prefetched_jobs_purge + 15 * 60 < Job.db_time_now
-          Job.unlock_orphaned_prefetched_jobs
-          last_orphaned_prefetched_jobs_purge = Job.db_time_now
+        def run_once
+          handles = @clients.keys + [@listen_socket, @self_pipe[0]]
+          # if we're currently idle, then force a "latency" to job fetching - don't
+          # fetch recently queued jobs, allowing busier workers to fetch them first.
+          # if they're not keeping up, the jobs will slip back in time, and suddenly we'll become
+          # active and quickly pick up all the jobs we can. The latency is calculated to ensure that
+          # an active worker is guaranteed to have attempted to fetch new jobs in the meantime
+          forced_latency = Settings.sleep_delay + (Settings.sleep_delay_stagger * 2) if all_workers_idle?
+          timeout = Settings.sleep_delay + (rand * Settings.sleep_delay_stagger)
+          readable, = IO.select(handles, nil, nil, timeout)
+          readable&.each { |s| handle_read(s) }
+          Delayed::Worker.lifecycle.run_callbacks(:check_for_work, self) do
+            check_for_work(forced_latency: forced_latency)
+          end
+          unlock_timed_out_prefetched_jobs
         end
-      end
-    rescue => e
-      logger.error "WorkQueue Server died: #{e.inspect}"
-      raise
-    ensure
-      unlock_all_prefetched_jobs
-    end
+        def handle_read(socket)
+          if socket == @listen_socket
+            handle_accept
+          elsif socket == @self_pipe[0]
+            # We really don't care about the contents of the pipe, we just need to
+            # wake up.
+            @self_pipe[0].read_nonblock(11, exception: false)
+          else
+            handle_request(socket)
+          end
+        end
-    def run_once
-      handles = @clients.keys + [@listen_socket, @self_pipe[0]]
-      # if we're currently idle, then force a "latency" to job fetching - don't
-      # fetch recently queued jobs, allowing busier workers to fetch them first.
-      # if they're not keeping up, the jobs will slip back in time, and suddenly we'll become
-      # active and quickly pick up all the jobs we can. The latency is calculated to ensure that
-      # an active worker is guaranteed to have attempted to fetch new jobs in the meantime
-      forced_latency = Settings.sleep_delay + Settings.sleep_delay_stagger * 2 if all_workers_idle?
-      timeout = Settings.sleep_delay + (rand * Settings.sleep_delay_stagger)
-      readable, _, _ = IO.select(handles, nil, nil, timeout)
-      if readable
-        readable.each { |s| handle_read(s) }
-      end
-      Delayed::Worker.lifecycle.run_callbacks(:check_for_work, self) do
-        check_for_work(forced_latency: forced_latency)
-      end
-      unlock_timed_out_prefetched_jobs
-    end
+        # Any error on the listen socket other than WaitReadable will bubble up
+        # and terminate the work queue process, to be restarted by the parent daemon.
+        def handle_accept
+          socket, _addr = @listen_socket.accept_nonblock
+          @clients[socket] = ClientState.new(false, socket) if socket
+        rescue IO::WaitReadable
+          logger.error("Server attempted to read listen_socket but failed with IO::WaitReadable")
+          # ignore and just try accepting again next time through the loop
+        end
-    def handle_read(socket)
-      if socket == @listen_socket
-        handle_accept
-      elsif socket == @self_pipe[0]
-        # We really don't care about the contents of the pipe, we just need to
-        # wake up.
-        @self_pipe[0].read_nonblock(11, exception: false)
-      else
-        handle_request(socket)
-      end
-    end
+        def handle_request(socket)
+          # There is an assumption here that the client will never send a partial
+          # request and then leave the socket open. Doing so would leave us hanging
+          # in Marshal.load forever. This is only a reasonable assumption because we
+          # control the client.
+          client = @clients[socket]
+          if socket.eof?
+            logger.debug("Client #{client.name} closed connection")
+            return drop_socket(socket)
+          end
+          worker_name, worker_config = Marshal.load(socket)
+          client.name = worker_name
+          client.working = false
+          (@waiting_clients[worker_config] ||= []) << client
+        rescue SystemCallError, IOError => e
+          logger.error("Receiving message from client (#{socket}) failed: #{e.inspect}")
+          drop_socket(socket)
+        end
-    # Any error on the listen socket other than WaitReadable will bubble up
-    # and terminate the work queue process, to be restarted by the parent daemon.
-    def handle_accept
-      socket, _addr = @listen_socket.accept_nonblock
-      if socket
-        @clients[socket] = ClientState.new(false, socket)
-      end
-    rescue IO::WaitReadable
-      logger.error("Server attempted to read listen_socket but failed with IO::WaitReadable")
-      # ignore and just try accepting again next time through the loop
-    end
+        def check_for_work(forced_latency: nil)
+          @waiting_clients.each do |(worker_config, workers)|
+            prefetched_jobs = @prefetched_jobs[worker_config] ||= []
+            logger.debug("I have #{prefetched_jobs.length} jobs for #{workers.length} waiting workers")
+            while !prefetched_jobs.empty? && !workers.empty?
+              job = prefetched_jobs.shift
+              client = workers.shift
+              # couldn't re-lock it for some reason
+              logger.debug("Transferring prefetched job to #{client.name}")
+              unless job.transfer_lock!(from: prefetch_owner, to: client.name)
+                workers.unshift(client)
+                next
+              end
+              client.working = true
+              begin
+                logger.debug("Sending prefetched job #{job.id} to #{client.name}")
+                client_timeout { Marshal.dump(job, client.socket) }
+              rescue SystemCallError, IOError, Timeout::Error => e
+                logger.error("Failed to send pre-fetched job to #{client.name}: #{e.inspect}")
+                drop_socket(client.socket)
+                Delayed::Job.unlock([job])
+              end
+            end
-    def handle_request(socket)
-      # There is an assumption here that the client will never send a partial
-      # request and then leave the socket open. Doing so would leave us hanging
-      # in Marshal.load forever. This is only a reasonable assumption because we
-      # control the client.
-      client = @clients[socket]
-      if socket.eof?
-        logger.debug("Client #{client.name} closed connection")
-        return drop_socket(socket)
-      end
-      worker_name, worker_config = Marshal.load(socket)
-      client.name = worker_name
-      client.working = false
-      (@waiting_clients[worker_config] ||= []) << client
-    rescue SystemCallError, IOError => ex
-      logger.error("Receiving message from client (#{socket}) failed: #{ex.inspect}")
-      drop_socket(socket)
-    end
+            next if workers.empty?
+            logger.debug("Fetching new work for #{workers.length} workers")
+            jobs_to_send = []
+            Delayed::Worker.lifecycle.run_callbacks(:work_queue_pop, self, worker_config) do
+              recipients = workers.map(&:name)
+              response = Delayed::Job.get_and_lock_next_available(
+                recipients,
+                worker_config[:queue],
+                worker_config[:min_priority],
+                worker_config[:max_priority],
+                prefetch: (Settings.fetch_batch_size * (worker_config[:workers] || 1)) - recipients.length,
+                prefetch_owner: prefetch_owner,
+                forced_latency: forced_latency
+              )
+              logger.debug(
+                "Fetched and locked #{response.values.flatten.size} new jobs for workers (#{response.keys.join(', ')})."
+              )
+              response.each do |(worker_name, locked_jobs)|
+                if worker_name == prefetch_owner
+                  # it's actually an array of all the extra jobs
+                  logger.debug(
+                    "Adding prefetched jobs #{locked_jobs.length} to prefetched array (size: #{prefetched_jobs.count})"
+                  )
+                  prefetched_jobs.concat(locked_jobs)
+                  next
+                end
+                client = workers.find { |worker| worker.name == worker_name }
+                client.working = true
+                jobs_to_send << [client, locked_jobs]
+              end
+            end
-    def check_for_work(forced_latency: nil)
-      @waiting_clients.each do |(worker_config, workers)|
-        prefetched_jobs = @prefetched_jobs[worker_config] ||= []
-        logger.debug("I have #{prefetched_jobs.length} jobs for #{workers.length} waiting workers")
-        while !prefetched_jobs.empty? && !workers.empty?
-          job = prefetched_jobs.shift
-          client = workers.shift
-          # couldn't re-lock it for some reason
-          logger.debug("Transferring prefetched job to #{client.name}")
-          unless job.transfer_lock!(from: prefetch_owner, to: client.name)
-            workers.unshift(client)
-            next
+            jobs_to_send.each do |(recipient, job_to_send)|
+              @waiting_clients[worker_config].delete(client)
+              begin
+                logger.debug("Sending job #{job_to_send.id} to #{recipient.name}")
+                client_timeout { Marshal.dump(job_to_send, recipient.socket) }
+              rescue SystemCallError, IOError, Timeout::Error => e
+                logger.error("Failed to send job to #{recipient.name}: #{e.inspect}")
+                drop_socket(recipient.socket)
+                Delayed::Job.unlock([job_to_send])
+              end
+            end
           end
-          client.working = true
-          begin
-            logger.debug("Sending prefetched job #{job.id} to #{client.name}")
-            client_timeout { Marshal.dump(job, client.socket) }
-          rescue SystemCallError, IOError, Timeout::Error => ex
-            logger.error("Failed to send pre-fetched job to #{client.name}: #{ex.inspect}")
-            drop_socket(client.socket)
-            Delayed::Job.unlock([job])
+        end
+        def unlock_timed_out_prefetched_jobs
+          @prefetched_jobs.each do |(worker_config, jobs)|
+            next if jobs.empty?
+            next unless jobs.first.locked_at < Time.now.utc - Settings.parent_process[:prefetched_jobs_timeout]
+            Delayed::Job.transaction do
+              Delayed::Job.advisory_lock(Delayed::Job.prefetch_jobs_lock_name)
+              Delayed::Job.unlock(jobs)
+            end
+            @prefetched_jobs[worker_config] = []
           end
         end
-        next if workers.empty?
-        logger.debug("Fetching new work for #{workers.length} workers")
-        jobs_to_send = []
-        Delayed::Worker.lifecycle.run_callbacks(:work_queue_pop, self, worker_config) do
-          recipients = workers.map(&:name)
-          response = Delayed::Job.get_and_lock_next_available(
-              recipients,
-              worker_config[:queue],
-              worker_config[:min_priority],
-              worker_config[:max_priority],
-              prefetch: Settings.fetch_batch_size * (worker_config[:workers] || 1) - recipients.length,
-              prefetch_owner: prefetch_owner,
-              forced_latency: forced_latency)
-          logger.debug("Fetched and locked #{response.values.flatten.size} new jobs for workers (#{response.keys.join(', ')}).")
-          response.each do |(worker_name, job)|
-            if worker_name == prefetch_owner
-              # it's actually an array of all the extra jobs
-              logger.debug("Adding prefetched jobs #{job.length} to prefetched array (size: #{prefetched_jobs.count})")
-              prefetched_jobs.concat(job)
-              next
+        def unlock_all_prefetched_jobs
+          @prefetched_jobs.each do |(_worker_config, jobs)|
+            next if jobs.empty?
+            Delayed::Job.transaction do
+              Delayed::Job.advisory_lock(Delayed::Job.prefetch_jobs_lock_name)
+              Delayed::Job.unlock(jobs)
             end
-            client = workers.find { |worker| worker.name == worker_name }
-            client.working = true
-            jobs_to_send << [client, job]
           end
+          @prefetched_jobs = {}
         end
-        jobs_to_send.each do |(client, job)|
-          @waiting_clients[worker_config].delete(client)
+        def drop_socket(socket)
+          # this socket went away
           begin
-            logger.debug("Sending job #{job.id} to #{client.name}")
-            client_timeout { Marshal.dump(job, client.socket) }
-          rescue SystemCallError, IOError, Timeout::Error => ex
-            logger.error("Failed to send job to #{client.name}: #{ex.inspect}")
-            drop_socket(client.socket)
-            Delayed::Job.unlock([job])
+            socket.close
+          rescue IOError
+            nil
+          end
+          client = @clients[socket]
+          @clients.delete(socket)
+          @waiting_clients.each do |(_config, workers)|
+            workers.delete(client)
           end
         end
-      end
-    end
-    def unlock_timed_out_prefetched_jobs
-      @prefetched_jobs.each do |(worker_config, jobs)|
-        next if jobs.empty?
-        if jobs.first.locked_at < Time.now.utc - Settings.parent_process[:prefetched_jobs_timeout]
-          Delayed::Job.unlock(jobs)
-          @prefetched_jobs[worker_config] = []
+        def exit?
+          !!@exit || parent_exited?
         end
-      end
-    end
-    def unlock_all_prefetched_jobs
-      @prefetched_jobs.each do |(_worker_config, jobs)|
-        next if jobs.empty?
-        Delayed::Job.unlock(jobs)
-      end
-      @prefetched_jobs = {}
-    end
-    def drop_socket(socket)
-      # this socket went away
-      begin
-        socket.close
-      rescue IOError
-      end
-      client = @clients[socket]
-      @clients.delete(socket)
-      @waiting_clients.each do |(_config, workers)|
-        workers.delete(client)
-      end
-    end
-    def exit?
-      !!@exit || parent_exited?
-    end
+        def prefetch_owner
+          "prefetch:#{Socket.gethostname rescue 'X'}"
+        end
-    def prefetch_owner
-      "prefetch:#{Socket.gethostname rescue 'X'}"
-    end
+        def parent_exited?
+          @parent_pid && @parent_pid != Process.ppid
+        end
-    def parent_exited?
-      @parent_pid && @parent_pid != Process.ppid
-    end
+        def client_timeout(&block)
+          Timeout.timeout(@client_timeout, &block)
+        end
-    def client_timeout
-      Timeout.timeout(@client_timeout) { yield }
+        ClientState = Struct.new(:working, :socket, :name)
+      end
     end
-    ClientState = Struct.new(:working, :socket, :name)
   end
 end
-end
-end

data/lib/delayed/work_queue/parent_process.rb CHANGED Viewed

@@ -1,69 +1,68 @@
 # frozen_string_literal: true
-require 'pathname'
-require 'socket'
-require 'timeout'
+require "pathname"
+require "socket"
+require "timeout"
-require_relative 'parent_process/client'
-require_relative 'parent_process/server'
+require_relative "parent_process/client"
+require_relative "parent_process/server"
 module Delayed
-module WorkQueue
-# ParentProcess is a WorkQueue implementation that spawns a separate worker
-# process for querying the queue. Each Worker child process sends requests to
-# the ParentProcess via IPC, and receives responses. This centralized queue
-# querying cuts down on db queries and lock contention, and allows the
-# possibility for other centralized logic such as notifications when all workers
-# are idle.
-#
-# The IPC implementation uses Unix stream sockets and Ruby's built-in Marshal
-# functionality. The ParentProcess creates a Unix socket on the filesystem in
-# the tmp directory, so that if a worker process dies and is restarted it can
-# reconnect to the socket.
-#
-# While Unix and IP sockets are API compatible, we take a lot of shortcuts
-# because we know it's just a local Unix socket. If we ever wanted to swap this
-# out for a TCP/IP socket and have the WorkQueue running on another host, we'd
-# want to be a lot more robust about partial reads/writes and timeouts.
-class ParentProcess
-  class ProtocolError < RuntimeError
-  end
+  module WorkQueue
+    # ParentProcess is a WorkQueue implementation that spawns a separate worker
+    # process for querying the queue. Each Worker child process sends requests to
+    # the ParentProcess via IPC, and receives responses. This centralized queue
+    # querying cuts down on db queries and lock contention, and allows the
+    # possibility for other centralized logic such as notifications when all workers
+    # are idle.
+    #
+    # The IPC implementation uses Unix stream sockets and Ruby's built-in Marshal
+    # functionality. The ParentProcess creates a Unix socket on the filesystem in
+    # the tmp directory, so that if a worker process dies and is restarted it can
+    # reconnect to the socket.
+    #
+    # While Unix and IP sockets are API compatible, we take a lot of shortcuts
+    # because we know it's just a local Unix socket. If we ever wanted to swap this
+    # out for a TCP/IP socket and have the WorkQueue running on another host, we'd
+    # want to be a lot more robust about partial reads/writes and timeouts.
+    class ParentProcess
+      class ProtocolError < RuntimeError
+      end
-  attr_reader :server_address
+      attr_reader :server_address
-  DEFAULT_SOCKET_NAME = 'inst-jobs.sock'.freeze
-  private_constant :DEFAULT_SOCKET_NAME
+      DEFAULT_SOCKET_NAME = "inst-jobs.sock"
+      private_constant :DEFAULT_SOCKET_NAME
-  def initialize(config = Settings.parent_process)
-    @config = config
-    @server_address = generate_socket_path(config['server_address'])
-  end
+      def initialize(config = Settings.parent_process)
+        @config = config
+        @server_address = generate_socket_path(config["server_address"])
+      end
-  def server(parent_pid: nil)
-    # The unix_server_socket method takes care of cleaning up any existing
-    # socket for us if the work queue process dies and is restarted.
-    listen_socket = Socket.unix_server_socket(@server_address)
-    Server.new(listen_socket, parent_pid: parent_pid, config: @config)
-  end
+      def server(parent_pid: nil)
+        # The unix_server_socket method takes care of cleaning up any existing
+        # socket for us if the work queue process dies and is restarted.
+        listen_socket = Socket.unix_server_socket(@server_address)
+        Server.new(listen_socket, parent_pid: parent_pid, config: @config)
+      end
-  def client
-    Client.new(Addrinfo.unix(@server_address), config: @config)
-  end
+      def client
+        Client.new(Addrinfo.unix(@server_address), config: @config)
+      end
-  private
+      private
-  def generate_socket_path(supplied_path)
-    pathname = Pathname.new(supplied_path)
+      def generate_socket_path(supplied_path)
+        pathname = Pathname.new(supplied_path)
-    if pathname.absolute? && pathname.directory?
-      pathname.join(DEFAULT_SOCKET_NAME).to_s
-    elsif pathname.absolute?
-      supplied_path
-    else
-      generate_socket_path(Settings.expand_rails_path(supplied_path))
+        if pathname.absolute? && pathname.directory?
+          pathname.join(DEFAULT_SOCKET_NAME).to_s
+        elsif pathname.absolute?
+          supplied_path
+        else
+          generate_socket_path(Settings.expand_rails_path(supplied_path))
+        end
+      end
     end
   end
 end
-end
-end