RubyGems - hekenga - Versions diffs - 0.2.13 → 1.0.1 - Mend

hekenga 0.2.13 → 1.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (25) hide show

checksums.yaml +4 -4
data/.gitignore +2 -0
data/CHANGELOG.md +33 -0
data/docker-compose.yml +30 -0
data/exe/hekenga +25 -38
data/hekenga.gemspec +5 -4
data/lib/hekenga/context.rb +7 -6
data/lib/hekenga/document_task.rb +9 -3
data/lib/hekenga/document_task_executor.rb +264 -0
data/lib/hekenga/document_task_record.rb +29 -0
data/lib/hekenga/dsl/document_task.rb +28 -1
data/lib/hekenga/dsl/migration.rb +3 -0
data/lib/hekenga/failure/write.rb +1 -0
data/lib/hekenga/iterator.rb +26 -0
data/lib/hekenga/log.rb +14 -19
data/lib/hekenga/master_process.rb +184 -105
data/lib/hekenga/migration.rb +70 -330
data/lib/hekenga/parallel_job.rb +11 -4
data/lib/hekenga/parallel_task.rb +110 -0
data/lib/hekenga/scaffold.rb +26 -21
data/lib/hekenga/task_failed_error.rb +4 -0
data/lib/hekenga/task_splitter.rb +30 -0
data/lib/hekenga/version.rb +1 -1
data/lib/hekenga.rb +22 -10
metadata +22 -13

data/lib/hekenga/migration.rb CHANGED Viewed

@@ -1,12 +1,15 @@
 require 'hekenga/invalid'
 require 'hekenga/context'
 require 'hekenga/parallel_job'
+require 'hekenga/parallel_task'
 require 'hekenga/master_process'
+require 'hekenga/document_task_record'
+require 'hekenga/document_task_executor'
 require 'hekenga/log'
 module Hekenga
   class Migration
-    attr_accessor :stamp, :description, :batch_size
-    attr_reader :tasks
+    attr_accessor :stamp, :description, :batch_size, :active_idx
+    attr_reader :tasks, :session, :test_mode
     def initialize
       @tasks      = []
@@ -50,15 +53,19 @@ module Hekenga
     def reload_logs
       @logs = {}
     end
     def performing?
       Hekenga::Log.where(pkey: self.to_key, done: false).any?
     end
     def performed?
       !!log(self.tasks.length - 1).done
     end
     def test_mode!
       @test_mode = true
     end
     def perform!
       if Hekenga.status(self) == :naught
         Hekenga::MasterProcess.new(self).run!
@@ -67,322 +74,102 @@ module Hekenga
         return false
       end
     end
-    def perform_task!(task_idx = 0, scope = nil)
+    def perform_task!(task_idx)
       task         = @tasks[task_idx] or return
       @active_idx  = task_idx
       case task
       when Hekenga::SimpleTask
         start_simple_task(task)
       when Hekenga::DocumentTask
-        # TODO - online migration support (have log.total update, requeue)
-        scope ||= task.scope.asc(:_id)
         if task.parallel
-          start_parallel_task(task, task_idx, scope)
-        else
-          start_document_task(task, task_idx, scope)
-        end
-      end
-    end
-    def recover!
-      # NOTE - can't find a way to check this automatically with ActiveJob right now
-      return false unless prompt "Check that the migration queue has processed before recovering. Continue?"
-      # Write failures
-      @tasks.each.with_index do |task, idx|
-        # If no log, run the task now
-        unless Hekenga::Log.where(pkey: self.to_key, task_idx: idx).any?
-          return false unless retry_task!(task, idx)
-          next
-        end
-        # Did this task fail?
-        failedP = log(idx).cancel || Hekenga::Failure.where(pkey: to_key, task_idx: idx).any?
-        # If it didn't, keep searching
-        next unless failedP
-        # This is the first failure we've detected - recover from it
-        case task
-        when Hekenga::DocumentTask
-          ret = recover_document_task!(task, idx)
-        when Hekenga::SimpleTask
-          ret = recover_simple!(task, idx)
-        end
-        case ret
-        when :next
-          next
-        when :cancel
-          return false
+          start_parallel_task(task, task_idx)
         else
-          return false unless retry_task!(task, idx, ret)
+          start_document_task(task, task_idx)
         end
       end
-      return true
     end
-    def retry_task!(task, idx, scope = nil)
-      Hekenga.log "Retrying task##{idx}"
-      unless Hekenga::MasterProcess.new(self).retry!(idx, scope)
-        Hekenga.log "Failed to retry the task. Aborting.."
-        return false
-      end
-      return true
-    end
-    def recover_simple!(task, idx)
-      # Simple tasks just get retried - no fuss
-      Hekenga.log("Found failed simple task. Retrying..")
-      return
-    end
-    def recover_document_task!(task, idx)
-      # Document tasks are a bit more involved.
-      validation_failures = Hekenga::Failure::Validation.where(pkey: to_key, task_idx: idx)
-      write_failures      = Hekenga::Failure::Write.where(pkey: to_key, task_idx: idx)
-      error_failures      = Hekenga::Failure::Error.where(pkey: to_key, task_idx: idx)
-      cancelled_failures  = Hekenga::Failure::Cancelled.where(pkey: to_key, task_idx: idx)
-      # Stats
-      validation_failure_ctr = validation_failures.count
-      write_failure_ctr      = write_failures.count
-      error_failure_ctr      = error_failures.count
-      cancelled_failure_ctr  = cancelled_failures.count
-      # Prompt for recovery
-      recoverP = prompt(
-        "Found #{validation_failure_ctr} invalid, "+
-        "#{write_failure_ctr} failed writes, "+
-        "#{error_failure_ctr} errors, "+
-        "#{cancelled_failure_ctr} cancelled on migration. Recover?"
-      )
-      return :next unless recoverP
-      # Recover from critical write failures (DB records potentially lost)
-      unless write_failure_ctr.zero?
-        Hekenga.log "Recovering old data from #{write_failure_ctr} write failure(s)"
-        recover_data(write_failures, task.scope.klass)
-      end
-      # Resume task from point of error
-      if task.parallel
-        # TODO - support for recovery on huge # IDs
-        failed_ids = [
-          write_failures.pluck(:document_ids),
-          error_failures.pluck(:batch_start),
-          cancelled_failures.pluck(:document_ids),
-          validation_failures.pluck(:doc_id)
-        ].flatten.compact
-        resume_scope = task.scope.klass.asc(:_id).in(_id: failed_ids)
-      else
-        first_id     = error_failures.first&.batch_start || write_failures.first&.batch_start
-        invalid_ids  = validation_failures.pluck(:doc_id)
-        if first_id && invalid_ids.any?
-          resume_scope = task.scope.klass.asc(:_id).and(
-            task.scope.selector,
-            task.scope.klass.or(
-              {_id: {:$gte => first_id}},
-              {_id: {:$in  => invalid_ids}}
-            ).selector
-          )
-        elsif first_id
-          resume_scope = task.scope.asc(:_id).gte(_id: first_id)
-        elsif invalid_ids.any?
-          resume_scope = task.scope.klass.asc(:_id).in(_id: invalid_ids)
-        else
-          resume_scope = :next
-        end
-      end
-      return resume_scope
-    end
-    def recover_data(write_failures, klass)
-      write_failures.each do |write_failure|
-        failed_ids = write_failure.document_ids
-        extant     = klass.in(_id: failed_ids).pluck(:_id)
-        to_recover = (failed_ids - extant)
-        docs       = write_failure.documents.find_all {|x| to_recover.include?(x["_id"])}
-        next if docs.empty?
-        Hekenga.log "Recovering #{docs.length} documents.."
-        klass.collection.insert_many(docs)
-      end
-    end
-    def prompt(str)
-      loop do
-        print "#{str} (Y/N):\n"
-        case gets.chomp.downcase
-        when "y"
-          return true
-        when "n"
-          return false
-        end
-      end
-    end
-    def rollback!
-      # TODO
+    def recover!
+      Hekenga::MasterProcess.new(self).recover!
     end
     # Internal perform methods
     def start_simple_task(task)
       create_log!
       begin
-        with_setup do
-          task.up!(@context)
-        end
+        @context = Hekenga::Context.new(test_mode: test_mode)
+        task.up!(@context)
       rescue => e
         simple_failure!(e)
         return
+      ensure
+        @context = nil
       end
       log_done!
     end
-    def check_for_completion
-      if log.processed == log.total
-        log_done!
-      end
-    end
     def log_done!
-      log.set(done: true, finished: Time.now)
+      log.set_without_session({done: true, finished: Time.now})
     end
-    def start_parallel_task(task, task_idx, scope)
-      # TODO - support for crazy numbers of documents where pluck is too big
-      scope.asc(:_id).pluck(:_id).tap do |all_ids|
-        create_log!(total: all_ids.length)
-      end.each_slice(batch_size).each do |ids|
-        Hekenga::ParallelJob.perform_later(
-          self.to_key, task_idx, ids.map(&:to_s), !!@test_mode
-        )
-      end
-      check_for_completion # if 0 items to migrate
-    end
-    def run_parallel_task(task_idx, ids)
-      @active_idx = task_idx
-      if log(task_idx).cancel
-        failed_cancelled!(ids)
-        return
-      end
-      task = self.tasks[task_idx] or return
-      with_setup(task) do
-        process_batch(task, task.scope.klass.asc(:_id).in(_id: ids).to_a)
-        unless @skipped.empty?
-          failed_cancelled!(@skipped.map(&:_id))
-        end
-      end
+    def start_parallel_task(task, task_idx)
+      create_log!
+      Hekenga::ParallelTask.new(
+        migration: self,
+        task:      task,
+        task_idx:  task_idx,
+        test_mode: test_mode
+      ).start!
     end
-    def with_setup(task = nil)
-      @context = Hekenga::Context.new(@test_mode)
-      task&.setups&.each do |block|
-        @context.instance_exec(&block)
-      end
-      begin
-        yield
-      ensure
-        @context = nil
-      end
+    def task_records(task_idx)
+      Hekenga::DocumentTaskRecord.where(migration_key: to_key, task_idx: task_idx)
     end
-    def start_document_task(task, task_idx, scope)
-      create_log!(total: scope.count)
+    def start_document_task(task, task_idx, recover: false)
+      create_log!
       records = []
-      with_setup(task) do
-        scope.asc(:_id).no_timeout.each do |record|
-          records.push(record)
-          if records.length == batch_size
-            process_batch(task, records)
-            return if log.cancel
-            records = []
-          end
-        end
-        process_batch(task, records) if records.any?
-      end
+      task_records(task_idx).delete_all unless recover
+      executor_key = BSON::ObjectId.new
+      task.scope.asc(:_id).no_timeout.each do |record|
+        records.push(record)
+        next unless records.length == (task.batch_size || batch_size)
+        records = filter_out_processed(task, task_idx, records) if recover
+        next unless records.length == (task.batch_size || batch_size)
+        execute_document_task(task_idx, executor_key, records)
+        records = []
+        return if log.cancel
+      end
+      records = filter_out_processed(task, task_idx, records) if recover
+      execute_document_task(task_idx, executor_key, records) if records.any?
+      return if log.cancel
       log_done!
     end
-    def run_filters(task, record)
-      task.filters.all? do |block|
-        @context.instance_exec(record, &block)
-      end
-    end
-    def deep_clone(record)
-      record.as_document.deep_dup
-    end
-    def process_batch(task, records)
-      @skipped   = []
-      to_persist = []
-      fallbacks  = []
-      filtered = records.group_by do |record|
-        run_filters(task, record)
+    def filter_out_processed(task, task_idx, records)
+      return records if records.empty?
+      selector = task_records(task_idx).in(ids: records.map(&:id))
+      processed_ids = selector.pluck(:ids).flatten.to_set
+      records.reject do |record|
+        processed_ids.include?(record._id)
       end
-      log_skipped(task, filtered[false]) if filtered[false]
-      return unless filtered[true]
-      filtered[true].map.with_index do |record, idx|
-        original_record = deep_clone(record)
-        begin
-          task.up!(@context, record)
-        rescue => e
-          failed_apply!(e, record, records[0].id)
-          @skipped = filtered[true][idx+1..-1]
-          return
-        end
-        if validate_record(task, record)
-          to_persist.push(record)
-          fallbacks.push(original_record)
-        else
-          if log.cancel
-            @skipped = filtered[true][idx+1..-1]
-            return
-          end
-        end
-      end.compact
-      persist_batch(task, to_persist, fallbacks)
-    end
-    def log_skipped(task, records)
-      log.incr_and_return(
-        skipped:   records.length,
-        processed: records.length
-      )
-      check_for_completion
     end
-    def log_success(task, records)
-      log.incr_and_return(
-        processed: records.length
+    def execute_document_task(task_idx, executor_key, records)
+      task_record = Hekenga::DocumentTaskRecord.create(
+        migration_key: to_key,
+        task_idx: task_idx,
+        executor_key: executor_key,
+        test_mode: test_mode,
+        ids: records.map(&:id)
       )
-      check_for_completion
+      Hekenga::DocumentTaskExecutor.new(task_record, records: records).run!
     end
-    def persist_batch(task, records, original_records)
-      if @test_mode
-        log_success(task, records)
-        return
-      end
-      # NOTE - edgecase where callbacks cause the record to become invalid is
-      # not covered
-      records.each do |record|
-        begin
-          next if task.skip_prepare
-          if task.timeless
-            record.timeless.send(:prepare_update) {}
-          else
-            record.send(:prepare_update) {}
-          end
-        rescue => e
-          # If prepare_update throws an error, we're in trouble - crash out now
-          failed_apply!(e, record, records[0].id)
-          return
-        end
-      end
-      begin
-        delete_records!(task.scope.klass, records.map(&:_id))
-        write_records!(task.scope.klass, records)
-        log_success(task, records)
-      rescue => e
-        failed_write!(e, original_records)
-      end
-    end
-    def delete_records!(klass, ids)
-      klass.in(_id: ids).delete_all
-    end
-    def write_records!(klass, records)
-      klass.collection.insert_many(records.map(&:as_document))
-    end
     def simple_failure!(error)
       log.add_failure({
         message:   error.to_s,
@@ -391,57 +178,10 @@ module Hekenga
       }, Hekenga::Failure::Error)
       log_cancel!
     end
-    def failed_cancelled!(ids)
-      log.add_failure({
-        document_ids: ids,
-        batch_start: ids[0]
-      }, Hekenga::Failure::Cancelled)
-    end
-    def failed_apply!(error, record, batch_start_id)
-      log.add_failure({
-        message:     error.to_s,
-        backtrace:   error.backtrace,
-        document:    deep_clone(record),
-        batch_start: batch_start_id
-      }, Hekenga::Failure::Error)
-      log_cancel!
-    end
     def log_cancel!
-      log.set(cancel: true, error: true, done: true, finished: Time.now)
-    end
-    def failed_write!(error, original_records)
-      log.add_failure({
-        message:      error.to_s,
-        backtrace:    error.backtrace,
-        documents:    original_records,
-        document_ids: original_records.map {|x| x["_id"]},
-        batch_start:  original_records[0]["_id"]
-      }, Hekenga::Failure::Write)
-      log_cancel!
-    end
-    def failed_validation!(task, record)
-      log.add_failure({
-        doc_id:   record.id,
-        errs:     record.errors.full_messages,
-        document: deep_clone(record),
-      }, Hekenga::Failure::Validation)
-      log.set(error: true)
-      log.incr_and_return(processed: 1, unvalid: 1)
-      if task.invalid_strategy == :cancel
-        log_cancel!
-      else
-        check_for_completion
-      end
-    end
-    def validate_record(task, record)
-      # TODO - ability to skip validation
-      # TODO - handle errors on validation
-      if record.valid?
-        true
-      else
-        failed_validation!(task, record)
-        false
-      end
+      # Bypass the active transaction if there is one
+      log.set_without_session({cancel: true, error: true, done: true, finished: Time.now})
     end
     # Validations

data/lib/hekenga/parallel_job.rb CHANGED Viewed

@@ -4,10 +4,17 @@ module Hekenga
     queue_as do
       ENV["HEKENGA_QUEUE"] || :migration
     end
-    def perform(migration_key, task_idx, ids, test_mode)
-      migration = Hekenga.find_migration(migration_key)
-      migration.test_mode! if test_mode
-      migration.run_parallel_task(task_idx, ids)
+    def perform(document_task_record_id, executor_key)
+      record = Hekenga::DocumentTaskRecord.where(_id: document_task_record_id).first
+      return if record.nil?
+      return if record.executor_key != BSON::ObjectId(executor_key)
+      return if record.complete?
+      executor = Hekenga::DocumentTaskExecutor.new(record)
+      return if executor.migration_cancelled?
+      executor.run!
+      executor.check_for_completion!
     end
   end
 end

data/lib/hekenga/parallel_task.rb ADDED Viewed

@@ -0,0 +1,110 @@
+require 'hekenga/iterator'
+require 'hekenga/document_task_executor'
+require 'hekenga/task_splitter'
+module Hekenga
+  class ParallelTask
+    attr_reader :migration, :task, :task_idx, :test_mode
+    def initialize(migration:, task:, task_idx:, test_mode:)
+      @migration = migration
+      @task      = task
+      @task_idx  = task_idx
+      @test_mode = test_mode
+    end
+    def start!
+      clear_task_records!
+      @executor_key = BSON::ObjectId.new
+      generate_for_scope(task.scope)
+      check_for_completion!
+    end
+    def resume!
+      @executor_key = BSON::ObjectId.new
+      task_records.set(executor_key: @executor_key)
+      queue_jobs!(task_records.incomplete)
+      generate_new_records!
+      recover_failed_records!
+      check_for_completion!
+    end
+    def complete?
+      task_records.incomplete.none?
+    end
+    def check_for_completion!
+      if complete?
+        migration.log(task_idx).set_without_session(done: true, finished: Time.now)
+      end
+    end
+    private
+    def generate_for_scope(scope)
+      Hekenga::Iterator.new(scope, size: 100_000).each do |id_block|
+        task_records = id_block.each_slice(batch_size).map do |id_slice|
+          generate_task_records!(id_slice)
+        end
+        write_task_records!(task_records)
+        queue_jobs!(task_records)
+      end
+    end
+    def generate_new_records!
+      last_record = task_records.desc(:_id).first
+      last_id = last_record&.ids&.last
+      scope = task.scope
+      scope = task.scope.and(_id: {'$gt': last_id}) if last_id
+      generate_for_scope(scope)
+    end
+    # Any records with a failure or a validation failure get moved into
+    # a new task record which is incomplete and gets a job queued
+    def recover_failed_records!
+      task_records.complete.no_timeout.each do |record|
+        Hekenga::TaskSplitter.new(record, @executor_key).call.tap do |new_record|
+          next if new_record.nil?
+          Hekenga::ParallelJob.perform_later(new_record.id.to_s, @executor_key.to_s)
+        end
+      end
+    end
+    def batch_size
+      task.batch_size || migration.batch_size
+    end
+    def clear_task_records!
+      task_records.delete_all
+    end
+    def task_records
+      migration.task_records(task_idx)
+    end
+    def generate_task_records!(id_slice)
+      Hekenga::DocumentTaskRecord.new(
+        migration_key: migration.to_key,
+        task_idx:      task_idx,
+        executor_key:  @executor_key,
+        test_mode:     test_mode,
+        ids:           id_slice
+      ).tap do |record|
+        record.send(:prepare_insert) {}
+      end
+    end
+    def write_task_records!(records)
+      Hekenga::DocumentTaskRecord.collection.bulk_write(records.map do |record|
+        { insert_one: record.as_document }
+      end)
+    end
+    def queue_jobs!(records)
+      records.each do |record|
+        Hekenga::ParallelJob.perform_later(record.id.to_s, @executor_key.to_s)
+      end
+    end
+  end
+end

data/lib/hekenga/scaffold.rb CHANGED Viewed

@@ -28,33 +28,38 @@ module Hekenga
         created #{@migration.timestamp.sub("T", " ").inspect}
         ## Optional
-        # batch_size 10
+        #batch_size 25
         ## Simple tasks
-        # task "task description" do
-        #   up do
-        #   end
-        # end
+        #task "task description" do
+        #  up do
+        #  end
+        #end
         ## Per document tasks
-        # per_document "task description" do
-        #   ## Required
-        #   scope MyModel.all
+        #per_document "task description" do
+        #  ## Required
+        #  scope MyModel.all
         #
-        #   ## Optional config
-        #   # parallel!
-        #   # timeless!
-        #   # skip_prepare!
-        #   # when_invalid :prompt # :prompt, :cancel, :stop, :continue
-        #   #
-        #   # setup do
-        #   # end
-        #   # filter do
-        #   # end
+        #  ## Optional config
+        #  #parallel!
+        #  #timeless!
+        #  #always_write!
+        #  #skip_prepare!
+        #  #batch_size 25
+        #  #write_strategy :update # :delete_then_insert
         #
-        #   up do |doc|
-        #   end
-        # end
+        #  # Called once per batch, instance variables will be accessible
+        #  # in the filter & up blocks
+        #  #setup do
+        #  #end
+        #
+        #  #filter do |doc|
+        #  #end
+        #
+        #  up do |doc|
+        #  end
+        #end
       end
       EOF
     end

data/lib/hekenga/task_failed_error.rb ADDED Viewed

@@ -0,0 +1,4 @@
+module Hekenga
+  class TaskFailedError < Hekenga::BaseError
+  end
+end