RubyGems - rbbt-util - Versions diffs - 5.28.4 → 5.28.9 - Mend

rbbt-util 5.28.4 → 5.28.9

Files changed (33) hide show

checksums.yaml +4 -4
data/lib/rbbt/hpc.rb +5 -2
data/lib/rbbt/persist.rb +1 -0
data/lib/rbbt/tsv/accessor.rb +10 -2
data/lib/rbbt/tsv/dumper.rb +10 -2
data/lib/rbbt/tsv/parallel/traverse.rb +3 -0
data/lib/rbbt/tsv/util.rb +5 -1
data/lib/rbbt/util/config.rb +2 -1
data/lib/rbbt/util/misc/inspect.rb +1 -1
data/lib/rbbt/util/misc/system.rb +1 -1
data/lib/rbbt/util/open.rb +1 -1
data/lib/rbbt/workflow.rb +1 -0
data/lib/rbbt/workflow/accessor.rb +94 -93
data/lib/rbbt/workflow/definition.rb +6 -3
data/lib/rbbt/workflow/integration/cromwell.rb +4 -2
data/lib/rbbt/workflow/remote_workflow/driver/rest.rb +5 -1
data/lib/rbbt/workflow/step.rb +17 -5
data/lib/rbbt/workflow/step/accessor.rb +9 -6
data/lib/rbbt/workflow/usage.rb +1 -1
data/lib/rbbt/workflow/util/archive.rb +1 -0
data/lib/rbbt/workflow/util/orchestrator.rb +215 -0
data/lib/rbbt/workflow/util/trace.rb +182 -0
data/share/rbbt_commands/app/start +2 -2
data/share/rbbt_commands/purge_job +2 -4
data/share/rbbt_commands/system/status +1 -1
data/share/rbbt_commands/workflow/forget_deps +1 -3
data/share/rbbt_commands/workflow/server +2 -0
data/test/rbbt/tsv/parallel/test_traverse.rb +14 -0
data/test/rbbt/tsv/test_manipulate.rb +20 -0
data/test/rbbt/workflow/test_schedule.rb +0 -0
data/test/rbbt/workflow/util/test_orchestrator.rb +223 -0
metadata +8 -3
data/lib/rbbt/workflow/schedule.rb +0 -238

data/lib/rbbt/workflow/step/accessor.rb CHANGED

@@ -93,8 +93,8 @@ class Step
         else
           Open.write(path + '.read', value.to_s)
         end
-      when Step === v
-        v = v.produce.load
+      when Step === value
+        value = value.produce.load
       else
         Open.write(path, value.to_s)
       end
@@ -110,12 +110,14 @@ class Step
     task_info = workflow.task_info(task_name)
     input_types = task_info[:input_types]
     task_inputs = task_info[:inputs]
+    input_defaults = task_info[:input_defaults]
     inputs = {}
     job.recursive_inputs.zip(job.recursive_inputs.fields).each do |value,name|
       next unless task_inputs.include? name.to_sym
       next if options and ! options.include?(name)
       next if value.nil?
+      next if input_defaults[name] == value
       inputs[name] = value
     end
@@ -125,7 +127,7 @@ class Step
     end
     save_inputs(inputs, input_types, dir)
-    inputs.any?
+    inputs.keys
   end
   def name
@@ -437,11 +439,12 @@ class Step
     rec_dependencies = self.rec_dependencies
     return [] if rec_dependencies.empty?
     canfail_paths = self.canfail_paths
     dirty_files = rec_dependencies.reject{|dep|
       (defined?(WorkflowRemoteClient) && WorkflowRemoteClient::RemoteStep === dep) ||
         ! Open.exists?(dep.info_file) ||
         (dep.path && (Open.exists?(dep.path) || Open.remote?(dep.path))) ||
-        ((dep.error? || dep.aborted? || dep.waiting?) && (! dep.recoverable_error? || canfail_paths.include?(dep.path)))
+        ((dep.error? || dep.aborted?) && (! dep.recoverable_error? || canfail_paths.include?(dep.path)))
     }
   end
@@ -508,12 +511,12 @@ class Step
   def nopid?
     pid = info[:pid] || Open.exists?(pid_file)
-    ! pid && ! (status.nil? || status == :aborted || status == :done || status == :error)
+    ! pid && ! (status.nil? || status == :aborted || status == :done || status == :error || status == :cleaned)
   end
   def aborted?
     status = self.status
-    status == :aborted || ((status != :noinfo && status != :setup && status != :noinfo) && nopid?)
+    status == :aborted || ((status != :cleaned && status != :noinfo && status != :setup && status != :noinfo) && nopid?)
   end
   # {{{ INFO

data/lib/rbbt/workflow/usage.rb CHANGED

@@ -240,7 +240,7 @@ module Workflow
           inputs.each do |input, type, file|
             case type
-            when :tsv, :array, :text
+            when :tsv, :array, :text, :file
               lines = file.read.split("\n")
               head = lines[0..5].compact * "\n\n"
               head = head[0..500]

data/lib/rbbt/workflow/util/archive.rb CHANGED

@@ -262,6 +262,7 @@ puts resource[path].find(search_path)
     job_files.each do |file|
       begin
+        Log.debug "Purging #{file}"
         Open.rm_rf file if Open.exists?(file)
       rescue
         Log.warn "Could not erase '#{file}': #{$!.message}"

data/lib/rbbt/workflow/util/orchestrator.rb ADDED

@@ -0,0 +1,215 @@
+require 'rbbt/workflow'
+module Workflow
+  class Orchestrator
+    def self.job_workload(job)
+      workload = {job => []}
+      return workload if job.done?
+      job.dependencies.each do |dep|
+        next if dep.done?
+        workload.merge!(job_workload(dep))
+        workload[job] += workload[dep]
+        workload[job] << dep
+        workload[job].uniq!
+      end
+      job.input_dependencies.each do |dep|
+        next if dep.done?
+        workload.merge!(job_workload(dep))
+        workload[job] += workload[dep]
+        workload[job] << dep
+        workload[job].uniq!
+      end
+      workload
+    end
+    def self.job_rules(rules, job)
+      workflow = job.workflow.to_s
+      task_name = job.task_name.to_s
+      return IndiferentHash.setup(rules["defaults"]) unless rules[workflow]
+      return IndiferentHash.setup(rules["defaults"]) unless rules[workflow][task_name]
+      job_rules = IndiferentHash.setup(rules[workflow][task_name])
+      rules["defaults"].each{|k,v| job_rules[k] = v if job_rules[k].nil? } if rules["defaults"]
+      job_rules
+    end
+    def self.purge_duplicates(candidates)
+      seen = Set.new
+      candidates.select do |job|
+        if seen.include? job.path
+          false
+        else
+          seen << job.path
+          true
+        end
+      end
+    end
+    def self.job_resources(rules, job)
+      resources = (job_rules(rules, job) || {})["resources"] || {}
+      IndiferentHash.setup(resources)
+      default_resources = rules["default_resources"] || rules["defaults"]["resources"]
+      default_resources.each{|k,v| resources[k] ||= v } if default_resources
+      resources
+    end
+    def self.sort_candidates(candidates, rules)
+      seen = Set.new
+      candidates.sort_by do |job|
+        - job_resources(rules, job).values.inject(0){|acc,e| acc += e}
+      end
+    end
+    def self.candidates(workload, rules)
+      if rules.empty?
+        candidates = workload.select{|k,v| v.empty? }.
+          collect{|k,v| k}.
+          reject{|k| k.done? }
+      else
+        candidates = workload. #select{|k,v| Orchestrator.job_rules(rules, k) }.
+          select{|k,v| v.empty? }.
+          collect{|k,v| k }.
+          reject{|k| k.done? }
+      end
+      top_level = workload.keys - workload.values.flatten
+      candidates = purge_duplicates candidates
+      candidates = sort_candidates candidates, rules
+      candidates
+    end
+    attr_accessor :available_resources, :resources_requested, :resources_used, :timer
+    def initialize(timer = 5, available_resources = {})
+      @timer               = timer
+      @available_resources = IndiferentHash.setup(available_resources)
+      @resources_requested = IndiferentHash.setup({})
+      @resources_used      = IndiferentHash.setup({})
+    end
+    def release_resources(job)
+      if resources_used[job]
+        Log.debug "Orchestrator releasing resouces from #{job.path}"
+        resources_used[job].each do |resource,value|
+          next if resource == 'size'
+          resources_requested[resource] -= value.to_i
+        end
+        resources_used.delete job
+      end
+    end
+    def check_resources(rules, job)
+      resources = Orchestrator.job_resources(rules, job)
+      limit_resources = resources.select{|resource,value| available_resources[resource] && ((resources_requested[resource] || 0) + value) > available_resources[resource]  }.collect{|resource,v| resource }
+      if limit_resources.any?
+        Log.debug "Orchestrator waiting on #{job.path} due to #{limit_resources * ", "}"
+      else
+        resources_used[job] = resources
+        resources.each do |resource,value|
+          resources_requested[resource] ||= 0
+          resources_requested[resource] += value.to_i
+        end
+        Log.low "Orchestrator producing #{job.path} with resources #{resources}"
+        return yield
+      end
+    end
+    def run_with_rules(rules, job)
+      job_rules = Orchestrator.job_rules(rules, job)
+      Rbbt::Config.with_config do
+        job_rules[:config_keys].each do |config|
+          Rbbt::Config.process_config config
+        end if job_rules && job_rules[:config_keys]
+        log = job_rules[:log] if job_rules
+        log = Log.severity if log.nil?
+        Log.with_severity log do
+          job.produce(false, true)
+        end
+      end
+    end
+    def erase_job_dependencies(job, rules, workload, top_level_jobs)
+      job.dependencies.each do |dep|
+        next if top_level_jobs.include? dep.path
+        next unless Orchestrator.job_rules(rules, dep)["erase"].to_s == 'true'
+        list = (workload.keys - [job]).collect{|pending| pending.dependencies}.flatten
+        next if list.include?(dep)
+        Log.high "Erasing #{dep.path} from #{job.path}"
+        job.archive_deps
+        job.copy_files_dir
+        job.dependencies = job.dependencies - [dep]
+        dep.clean
+      end
+    end
+    def process(rules, jobs)
+      begin
+        workload = jobs.inject({}){|acc,job| acc.merge!(Orchestrator.job_workload(job)) }
+        top_level_jobs = jobs.collect{|job| job.path }
+        while workload.any?
+          candidates = resources_used.keys + Orchestrator.candidates(workload, rules)
+          raise "No candidates and no running jobs" if candidates.empty?
+          candidates.each do |job|
+            case
+            when (job.error? || job.aborted?)
+              begin
+                if job.recoverable_error?
+                  job.clean
+                  raise TryAgain
+                else
+                  next
+                end
+              ensure
+                Log.warn "Releases resources from failed job: #{job.path}"
+                release_resources(job)
+              end
+            when job.done?
+              Log.debug "Orchestrator done #{job.path}"
+              release_resources(job)
+              erase_job_dependencies(job, rules, workload, top_level_jobs)
+            when job.running?
+              next
+            else
+              check_resources(rules, job) do
+                run_with_rules(rules, job)
+              end
+            end
+          end
+          new_workload = {}
+          workload.each do |k,v|
+            next if k.done?
+            new_workload[k] = v.reject{|d| d.done? || (d.error? && ! d.recoverable_error?)}
+          end
+          workload = new_workload
+          sleep timer
+        end
+      rescue TryAgain
+        retry
+      end
+    end
+  end
+end

data/lib/rbbt/workflow/util/trace.rb ADDED

@@ -0,0 +1,182 @@
+require 'rbbt/util/R'
+module Workflow
+  def self.trace(seed_jobs, options = {})
+    jobs = []
+    seed_jobs.each{|j| jobs << j; jobs += j.rec_dependencies}
+    data = TSV.setup({}, "Job~Workflow,Task,Start,End#:type=:list")
+    min_start = nil
+    max_done = nil
+    jobs.each do |job|
+      next unless job.info[:done]
+      started = job.info[:started]
+      ddone = job.info[:done]
+      code = [job.workflow, job.task_name].compact.collect{|s| s.to_s} * "."
+      code = code + '.' + job.name
+      data[code] = [job.workflow.to_s, job.task_name, started, ddone]
+      if min_start.nil?
+        min_start = started
+      else
+        min_start = started if started < min_start
+      end
+      if max_done.nil?
+        max_done = ddone
+      else
+        max_done = ddone if ddone > max_done
+      end
+    end
+    data.add_field "Start.second" do |k,value|
+      value["Start"] - min_start
+    end
+    data.add_field "End.second" do |k,value|
+      value["End"] - min_start
+    end
+    if options[:fix_gap]
+      ranges = []
+      data.through do |k,values|
+        start, eend = values.values_at "Start.second", "End.second"
+        ranges << (start..eend)
+      end
+      gaps = {}
+      last = nil
+      Misc.collapse_ranges(ranges).each do |range|
+        start = range.begin
+        eend = range.end
+        if last
+          gaps[last] = start - last
+        end
+        last = eend
+      end
+      data.process "End.second" do |value,k,values|
+        gap = Misc.sum(gaps.select{|pos,size| pos < values["Start.second"]}.collect{|pos,size| size})
+        value - gap
+      end
+      data.process "Start.second" do |value,k,values|
+        gap = Misc.sum(gaps.select{|pos,size| pos < values["Start.second"]}.collect{|pos,size| size})
+        value - gap
+      end
+    end
+    tasks_info = {}
+    jobs.each do |dep|
+      next unless dep.info[:done]
+      task = [dep.workflow, dep.task_name].compact.collect{|s| s.to_s} * "#"
+      info = tasks_info[task] ||= {}
+      time = dep.info[:done] - dep.info[:started]
+      info[:time] ||= []
+      info[:time] << time
+      cpus = nil
+      spark = false
+      shard = false
+      dep.info[:config_keys].select do |kinfo|
+        key, value, tokens = kinfo
+        key = key.to_s
+        cpus = value if key.include? 'cpu'
+        spark = value if key == 'spark'
+        shard = value if key == 'shard'
+      end
+      info[:cpus] = cpus || 1
+      info[:spark] = spark
+      info[:shard] = shard
+    end
+    stats = TSV.setup({}, "Task~Calls,Avg. Time,Total Time,Cpus,Spark,Shard#:type=:list")
+    tasks_info.each do |task, info|
+      time_lists, cpus, spark, shard = info.values_at :time, :cpus, :spark, :shard
+      avg_time = Misc.mean(time_lists)
+      total_time = Misc.sum(time_lists)
+      calls = time_lists.length
+      stats[task] = [calls, avg_time, total_time, cpus, spark, shard]
+    end
+    raise "No jobs to process" if data.size == 0
+    start = data.column("Start.second").values.flatten.collect{|v| v.to_f}.min
+    eend = data.column("End.second").values.flatten.collect{|v| v.to_f}.max
+    total = eend - start
+    Log.info "Total time elapsed: #{total} seconds"
+    if options[:fix_gap]
+      total_gaps = Misc.sum(gaps.collect{|k,v| v})
+      Log.info "Total gaps: #{total_gaps} seconds"
+    end
+    plot, width, height = options.values_at :plot, :width, :height
+    if plot
+      data.R <<-EOF, [:svg]
+    rbbt.require('tidyverse')
+    rbbt.require('ggplot2')
+    names(data) <- make.names(names(data))
+    data$id = rownames(data)
+    data$content = data$Task
+    data$start = data$Start
+    data$end = data$End
+    data$Project = data$Workflow
+    tasks = data
+    #theme_gantt <- function(base_size=11, base_family="Source Sans Pro Light") {
+    theme_gantt <- function(base_size=11, base_family="Sans Serif") {
+      ret <- theme_bw(base_size, base_family) %+replace%
+        theme(panel.background = element_rect(fill="#ffffff", colour=NA),
+              axis.title.x=element_text(vjust=-0.2), axis.title.y=element_text(vjust=1.5),
+              title=element_text(vjust=1.2, family="Source Sans Pro Semibold"),
+              panel.border = element_blank(), axis.line=element_blank(),
+              panel.grid.minor=element_blank(),
+              panel.grid.major.y = element_blank(),
+              panel.grid.major.x = element_line(size=0.5, colour="grey80"),
+              axis.ticks=element_blank(),
+              legend.position="bottom",
+              axis.title=element_text(size=rel(1.2), family="Source Sans Pro Semibold"),
+              strip.text=element_text(size=rel(1.5), family="Source Sans Pro Semibold"),
+              strip.background=element_rect(fill="#ffffff", colour=NA),
+              panel.spacing.y=unit(1.5, "lines"),
+              legend.key = element_blank())
+      ret
+    }
+    tasks.long <- tasks %>%
+    gather(date.type, task.date, -c(Project, Task, id, Start.second, End.second)) %>%
+    arrange(date.type, task.date) %>%
+    mutate(id = factor(id, levels=rev(unique(id)), ordered=TRUE))
+    x.breaks <- seq(length(tasks$Task) + 0.5 - 3, 0, by=-3)
+    timeline <- ggplot(tasks.long, aes(y=id, yend=id, x=Start.second, xend=End.second, colour=Task)) +
+      geom_segment() +
+      geom_vline(xintercept=x.breaks, colour="grey80", linetype="dotted") +
+      guides(colour=guide_legend(title=NULL)) +
+      labs(x=NULL, y=NULL) +
+      theme_gantt() + theme(axis.text.x=element_text(angle=45, hjust=1))
+    rbbt.png_plot('#{plot}', 'plot(timeline)', width=#{width}, height=#{height}, pointsize=6)
+      EOF
+    end
+    if options[:plot_data]
+      data
+    else
+      stats
+    end
+  end
+end