RubyGems - miga-base - Versions diffs - 0.7.26.0 → 1.0.0.1 - Mend

miga-base 0.7.26.0 → 1.0.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (337) hide show

checksums.yaml +4 -4
data/lib/miga/_data/aai-intax.blast.tsv.gz +0 -0
data/lib/miga/_data/aai-intax.diamond.tsv.gz +0 -0
data/lib/miga/_data/aai-novel.blast.tsv.gz +0 -0
data/lib/miga/_data/aai-novel.diamond.tsv.gz +0 -0
data/lib/miga/cli/action/classify_wf.rb +2 -2
data/lib/miga/cli/action/derep_wf.rb +1 -1
data/lib/miga/cli/action/doctor.rb +57 -14
data/lib/miga/cli/action/doctor/base.rb +47 -23
data/lib/miga/cli/action/init.rb +11 -7
data/lib/miga/cli/action/init/files_helper.rb +1 -0
data/lib/miga/cli/action/ncbi_get.rb +3 -3
data/lib/miga/cli/action/tax_dist.rb +2 -2
data/lib/miga/cli/action/wf.rb +5 -4
data/lib/miga/common.rb +1 -0
data/lib/miga/daemon.rb +11 -4
data/lib/miga/dataset/result.rb +10 -6
data/lib/miga/json.rb +5 -4
data/lib/miga/metadata.rb +5 -1
data/lib/miga/parallel.rb +36 -0
data/lib/miga/project.rb +8 -8
data/lib/miga/project/base.rb +4 -4
data/lib/miga/project/result.rb +2 -2
data/lib/miga/sqlite.rb +10 -2
data/lib/miga/version.rb +23 -9
data/scripts/aai_distances.bash +16 -18
data/scripts/ani_distances.bash +16 -17
data/scripts/assembly.bash +31 -16
data/scripts/haai_distances.bash +3 -27
data/scripts/miga.bash +6 -4
data/scripts/p.bash +1 -1
data/scripts/read_quality.bash +9 -18
data/scripts/trimmed_fasta.bash +14 -30
data/scripts/trimmed_reads.bash +36 -36
data/test/parallel_test.rb +31 -0
data/test/project_test.rb +2 -1
data/test/remote_dataset_test.rb +1 -1
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Archaea_SCG.hmm +41964 -0
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Bacteria_SCG.hmm +32439 -0
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Complete_SCG_DB.hmm +62056 -0
data/utils/FastAAI/FastAAI/FastAAI +1336 -0
data/utils/FastAAI/README.md +84 -0
data/utils/FastAAI/kAAI_v1.0_virus.py +1296 -0
data/utils/distance/commands.rb +1 -0
data/utils/distance/database.rb +0 -1
data/utils/distance/runner.rb +2 -4
data/utils/enveomics/Docs/recplot2.md +244 -0
data/utils/enveomics/Examples/aai-matrix.bash +66 -0
data/utils/enveomics/Examples/ani-matrix.bash +66 -0
data/utils/enveomics/Examples/essential-phylogeny.bash +105 -0
data/utils/enveomics/Examples/unus-genome-phylogeny.bash +100 -0
data/utils/enveomics/LICENSE.txt +73 -0
data/utils/enveomics/Makefile +52 -0
data/utils/enveomics/Manifest/Tasks/aasubs.json +103 -0
data/utils/enveomics/Manifest/Tasks/blasttab.json +786 -0
data/utils/enveomics/Manifest/Tasks/distances.json +161 -0
data/utils/enveomics/Manifest/Tasks/fasta.json +802 -0
data/utils/enveomics/Manifest/Tasks/fastq.json +291 -0
data/utils/enveomics/Manifest/Tasks/graphics.json +126 -0
data/utils/enveomics/Manifest/Tasks/mapping.json +137 -0
data/utils/enveomics/Manifest/Tasks/ogs.json +382 -0
data/utils/enveomics/Manifest/Tasks/other.json +906 -0
data/utils/enveomics/Manifest/Tasks/remote.json +355 -0
data/utils/enveomics/Manifest/Tasks/sequence-identity.json +638 -0
data/utils/enveomics/Manifest/Tasks/tables.json +308 -0
data/utils/enveomics/Manifest/Tasks/trees.json +68 -0
data/utils/enveomics/Manifest/Tasks/variants.json +111 -0
data/utils/enveomics/Manifest/categories.json +165 -0
data/utils/enveomics/Manifest/examples.json +154 -0
data/utils/enveomics/Manifest/tasks.json +4 -0
data/utils/enveomics/Pipelines/assembly.pbs/CONFIG.mock.bash +69 -0
data/utils/enveomics/Pipelines/assembly.pbs/FastA.N50.pl +1 -0
data/utils/enveomics/Pipelines/assembly.pbs/FastA.filterN.pl +1 -0
data/utils/enveomics/Pipelines/assembly.pbs/FastA.length.pl +1 -0
data/utils/enveomics/Pipelines/assembly.pbs/README.md +189 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-2.bash +112 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-3.bash +23 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-4.bash +44 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME.bash +50 -0
data/utils/enveomics/Pipelines/assembly.pbs/kSelector.R +37 -0
data/utils/enveomics/Pipelines/assembly.pbs/newbler.pbs +68 -0
data/utils/enveomics/Pipelines/assembly.pbs/newbler_preparator.pl +49 -0
data/utils/enveomics/Pipelines/assembly.pbs/soap.pbs +80 -0
data/utils/enveomics/Pipelines/assembly.pbs/stats.pbs +57 -0
data/utils/enveomics/Pipelines/assembly.pbs/velvet.pbs +63 -0
data/utils/enveomics/Pipelines/blast.pbs/01.pbs.bash +38 -0
data/utils/enveomics/Pipelines/blast.pbs/02.pbs.bash +73 -0
data/utils/enveomics/Pipelines/blast.pbs/03.pbs.bash +21 -0
data/utils/enveomics/Pipelines/blast.pbs/BlastTab.recover_job.pl +72 -0
data/utils/enveomics/Pipelines/blast.pbs/CONFIG.mock.bash +98 -0
data/utils/enveomics/Pipelines/blast.pbs/FastA.split.pl +1 -0
data/utils/enveomics/Pipelines/blast.pbs/README.md +127 -0
data/utils/enveomics/Pipelines/blast.pbs/RUNME.bash +109 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.check.bash +128 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.dry.bash +16 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.eo.bash +22 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.pause.bash +26 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.run.bash +89 -0
data/utils/enveomics/Pipelines/blast.pbs/sentinel.pbs.bash +29 -0
data/utils/enveomics/Pipelines/idba.pbs/README.md +49 -0
data/utils/enveomics/Pipelines/idba.pbs/RUNME.bash +95 -0
data/utils/enveomics/Pipelines/idba.pbs/run.pbs +56 -0
data/utils/enveomics/Pipelines/trim.pbs/README.md +54 -0
data/utils/enveomics/Pipelines/trim.pbs/RUNME.bash +70 -0
data/utils/enveomics/Pipelines/trim.pbs/run.pbs +130 -0
data/utils/enveomics/README.md +42 -0
data/utils/enveomics/Scripts/AAsubs.log2ratio.rb +171 -0
data/utils/enveomics/Scripts/Aln.cat.rb +221 -0
data/utils/enveomics/Scripts/Aln.convert.pl +35 -0
data/utils/enveomics/Scripts/AlphaDiversity.pl +152 -0
data/utils/enveomics/Scripts/BedGraph.tad.rb +93 -0
data/utils/enveomics/Scripts/BedGraph.window.rb +71 -0
data/utils/enveomics/Scripts/BlastPairwise.AAsubs.pl +102 -0
data/utils/enveomics/Scripts/BlastTab.addlen.rb +63 -0
data/utils/enveomics/Scripts/BlastTab.advance.bash +48 -0
data/utils/enveomics/Scripts/BlastTab.best_hit_sorted.pl +55 -0
data/utils/enveomics/Scripts/BlastTab.catsbj.pl +104 -0
data/utils/enveomics/Scripts/BlastTab.cogCat.rb +76 -0
data/utils/enveomics/Scripts/BlastTab.filter.pl +47 -0
data/utils/enveomics/Scripts/BlastTab.kegg_pep2path_rest.pl +194 -0
data/utils/enveomics/Scripts/BlastTab.metaxaPrep.pl +104 -0
data/utils/enveomics/Scripts/BlastTab.pairedHits.rb +157 -0
data/utils/enveomics/Scripts/BlastTab.recplot2.R +48 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth.pl +86 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth_ZIP.pl +119 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth_nomedian.pl +86 -0
data/utils/enveomics/Scripts/BlastTab.subsample.pl +47 -0
data/utils/enveomics/Scripts/BlastTab.sumPerHit.pl +114 -0
data/utils/enveomics/Scripts/BlastTab.taxid2taxrank.pl +90 -0
data/utils/enveomics/Scripts/BlastTab.topHits_sorted.rb +101 -0
data/utils/enveomics/Scripts/Chao1.pl +97 -0
data/utils/enveomics/Scripts/CharTable.classify.rb +234 -0
data/utils/enveomics/Scripts/EBIseq2tax.rb +83 -0
data/utils/enveomics/Scripts/FastA.N50.pl +60 -0
data/utils/enveomics/Scripts/FastA.extract.rb +152 -0
data/utils/enveomics/Scripts/FastA.filter.pl +52 -0
data/utils/enveomics/Scripts/FastA.filterLen.pl +28 -0
data/utils/enveomics/Scripts/FastA.filterN.pl +60 -0
data/utils/enveomics/Scripts/FastA.fragment.rb +100 -0
data/utils/enveomics/Scripts/FastA.gc.pl +42 -0
data/utils/enveomics/Scripts/FastA.interpose.pl +93 -0
data/utils/enveomics/Scripts/FastA.length.pl +38 -0
data/utils/enveomics/Scripts/FastA.mask.rb +89 -0
data/utils/enveomics/Scripts/FastA.per_file.pl +36 -0
data/utils/enveomics/Scripts/FastA.qlen.pl +57 -0
data/utils/enveomics/Scripts/FastA.rename.pl +65 -0
data/utils/enveomics/Scripts/FastA.revcom.pl +23 -0
data/utils/enveomics/Scripts/FastA.sample.rb +98 -0
data/utils/enveomics/Scripts/FastA.slider.pl +85 -0
data/utils/enveomics/Scripts/FastA.split.pl +55 -0
data/utils/enveomics/Scripts/FastA.split.rb +79 -0
data/utils/enveomics/Scripts/FastA.subsample.pl +131 -0
data/utils/enveomics/Scripts/FastA.tag.rb +65 -0
data/utils/enveomics/Scripts/FastA.toFastQ.rb +69 -0
data/utils/enveomics/Scripts/FastA.wrap.rb +48 -0
data/utils/enveomics/Scripts/FastQ.filter.pl +54 -0
data/utils/enveomics/Scripts/FastQ.interpose.pl +90 -0
data/utils/enveomics/Scripts/FastQ.maskQual.rb +89 -0
data/utils/enveomics/Scripts/FastQ.offset.pl +90 -0
data/utils/enveomics/Scripts/FastQ.split.pl +53 -0
data/utils/enveomics/Scripts/FastQ.tag.rb +70 -0
data/utils/enveomics/Scripts/FastQ.test-error.rb +81 -0
data/utils/enveomics/Scripts/FastQ.toFastA.awk +24 -0
data/utils/enveomics/Scripts/GFF.catsbj.pl +127 -0
data/utils/enveomics/Scripts/GenBank.add_fields.rb +84 -0
data/utils/enveomics/Scripts/HMM.essential.rb +351 -0
data/utils/enveomics/Scripts/HMM.haai.rb +168 -0
data/utils/enveomics/Scripts/HMMsearch.extractIds.rb +83 -0
data/utils/enveomics/Scripts/JPlace.distances.rb +88 -0
data/utils/enveomics/Scripts/JPlace.to_iToL.rb +320 -0
data/utils/enveomics/Scripts/M5nr.getSequences.rb +81 -0
data/utils/enveomics/Scripts/MeTaxa.distribution.pl +198 -0
data/utils/enveomics/Scripts/MyTaxa.fragsByTax.pl +35 -0
data/utils/enveomics/Scripts/MyTaxa.seq-taxrank.rb +49 -0
data/utils/enveomics/Scripts/NCBIacc2tax.rb +92 -0
data/utils/enveomics/Scripts/Newick.autoprune.R +27 -0
data/utils/enveomics/Scripts/RAxML-EPA.to_iToL.pl +228 -0
data/utils/enveomics/Scripts/RecPlot2.compareIdentities.R +32 -0
data/utils/enveomics/Scripts/RefSeq.download.bash +48 -0
data/utils/enveomics/Scripts/SRA.download.bash +55 -0
data/utils/enveomics/Scripts/TRIBS.plot-test.R +36 -0
data/utils/enveomics/Scripts/TRIBS.test.R +39 -0
data/utils/enveomics/Scripts/Table.barplot.R +31 -0
data/utils/enveomics/Scripts/Table.df2dist.R +30 -0
data/utils/enveomics/Scripts/Table.filter.pl +61 -0
data/utils/enveomics/Scripts/Table.merge.pl +77 -0
data/utils/enveomics/Scripts/Table.prefScore.R +60 -0
data/utils/enveomics/Scripts/Table.replace.rb +69 -0
data/utils/enveomics/Scripts/Table.round.rb +63 -0
data/utils/enveomics/Scripts/Table.split.pl +57 -0
data/utils/enveomics/Scripts/Taxonomy.silva2ncbi.rb +227 -0
data/utils/enveomics/Scripts/VCF.KaKs.rb +147 -0
data/utils/enveomics/Scripts/VCF.SNPs.rb +88 -0
data/utils/enveomics/Scripts/aai.rb +419 -0
data/utils/enveomics/Scripts/ani.rb +362 -0
data/utils/enveomics/Scripts/anir.rb +137 -0
data/utils/enveomics/Scripts/clust.rand.rb +102 -0
data/utils/enveomics/Scripts/gi2tax.rb +103 -0
data/utils/enveomics/Scripts/in_silico_GA_GI.pl +96 -0
data/utils/enveomics/Scripts/lib/data/dupont_2012_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/data/lee_2019_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/enveomics.R +1 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/anir.rb +293 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/bm_set.rb +175 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/enveomics.rb +24 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/errors.rb +17 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/gmm_em.rb +30 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/jplace.rb +253 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/match.rb +63 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/og.rb +182 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/rbm.rb +49 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/remote_data.rb +74 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/seq_range.rb +237 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats.rb +3 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/rand.rb +31 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/sample.rb +152 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/utils.rb +73 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/vcf.rb +135 -0
data/utils/enveomics/Scripts/ogs.annotate.rb +88 -0
data/utils/enveomics/Scripts/ogs.core-pan.rb +160 -0
data/utils/enveomics/Scripts/ogs.extract.rb +125 -0
data/utils/enveomics/Scripts/ogs.mcl.rb +186 -0
data/utils/enveomics/Scripts/ogs.rb +104 -0
data/utils/enveomics/Scripts/ogs.stats.rb +131 -0
data/utils/enveomics/Scripts/rbm-legacy.rb +172 -0
data/utils/enveomics/Scripts/rbm.rb +100 -0
data/utils/enveomics/Scripts/sam.filter.rb +148 -0
data/utils/enveomics/Tests/Makefile +10 -0
data/utils/enveomics/Tests/Mgen_M2288.faa +3189 -0
data/utils/enveomics/Tests/Mgen_M2288.fna +8282 -0
data/utils/enveomics/Tests/Mgen_M2321.fna +8288 -0
data/utils/enveomics/Tests/Nequ_Kin4M.faa +2970 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.tribs.Rdata +0 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.txt +7 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai-mat.tsv +17 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai.tsv +137 -0
data/utils/enveomics/Tests/a_mg.cds-go.blast.tsv +123 -0
data/utils/enveomics/Tests/a_mg.reads-cds.blast.tsv +200 -0
data/utils/enveomics/Tests/a_mg.reads-cds.counts.tsv +55 -0
data/utils/enveomics/Tests/alkB.nwk +1 -0
data/utils/enveomics/Tests/anthrax-cansnp-data.tsv +13 -0
data/utils/enveomics/Tests/anthrax-cansnp-key.tsv +17 -0
data/utils/enveomics/Tests/hiv1.faa +59 -0
data/utils/enveomics/Tests/hiv1.fna +134 -0
data/utils/enveomics/Tests/hiv2.faa +70 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv +233 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.lim +1 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.rec +233 -0
data/utils/enveomics/Tests/phyla_counts.tsv +10 -0
data/utils/enveomics/Tests/primate_lentivirus.ogs +11 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv1.rbm +9 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv2.rbm +8 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-siv.rbm +6 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-hiv2.rbm +9 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-siv.rbm +6 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/siv-siv.rbm +6 -0
data/utils/enveomics/build_enveomics_r.bash +45 -0
data/utils/enveomics/enveomics.R/DESCRIPTION +31 -0
data/utils/enveomics/enveomics.R/NAMESPACE +39 -0
data/utils/enveomics/enveomics.R/R/autoprune.R +155 -0
data/utils/enveomics/enveomics.R/R/barplot.R +184 -0
data/utils/enveomics/enveomics.R/R/cliopts.R +135 -0
data/utils/enveomics/enveomics.R/R/df2dist.R +154 -0
data/utils/enveomics/enveomics.R/R/growthcurve.R +331 -0
data/utils/enveomics/enveomics.R/R/prefscore.R +79 -0
data/utils/enveomics/enveomics.R/R/recplot.R +354 -0
data/utils/enveomics/enveomics.R/R/recplot2.R +1631 -0
data/utils/enveomics/enveomics.R/R/tribs.R +583 -0
data/utils/enveomics/enveomics.R/R/utils.R +80 -0
data/utils/enveomics/enveomics.R/README.md +81 -0
data/utils/enveomics/enveomics.R/data/growth.curves.rda +0 -0
data/utils/enveomics/enveomics.R/data/phyla.counts.rda +0 -0
data/utils/enveomics/enveomics.R/man/cash-enve.GrowthCurve-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2.Peak-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/enve.GrowthCurve-class.Rd +25 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBS-class.Rd +46 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBS.merge.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBStest-class.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.__prune.iter.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.__prune.reduce.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.__tribs.Rd +40 -0
data/utils/enveomics/enveomics.R/man/enve.barplot.Rd +103 -0
data/utils/enveomics/enveomics.R/man/enve.cliopts.Rd +67 -0
data/utils/enveomics/enveomics.R/man/enve.col.alpha.Rd +24 -0
data/utils/enveomics/enveomics.R/man/enve.col2alpha.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.group.Rd +44 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.list.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.growthcurve.Rd +75 -0
data/utils/enveomics/enveomics.R/man/enve.prefscore.Rd +50 -0
data/utils/enveomics/enveomics.R/man/enve.prune.dist.Rd +44 -0
data/utils/enveomics/enveomics.R/man/enve.recplot.Rd +139 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2-class.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.ANIr.Rd +24 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.Rd +77 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__counts.Rd +25 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__peakHist.Rd +21 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__whichClosestPeak.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.changeCutoff.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.compareIdentities.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.coordinates.Rd +29 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.corePeak.Rd +18 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.extractWindows.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.Rd +36 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_e.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_m.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__emauto_one.Rd +27 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mow_one.Rd +52 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mower.Rd +17 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.em.Rd +51 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.emauto.Rd +43 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.mower.Rd +82 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.peak-class.Rd +59 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.seqdepth.Rd +27 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.windowDepthThreshold.Rd +36 -0
data/utils/enveomics/enveomics.R/man/enve.selvector.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.tribs.Rd +68 -0
data/utils/enveomics/enveomics.R/man/enve.tribs.test.Rd +28 -0
data/utils/enveomics/enveomics.R/man/enve.truncate.Rd +27 -0
data/utils/enveomics/enveomics.R/man/growth.curves.Rd +14 -0
data/utils/enveomics/enveomics.R/man/phyla.counts.Rd +13 -0
data/utils/enveomics/enveomics.R/man/plot.enve.GrowthCurve.Rd +78 -0
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBS.Rd +46 -0
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBStest.Rd +45 -0
data/utils/enveomics/enveomics.R/man/plot.enve.recplot2.Rd +125 -0
data/utils/enveomics/enveomics.R/man/summary.enve.GrowthCurve.Rd +19 -0
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBS.Rd +19 -0
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBStest.Rd +19 -0
data/utils/enveomics/globals.mk +8 -0
data/utils/enveomics/manifest.json +9 -0
data/utils/multitrim/Multitrim How-To.pdf +0 -0
data/utils/multitrim/README.md +67 -0
data/utils/multitrim/multitrim.py +1555 -0
data/utils/multitrim/multitrim.yml +13 -0
data/utils/requirements.txt +4 -3
metadata +304 -3

data/utils/enveomics/enveomics.R/man/enve.recplot2.coordinates.Rd ADDED Viewed

@@ -0,0 +1,29 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.coordinates}
+\alias{enve.recplot2.coordinates}
+\title{Enveomics: Recruitment Plot (2) Coordinates}
+\usage{
+enve.recplot2.coordinates(x, bins)
+}
+\arguments{
+\item{x}{\code{\link{enve.RecPlot2}} object.}
+\item{bins}{Vector of selected bins to return. It can be a vector of logical values
+with the same length as \code{x$pos.breaks-1} or a vector of integers. If
+missing, returns the coordinates of all windows.}
+}
+\value{
+Returns a data.frame with five columns: \code{name.from} (character),
+\code{pos.from} (numeric), \code{name.to} (character), \code{pos.to}
+(numeric), and \code{seq.name} (character).
+The first two correspond to sequence and position of the start point of the
+bin. The next two correspond to the sequence and position of the end point of
+the bin. The last one indicates the name of the sequence (if defined).
+}
+\description{
+Returns the sequence name and coordinates of the requested position bins.
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.corePeak.Rd ADDED Viewed

@@ -0,0 +1,18 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.corePeak}
+\alias{enve.recplot2.corePeak}
+\title{Enveomics: Recruitment Plot (2) Core Peak Finder}
+\usage{
+enve.recplot2.corePeak(x)
+}
+\arguments{
+\item{x}{\code{list} of \code{\link{enve.RecPlot2.Peak}} objects.}
+}
+\description{
+Finds the peak in a list of peaks that is most likely to represent the
+"core genome" of a population.
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.extractWindows.Rd ADDED Viewed

@@ -0,0 +1,45 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.extractWindows}
+\alias{enve.recplot2.extractWindows}
+\title{Enveomics: Recruitment Plot (2) Extract Windows}
+\usage{
+enve.recplot2.extractWindows(
+  rp,
+  peak,
+  lower.tail = TRUE,
+  significance = 0.05,
+  seq.names = FALSE
+)
+}
+\arguments{
+\item{rp}{Recruitment plot, a \code{\link{enve.RecPlot2}} object.}
+\item{peak}{Peak, an \code{\link{enve.RecPlot2.Peak}} object. If list, it is assumed to be a
+list of \code{\link{enve.RecPlot2.Peak}} objects, in which case the core peak is
+used (see \code{\link{enve.recplot2.corePeak}}).}
+\item{lower.tail}{If \code{FALSE}, it returns windows significantly above the peak in
+sequencing depth.}
+\item{significance}{Significance threshold (alpha) to select windows.}
+\item{seq.names}{Returns subject sequence names instead of a vector of Booleans. If
+the recruitment plot was generated with named position bins (e.g, using
+\code{pos.breaks=0} or a two-column \code{pos.breaks.tsv}), it returns a
+vector of characters (the sequence identifiers), otherwise it returns a
+data.frame with a name column and two columns of coordinates.}
+}
+\value{
+Returns a vector of logicals if \code{seq.names = FALSE}.
+If \code{seq.names = TRUE}, it returns a data.frame with five columns:
+\code{name.from}, \code{name.to}, \code{pos.from}, \code{pos.to}, and
+\code{seq.name} (see \code{\link{enve.recplot2.coordinates}}).
+}
+\description{
+Extract windows significantly below (or above) the peak in sequencing
+depth.
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.Rd ADDED Viewed

@@ -0,0 +1,36 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks}
+\alias{enve.recplot2.findPeaks}
+\title{Enveomics: Recruitment Plot (2) Peak Finder}
+\usage{
+enve.recplot2.findPeaks(x, method = "emauto", ...)
+}
+\arguments{
+\item{x}{An \code{\link{enve.RecPlot2}} object.}
+\item{method}{Peak-finder method. This should be one of:
+\itemize{
+   \item \strong{emauto}
+   (Expectation-Maximization with auto-selection of components)
+   \item \strong{em}
+   (Expectation-Maximization)
+   \item \strong{mower}
+   (Custom distribution-mowing method)
+}}
+\item{...}{Any additional parameters supported by
+\code{\link{enve.recplot2.findPeaks}}.}
+}
+\value{
+Returns a list of \code{\link{enve.RecPlot2.Peak}} objects.
+}
+\description{
+Identifies peaks in the population histogram potentially indicating
+sub-population mixtures.
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+export
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_e.Rd ADDED Viewed

@@ -0,0 +1,19 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.__em_e}
+\alias{enve.recplot2.findPeaks.__em_e}
+\title{Enveomics: Recruitment Plot (2) EM Peak Finder - Internal Ancillary Function Expectation}
+\usage{
+enve.recplot2.findPeaks.__em_e(x, theta)
+}
+\arguments{
+\item{x}{Vector of log-transformed sequencing depths}
+\item{theta}{Parameters list}
+}
+\description{
+Internal ancillary function (see \code{\link{enve.recplot2.findPeaks.em}}).
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_m.Rd ADDED Viewed

@@ -0,0 +1,19 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.__em_m}
+\alias{enve.recplot2.findPeaks.__em_m}
+\title{Enveomics: Recruitment Plot (2) Em Peak Finder - Internal Ancillary Function Maximization}
+\usage{
+enve.recplot2.findPeaks.__em_m(x, posterior)
+}
+\arguments{
+\item{x}{Vector of log-transformed sequencing depths}
+\item{posterior}{Posterior probability}
+}
+\description{
+Internal ancillary function (see \code{\link{enve.recplot2.findPeaks.em}}).
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__emauto_one.Rd ADDED Viewed

@@ -0,0 +1,27 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.__emauto_one}
+\alias{enve.recplot2.findPeaks.__emauto_one}
+\title{Enveomics: Recruitment Plot (2) EMauto Peak Finder - Internal Ancillary Function}
+\usage{
+enve.recplot2.findPeaks.__emauto_one(x, comp, do_crit, best, verbose, ...)
+}
+\arguments{
+\item{x}{\code{\link{enve.RecPlot2}} object}
+\item{comp}{Components}
+\item{do_crit}{Function estimating the criterion}
+\item{best}{Best solution thus far}
+\item{verbose}{If verbose}
+\item{...}{Additional parameters for \code{\link{enve.recplot2.findPeaks.em}}}
+}
+\description{
+Internal ancillary function (see \code{\link{enve.recplot2.findPeaks.emauto}}).
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mow_one.Rd ADDED Viewed

@@ -0,0 +1,52 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.__mow_one}
+\alias{enve.recplot2.findPeaks.__mow_one}
+\title{Enveomics: Recruitment Plot (2) Mowing Peak Finder - Internal Ancillary Function 1}
+\usage{
+enve.recplot2.findPeaks.__mow_one(
+  lsd1,
+  min.points,
+  quant.est,
+  mlv.opts,
+  fitdist.opts,
+  with.skewness,
+  optim.rounds,
+  optim.epsilon,
+  n.total,
+  merge.logdist,
+  verbose,
+  log
+)
+}
+\arguments{
+\item{lsd1}{Vector of log-transformed sequencing depths}
+\item{min.points}{Minimum number of points}
+\item{quant.est}{Quantile estimate}
+\item{mlv.opts}{List of options for \code{mlv}}
+\item{fitdist.opts}{List of options for \code{fitdist}}
+\item{with.skewness}{If skewed-normal should be used}
+\item{optim.rounds}{Maximum number of optimization rounds}
+\item{optim.epsilon}{Minimum difference considered negligible}
+\item{n.total}{Global number of windows}
+\item{merge.logdist}{Attempted \code{merge.logdist} parameter}
+\item{verbose}{If verbose}
+\item{log}{If log-transformed depths}
+}
+\description{
+Internall ancillary function (see \code{\link{enve.recplot2.findPeaks.mower}}).
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mower.Rd ADDED Viewed

@@ -0,0 +1,17 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.__mower}
+\alias{enve.recplot2.findPeaks.__mower}
+\title{Enveomics: Recruitment Plot (2) Mowing Peak Finder - Internal Ancillary Function 2}
+\usage{
+enve.recplot2.findPeaks.__mower(peaks.opts)
+}
+\arguments{
+\item{peaks.opts}{List of options for \code{\link{enve.recplot2.findPeaks.__mow_one}}}
+}
+\description{
+Internal ancillary function (see \code{\link{enve.recplot2.findPeaks.mower}}).
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.em.Rd ADDED Viewed

@@ -0,0 +1,51 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.em}
+\alias{enve.recplot2.findPeaks.em}
+\title{Enveomics: Recruitment Plot (2) Em Peak Finder}
+\usage{
+enve.recplot2.findPeaks.em(
+  x,
+  max.iter = 1000,
+  ll.diff.res = 1e-08,
+  components = 2,
+  rm.top = 0.05,
+  verbose = FALSE,
+  init,
+  log = TRUE
+)
+}
+\arguments{
+\item{x}{An \code{\link{enve.RecPlot2}} object.}
+\item{max.iter}{Maximum number of EM iterations.}
+\item{ll.diff.res}{Maximum Log-Likelihood difference to be considered as convergent.}
+\item{components}{Number of distributions assumed in the mixture.}
+\item{rm.top}{Top-values to remove before finding peaks, as a quantile probability.
+This step is useful to remove highly conserved regions, but can be
+turned off by setting \code{rm.top=0}. The quantile is determined
+\strong{after} removing zero-coverage windows.}
+\item{verbose}{Display (mostly debugging) information.}
+\item{init}{Initialization parameters. By default, these are derived from k-means
+clustering. A named list with vectors for \code{mu}, \code{sd}, and
+\code{alpha}, each of length \code{components}.}
+\item{log}{Logical value indicating if the estimations should be performed in
+natural logarithm units. Do not change unless you know what you're
+doing.}
+}
+\value{
+Returns a list of \code{\link{enve.RecPlot2.Peak}} objects.
+}
+\description{
+Identifies peaks in the population histogram using a Gaussian Mixture
+Model Expectation Maximization (GMM-EM) method.
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.emauto.Rd ADDED Viewed

@@ -0,0 +1,43 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.emauto}
+\alias{enve.recplot2.findPeaks.emauto}
+\title{Enveomics: Recruitment Plot (2) Emauto Peak Finder}
+\usage{
+enve.recplot2.findPeaks.emauto(
+  x,
+  components = seq(1, 5),
+  criterion = "aic",
+  merge.tol = 2L,
+  verbose = FALSE,
+  ...
+)
+}
+\arguments{
+\item{x}{An \code{\link{enve.RecPlot2}} object.}
+\item{components}{A vector of number of components to evaluate.}
+\item{criterion}{Criterion to use for components selection. Must be one of:
+\code{aic} (Akaike Information Criterion), \code{bic} or \code{sbc}
+(Bayesian Information Criterion or Schwarz Criterion).}
+\item{merge.tol}{When attempting to merge peaks with very similar sequencing depth, use
+this number of significant digits (in log-scale).}
+\item{verbose}{Display (mostly debugging) information.}
+\item{...}{Any additional parameters supported by
+\code{\link{enve.recplot2.findPeaks.em}}.}
+}
+\value{
+Returns a list of \code{\link{enve.RecPlot2.Peak}} objects.
+}
+\description{
+Identifies peaks in the population histogram using a Gaussian Mixture
+Model Expectation Maximization (GMM-EM) method with number of components
+automatically detected.
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}

data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.mower.Rd ADDED Viewed

@@ -0,0 +1,82 @@
+% Generated by roxygen2: do not edit by hand
+% Please edit documentation in R/recplot2.R
+\name{enve.recplot2.findPeaks.mower}
+\alias{enve.recplot2.findPeaks.mower}
+\title{Enveomics: Recruitment Plot (2) Mowing Peak Finder}
+\usage{
+enve.recplot2.findPeaks.mower(
+  x,
+  min.points = 10,
+  quant.est = c(0.002, 0.998),
+  mlv.opts = list(method = "parzen"),
+  fitdist.opts.sn = list(distr = "sn", method = "qme", probs = c(0.1, 0.5, 0.8), start =
+    list(omega = 1, alpha = -1), lower = c(0, -Inf, -Inf)),
+  fitdist.opts.norm = list(distr = "norm", method = "qme", probs = c(0.4, 0.6), start =
+    list(sd = 1), lower = c(0, -Inf)),
+  rm.top = 0.05,
+  with.skewness = TRUE,
+  optim.rounds = 200,
+  optim.epsilon = 1e-04,
+  merge.logdist = log(1.75),
+  verbose = FALSE,
+  log = TRUE
+)
+}
+\arguments{
+\item{x}{An \code{\link{enve.RecPlot2}} object.}
+\item{min.points}{Minimum number of points in the quantile-estimation-range
+\code{(quant.est)} to estimate a peak.}
+\item{quant.est}{Range of quantiles to be used in the estimation of a peak's
+parameters.}
+\item{mlv.opts}{Ignored. For backwards compatibility.}
+\item{fitdist.opts.sn}{Options passed to \code{fitdist} to estimate the standard deviation if
+\code{with.skewness=TRUE}. Note that the \code{start} parameter will be
+ammended with \code{xi=estimated} mode for each peak.}
+\item{fitdist.opts.norm}{Options passed to \code{fitdist} to estimate the standard deviation if
+\code{with.skewness=FALSE}. Note that the \code{start} parameter will be
+ammended with \code{mean=estimated} mode for each peak.}
+\item{rm.top}{Top-values to remove before finding peaks, as a quantile probability.
+This step is useful to remove highly conserved regions, but can be
+turned off by setting \code{rm.top=0}. The quantile is determined
+\strong{after} removing zero-coverage windows.}
+\item{with.skewness}{Allow skewness correction of the peaks. Typically, the
+sequencing-depth distribution for a single peak is left-skewed, due
+partly (but not exclusively) to fragmentation and mapping sensitivity.
+See \emph{Lindner et al 2013, Bioinformatics 29(10):1260-7} for an
+alternative solution for the first problem (fragmentation) called
+"tail distribution".}
+\item{optim.rounds}{Maximum rounds of peak optimization.}
+\item{optim.epsilon}{Trace change at which optimization stops (unless \code{optim.rounds} is
+reached first). The trace change is estimated as the sum of square
+differences between parameters in one round and those from two rounds
+earlier (to avoid infinite loops from approximation).}
+\item{merge.logdist}{Maximum value of \code{|log-ratio|} between centrality parameters in peaks
+to attempt merging. The default of ~0.22 corresponds to a maximum
+difference of 25\%.}
+\item{verbose}{Display (mostly debugging) information.}
+\item{log}{Logical value indicating if the estimations should be performed in
+natural logarithm units. Do not change unless you know what you're
+doing.}
+}
+\value{
+Returns a list of \code{\link{enve.RecPlot2.Peak}} objects.
+}
+\description{
+Identifies peaks in the population histogram potentially indicating
+sub-population mixtures, using a custom distribution-mowing method.
+}
+\author{
+Luis M. Rodriguez-R [aut, cre]
+}