RubyGems - miga-base - Versions diffs - 0.7.26.0 → 1.0.0.1 - Mend

miga-base 0.7.26.0 → 1.0.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (337) hide show

checksums.yaml +4 -4
data/lib/miga/_data/aai-intax.blast.tsv.gz +0 -0
data/lib/miga/_data/aai-intax.diamond.tsv.gz +0 -0
data/lib/miga/_data/aai-novel.blast.tsv.gz +0 -0
data/lib/miga/_data/aai-novel.diamond.tsv.gz +0 -0
data/lib/miga/cli/action/classify_wf.rb +2 -2
data/lib/miga/cli/action/derep_wf.rb +1 -1
data/lib/miga/cli/action/doctor.rb +57 -14
data/lib/miga/cli/action/doctor/base.rb +47 -23
data/lib/miga/cli/action/init.rb +11 -7
data/lib/miga/cli/action/init/files_helper.rb +1 -0
data/lib/miga/cli/action/ncbi_get.rb +3 -3
data/lib/miga/cli/action/tax_dist.rb +2 -2
data/lib/miga/cli/action/wf.rb +5 -4
data/lib/miga/common.rb +1 -0
data/lib/miga/daemon.rb +11 -4
data/lib/miga/dataset/result.rb +10 -6
data/lib/miga/json.rb +5 -4
data/lib/miga/metadata.rb +5 -1
data/lib/miga/parallel.rb +36 -0
data/lib/miga/project.rb +8 -8
data/lib/miga/project/base.rb +4 -4
data/lib/miga/project/result.rb +2 -2
data/lib/miga/sqlite.rb +10 -2
data/lib/miga/version.rb +23 -9
data/scripts/aai_distances.bash +16 -18
data/scripts/ani_distances.bash +16 -17
data/scripts/assembly.bash +31 -16
data/scripts/haai_distances.bash +3 -27
data/scripts/miga.bash +6 -4
data/scripts/p.bash +1 -1
data/scripts/read_quality.bash +9 -18
data/scripts/trimmed_fasta.bash +14 -30
data/scripts/trimmed_reads.bash +36 -36
data/test/parallel_test.rb +31 -0
data/test/project_test.rb +2 -1
data/test/remote_dataset_test.rb +1 -1
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Archaea_SCG.hmm +41964 -0
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Bacteria_SCG.hmm +32439 -0
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Complete_SCG_DB.hmm +62056 -0
data/utils/FastAAI/FastAAI/FastAAI +1336 -0
data/utils/FastAAI/README.md +84 -0
data/utils/FastAAI/kAAI_v1.0_virus.py +1296 -0
data/utils/distance/commands.rb +1 -0
data/utils/distance/database.rb +0 -1
data/utils/distance/runner.rb +2 -4
data/utils/enveomics/Docs/recplot2.md +244 -0
data/utils/enveomics/Examples/aai-matrix.bash +66 -0
data/utils/enveomics/Examples/ani-matrix.bash +66 -0
data/utils/enveomics/Examples/essential-phylogeny.bash +105 -0
data/utils/enveomics/Examples/unus-genome-phylogeny.bash +100 -0
data/utils/enveomics/LICENSE.txt +73 -0
data/utils/enveomics/Makefile +52 -0
data/utils/enveomics/Manifest/Tasks/aasubs.json +103 -0
data/utils/enveomics/Manifest/Tasks/blasttab.json +786 -0
data/utils/enveomics/Manifest/Tasks/distances.json +161 -0
data/utils/enveomics/Manifest/Tasks/fasta.json +802 -0
data/utils/enveomics/Manifest/Tasks/fastq.json +291 -0
data/utils/enveomics/Manifest/Tasks/graphics.json +126 -0
data/utils/enveomics/Manifest/Tasks/mapping.json +137 -0
data/utils/enveomics/Manifest/Tasks/ogs.json +382 -0
data/utils/enveomics/Manifest/Tasks/other.json +906 -0
data/utils/enveomics/Manifest/Tasks/remote.json +355 -0
data/utils/enveomics/Manifest/Tasks/sequence-identity.json +638 -0
data/utils/enveomics/Manifest/Tasks/tables.json +308 -0
data/utils/enveomics/Manifest/Tasks/trees.json +68 -0
data/utils/enveomics/Manifest/Tasks/variants.json +111 -0
data/utils/enveomics/Manifest/categories.json +165 -0
data/utils/enveomics/Manifest/examples.json +154 -0
data/utils/enveomics/Manifest/tasks.json +4 -0
data/utils/enveomics/Pipelines/assembly.pbs/CONFIG.mock.bash +69 -0
data/utils/enveomics/Pipelines/assembly.pbs/FastA.N50.pl +1 -0
data/utils/enveomics/Pipelines/assembly.pbs/FastA.filterN.pl +1 -0
data/utils/enveomics/Pipelines/assembly.pbs/FastA.length.pl +1 -0
data/utils/enveomics/Pipelines/assembly.pbs/README.md +189 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-2.bash +112 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-3.bash +23 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-4.bash +44 -0
data/utils/enveomics/Pipelines/assembly.pbs/RUNME.bash +50 -0
data/utils/enveomics/Pipelines/assembly.pbs/kSelector.R +37 -0
data/utils/enveomics/Pipelines/assembly.pbs/newbler.pbs +68 -0
data/utils/enveomics/Pipelines/assembly.pbs/newbler_preparator.pl +49 -0
data/utils/enveomics/Pipelines/assembly.pbs/soap.pbs +80 -0
data/utils/enveomics/Pipelines/assembly.pbs/stats.pbs +57 -0
data/utils/enveomics/Pipelines/assembly.pbs/velvet.pbs +63 -0
data/utils/enveomics/Pipelines/blast.pbs/01.pbs.bash +38 -0
data/utils/enveomics/Pipelines/blast.pbs/02.pbs.bash +73 -0
data/utils/enveomics/Pipelines/blast.pbs/03.pbs.bash +21 -0
data/utils/enveomics/Pipelines/blast.pbs/BlastTab.recover_job.pl +72 -0
data/utils/enveomics/Pipelines/blast.pbs/CONFIG.mock.bash +98 -0
data/utils/enveomics/Pipelines/blast.pbs/FastA.split.pl +1 -0
data/utils/enveomics/Pipelines/blast.pbs/README.md +127 -0
data/utils/enveomics/Pipelines/blast.pbs/RUNME.bash +109 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.check.bash +128 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.dry.bash +16 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.eo.bash +22 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.pause.bash +26 -0
data/utils/enveomics/Pipelines/blast.pbs/TASK.run.bash +89 -0
data/utils/enveomics/Pipelines/blast.pbs/sentinel.pbs.bash +29 -0
data/utils/enveomics/Pipelines/idba.pbs/README.md +49 -0
data/utils/enveomics/Pipelines/idba.pbs/RUNME.bash +95 -0
data/utils/enveomics/Pipelines/idba.pbs/run.pbs +56 -0
data/utils/enveomics/Pipelines/trim.pbs/README.md +54 -0
data/utils/enveomics/Pipelines/trim.pbs/RUNME.bash +70 -0
data/utils/enveomics/Pipelines/trim.pbs/run.pbs +130 -0
data/utils/enveomics/README.md +42 -0
data/utils/enveomics/Scripts/AAsubs.log2ratio.rb +171 -0
data/utils/enveomics/Scripts/Aln.cat.rb +221 -0
data/utils/enveomics/Scripts/Aln.convert.pl +35 -0
data/utils/enveomics/Scripts/AlphaDiversity.pl +152 -0
data/utils/enveomics/Scripts/BedGraph.tad.rb +93 -0
data/utils/enveomics/Scripts/BedGraph.window.rb +71 -0
data/utils/enveomics/Scripts/BlastPairwise.AAsubs.pl +102 -0
data/utils/enveomics/Scripts/BlastTab.addlen.rb +63 -0
data/utils/enveomics/Scripts/BlastTab.advance.bash +48 -0
data/utils/enveomics/Scripts/BlastTab.best_hit_sorted.pl +55 -0
data/utils/enveomics/Scripts/BlastTab.catsbj.pl +104 -0
data/utils/enveomics/Scripts/BlastTab.cogCat.rb +76 -0
data/utils/enveomics/Scripts/BlastTab.filter.pl +47 -0
data/utils/enveomics/Scripts/BlastTab.kegg_pep2path_rest.pl +194 -0
data/utils/enveomics/Scripts/BlastTab.metaxaPrep.pl +104 -0
data/utils/enveomics/Scripts/BlastTab.pairedHits.rb +157 -0
data/utils/enveomics/Scripts/BlastTab.recplot2.R +48 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth.pl +86 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth_ZIP.pl +119 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth_nomedian.pl +86 -0
data/utils/enveomics/Scripts/BlastTab.subsample.pl +47 -0
data/utils/enveomics/Scripts/BlastTab.sumPerHit.pl +114 -0
data/utils/enveomics/Scripts/BlastTab.taxid2taxrank.pl +90 -0
data/utils/enveomics/Scripts/BlastTab.topHits_sorted.rb +101 -0
data/utils/enveomics/Scripts/Chao1.pl +97 -0
data/utils/enveomics/Scripts/CharTable.classify.rb +234 -0
data/utils/enveomics/Scripts/EBIseq2tax.rb +83 -0
data/utils/enveomics/Scripts/FastA.N50.pl +60 -0
data/utils/enveomics/Scripts/FastA.extract.rb +152 -0
data/utils/enveomics/Scripts/FastA.filter.pl +52 -0
data/utils/enveomics/Scripts/FastA.filterLen.pl +28 -0
data/utils/enveomics/Scripts/FastA.filterN.pl +60 -0
data/utils/enveomics/Scripts/FastA.fragment.rb +100 -0
data/utils/enveomics/Scripts/FastA.gc.pl +42 -0
data/utils/enveomics/Scripts/FastA.interpose.pl +93 -0
data/utils/enveomics/Scripts/FastA.length.pl +38 -0
data/utils/enveomics/Scripts/FastA.mask.rb +89 -0
data/utils/enveomics/Scripts/FastA.per_file.pl +36 -0
data/utils/enveomics/Scripts/FastA.qlen.pl +57 -0
data/utils/enveomics/Scripts/FastA.rename.pl +65 -0
data/utils/enveomics/Scripts/FastA.revcom.pl +23 -0
data/utils/enveomics/Scripts/FastA.sample.rb +98 -0
data/utils/enveomics/Scripts/FastA.slider.pl +85 -0
data/utils/enveomics/Scripts/FastA.split.pl +55 -0
data/utils/enveomics/Scripts/FastA.split.rb +79 -0
data/utils/enveomics/Scripts/FastA.subsample.pl +131 -0
data/utils/enveomics/Scripts/FastA.tag.rb +65 -0
data/utils/enveomics/Scripts/FastA.toFastQ.rb +69 -0
data/utils/enveomics/Scripts/FastA.wrap.rb +48 -0
data/utils/enveomics/Scripts/FastQ.filter.pl +54 -0
data/utils/enveomics/Scripts/FastQ.interpose.pl +90 -0
data/utils/enveomics/Scripts/FastQ.maskQual.rb +89 -0
data/utils/enveomics/Scripts/FastQ.offset.pl +90 -0
data/utils/enveomics/Scripts/FastQ.split.pl +53 -0
data/utils/enveomics/Scripts/FastQ.tag.rb +70 -0
data/utils/enveomics/Scripts/FastQ.test-error.rb +81 -0
data/utils/enveomics/Scripts/FastQ.toFastA.awk +24 -0
data/utils/enveomics/Scripts/GFF.catsbj.pl +127 -0
data/utils/enveomics/Scripts/GenBank.add_fields.rb +84 -0
data/utils/enveomics/Scripts/HMM.essential.rb +351 -0
data/utils/enveomics/Scripts/HMM.haai.rb +168 -0
data/utils/enveomics/Scripts/HMMsearch.extractIds.rb +83 -0
data/utils/enveomics/Scripts/JPlace.distances.rb +88 -0
data/utils/enveomics/Scripts/JPlace.to_iToL.rb +320 -0
data/utils/enveomics/Scripts/M5nr.getSequences.rb +81 -0
data/utils/enveomics/Scripts/MeTaxa.distribution.pl +198 -0
data/utils/enveomics/Scripts/MyTaxa.fragsByTax.pl +35 -0
data/utils/enveomics/Scripts/MyTaxa.seq-taxrank.rb +49 -0
data/utils/enveomics/Scripts/NCBIacc2tax.rb +92 -0
data/utils/enveomics/Scripts/Newick.autoprune.R +27 -0
data/utils/enveomics/Scripts/RAxML-EPA.to_iToL.pl +228 -0
data/utils/enveomics/Scripts/RecPlot2.compareIdentities.R +32 -0
data/utils/enveomics/Scripts/RefSeq.download.bash +48 -0
data/utils/enveomics/Scripts/SRA.download.bash +55 -0
data/utils/enveomics/Scripts/TRIBS.plot-test.R +36 -0
data/utils/enveomics/Scripts/TRIBS.test.R +39 -0
data/utils/enveomics/Scripts/Table.barplot.R +31 -0
data/utils/enveomics/Scripts/Table.df2dist.R +30 -0
data/utils/enveomics/Scripts/Table.filter.pl +61 -0
data/utils/enveomics/Scripts/Table.merge.pl +77 -0
data/utils/enveomics/Scripts/Table.prefScore.R +60 -0
data/utils/enveomics/Scripts/Table.replace.rb +69 -0
data/utils/enveomics/Scripts/Table.round.rb +63 -0
data/utils/enveomics/Scripts/Table.split.pl +57 -0
data/utils/enveomics/Scripts/Taxonomy.silva2ncbi.rb +227 -0
data/utils/enveomics/Scripts/VCF.KaKs.rb +147 -0
data/utils/enveomics/Scripts/VCF.SNPs.rb +88 -0
data/utils/enveomics/Scripts/aai.rb +419 -0
data/utils/enveomics/Scripts/ani.rb +362 -0
data/utils/enveomics/Scripts/anir.rb +137 -0
data/utils/enveomics/Scripts/clust.rand.rb +102 -0
data/utils/enveomics/Scripts/gi2tax.rb +103 -0
data/utils/enveomics/Scripts/in_silico_GA_GI.pl +96 -0
data/utils/enveomics/Scripts/lib/data/dupont_2012_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/data/lee_2019_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/enveomics.R +1 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/anir.rb +293 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/bm_set.rb +175 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/enveomics.rb +24 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/errors.rb +17 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/gmm_em.rb +30 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/jplace.rb +253 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/match.rb +63 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/og.rb +182 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/rbm.rb +49 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/remote_data.rb +74 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/seq_range.rb +237 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats.rb +3 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/rand.rb +31 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/sample.rb +152 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/utils.rb +73 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/vcf.rb +135 -0
data/utils/enveomics/Scripts/ogs.annotate.rb +88 -0
data/utils/enveomics/Scripts/ogs.core-pan.rb +160 -0
data/utils/enveomics/Scripts/ogs.extract.rb +125 -0
data/utils/enveomics/Scripts/ogs.mcl.rb +186 -0
data/utils/enveomics/Scripts/ogs.rb +104 -0
data/utils/enveomics/Scripts/ogs.stats.rb +131 -0
data/utils/enveomics/Scripts/rbm-legacy.rb +172 -0
data/utils/enveomics/Scripts/rbm.rb +100 -0
data/utils/enveomics/Scripts/sam.filter.rb +148 -0
data/utils/enveomics/Tests/Makefile +10 -0
data/utils/enveomics/Tests/Mgen_M2288.faa +3189 -0
data/utils/enveomics/Tests/Mgen_M2288.fna +8282 -0
data/utils/enveomics/Tests/Mgen_M2321.fna +8288 -0
data/utils/enveomics/Tests/Nequ_Kin4M.faa +2970 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.tribs.Rdata +0 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.txt +7 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai-mat.tsv +17 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai.tsv +137 -0
data/utils/enveomics/Tests/a_mg.cds-go.blast.tsv +123 -0
data/utils/enveomics/Tests/a_mg.reads-cds.blast.tsv +200 -0
data/utils/enveomics/Tests/a_mg.reads-cds.counts.tsv +55 -0
data/utils/enveomics/Tests/alkB.nwk +1 -0
data/utils/enveomics/Tests/anthrax-cansnp-data.tsv +13 -0
data/utils/enveomics/Tests/anthrax-cansnp-key.tsv +17 -0
data/utils/enveomics/Tests/hiv1.faa +59 -0
data/utils/enveomics/Tests/hiv1.fna +134 -0
data/utils/enveomics/Tests/hiv2.faa +70 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv +233 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.lim +1 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.rec +233 -0
data/utils/enveomics/Tests/phyla_counts.tsv +10 -0
data/utils/enveomics/Tests/primate_lentivirus.ogs +11 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv1.rbm +9 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv2.rbm +8 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-siv.rbm +6 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-hiv2.rbm +9 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-siv.rbm +6 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/siv-siv.rbm +6 -0
data/utils/enveomics/build_enveomics_r.bash +45 -0
data/utils/enveomics/enveomics.R/DESCRIPTION +31 -0
data/utils/enveomics/enveomics.R/NAMESPACE +39 -0
data/utils/enveomics/enveomics.R/R/autoprune.R +155 -0
data/utils/enveomics/enveomics.R/R/barplot.R +184 -0
data/utils/enveomics/enveomics.R/R/cliopts.R +135 -0
data/utils/enveomics/enveomics.R/R/df2dist.R +154 -0
data/utils/enveomics/enveomics.R/R/growthcurve.R +331 -0
data/utils/enveomics/enveomics.R/R/prefscore.R +79 -0
data/utils/enveomics/enveomics.R/R/recplot.R +354 -0
data/utils/enveomics/enveomics.R/R/recplot2.R +1631 -0
data/utils/enveomics/enveomics.R/R/tribs.R +583 -0
data/utils/enveomics/enveomics.R/R/utils.R +80 -0
data/utils/enveomics/enveomics.R/README.md +81 -0
data/utils/enveomics/enveomics.R/data/growth.curves.rda +0 -0
data/utils/enveomics/enveomics.R/data/phyla.counts.rda +0 -0
data/utils/enveomics/enveomics.R/man/cash-enve.GrowthCurve-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2.Peak-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/enve.GrowthCurve-class.Rd +25 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBS-class.Rd +46 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBS.merge.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBStest-class.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.__prune.iter.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.__prune.reduce.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.__tribs.Rd +40 -0
data/utils/enveomics/enveomics.R/man/enve.barplot.Rd +103 -0
data/utils/enveomics/enveomics.R/man/enve.cliopts.Rd +67 -0
data/utils/enveomics/enveomics.R/man/enve.col.alpha.Rd +24 -0
data/utils/enveomics/enveomics.R/man/enve.col2alpha.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.group.Rd +44 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.list.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.growthcurve.Rd +75 -0
data/utils/enveomics/enveomics.R/man/enve.prefscore.Rd +50 -0
data/utils/enveomics/enveomics.R/man/enve.prune.dist.Rd +44 -0
data/utils/enveomics/enveomics.R/man/enve.recplot.Rd +139 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2-class.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.ANIr.Rd +24 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.Rd +77 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__counts.Rd +25 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__peakHist.Rd +21 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__whichClosestPeak.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.changeCutoff.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.compareIdentities.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.coordinates.Rd +29 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.corePeak.Rd +18 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.extractWindows.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.Rd +36 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_e.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_m.Rd +19 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__emauto_one.Rd +27 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mow_one.Rd +52 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mower.Rd +17 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.em.Rd +51 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.emauto.Rd +43 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.mower.Rd +82 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.peak-class.Rd +59 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.seqdepth.Rd +27 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.windowDepthThreshold.Rd +36 -0
data/utils/enveomics/enveomics.R/man/enve.selvector.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.tribs.Rd +68 -0
data/utils/enveomics/enveomics.R/man/enve.tribs.test.Rd +28 -0
data/utils/enveomics/enveomics.R/man/enve.truncate.Rd +27 -0
data/utils/enveomics/enveomics.R/man/growth.curves.Rd +14 -0
data/utils/enveomics/enveomics.R/man/phyla.counts.Rd +13 -0
data/utils/enveomics/enveomics.R/man/plot.enve.GrowthCurve.Rd +78 -0
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBS.Rd +46 -0
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBStest.Rd +45 -0
data/utils/enveomics/enveomics.R/man/plot.enve.recplot2.Rd +125 -0
data/utils/enveomics/enveomics.R/man/summary.enve.GrowthCurve.Rd +19 -0
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBS.Rd +19 -0
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBStest.Rd +19 -0
data/utils/enveomics/globals.mk +8 -0
data/utils/enveomics/manifest.json +9 -0
data/utils/multitrim/Multitrim How-To.pdf +0 -0
data/utils/multitrim/README.md +67 -0
data/utils/multitrim/multitrim.py +1555 -0
data/utils/multitrim/multitrim.yml +13 -0
data/utils/requirements.txt +4 -3
metadata +304 -3

data/utils/enveomics/Manifest/Tasks/distances.json ADDED Viewed

@@ -0,0 +1,161 @@
+{
+  "tasks": [
+    {
+      "task": "TRIBS.test.R",
+      "description": ["Estimates the empirical difference between all the",
+        "distances in a set of objects and a subset, together with its",
+        "statistical significance."],
+      "help_arg": "--help",
+      "requires": [
+        { "r_package": "optparse" },
+        { "r_package": "enveomics.R" }
+      ],
+      "see_also": ["TRIBS.plot-test.R"],
+      "options": [
+        {
+          "opt": "--dist",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "A tab-delimited matrix of distances."
+        },
+        {
+          "opt": "--selection",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "A list of names with the selection to evaluate."
+        },
+        {
+          "opt": "--replicates",
+          "arg": "integer",
+          "default": 1000,
+          "description": "Number of replications per point."
+        },
+        {
+          "opt": "--summary-fx",
+          "arg": "string",
+          "description": ["Function to summarize the distance distributions in",
+            "a given replicate. By default, the median distance is estimated."]
+        },
+        {
+          "opt": "--dist-method",
+          "arg": "string",
+          "default": "euclidean",
+          "description": ["Distance method between random points and samples",
+            "in the transformed space. See the R function 'dist'."]
+        },
+        {
+          "opt": "--dimensions",
+          "arg": "integer",
+          "description": ["Dimensions to use in the NMDS. By default, 5% of",
+            "the selection length."]
+        },
+        {
+          "opt": "--threads",
+          "arg": "integer",
+          "default": 2,
+          "description": "Number of threads to use."
+        },
+        {
+          "opt": "--verbosity",
+          "arg": "integer",
+          "default": 1,
+          "description": ["Verbosity. Use 0 to run quietly, increase for",
+            "additional information."]
+        },
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output file with the TRIBS test R object."
+        },
+        {
+          "name": "Bins",
+          "arg": "integer",
+          "default": 50,
+          "description": "Number of bins to evaluate in the range of distances."
+        }
+      ]
+    },
+    {
+      "task": "TRIBS.plot-test.R",
+      "description": "Plots an `enve.TRIBStest` object.",
+      "requires": [
+        { "r_package": "optparse" },
+        { "r_package": "enveomics.R" }
+      ],
+      "see_also": ["TRIBS.test.R"],
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input TRIBS Test",
+          "opt": "--x",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "'enve.TRIBStest' object to plot."
+        },
+        {
+          "opt": "--type",
+          "arg": "select",
+          "values": ["overlap","difference"],
+          "default": "overlap",
+          "description": ["What to plot. 'overlap' generates a plot of the two",
+            "contrasting empirical PDFs (to compare against each other),",
+            "'difference' produces a plot of the differences between the",
+            "empirical PDFs (to compare against zero)."]
+        },
+        {
+          "opt": "--col",
+          "arg": "string",
+          "default": "#00000044",
+          "description": "Main color of the plot if type='difference'."
+        },
+        {
+          "opt": "--col1",
+          "arg": "string",
+          "description": ["First color of the plot if 'Type' is overlap. 'Col'",
+            "by default."]
+        },
+        {
+          "opt": "--col2",
+          "arg": "string",
+          "default": "#44001144",
+          "description": "Second color of the plot if 'Type' is overlap."
+        },
+        {
+          "opt": "--ylab",
+          "arg": "string",
+          "default": "Probability",
+          "description": "Y-axis label."
+        },
+        {
+          "opt": "--xlim",
+          "arg": "string",
+          "description": "X-axis limits, separate values by comma."
+        },
+        {
+          "opt": "--ylim",
+          "arg": "string",
+          "description": "Y-axis limits, separate values by comma."
+        },
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output file in PDF format."
+        },
+        {
+          "name": "Width",
+          "arg": "float",
+          "default": 7.0,
+          "mandatory": true,
+          "description": "Width of the plot in inches."
+        },
+        {
+          "name": "Height",
+          "arg": "float",
+          "default": 7.0,
+          "mandatory": true,
+          "description": "Height of the plot in inches."
+        }
+      ]
+    }
+  ]
+}

data/utils/enveomics/Manifest/Tasks/fasta.json ADDED Viewed

@@ -0,0 +1,802 @@
+{
+  "tasks": [
+    {
+      "task": "FastA.N50.pl",
+      "description": ["Calculates the N50 value of a set of sequences.",
+        "Alternatively, it can calculate other N** values. It also calculates",
+        "the total number of sequences, the total added length, and the",
+        "longest sequence length."],
+      "help_arg": "",
+      "see_also": ["FastA.length.pl"],
+      "options": [
+        {
+          "name": "Sequences",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "A FastA file containing the sequences."
+        },
+        {
+          "name": "Minimum length",
+          "arg": "integer",
+          "description": "Minimum length to take into consideration.",
+          "default": 0
+        },
+        {
+          "name": "NXX",
+          "arg": "integer",
+          "description": "Value NXX to calculate.",
+          "default": 50
+        }
+      ]
+    },
+    {
+      "task": "FastA.filter.pl",
+      "description": "Extracts a subset of sequences from a FastA file.",
+      "help_arg": "-h",
+      "see_also": ["FastQ.filter.pl"],
+      "options": [
+        {
+          "opt": "-r",
+          "description": ["Reverse list. Extracts sequences NOT present in the",
+            "list."]
+        },
+        {
+          "opt": "-q",
+          "description": "Runs quietly."
+        },
+        {
+          "name": "List",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "List of sequences to extract."
+        },
+        {
+          "name": "Sequences",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "FastA file containing the superset of sequences."
+        },
+        ">",
+        {
+          "name": "Subset",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "FastA file to be created."
+        }
+      ]
+    },
+    {
+      "task": "FastA.filterLen.pl",
+      "description": "Filters a multi-FastA file by length.",
+      "requires": [ { "perl_lib": "Bio::SeqIO" } ],
+      "cite": [["Stajich et al, 2002, GRes",
+        "http://dx.doi.org/10.1101/gr.361602"]],
+      "help_arg": "",
+      "options": [
+        {
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input FastA file."
+        },
+        {
+          "name": "Minimum length",
+          "arg": "integer",
+          "mandatory": true,
+          "description": "Minimum length to report a sequence."
+        },
+        ">",
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Filtered FastA file."
+        }
+      ]
+    },
+    {
+      "task": "FastA.filterN.pl",
+      "description": ["Filter sequences by N-content and presence of long",
+        "homopolymers."],
+      "help_arg": "",
+      "options": [
+        {
+          "name": "Sequences",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input file in FastA format."
+        },
+        {
+          "name": "Content",
+          "arg": "float",
+          "default": 0.5,
+          "mandatory": true,
+          "description": ["A number between 0 and 1 indicating the maximum",
+            "proportion of Ns (1 to turn off, 0.5 by default)."]
+        },
+        {
+          "name": "Stretch",
+          "arg": "integer",
+          "default": 100,
+          "description": ["A number indicating the maximum number of",
+            "consecutive identical nucleotides allowed (0 to turn off, 100 by",
+            "default)."]
+        },
+        ">",
+        {
+          "name": "Filtered",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Filtered set of sequences."
+        }
+      ]
+    },
+    {
+      "task": "FastA.gc.pl",
+      "description": "Estimates the G+C content of sequences.",
+      "help_arg": "",
+      "options": [
+        {
+          "name": "seqs.fa",
+          "arg": "in_file",
+          "multiple_sep": " ",
+          "mandatory": true,
+          "description": "One or more FastA files."
+        },
+        ">",
+        {
+          "name": "gc.txt",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "A table with the G+C content of the sequences."
+        }
+      ]
+    },
+    {
+      "task": "FastA.interpose.pl",
+      "description": ["Interpose sequences in FastA format from two files into",
+        "one output file. If more than two files are provided, the script will",
+        "interpose all the input files."],
+      "see_also": ["FastA.split.rb","FastQ.interpose.pl"],
+      "warn": ["Please note that this script will check for the consistency of",
+        "the names (assuming a pair of related reads contains the same name",
+        "varying only in a trailing slash (/) followed by a digit. If you want",
+        "to turn this feature off just set the checking period to zero. If",
+        "you want to decrease the sampling period (to speed the script up) or",
+        "increase it (to make it more sensitive to errors) just change the ",
+        "checking period accordingly."],
+      "help_arg": "",
+      "options": [
+        {
+          "name": "Checking period",
+          "opt": "-T",
+          "arg": "integer",
+          "default": 1000,
+          "description": "Sampling period for names evaluation."
+        },
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output FastA file."
+        },
+        {
+          "name": "Input FastA 1",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "First FastA file."
+        },
+        {
+          "name": "Input FastA 2",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Second FastA file."
+        },
+        {
+          "name": "Additional FastA",
+          "arg": "in_file",
+          "multiple_sep": " ",
+          "description": "Any additional FastA files (or none)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.length.pl",
+      "description": "Returns the length of sequences in (multi-)FastA.",
+      "see_also": ["FastA.N50.pl"],
+      "help_arg": "",
+      "options": [
+        {
+          "arg": "in_file",
+          "multiple_sep": " ",
+          "mandatory": true,
+          "description": "One or more FastA files."
+        },
+        ">",
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "A table with the lengths of the sequences."
+        }
+      ]
+    },
+    {
+      "task": "FastA.mask.rb",
+      "description": "Mask sequence region(s) in a FastA file.",
+      "help_arg": "--help",
+      "options": [
+        {
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input FastA file."
+        },
+        {
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output FastA file."
+        },
+        {
+          "opt": "--regions",
+          "arg": "string",
+          "mandatory": true,
+          "description": ["Regions to mask separated by commas.",
+            "Each region must be in the format \"sequence_id:from..to\"."]
+        },
+        {
+          "opt": "--symbol",
+          "arg": "string",
+          "default": "N",
+          "description": "Character used to mask the region(s)."
+        },
+        {
+          "opt": "--trim",
+          "description": ["Trim masked regions extending to the edge of a",
+            "sequence."]
+        },
+        {
+          "opt": "--wrap",
+          "arg": "integer",
+          "default": 70,
+          "description": ["Line length to wrap sequences. Use 0 to generate",
+            "1-line sequences."]
+        }
+      ]
+    },
+    {
+      "task": "FastA.qlen.pl",
+      "description": ["Calculates the quartiles of the length in a set of",
+        "sequences. The Q2 is also known as the median. Q0 is the minimum",
+        "length, and Q4 is the maximum length. It also calculates TOTAL, the",
+        "added length of the sequences in the file, and AVG, the average",
+        "length."],
+      "help_arg": "",
+      "options": [
+        {
+          "name": "Sequences",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "A FastA file containing the sequences."
+        },
+        {
+          "name": "Minimum Length",
+          "arg": "integer",
+          "default": 0,
+          "description": "The minimum length to take into consideration."
+        }
+      ]
+    },
+    {
+      "task": "FastA.rename.pl",
+      "description": "Renames a set of sequences in FastA format.",
+      "help_arg": "-h",
+      "options": [
+        {
+          "name": "Filter list",
+          "opt": "-f",
+          "description": "Ignore sequences NOT present in the list."
+        },
+        {
+          "name": "Quiet",
+          "opt": "-q",
+          "description": "Runs quietly."
+        },
+        {
+          "name": "List.txt",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": ["Tab-delimited list of sequences, with the original",
+            "ID in the first column and the ID to use in the second."]
+        },
+        {
+          "name": "Seqs.fa",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "FastA file containing the superset of sequences."
+        },
+        ">",
+        {
+          "name": "Renamed.fa",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "FastA file to be created."
+        }
+      ]
+    },
+    {
+      "task": "FastA.revcom.pl",
+      "description": "Reverse-complement sequences in FastA format.",
+      "requires": [ { "perl_lib": "Bio::SeqIO" } ],
+      "cite": [["Stajich et al, 2002, GRes",
+        "http://dx.doi.org/10.1101/gr.361602"]],
+      "help_arg": "--help",
+      "options": [
+        "<",
+        {
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input file in FastA format."
+        },
+        ">",
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output file in FastA format."
+        }
+      ]
+    },
+    {
+      "task": "FastA.sample.rb",
+      "description": ["Samples a random set of sequences from a multi-FastA",
+        "file."],
+      "help_arg": "--help",
+      "see_also": "FastA.subsample.pl",
+      "options": [
+        {
+          "name": "Input File",
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input FastA file (supports .gz compression)."
+        },
+        {
+          "name": "Output file",
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output FastA file (supports .gz compression)."
+        },
+        {
+          "opt": "--fraction",
+          "arg": "float",
+          "description": ["Fraction of sequences to sample [0-1].",
+            "Mandatory unless Number is provided."]
+        },
+        {
+          "opt": "--number",
+          "arg": "integer",
+          "description": ["Number of sequences to sample.",
+            "Mandatory unless -f is provided."]
+        },
+        {
+          "opt": "--replacement",
+          "description": "Sample with replacement."
+        },
+        {
+          "opt": "--quiet",
+          "description": "Run quietly (no STDERR output)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.slider.pl",
+      "description": "Slices sequences in fixed- or variable-length windows.",
+      "help_arg": "-help",
+      "options": [
+        {
+          "opt": "-seq",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input file in FastA format."
+        },
+        {
+          "opt": "-out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output file in FastA format."
+        },
+        {
+          "opt": "-win",
+          "arg": "integer",
+          "default": 18,
+          "description": "Window size."
+        },
+        {
+          "opt": "-step",
+          "arg": "integer",
+          "default": 1,
+          "description": "Step size."
+        },
+        {
+          "name": "Length error",
+          "opt": "-lerr",
+          "arg": "integer",
+          "default": 2,
+          "description": "Expected error in chunks length."
+        },
+        {
+          "opt": "-comm",
+          "arg": "select",
+          "values": [0,1],
+          "default": 0,
+          "description": ["Generate FastA comments (leaded by semi-colon) to",
+            "separate input sequences. Set to 0 for no-comments, to 1 for",
+            "comments."]
+        },
+        {
+          "opt": "-short",
+          "arg": "select",
+          "values": [0,1],
+          "default": 0,
+          "description": ["Use chunks shorter than the window size 'as is'.",
+            "Set to 0 to discard those chunks, to 1 to use them."]
+        }
+      ]
+    },
+    {
+      "task": "FastA.split.rb",
+      "description": ["Evenly splits a multi-FastA file into multiple",
+        "multi-FastA files."],
+      "see_also": ["FastA.interpose.pl","FastQ.split.pl"],
+      "help_arg": "--help",
+      "options": [
+        {
+          "opt": "--input",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input FastA file."
+        },
+        {
+          "opt": "--prefix",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Prefix of output FastA files."
+        },
+        {
+          "opt": "--number",
+          "arg": "integer",
+          "default": 12,
+          "description": "Number of output files to produce."
+        },
+        {
+          "opt": "--zero-padded",
+          "description": "Use zero-padded numbers as output index."
+        },
+        {
+          "opt": "--lowercase-letters",
+          "description": "Use lowercase letters as output index."
+        },
+        {
+          "name": "Output format",
+          "opt": "--out",
+          "arg": "string",
+          "default": "%s.%s.fa",
+          "description": ["Format of output filenames, where %s are replaced",
+            "by prefix and index."]
+        },
+        {
+          "opt": "--quiet",
+          "description": "Run quietly (no STDERR output)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.split.pl",
+      "description": "Splits a FastA file into two or more files.",
+      "warn": "Deprecated in favor of FastA.split.rb.",
+      "see_also": ["FastA.split.rb","FastA.interpose.pl","FastQ.split.pl"],
+      "help_arg": "",
+      "options": [
+        {
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input file in FastA format."
+        },
+        {
+          "name": "Out base",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": ["Prefix for the name of the output files. It will be",
+            "appended with .<i>.fa, where <i> is a consecutive number starting",
+            "in 1."]
+        },
+        {
+          "name": "Number of files",
+          "arg": "integer",
+          "default": 12,
+          "description": "Number of files to generate."
+        }
+      ]
+    },
+    {
+      "task": "FastA.subsample.pl",
+      "description": "Subsamples a set of sequences.",
+      "help_arg": "-h",
+      "see_also": "FastA.sample.rb",
+      "options": [
+        {
+          "name": "Fraction",
+          "opt": "-f",
+          "arg": "string",
+          "default": "10",
+          "description": ["Fraction of the library to be sampled (as",
+            "percentage). It can include several values (separated by comma),",
+            "as well as ranges of values in the form 'from-to/by'. For",
+            "example, the -f value 1-5/1,10-50/10,75,99 will produce 12",
+            "subsamples with expected fractions 1%, 2%, 3%, 4%, 5%, 10%, 20%,",
+            "30%, 40%, 50%, 75%, and 99%."]
+        },
+        {
+          "name": "Replicates",
+          "opt": "-r",
+          "arg": "integer",
+          "default": 1,
+          "description": "Number of replicates per fraction."
+        },
+        {
+          "name": "Out base",
+          "opt": "-o",
+          "arg": "out_file",
+          "description": ["Prefix of the output files to be created. The",
+            "output files will have a suffix of the form",
+            "'.fraction-replicate.fa', where 'fraction' is the percentage",
+            "sampled and 'replicate' is an increasing integer for replicates",
+            "of the same fraction. By default: Path to the input file."]
+        },
+        {
+          "name": "Force",
+          "opt": "-F",
+          "description": "Force overwriting output file(s)."
+        },
+        {
+          "name": "Zeroes",
+          "opt": "-z",
+          "description": ["Include leading zeroes in the numeric parts of the",
+            "output files (e.g., file.002.50-01.fa instead of file.2.50-1.fa),",
+            "so that alphabetic sorting of files reflects the sampled",
+            "fraction."]
+        },
+        {
+          "name": "Quiet",
+          "opt": "-q",
+          "description": "Run quietly."
+        },
+        {
+          "arg": "in_file",
+          "mandatory": true,
+          "multiple_sep": " ",
+          "description": "Input multi-FastA file(s)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.tag.rb",
+      "description": "Generates easy-to-parse tagged reads from FastA files.",
+      "see_also": ["FastQ.tag.rb"],
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input file",
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "FastA file containing the sequences."
+        },
+        {
+          "name": "Output file",
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "FastA file to create."
+        },
+        {
+          "opt": "--prefix",
+          "arg": "string",
+          "description": "Prefix to use in all IDs."
+        },
+        {
+          "opt": "--suffix",
+          "arg": "string",
+          "description": "Suffix to use in all IDs."
+        },
+        {
+          "opt": "--defline",
+          "description": "Keep the original defline after a space."
+        },
+        {
+          "opt": "--list",
+          "arg": "in_file",
+          "description": "Reads a list of IDS."
+        },
+        {
+          "opt": "--quiet",
+          "description": "Run quietly (no STDERR output)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.per_file.pl",
+      "description": ["Extracts all the sequences in a multi-FastA into",
+        "multiple single-FastA files."],
+      "see_also": "FastA.split.rb",
+      "help_arg": "",
+      "options": [
+        {
+          "arg": "out_dir",
+          "mandatory": true,
+          "description": "Output directory for the individual files."
+        },
+        {
+          "arg": "in_file",
+          "mandatory": true,
+          "multiple_sep": " ",
+          "description": "Input multi-FastA file(s)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.extract.rb",
+      "description": ["Extracts a list of sequences and/or coordinates from",
+        "multi-FastA files."],
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input file",
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input FastA file."
+        },
+        {
+          "name": "Output file",
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output FastA file."
+        },
+        {
+          "name": "Coordinates",
+          "opt": "--coords",
+          "arg": "string",
+          "description": ["Comma-delimited list of coordinates (mandatory",
+            "unless -C is passed).",
+            "The format of the coordinates is SEQ:FROM..TO or SEQ:FROM~LEN:",
+            "SEQ: Sequence ID, or * (asterisk) to extract range from all",
+              "sequences",
+            "FROM: Integer, position of the first base to include (can be",
+              "negative)",
+            "TO: Integer, last base to include (can be negative)",
+            "LEN: Length of the range to extract."]
+        },
+        {
+          "name": "Coordinates file",
+          "opt": "--coords-file",
+          "arg": "in_file",
+          "description": ["File containing the coordinates, one per line.",
+            "Each line must follow the format described for Coordinates."]
+        },
+        {
+          "opt": "--quiet",
+          "description": "Run quietly (no STDERR output)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.fragment.rb",
+      "description": ["Simulates incomplete (fragmented) drafts from complete",
+        "genomes."],
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input file",
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "FastA file containing the complete sequences."
+        },
+        {
+          "name": "Output file",
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "FastA to create."
+        },
+        {
+          "opt": "--completeness",
+          "arg": "float",
+          "mandatory": true,
+          "description": ["Fraction of genome completeness to simulate from 0",
+            "to 1."]
+        },
+        {
+          "name": "Minimum length",
+          "opt": "--minlen",
+          "arg": "integer",
+          "description": "Minimum fragment length to report.",
+          "default": 500
+        },
+        {
+          "opt": "--sorted",
+          "description": ["Keep fragments sorted as in the input file. By",
+            "default, fragments are shuffled."]
+        },
+        {
+          "opt": "--quiet",
+          "description": "Run quietly (no STDERR output)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.toFastQ.rb",
+      "description": "Creates a FastQ-compliant file from a FastA file.",
+      "see_also": "FastQ.toFastA.awk",
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input FastA",
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input FastA file (supports .gz compression)."
+        },
+        {
+          "name": "Output FastQ",
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output FastQ file (supports .gz compression)."
+        },
+        {
+          "opt": "--quality",
+          "arg": "integer",
+          "default": 31,
+          "description": ["PHRED quality score to use (fixed), in the range",
+            "[-5, 41]."]
+        },
+        {
+          "opt": "--encoding",
+          "arg": "integer",
+          "default": 33,
+          "description": "Base encoding (33 or 64)."
+        }
+      ]
+    },
+    {
+      "task": "FastA.wrap.rb",
+      "description": "Wraps sequences in a FastA to a given line length.",
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input FastA",
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input FastA file."
+        },
+        {
+          "name": "Output FastA",
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output FastA file."
+        },
+        {
+          "name": "Wrap length",
+          "opt": "--wrap",
+          "arg": "integer",
+          "description": ["Line length to wrap sequences. Use 0 to generate",
+            "1-line sequences."],
+          "default": 70
+        }
+      ]
+    }
+  ]
+}