RubyGems - miga-base - Versions diffs - 1.2.17.0 → 1.2.17.2 - Mend

miga-base 1.2.17.0 → 1.2.17.2

Files changed (265) hide show

checksums.yaml +4 -4
data/lib/miga/version.rb +2 -2
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Archaea_SCG.hmm +41964 -0
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Bacteria_SCG.hmm +32439 -0
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Complete_SCG_DB.hmm +62056 -0
data/utils/FastAAI/FastAAI +3659 -0
data/utils/FastAAI/FastAAI-legacy/FastAAI +1336 -0
data/utils/FastAAI/FastAAI-legacy/kAAI_v1.0_virus.py +1296 -0
data/utils/FastAAI/README.md +84 -0
data/utils/enveomics/Docs/recplot2.md +244 -0
data/utils/enveomics/Examples/aai-matrix.bash +66 -0
data/utils/enveomics/Examples/ani-matrix.bash +66 -0
data/utils/enveomics/Examples/essential-phylogeny.bash +105 -0
data/utils/enveomics/Examples/unus-genome-phylogeny.bash +100 -0
data/utils/enveomics/LICENSE.txt +73 -0
data/utils/enveomics/Makefile +52 -0
data/utils/enveomics/Manifest/Tasks/aasubs.json +103 -0
data/utils/enveomics/Manifest/Tasks/blasttab.json +790 -0
data/utils/enveomics/Manifest/Tasks/distances.json +161 -0
data/utils/enveomics/Manifest/Tasks/fasta.json +802 -0
data/utils/enveomics/Manifest/Tasks/fastq.json +291 -0
data/utils/enveomics/Manifest/Tasks/graphics.json +126 -0
data/utils/enveomics/Manifest/Tasks/mapping.json +165 -0
data/utils/enveomics/Manifest/Tasks/ogs.json +382 -0
data/utils/enveomics/Manifest/Tasks/other.json +906 -0
data/utils/enveomics/Manifest/Tasks/remote.json +356 -0
data/utils/enveomics/Manifest/Tasks/sequence-identity.json +650 -0
data/utils/enveomics/Manifest/Tasks/tables.json +308 -0
data/utils/enveomics/Manifest/Tasks/trees.json +68 -0
data/utils/enveomics/Manifest/Tasks/variants.json +111 -0
data/utils/enveomics/Manifest/categories.json +165 -0
data/utils/enveomics/Manifest/examples.json +162 -0
data/utils/enveomics/Manifest/tasks.json +4 -0
data/utils/enveomics/README.md +42 -0
data/utils/enveomics/Scripts/AAsubs.log2ratio.rb +171 -0
data/utils/enveomics/Scripts/Aln.cat.rb +221 -0
data/utils/enveomics/Scripts/Aln.convert.pl +35 -0
data/utils/enveomics/Scripts/AlphaDiversity.pl +152 -0
data/utils/enveomics/Scripts/BedGraph.tad.rb +138 -0
data/utils/enveomics/Scripts/BedGraph.window.rb +71 -0
data/utils/enveomics/Scripts/BlastPairwise.AAsubs.pl +102 -0
data/utils/enveomics/Scripts/BlastTab.addlen.rb +63 -0
data/utils/enveomics/Scripts/BlastTab.advance.bash +48 -0
data/utils/enveomics/Scripts/BlastTab.best_hit_sorted.pl +55 -0
data/utils/enveomics/Scripts/BlastTab.catsbj.pl +104 -0
data/utils/enveomics/Scripts/BlastTab.cogCat.rb +76 -0
data/utils/enveomics/Scripts/BlastTab.filter.pl +47 -0
data/utils/enveomics/Scripts/BlastTab.kegg_pep2path_rest.pl +194 -0
data/utils/enveomics/Scripts/BlastTab.metaxaPrep.pl +104 -0
data/utils/enveomics/Scripts/BlastTab.pairedHits.rb +157 -0
data/utils/enveomics/Scripts/BlastTab.recplot2.R +48 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth.pl +86 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth_ZIP.pl +119 -0
data/utils/enveomics/Scripts/BlastTab.seqdepth_nomedian.pl +86 -0
data/utils/enveomics/Scripts/BlastTab.subsample.pl +47 -0
data/utils/enveomics/Scripts/BlastTab.sumPerHit.pl +114 -0
data/utils/enveomics/Scripts/BlastTab.taxid2taxrank.pl +90 -0
data/utils/enveomics/Scripts/BlastTab.topHits_sorted.rb +123 -0
data/utils/enveomics/Scripts/Chao1.pl +97 -0
data/utils/enveomics/Scripts/CharTable.classify.rb +234 -0
data/utils/enveomics/Scripts/EBIseq2tax.rb +83 -0
data/utils/enveomics/Scripts/FastA.N50.pl +60 -0
data/utils/enveomics/Scripts/FastA.extract.rb +152 -0
data/utils/enveomics/Scripts/FastA.filter.pl +52 -0
data/utils/enveomics/Scripts/FastA.filterLen.pl +28 -0
data/utils/enveomics/Scripts/FastA.filterN.pl +60 -0
data/utils/enveomics/Scripts/FastA.fragment.rb +100 -0
data/utils/enveomics/Scripts/FastA.gc.pl +42 -0
data/utils/enveomics/Scripts/FastA.interpose.pl +93 -0
data/utils/enveomics/Scripts/FastA.length.pl +38 -0
data/utils/enveomics/Scripts/FastA.mask.rb +89 -0
data/utils/enveomics/Scripts/FastA.per_file.pl +36 -0
data/utils/enveomics/Scripts/FastA.qlen.pl +57 -0
data/utils/enveomics/Scripts/FastA.rename.pl +65 -0
data/utils/enveomics/Scripts/FastA.revcom.pl +23 -0
data/utils/enveomics/Scripts/FastA.sample.rb +98 -0
data/utils/enveomics/Scripts/FastA.slider.pl +85 -0
data/utils/enveomics/Scripts/FastA.split.pl +55 -0
data/utils/enveomics/Scripts/FastA.split.rb +79 -0
data/utils/enveomics/Scripts/FastA.subsample.pl +131 -0
data/utils/enveomics/Scripts/FastA.tag.rb +65 -0
data/utils/enveomics/Scripts/FastA.toFastQ.rb +69 -0
data/utils/enveomics/Scripts/FastA.wrap.rb +48 -0
data/utils/enveomics/Scripts/FastQ.filter.pl +54 -0
data/utils/enveomics/Scripts/FastQ.interpose.pl +90 -0
data/utils/enveomics/Scripts/FastQ.maskQual.rb +89 -0
data/utils/enveomics/Scripts/FastQ.offset.pl +90 -0
data/utils/enveomics/Scripts/FastQ.split.pl +53 -0
data/utils/enveomics/Scripts/FastQ.tag.rb +70 -0
data/utils/enveomics/Scripts/FastQ.test-error.rb +81 -0
data/utils/enveomics/Scripts/FastQ.toFastA.awk +24 -0
data/utils/enveomics/Scripts/GFF.catsbj.pl +127 -0
data/utils/enveomics/Scripts/GenBank.add_fields.rb +84 -0
data/utils/enveomics/Scripts/HMM.essential.rb +351 -0
data/utils/enveomics/Scripts/HMM.haai.rb +168 -0
data/utils/enveomics/Scripts/HMMsearch.extractIds.rb +83 -0
data/utils/enveomics/Scripts/JPlace.distances.rb +88 -0
data/utils/enveomics/Scripts/JPlace.to_iToL.rb +320 -0
data/utils/enveomics/Scripts/M5nr.getSequences.rb +81 -0
data/utils/enveomics/Scripts/MeTaxa.distribution.pl +198 -0
data/utils/enveomics/Scripts/MyTaxa.fragsByTax.pl +35 -0
data/utils/enveomics/Scripts/MyTaxa.seq-taxrank.rb +49 -0
data/utils/enveomics/Scripts/NCBIacc2tax.rb +92 -0
data/utils/enveomics/Scripts/Newick.autoprune.R +27 -0
data/utils/enveomics/Scripts/RAxML-EPA.to_iToL.pl +228 -0
data/utils/enveomics/Scripts/RecPlot2.compareIdentities.R +32 -0
data/utils/enveomics/Scripts/RefSeq.download.bash +48 -0
data/utils/enveomics/Scripts/SRA.download.bash +67 -0
data/utils/enveomics/Scripts/TRIBS.plot-test.R +36 -0
data/utils/enveomics/Scripts/TRIBS.test.R +39 -0
data/utils/enveomics/Scripts/Table.barplot.R +31 -0
data/utils/enveomics/Scripts/Table.df2dist.R +30 -0
data/utils/enveomics/Scripts/Table.filter.pl +61 -0
data/utils/enveomics/Scripts/Table.merge.pl +77 -0
data/utils/enveomics/Scripts/Table.prefScore.R +60 -0
data/utils/enveomics/Scripts/Table.replace.rb +69 -0
data/utils/enveomics/Scripts/Table.round.rb +63 -0
data/utils/enveomics/Scripts/Table.split.pl +57 -0
data/utils/enveomics/Scripts/Taxonomy.silva2ncbi.rb +227 -0
data/utils/enveomics/Scripts/VCF.KaKs.rb +147 -0
data/utils/enveomics/Scripts/VCF.SNPs.rb +88 -0
data/utils/enveomics/Scripts/aai.rb +421 -0
data/utils/enveomics/Scripts/ani.rb +362 -0
data/utils/enveomics/Scripts/anir.rb +137 -0
data/utils/enveomics/Scripts/clust.rand.rb +102 -0
data/utils/enveomics/Scripts/gi2tax.rb +103 -0
data/utils/enveomics/Scripts/in_silico_GA_GI.pl +96 -0
data/utils/enveomics/Scripts/lib/data/dupont_2012_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/data/lee_2019_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/enveomics.R +1 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/anir.rb +293 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/bm_set.rb +175 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/enveomics.rb +24 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/errors.rb +17 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/gmm_em.rb +30 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/jplace.rb +253 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/match.rb +88 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/og.rb +182 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/rbm.rb +49 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/remote_data.rb +74 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/seq_range.rb +237 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/rand.rb +31 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/sample.rb +152 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/stats.rb +3 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/utils.rb +74 -0
data/utils/enveomics/Scripts/lib/enveomics_rb/vcf.rb +135 -0
data/utils/enveomics/Scripts/ogs.annotate.rb +88 -0
data/utils/enveomics/Scripts/ogs.core-pan.rb +160 -0
data/utils/enveomics/Scripts/ogs.extract.rb +125 -0
data/utils/enveomics/Scripts/ogs.mcl.rb +186 -0
data/utils/enveomics/Scripts/ogs.rb +104 -0
data/utils/enveomics/Scripts/ogs.stats.rb +131 -0
data/utils/enveomics/Scripts/rbm-legacy.rb +172 -0
data/utils/enveomics/Scripts/rbm.rb +108 -0
data/utils/enveomics/Scripts/sam.filter.rb +148 -0
data/utils/enveomics/Tests/Makefile +10 -0
data/utils/enveomics/Tests/Mgen_M2288.faa +3189 -0
data/utils/enveomics/Tests/Mgen_M2288.fna +8282 -0
data/utils/enveomics/Tests/Mgen_M2321.fna +8288 -0
data/utils/enveomics/Tests/Nequ_Kin4M.faa +2970 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.tribs.Rdata +0 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.txt +7 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai-mat.tsv +17 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai.tsv +137 -0
data/utils/enveomics/Tests/a_mg.cds-go.blast.tsv +123 -0
data/utils/enveomics/Tests/a_mg.reads-cds.blast.tsv +200 -0
data/utils/enveomics/Tests/a_mg.reads-cds.counts.tsv +55 -0
data/utils/enveomics/Tests/alkB.nwk +1 -0
data/utils/enveomics/Tests/anthrax-cansnp-data.tsv +13 -0
data/utils/enveomics/Tests/anthrax-cansnp-key.tsv +17 -0
data/utils/enveomics/Tests/hiv1.faa +59 -0
data/utils/enveomics/Tests/hiv1.fna +134 -0
data/utils/enveomics/Tests/hiv2.faa +70 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv +233 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.lim +1 -0
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.rec +233 -0
data/utils/enveomics/Tests/low-cov.bg.gz +0 -0
data/utils/enveomics/Tests/phyla_counts.tsv +10 -0
data/utils/enveomics/Tests/primate_lentivirus.ogs +11 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv1.rbm +9 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv2.rbm +8 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-siv.rbm +6 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-hiv2.rbm +9 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-siv.rbm +6 -0
data/utils/enveomics/Tests/primate_lentivirus.rbm/siv-siv.rbm +6 -0
data/utils/enveomics/build_enveomics_r.bash +45 -0
data/utils/enveomics/enveomics.R/DESCRIPTION +31 -0
data/utils/enveomics/enveomics.R/NAMESPACE +39 -0
data/utils/enveomics/enveomics.R/R/autoprune.R +167 -0
data/utils/enveomics/enveomics.R/R/barplot.R +203 -0
data/utils/enveomics/enveomics.R/R/cliopts.R +141 -0
data/utils/enveomics/enveomics.R/R/df2dist.R +192 -0
data/utils/enveomics/enveomics.R/R/growthcurve.R +349 -0
data/utils/enveomics/enveomics.R/R/prefscore.R +79 -0
data/utils/enveomics/enveomics.R/R/recplot.R +419 -0
data/utils/enveomics/enveomics.R/R/recplot2.R +1698 -0
data/utils/enveomics/enveomics.R/R/tribs.R +638 -0
data/utils/enveomics/enveomics.R/R/utils.R +90 -0
data/utils/enveomics/enveomics.R/README.md +81 -0
data/utils/enveomics/enveomics.R/data/growth.curves.rda +0 -0
data/utils/enveomics/enveomics.R/data/phyla.counts.rda +0 -0
data/utils/enveomics/enveomics.R/man/cash-enve.GrowthCurve-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2.Peak-method.Rd +16 -0
data/utils/enveomics/enveomics.R/man/enve.GrowthCurve-class.Rd +25 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBS-class.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBS.merge.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.TRIBStest-class.Rd +47 -0
data/utils/enveomics/enveomics.R/man/enve.__prune.iter.Rd +26 -0
data/utils/enveomics/enveomics.R/man/enve.__prune.reduce.Rd +26 -0
data/utils/enveomics/enveomics.R/man/enve.__tribs.Rd +44 -0
data/utils/enveomics/enveomics.R/man/enve.barplot.Rd +111 -0
data/utils/enveomics/enveomics.R/man/enve.cliopts.Rd +67 -0
data/utils/enveomics/enveomics.R/man/enve.col.alpha.Rd +34 -0
data/utils/enveomics/enveomics.R/man/enve.col2alpha.Rd +25 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.Rd +59 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.group.Rd +63 -0
data/utils/enveomics/enveomics.R/man/enve.df2dist.list.Rd +46 -0
data/utils/enveomics/enveomics.R/man/enve.growthcurve.Rd +78 -0
data/utils/enveomics/enveomics.R/man/enve.prefscore.Rd +50 -0
data/utils/enveomics/enveomics.R/man/enve.prune.dist.Rd +44 -0
data/utils/enveomics/enveomics.R/man/enve.recplot.Rd +147 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2-class.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.ANIr.Rd +27 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.Rd +77 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__counts.Rd +28 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__peakHist.Rd +24 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.__whichClosestPeak.Rd +22 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.changeCutoff.Rd +22 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.compareIdentities.Rd +52 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.coordinates.Rd +29 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.corePeak.Rd +21 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.extractWindows.Rd +45 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.Rd +34 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_e.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_m.Rd +24 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__emauto_one.Rd +31 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mow_one.Rd +56 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mower.Rd +20 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.em.Rd +51 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.emauto.Rd +43 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.mower.Rd +82 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.peak-class.Rd +59 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.seqdepth.Rd +27 -0
data/utils/enveomics/enveomics.R/man/enve.recplot2.windowDepthThreshold.Rd +36 -0
data/utils/enveomics/enveomics.R/man/enve.selvector.Rd +23 -0
data/utils/enveomics/enveomics.R/man/enve.tribs.Rd +68 -0
data/utils/enveomics/enveomics.R/man/enve.tribs.test.Rd +28 -0
data/utils/enveomics/enveomics.R/man/enve.truncate.Rd +27 -0
data/utils/enveomics/enveomics.R/man/growth.curves.Rd +14 -0
data/utils/enveomics/enveomics.R/man/phyla.counts.Rd +13 -0
data/utils/enveomics/enveomics.R/man/plot.enve.GrowthCurve.Rd +81 -0
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBS.Rd +49 -0
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBStest.Rd +48 -0
data/utils/enveomics/enveomics.R/man/plot.enve.recplot2.Rd +125 -0
data/utils/enveomics/enveomics.R/man/summary.enve.GrowthCurve.Rd +22 -0
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBS.Rd +22 -0
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBStest.Rd +22 -0
data/utils/enveomics/globals.mk +8 -0
data/utils/enveomics/manifest.json +9 -0
data/utils/multitrim/Multitrim How-To.pdf +0 -0
data/utils/multitrim/README.md +67 -0
data/utils/multitrim/multitrim.py +1555 -0
data/utils/multitrim/multitrim.yml +13 -0
metadata +268 -6

data/utils/enveomics/Manifest/Tasks/tables.json ADDED Viewed

@@ -0,0 +1,308 @@
+{
+  "tasks": [
+    {
+      "task": "Table.df2dist.R",
+      "description": ["Transform a tab-delimited list of distances into a",
+        "squared matrix."],
+      "help_arg": "--help",
+      "requires": [ { "r_package": "optparse" } ],
+      "options": [
+        {
+          "name": "Input list",
+          "opt": "--x",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "A tab-delimited table with the distances."
+        },
+        {
+          "opt": "--obj1-index",
+          "arg": "integer",
+          "default": 1,
+          "description": ["Index of the column containing the ID of the object",
+            "1."]
+        },
+        {
+          "opt": "--obj2-index",
+          "arg": "integer",
+          "default": 2,
+          "description": ["Index of the column containing the ID of the object",
+            "2."]
+        },
+        {
+          "opt": "--dist-index",
+          "arg": "integer",
+          "default": 3,
+          "description": "Index of the column containing the distance."
+        },
+        {
+          "opt": "--default-d",
+          "arg": "integer",
+          "description": "Default value for missing values. NA if empty."
+        },
+        {
+          "opt": "--max-sim",
+          "arg": "float",
+          "description": ["If not-empty, assumes that the values are",
+            "similarity (not distance) and this is the maximum similarity",
+            "(corresponding to distance 0). Applies transformation:",
+            "distance = (max.sim - values)/max.sim."]
+        },
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output squared matrix in tab-separated values format."
+        }
+      ]
+    },
+    {
+      "task": "Table.filter.pl",
+      "description": ["Extracts (and re-orders) a subset of rows from a raw",
+        "table."],
+      "help_arg": "",
+      "options": [
+        {
+          "name": "Key",
+          "opt": "-k",
+          "arg": "integer",
+          "default": 1,
+          "description": "Column of the table to use as key to filter."
+        },
+        {
+          "name": "Sep",
+          "opt": "-s",
+          "arg": "string",
+          "description": ["String to use as separation between rows. By",
+            "default, tabulation."]
+        },
+        {
+          "name": "Inverse",
+          "opt": "-i",
+          "description": ["If set, reports the inverse of the list (i.e.,",
+            "reports only rows absent in the list). Implies 'No re-order'."]
+        },
+        {
+          "name": "Header",
+          "opt": "-h",
+          "description": "Keep first row of the table (header) untouched."
+        },
+        {
+          "name": "No re-order",
+          "opt": "-n",
+          "description": ["The output has the same order of the table. By",
+            "default, it prints in the order of the list."]
+        },
+        {
+          "name": "List",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "List of IDs to extract."
+        },
+        {
+          "name": "Table",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Table file containing the superset."
+        },
+        ">",
+        {
+          "name": "Subset",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Table file to be created."
+        }
+      ]
+    },
+    {
+      "task": "Table.merge.pl",
+      "description": "Merges multiple (two-column) lists into one table.",
+      "see_also": ["Table.split.pl"],
+      "help_arg": "",
+      "options": [
+        {
+          "name": "Strings",
+          "opt": "-s",
+          "description": ["Values are read as Strings. By default, values are",
+            "read as numbers."]
+        },
+        {
+          "name": "Input delimiter",
+          "opt": "-i",
+          "arg": "string",
+          "description": "Input field-delimiter. By default, tabulation."
+        },
+        {
+          "name": "Output delimiter",
+          "opt": "-o",
+          "arg": "string",
+          "description": "Output field-delimiter. By default: tabulation."
+        },
+        {
+          "name": "No header",
+          "opt": "-n",
+          "description": ["By default, the header is determined by the file",
+            "names."]
+        },
+        {
+          "name": "Empty",
+          "opt": "-e",
+          "description": ["Default string when no value is found. By default,",
+            "the 'empty' value is 0 if values are numeric (i.e., unless -s is",
+            "set) or an empty string otherwise."]
+        },
+        {
+          "name": "Header",
+          "opt": "-h",
+          "arg": "string",
+          "default": "Tag",
+          "description": "Header of the first column, containing the IDs."
+        },
+        {
+          "name": "Header format",
+          "opt": "-H",
+          "arg": "string",
+          "default": "(?:.*/)?([^\\.]+)",
+          "description": ["Format of filenames capturing the column header in",
+            "the first capturing parenthesis. Non-capturing paretheses can be",
+            "defined as (?:...). By default: '(?:.*/)?([^\\.]+)', which",
+            "captures the part of the basename of the file before the first",
+            "dot (if any)."]
+        },
+        {
+          "name": "Rows to ignore",
+          "opt": "-r",
+          "arg": "integer",
+          "default": 0,
+          "description": "Number of leading rows to ignore in the input files."
+        },
+        {
+          "arg": "in_file",
+          "mandatory": true,
+          "multiple_sep": " ",
+          "description": "Input two-column lists."
+        },
+        ">",
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Merged table."
+        }
+      ]
+    },
+    {
+      "task": "Table.round.rb",
+      "description": "Rounds numbers in a table.",
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input file",
+          "opt": "--in",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input table."
+        },
+        {
+          "name": "Output file",
+          "opt": "--out",
+          "arg": "out_file",
+          "mandatory": true,
+          "description": "Output table."
+        },
+        {
+          "name": "Decimals",
+          "opt": "--ndigits",
+          "arg": "integer",
+          "default": 0,
+          "description": "Number of decimal digits."
+        },
+        {
+          "opt": "--floor",
+          "description": ["Floors the values instead of rounding them. Ignores",
+            "'Decimals'."]
+        },
+        {
+          "opt": "--ceil",
+          "description": ["Ceils the values instead of rounding them. Ignores",
+            "'Decimals'."]
+        },
+        {
+          "opt": "--delimiter",
+          "arg": "string",
+          "description": "String delimiting columns. By default, tabulation."
+        }
+      ]
+    },
+    {
+      "task": "Table.split.pl",
+      "description": ["Split a file with multiple columns into multiple",
+        "two-columns lists."],
+      "see_also": ["Table.merge.pl"],
+      "help_arg": "",
+      "options": [
+        {
+          "name": "Input delimiter",
+          "opt": "-i",
+          "arg": "string",
+          "description": "Input field-delimiter. By default, tabulation."
+        },
+        {
+          "name": "Out prefix",
+          "opt": "-o",
+          "arg": "string",
+          "description": "Prefix of the output files."
+        },
+        {
+          "name": "Output directory",
+          "opt": "-d",
+          "arg": "out_dir",
+          "description": "Output directory."
+        },
+        {
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input table."
+        }
+      ]
+    },
+    {
+       "task": "Table.replace.rb",
+       "description": "Replace a field in a table using a mapping file.",
+       "help_arg": "--help",
+       "options": [
+         {
+           "opt": "--map",
+           "arg": "in_file",
+           "mandatory": true,
+           "description": "Mapping file with two columns (key and replacement)."
+         },
+         {
+           "opt": "--in",
+           "arg": "in_file",
+           "mandatory": true,
+           "description": "Input table."
+         },
+         {
+           "opt": "--out",
+           "arg": "out_file",
+           "mandatory": true,
+           "description": "Output table."
+         },
+         {
+           "opt": "--key",
+           "arg": "integer",
+           "default": 1,
+           "description": "Column to replace in Input table."
+         },
+         {
+           "opt": "--unknown",
+           "arg": "string",
+           "description": "String to use whenever the key is not found in Map."
+         },
+         {
+           "opt": "--delimiter",
+           "arg": "string",
+           "description": "String delimiting columns. By default, tabulation."
+         }
+      ]
+    }
+  ]
+}

data/utils/enveomics/Manifest/Tasks/trees.json ADDED Viewed

@@ -0,0 +1,68 @@
+{
+  "tasks": [
+    {
+      "task": "Newick.autoprune.R",
+      "description": ["Automatically prunes a tree, to keep representatives of",
+        "each clade."],
+      "requires": [ { "r_package": "optparse" }, { "r_package": "ape" } ],
+      "cite": [["Paradis et al, 2004, Bioinf",
+        "http://dx.doi.org/10.1093/bioinformatics/btg412"]],
+      "help_arg": "--help",
+      "options": [
+        {
+          "name": "Input tree",
+          "opt": "--t",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "A tree to prune in Newick format."
+        },
+        {
+          "opt": "--dist-quantile",
+          "arg": "float",
+          "default": 0.25,
+          "description": "The quantile of edge lengths."
+        },
+        {
+          "opt": "--min_dist",
+          "arg": "float",
+          "description": ["The minimum distance to allow between two tips. If",
+            "not set, dist.quantile is used instead to calculate it."]
+        },
+        {
+          "opt": "--quiet",
+          "description": ["Boolean indicating if the function must run without",
+            "output."]
+        },
+        {
+          "opt": "--max_iters",
+          "arg": "integer",
+          "default": 1000,
+          "description": "Maximum number of iterations."
+        },
+        {
+          "opt": "--min_nodes_random",
+          "arg": "integer",
+          "default": 40000,
+          "description": ["Minimum number of nodes to trigger 'tip-pairs'",
+            "nodes sampling. This sampling is less reproducible and more",
+            "computationally expensive, but it's the only solution if the",
+            "cophenetic matrix exceeds 2^31-1 entries; above that, it cannot",
+            "be represented in R."]
+        },
+        {
+          "opt": "--random_nodes_frx",
+          "arg": "float",
+          "default": 1.0,
+          "description": ["Fraction of the nodes to be sampled if more than",
+            "'Min nodes random'."]
+        },
+        {
+          "arg": "out_file",
+          "mandatory": true,
+          "description": ["Output file in Newick format containing the pruned",
+            "tree."]
+        }
+      ]
+    }
+  ]
+}

data/utils/enveomics/Manifest/Tasks/variants.json ADDED Viewed

@@ -0,0 +1,111 @@
+{
+  "tasks": [
+    {
+      "task": "VCF.SNPs.rb",
+      "description": ["Counts the number of Single-Nucleotide Polymorphisms",
+        "(SNPs) in a VCF file."],
+      "help_arg": "--help",
+      "options": [
+        {
+          "opt": "--input",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input file in Variant Call Format (VCF)."
+        },
+        {
+          "name": "Filtered VCF",
+          "opt": "--out",
+          "arg": "out_file",
+          "description": "Output (filtered) file in Variant Call Format (VCF)."
+        },
+        {
+          "name": "Min DP",
+          "opt": "--min-dp",
+          "arg": "integer",
+          "description": "Minimum number of reads covering the position.",
+          "default": 4
+        },
+        {
+          "name": "Max DP",
+          "opt": "--max-dp",
+          "arg": "integer",
+          "description": ["Maximum number of reads covering the position. By",
+            "default no limit."]
+        },
+        {
+          "name": "Min Ref-DP",
+          "opt": "--min-ref-dp",
+          "arg": "integer",
+          "description": "Minimum number of reads supporting the REF allele.",
+          "default": 2
+        },
+        {
+          "name": "Min Alt-DP",
+          "opt": "--min-alt-dp",
+          "arg": "integer",
+          "description": "Minimum number of reads supporting the ALT allele.",
+          "default": 2
+        },
+        {
+          "opt": "--min-quality",
+          "arg": "float",
+          "description": "Minimum quality of the position mapping.",
+          "default": 0.0
+        },
+        {
+          "opt": "--min-shannon",
+          "arg": "integer",
+          "description": "Minimum information content (in bits, from 0 to 1).",
+          "default": 0.0
+        },
+        {
+          "opt": "--indels",
+          "description": "Process indels."
+        }
+      ]
+    },
+    {
+      "task": "VCF.KaKs.rb",
+      "description": ["Estimates the Ka/Ks ratio from the SNPs in a VCF file.",
+        "Ka and Ks are corrected using pseudo-counts, but no corrections for",
+        "multiple substitutions are applied."],
+      "help_arg": "--help",
+      "see_also": ["VCF.SNPs.rb"],
+      "options": [
+        {
+          "opt": "--input",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input file in Variant Call Format (VCF)."
+        },
+        {
+          "opt": "--seqs",
+          "arg": "in_file",
+          "mandatory": true,
+          "description": "Input gene sequences (nucleotides) in FastA format."
+        },
+        {
+          "name": "Synonymous fraction",
+          "opt": "--syn-frx",
+          "arg": "float",
+          "description": ["Fraction of synonymous substitutions. If passed,",
+            "the number of sites are estimated (not counted per gene),",
+            "speeding up the computation ~10X."]
+        },
+        {
+          "name": "Bacterial code synonymous fraction",
+          "opt": "--syn-bacterial-code",
+          "description": ["Sets the synonymous fraction to 0.760417,",
+            "approximately the proportion of synonymous substitutions in the",
+            "bacterial code."]
+        },
+        {
+          "opt": "--codon-file",
+          "arg": "out_file",
+          "description": ["Output file including the codons of substitution",
+            "variants."]
+        }
+      ]
+    }
+  ]
+}

data/utils/enveomics/Manifest/categories.json ADDED Viewed

@@ -0,0 +1,165 @@
+{
+  "categories": {
+    "Sequence similarity search": {
+      "Statistics": [
+        "BedGraph.tad.rb",
+        "BedGraph.window.rb",
+        "BlastPairwise.AAsubs.pl",
+        "BlastTab.advance.bash",
+        "BlastTab.recplot2.R",
+        "BlastTab.seqdepth.pl",
+        "BlastTab.seqdepth_nomedian.pl",
+        "BlastTab.seqdepth_ZIP.pl",
+        "BlastTab.sumPerHit.pl",
+        "FastQ.test-error.rb",
+        "RecPlot2.compareIdentities.R"
+      ],
+      "Manipulation": [
+        "BlastTab.addlen.rb",
+        "BlastTab.best_hit_sorted.pl",
+        "BlastTab.catsbj.pl",
+        "BlastTab.cogCat.rb",
+        "BlastTab.filter.pl",
+        "BlastTab.kegg_pep2path_rest.pl",
+        "BlastTab.pairedHits.rb",
+        "BlastTab.subsample.pl",
+        "BlastTab.taxid2taxrank.pl",
+        "BlastTab.topHits_sorted.rb",
+        "sam.filter.rb"
+      ],
+      "Execution": [
+        "aai.rb",
+        "ani.rb",
+        "anir.rb",
+        "HMM.haai.rb",
+        "rbm.rb"
+      ]
+    },
+    "Sequence analyses": {
+      "Statistics": [
+        "FastA.gc.pl",
+        "FastA.length.pl",
+        "FastA.N50.pl",
+        "FastA.qlen.pl",
+        "FastQ.test-error.rb"
+      ],
+      "Manipulation": [
+        "FastA.extract.rb",
+        "FastA.filter.pl",
+        "FastA.filterLen.pl",
+        "FastA.filterN.pl",
+        "FastA.fragment.rb",
+        "FastA.interpose.pl",
+        "FastA.mask.rb",
+        "FastA.per_file.pl",
+        "FastA.rename.pl",
+        "FastA.revcom.pl",
+        "FastA.sample.rb",
+        "FastA.slider.pl",
+        "FastA.split.pl",
+        "FastA.split.rb",
+        "FastA.subsample.pl",
+        "FastA.tag.rb",
+        "FastA.toFastQ.rb",
+        "FastA.wrap.rb",
+        "FastQ.filter.pl",
+        "FastQ.interpose.pl",
+        "FastQ.maskQual.rb",
+        "FastQ.offset.pl",
+        "FastQ.split.pl",
+        "FastQ.tag.rb",
+        "FastQ.toFastA.awk"
+      ]
+    },
+    "Diversity": {
+      "Community": [
+        "AlphaDiversity.pl",
+        "Chao1.pl",
+        "Table.barplot.R",
+        "Table.prefScore.R"
+      ],
+      "Population": [
+        "VCF.SNPs.rb",
+        "VCF.KaKs.rb",
+        "Table.prefScore.R"
+      ]
+    },
+    "Annotation": {
+      "Database mapping": [
+        "BlastTab.kegg_pep2path_rest.pl",
+        "BlastTab.taxid2taxrank.pl",
+        "EBIseq2tax.rb",
+        "NCBIacc2tax.rb",
+        "gi2tax.rb",
+        "M5nr.getSequences.rb",
+        "RefSeq.download.bash",
+        "SRA.download.bash"
+      ],
+      "Tables": [
+        "Table.barplot.R",
+        "GenBank.add_fields.rb",
+        "MyTaxa.fragsByTax.pl",
+        "Table.df2dist.R",
+        "Table.filter.pl",
+        "Table.merge.pl",
+        "Table.replace.rb",
+        "Table.round.rb",
+        "Table.split.pl"
+      ],
+      "Search": [
+        "HMM.essential.rb",
+        "HMM.haai.rb",
+        "HMMsearch.extractIds.rb",
+        "ogs.annotate.rb",
+        "ogs.core-pan.rb",
+        "ogs.extract.rb",
+        "ogs.mcl.rb",
+        "ogs.stats.rb",
+        "ogs.rb"
+      ]
+    },
+    "Other data": {
+      "Phylogenetic and other distances": [
+        "CharTable.classify.rb",
+        "JPlace.distances.rb",
+        "JPlace.to_iToL.rb",
+        "Newick.autoprune.R",
+        "TRIBS.test.R",
+        "TRIBS.plot-test.R",
+        "Table.df2dist.R"
+      ],
+      "Taxonomic": [
+        "CharTable.classify.rb",
+        "EBIseq2tax.rb",
+        "NCBIacc2tax.rb",
+        "Table.barplot.R",
+        "gi2tax.rb",
+        "MyTaxa.fragsByTax.pl",
+        "MyTaxa.seq-taxrank.rb",
+        "Taxonomy.silva2ncbi.rb"
+      ],
+      "Alignments": [
+        "AAsubs.log2ratio.rb",
+        "Aln.cat.rb",
+        "Aln.convert.pl",
+        "BlastPairwise.AAsubs.pl"
+      ],
+      "Clustering": [
+        "ogs.mcl.rb",
+        "clust.rand.rb"
+      ],
+      "Read recruitments": [
+        "anir.rb",
+        "BedGraph.tad.rb",
+        "BedGraph.window.rb",
+        "BlastTab.catsbj.pl",
+        "BlastTab.pairedHits.rb",
+        "BlastTab.recplot2.R",
+        "FastQ.test-error.rb",
+        "GFF.catsbj.pl",
+        "RecPlot2.compareIdentities.R",
+        "sam.filter.rb"
+      ]
+    }
+  }
+}