RubyGems - miga-base - Versions diffs - 0.7.25.2 → 0.7.25.3 - Mend

miga-base 0.7.25.2 → 0.7.25.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (277) hide show

checksums.yaml +4 -4
data/lib/miga/version.rb +2 -2
data/utils/distance/runner.rb +2 -1
metadata +5 -278
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Archaea_SCG.hmm +0 -41964
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Bacteria_SCG.hmm +0 -32439
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Complete_SCG_DB.hmm +0 -62056
data/utils/FastAAI/FastAAI/FastAAI +0 -1336
data/utils/FastAAI/README.md +0 -84
data/utils/FastAAI/kAAI_v1.0_virus.py +0 -1296
data/utils/enveomics/Docs/recplot2.md +0 -244
data/utils/enveomics/Examples/aai-matrix.bash +0 -66
data/utils/enveomics/Examples/ani-matrix.bash +0 -66
data/utils/enveomics/Examples/essential-phylogeny.bash +0 -105
data/utils/enveomics/Examples/unus-genome-phylogeny.bash +0 -100
data/utils/enveomics/LICENSE.txt +0 -73
data/utils/enveomics/Makefile +0 -52
data/utils/enveomics/Manifest/Tasks/aasubs.json +0 -103
data/utils/enveomics/Manifest/Tasks/blasttab.json +0 -786
data/utils/enveomics/Manifest/Tasks/distances.json +0 -161
data/utils/enveomics/Manifest/Tasks/fasta.json +0 -766
data/utils/enveomics/Manifest/Tasks/fastq.json +0 -243
data/utils/enveomics/Manifest/Tasks/graphics.json +0 -126
data/utils/enveomics/Manifest/Tasks/mapping.json +0 -67
data/utils/enveomics/Manifest/Tasks/ogs.json +0 -382
data/utils/enveomics/Manifest/Tasks/other.json +0 -829
data/utils/enveomics/Manifest/Tasks/remote.json +0 -355
data/utils/enveomics/Manifest/Tasks/sequence-identity.json +0 -501
data/utils/enveomics/Manifest/Tasks/tables.json +0 -308
data/utils/enveomics/Manifest/Tasks/trees.json +0 -68
data/utils/enveomics/Manifest/Tasks/variants.json +0 -111
data/utils/enveomics/Manifest/categories.json +0 -156
data/utils/enveomics/Manifest/examples.json +0 -154
data/utils/enveomics/Manifest/tasks.json +0 -4
data/utils/enveomics/Pipelines/assembly.pbs/CONFIG.mock.bash +0 -69
data/utils/enveomics/Pipelines/assembly.pbs/FastA.N50.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/FastA.filterN.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/FastA.length.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/README.md +0 -189
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-2.bash +0 -112
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-3.bash +0 -23
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-4.bash +0 -44
data/utils/enveomics/Pipelines/assembly.pbs/RUNME.bash +0 -50
data/utils/enveomics/Pipelines/assembly.pbs/kSelector.R +0 -37
data/utils/enveomics/Pipelines/assembly.pbs/newbler.pbs +0 -68
data/utils/enveomics/Pipelines/assembly.pbs/newbler_preparator.pl +0 -49
data/utils/enveomics/Pipelines/assembly.pbs/soap.pbs +0 -80
data/utils/enveomics/Pipelines/assembly.pbs/stats.pbs +0 -57
data/utils/enveomics/Pipelines/assembly.pbs/velvet.pbs +0 -63
data/utils/enveomics/Pipelines/blast.pbs/01.pbs.bash +0 -38
data/utils/enveomics/Pipelines/blast.pbs/02.pbs.bash +0 -73
data/utils/enveomics/Pipelines/blast.pbs/03.pbs.bash +0 -21
data/utils/enveomics/Pipelines/blast.pbs/BlastTab.recover_job.pl +0 -72
data/utils/enveomics/Pipelines/blast.pbs/CONFIG.mock.bash +0 -98
data/utils/enveomics/Pipelines/blast.pbs/FastA.split.pl +0 -1
data/utils/enveomics/Pipelines/blast.pbs/README.md +0 -127
data/utils/enveomics/Pipelines/blast.pbs/RUNME.bash +0 -109
data/utils/enveomics/Pipelines/blast.pbs/TASK.check.bash +0 -128
data/utils/enveomics/Pipelines/blast.pbs/TASK.dry.bash +0 -16
data/utils/enveomics/Pipelines/blast.pbs/TASK.eo.bash +0 -22
data/utils/enveomics/Pipelines/blast.pbs/TASK.pause.bash +0 -26
data/utils/enveomics/Pipelines/blast.pbs/TASK.run.bash +0 -89
data/utils/enveomics/Pipelines/blast.pbs/sentinel.pbs.bash +0 -29
data/utils/enveomics/Pipelines/idba.pbs/README.md +0 -49
data/utils/enveomics/Pipelines/idba.pbs/RUNME.bash +0 -95
data/utils/enveomics/Pipelines/idba.pbs/run.pbs +0 -56
data/utils/enveomics/Pipelines/trim.pbs/README.md +0 -54
data/utils/enveomics/Pipelines/trim.pbs/RUNME.bash +0 -70
data/utils/enveomics/Pipelines/trim.pbs/run.pbs +0 -130
data/utils/enveomics/README.md +0 -42
data/utils/enveomics/Scripts/AAsubs.log2ratio.rb +0 -171
data/utils/enveomics/Scripts/Aln.cat.rb +0 -163
data/utils/enveomics/Scripts/Aln.convert.pl +0 -35
data/utils/enveomics/Scripts/AlphaDiversity.pl +0 -152
data/utils/enveomics/Scripts/BedGraph.tad.rb +0 -93
data/utils/enveomics/Scripts/BedGraph.window.rb +0 -71
data/utils/enveomics/Scripts/BlastPairwise.AAsubs.pl +0 -102
data/utils/enveomics/Scripts/BlastTab.addlen.rb +0 -63
data/utils/enveomics/Scripts/BlastTab.advance.bash +0 -48
data/utils/enveomics/Scripts/BlastTab.best_hit_sorted.pl +0 -55
data/utils/enveomics/Scripts/BlastTab.catsbj.pl +0 -104
data/utils/enveomics/Scripts/BlastTab.cogCat.rb +0 -76
data/utils/enveomics/Scripts/BlastTab.filter.pl +0 -47
data/utils/enveomics/Scripts/BlastTab.kegg_pep2path_rest.pl +0 -194
data/utils/enveomics/Scripts/BlastTab.metaxaPrep.pl +0 -104
data/utils/enveomics/Scripts/BlastTab.pairedHits.rb +0 -157
data/utils/enveomics/Scripts/BlastTab.recplot2.R +0 -48
data/utils/enveomics/Scripts/BlastTab.seqdepth.pl +0 -86
data/utils/enveomics/Scripts/BlastTab.seqdepth_ZIP.pl +0 -119
data/utils/enveomics/Scripts/BlastTab.seqdepth_nomedian.pl +0 -86
data/utils/enveomics/Scripts/BlastTab.subsample.pl +0 -47
data/utils/enveomics/Scripts/BlastTab.sumPerHit.pl +0 -114
data/utils/enveomics/Scripts/BlastTab.taxid2taxrank.pl +0 -90
data/utils/enveomics/Scripts/BlastTab.topHits_sorted.rb +0 -101
data/utils/enveomics/Scripts/Chao1.pl +0 -97
data/utils/enveomics/Scripts/CharTable.classify.rb +0 -234
data/utils/enveomics/Scripts/EBIseq2tax.rb +0 -83
data/utils/enveomics/Scripts/FastA.N50.pl +0 -56
data/utils/enveomics/Scripts/FastA.extract.rb +0 -152
data/utils/enveomics/Scripts/FastA.filter.pl +0 -52
data/utils/enveomics/Scripts/FastA.filterLen.pl +0 -28
data/utils/enveomics/Scripts/FastA.filterN.pl +0 -60
data/utils/enveomics/Scripts/FastA.fragment.rb +0 -92
data/utils/enveomics/Scripts/FastA.gc.pl +0 -42
data/utils/enveomics/Scripts/FastA.interpose.pl +0 -93
data/utils/enveomics/Scripts/FastA.length.pl +0 -38
data/utils/enveomics/Scripts/FastA.mask.rb +0 -89
data/utils/enveomics/Scripts/FastA.per_file.pl +0 -36
data/utils/enveomics/Scripts/FastA.qlen.pl +0 -57
data/utils/enveomics/Scripts/FastA.rename.pl +0 -65
data/utils/enveomics/Scripts/FastA.revcom.pl +0 -23
data/utils/enveomics/Scripts/FastA.sample.rb +0 -83
data/utils/enveomics/Scripts/FastA.slider.pl +0 -85
data/utils/enveomics/Scripts/FastA.split.pl +0 -55
data/utils/enveomics/Scripts/FastA.split.rb +0 -79
data/utils/enveomics/Scripts/FastA.subsample.pl +0 -131
data/utils/enveomics/Scripts/FastA.tag.rb +0 -65
data/utils/enveomics/Scripts/FastA.wrap.rb +0 -48
data/utils/enveomics/Scripts/FastQ.filter.pl +0 -54
data/utils/enveomics/Scripts/FastQ.interpose.pl +0 -90
data/utils/enveomics/Scripts/FastQ.offset.pl +0 -90
data/utils/enveomics/Scripts/FastQ.split.pl +0 -53
data/utils/enveomics/Scripts/FastQ.tag.rb +0 -63
data/utils/enveomics/Scripts/FastQ.test-error.rb +0 -81
data/utils/enveomics/Scripts/FastQ.toFastA.awk +0 -24
data/utils/enveomics/Scripts/GFF.catsbj.pl +0 -127
data/utils/enveomics/Scripts/GenBank.add_fields.rb +0 -84
data/utils/enveomics/Scripts/HMM.essential.rb +0 -351
data/utils/enveomics/Scripts/HMM.haai.rb +0 -168
data/utils/enveomics/Scripts/HMMsearch.extractIds.rb +0 -83
data/utils/enveomics/Scripts/JPlace.distances.rb +0 -88
data/utils/enveomics/Scripts/JPlace.to_iToL.rb +0 -320
data/utils/enveomics/Scripts/M5nr.getSequences.rb +0 -81
data/utils/enveomics/Scripts/MeTaxa.distribution.pl +0 -198
data/utils/enveomics/Scripts/MyTaxa.fragsByTax.pl +0 -35
data/utils/enveomics/Scripts/MyTaxa.seq-taxrank.rb +0 -49
data/utils/enveomics/Scripts/NCBIacc2tax.rb +0 -92
data/utils/enveomics/Scripts/Newick.autoprune.R +0 -27
data/utils/enveomics/Scripts/RAxML-EPA.to_iToL.pl +0 -228
data/utils/enveomics/Scripts/RecPlot2.compareIdentities.R +0 -32
data/utils/enveomics/Scripts/RefSeq.download.bash +0 -48
data/utils/enveomics/Scripts/SRA.download.bash +0 -57
data/utils/enveomics/Scripts/TRIBS.plot-test.R +0 -36
data/utils/enveomics/Scripts/TRIBS.test.R +0 -39
data/utils/enveomics/Scripts/Table.barplot.R +0 -31
data/utils/enveomics/Scripts/Table.df2dist.R +0 -30
data/utils/enveomics/Scripts/Table.filter.pl +0 -61
data/utils/enveomics/Scripts/Table.merge.pl +0 -77
data/utils/enveomics/Scripts/Table.replace.rb +0 -69
data/utils/enveomics/Scripts/Table.round.rb +0 -63
data/utils/enveomics/Scripts/Table.split.pl +0 -57
data/utils/enveomics/Scripts/Taxonomy.silva2ncbi.rb +0 -227
data/utils/enveomics/Scripts/VCF.KaKs.rb +0 -147
data/utils/enveomics/Scripts/VCF.SNPs.rb +0 -88
data/utils/enveomics/Scripts/aai.rb +0 -418
data/utils/enveomics/Scripts/ani.rb +0 -362
data/utils/enveomics/Scripts/clust.rand.rb +0 -102
data/utils/enveomics/Scripts/gi2tax.rb +0 -103
data/utils/enveomics/Scripts/in_silico_GA_GI.pl +0 -96
data/utils/enveomics/Scripts/lib/data/dupont_2012_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/data/lee_2019_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/enveomics.R +0 -1
data/utils/enveomics/Scripts/lib/enveomics_rb/enveomics.rb +0 -24
data/utils/enveomics/Scripts/lib/enveomics_rb/jplace.rb +0 -253
data/utils/enveomics/Scripts/lib/enveomics_rb/og.rb +0 -182
data/utils/enveomics/Scripts/lib/enveomics_rb/remote_data.rb +0 -74
data/utils/enveomics/Scripts/lib/enveomics_rb/seq_range.rb +0 -237
data/utils/enveomics/Scripts/lib/enveomics_rb/stat.rb +0 -30
data/utils/enveomics/Scripts/lib/enveomics_rb/vcf.rb +0 -135
data/utils/enveomics/Scripts/ogs.annotate.rb +0 -88
data/utils/enveomics/Scripts/ogs.core-pan.rb +0 -160
data/utils/enveomics/Scripts/ogs.extract.rb +0 -125
data/utils/enveomics/Scripts/ogs.mcl.rb +0 -186
data/utils/enveomics/Scripts/ogs.rb +0 -104
data/utils/enveomics/Scripts/ogs.stats.rb +0 -131
data/utils/enveomics/Scripts/rbm.rb +0 -146
data/utils/enveomics/Tests/Makefile +0 -10
data/utils/enveomics/Tests/Mgen_M2288.faa +0 -3189
data/utils/enveomics/Tests/Mgen_M2288.fna +0 -8282
data/utils/enveomics/Tests/Mgen_M2321.fna +0 -8288
data/utils/enveomics/Tests/Nequ_Kin4M.faa +0 -2970
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.tribs.Rdata +0 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.txt +0 -7
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai-mat.tsv +0 -17
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai.tsv +0 -137
data/utils/enveomics/Tests/a_mg.cds-go.blast.tsv +0 -123
data/utils/enveomics/Tests/a_mg.reads-cds.blast.tsv +0 -200
data/utils/enveomics/Tests/a_mg.reads-cds.counts.tsv +0 -55
data/utils/enveomics/Tests/alkB.nwk +0 -1
data/utils/enveomics/Tests/anthrax-cansnp-data.tsv +0 -13
data/utils/enveomics/Tests/anthrax-cansnp-key.tsv +0 -17
data/utils/enveomics/Tests/hiv1.faa +0 -59
data/utils/enveomics/Tests/hiv1.fna +0 -134
data/utils/enveomics/Tests/hiv2.faa +0 -70
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv +0 -233
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.lim +0 -1
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.rec +0 -233
data/utils/enveomics/Tests/phyla_counts.tsv +0 -10
data/utils/enveomics/Tests/primate_lentivirus.ogs +0 -11
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv1.rbm +0 -9
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv2.rbm +0 -8
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-siv.rbm +0 -6
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-hiv2.rbm +0 -9
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-siv.rbm +0 -6
data/utils/enveomics/Tests/primate_lentivirus.rbm/siv-siv.rbm +0 -6
data/utils/enveomics/build_enveomics_r.bash +0 -45
data/utils/enveomics/enveomics.R/DESCRIPTION +0 -31
data/utils/enveomics/enveomics.R/NAMESPACE +0 -39
data/utils/enveomics/enveomics.R/R/autoprune.R +0 -155
data/utils/enveomics/enveomics.R/R/barplot.R +0 -184
data/utils/enveomics/enveomics.R/R/cliopts.R +0 -135
data/utils/enveomics/enveomics.R/R/df2dist.R +0 -154
data/utils/enveomics/enveomics.R/R/growthcurve.R +0 -331
data/utils/enveomics/enveomics.R/R/recplot.R +0 -354
data/utils/enveomics/enveomics.R/R/recplot2.R +0 -1631
data/utils/enveomics/enveomics.R/R/tribs.R +0 -583
data/utils/enveomics/enveomics.R/R/utils.R +0 -50
data/utils/enveomics/enveomics.R/README.md +0 -80
data/utils/enveomics/enveomics.R/data/growth.curves.rda +0 -0
data/utils/enveomics/enveomics.R/data/phyla.counts.rda +0 -0
data/utils/enveomics/enveomics.R/man/cash-enve.GrowthCurve-method.Rd +0 -17
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2-method.Rd +0 -17
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2.Peak-method.Rd +0 -17
data/utils/enveomics/enveomics.R/man/enve.GrowthCurve-class.Rd +0 -25
data/utils/enveomics/enveomics.R/man/enve.TRIBS-class.Rd +0 -46
data/utils/enveomics/enveomics.R/man/enve.TRIBS.merge.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.TRIBStest-class.Rd +0 -47
data/utils/enveomics/enveomics.R/man/enve.__prune.iter.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.__prune.reduce.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.__tribs.Rd +0 -32
data/utils/enveomics/enveomics.R/man/enve.barplot.Rd +0 -91
data/utils/enveomics/enveomics.R/man/enve.cliopts.Rd +0 -57
data/utils/enveomics/enveomics.R/man/enve.col.alpha.Rd +0 -24
data/utils/enveomics/enveomics.R/man/enve.col2alpha.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.df2dist.Rd +0 -39
data/utils/enveomics/enveomics.R/man/enve.df2dist.group.Rd +0 -38
data/utils/enveomics/enveomics.R/man/enve.df2dist.list.Rd +0 -40
data/utils/enveomics/enveomics.R/man/enve.growthcurve.Rd +0 -67
data/utils/enveomics/enveomics.R/man/enve.prune.dist.Rd +0 -37
data/utils/enveomics/enveomics.R/man/enve.recplot.Rd +0 -122
data/utils/enveomics/enveomics.R/man/enve.recplot2-class.Rd +0 -45
data/utils/enveomics/enveomics.R/man/enve.recplot2.ANIr.Rd +0 -24
data/utils/enveomics/enveomics.R/man/enve.recplot2.Rd +0 -68
data/utils/enveomics/enveomics.R/man/enve.recplot2.__counts.Rd +0 -25
data/utils/enveomics/enveomics.R/man/enve.recplot2.__peakHist.Rd +0 -21
data/utils/enveomics/enveomics.R/man/enve.recplot2.__whichClosestPeak.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.changeCutoff.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.compareIdentities.Rd +0 -41
data/utils/enveomics/enveomics.R/man/enve.recplot2.coordinates.Rd +0 -29
data/utils/enveomics/enveomics.R/man/enve.recplot2.corePeak.Rd +0 -18
data/utils/enveomics/enveomics.R/man/enve.recplot2.extractWindows.Rd +0 -40
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.Rd +0 -36
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_e.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_m.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__emauto_one.Rd +0 -27
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mow_one.Rd +0 -41
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mower.Rd +0 -17
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.em.Rd +0 -43
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.emauto.Rd +0 -37
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.mower.Rd +0 -74
data/utils/enveomics/enveomics.R/man/enve.recplot2.peak-class.Rd +0 -59
data/utils/enveomics/enveomics.R/man/enve.recplot2.seqdepth.Rd +0 -27
data/utils/enveomics/enveomics.R/man/enve.recplot2.windowDepthThreshold.Rd +0 -32
data/utils/enveomics/enveomics.R/man/enve.tribs.Rd +0 -59
data/utils/enveomics/enveomics.R/man/enve.tribs.test.Rd +0 -28
data/utils/enveomics/enveomics.R/man/enve.truncate.Rd +0 -27
data/utils/enveomics/enveomics.R/man/growth.curves.Rd +0 -14
data/utils/enveomics/enveomics.R/man/phyla.counts.Rd +0 -13
data/utils/enveomics/enveomics.R/man/plot.enve.GrowthCurve.Rd +0 -63
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBS.Rd +0 -38
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBStest.Rd +0 -38
data/utils/enveomics/enveomics.R/man/plot.enve.recplot2.Rd +0 -111
data/utils/enveomics/enveomics.R/man/summary.enve.GrowthCurve.Rd +0 -19
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBS.Rd +0 -19
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBStest.Rd +0 -19
data/utils/enveomics/globals.mk +0 -8
data/utils/enveomics/manifest.json +0 -9

data/utils/enveomics/Manifest/Tasks/remote.json DELETED Viewed

@@ -1,355 +0,0 @@
-{
-  "tasks": [
-    {
-      "task": "BlastTab.kegg_pep2path_rest.pl",
-      "description": ["Takes a BLAST against KEGG_PEP (or KO) and retrieves",
-        "the pathways in which the subject peptides are involved."],
-      "requires": [
-        { "perl_lib": "JSON" },
-        { "perl_lib": "LWP::Simple" }
-      ],
-      "help_arg": "",
-      "options": [
-        {
-          "name": "blast.txt",
-          "arg": "in_file",
-          "mandatory": true,
-          "description": "Input tabular BLAST file."
-        },
-        {
-          "name": "Cache file",
-          "arg": "out_file",
-          "description": ["(optional) File containing the saved cache. If",
-            "unset, the cache won't be recoverable across instances of this",
-            "script. It is strongly recommended to set a file. Multiple",
-            "parallel instances of this script may use the same cache file."]
-        },
-        ">",
-        {
-          "name": "output.txt",
-          "arg": "out_file",
-          "mandatory": true,
-          "description": ["Tab-delimited output file, with the columns: (1)",
-            "Query ID, (2) Subject ID, (3) Pathway ID, (4) Pathway (reference)",
-            "description, (5) Organism."]
-        }
-      ]
-    },
-    {
-      "task": "M5nr.getSequences.rb",
-      "description": ["Downloads a set of sequences from M5nr with a given",
-        "functional annotation."],
-      "help_arg": "--help",
-      "requires": [
-        { "ruby_gem": "restclient" },
-        { "ruby_gem": "open-uri" },
-        { "ruby_gem": "JSON" }
-      ],
-      "options": [
-        {
-          "opt": "--function",
-          "arg": "string",
-          "mandatory": true,
-          "description": "Functional annotation."
-        },
-        {
-          "name": "Output file",
-          "opt": "--out",
-          "arg": "out_file",
-          "mandatory": true,
-          "description": "File containing the sequences."
-        },
-        {
-          "opt": "--max",
-          "arg": "integer",
-          "default": 0,
-          "description": ["Maximum number of sequences to download. Set to",
-            "0 to download all."]
-        },
-        {
-          "opt": "--recover",
-          "description": "If set, tries to recover a previous FastA."
-        },
-        {
-          "name": "URL",
-          "opt": "--url",
-          "arg": "string",
-          "default": "http://api.metagenomics.anl.gov/m5nr",
-          "description": "URL for M5nr API."
-        },
-        {
-          "opt": "--quiet",
-          "description": "Run quietly (no STDERR output)."
-        }
-      ]
-    },
-    {
-      "task": "EBIseq2tax.rb",
-      "description": ["Maps a list of EBI-supported IDs to their corresponding",
-        "NCBI taxonomy using EBI RESTful API."],
-      "warn": ["Avoid using this script on millions of entries at a time,",
-        "since each entry elicits requests to EBI and NCBI servers."],
-      "requires": [
-        { "ruby_gem": "nokogiri" }
-      ],
-      "see_also": ["NCBIacc2tax.rb"],
-      "help_arg": "--help",
-      "options": [
-        {
-          "name": "IDs",
-          "opt": "--ids",
-          "arg": "string",
-          "description": "Comma-separated list of EBI IDs.",
-          "note": "Required unless 'Input file' is passed."
-        },
-        {
-          "name": "Input file",
-          "opt": "--infile",
-          "arg": "in_file",
-          "description": ["Raw text file containing the list of EBI IDs,",
-            "one per line."],
-          "note": "Required unless 'IDs' is passed."
-        },
-        {
-          "opt": "--database",
-          "arg": "string",
-          "default": "uniprotkb",
-          "description": "EBI database defining the EBI IDs."
-        },
-        {
-          "opt": "--ranks",
-          "arg": "string",
-          "description": "Comma-delimited list of taxonomic ranks to report.",
-          "default": "superkingdom,phylum,class,order,family,genus,species"
-        },
-        {
-          "opt": "--noheader",
-          "description": "Do not includ a header in the output."
-        },
-        {
-          "opt": "--taxids",
-          "description": "Return Taxonomy IDs instead of scientific names."
-        },
-        {
-          "opt": "--quiet",
-          "description": "Run quietly."
-        }
-      ]
-    },
-    {
-      "task": "RefSeq.download.bash",
-      "description": ["Downloads a collection of sequences and/or annotations",
-        "from NCBI's RefSeq."],
-      "help_arg": "",
-      "requires": [
-        {
-          "description": "curl",
-          "test": "curl --version"
-        }
-      ],
-      "options": [
-        {
-          "name": "Organism",
-          "arg": "string",
-          "mandatory": true,
-          "description": ["The organism to download (e.g.,",
-            "Streptococcus_pneumoniae)."]
-        },
-        {
-          "name": "Extension",
-          "arg": "string",
-          "mandatory": true,
-          "default": ".*.gz",
-          "description": ["Extension to download. Common extensions include",
-            ".fna.gz (genomic sequences), .faa.gz (protein sequences),",
-            ".gff.gz (annotations), and .*.gz (all data)."]
-        },
-        {
-          "name": "Level",
-          "arg": "string",
-          "mandatory": true,
-          "default": "Any",
-          "description": ["Use only genomes with this assembly level. Common",
-            "levels are 'Complete Genome' and 'Contig'. By default, any",
-            "assembly level is allowed ('Any')."]
-        },
-        {
-          "name": "Directory",
-          "arg": "out_dir",
-          "description": ["Directory where the files are to be downladed.",
-            "By default, same as 'Organism'."]
-        }
-      ]
-    },
-    {
-      "task": "SRA.download.bash",
-      "description": ["Downloads the set of runs from a project, sample, or",
-        "experiment in SRA."],
-      "help_arg": "",
-      "requires": [
-        {
-          "description": "curl",
-          "test": "curl --version"
-        }
-      ],
-      "options": [
-        {
-          "name": "SRA ID",
-          "arg": "string",
-          "mandatory": true,
-          "description": "ID of the SRA Project, Sample, or Experiment."
-        },
-        {
-          "name": "dir",
-          "arg": "out_dir",
-          "description": ["Directory where the files are to be downladed. By",
-            "default, same as 'SRA ID'."]
-        }
-      ]
-    },
-    {
-      "task": "gi2tax.rb",
-      "description": ["Maps a list of NCBI GIs to their corresponding taxonomy",
-        "using the NCBI EUtilities."],
-      "warn": ["Avoid using this script on millions of entries at a time,",
-        "since each entry elicits two requests to NCBI's servers.",
-        "*IMPORTANT NOTE*: NCBI is phasing out support for GIs. Please use",
-        "acc.ver instead with NCBIacc2tax.rb."],
-      "requires": [
-        { "ruby_gem": "nokogiri" },
-        { "ruby_gem": "json" }
-      ],
-      "see_also": ["NCBIacc2tax.rb"],
-      "help_arg": "--help",
-      "options": [
-        {
-          "name": "GIs",
-          "opt": "--gis",
-          "arg": "string",
-          "description": "Comma-separated list of GIs.",
-          "note": "Required unless 'Input file' is passed."
-        },
-        {
-          "name": "Input file",
-          "opt": "--infile",
-          "arg": "in_file",
-          "description": ["Raw text file containing the list of GIs, one per",
-            "line."],
-          "note": "Required unless 'GIs' is passed."
-        },
-        {
-          "opt": "--protein",
-          "description": ["Use if the GIs are proteins. Otherwise, GIs are",
-            "assumed to be from the Nuccore Database."]
-        },
-        {
-          "opt": "--ranks",
-          "arg": "string",
-          "description": "Taxonomic ranks to report, separated by commas.",
-          "default": "superkingdom,phylum,class,order,family,genus,species"
-        },
-        {
-          "name": "No header",
-          "opt": "--noheader",
-          "description": "Do not include a header in the output."
-        },
-        {
-          "name": "Tax IDs",
-          "opt": "--taxids",
-          "description": "Return Taxonomy IDs instead of scientific names."
-        },
-        {
-          "name": "Exact GI",
-          "opt": "--exact-gi",
-          "description": ["Returns only taxonomy associated with the exact GI",
-            "passed. By default, it attempts to update accession versions if",
-            "possible."]
-        },
-        {
-          "opt": "--ignore-missing",
-          "description": ["Does not report missing GIs in the output file. By",
-            "default, it reports GI and empty values for all other columns."]
-        },
-        {
-          "opt": "--quiet",
-          "description": "Run quietly."
-        },
-        ">",
-        {
-          "arg": "out_file",
-          "mandatory": true,
-          "description": ["Tab-delimited table with GIs and taxonomic",
-            "classification."]
-        }
-      ]
-    },
-    {
-      "task": "NCBIacc2tax.rb",
-      "description": ["Maps a list of NCBI accessions to their corresponding",
-        "taxonomy using the NCBI EUtilities."],
-      "warn": ["Avoid using this script on millions of entries at a time,",
-        "since each entry elicits two requests to NCBI's servers."],
-      "requires": [
-        { "ruby_gem": "nokogiri" },
-        { "ruby_gem": "json" }
-      ],
-      "see_also": ["EBIseq2tax.rb"],
-      "help_arg": "--help",
-      "options": [
-        {
-          "name": "Accessions",
-          "opt": "--acc",
-          "arg": "string",
-          "description": "Comma-separated list of accessions.",
-          "note": "Required unless 'Input file' is passed."
-        },
-        {
-          "name": "Input file",
-          "opt": "--infile",
-          "arg": "in_file",
-          "description": ["Raw text file containing the list of accessions,",
-            "one per line."],
-          "note": "Required unless 'Accessions' is passed."
-        },
-        {
-          "opt": "--protein",
-          "description": ["Use if the accessions are proteins. Otherwise,",
-            "accessions are assumed to be from the Nuccore Database."]
-        },
-        {
-          "opt": "--ranks",
-          "arg": "string",
-          "description": "Taxonomic ranks to report, separated by commas.",
-          "default": "superkingdom,phylum,class,order,family,genus,species"
-        },
-        {
-          "name": "No header",
-          "opt": "--noheader",
-          "description": "Do not include a header in the output."
-        },
-        {
-          "name": "Tax IDs",
-          "opt": "--taxids",
-          "description": "Return Taxonomy IDs instead of scientific names."
-        },
-        {
-          "opt": "--ignore-missing",
-          "description": ["Does not report missing accessions in the output",
-            "file. By default, it reports GI and empty values for all other",
-            "columns."]
-        },
-        {
-          "opt": "--quiet",
-          "description": "Run quietly."
-        },
-        ">",
-        {
-          "arg": "out_file",
-          "mandatory": true,
-          "description": ["Tab-delimited table with accessions and taxonomic",
-            "classification."]
-        }
-      ]
-    }
-  ]
-}

data/utils/enveomics/Manifest/Tasks/sequence-identity.json DELETED Viewed

@@ -1,501 +0,0 @@
-{
-  "tasks": [
-    {
-      "task": "aai.rb",
-      "description": ["Calculates the Average Amino acid Identity between two",
-        "genomes."],
-      "help_arg": "--help",
-      "see_also": ["ani.rb", "rbm.rb"],
-      "cite": [
-        ["Konstantinidis & Tiedje, 2005, JBac",
-          "https://dx.doi.org/10.1128%2FJB.187.18.6258-6264.2005"],
-        ["Altschul et al, 2000, JMB (BLAST)",
-          "https://dx.doi.org/10.1016/S0022-2836(05)80360-2"],
-        ["Kent WJ, 2002, Genome Res (BLAT)",
-          "https://dx.doi.org/10.1101/gr.229202"],
-        ["Buchfink B, Xie C, Huson D, 2015, Nat Meth (Diamond)",
-          "https://dx.doi.org/10.1038/nmeth.3176"]
-      ],
-      "options": [
-        {
-          "name": "Sequence 1",
-          "opt": "--seq1",
-          "arg": "in_file",
-          "mandatory": true,
-          "description": "FastA file containing the genome 1 (proteins).",
-          "note": ["Alternatively, you can supply the NCBI-acc of a genome",
-            " (nucleotides) with the format ncbi:CP014272 instead of files."]
-        },
-        {
-          "name": "Sequence 2",
-          "opt": "--seq2",
-          "arg": "in_file",
-          "mandatory": true,
-          "description": "FastA file containing the genome 2.",
-          "note": ["Alternatively, you can supply the NCBI-acc of a genome",
-            " (nucleotides) with the format ncbi:NC_004337 instead of files."]
-        },
-        {
-          "name": "Length",
-          "opt": "--len",
-          "arg": "integer",
-          "description": "Minimum alignment length (in aa).",
-          "default": 0
-        },
-        {
-          "name": "Length fraction",
-          "opt": "--len-fraction",
-          "arg": "float",
-          "description": ["Minimum alignment length as a fraction of the",
-            "shorter sequence (range 0-1)."],
-          "default": 0.0
-        },
-        {
-          "name": "Identity",
-          "opt": "--id",
-          "arg": "float",
-          "description": "Minimum alignment identity (in %).",
-          "default": 20.0
-        },
-        {
-          "name": "Bit-score",
-          "opt": "--bitscore",
-          "arg": "float",
-          "description": "Minimum bit score (in bits).",
-          "default": 0.0
-        },
-        {
-          "opt": "--hits",
-          "arg": "float",
-          "description": "Minimum number of hits.",
-          "default": 50.0
-        },
-        {
-          "name": "Nucleotides",
-          "opt": "--nucl",
-          "description": ["The input sequences are nucleotides (genes), not",
-            "proteins."]
-        },
-        {
-          "name": "Max ACTG",
-          "opt": "--max-actg",
-          "arg": "float",
-          "default": 0.95,
-          "description": ["Maximum fraction of ACTGN in the sequences before",
-            "assuming nucleotides."]
-        },
-        {
-          "name": "Executables",
-          "opt": "--bin",
-          "arg": "in_dir",
-          "description": ["Path to the directory containing the binaries of",
-            "the search program."]
-        },
-        {
-          "opt": "--program",
-          "arg": "select",
-          "values": ["blast+","blast","blat","diamond"],
-          "default": "blast+",
-          "description": "Search program to be used.",
-          "note": ["Make sure that you have installed the search program you",
-            "want to use. If you have downloaded the program, but it's not",
-            "installed, please use the Executables option above."]
-        },
-        {
-          "opt": "--threads",
-          "arg": "integer",
-          "description": "Number of parallel threads to be used.",
-          "default": 1
-        },
-        {
-          "name": "SQLite3 DB",
-          "opt": "--sqlite3",
-          "arg": "out_file",
-          "description": ["Path to the SQLite3 database to create (or update)",
-            "with the results."]
-        },
-        {
-          "name": "Name 1",
-          "opt": "--name1",
-          "arg": "string",
-          "description": ["Name of Sequence 1 to use in SQLite3 DB. By default",
-            "determined by filename."]
-        },
-        {
-          "name": "Name 2",
-          "opt": "--name2",
-          "arg": "string",
-          "description": ["Name of Sequence 2 to use in SQLite3 DB. By default",
-            "determined by filename."]
-        },
-        {
-          "name": "Don't save RBM",
-          "opt": "--no-save-rbm",
-          "description": ["Don't save the reciprocal best matches in the",
-            "--sqlite3 database."]
-        },
-        {
-          "opt": "--lookup-first",
-          "description": ["Indicates if the AAI should be looked up first in",
-            "the database. Requires SQLite3 DB, Auto, Name 1, and Name 2.",
-            "Incompatible with Result, Tab, Out, and RBM."]
-        },
-        {
-          "name": "Precision",
-          "opt": "--dec",
-          "arg": "integer",
-          "default": 2,
-          "description": "Decimal positions to report."
-        },
-        {
-          "name": "RBM",
-          "opt": "--rbm",
-          "arg": "out_file",
-          "description": "Saves a file with the reciprocal best matches."
-        },
-        {
-          "opt": "--out",
-          "arg": "out_file",
-          "description": ["Saves a file describing the alignments used for",
-            "two-way AAI."]
-        },
-        {
-          "name": "Result",
-          "opt": "--res",
-          "arg": "out_file",
-          "description": "Saves a file with the final results."
-        },
-        {
-          "opt": "--tab",
-          "arg": "out_file",
-          "description": ["Saves a file with the final two-way results in a",
-            "tab-delimited form. The columns are (in that order): AAI,",
-            "standard deviation, proteins used, proteins in the smallest",
-            "genome."]
-        },
-        {
-          "opt": "--auto",
-          "description": ["ONLY outputs the AAI value in STDOUT (or nothing,",
-            "if calculation fails)."]
-        },
-        {
-          "opt": "--quiet",
-          "description": "Run quietly (no STDERR output)."
-        }
-      ]
-    },
-    {
-      "task": "ani.rb",
-      "description": ["Calculates the Average Nucleotide Identity between two",
-        "genomes."],
-      "help_arg": "--help",
-      "see_also": ["aai.rb","rbm.rb","HMM.essential.rb"],
-      "cite": [
-        ["Konstantinidis & Tiedje, 2005, PNAS",
-          "http://dx.doi.org/10.1073%2Fpnas.0409727102"],
-        ["Altschul et al, 2000, JMB (BLAST)",
-          "http://dx.doi.org/10.1016/S0022-2836(05)80360-2"],
-        ["Kent WJ, 2002, Genome Res (BLAT)",
-          "https://dx.doi.org/10.1101/gr.229202"]
-      ],
-      "options": [
-        {
-          "name": "Sequence 1",
-          "opt": "--seq1",
-          "arg": "in_file",
-          "mandatory": true,
-          "description": "FastA file containing the genome 1.",
-          "note": ["Alternatively, you can supply an NCBI-acc with the format",
-            "ncbi:CP014272 instead of files."]
-        },
-        {
-          "name": "Sequence 2",
-          "opt": "--seq2",
-          "arg": "in_file",
-          "mandatory": true,
-          "description": "FastA file containing the genome 2.",
-          "note": ["Alternatively, you can supply an NCBI-acc with the format",
-            "ncbi:AE005174 instead of files."]
-        },
-        {
-          "name": "Window",
-          "opt": "--win",
-          "arg": "integer",
-          "description": "Window size in the ANI calculation (in bp).",
-          "default": 1000
-        },
-        {
-          "opt": "--step",
-          "arg": "integer",
-          "description": "Step size in the ANI calculation (in bp).",
-          "default": 200
-        },
-        {
-          "name": "Length",
-          "opt": "--len",
-          "arg": "integer",
-          "description": "Minimum alignment length (in bp).",
-          "default": 700
-        },
-        {
-          "name": "Identity",
-          "opt": "--id",
-          "arg": "float",
-          "description": "Minimum alignment identity (in %).",
-          "default": 70.0
-        },
-        {
-          "opt": "--hits",
-          "arg": "integer",
-          "description": "Minimum number of hits.",
-          "default": 50
-        },
-        {
-          "name": "No correction",
-          "opt": "--nocorrection",
-          "description": "Report values without post-hoc correction."
-        },
-        {
-          "name": "Min ACTG",
-          "opt": "--min-actg",
-          "arg": "float",
-          "default": 0.95,
-          "description": ["Minimum fraction of ACTGN in the sequences before",
-            "assuming proteins."]
-        },
-        {
-          "name": "Executables",
-          "opt": "--bin",
-          "arg": "in_dir",
-          "description": ["Directory containing the binaries of the search",
-            "program."]
-        },
-        {
-          "opt": "--program",
-          "arg": "select",
-          "values": ["blast+", "blast", "blat"],
-          "default": "blast+",
-          "description": "Search program to be used.",
-          "note": ["Make sure that you have installed the search program you",
-            "want to use. If you have downloaded the program, but it's not",
-            "installed, please use the Executables option above."]
-        },
-        {
-          "opt": "--threads",
-          "arg": "integer",
-          "description": "Number of parallel threads to be used.",
-          "default": 1
-        },
-        {
-          "name": "SQLite3 DB",
-          "opt": "--sqlite3",
-          "arg": "out_file",
-          "description": ["Path to the SQLite3 database to create (or update)",
-            "with the results."]
-        },
-        {
-          "name": "Name 1",
-          "opt": "--name1",
-          "arg": "string",
-          "description": ["Name of Sequence 1 to use in SQLite3 DB. By default",
-            "it's determined by the filename."]
-        },
-        {
-          "name": "Name 2",
-          "opt": "--name2",
-          "arg": "string",
-          "description": ["Name of Sequence 2 to use in SQLite3 DB. By default",
-            "it's determined by the filename."]
-        },
-        {
-          "name": "Don't save regions",
-          "opt": "--no-save-regions",
-          "description": "Don't save the fragments in the SQLite3 database."
-        },
-        {
-          "name": "Don't save RBM",
-          "opt": "--no-save-rbm",
-          "description": ["Don't save the reciprocal best matches in the",
-            "--sqlite3 database."]
-        },
-        {
-          "opt": "--lookup-first",
-          "description": ["Indicates if the ANI should be looked up first in",
-            "the database. Requires SQLite3 DB, Auto, Name 1, and Name 2.",
-            "Incompatible with Result, Tab, and Out."]
-        },
-        {
-          "name": "Precision",
-          "opt": "--dec",
-          "arg": "integer",
-          "description": "Decimal positions to report.",
-          "default": 2
-        },
-        {
-          "opt": "--out",
-          "arg": "out_file",
-          "description": ["Saves a file describing the alignments used for",
-            "two-way ANI."]
-        },
-        {
-          "name": "Result",
-          "opt": "--res",
-          "arg": "out_file",
-          "description": "Saves a file with the final results."
-        },
-        {
-          "opt": "--tab",
-          "arg": "out_file",
-          "description": ["Saves a file with the final two-way results in a",
-            "tab-delimited form. The columns are (in that order): ANI,",
-            "standard deviation, fragments used, fragments in the smallest",
-            "genome."]
-        },
-        {
-          "opt": "--auto",
-          "description": ["ONLY outputs the ANI value in STDOUT (or nothing,",
-            "if calculation fails)."]
-        },
-        {
-          "opt": "--quiet",
-          "description": "Run quietly (no STDERR output)."
-        }
-      ]
-    },
-    {
-      "task": "HMM.haai.rb",
-      "description": ["Estimates Average Amino Acid Identity (AAI) from the",
-        "essential genes extracted and aligned by HMM.essential.rb (see",
-        "Alignments)."],
-      "help_arg": "--help",
-      "see_also": ["HMM.essential.rb","aai.rb"],
-      "options": [
-        {
-          "name": "Alignments 1",
-          "opt": "-1",
-          "arg": "in_file",
-          "description": "Input alignments file for genome 1."
-        },
-        {
-          "name": "Alignments 2",
-          "opt": "-2",
-          "arg": "in_file",
-          "description": "Input alignments file for genome 2."
-        },
-        {
-          "name": "Alignment output",
-          "opt": "--aln-out",
-          "arg": "out_file",
-          "description": "Output file containing the aligned proteins."
-        },
-	{
-	  "opt": "--components",
-	  "arg": "out_file",
-	  "description": ["Output file containing the components of the",
-	    "estimation. Tab-delimited file with model name, matches, and",
-	    "columns."]
-	},
-        {
-          "opt": "--quiet",
-          "description": "Run quietly (no STDERR output)."
-        }
-      ]
-    },
-    {
-      "task": "rbm.rb",
-      "description": ["Finds the reciprocal best matches between two sets of",
-        "sequences."],
-      "help_arg": "--help",
-      "cite":[
-        ["Altschul et al, 2000, JMB (BLAST)",
-          "http://dx.doi.org/10.1016/S0022-2836(05)80360-2"],
-        ["Buchfink B, Xie C, Huson D, 2015, Nat Meth (Diamond)",
-          "https://dx.doi.org/10.1038/nmeth.3176"]
-      ],
-      "options": [
-        {
-          "name": "Sequence 1",
-          "opt": "--seq1",
-          "arg": "in_file",
-          "mandatory": true,
-          "description": "FastA file containing the genome 1."
-        },
-        {
-          "name": "Sequence 2",
-          "opt": "--seq2",
-          "arg": "in_file",
-          "mandatory": true,
-          "description": "FastA file containing the genome 2."
-        },
-        {
-          "name": "Nucleotides",
-          "opt": "--nucl",
-          "description": ["Sequences are assumed to be nucleotides (proteins",
-            "by default)."]
-        },
-        {
-          "name": "Length",
-          "opt": "--len",
-          "arg": "integer",
-          "description": "Minimum alignment length (in residues).",
-          "default": 0
-        },
-        {
-          "name": "Fraction",
-          "opt": "--fract",
-          "arg": "float",
-          "default": 0.0,
-          "description": ["Minimum alignment length (as a fraction of the",
-            "query). If set, requires BLAST+ or Diamond (see Program)."]
-        },
-        {
-          "name": "Identity",
-          "opt": "--id",
-          "arg": "float",
-          "description": "Minimum alignment identity (in %).",
-          "default": 0.0
-        },
-        {
-          "name": "Bit score",
-          "opt": "--score",
-          "arg": "float",
-          "default": 0.0,
-          "description": "Minimum alignment score (in bits)."
-        },
-        {
-          "name": "Executables",
-          "opt": "--bin",
-          "arg": "in_dir",
-          "description": ["Directory containing the binaries of the search",
-            "program."]
-        },
-        {
-          "opt": "--program",
-          "arg": "select",
-          "values": ["blast+", "blast", "blat", "diamond"],
-          "default": "blast+",
-          "description": "Search program to be used. Default: blast+.",
-          "note": ["Make sure that you have installed the search program you",
-            "want to use. If you have downloaded the program, but it's not",
-            "installed, please use the Executables option above."]
-        },
-        {
-          "opt": "--threads",
-          "arg": "integer",
-          "description": "Number of parallel threads to be used.",
-          "default": 1
-        },
-        {
-          "opt": "--quiet",
-          "description": "Run quietly (no STDERR output)."
-        },
-        ">",
-        {
-          "arg": "out_file",
-          "mandatory": true,
-          "description": "Reciprocal Best Matches in BLAST tabular format."
-        }
-      ]
-    }
-  ]
-}