RubyGems - miga-base - Versions diffs - 1.2.15.2 → 1.2.15.4 - Mend

miga-base 1.2.15.2 → 1.2.15.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (306) hide show

checksums.yaml +4 -4
data/lib/miga/cli/action/download/gtdb.rb +4 -1
data/lib/miga/cli/action/gtdb_get.rb +4 -0
data/lib/miga/daemon.rb +4 -1
data/lib/miga/lair.rb +6 -4
data/lib/miga/remote_dataset/download.rb +3 -2
data/lib/miga/remote_dataset.rb +25 -7
data/lib/miga/taxonomy.rb +6 -0
data/lib/miga/version.rb +2 -2
metadata +6 -302
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Archaea_SCG.hmm +0 -41964
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Bacteria_SCG.hmm +0 -32439
data/utils/FastAAI/00.Libraries/01.SCG_HMMs/Complete_SCG_DB.hmm +0 -62056
data/utils/FastAAI/FastAAI +0 -3659
data/utils/FastAAI/FastAAI-legacy/FastAAI +0 -1336
data/utils/FastAAI/FastAAI-legacy/kAAI_v1.0_virus.py +0 -1296
data/utils/FastAAI/README.md +0 -84
data/utils/enveomics/Docs/recplot2.md +0 -244
data/utils/enveomics/Examples/aai-matrix.bash +0 -66
data/utils/enveomics/Examples/ani-matrix.bash +0 -66
data/utils/enveomics/Examples/essential-phylogeny.bash +0 -105
data/utils/enveomics/Examples/unus-genome-phylogeny.bash +0 -100
data/utils/enveomics/LICENSE.txt +0 -73
data/utils/enveomics/Makefile +0 -52
data/utils/enveomics/Manifest/Tasks/aasubs.json +0 -103
data/utils/enveomics/Manifest/Tasks/blasttab.json +0 -790
data/utils/enveomics/Manifest/Tasks/distances.json +0 -161
data/utils/enveomics/Manifest/Tasks/fasta.json +0 -802
data/utils/enveomics/Manifest/Tasks/fastq.json +0 -291
data/utils/enveomics/Manifest/Tasks/graphics.json +0 -126
data/utils/enveomics/Manifest/Tasks/mapping.json +0 -137
data/utils/enveomics/Manifest/Tasks/ogs.json +0 -382
data/utils/enveomics/Manifest/Tasks/other.json +0 -906
data/utils/enveomics/Manifest/Tasks/remote.json +0 -355
data/utils/enveomics/Manifest/Tasks/sequence-identity.json +0 -650
data/utils/enveomics/Manifest/Tasks/tables.json +0 -308
data/utils/enveomics/Manifest/Tasks/trees.json +0 -68
data/utils/enveomics/Manifest/Tasks/variants.json +0 -111
data/utils/enveomics/Manifest/categories.json +0 -165
data/utils/enveomics/Manifest/examples.json +0 -162
data/utils/enveomics/Manifest/tasks.json +0 -4
data/utils/enveomics/Pipelines/assembly.pbs/CONFIG.mock.bash +0 -69
data/utils/enveomics/Pipelines/assembly.pbs/FastA.N50.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/FastA.filterN.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/FastA.length.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/README.md +0 -189
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-2.bash +0 -112
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-3.bash +0 -23
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-4.bash +0 -44
data/utils/enveomics/Pipelines/assembly.pbs/RUNME.bash +0 -50
data/utils/enveomics/Pipelines/assembly.pbs/kSelector.R +0 -37
data/utils/enveomics/Pipelines/assembly.pbs/newbler.pbs +0 -68
data/utils/enveomics/Pipelines/assembly.pbs/newbler_preparator.pl +0 -49
data/utils/enveomics/Pipelines/assembly.pbs/soap.pbs +0 -80
data/utils/enveomics/Pipelines/assembly.pbs/stats.pbs +0 -57
data/utils/enveomics/Pipelines/assembly.pbs/velvet.pbs +0 -63
data/utils/enveomics/Pipelines/blast.pbs/01.pbs.bash +0 -38
data/utils/enveomics/Pipelines/blast.pbs/02.pbs.bash +0 -73
data/utils/enveomics/Pipelines/blast.pbs/03.pbs.bash +0 -21
data/utils/enveomics/Pipelines/blast.pbs/BlastTab.recover_job.pl +0 -72
data/utils/enveomics/Pipelines/blast.pbs/CONFIG.mock.bash +0 -98
data/utils/enveomics/Pipelines/blast.pbs/FastA.split.pl +0 -1
data/utils/enveomics/Pipelines/blast.pbs/README.md +0 -127
data/utils/enveomics/Pipelines/blast.pbs/RUNME.bash +0 -109
data/utils/enveomics/Pipelines/blast.pbs/TASK.check.bash +0 -128
data/utils/enveomics/Pipelines/blast.pbs/TASK.dry.bash +0 -16
data/utils/enveomics/Pipelines/blast.pbs/TASK.eo.bash +0 -22
data/utils/enveomics/Pipelines/blast.pbs/TASK.pause.bash +0 -26
data/utils/enveomics/Pipelines/blast.pbs/TASK.run.bash +0 -89
data/utils/enveomics/Pipelines/blast.pbs/sentinel.pbs.bash +0 -29
data/utils/enveomics/Pipelines/idba.pbs/README.md +0 -49
data/utils/enveomics/Pipelines/idba.pbs/RUNME.bash +0 -95
data/utils/enveomics/Pipelines/idba.pbs/run.pbs +0 -56
data/utils/enveomics/Pipelines/trim.pbs/README.md +0 -54
data/utils/enveomics/Pipelines/trim.pbs/RUNME.bash +0 -70
data/utils/enveomics/Pipelines/trim.pbs/run.pbs +0 -130
data/utils/enveomics/README.md +0 -42
data/utils/enveomics/Scripts/AAsubs.log2ratio.rb +0 -171
data/utils/enveomics/Scripts/Aln.cat.rb +0 -221
data/utils/enveomics/Scripts/Aln.convert.pl +0 -35
data/utils/enveomics/Scripts/AlphaDiversity.pl +0 -152
data/utils/enveomics/Scripts/BedGraph.tad.rb +0 -93
data/utils/enveomics/Scripts/BedGraph.window.rb +0 -71
data/utils/enveomics/Scripts/BlastPairwise.AAsubs.pl +0 -102
data/utils/enveomics/Scripts/BlastTab.addlen.rb +0 -63
data/utils/enveomics/Scripts/BlastTab.advance.bash +0 -48
data/utils/enveomics/Scripts/BlastTab.best_hit_sorted.pl +0 -55
data/utils/enveomics/Scripts/BlastTab.catsbj.pl +0 -104
data/utils/enveomics/Scripts/BlastTab.cogCat.rb +0 -76
data/utils/enveomics/Scripts/BlastTab.filter.pl +0 -47
data/utils/enveomics/Scripts/BlastTab.kegg_pep2path_rest.pl +0 -194
data/utils/enveomics/Scripts/BlastTab.metaxaPrep.pl +0 -104
data/utils/enveomics/Scripts/BlastTab.pairedHits.rb +0 -157
data/utils/enveomics/Scripts/BlastTab.recplot2.R +0 -48
data/utils/enveomics/Scripts/BlastTab.seqdepth.pl +0 -86
data/utils/enveomics/Scripts/BlastTab.seqdepth_ZIP.pl +0 -119
data/utils/enveomics/Scripts/BlastTab.seqdepth_nomedian.pl +0 -86
data/utils/enveomics/Scripts/BlastTab.subsample.pl +0 -47
data/utils/enveomics/Scripts/BlastTab.sumPerHit.pl +0 -114
data/utils/enveomics/Scripts/BlastTab.taxid2taxrank.pl +0 -90
data/utils/enveomics/Scripts/BlastTab.topHits_sorted.rb +0 -123
data/utils/enveomics/Scripts/Chao1.pl +0 -97
data/utils/enveomics/Scripts/CharTable.classify.rb +0 -234
data/utils/enveomics/Scripts/EBIseq2tax.rb +0 -83
data/utils/enveomics/Scripts/FastA.N50.pl +0 -60
data/utils/enveomics/Scripts/FastA.extract.rb +0 -152
data/utils/enveomics/Scripts/FastA.filter.pl +0 -52
data/utils/enveomics/Scripts/FastA.filterLen.pl +0 -28
data/utils/enveomics/Scripts/FastA.filterN.pl +0 -60
data/utils/enveomics/Scripts/FastA.fragment.rb +0 -100
data/utils/enveomics/Scripts/FastA.gc.pl +0 -42
data/utils/enveomics/Scripts/FastA.interpose.pl +0 -93
data/utils/enveomics/Scripts/FastA.length.pl +0 -38
data/utils/enveomics/Scripts/FastA.mask.rb +0 -89
data/utils/enveomics/Scripts/FastA.per_file.pl +0 -36
data/utils/enveomics/Scripts/FastA.qlen.pl +0 -57
data/utils/enveomics/Scripts/FastA.rename.pl +0 -65
data/utils/enveomics/Scripts/FastA.revcom.pl +0 -23
data/utils/enveomics/Scripts/FastA.sample.rb +0 -98
data/utils/enveomics/Scripts/FastA.slider.pl +0 -85
data/utils/enveomics/Scripts/FastA.split.pl +0 -55
data/utils/enveomics/Scripts/FastA.split.rb +0 -79
data/utils/enveomics/Scripts/FastA.subsample.pl +0 -131
data/utils/enveomics/Scripts/FastA.tag.rb +0 -65
data/utils/enveomics/Scripts/FastA.toFastQ.rb +0 -69
data/utils/enveomics/Scripts/FastA.wrap.rb +0 -48
data/utils/enveomics/Scripts/FastQ.filter.pl +0 -54
data/utils/enveomics/Scripts/FastQ.interpose.pl +0 -90
data/utils/enveomics/Scripts/FastQ.maskQual.rb +0 -89
data/utils/enveomics/Scripts/FastQ.offset.pl +0 -90
data/utils/enveomics/Scripts/FastQ.split.pl +0 -53
data/utils/enveomics/Scripts/FastQ.tag.rb +0 -70
data/utils/enveomics/Scripts/FastQ.test-error.rb +0 -81
data/utils/enveomics/Scripts/FastQ.toFastA.awk +0 -24
data/utils/enveomics/Scripts/GFF.catsbj.pl +0 -127
data/utils/enveomics/Scripts/GenBank.add_fields.rb +0 -84
data/utils/enveomics/Scripts/HMM.essential.rb +0 -351
data/utils/enveomics/Scripts/HMM.haai.rb +0 -168
data/utils/enveomics/Scripts/HMMsearch.extractIds.rb +0 -83
data/utils/enveomics/Scripts/JPlace.distances.rb +0 -88
data/utils/enveomics/Scripts/JPlace.to_iToL.rb +0 -320
data/utils/enveomics/Scripts/M5nr.getSequences.rb +0 -81
data/utils/enveomics/Scripts/MeTaxa.distribution.pl +0 -198
data/utils/enveomics/Scripts/MyTaxa.fragsByTax.pl +0 -35
data/utils/enveomics/Scripts/MyTaxa.seq-taxrank.rb +0 -49
data/utils/enveomics/Scripts/NCBIacc2tax.rb +0 -92
data/utils/enveomics/Scripts/Newick.autoprune.R +0 -27
data/utils/enveomics/Scripts/RAxML-EPA.to_iToL.pl +0 -228
data/utils/enveomics/Scripts/RecPlot2.compareIdentities.R +0 -32
data/utils/enveomics/Scripts/RefSeq.download.bash +0 -48
data/utils/enveomics/Scripts/SRA.download.bash +0 -55
data/utils/enveomics/Scripts/TRIBS.plot-test.R +0 -36
data/utils/enveomics/Scripts/TRIBS.test.R +0 -39
data/utils/enveomics/Scripts/Table.barplot.R +0 -31
data/utils/enveomics/Scripts/Table.df2dist.R +0 -30
data/utils/enveomics/Scripts/Table.filter.pl +0 -61
data/utils/enveomics/Scripts/Table.merge.pl +0 -77
data/utils/enveomics/Scripts/Table.prefScore.R +0 -60
data/utils/enveomics/Scripts/Table.replace.rb +0 -69
data/utils/enveomics/Scripts/Table.round.rb +0 -63
data/utils/enveomics/Scripts/Table.split.pl +0 -57
data/utils/enveomics/Scripts/Taxonomy.silva2ncbi.rb +0 -227
data/utils/enveomics/Scripts/VCF.KaKs.rb +0 -147
data/utils/enveomics/Scripts/VCF.SNPs.rb +0 -88
data/utils/enveomics/Scripts/aai.rb +0 -421
data/utils/enveomics/Scripts/ani.rb +0 -362
data/utils/enveomics/Scripts/anir.rb +0 -137
data/utils/enveomics/Scripts/clust.rand.rb +0 -102
data/utils/enveomics/Scripts/gi2tax.rb +0 -103
data/utils/enveomics/Scripts/in_silico_GA_GI.pl +0 -96
data/utils/enveomics/Scripts/lib/data/dupont_2012_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/data/lee_2019_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/enveomics.R +0 -1
data/utils/enveomics/Scripts/lib/enveomics_rb/anir.rb +0 -293
data/utils/enveomics/Scripts/lib/enveomics_rb/bm_set.rb +0 -175
data/utils/enveomics/Scripts/lib/enveomics_rb/enveomics.rb +0 -24
data/utils/enveomics/Scripts/lib/enveomics_rb/errors.rb +0 -17
data/utils/enveomics/Scripts/lib/enveomics_rb/gmm_em.rb +0 -30
data/utils/enveomics/Scripts/lib/enveomics_rb/jplace.rb +0 -253
data/utils/enveomics/Scripts/lib/enveomics_rb/match.rb +0 -88
data/utils/enveomics/Scripts/lib/enveomics_rb/og.rb +0 -182
data/utils/enveomics/Scripts/lib/enveomics_rb/rbm.rb +0 -49
data/utils/enveomics/Scripts/lib/enveomics_rb/remote_data.rb +0 -74
data/utils/enveomics/Scripts/lib/enveomics_rb/seq_range.rb +0 -237
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/rand.rb +0 -31
data/utils/enveomics/Scripts/lib/enveomics_rb/stats/sample.rb +0 -152
data/utils/enveomics/Scripts/lib/enveomics_rb/stats.rb +0 -3
data/utils/enveomics/Scripts/lib/enveomics_rb/utils.rb +0 -74
data/utils/enveomics/Scripts/lib/enveomics_rb/vcf.rb +0 -135
data/utils/enveomics/Scripts/ogs.annotate.rb +0 -88
data/utils/enveomics/Scripts/ogs.core-pan.rb +0 -160
data/utils/enveomics/Scripts/ogs.extract.rb +0 -125
data/utils/enveomics/Scripts/ogs.mcl.rb +0 -186
data/utils/enveomics/Scripts/ogs.rb +0 -104
data/utils/enveomics/Scripts/ogs.stats.rb +0 -131
data/utils/enveomics/Scripts/rbm-legacy.rb +0 -172
data/utils/enveomics/Scripts/rbm.rb +0 -108
data/utils/enveomics/Scripts/sam.filter.rb +0 -148
data/utils/enveomics/Tests/Makefile +0 -10
data/utils/enveomics/Tests/Mgen_M2288.faa +0 -3189
data/utils/enveomics/Tests/Mgen_M2288.fna +0 -8282
data/utils/enveomics/Tests/Mgen_M2321.fna +0 -8288
data/utils/enveomics/Tests/Nequ_Kin4M.faa +0 -2970
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.tribs.Rdata +0 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.txt +0 -7
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai-mat.tsv +0 -17
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai.tsv +0 -137
data/utils/enveomics/Tests/a_mg.cds-go.blast.tsv +0 -123
data/utils/enveomics/Tests/a_mg.reads-cds.blast.tsv +0 -200
data/utils/enveomics/Tests/a_mg.reads-cds.counts.tsv +0 -55
data/utils/enveomics/Tests/alkB.nwk +0 -1
data/utils/enveomics/Tests/anthrax-cansnp-data.tsv +0 -13
data/utils/enveomics/Tests/anthrax-cansnp-key.tsv +0 -17
data/utils/enveomics/Tests/hiv1.faa +0 -59
data/utils/enveomics/Tests/hiv1.fna +0 -134
data/utils/enveomics/Tests/hiv2.faa +0 -70
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv +0 -233
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.lim +0 -1
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.rec +0 -233
data/utils/enveomics/Tests/phyla_counts.tsv +0 -10
data/utils/enveomics/Tests/primate_lentivirus.ogs +0 -11
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv1.rbm +0 -9
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv2.rbm +0 -8
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-siv.rbm +0 -6
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-hiv2.rbm +0 -9
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-siv.rbm +0 -6
data/utils/enveomics/Tests/primate_lentivirus.rbm/siv-siv.rbm +0 -6
data/utils/enveomics/build_enveomics_r.bash +0 -45
data/utils/enveomics/enveomics.R/DESCRIPTION +0 -31
data/utils/enveomics/enveomics.R/NAMESPACE +0 -39
data/utils/enveomics/enveomics.R/R/autoprune.R +0 -155
data/utils/enveomics/enveomics.R/R/barplot.R +0 -184
data/utils/enveomics/enveomics.R/R/cliopts.R +0 -135
data/utils/enveomics/enveomics.R/R/df2dist.R +0 -154
data/utils/enveomics/enveomics.R/R/growthcurve.R +0 -331
data/utils/enveomics/enveomics.R/R/prefscore.R +0 -79
data/utils/enveomics/enveomics.R/R/recplot.R +0 -354
data/utils/enveomics/enveomics.R/R/recplot2.R +0 -1631
data/utils/enveomics/enveomics.R/R/tribs.R +0 -583
data/utils/enveomics/enveomics.R/R/utils.R +0 -80
data/utils/enveomics/enveomics.R/README.md +0 -81
data/utils/enveomics/enveomics.R/data/growth.curves.rda +0 -0
data/utils/enveomics/enveomics.R/data/phyla.counts.rda +0 -0
data/utils/enveomics/enveomics.R/man/cash-enve.GrowthCurve-method.Rd +0 -16
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2-method.Rd +0 -16
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2.Peak-method.Rd +0 -16
data/utils/enveomics/enveomics.R/man/enve.GrowthCurve-class.Rd +0 -25
data/utils/enveomics/enveomics.R/man/enve.TRIBS-class.Rd +0 -46
data/utils/enveomics/enveomics.R/man/enve.TRIBS.merge.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.TRIBStest-class.Rd +0 -47
data/utils/enveomics/enveomics.R/man/enve.__prune.iter.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.__prune.reduce.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.__tribs.Rd +0 -40
data/utils/enveomics/enveomics.R/man/enve.barplot.Rd +0 -103
data/utils/enveomics/enveomics.R/man/enve.cliopts.Rd +0 -67
data/utils/enveomics/enveomics.R/man/enve.col.alpha.Rd +0 -24
data/utils/enveomics/enveomics.R/man/enve.col2alpha.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.df2dist.Rd +0 -45
data/utils/enveomics/enveomics.R/man/enve.df2dist.group.Rd +0 -44
data/utils/enveomics/enveomics.R/man/enve.df2dist.list.Rd +0 -47
data/utils/enveomics/enveomics.R/man/enve.growthcurve.Rd +0 -75
data/utils/enveomics/enveomics.R/man/enve.prefscore.Rd +0 -50
data/utils/enveomics/enveomics.R/man/enve.prune.dist.Rd +0 -44
data/utils/enveomics/enveomics.R/man/enve.recplot.Rd +0 -139
data/utils/enveomics/enveomics.R/man/enve.recplot2-class.Rd +0 -45
data/utils/enveomics/enveomics.R/man/enve.recplot2.ANIr.Rd +0 -24
data/utils/enveomics/enveomics.R/man/enve.recplot2.Rd +0 -77
data/utils/enveomics/enveomics.R/man/enve.recplot2.__counts.Rd +0 -25
data/utils/enveomics/enveomics.R/man/enve.recplot2.__peakHist.Rd +0 -21
data/utils/enveomics/enveomics.R/man/enve.recplot2.__whichClosestPeak.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.changeCutoff.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.compareIdentities.Rd +0 -47
data/utils/enveomics/enveomics.R/man/enve.recplot2.coordinates.Rd +0 -29
data/utils/enveomics/enveomics.R/man/enve.recplot2.corePeak.Rd +0 -18
data/utils/enveomics/enveomics.R/man/enve.recplot2.extractWindows.Rd +0 -45
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.Rd +0 -36
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_e.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_m.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__emauto_one.Rd +0 -27
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mow_one.Rd +0 -52
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mower.Rd +0 -17
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.em.Rd +0 -51
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.emauto.Rd +0 -43
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.mower.Rd +0 -82
data/utils/enveomics/enveomics.R/man/enve.recplot2.peak-class.Rd +0 -59
data/utils/enveomics/enveomics.R/man/enve.recplot2.seqdepth.Rd +0 -27
data/utils/enveomics/enveomics.R/man/enve.recplot2.windowDepthThreshold.Rd +0 -36
data/utils/enveomics/enveomics.R/man/enve.selvector.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.tribs.Rd +0 -68
data/utils/enveomics/enveomics.R/man/enve.tribs.test.Rd +0 -28
data/utils/enveomics/enveomics.R/man/enve.truncate.Rd +0 -27
data/utils/enveomics/enveomics.R/man/growth.curves.Rd +0 -14
data/utils/enveomics/enveomics.R/man/phyla.counts.Rd +0 -13
data/utils/enveomics/enveomics.R/man/plot.enve.GrowthCurve.Rd +0 -78
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBS.Rd +0 -46
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBStest.Rd +0 -45
data/utils/enveomics/enveomics.R/man/plot.enve.recplot2.Rd +0 -125
data/utils/enveomics/enveomics.R/man/summary.enve.GrowthCurve.Rd +0 -19
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBS.Rd +0 -19
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBStest.Rd +0 -19
data/utils/enveomics/globals.mk +0 -8
data/utils/enveomics/manifest.json +0 -9
data/utils/multitrim/Multitrim How-To.pdf +0 -0
data/utils/multitrim/README.md +0 -67
data/utils/multitrim/multitrim.py +0 -1555
data/utils/multitrim/multitrim.yml +0 -13

data/utils/enveomics/Scripts/ogs.stats.rb DELETED Viewed

@@ -1,131 +0,0 @@
-#!/usr/bin/env ruby
-#
-# @author: Luis M. Rodriguez-R
-# @license: Artistic-2.0
-#
-$:.push File.expand_path(File.dirname(__FILE__) + '/lib')
-require 'enveomics_rb/og'
-require 'optparse'
-require 'json'
-o = {q:false, a:false}
-ARGV << '-h' if ARGV.size==0
-OptionParser.new do |opts|
-  opts.banner = "
-Estimates some descriptive statistics on a set of Orthology Groups (OGs).
-Usage: #{$0} [options]"
-  opts.separator ""
-  opts.separator "Mandatory"
-  opts.on("-o", "--ogs FILE",
-    "Input file containing the precomputed OGs."){ |v| o[:ogs]=v }
-  opts.separator ""
-  opts.separator "Other Options"
-  opts.on("-j", "--json FILE", "Output file in JSON format."){ |v| o[:json]=v }
-  opts.on("-t", "--tab FILE","Output file in tabular format."){ |v| o[:tab]=v }
-  opts.on("-T", "--transposed-tab FILE",
-    "Output file in transposed tabular format."){ |v| o[:ttab]=v }
-  opts.on("-a", "--auto", "Run completely quietly (no STDERR or STDOUT)") do
-    o[:q] = true
-    o[:a] = true
-  end
-  opts.on("-q", "--quiet", "Run quietly (no STDERR output)."){ o[:q] = true }
-  opts.on("-h", "--help", "Display this screen.") do
-    puts opts
-    exit
-  end
-  opts.separator ""
-end.parse!
-abort "-o is mandatory" if o[:ogs].nil?
-##### MAIN:
-begin
-  # Initialize the collection of OGs.
-  collection = OGCollection.new
-  # Read the pre-computed OGs
-  $stderr.puts "Reading pre-computed OGs in '#{o[:ogs]}'." unless o[:q]
-  f = File.open(o[:ogs], "r")
-  h = f.gets.chomp.split /\t/
-  while ln = f.gets
-    collection << OG.new(h, ln.chomp.split(/\t/))
-  end
-  f.close
-  $stderr.puts " Loaded OGs: #{collection.ogs.length}." unless o[:q]
-  # Estimate descriptive stats
-  stat_name = {
-    genomes: "Number of genomes",
-    pan: "Pangenome (OGs)",
-    core: "Core genome (OGs)",
-    core90pc: "OGs in 90% of the genomes",
-    core80pc: "OGs in 80% of the genomes",
-    unus: "Unus genome, core genome discarding paralogs (OGs)",
-    avg: "Average number of OGs in a genome",
-    avg_pan: "Average genome (OGs) / Pangenome (OGs)",
-    core_avg: "Core genome (OGs) / Average genome (OGs)",
-    core_pan: "Core genome (OGs) / Pangenome (OGs)",
-    ogs_shannon: "Entropy of the OG frequencies (bits)"
-  }
-  stats = {}
-  stats[:genomes] = Gene.genomes.length
-  stats[:pan] = collection.ogs.length
-  stats[:core] = collection.ogs.map do |og|
-    (og.genomes.length == Gene.genomes.length) ? 1 : 0
-  end.inject(0,:+)
-  stats[:core90pc] = collection.ogs.map do |og|
-    (og.genomes.length >= 0.9*Gene.genomes.length) ? 1 : 0
-  end.inject(0,:+)
-  stats[:core80pc] = collection.ogs.map do |og|
-    (og.genomes.length >= 0.8*Gene.genomes.length) ? 1 : 0
-  end.inject(0,:+)
-  stats[:unus] = collection.ogs.map do |og|
-    (og.genomes.length != Gene.genomes.length) ? 0 :
-      (og.genes.all?{ |i| i.size==1 }) ? 1 : 0
-  end.inject(0,:+)
-  og_genomes = collection.ogs.map{ |og| og.genomes.length }.inject(0,:+)
-  stats[:avg] = og_genomes.to_f/Gene.genomes.length
-  stats[:avg_pan] = stats[:avg]/stats[:pan]
-  stats[:core_avg] = stats[:core].to_f/stats[:avg]
-  stats[:core_pan] = stats[:core].to_f/stats[:pan]
-  stats[:ogs_shannon] = -1 * collection.ogs.map do |og|
-    pi = og.genomes.length.to_f/Gene.genomes.length
-    pi * Math.log(pi)
-  end.inject(0.0,:+)
-  # Show result
-  $stderr.puts "Generating reports." unless o[:q]
-  stats.each_pair{ |k,v| puts " #{stat_name[k]}: #{v}" } unless o[:a]
-  # Save results in JSON
-  unless o[:json].nil?
-    ohf = File.open(o[:json], "w")
-    ohf.puts JSON.pretty_generate(stats)
-    ohf.close
-  end
-  # Save results in tab
-  unless o[:tab].nil?
-    ohf = File.open(o[:tab], "w")
-    stats.each_pair{ |k,v| ohf.puts "#{k}\t#{v}" }
-    ohf.close
-  end
-  # Save results in T(tab)
-  unless o[:ttab].nil?
-    ohf = File.open(o[:ttab], "w")
-    ohf.puts stats.keys.join("\t")
-    ohf.puts stats.values.join("\t")
-    ohf.close
-  end
-  $stderr.puts "Done.\n" unless o[:q]
-rescue => err
-  $stderr.puts "Exception: #{err}\n\n"
-  err.backtrace.each { |l| $stderr.puts l + "\n" }
-  err
-end

data/utils/enveomics/Scripts/rbm-legacy.rb DELETED Viewed

@@ -1,172 +0,0 @@
-#!/usr/bin/env ruby
-# frozen_string_literal: true
-$VERSION = 0.1
-$:.push File.expand_path('../lib', __FILE__)
-require 'enveomics_rb/enveomics'
-require 'tmpdir'
-o = {
-  q: false, thr: 1,
-  len: 0, id: 0.0, fract: 0.0, score: 0.0,
-  bin: '', program: :'blast+', nucl: false
-}
-OptionParser.new do |opts|
-  cmd = File.basename($0)
-  opts.banner = <<~BANNER
-    [Enveomics Collection: #{cmd} v#{$VERSION}]
-    [DEPRECATED: Please use rbm.rb instead]
-    Finds the reciprocal best matches between two sets of sequences
-    Usage: #{cmd} [options]
-  BANNER
-  opts.separator 'Mandatory'
-  opts.on(
-    '-1', '--seq1 FILE',
-    'Path to the FastA file containing the set 1'
-  ) { |v| o[:seq1] = v }
-  opts.on(
-    '-2', '--seq2 FILE',
-    'Path to the FastA file containing the set 2'
-  ) { |v| o[:seq2] = v }
-  opts.separator ''
-  opts.separator 'Search Options'
-  opts.on(
-    '-n', '--nucl',
-    'Sequences are assumed to be nucleotides (proteins by default)',
-    'Incompatible with -p diamond'
-  ) { |v| o[:nucl] = true }
-  opts.on(
-    '-l', '--len INT', Integer,
-    'Minimum alignment length (in residues)',
-    "By default: #{o[:len]}"
-  ) { |v| o[:len] = v }
-  opts.on(
-    '-f', '--fract FLOAT', Float,
-    'Minimum alignment length (as a fraction of the query)',
-    'If set, requires BLAST+ or Diamond (see -p)',
-    "By default: #{o[:fract]}"
-  ) { |v| o[:fract] = v }
-  opts.on(
-    '-i', '--id NUM', Float,
-    'Minimum alignment identity (in %)',
-    "By default: #{o[:id]}"
-  ){ |v| o[:id] = v }
-  opts.on(
-    '-s', '--score NUM', Float,
-    'Minimum alignment score (in bits)',
-    "By default: #{o[:score]}"
-  ) { |v| o[:score] = v }
-  opts.separator ''
-  opts.separator 'Software Options'
-  opts.on(
-    '-b', '--bin DIR',
-    'Path to the directory containing the binaries of the search program'
-  ) { |v| o[:bin] = v }
-  opts.on(
-    '-p', '--program STR',
-    'Search program to be used.  One of: blast+ (default), blast, diamond'
-  ) { |v| o[:program] = v.downcase.to_sym }
-  opts.on(
-    '-t', '--threads INT', Integer,
-    'Number of parallel threads to be used',
-    "By default: #{o[:thr]}"
-  ) { |v| o[:thr] = v }
-  opts.separator ''
-  opts.separator 'Other Options'
-  opts.on('-q', '--quiet', 'Run quietly (no STDERR output)') { o[:q] = true }
-  opts.on('-h', '--help', 'Display this screen') { puts opts ; exit }
-  opts.separator ''
-end.parse!
-abort '-1 is mandatory' if o[:seq1].nil?
-abort '-2 is mandatory' if o[:seq2].nil?
-if o[:program] == :diamond && o[:nucl]
-  abort '-p diamond is incompatible with -n'
-end
-if o[:fract] > 0.0 && o[:program] == :blast
-  abort 'Argument -f/--fract requires -p blast+ or -p diamond'
-end
-o[:bin] = o[:bin] + '/' if o[:bin].size > 0
-$quiet = o[:q]
-Dir.mktmpdir do |dir|
-  say('Temporal directory: ', dir)
-  # Create databases
-  say 'Creating databases'
-  [:seq1, :seq2].each do |seq|
-    case o[:program]
-    when :blast
-      `"#{o[:bin]}formatdb" -i "#{o[seq]}" -n "#{dir}/#{seq}" \
-        -p #{o[:nucl] ? 'F' : 'T'}`
-    when :'blast+'
-      `"#{o[:bin]}makeblastdb" -in "#{o[seq]}" -out "#{dir}/#{seq}" \
-        -dbtype #{o[:nucl] ? 'nucl' : 'prot'}`
-    when :diamond
-      `"#{o[:bin]}diamond" makedb --in "#{o[seq]}" \
-        --db "#{dir}/#{seq}.dmnd" --threads "#{o[:thr]}"`
-    else
-      abort "Unsupported program: #{o[:program]}"
-    end
-  end
-  # Best-hits
-  rbh = {}
-  n2 = 0
-  say ' Running comparisons'
-  [2, 1].each do |i|
-    qry_seen = {}
-    q = o[:"seq#{i}"]
-    s = "#{dir}/seq#{i == 1 ? 2 : 1}"
-    say('  Query: ', q)
-    case o[:program]
-    when :blast
-      `"#{o[:bin]}blastall" -p #{o[:nucl] ? 'blastn' : 'blastp'} -d "#{s}" \
-        -i "#{q}" -v 1 -b 1 -a #{o[:thr]} -m 8 -o "#{dir}/#{i}.tab"`
-    when :'blast+'
-      `"#{o[:bin]}#{o[:nucl] ? 'blastn' : 'blastp'}" -db "#{s}" -query "#{q}" \
-        -max_target_seqs 1 -num_threads #{o[:thr]} -out "#{dir}/#{i}.tab" \
-        -outfmt "6 qseqid sseqid pident length mismatch gapopen qstart qend \
-        sstart send evalue bitscore qlen slen"`
-    when :diamond
-      `"#{o[:bin]}diamond" blastp --threads "#{o[:thr]}" --db "#{s}.dmnd" \
-        --query "#{q}" --sensitive --daa "#{dir}/#{i}.daa" --quiet \
-        && "#{o[:bin]}diamond" view --daa "#{dir}/#{i}.daa" --outfmt \
-        6 qseqid sseqid pident length mismatch gapopen qstart qend sstart \
-        send evalue bitscore qlen slen --out "#{dir}/#{i}.tab" --quiet`
-    else
-      abort "Unsupported program: #{o[:program]}"
-    end
-    n = 0
-    File.open("#{dir}/#{i}.tab", 'r') do |fh|
-      fh.each do |ln|
-        ln.chomp!
-        row = ln.split(/\t/)
-        row[12] = '1' unless [:'blast+', :diamond].include? o[:program]
-        next unless qry_seen[row[0]].nil? &&
-          row[3].to_i >= o[:len] && row[2].to_f >= o[:id] &&
-          row[11].to_f >= o[:score] && row[3].to_f / row[12].to_i >= o[:fract]
-        qry_seen[row[0]] = 1
-        n += 1
-        if i == 2
-          rbh[row[0]] = row[1]
-        elsif !rbh[row[1]].nil? && rbh[row[1]] == row[0]
-          puts ln
-          n2 += 1
-        end
-      end
-    end
-    say "    #{n} sequences with hit"
-  end
-  say "  #{n2} RBMs"
-end

data/utils/enveomics/Scripts/rbm.rb DELETED Viewed

@@ -1,108 +0,0 @@
-#!/usr/bin/env ruby
-# frozen_string_literal: true
-$VERSION = 1.01
-$:.push File.expand_path('../lib', __FILE__)
-require 'enveomics_rb/rbm'
-require 'tmpdir'
-bms_dummy = Enveomics::RBM.new('1', '2').bms1
-o = { q: false, out: '-' }
-%i[thr len id fract score bin program nucl].each do |k|
-  o[k] = bms_dummy.opt(k)
-end
-OptionParser.new do |opts|
-  opts.version = $VERSION
-  cmd = File.basename($0)
-  opts.banner = <<~BANNER
-    [Enveomics Collection: #{cmd} v#{$VERSION}]
-    Finds the reciprocal best matches between two sets of sequences
-    Usage: #{cmd} [options]
-  BANNER
-  opts.separator 'Mandatory'
-  opts.on(
-    '-1', '--seq1 FILE',
-    'Path to the FastA file containing the set 1'
-  ) { |v| o[:seq1] = v }
-  opts.on(
-    '-2', '--seq2 FILE',
-    'Path to the FastA file containing the set 2'
-  ) { |v| o[:seq2] = v }
-  opts.on(
-    '-o', '--out FILE',
-    'Reciprocal Best Matches in BLAST tabular format.',
-    'Supports compression with .gz extension, use - for STDOUT (default)'
-  ) { |v| o[:out] = v }
-  opts.separator ''
-  opts.separator 'Search Options'
-  opts.on(
-    '-n', '--nucl',
-    'Sequences are assumed to be nucleotides (proteins by default)',
-    'Incompatible with -p diamond'
-  ) { |v| o[:nucl] = true }
-  opts.on(
-    '-l', '--len INT', Integer,
-    'Minimum alignment length (in residues)',
-    "By default: #{o[:len]}"
-  ) { |v| o[:len] = v }
-  opts.on(
-    '-f', '--fract FLOAT', Float,
-    'Minimum alignment length (as a fraction of the query)',
-    'If set, requires BLAST+ or Diamond (see -p)',
-    "By default: #{o[:fract]}"
-  ) { |v| o[:fract] = v }
-  opts.on(
-    '-i', '--id NUM', Float,
-    'Minimum alignment identity (in %)',
-    "By default: #{o[:id]}"
-  ){ |v| o[:id] = v }
-  opts.on(
-    '-s', '--score NUM', Float,
-    'Minimum alignment score (in bits)',
-    "By default: #{o[:score]}"
-  ) { |v| o[:score] = v }
-  opts.separator ''
-  opts.separator 'Software Options'
-  opts.on(
-    '-b', '--bin DIR',
-    'Path to the directory containing the binaries of the search program'
-  ) { |v| o[:bin] = v }
-  opts.on(
-    '-p', '--program STR',
-    'Search program to be used',
-    'One of: blast+ (default), blast, diamond, blat'
-  ) { |v| o[:program] = v.downcase.to_sym }
-  opts.on(
-    '-t', '--threads INT', Integer,
-    'Number of parallel threads to be used',
-    "By default: #{o[:thr]}"
-  ) { |v| o[:thr] = v }
-  opts.separator ''
-  opts.separator 'Other Options'
-  opts.on('-q', '--quiet', 'Run quietly (no STDERR output)') { $QUIET = true }
-  opts.on('-h', '--help', 'Display this screen') { puts opts ; exit }
-  opts.separator ''
-end.parse!
-raise Enveomics::OptionError.new('-1 is mandatory') if o[:seq1].nil?
-raise Enveomics::OptionError.new('-2 is mandatory') if o[:seq2].nil?
-raise Enveomics::OptionError.new(
-  'Argument -f/--fract requires -p blast+ or -p diamond'
-) if o[:fract] > 0.0 && !%i[blast+ diamond].include?(o[:program])
-rbm = Enveomics::RBM.new(o[:seq1], o[:seq2], o)
-ofh = writer(o[:out])
-rbm.each { |bm| ofh.puts bm.to_s }
-ofh.close
-say('Forward Best Matches: ', rbm.bms1.count)
-say('Reverse Best Matches: ', rbm.bms2.count)
-say('Reciprocal Best Matches: ', rbm.count)

data/utils/enveomics/Scripts/sam.filter.rb DELETED Viewed

@@ -1,148 +0,0 @@
-#!/usr/bin/env ruby
-# frozen_string_literal: true
-$VERSION = 1.0
-$:.push File.expand_path('../lib', __FILE__)
-require 'enveomics_rb/enveomics'
-use 'shellwords'
-o = {
-  q: false, threads: 2, m_format: :sam, g_format: :fasta, identity: 95.0,
-  o: '-', header: true
-}
-OptionParser.new do |opt|
-  Enveomics.opt_banner(
-    opt, 'Filters a SAM or BAM file by target sequences and/or identity',
-    "#{File.basename($0)} -m map.sam -o filtered_map.sam [options]"
-  )
-  opt.separator 'Input/Output'
-  opt.on(
-    '-g', '--genome PATH',
-    'Genome assembly',
-    'Supports compression with .gz extension, use - for STDIN'
-  ) { |v| o[:g] = v }
-  opt.on(
-    '-m', '--mapping PATH',
-    'Mapping file',
-    'Supports compression with .gz extension, use - for STDIN'
-  ) { |v| o[:m] = v }
-  opt.on(
-    '-o', '--out-sam PATH',
-    'Output filtered file in SAM format',
-    'Supports compression with .gz extension, use - for STDOUT (default)'
-  ) { |v| o[:o] = v }
-  opt.separator ''
-  opt.separator 'Formats'
-  opt.on(
-    '--g-format STRING',
-    'Genome assembly format: fasta (default) or list'
-  ) { |v| o[:g_format] = v.downcase.to_sym }
-  opt.on(
-    '--m-format STRING',
-    'Mapping file format: sam (default) or bam',
-    'sam supports compression with .gz file extension'
-  ) { |v| o[:m_format] = v.downcase.to_sym }
-  opt.separator ''
-  opt.separator 'General'
-  opt.on(
-    '-i', '--identity FLOAT', Float,
-    "Set a fixed threshold of percent identity (default: #{o[:identity]})"
-  ) { |v| o[:identity] = v }
-  opt.on('--no-header', 'Do not include the headers') { |v| o[:header] = v }
-  opt.separator ''
-  opt.on(
-    '-t', '--threads INT', Integer, "Threads to use (default: #{o[:threads]})"
-  ) { |v| o[:threads] = v }
-  opt.on('-l', '--log PATH', 'Log file to save output') { |v| o[:log] = v }
-  opt.on('-q', '--quiet', 'Run quietly') { |v| o[:q] = v }
-  opt.on('-h', '--help', 'Display this screen') do
-    puts opt
-    exit
-  end
-  opt.separator ''
-end.parse!
-$QUIET = o[:q]
-# Functions
-##
-# Parses one line +ln+ in SAM format and outputs filtered lines to +ofh+
-# Filters by minimum +identity+ and +target+ sequences, and prints
-# the headers if +header+
-def parse_sam_line(ln, identity, target, header, ofh)
-  if ln =~ /^@/ || ln =~ /^\s*$/
-    ofh.puts ln if header
-    return
-  end
-  # No match
-  row = ln.chomp.split("\t")
-  return if row[2] == '*'
-  # Filter by target
-  return if !target.nil? && !target.include?(row[2])
-  # Exclude unless concordant or unaligned
-  length = row[9].size
-  row.shift(11) # Discard non-flag columns
-  flags = Hash[row.map { |i| i.sub(/:.:/, ':').split(':', 2) }]
-  return if flags['YT'] && !%w[CP UU].include?(flags['YT'])
-  # Filter by identity
-  unless flags['MD']
-    raise Enveomics::ParseError.new(
-      "SAM line missing MD flag:\n#{ln}\nFlags: #{flags}"
-    )
-  end
-  mismatches = flags['MD'].scan(/[^\d]/).count
-  id = 100.0 * (length - mismatches) / length
-  ofh.puts ln if id >= identity
-end
-# Reading targets
-if o[:g]
-  say 'Loading target sequences to filter'
-  reader = reader(o[:g])
-  target =
-    case o[:g_format]
-    when :fasta
-      reader.each.map { |ln| $1 if ln =~ /^>(\S+)/ }.compact
-    when :list
-      reader.each.map(&:chomp)
-    else
-      raise Enveomics::OptionError.new(
-        "Unsupported target sequences format: #{o[:g_format]}"
-      )
-    end
-  reader.close
-else
-  target = nil
-end
-# Reading and filtering mapping
-say 'Reading mapping file'
-ofh = writer(o[:o])
-case o[:m_format]
-when :sam
-  reader = reader(o[:m])
-  reader.each { |ln| parse_sam_line(ln, o[:identity], target, o[:header], ofh) }
-  reader.close
-when :bam
-  cmd = ['samtools', 'view', o[:m], '-@', o[:threads]]
-  cmd << '-h' if o[:header]
-  IO.popen(cmd.shelljoin) do |fh|
-    fh.each { |ln| parse_sam_line(ln, o[:identity], target, o[:header], ofh) }
-  end
-else
-  raise Enveomics::OptionError.new(
-    "Unsupported mapping format: #{o[:m_format]}"
-  )
-end
-ofh.close

data/utils/enveomics/Tests/Makefile DELETED Viewed

@@ -1,10 +0,0 @@
-# Makefile for the Enve-omics collection
-# @update Oct 13 2013
-# @author Luis M. Rodriguez-R <lmrodriguez at gmail dot com>
-include ../globals.mk
-all:
-	@echo NOTHING TO DO YET