RubyGems - miga-base - Versions diffs - 0.7.23.0 → 0.7.25.3 - Mend

miga-base 0.7.23.0 → 0.7.25.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (320) hide show

checksums.yaml +4 -4
data/Gemfile +3 -0
data/Rakefile +1 -0
data/lib/miga/cli/action/add.rb +10 -8
data/lib/miga/cli/action/classify_wf.rb +12 -11
data/lib/miga/cli/action/derep_wf.rb +3 -9
data/lib/miga/cli/action/edit.rb +0 -1
data/lib/miga/cli/action/find.rb +1 -1
data/lib/miga/cli/action/generic.rb +1 -1
data/lib/miga/cli/action/get.rb +7 -2
data/lib/miga/cli/action/index_wf.rb +4 -2
data/lib/miga/cli/action/init.rb +60 -59
data/lib/miga/cli/action/init/files_helper.rb +2 -1
data/lib/miga/cli/action/ncbi_get.rb +1 -1
data/lib/miga/cli/action/new.rb +15 -9
data/lib/miga/cli/action/option.rb +63 -0
data/lib/miga/cli/action/preproc_wf.rb +7 -5
data/lib/miga/cli/action/quality_wf.rb +3 -3
data/lib/miga/cli/action/tax_dist.rb +1 -1
data/lib/miga/cli/action/tax_test.rb +1 -1
data/lib/miga/cli/action/wf.rb +72 -54
data/lib/miga/cli/base.rb +17 -5
data/lib/miga/cli/objects_helper.rb +23 -18
data/lib/miga/common.rb +1 -1
data/lib/miga/common/with_option.rb +83 -0
data/lib/miga/common/with_result.rb +2 -1
data/lib/miga/dataset/base.rb +20 -2
data/lib/miga/dataset/result.rb +3 -2
data/lib/miga/metadata.rb +25 -13
data/lib/miga/project/base.rb +82 -2
data/lib/miga/project/result.rb +4 -4
data/lib/miga/result.rb +18 -15
data/lib/miga/result/stats.rb +2 -2
data/lib/miga/version.rb +2 -2
data/scripts/essential_genes.bash +18 -3
data/scripts/miga.bash +8 -2
data/scripts/ogs.bash +2 -3
data/test/dataset_test.rb +5 -5
data/test/lair_test.rb +1 -2
data/test/result_test.rb +22 -0
data/test/with_option_test.rb +115 -0
data/utils/cleanup-databases.rb +1 -2
data/utils/distance/base.rb +9 -0
data/utils/distance/commands.rb +183 -81
data/utils/distance/database.rb +69 -10
data/utils/distance/pipeline.rb +15 -21
data/utils/distance/runner.rb +28 -49
data/utils/distance/temporal.rb +4 -2
data/utils/distances.rb +2 -2
data/utils/index_metadata.rb +1 -2
data/utils/requirements.txt +1 -1
data/utils/subclade/runner.rb +9 -10
metadata +9 -273
data/utils/enveomics/Docs/recplot2.md +0 -244
data/utils/enveomics/Examples/aai-matrix.bash +0 -66
data/utils/enveomics/Examples/ani-matrix.bash +0 -66
data/utils/enveomics/Examples/essential-phylogeny.bash +0 -105
data/utils/enveomics/Examples/unus-genome-phylogeny.bash +0 -100
data/utils/enveomics/LICENSE.txt +0 -73
data/utils/enveomics/Makefile +0 -52
data/utils/enveomics/Manifest/Tasks/aasubs.json +0 -103
data/utils/enveomics/Manifest/Tasks/blasttab.json +0 -786
data/utils/enveomics/Manifest/Tasks/distances.json +0 -161
data/utils/enveomics/Manifest/Tasks/fasta.json +0 -766
data/utils/enveomics/Manifest/Tasks/fastq.json +0 -243
data/utils/enveomics/Manifest/Tasks/graphics.json +0 -126
data/utils/enveomics/Manifest/Tasks/mapping.json +0 -67
data/utils/enveomics/Manifest/Tasks/ogs.json +0 -382
data/utils/enveomics/Manifest/Tasks/other.json +0 -829
data/utils/enveomics/Manifest/Tasks/remote.json +0 -355
data/utils/enveomics/Manifest/Tasks/sequence-identity.json +0 -501
data/utils/enveomics/Manifest/Tasks/tables.json +0 -308
data/utils/enveomics/Manifest/Tasks/trees.json +0 -68
data/utils/enveomics/Manifest/Tasks/variants.json +0 -111
data/utils/enveomics/Manifest/categories.json +0 -156
data/utils/enveomics/Manifest/examples.json +0 -154
data/utils/enveomics/Manifest/tasks.json +0 -4
data/utils/enveomics/Pipelines/assembly.pbs/CONFIG.mock.bash +0 -69
data/utils/enveomics/Pipelines/assembly.pbs/FastA.N50.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/FastA.filterN.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/FastA.length.pl +0 -1
data/utils/enveomics/Pipelines/assembly.pbs/README.md +0 -189
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-2.bash +0 -112
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-3.bash +0 -23
data/utils/enveomics/Pipelines/assembly.pbs/RUNME-4.bash +0 -44
data/utils/enveomics/Pipelines/assembly.pbs/RUNME.bash +0 -50
data/utils/enveomics/Pipelines/assembly.pbs/kSelector.R +0 -37
data/utils/enveomics/Pipelines/assembly.pbs/newbler.pbs +0 -68
data/utils/enveomics/Pipelines/assembly.pbs/newbler_preparator.pl +0 -49
data/utils/enveomics/Pipelines/assembly.pbs/soap.pbs +0 -80
data/utils/enveomics/Pipelines/assembly.pbs/stats.pbs +0 -57
data/utils/enveomics/Pipelines/assembly.pbs/velvet.pbs +0 -63
data/utils/enveomics/Pipelines/blast.pbs/01.pbs.bash +0 -38
data/utils/enveomics/Pipelines/blast.pbs/02.pbs.bash +0 -73
data/utils/enveomics/Pipelines/blast.pbs/03.pbs.bash +0 -21
data/utils/enveomics/Pipelines/blast.pbs/BlastTab.recover_job.pl +0 -72
data/utils/enveomics/Pipelines/blast.pbs/CONFIG.mock.bash +0 -98
data/utils/enveomics/Pipelines/blast.pbs/FastA.split.pl +0 -1
data/utils/enveomics/Pipelines/blast.pbs/README.md +0 -127
data/utils/enveomics/Pipelines/blast.pbs/RUNME.bash +0 -109
data/utils/enveomics/Pipelines/blast.pbs/TASK.check.bash +0 -128
data/utils/enveomics/Pipelines/blast.pbs/TASK.dry.bash +0 -16
data/utils/enveomics/Pipelines/blast.pbs/TASK.eo.bash +0 -22
data/utils/enveomics/Pipelines/blast.pbs/TASK.pause.bash +0 -26
data/utils/enveomics/Pipelines/blast.pbs/TASK.run.bash +0 -89
data/utils/enveomics/Pipelines/blast.pbs/sentinel.pbs.bash +0 -29
data/utils/enveomics/Pipelines/idba.pbs/README.md +0 -49
data/utils/enveomics/Pipelines/idba.pbs/RUNME.bash +0 -95
data/utils/enveomics/Pipelines/idba.pbs/run.pbs +0 -56
data/utils/enveomics/Pipelines/trim.pbs/README.md +0 -54
data/utils/enveomics/Pipelines/trim.pbs/RUNME.bash +0 -70
data/utils/enveomics/Pipelines/trim.pbs/run.pbs +0 -130
data/utils/enveomics/README.md +0 -42
data/utils/enveomics/Scripts/AAsubs.log2ratio.rb +0 -171
data/utils/enveomics/Scripts/Aln.cat.rb +0 -163
data/utils/enveomics/Scripts/Aln.convert.pl +0 -35
data/utils/enveomics/Scripts/AlphaDiversity.pl +0 -152
data/utils/enveomics/Scripts/BedGraph.tad.rb +0 -93
data/utils/enveomics/Scripts/BedGraph.window.rb +0 -71
data/utils/enveomics/Scripts/BlastPairwise.AAsubs.pl +0 -102
data/utils/enveomics/Scripts/BlastTab.addlen.rb +0 -63
data/utils/enveomics/Scripts/BlastTab.advance.bash +0 -48
data/utils/enveomics/Scripts/BlastTab.best_hit_sorted.pl +0 -55
data/utils/enveomics/Scripts/BlastTab.catsbj.pl +0 -104
data/utils/enveomics/Scripts/BlastTab.cogCat.rb +0 -76
data/utils/enveomics/Scripts/BlastTab.filter.pl +0 -47
data/utils/enveomics/Scripts/BlastTab.kegg_pep2path_rest.pl +0 -194
data/utils/enveomics/Scripts/BlastTab.metaxaPrep.pl +0 -104
data/utils/enveomics/Scripts/BlastTab.pairedHits.rb +0 -157
data/utils/enveomics/Scripts/BlastTab.recplot2.R +0 -48
data/utils/enveomics/Scripts/BlastTab.seqdepth.pl +0 -86
data/utils/enveomics/Scripts/BlastTab.seqdepth_ZIP.pl +0 -119
data/utils/enveomics/Scripts/BlastTab.seqdepth_nomedian.pl +0 -86
data/utils/enveomics/Scripts/BlastTab.subsample.pl +0 -47
data/utils/enveomics/Scripts/BlastTab.sumPerHit.pl +0 -114
data/utils/enveomics/Scripts/BlastTab.taxid2taxrank.pl +0 -90
data/utils/enveomics/Scripts/BlastTab.topHits_sorted.rb +0 -101
data/utils/enveomics/Scripts/Chao1.pl +0 -97
data/utils/enveomics/Scripts/CharTable.classify.rb +0 -234
data/utils/enveomics/Scripts/EBIseq2tax.rb +0 -83
data/utils/enveomics/Scripts/FastA.N50.pl +0 -56
data/utils/enveomics/Scripts/FastA.extract.rb +0 -152
data/utils/enveomics/Scripts/FastA.filter.pl +0 -52
data/utils/enveomics/Scripts/FastA.filterLen.pl +0 -28
data/utils/enveomics/Scripts/FastA.filterN.pl +0 -60
data/utils/enveomics/Scripts/FastA.fragment.rb +0 -92
data/utils/enveomics/Scripts/FastA.gc.pl +0 -42
data/utils/enveomics/Scripts/FastA.interpose.pl +0 -93
data/utils/enveomics/Scripts/FastA.length.pl +0 -38
data/utils/enveomics/Scripts/FastA.mask.rb +0 -89
data/utils/enveomics/Scripts/FastA.per_file.pl +0 -36
data/utils/enveomics/Scripts/FastA.qlen.pl +0 -57
data/utils/enveomics/Scripts/FastA.rename.pl +0 -65
data/utils/enveomics/Scripts/FastA.revcom.pl +0 -23
data/utils/enveomics/Scripts/FastA.sample.rb +0 -83
data/utils/enveomics/Scripts/FastA.slider.pl +0 -85
data/utils/enveomics/Scripts/FastA.split.pl +0 -55
data/utils/enveomics/Scripts/FastA.split.rb +0 -79
data/utils/enveomics/Scripts/FastA.subsample.pl +0 -131
data/utils/enveomics/Scripts/FastA.tag.rb +0 -65
data/utils/enveomics/Scripts/FastA.wrap.rb +0 -48
data/utils/enveomics/Scripts/FastQ.filter.pl +0 -54
data/utils/enveomics/Scripts/FastQ.interpose.pl +0 -90
data/utils/enveomics/Scripts/FastQ.offset.pl +0 -90
data/utils/enveomics/Scripts/FastQ.split.pl +0 -53
data/utils/enveomics/Scripts/FastQ.tag.rb +0 -63
data/utils/enveomics/Scripts/FastQ.test-error.rb +0 -81
data/utils/enveomics/Scripts/FastQ.toFastA.awk +0 -24
data/utils/enveomics/Scripts/GFF.catsbj.pl +0 -127
data/utils/enveomics/Scripts/GenBank.add_fields.rb +0 -84
data/utils/enveomics/Scripts/HMM.essential.rb +0 -351
data/utils/enveomics/Scripts/HMM.haai.rb +0 -168
data/utils/enveomics/Scripts/HMMsearch.extractIds.rb +0 -83
data/utils/enveomics/Scripts/JPlace.distances.rb +0 -88
data/utils/enveomics/Scripts/JPlace.to_iToL.rb +0 -320
data/utils/enveomics/Scripts/M5nr.getSequences.rb +0 -81
data/utils/enveomics/Scripts/MeTaxa.distribution.pl +0 -198
data/utils/enveomics/Scripts/MyTaxa.fragsByTax.pl +0 -35
data/utils/enveomics/Scripts/MyTaxa.seq-taxrank.rb +0 -49
data/utils/enveomics/Scripts/NCBIacc2tax.rb +0 -92
data/utils/enveomics/Scripts/Newick.autoprune.R +0 -27
data/utils/enveomics/Scripts/RAxML-EPA.to_iToL.pl +0 -228
data/utils/enveomics/Scripts/RecPlot2.compareIdentities.R +0 -32
data/utils/enveomics/Scripts/RefSeq.download.bash +0 -48
data/utils/enveomics/Scripts/SRA.download.bash +0 -57
data/utils/enveomics/Scripts/TRIBS.plot-test.R +0 -36
data/utils/enveomics/Scripts/TRIBS.test.R +0 -39
data/utils/enveomics/Scripts/Table.barplot.R +0 -31
data/utils/enveomics/Scripts/Table.df2dist.R +0 -30
data/utils/enveomics/Scripts/Table.filter.pl +0 -61
data/utils/enveomics/Scripts/Table.merge.pl +0 -77
data/utils/enveomics/Scripts/Table.replace.rb +0 -69
data/utils/enveomics/Scripts/Table.round.rb +0 -63
data/utils/enveomics/Scripts/Table.split.pl +0 -57
data/utils/enveomics/Scripts/Taxonomy.silva2ncbi.rb +0 -227
data/utils/enveomics/Scripts/VCF.KaKs.rb +0 -147
data/utils/enveomics/Scripts/VCF.SNPs.rb +0 -88
data/utils/enveomics/Scripts/aai.rb +0 -418
data/utils/enveomics/Scripts/ani.rb +0 -362
data/utils/enveomics/Scripts/clust.rand.rb +0 -102
data/utils/enveomics/Scripts/gi2tax.rb +0 -103
data/utils/enveomics/Scripts/in_silico_GA_GI.pl +0 -96
data/utils/enveomics/Scripts/lib/data/dupont_2012_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/data/lee_2019_essential.hmm.gz +0 -0
data/utils/enveomics/Scripts/lib/enveomics.R +0 -1
data/utils/enveomics/Scripts/lib/enveomics_rb/enveomics.rb +0 -24
data/utils/enveomics/Scripts/lib/enveomics_rb/jplace.rb +0 -253
data/utils/enveomics/Scripts/lib/enveomics_rb/og.rb +0 -182
data/utils/enveomics/Scripts/lib/enveomics_rb/remote_data.rb +0 -74
data/utils/enveomics/Scripts/lib/enveomics_rb/seq_range.rb +0 -237
data/utils/enveomics/Scripts/lib/enveomics_rb/stat.rb +0 -30
data/utils/enveomics/Scripts/lib/enveomics_rb/vcf.rb +0 -135
data/utils/enveomics/Scripts/ogs.annotate.rb +0 -88
data/utils/enveomics/Scripts/ogs.core-pan.rb +0 -160
data/utils/enveomics/Scripts/ogs.extract.rb +0 -125
data/utils/enveomics/Scripts/ogs.mcl.rb +0 -186
data/utils/enveomics/Scripts/ogs.rb +0 -104
data/utils/enveomics/Scripts/ogs.stats.rb +0 -131
data/utils/enveomics/Scripts/rbm.rb +0 -146
data/utils/enveomics/Tests/Makefile +0 -10
data/utils/enveomics/Tests/Mgen_M2288.faa +0 -3189
data/utils/enveomics/Tests/Mgen_M2288.fna +0 -8282
data/utils/enveomics/Tests/Mgen_M2321.fna +0 -8288
data/utils/enveomics/Tests/Nequ_Kin4M.faa +0 -2970
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.tribs.Rdata +0 -0
data/utils/enveomics/Tests/Xanthomonas_oryzae-PilA.txt +0 -7
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai-mat.tsv +0 -17
data/utils/enveomics/Tests/Xanthomonas_oryzae.aai.tsv +0 -137
data/utils/enveomics/Tests/a_mg.cds-go.blast.tsv +0 -123
data/utils/enveomics/Tests/a_mg.reads-cds.blast.tsv +0 -200
data/utils/enveomics/Tests/a_mg.reads-cds.counts.tsv +0 -55
data/utils/enveomics/Tests/alkB.nwk +0 -1
data/utils/enveomics/Tests/anthrax-cansnp-data.tsv +0 -13
data/utils/enveomics/Tests/anthrax-cansnp-key.tsv +0 -17
data/utils/enveomics/Tests/hiv1.faa +0 -59
data/utils/enveomics/Tests/hiv1.fna +0 -134
data/utils/enveomics/Tests/hiv2.faa +0 -70
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv +0 -233
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.lim +0 -1
data/utils/enveomics/Tests/hiv_mix-hiv1.blast.tsv.rec +0 -233
data/utils/enveomics/Tests/phyla_counts.tsv +0 -10
data/utils/enveomics/Tests/primate_lentivirus.ogs +0 -11
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv1.rbm +0 -9
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-hiv2.rbm +0 -8
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv1-siv.rbm +0 -6
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-hiv2.rbm +0 -9
data/utils/enveomics/Tests/primate_lentivirus.rbm/hiv2-siv.rbm +0 -6
data/utils/enveomics/Tests/primate_lentivirus.rbm/siv-siv.rbm +0 -6
data/utils/enveomics/build_enveomics_r.bash +0 -45
data/utils/enveomics/enveomics.R/DESCRIPTION +0 -31
data/utils/enveomics/enveomics.R/NAMESPACE +0 -39
data/utils/enveomics/enveomics.R/R/autoprune.R +0 -155
data/utils/enveomics/enveomics.R/R/barplot.R +0 -184
data/utils/enveomics/enveomics.R/R/cliopts.R +0 -135
data/utils/enveomics/enveomics.R/R/df2dist.R +0 -154
data/utils/enveomics/enveomics.R/R/growthcurve.R +0 -331
data/utils/enveomics/enveomics.R/R/recplot.R +0 -354
data/utils/enveomics/enveomics.R/R/recplot2.R +0 -1631
data/utils/enveomics/enveomics.R/R/tribs.R +0 -583
data/utils/enveomics/enveomics.R/R/utils.R +0 -50
data/utils/enveomics/enveomics.R/README.md +0 -80
data/utils/enveomics/enveomics.R/data/growth.curves.rda +0 -0
data/utils/enveomics/enveomics.R/data/phyla.counts.rda +0 -0
data/utils/enveomics/enveomics.R/man/cash-enve.GrowthCurve-method.Rd +0 -17
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2-method.Rd +0 -17
data/utils/enveomics/enveomics.R/man/cash-enve.RecPlot2.Peak-method.Rd +0 -17
data/utils/enveomics/enveomics.R/man/enve.GrowthCurve-class.Rd +0 -25
data/utils/enveomics/enveomics.R/man/enve.TRIBS-class.Rd +0 -46
data/utils/enveomics/enveomics.R/man/enve.TRIBS.merge.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.TRIBStest-class.Rd +0 -47
data/utils/enveomics/enveomics.R/man/enve.__prune.iter.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.__prune.reduce.Rd +0 -23
data/utils/enveomics/enveomics.R/man/enve.__tribs.Rd +0 -32
data/utils/enveomics/enveomics.R/man/enve.barplot.Rd +0 -91
data/utils/enveomics/enveomics.R/man/enve.cliopts.Rd +0 -57
data/utils/enveomics/enveomics.R/man/enve.col.alpha.Rd +0 -24
data/utils/enveomics/enveomics.R/man/enve.col2alpha.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.df2dist.Rd +0 -39
data/utils/enveomics/enveomics.R/man/enve.df2dist.group.Rd +0 -38
data/utils/enveomics/enveomics.R/man/enve.df2dist.list.Rd +0 -40
data/utils/enveomics/enveomics.R/man/enve.growthcurve.Rd +0 -67
data/utils/enveomics/enveomics.R/man/enve.prune.dist.Rd +0 -37
data/utils/enveomics/enveomics.R/man/enve.recplot.Rd +0 -122
data/utils/enveomics/enveomics.R/man/enve.recplot2-class.Rd +0 -45
data/utils/enveomics/enveomics.R/man/enve.recplot2.ANIr.Rd +0 -24
data/utils/enveomics/enveomics.R/man/enve.recplot2.Rd +0 -68
data/utils/enveomics/enveomics.R/man/enve.recplot2.__counts.Rd +0 -25
data/utils/enveomics/enveomics.R/man/enve.recplot2.__peakHist.Rd +0 -21
data/utils/enveomics/enveomics.R/man/enve.recplot2.__whichClosestPeak.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.changeCutoff.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.compareIdentities.Rd +0 -41
data/utils/enveomics/enveomics.R/man/enve.recplot2.coordinates.Rd +0 -29
data/utils/enveomics/enveomics.R/man/enve.recplot2.corePeak.Rd +0 -18
data/utils/enveomics/enveomics.R/man/enve.recplot2.extractWindows.Rd +0 -40
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.Rd +0 -36
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_e.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__em_m.Rd +0 -19
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__emauto_one.Rd +0 -27
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mow_one.Rd +0 -41
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.__mower.Rd +0 -17
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.em.Rd +0 -43
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.emauto.Rd +0 -37
data/utils/enveomics/enveomics.R/man/enve.recplot2.findPeaks.mower.Rd +0 -74
data/utils/enveomics/enveomics.R/man/enve.recplot2.peak-class.Rd +0 -59
data/utils/enveomics/enveomics.R/man/enve.recplot2.seqdepth.Rd +0 -27
data/utils/enveomics/enveomics.R/man/enve.recplot2.windowDepthThreshold.Rd +0 -32
data/utils/enveomics/enveomics.R/man/enve.tribs.Rd +0 -59
data/utils/enveomics/enveomics.R/man/enve.tribs.test.Rd +0 -28
data/utils/enveomics/enveomics.R/man/enve.truncate.Rd +0 -27
data/utils/enveomics/enveomics.R/man/growth.curves.Rd +0 -14
data/utils/enveomics/enveomics.R/man/phyla.counts.Rd +0 -13
data/utils/enveomics/enveomics.R/man/plot.enve.GrowthCurve.Rd +0 -63
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBS.Rd +0 -38
data/utils/enveomics/enveomics.R/man/plot.enve.TRIBStest.Rd +0 -38
data/utils/enveomics/enveomics.R/man/plot.enve.recplot2.Rd +0 -111
data/utils/enveomics/enveomics.R/man/summary.enve.GrowthCurve.Rd +0 -19
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBS.Rd +0 -19
data/utils/enveomics/enveomics.R/man/summary.enve.TRIBStest.Rd +0 -19
data/utils/enveomics/globals.mk +0 -8
data/utils/enveomics/manifest.json +0 -9

data/utils/enveomics/Scripts/EBIseq2tax.rb DELETED Viewed

@@ -1,83 +0,0 @@
-#!/usr/bin/env ruby
-#
-# @author  Luis M. Rodriguez-R <lmrodriguezr at gmail dot com>
-# @update  Oct-13-2015
-# @license Artistic License 2.0
-#
-$:.push File.expand_path(File.dirname(__FILE__) + "/lib")
-require "enveomics_rb/remote_data"
-use "nokogiri"
-#================================[ Options parsing ]
-$o = {
-   q: false, ids: [], dbfrom: "uniprotkb", header: true,
-   ret: "ScientificName",
-   ranks: %w(superkingdom phylum class order family genus species)}
-OptionParser.new do |opt|
-   opt.banner = "
-   Maps a list of EBI-supported IDs to their corresponding NCBI taxonomy using
-   EBI RESTful API. Avoid using this script on millions of entries at a time,
-   since each entry elicits requests to EBI and NCBI servers.
-   Usage: #{$0} [options]".gsub(/^ +/,"")
-   opt.separator ""
-   opt.on("-i", "--ids ID1,ID2,...", Array,
-      "Comma-separated list of EBI IDs. Required unless -I is passed."
-      ){ |v| $o[:ids]=v }
-   opt.on("-I", "--infile FILE",
-      "Raw text file containing the list of EBI IDs, one per line.",
-      "Required unless -i is passed."){ |v| $o[:infile]=v }
-   opt.on("-d", "--database DB",
-      "EBI database defining the EBI IDs. By default: " + $o[:dbfrom].to_s + "."
-      ){ |v| $o[:dbfrom]=v }
-   opt.on("-r", "--ranks RANK1,RANK2,...", Array,
-      "Taxonomic ranks to report. By default:",
-      $o[:ranks].join(",") + "."){ |v| $o[:ranks]=v }
-   opt.on("-n", "--noheader",
-      "Do not includ a header in the output."){ $o[:header]=false }
-   opt.on("-t", "--taxids",
-      "Return Taxonomy IDs instead of scientific names."){ $o[:ret]="TaxId" }
-   opt.on("-q", "--quiet", "Run quietly."){ |v| $o[:q]=true }
-   opt.on("-h", "--help","Display this screen") do
-      puts opt
-      exit
-   end
-   opt.separator ""
-end.parse!
-#================================[ Main ]
-begin
-   $o[:ids] += File.readlines($o[:infile]).map{ |l| l.chomp } unless
-      $o[:infile].nil?
-   $o[:ranks].map!{ |r| r.downcase }
-   puts (["ID", "TaxId"] + $o[:ranks].map{ |r| r.capitalize }).join("\t") if
-      $o[:header]
-   $o[:ids].each do |id|
-      id = $1 if id =~ /^[a-z]+\|\S+\|(\S+)/
-      taxid = RemoteData.ebiseq2taxid(id, $o[:dbfrom])
-      if taxid.nil?
-	 warn "Cannot find link to taxonomy: #{id}"
-	 next
-      end
-      taxonomy = {}
-      unless taxid.nil?
-	 doc = Nokogiri::XML( RemoteData.efetch({db: "taxonomy", id: taxid}) )
-	 taxonomy[ doc.at_xpath("/TaxaSet/Taxon/Rank").content ] =
-	    doc.at_xpath("/TaxaSet/Taxon/#{$o[:ret]}").content
-	 doc.xpath("/TaxaSet/Taxon/LineageEx/Taxon").each do |taxon|
-	    taxonomy[ taxon.at_xpath("./Rank").content ] =
-	       taxon.at_xpath("./#{$o[:ret]}").content
-	 end
-      end
-      puts ([id, taxid] +
-	 $o[:ranks].map{ |rank| taxonomy[ rank ] ||= "" }).join("\t")
-   end # $o[:ids].each
-rescue => err
-   $stderr.puts "Exception: #{err}\n\n"
-   err.backtrace.each { |l| $stderr.puts l + "\n" }
-   err
-end

data/utils/enveomics/Scripts/FastA.N50.pl DELETED Viewed

@@ -1,56 +0,0 @@
-#!/usr/bin/env perl
-#
-# @author: Luis M. Rodriguez-R <lmrodriguezr at gmail dot com>
-# @update: Oct 07 2015
-# @license: artistic license 2.0
-#
-use strict;
-use warnings;
-use List::Util qw/sum min max/;
-my ($seqs, $minlen, $n__) = @ARGV;
-$seqs or die "
-Description:
-   Calculates the N50 value of a set of sequences.  Alternatively, it
-   can calculate other N** values.  It also calculates the total number
-   of sequences and the total added length.
-Usage:
-   $0 seqs.fa[ minlen[ **]]
-   seqs.fa	A FastA file containing the sequences.
-   minlen	(optional) The minimum length to take into consideration.
-   		By default: 0.
-   **		Value N** to calculate.  By default: 50 (N50).
-";
-$minlen ||= 0;
-$n__    ||= 50;
-my @len = ();
-open SEQ, "<", $seqs or die "Cannot open file: $seqs: $!\n";
-while(<SEQ>){
-   if(/^>/){
-      push @len, 0;
-   }else{
-      next if /^;/;
-      chomp;
-      s/\W//g;
-      $len[-1]+=length $_;
-   }
-}
-close SEQ;
-@len = sort { $a <=> $b } map { $_>=$minlen?$_:() } @len;
-my $tot = (sum(@len) || 0);
-my $thr = $n__*$tot/100;
-my $pos = 0;
-for(@len){
-   $pos+= $_;
-   if($pos>=$thr){
-      print "N$n__: $_\n";
-      last;
-   }
-}
-print "Sequences: ".scalar(@len)."\n";
-print "Total length: $tot\n";

data/utils/enveomics/Scripts/FastA.extract.rb DELETED Viewed

@@ -1,152 +0,0 @@
-#!/usr/bin/env ruby
-#
-# @author Luis M. Rodriguez-R <lmrodriguezr at gmail dot com>
-# @license Artistic-2.0
-#
-require 'optparse'
-o = {q: false}
-ARGV << '-h' if ARGV.size==0
-OptionParser.new do |opt|
-  opt.banner = "
-Extracts a list of sequences and/or coordinates from multi-FastA files.
-Usage: #{$0} [options]"
-  opt.separator ''
-  opt.separator 'Mandatory'
-  opt.on('-i', '--in PATH', 'Input FastA file.'){ |v| o[:i] = v }
-  opt.on('-o', '--out PATH', 'Output FastA file.'){ |v| o[:o] = v }
-  opt.on('-c', '--coords STRING',
-    'Comma-delimited list of coordinates (mandatory unless -C is passed).',
-    'The format of the coordinates is "SEQ:FROM..TO" or "SEQ:FROM~LEN":',
-    'SEQ: Sequence ID, or * (asterisk) to extract range from all sequences',
-    'FROM: Integer, position of the first base to include (can be negative)',
-    'TO: Integer, last base to include (can be negative)',
-    'LEN: Length of the range to extract'
-    ){ |v| o[:c] = v }
-  opt.separator ''
-  opt.separator 'Options'
-  opt.on('-C', '--coords-file PATH',
-    'File containing the coordinates, one per line.',
-    'Each line must follow the format described for -c.'){ |v| o[:C] = v }
-  opt.on('-q', '--quiet', 'Run quietly (no STDERR output).'){ o[:q] = true }
-  opt.on('-h', '--help', 'Display this screen.') do
-    puts opt
-    exit
-  end
-  opt.separator ''
-end.parse!
-abort '-i is mandatory.' if o[:i].nil?
-abort '-o is mandatory.' if o[:o].nil?
-abort '-c is mandatory.' if o[:c].nil? and o[:C].nil?
-# Classses to parse coordinates
-class SeqCoords
-  attr :id, :from, :to, :length, :str
-  def initialize(str)
-    @str = str
-    m = /(\S+):(-?\d+)(~|\.\.)(-?\d+)/.match str
-    raise "Cannot parse coordinates: #{str}" if m.nil?
-    @id = m[1]
-    @from = m[2].to_i
-    if m[3] == '~'
-      @length = m[4].to_i
-    else
-      @to = m[4].to_i
-    end
-  end
-  def extract(id, seq)
-    return nil unless concerns? id
-    from_i = from > 0 ? from : seq.length + 1 + from
-    if to.nil?
-      seq[from_i, length]
-    else
-      to_i = to > 0 ? to : seq.length + 1 + to
-      seq[from_i .. to_i]
-    end
-  end
-  def concerns?(seq_id)
-    return true if id == '*'
-    return id == seq_id
-  end
-end
-class SeqCoordsCollection
-  class << self
-    def from_str(str)
-      c = new
-      str.split(',').each { |i| c << SeqCoords.new(i) }
-      c
-    end
-    def from_file(path)
-      c = new
-      File.open(path, 'r') do |fh|
-        fh.each{ |i| c << SeqCoords.new(i.chomp) }
-      end
-      c
-    end
-  end
-  attr :collection
-  def initialize
-    @collection = []
-  end
-  def <<(coords)
-    @collection << coords
-  end
-  def extract(id, seq)
-    @collection.map{ |c| c.extract(id, seq) }.compact
-  end
-end
-# Functions to parse sequences
-def do_stuff(id, sq)
-  return if id.nil? or sq.empty?
-  @n_in += 1
-  sq.gsub!(/[^A-Za-z]/, '')
-  i = 0
-  @coll.extract(id, sq).each do |new_sq|
-    @ofh.puts ">#{id}:#{i += 1}"
-    @ofh.puts new_sq
-    @n_out += 1
-  end
-end
-# Parse coordinates
-$stderr.puts 'Parsing coordinates' unless o[:q]
-@coll = o[:c].nil? ? SeqCoordsCollection.from_file(o[:C]) :
-  SeqCoordsCollection.from_str(o[:c])
-$stderr.puts "  Coordinates found: #{@coll.collection.size}"
-# Parse sequences
-$stderr.puts 'Parsing sequences' unless o[:q]
-@n_in = 0
-@n_out = 0
-@ofh = File.open(o[:o], 'w')
-File.open(o[:i], 'r') do |fh|
-  id = nil
-  sq = ''
-  fh.each do |ln|
-    next if ln =~ /^;/
-    if ln =~ /^>(\S+)/
-      id = $1
-      do_stuff(id, sq)
-      sq = ''
-    else
-      sq << ln
-    end
-  end
-  do_stuff(id, sq)
-end
-@ofh.close
-$stderr.puts "  Input sequences: #{@n_in}"
-$stderr.puts "  Output fragments: #{@n_out}"

data/utils/enveomics/Scripts/FastA.filter.pl DELETED Viewed

@@ -1,52 +0,0 @@
-#!/usr/bin/env perl
-#
-# @author  Luis M. Rodriguez-R <lmrodriguezr at gmail dot com>
-# @update  Oct-07-2015
-# @license artistic license 2.0
-#
-use warnings;
-use strict;
-use Getopt::Std;
-sub HELP_MESSAGE { die "
-.Description:
-   Extracts a subset of sequences from a FastA file.
-.Usage: $0 [options] list.txt seqs.fa > subset.fa
-   [options]
-   -r		Reverse list.  Extracts sequences NOT present in the list.
-   -q		Runs quietly.
-   -h		Prints this message and exits.
-   [mandatory]
-   list.txt	List of sequences to extract.
-   seqs.fa	FastA file containing the superset of sequences.
-   subset.fa	FastA file to be created.
-" }
-my %o=();
-getopts('rhq', \%o);
-my($list, $fa) = @ARGV;
-($list and $fa) or &HELP_MESSAGE;
-$o{h} and &HELP_MESSAGE;
-print STDERR "Reading list.\n" unless $o{q};
-open LI, "<", $list or die "Cannot read file: $list: $!\n";
-my %li = map { chomp; $_ => 1 } <LI>;
-close LI;
-print STDERR "Filtering FastA.\n" unless $o{q};
-open FA, "<", $fa or die "Cannot read file: $fa: $!\n";
-my $good = 0;
-while(my $ln = <FA>){
-   next if $ln =~ /^;/;
-   chomp $ln;
-   if($ln =~ m/^>((\S+).*)/){ $good = (exists $li{$1} or exists $li{">$1"} or exists $li{$2} or exists $li{$ln}) }
-   elsif($ln =~ m/^>/){ $good=$o{r}; print STDERR "Warning: Non-cannonical defline, line $.: $ln\n" }
-   print "$ln\n" if (($good and not $o{r}) or ($o{r} and not $good));
-}
-close FA;

data/utils/enveomics/Scripts/FastA.filterLen.pl DELETED Viewed

@@ -1,28 +0,0 @@
-#!/usr/bin/env perl
-use warnings;
-use strict;
-use Bio::SeqIO;
-my $file = $ARGV[0];
-my $min = $ARGV[1];
-($file and $min) or die <<HELP
-This script will filter a multi fastA file by length
-Usage "perl $0 fastafile minlenght "
-HELP
-;
-my $seq_in  = Bio::SeqIO->new( -format => 'fasta',-file => $file);
-while( my $seq1 = $seq_in->next_seq() ) {
-	my $id  = $seq1->primary_id;
-	chomp $id;
-	my $seq = $seq1->seq;
-	chomp $seq;
-	my $lseq = length($seq);
-	if($lseq>=$min){
-		print ">$id","\n",$seq,"\n";
-	}
-}

data/utils/enveomics/Scripts/FastA.filterN.pl DELETED Viewed

@@ -1,60 +0,0 @@
-#!/usr/bin/env perl
-#
-# @author  Luis M. Rodriguez-R
-# @update  Oct-07-2015
-# @license artistic license 2.0
-#
-use warnings;
-use strict;
-my($file, $content, $stretch) = @ARGV;
-$file or die <<HELP
-Description:
-   Filter sequences by N-content and presence of long homopolymers.
-Usage:
-   $0 sequences.fa [content [stretch]] > filtered.fa
-Where:
-   sequences.fa	Input file in FastA format
-   content	A number between 0 and 1 indicating the maximum proportion of Ns
-   		(1 to turn off, 0.5 by default)
-   stretch	A number indicating the maximum number of consecutive identical
-   		nucleotides allowed (0 to turn off, 100 by default)
-   filtered.fa	Filtered set of sequences.
-HELP
-;
-($content ||= 0.5)+=0;
-($stretch ||= 100)+=0;
-my $good = 0;
-my $N = 0;
-FASTA: {
-   local $/ = "\n>";
-   open FILE, "<", $file or die "I can not open the file: $file: $!\n";
-   SEQ: while(<FILE>){
-      $N++;
-      s/^;.*//gm;
-      s/>//g;
-      my($n,$s) = split /\n/, $_, 2;
-      (my $clean = $s) =~ s/[^ACTGN]//g;
-      if($content < 1){
-         (my $Ns = $clean) =~ s/[^N]//g;
-	 next SEQ if length($Ns)>length($clean)*$content;
-      }
-      if($stretch > 0){
-         for my $nuc (qw(A C T G N)){
-	    next SEQ if $clean =~ m/[$nuc]{$stretch}/;
-	 }
-      }
-      print ">$n\n$s\n";
-      $good++;
-   }
-   close FILE;
-   print STDERR "Total sequences: $N\nAfter filtering: $good\n";
-}

data/utils/enveomics/Scripts/FastA.fragment.rb DELETED Viewed

@@ -1,92 +0,0 @@
-#!/usr/bin/env ruby
-# @author  Luis M. Rodriguez-R
-# @license artistic license 2.0
-$:.push File.expand_path("../lib", __FILE__)
-require "enveomics_rb/enveomics"
-require "enveomics_rb/stat"
-o = {q:false, completeness:nil, minlen:500, shuffle:true}
-OptionParser.new do |opts|
-  opts.banner = "
-Simulates incomplete (fragmented) drafts from complete genomes.
-Usage: #{$0} [options]"
-  opts.separator ""
-  opts.separator "Mandatory"
-  opts.on("-i", "--in FILE",
-    "Path to the FastA file containing the complete sequences."
-    ){ |v| o[:in] = v }
-  opts.on("-o", "--out FILE", "Path to the FastA to create."){ |v| o[:out] = v }
-  opts.on("-c", "--completeness FLOAT",
-    "Fraction of genome completeness to simulate from 0 to 1."
-    ){ |v| o[:completeness] = v.to_f }
-  opts.separator ""
-  opts.separator "Options"
-  opts.on("-m", "--minlen INT",
-    "Minimum fragment length to report. By default: #{o[:minlen]}."
-    ){ |v| o[:minlen] = v.to_i }
-  opts.on("-s", "--sorted", "Keep fragments sorted as in the input file. ",
-    "By default, fragments are shuffled."){ |v| o[:shuffle] = !v }
-  opts.on("-q", "--quiet", "Run quietly (no STDERR output)"){ o[:q] = true }
-  opts.on("-h", "--help", "Display this screen") do
-    puts opts
-    exit
-  end
-  opts.separator ""
-end.parse!
-abort "-i is mandatory" if o[:in].nil?
-abort "-o is mandatory" if o[:out].nil?
-abort "-c is mandatory" if o[:completeness].nil?
-begin
-  # Read input sequences
-  g_id  = []
-  g_seq = []
-  File.open(o[:in], "r") do |ifh|
-    id = ""
-    ifh.each_line do |ln|
-      if ln =~ /^>(\S*)/
-        g_id  << $1
-        g_seq << ""
-      else
-        g_seq[g_seq.size-1] += ln.gsub(/[^A-Za-z]/,"")
-      end
-    end
-  end
-  # Fragment genomes
-  f = {}
-  binlen = [1, (o[:minlen].to_f/(1.5**2)).ceil].max
-  p = [0.001, [1.0, 1.0 - (o[:completeness]/1.25 + 0.1)].min].max
-  while not g_seq.empty?
-    id  = g_id.shift
-    seq = g_seq.shift
-    gL  = seq.length
-    while not seq.empty?
-      fL = [0, ((Enve::Stat.r_geom(p).to_f +
-                  Enve::Stat.r_unif(-0.5,0.5))*binlen).round].max
-      f["#{f.size+1}_#{id}"] = seq[0,fL] if fL >= o[:minlen]
-      seq = seq[(fL+1) .. -1]
-      seq = "" if seq.nil?
-    end
-  end
-  # Save output
-  k = f.keys
-  k.shuffle! if o[:shuffle]
-  File.open(o[:out], "w") do |ofh|
-    k.each do |id|
-      ofh.puts ">#{id}"
-      ofh.puts f[id].gsub(/(\S{50})/, "\\1\n")
-    end
-  end
-rescue => err
-   $stderr.puts "Exception: #{err}\n\n"
-   err.backtrace.each { |l| $stderr.puts l + "\n" }
-   err
-end