RubyGems - mspire - Versions diffs - 0.4.9 → 0.5.0 - Mend

mspire 0.4.9 → 0.5.0

Files changed (255) hide show

data/README +27 -17
data/changelog.txt +31 -62
data/lib/ms/calc.rb +32 -0
data/lib/ms/data/interleaved.rb +60 -0
data/lib/ms/data/lazy_io.rb +73 -0
data/lib/ms/data/lazy_string.rb +15 -0
data/lib/ms/data/simple.rb +59 -0
data/lib/ms/data/transposed.rb +41 -0
data/lib/ms/data.rb +57 -0
data/lib/ms/format/format_error.rb +12 -0
data/lib/ms/spectrum.rb +25 -384
data/lib/ms/support/binary_search.rb +126 -0
data/lib/ms.rb +10 -10
metadata +38 -350
data/INSTALL +0 -58
data/README.rdoc +0 -18
data/Rakefile +0 -330
data/bin/aafreqs.rb +0 -23
data/bin/bioworks2excel.rb +0 -14
data/bin/bioworks_to_pepxml.rb +0 -148
data/bin/bioworks_to_pepxml_gui.rb +0 -225
data/bin/fasta_shaker.rb +0 -5
data/bin/filter_and_validate.rb +0 -5
data/bin/gi2annot.rb +0 -14
data/bin/id_class_anal.rb +0 -112
data/bin/id_precision.rb +0 -172
data/bin/ms_to_lmat.rb +0 -67
data/bin/pepproph_filter.rb +0 -16
data/bin/prob_validate.rb +0 -6
data/bin/protein_summary.rb +0 -6
data/bin/protxml2prots_peps.rb +0 -32
data/bin/raw_to_mzXML.rb +0 -55
data/bin/run_percolator.rb +0 -122
data/bin/sqt_group.rb +0 -26
data/bin/srf_group.rb +0 -27
data/bin/srf_to_sqt.rb +0 -40
data/lib/align/chams.rb +0 -78
data/lib/align.rb +0 -154
data/lib/archive/targz.rb +0 -94
data/lib/bsearch.rb +0 -120
data/lib/core_extensions.rb +0 -16
data/lib/fasta.rb +0 -626
data/lib/gi.rb +0 -124
data/lib/group_by.rb +0 -10
data/lib/index_by.rb +0 -11
data/lib/merge_deep.rb +0 -21
data/lib/ms/converter/mzxml.rb +0 -77
data/lib/ms/gradient_program.rb +0 -170
data/lib/ms/msrun.rb +0 -244
data/lib/ms/msrun_index.rb +0 -108
data/lib/ms/parser/mzdata/axml.rb +0 -67
data/lib/ms/parser/mzdata/dom.rb +0 -175
data/lib/ms/parser/mzdata/libxml.rb +0 -7
data/lib/ms/parser/mzdata.rb +0 -31
data/lib/ms/parser/mzxml/axml.rb +0 -70
data/lib/ms/parser/mzxml/dom.rb +0 -182
data/lib/ms/parser/mzxml/hpricot.rb +0 -253
data/lib/ms/parser/mzxml/libxml.rb +0 -19
data/lib/ms/parser/mzxml/regexp.rb +0 -122
data/lib/ms/parser/mzxml/rexml.rb +0 -72
data/lib/ms/parser/mzxml/xmlparser.rb +0 -248
data/lib/ms/parser/mzxml.rb +0 -282
data/lib/ms/parser.rb +0 -108
data/lib/ms/precursor.rb +0 -25
data/lib/ms/scan.rb +0 -81
data/lib/mspire.rb +0 -4
data/lib/pi_zero.rb +0 -244
data/lib/qvalue.rb +0 -161
data/lib/roc.rb +0 -187
data/lib/sample_enzyme.rb +0 -160
data/lib/scan_i.rb +0 -21
data/lib/spec_id/aa_freqs.rb +0 -170
data/lib/spec_id/bioworks.rb +0 -497
data/lib/spec_id/digestor.rb +0 -138
data/lib/spec_id/mass.rb +0 -179
data/lib/spec_id/parser/proph.rb +0 -335
data/lib/spec_id/precision/filter/cmdline.rb +0 -218
data/lib/spec_id/precision/filter/interactive.rb +0 -134
data/lib/spec_id/precision/filter/output.rb +0 -148
data/lib/spec_id/precision/filter.rb +0 -637
data/lib/spec_id/precision/output.rb +0 -60
data/lib/spec_id/precision/prob/cmdline.rb +0 -160
data/lib/spec_id/precision/prob/output.rb +0 -94
data/lib/spec_id/precision/prob.rb +0 -249
data/lib/spec_id/proph/pep_summary.rb +0 -104
data/lib/spec_id/proph/prot_summary.rb +0 -484
data/lib/spec_id/proph.rb +0 -4
data/lib/spec_id/protein_summary.rb +0 -489
data/lib/spec_id/sequest/params.rb +0 -316
data/lib/spec_id/sequest/pepxml.rb +0 -1458
data/lib/spec_id/sequest.rb +0 -33
data/lib/spec_id/sqt.rb +0 -349
data/lib/spec_id/srf.rb +0 -973
data/lib/spec_id.rb +0 -778
data/lib/spec_id_xml.rb +0 -99
data/lib/transmem/phobius.rb +0 -147
data/lib/transmem/toppred.rb +0 -368
data/lib/transmem.rb +0 -157
data/lib/validator/aa.rb +0 -48
data/lib/validator/aa_est.rb +0 -112
data/lib/validator/background.rb +0 -77
data/lib/validator/bias.rb +0 -95
data/lib/validator/cmdline.rb +0 -431
data/lib/validator/decoy.rb +0 -107
data/lib/validator/digestion_based.rb +0 -70
data/lib/validator/probability.rb +0 -51
data/lib/validator/prot_from_pep.rb +0 -234
data/lib/validator/q_value.rb +0 -32
data/lib/validator/transmem.rb +0 -272
data/lib/validator/true_pos.rb +0 -46
data/lib/validator.rb +0 -197
data/lib/xml.rb +0 -38
data/lib/xml_style_parser.rb +0 -119
data/lib/xmlparser_wrapper.rb +0 -19
data/release_notes.txt +0 -2
data/script/compile_and_plot_smriti_final.rb +0 -97
data/script/create_little_pepxml.rb +0 -61
data/script/degenerate_peptides.rb +0 -47
data/script/estimate_fpr_by_cysteine.rb +0 -226
data/script/extract_gradient_programs.rb +0 -56
data/script/find_cysteine_background.rb +0 -137
data/script/genuine_tps_and_probs.rb +0 -136
data/script/get_apex_values_rexml.rb +0 -44
data/script/histogram_probs.rb +0 -61
data/script/mascot_fix_pepxml.rb +0 -123
data/script/msvis.rb +0 -42
data/script/mzXML2timeIndex.rb +0 -25
data/script/peps_per_bin.rb +0 -67
data/script/prep_dir.rb +0 -121
data/script/simple_protein_digestion.rb +0 -27
data/script/smriti_final_analysis.rb +0 -103
data/script/sqt_to_meta.rb +0 -24
data/script/top_hit_per_scan.rb +0 -67
data/script/toppred_to_yaml.rb +0 -47
data/script/tpp_installer.rb +0 -249
data/specs/align_spec.rb +0 -79
data/specs/bin/bioworks_to_pepxml_spec.rb +0 -79
data/specs/bin/fasta_shaker_spec.rb +0 -259
data/specs/bin/filter_and_validate__multiple_vals_helper.yaml +0 -199
data/specs/bin/filter_and_validate_spec.rb +0 -180
data/specs/bin/ms_to_lmat_spec.rb +0 -34
data/specs/bin/prob_validate_spec.rb +0 -86
data/specs/bin/protein_summary_spec.rb +0 -14
data/specs/fasta_spec.rb +0 -354
data/specs/gi_spec.rb +0 -22
data/specs/load_bin_path.rb +0 -7
data/specs/merge_deep_spec.rb +0 -13
data/specs/ms/gradient_program_spec.rb +0 -77
data/specs/ms/msrun_spec.rb +0 -498
data/specs/ms/parser_spec.rb +0 -92
data/specs/ms/spectrum_spec.rb +0 -87
data/specs/pi_zero_spec.rb +0 -115
data/specs/qvalue_spec.rb +0 -39
data/specs/roc_spec.rb +0 -251
data/specs/rspec_autotest.rb +0 -149
data/specs/sample_enzyme_spec.rb +0 -126
data/specs/spec_helper.rb +0 -135
data/specs/spec_id/aa_freqs_spec.rb +0 -52
data/specs/spec_id/bioworks_spec.rb +0 -148
data/specs/spec_id/digestor_spec.rb +0 -75
data/specs/spec_id/precision/filter/cmdline_spec.rb +0 -20
data/specs/spec_id/precision/filter/output_spec.rb +0 -31
data/specs/spec_id/precision/filter_spec.rb +0 -246
data/specs/spec_id/precision/prob_spec.rb +0 -44
data/specs/spec_id/precision/prob_spec_helper.rb +0 -0
data/specs/spec_id/proph/pep_summary_spec.rb +0 -98
data/specs/spec_id/proph/prot_summary_spec.rb +0 -128
data/specs/spec_id/protein_summary_spec.rb +0 -189
data/specs/spec_id/sequest/params_spec.rb +0 -68
data/specs/spec_id/sequest/pepxml_spec.rb +0 -374
data/specs/spec_id/sequest_spec.rb +0 -38
data/specs/spec_id/sqt_spec.rb +0 -246
data/specs/spec_id/srf_spec.rb +0 -172
data/specs/spec_id/srf_spec_helper.rb +0 -139
data/specs/spec_id_helper.rb +0 -33
data/specs/spec_id_spec.rb +0 -366
data/specs/spec_id_xml_spec.rb +0 -33
data/specs/transmem/phobius_spec.rb +0 -425
data/specs/transmem/toppred_spec.rb +0 -298
data/specs/transmem_spec.rb +0 -60
data/specs/transmem_spec_shared.rb +0 -64
data/specs/validator/aa_est_spec.rb +0 -66
data/specs/validator/aa_spec.rb +0 -40
data/specs/validator/background_spec.rb +0 -67
data/specs/validator/bias_spec.rb +0 -122
data/specs/validator/decoy_spec.rb +0 -51
data/specs/validator/fasta_helper.rb +0 -26
data/specs/validator/prot_from_pep_spec.rb +0 -141
data/specs/validator/transmem_spec.rb +0 -146
data/specs/validator/true_pos_spec.rb +0 -58
data/specs/validator_helper.rb +0 -33
data/specs/xml_spec.rb +0 -12
data/test_files/000_pepxml18_small.xml +0 -206
data/test_files/020a.mzXML.timeIndex +0 -4710
data/test_files/4-03-03_mzXML/000.mzXML.timeIndex +0 -3973
data/test_files/4-03-03_mzXML/020.mzXML.timeIndex +0 -3872
data/test_files/4-03-03_small-prot.xml +0 -321
data/test_files/4-03-03_small.xml +0 -3876
data/test_files/7MIX_STD_110802_1.sequest_params_fragment.srf +0 -0
data/test_files/bioworks-3.3_10prots.xml +0 -5999
data/test_files/bioworks31.params +0 -77
data/test_files/bioworks32.params +0 -62
data/test_files/bioworks33.params +0 -63
data/test_files/bioworks_single_run_small.xml +0 -7237
data/test_files/bioworks_small.fasta +0 -212
data/test_files/bioworks_small.params +0 -63
data/test_files/bioworks_small.phobius +0 -109
data/test_files/bioworks_small.toppred.out +0 -2847
data/test_files/bioworks_small.xml +0 -5610
data/test_files/bioworks_with_INV_small.xml +0 -3753
data/test_files/bioworks_with_SHUFF_small.xml +0 -2503
data/test_files/corrupted_900.srf +0 -0
data/test_files/head_of_7MIX.srf +0 -0
data/test_files/interact-opd1_mods_small-prot.xml +0 -304
data/test_files/messups.fasta +0 -297
data/test_files/opd1/000.my_answer.100lines.xml +0 -101
data/test_files/opd1/000.tpp_1.2.3.first10.xml +0 -115
data/test_files/opd1/000.tpp_2.9.2.first10.xml +0 -126
data/test_files/opd1/000.v2.1.mzXML.timeIndex +0 -3748
data/test_files/opd1/000_020-prot.png +0 -0
data/test_files/opd1/000_020_3prots-prot.mod_initprob.xml +0 -62
data/test_files/opd1/000_020_3prots-prot.xml +0 -62
data/test_files/opd1/opd1_cat_inv_small-prot.xml +0 -139
data/test_files/opd1/sequest.3.1.params +0 -77
data/test_files/opd1/sequest.3.2.params +0 -62
data/test_files/opd1/twenty_scans.mzXML +0 -418
data/test_files/opd1/twenty_scans.v2.1.mzXML +0 -382
data/test_files/opd1/twenty_scans_answ.lmat +0 -0
data/test_files/opd1/twenty_scans_answ.lmata +0 -9
data/test_files/opd1_020_beginning.RAW +0 -0
data/test_files/opd1_2runs_2mods/data/020.mzData.xml +0 -683
data/test_files/opd1_2runs_2mods/data/020.readw.mzXML +0 -382
data/test_files/opd1_2runs_2mods/data/040.mzData.xml +0 -683
data/test_files/opd1_2runs_2mods/data/040.readw.mzXML +0 -382
data/test_files/opd1_2runs_2mods/data/README.txt +0 -6
data/test_files/opd1_2runs_2mods/interact-opd1_mods__small.xml +0 -753
data/test_files/orbitrap_mzData/000_cut.xml +0 -1920
data/test_files/pepproph_small.xml +0 -4691
data/test_files/phobius.small.noheader.txt +0 -50
data/test_files/phobius.small.small.txt +0 -53
data/test_files/s01_anC1_ld020mM.key.txt +0 -25
data/test_files/s01_anC1_ld020mM.meth +0 -0
data/test_files/small.fasta +0 -297
data/test_files/small.sqt +0 -87
data/test_files/smallraw.RAW +0 -0
data/test_files/tf_bioworks2excel.bioXML +0 -14340
data/test_files/tf_bioworks2excel.txt.actual +0 -1035
data/test_files/toppred.small.out +0 -416
data/test_files/toppred.xml.out +0 -318
data/test_files/validator_hits_separate/bias_bioworks_small_HS.fasta +0 -7
data/test_files/validator_hits_separate/bioworks_small_HS.xml +0 -5651
data/test_files/yeast_gly_small-prot.xml +0 -265
data/test_files/yeast_gly_small.1.0_1.0_1.0.parentTimes +0 -6
data/test_files/yeast_gly_small.xml +0 -3807
data/test_files/yeast_gly_small2.parentTimes +0 -6

data/lib/validator.rb DELETED Viewed

@@ -1,197 +0,0 @@
-class Validator
-  # in the absence of digestion, does the spec_id type requires pephits for
-  # validation?
-  def self.requires_pephits?(spec_id_obj)
-    case spec_id_obj
-    when Proph::ProtSummary : true
-    when Proph::PepSummary : true
-    when SQTGroup : true
-    else ; false
-    end
-  end
-  Validator_to_string = {
-    'Validator::AA' => 'badAA',
-    'Validator::AAEst' => 'badAAEst',
-    'Validator::Decoy' => 'decoy',
-    'Validator::Transmem::Protein' => 'tmm',
-    'Validator::TruePos' => 'tps',
-    'Validator::Bias' => 'bias',
-    'Validator::Probability' => 'prob',
-    'Validator::QValue' => 'qval',
-    :bad_aa => 'badAA',
-    :bad_aa_est => 'badAAEst',
-    :decoy => 'decoy',
-    :tmm => 'tmm',
-    :tps => 'tps',
-    :bias => 'bias',
-    :prob => 'prob',
-    :qval => 'qval',
-  }
-  def initialize_increment
-    @increment_tps = 0
-    @increment_fps = 0
-    @increment_total_submitted = 0
-    @increment_initialized = true
-  end
-  # if adding pephits in groups at a time, the entire group does not need to be
-  # queried, just the individual hit.  Use this OR pephits_precision (NOT
-  # both).  The initial query to this method will begin a running tally that
-  # is saved by the validator.
-  # takes either an array or a single pephit (determined by if it is a
-  # SpecID::Pep)
-  def increment_pephits_precision(peps)
-    tmp = $VERBOSE; $VERBOSE = nil
-    initialize_increment unless @increment_initialized
-    $VERBOSE = tmp
-    to_submit =
-      if peps.is_a? SpecID::Pep
-        [peps]
-      else
-        peps
-      end
-    @increment_total_submitted += to_submit.size
-    (tps, fps) = partition(to_submit)
-    @increment_tps += tps.size
-    @increment_fps += fps.size
-    (num_tps, num_fps) =
-      if self.respond_to?(:calc_precision_prep)  # for digestion based validators
-        (num_tps, num_fps) = calc_precision_prep(@increment_tps, @increment_fps)
-        [num_tps, num_fps]
-      else
-        [@increment_tps, @increment_fps]
-      end
-    calc_precision(num_tps, num_fps)
-  end
-  # returns an adjusted false positive rate (a float not to drop below 0.0)
-  # based on a background of 'false'-false positive hits to total hits.  Also
-  # sets the @calculated_background attribute.  Accepts floats or ints
-  def adjust_fps_for_background(num_tps, num_fps, background)
-    num_fps = num_fps.to_f
-    total_peps = num_tps + num_fps
-    @calculated_background = num_fps / total_peps
-    num_fps -= (total_peps.to_f * background)
-    num_fps = 0.0 if num_fps < 0.0
-    num_fps
-  end
-  # copied from libjtp: vec
-  # returns the mean and std_dev
-  def sample_stats(array)
-    _len = array.size
-    _sum = 0.0
-    _sum_sq = 0.0
-    array.each do |val|
-      _sum += val
-      _sum_sq += val * val
-    end
-    std_dev = _sum_sq - ((_sum * _sum)/_len)
-    std_dev /= ( (_len > 1) ? (_len-1) : 1 )
-    # on occasion, a very small negative number occurs
-    if std_dev < 0.0
-      std_dev = 0.0
-    else
-      std_dev = Math.sqrt(std_dev)
-    end
-    mean = _sum.to_f/_len
-    [mean, std_dev]
-  end
-  # takes an array of validators and returns a fresh array where each has been
-  # turned into a sensible hash (with symbols as the keys!)
-  def self.sensible_validator_hashes(validators)
-    validators.map do |val|
-      hash = {}
-      case val
-      when Validator::TruePos
-        hash.merge( {:correct_wins => val.correct_wins, :file => val.fasta.filename } )
-      when Validator::AAEst
-        %w(frequency background calculated_background).each do |cat|
-          hash[cat.to_sym] = val.send(cat.to_sym)
-        end
-      when Validator::AA
-        %w(false_to_total_ratio background calculated_background).each do |cat|
-          hash[cat.to_sym] = val.send(cat.to_sym)
-        end
-      when Validator::Decoy
-        %w(pi_zero correct_wins decoy_on_match).each do |cat|
-          hash[cat.to_sym] = val.send(cat.to_sym)
-        end
-        hash[:constraint] = val.constraint.inspect if val.constraint
-      when Validator::Bias
-        %w(correct_wins proteins_expected background calculated_background false_to_total_ratio).each do |cat|
-          hash[cat.to_sym] = val.send(cat.to_sym)
-        end
-        hash[:file] = val.fasta.filename
-      when Validator::Transmem::Protein
-        %w(false_to_total_ratio min_num_tms soluble_fraction correct_wins no_include_tm_peps background calculated_background transmem_file).each do |cat|
-          hash[cat.to_sym] = val.send(cat.to_sym)
-        end
-      when Validator::Probability
-        %w(prob_method).each do |cat|
-          hash[cat.to_sym] = val.send(cat.to_sym)
-        end
-      when Validator::QValue
-        # no params to add
-      else ; raise ArgumentError, "Don't know the validator class #{val}"
-      end
-      klass_as_s = val.class.to_s
-      hash[:type] = Validator_to_string[klass_as_s]
-      hash[:class] = klass_as_s
-      hash
-    end
-  end
-end
-module Precision::Calculator
-  # calculates precision by the assumption that the first group are all true
-  # hits and the second are all false hits
-  # (0,0) is returned as 1.0
-  def calc_precision(num_true_hits, num_false_hits)
-    if ((num_true_hits.to_f == 0.0) && (num_false_hits.to_f == 0.0))
-      1.0
-    else
-      num_true_hits.to_f / (num_true_hits.to_f + num_false_hits.to_f)
-    end
-  end
-end
-# will calculate precision for groups of proteins where the first group are
-# normal hits (which may be true or false) and the second are decoy hits.
-# edge case:  if num_normal.to_f == 0.0 then if num_decoy.to_f > 0 ; 0, else 1
-module Precision::Calculator::Decoy
-  def calc_precision(num_normal, num_decoy, frit=1.0)
-    # will calculate as floats in case fractional amounts passed in for
-    # whatever reason
-    num_normal_f = num_normal.to_f
-    num_true_pos = num_normal_f - (num_decoy.to_f * frit)
-    precision =
-      if num_normal_f == 0.0
-        if num_decoy.to_f > 0.0
-          0.0
-        else
-          1.0
-        end
-      else
-        num_true_pos/num_normal_f
-      end
-  end
-end
-#require 'validator/true_pos'
-#require 'validator/aa'
-#require 'validator/aa_est'
-#require 'validator/bias'
-#require 'validator/decoy'
-#require 'validator/transmem'
-#require 'validator/probability'
-#require 'validator/q_value'
-#require 'validator/prot_from_pep'

data/lib/xml.rb DELETED Viewed

@@ -1,38 +0,0 @@
-module XML
-  HourMinuteMatch = /[MH]/o
-  # returns a float object of seconds
-  # doesn't support year month, etc, yet
-  def self.duration_to_seconds(string)
-    case x = string[0,2]
-    when 'PT'
-      rest = string[2..-1]
-      # usually it will be this 'PT1.223434S':
-      if rest !~ HourMinuteMatch
-        rest[0...-1].to_f
-      else
-        addit = ''
-        total_secs = 0
-        total_secs_as_float = nil
-        rest.split('').each do |let|
-          case let
-          when 'H'
-            total_secs += addit.to_i * 3600
-            addit = ''
-          when 'M'
-            total_secs += addit.to_i * 60
-            addit = ''
-          when 'S'
-            total_secs_as_float = total_secs.to_f
-            total_secs_as_float += addit.to_f
-          else
-            addit << let
-          end
-        end
-        total_secs_as_float
-      end
-    else
-      abort 'need to include support for other durations'
-    end
-  end
-end

data/lib/xml_style_parser.rb DELETED Viewed

@@ -1,119 +0,0 @@
-module XMLStyleParser
-  @done_once = nil
-  Parser_precedence = %w(AXML LibXML XMLParser Regexp REXML)
-  # currently AXML requires 'xmlparser' to be installed.... (may not always be
-  # the case...)
-  File_required = {'AXML' => /^axml/, 'LibXML' => /^xml\/libxml/, 'XMLParser' => /^xmlparser/}
-  # the method that the parser will call on the given file at parse!
-  attr_accessor :method
-  # parses the given file by sending to @method
-  def parse(file, opts={})
-    if respond_to? @method
-      send(@method, file, opts)
-    else
-      raise NoMethodError, "Parser of class #{self.class} can't parse #{@method} yet"
-    end
-  end
-  # XMLParser and xml/libxml are incompatible, so if xmlparser is available,
-  # libxml will not be loaded (XMLParser#parse is clobbered by
-  # XML::Parser#parse [don't ask me why])
-  def self.require_parsers
-    if !@done_once
-      have_xmlparser = false
-      begin
-        require 'xmlparser'
-        puts "Loaded XMLParser" if $VERBOSE
-        have_xmlparser = true
-      rescue LoadError
-      end
-      begin
-        require 'axml'
-        puts "Loaded AXML" if $VERBOSE
-      rescue LoadError
-      end
-      begin
-        unless have_xmlparser
-          require 'xml/libxml'
-          puts "Loaded xml/libxml" if $VERBOSE
-          ################################################################
-          # IMPORTANT!
-          # This magic line makes the parser behave like it ought to!!
-          XML::Parser.default_keep_blanks = false
-          ################################################################
-        end
-      rescue LoadError
-      end
-    end
-    @done_once = true
-  end
-  # returns an array of strings depending on File_required (in the order of
-  # Parser_precedence)
-  def self.available_xml_parsers
-    require_parsers
-    parser_precedence = Parser_precedence.dup
-    File_required.map do |k,v|
-      unless $".any? {|req_file| req_file.match(v) }
-        parser_precedence.delete(k)
-      end
-    end
-    parser_precedence
-  end
-  ## appends downcase to each parser type here and tries to require it
-  # returns all those that were required without a load error
-  def self.require_parse_files(base_dir)
-    XMLStyleParser.available_xml_parsers.select do |v|
-      to_require = base_dir + '/' + v.downcase
-      begin
-        require to_require
-        true
-      rescue LoadError
-        false
-      end
-    end
-  end
-  # seeks a subclass that has the public_method @method
-  def self.choose_parser(const, method, special_subclass=nil)
-    ## First update @@parser_precedence to ensure we should get these guys
-    parser_precedence = available_xml_parsers
-    available_constants = parser_precedence.select do |v|
-      const.const_defined?(v)
-    end
-    available_subclasses = available_constants.map do |v|
-      const.const_get(v)
-    end
-    available = available_subclasses.select do |subclass|
-      subclass.public_method_defined? method
-    end
-    if special_subclass
-      available_special_subclasses = []
-      available.each do |subclass|
-        if subclass.const_defined?(special_subclass)
-          available_special_subclasses << subclass.const_get(special_subclass)
-        end
-      end
-      available = available_special_subclasses
-    end
-    if available.size > 0
-      available.first
-    else
-      warning = ""
-      if special_subclass
-        warning << "** while looking for special subclass: #{special_subclass} **\n"
-      end
-      warning << "No parser of class #{const} can parse :#{method}\n** Is 'axml' (or another xml parser) installed and working? **"
-      raise NoMethodError, warning
-    end
-  end
-end

data/lib/xmlparser_wrapper.rb DELETED Viewed

@@ -1,19 +0,0 @@
-module XMLParserWrapper
-  def parse_and_report(file, const, report_method=:report)
-    parse_and_report_string(IO.read(file), const, report_method)
-  end
-  def parse_and_report_string(string, const, report_method=:report)
-    parser = self.class.const_get(const).new
-    parser.parse(string)
-    parser.send(report_method)
-  end
-  def parse_and_report_io(io, const, report_method=:report)
-    parser = self.class.const_get(const).new
-    parser.parse(io)
-    parser.send(report_method)
-  end
-end

data/release_notes.txt DELETED Viewed

	@@ -1,2 +0,0 @@
1	-
2	-

data/script/compile_and_plot_smriti_final.rb DELETED Viewed

@@ -1,97 +0,0 @@
-#!/usr/bin/ruby -w
-require 'roc'
-require 'optparse'
-require 'generator'
-$decoy = false
-$base = "precision_vs_numhits"
-opts = OptionParser.new do |op|
-  op.banner = "usage: #{File.basename(__FILE__)} smriti.csv ..."
-  op.separator ""
-  op.separator "smriti.csv = (tab delimited) prob, file:seq:charge, T/F"
-  op.separator ""
-  op.on("--decoy", "'F' indicates this is a decoy") {|v| $decoy = true }
-  op.on("-o", "--outfile <filename>", "base outfile name (#{$base})") {|v| $base = v}
-end
-opts.parse!
-if ARGV.size <= 0
-  puts opts
-  exit
-end
-files = ARGV.to_a
-xys = files.map do |file|
-  triplets = IO.readlines(file).reject{|v| v =~ /^#/}.map do |line|
-    line.chomp.split("\t")
-  end
-  # check that they're all OK:
-  triplets.each do |trip|
-    if trip.size != 3 ; abort "bad triplet" end
-  end
-  # figure out the ordering (and correct if necessary):
-  higher_better = triplets[0][0].to_f > triplets.last[0].to_f
-  doublets = triplets.map do |trip|
-    value = trip[0].to_f
-    value *= -1 if higher_better
-    [value, ((trip[2] == 'T') ? true : false)]
-  end
-  roc = ROC.new
-  (tps, fps) = roc.doublets_to_separate(doublets)
-  (x, y) =
-    if $decoy
-      (numhits, precision) = DecoyROC.new.pred_and_ppv(tps, fps)
-      [numhits, precision]
-    else
-      (numhits, precision) = roc.numhits_and_ppv(doublets)
-      [numhits, precision]
-    end
-  [x,y]
-end
-## PLOT TO to_plot
-File.open( $base + ".to_plot", 'w') do |fh|
-  fh.puts "XYData"
-  fh.puts $base
-  fh.puts "precision vs. num hits"
-  fh.puts "num hits"
-  fh.puts "precision"
-  files.zip(xys) do |file,xy|
-    (x,y) = xy
-    x.unshift(0)
-    y.unshift(1)
-    fh.puts file.sub(/\.[^\.]$/,'')
-    fh.puts x.join(" ")
-    fh.puts y.join(" ")
-  end
-end
-File.open( $base + ".csv", 'w') do |fh|
-  columns = []
-  files.zip(xys) do |file,xy|
-    f = file.sub(/\.[^\.]$/,'')
-    (x,y) = xy
-    x.unshift("#Hits: #{f}")
-    y.unshift("Precision: #{f}")
-    columns << x << y
-  end
-  SyncEnumerator.new(*columns).each do |row|
-    fh.puts row.join("\t")
-  end
-end

data/script/create_little_pepxml.rb DELETED Viewed

@@ -1,61 +0,0 @@
-#!/usr/bin/ruby -w
-if ARGV.size < 2
-  puts "usage: #{File.basename(__FILE__)} protxml pepxml"
-  puts "Based on some kind of truncated prot xml file, takes a pepxml file"
-  puts "and deletes all search hits/peptides that aren't in the prot xml file!"
-  exit
-end
-protxml = ARGV[0]
-pepxml = ARGV[1]
-hash = {}
-File.open(protxml) do |fh|
-  while line = fh.gets
-    if line =~ /peptide_sequence="(.*?)" charge="(\d)" /
-      hash[[$1.dup,$2.dup]] = 1
-    end
-  end
-end
-p hash
-out = File.open(pepxml + ".small", "w")
-in_hit = false
-cur_charge = nil
-stored_lines = ""
-print_it = false
-File.open(pepxml) do |fh|
-  while line = fh.gets
-    if line =~ /<search_result .*? assumed_charge="(\d)".*?>/
-      cur_charge = $1.dup
-      in_hit = true
-    end
-    if line =~ /<search_hit .*? peptide="(.*?)"/
-      if hash.key?([$1.dup,cur_charge])
-        print_it = true
-      else
-        print_it = false
-      end
-    end
-    if line =~ /<\/search_result>/
-      if print_it == true
-        stored_lines << line
-        out.print stored_lines
-      end
-      stored_lines = ""
-      in_hit == false
-    elsif !in_hit
-      out.print line
-    else
-      stored_lines << line
-    end
-  end
-end
-out.close

data/script/degenerate_peptides.rb DELETED Viewed

@@ -1,47 +0,0 @@
-#!/usr/bin/ruby -w
-require 'fasta'
-require 'sample_enzyme'
-if ARGV.size < 3
-  puts "usage: #{File.basename(__FILE__)} min_peptide_length missed_cleavages <file>.fasta ..."
-  puts "       returns <file>.min_pep_length_<#>.missed_cleavages_<#>.degenerate_peptides.csv"
-  abort
-end
-min_peptide_length = ARGV.shift.to_i
-missed_cleavages = ARGV.shift.to_i
-ARGV.each do |file|
-  hash = {}
-  if file !~ /\.fasta/
-    abort "must be a fasta file with extension fasta"
-  end
-  new_filename = file.sub(/\.fasta$/, '')
-  new_filename << ".min_pep_length_#{min_peptide_length}.missed_cleavages_#{missed_cleavages}.degenerate_peptides.csv"
-  peptides = []
-  Fasta.new.read_file(file).prots.each do |prot|
-    SampleEnzyme.tryptic(prot.aaseq, missed_cleavages).each do |aaseq|
-      if aaseq.size >= min_peptide_length
-        hash[aaseq] ||= []
-        hash[aaseq].push( prot.header.sub(/^>/,'') )
-      end
-    end
-    #fh.puts( prot.header.split(/\s+/).first.sub(/^>/,'') + "\t" + SampleEnzyme.tryptic(prot.aaseq, missed_cleavages).join(" ") )
-  end
-  File.open(new_filename, "w") do |fh|
-    hash.keys.sort_by {|pep| hash[pep].size }.reverse.each do |pep|
-      fh.puts( [pep, *(hash[pep])].join("\t") )
-    end
-  end
-end