RubyGems - mspire - Versions diffs - 0.4.9 → 0.5.0 - Mend

mspire 0.4.9 → 0.5.0

Files changed (255) hide show

data/README +27 -17
data/changelog.txt +31 -62
data/lib/ms/calc.rb +32 -0
data/lib/ms/data/interleaved.rb +60 -0
data/lib/ms/data/lazy_io.rb +73 -0
data/lib/ms/data/lazy_string.rb +15 -0
data/lib/ms/data/simple.rb +59 -0
data/lib/ms/data/transposed.rb +41 -0
data/lib/ms/data.rb +57 -0
data/lib/ms/format/format_error.rb +12 -0
data/lib/ms/spectrum.rb +25 -384
data/lib/ms/support/binary_search.rb +126 -0
data/lib/ms.rb +10 -10
metadata +38 -350
data/INSTALL +0 -58
data/README.rdoc +0 -18
data/Rakefile +0 -330
data/bin/aafreqs.rb +0 -23
data/bin/bioworks2excel.rb +0 -14
data/bin/bioworks_to_pepxml.rb +0 -148
data/bin/bioworks_to_pepxml_gui.rb +0 -225
data/bin/fasta_shaker.rb +0 -5
data/bin/filter_and_validate.rb +0 -5
data/bin/gi2annot.rb +0 -14
data/bin/id_class_anal.rb +0 -112
data/bin/id_precision.rb +0 -172
data/bin/ms_to_lmat.rb +0 -67
data/bin/pepproph_filter.rb +0 -16
data/bin/prob_validate.rb +0 -6
data/bin/protein_summary.rb +0 -6
data/bin/protxml2prots_peps.rb +0 -32
data/bin/raw_to_mzXML.rb +0 -55
data/bin/run_percolator.rb +0 -122
data/bin/sqt_group.rb +0 -26
data/bin/srf_group.rb +0 -27
data/bin/srf_to_sqt.rb +0 -40
data/lib/align/chams.rb +0 -78
data/lib/align.rb +0 -154
data/lib/archive/targz.rb +0 -94
data/lib/bsearch.rb +0 -120
data/lib/core_extensions.rb +0 -16
data/lib/fasta.rb +0 -626
data/lib/gi.rb +0 -124
data/lib/group_by.rb +0 -10
data/lib/index_by.rb +0 -11
data/lib/merge_deep.rb +0 -21
data/lib/ms/converter/mzxml.rb +0 -77
data/lib/ms/gradient_program.rb +0 -170
data/lib/ms/msrun.rb +0 -244
data/lib/ms/msrun_index.rb +0 -108
data/lib/ms/parser/mzdata/axml.rb +0 -67
data/lib/ms/parser/mzdata/dom.rb +0 -175
data/lib/ms/parser/mzdata/libxml.rb +0 -7
data/lib/ms/parser/mzdata.rb +0 -31
data/lib/ms/parser/mzxml/axml.rb +0 -70
data/lib/ms/parser/mzxml/dom.rb +0 -182
data/lib/ms/parser/mzxml/hpricot.rb +0 -253
data/lib/ms/parser/mzxml/libxml.rb +0 -19
data/lib/ms/parser/mzxml/regexp.rb +0 -122
data/lib/ms/parser/mzxml/rexml.rb +0 -72
data/lib/ms/parser/mzxml/xmlparser.rb +0 -248
data/lib/ms/parser/mzxml.rb +0 -282
data/lib/ms/parser.rb +0 -108
data/lib/ms/precursor.rb +0 -25
data/lib/ms/scan.rb +0 -81
data/lib/mspire.rb +0 -4
data/lib/pi_zero.rb +0 -244
data/lib/qvalue.rb +0 -161
data/lib/roc.rb +0 -187
data/lib/sample_enzyme.rb +0 -160
data/lib/scan_i.rb +0 -21
data/lib/spec_id/aa_freqs.rb +0 -170
data/lib/spec_id/bioworks.rb +0 -497
data/lib/spec_id/digestor.rb +0 -138
data/lib/spec_id/mass.rb +0 -179
data/lib/spec_id/parser/proph.rb +0 -335
data/lib/spec_id/precision/filter/cmdline.rb +0 -218
data/lib/spec_id/precision/filter/interactive.rb +0 -134
data/lib/spec_id/precision/filter/output.rb +0 -148
data/lib/spec_id/precision/filter.rb +0 -637
data/lib/spec_id/precision/output.rb +0 -60
data/lib/spec_id/precision/prob/cmdline.rb +0 -160
data/lib/spec_id/precision/prob/output.rb +0 -94
data/lib/spec_id/precision/prob.rb +0 -249
data/lib/spec_id/proph/pep_summary.rb +0 -104
data/lib/spec_id/proph/prot_summary.rb +0 -484
data/lib/spec_id/proph.rb +0 -4
data/lib/spec_id/protein_summary.rb +0 -489
data/lib/spec_id/sequest/params.rb +0 -316
data/lib/spec_id/sequest/pepxml.rb +0 -1458
data/lib/spec_id/sequest.rb +0 -33
data/lib/spec_id/sqt.rb +0 -349
data/lib/spec_id/srf.rb +0 -973
data/lib/spec_id.rb +0 -778
data/lib/spec_id_xml.rb +0 -99
data/lib/transmem/phobius.rb +0 -147
data/lib/transmem/toppred.rb +0 -368
data/lib/transmem.rb +0 -157
data/lib/validator/aa.rb +0 -48
data/lib/validator/aa_est.rb +0 -112
data/lib/validator/background.rb +0 -77
data/lib/validator/bias.rb +0 -95
data/lib/validator/cmdline.rb +0 -431
data/lib/validator/decoy.rb +0 -107
data/lib/validator/digestion_based.rb +0 -70
data/lib/validator/probability.rb +0 -51
data/lib/validator/prot_from_pep.rb +0 -234
data/lib/validator/q_value.rb +0 -32
data/lib/validator/transmem.rb +0 -272
data/lib/validator/true_pos.rb +0 -46
data/lib/validator.rb +0 -197
data/lib/xml.rb +0 -38
data/lib/xml_style_parser.rb +0 -119
data/lib/xmlparser_wrapper.rb +0 -19
data/release_notes.txt +0 -2
data/script/compile_and_plot_smriti_final.rb +0 -97
data/script/create_little_pepxml.rb +0 -61
data/script/degenerate_peptides.rb +0 -47
data/script/estimate_fpr_by_cysteine.rb +0 -226
data/script/extract_gradient_programs.rb +0 -56
data/script/find_cysteine_background.rb +0 -137
data/script/genuine_tps_and_probs.rb +0 -136
data/script/get_apex_values_rexml.rb +0 -44
data/script/histogram_probs.rb +0 -61
data/script/mascot_fix_pepxml.rb +0 -123
data/script/msvis.rb +0 -42
data/script/mzXML2timeIndex.rb +0 -25
data/script/peps_per_bin.rb +0 -67
data/script/prep_dir.rb +0 -121
data/script/simple_protein_digestion.rb +0 -27
data/script/smriti_final_analysis.rb +0 -103
data/script/sqt_to_meta.rb +0 -24
data/script/top_hit_per_scan.rb +0 -67
data/script/toppred_to_yaml.rb +0 -47
data/script/tpp_installer.rb +0 -249
data/specs/align_spec.rb +0 -79
data/specs/bin/bioworks_to_pepxml_spec.rb +0 -79
data/specs/bin/fasta_shaker_spec.rb +0 -259
data/specs/bin/filter_and_validate__multiple_vals_helper.yaml +0 -199
data/specs/bin/filter_and_validate_spec.rb +0 -180
data/specs/bin/ms_to_lmat_spec.rb +0 -34
data/specs/bin/prob_validate_spec.rb +0 -86
data/specs/bin/protein_summary_spec.rb +0 -14
data/specs/fasta_spec.rb +0 -354
data/specs/gi_spec.rb +0 -22
data/specs/load_bin_path.rb +0 -7
data/specs/merge_deep_spec.rb +0 -13
data/specs/ms/gradient_program_spec.rb +0 -77
data/specs/ms/msrun_spec.rb +0 -498
data/specs/ms/parser_spec.rb +0 -92
data/specs/ms/spectrum_spec.rb +0 -87
data/specs/pi_zero_spec.rb +0 -115
data/specs/qvalue_spec.rb +0 -39
data/specs/roc_spec.rb +0 -251
data/specs/rspec_autotest.rb +0 -149
data/specs/sample_enzyme_spec.rb +0 -126
data/specs/spec_helper.rb +0 -135
data/specs/spec_id/aa_freqs_spec.rb +0 -52
data/specs/spec_id/bioworks_spec.rb +0 -148
data/specs/spec_id/digestor_spec.rb +0 -75
data/specs/spec_id/precision/filter/cmdline_spec.rb +0 -20
data/specs/spec_id/precision/filter/output_spec.rb +0 -31
data/specs/spec_id/precision/filter_spec.rb +0 -246
data/specs/spec_id/precision/prob_spec.rb +0 -44
data/specs/spec_id/precision/prob_spec_helper.rb +0 -0
data/specs/spec_id/proph/pep_summary_spec.rb +0 -98
data/specs/spec_id/proph/prot_summary_spec.rb +0 -128
data/specs/spec_id/protein_summary_spec.rb +0 -189
data/specs/spec_id/sequest/params_spec.rb +0 -68
data/specs/spec_id/sequest/pepxml_spec.rb +0 -374
data/specs/spec_id/sequest_spec.rb +0 -38
data/specs/spec_id/sqt_spec.rb +0 -246
data/specs/spec_id/srf_spec.rb +0 -172
data/specs/spec_id/srf_spec_helper.rb +0 -139
data/specs/spec_id_helper.rb +0 -33
data/specs/spec_id_spec.rb +0 -366
data/specs/spec_id_xml_spec.rb +0 -33
data/specs/transmem/phobius_spec.rb +0 -425
data/specs/transmem/toppred_spec.rb +0 -298
data/specs/transmem_spec.rb +0 -60
data/specs/transmem_spec_shared.rb +0 -64
data/specs/validator/aa_est_spec.rb +0 -66
data/specs/validator/aa_spec.rb +0 -40
data/specs/validator/background_spec.rb +0 -67
data/specs/validator/bias_spec.rb +0 -122
data/specs/validator/decoy_spec.rb +0 -51
data/specs/validator/fasta_helper.rb +0 -26
data/specs/validator/prot_from_pep_spec.rb +0 -141
data/specs/validator/transmem_spec.rb +0 -146
data/specs/validator/true_pos_spec.rb +0 -58
data/specs/validator_helper.rb +0 -33
data/specs/xml_spec.rb +0 -12
data/test_files/000_pepxml18_small.xml +0 -206
data/test_files/020a.mzXML.timeIndex +0 -4710
data/test_files/4-03-03_mzXML/000.mzXML.timeIndex +0 -3973
data/test_files/4-03-03_mzXML/020.mzXML.timeIndex +0 -3872
data/test_files/4-03-03_small-prot.xml +0 -321
data/test_files/4-03-03_small.xml +0 -3876
data/test_files/7MIX_STD_110802_1.sequest_params_fragment.srf +0 -0
data/test_files/bioworks-3.3_10prots.xml +0 -5999
data/test_files/bioworks31.params +0 -77
data/test_files/bioworks32.params +0 -62
data/test_files/bioworks33.params +0 -63
data/test_files/bioworks_single_run_small.xml +0 -7237
data/test_files/bioworks_small.fasta +0 -212
data/test_files/bioworks_small.params +0 -63
data/test_files/bioworks_small.phobius +0 -109
data/test_files/bioworks_small.toppred.out +0 -2847
data/test_files/bioworks_small.xml +0 -5610
data/test_files/bioworks_with_INV_small.xml +0 -3753
data/test_files/bioworks_with_SHUFF_small.xml +0 -2503
data/test_files/corrupted_900.srf +0 -0
data/test_files/head_of_7MIX.srf +0 -0
data/test_files/interact-opd1_mods_small-prot.xml +0 -304
data/test_files/messups.fasta +0 -297
data/test_files/opd1/000.my_answer.100lines.xml +0 -101
data/test_files/opd1/000.tpp_1.2.3.first10.xml +0 -115
data/test_files/opd1/000.tpp_2.9.2.first10.xml +0 -126
data/test_files/opd1/000.v2.1.mzXML.timeIndex +0 -3748
data/test_files/opd1/000_020-prot.png +0 -0
data/test_files/opd1/000_020_3prots-prot.mod_initprob.xml +0 -62
data/test_files/opd1/000_020_3prots-prot.xml +0 -62
data/test_files/opd1/opd1_cat_inv_small-prot.xml +0 -139
data/test_files/opd1/sequest.3.1.params +0 -77
data/test_files/opd1/sequest.3.2.params +0 -62
data/test_files/opd1/twenty_scans.mzXML +0 -418
data/test_files/opd1/twenty_scans.v2.1.mzXML +0 -382
data/test_files/opd1/twenty_scans_answ.lmat +0 -0
data/test_files/opd1/twenty_scans_answ.lmata +0 -9
data/test_files/opd1_020_beginning.RAW +0 -0
data/test_files/opd1_2runs_2mods/data/020.mzData.xml +0 -683
data/test_files/opd1_2runs_2mods/data/020.readw.mzXML +0 -382
data/test_files/opd1_2runs_2mods/data/040.mzData.xml +0 -683
data/test_files/opd1_2runs_2mods/data/040.readw.mzXML +0 -382
data/test_files/opd1_2runs_2mods/data/README.txt +0 -6
data/test_files/opd1_2runs_2mods/interact-opd1_mods__small.xml +0 -753
data/test_files/orbitrap_mzData/000_cut.xml +0 -1920
data/test_files/pepproph_small.xml +0 -4691
data/test_files/phobius.small.noheader.txt +0 -50
data/test_files/phobius.small.small.txt +0 -53
data/test_files/s01_anC1_ld020mM.key.txt +0 -25
data/test_files/s01_anC1_ld020mM.meth +0 -0
data/test_files/small.fasta +0 -297
data/test_files/small.sqt +0 -87
data/test_files/smallraw.RAW +0 -0
data/test_files/tf_bioworks2excel.bioXML +0 -14340
data/test_files/tf_bioworks2excel.txt.actual +0 -1035
data/test_files/toppred.small.out +0 -416
data/test_files/toppred.xml.out +0 -318
data/test_files/validator_hits_separate/bias_bioworks_small_HS.fasta +0 -7
data/test_files/validator_hits_separate/bioworks_small_HS.xml +0 -5651
data/test_files/yeast_gly_small-prot.xml +0 -265
data/test_files/yeast_gly_small.1.0_1.0_1.0.parentTimes +0 -6
data/test_files/yeast_gly_small.xml +0 -3807
data/test_files/yeast_gly_small2.parentTimes +0 -6

data/lib/ms/parser/mzxml.rb DELETED Viewed

@@ -1,282 +0,0 @@
-require 'ms/msrun'
-require 'fileutils'
-module MS; end
-module MS::Parser::MzXML
-  Base_dir_for_parsers = 'ms/parser/mzxml'
-  # inherits XMLStyleParser and version
-  include MS::Parser
-  include XMLStyleParser
-  # warning: clobbers file unless a newfilename is provided!
-  # returns the output filename
-  # will fix any size file!
-  def self.fix_bad_scan_tags(filename, newfilename=nil)
-    out_io =
-      if newfilename
-        File.open(newfilename, 'w')
-      else
-        Tempfile.new(File.basename(filename))
-      end
-    File.open(filename) do |fh|
-      self.fix_bad_scan_tags_from_io(fh, out_io)
-    end
-    out_io.close
-    unless newfilename
-      FileUtils.mv out_io.path, filename
-    end
-  end
-  # this is a memory efficient method to fix bad scan tags
-  # prints cleaned up file to out_io
-  # no effort is made to rewind the io objects, the user must do this if they
-  # plan to continue using these objects!
-  def self.fix_bad_scan_tags_from_io(io, out_io)
-    regexp = /<\/scan>/
-    end_scan_line = false
-    io.each("\n") do |line|
-      if end_scan_line && line =~ regexp
-        # two end scan lines! # don't print to out_io
-        end_scan_line = true
-      elsif line =~ regexp
-        out_io.print(line)
-        end_scan_line = true
-      else
-        out_io.print(line)
-        end_scan_line = false
-      end
-    end
-  end
-  # returns a string with double </scan></scan> tags into single and missing
-  # </scan> tags after peaks added in
-  # we do this in windows style since these are generated off a windows
-  # machine only
-  #def self.fix_bad_scan_tags(string)
-  #  string.gsub(/<\/scan>\s+<\/scan>/m, '</scan>').gsub(/<\/peaks>\s+<scan/m, "</peaks>\r\n  </scan>\r\n  <scan")
-  #end
-  # returns true if it has the bad tag
-  def self.has_bad_scan_tag_from_string?(string)
-    if string.match(/<\/scan>\s+<\/scan>/m)
-      true
-    else
-      false
-    end
-  end
-  def self.has_bad_scan_tag?(filename)
-    File.open(filename) do |fh|
-      self.has_bad_scan_tag_from_io?(fh)
-    end
-  end
-  # very efficient algorithm to check for malformed xml typical of readw
-  # output. The extra closing scan tags come after the last ms/ms scan in a
-  # cycle rewinds the io after looking
-  def self.has_bad_scan_tag_from_io?(io)
-    seen_first_ms_level = false
-    seen_higher_ms_level = false
-    cur_ms_level = 0
-    found_double_end_tag = false
-    found_end_tag = false
-    io.each("\n") do |line|
-      if line =~ /<\/scan>/
-        if found_end_tag  # already found one!
-          found_double_end_tag = true
-          break
-        end
-        found_end_tag = true
-      else
-        found_end_tag = false
-      end
-      if line =~ /msLevel="(\d+)"/
-        cur_ms_level = $1.dup
-        if seen_first_ms_level && seen_higher_ms_level && cur_ms_level == '1'
-          break
-        end
-        if cur_ms_level == '1'
-          seen_first_ms_level = true
-        elsif cur_ms_level == '2'
-          seen_higher_ms_level = true
-        end
-      end
-    end
-    io.rewind
-    found_double_end_tag
-  end
-  # returns a specific parser MS::Parser::MzXML::#{ParserType}
-  # based on choose_parser from xml_style_parser
-  def self.new(parse_type=:msrun, version='1.0', opts={})
-    special_subclass =
-      if opts[:lazy] == :io
-      'LazyPeaks'
-      else ; nil
-      end
-    @version = version
-    @method = parse_type
-    XMLStyleParser.require_parse_files(Base_dir_for_parsers)
-    parser_class = XMLStyleParser.choose_parser(self, parse_type, special_subclass)
-    parser = parser_class.new(parse_type, version)
-  end
-  # Returns an array of scans indexed by scan number
-  # NOTE that the first scan (zero indexed) will likely be nil!
-  # accepts an optional parse_type = 'xmlparser' | 'rexml'
-  def scans_by_num(mzXML_file, parse_type=nil)
-    unless parse_type
-      parse_type = default_parser
-    end
-    scans = []
-    case parse_type
-    when 'xmlparser'
-      parser = MS::MzXML::XMLParser::TimeMzIntenIndexer.new
-      parser.parse(IO.read(mzXML_file))
-      scans = parser.scans_by_num
-    when 'rexml' # use REXML
-      # This is really too slow for files of this size
-      doc = REXML::Document.new File.new(mzXML_file)
-      doc.elements.each('msRun/scan') do |scan|
-        rt = scan.attributes['retentionTime']  ## like PT0.154000S"
-        level = scan.attributes['msLevel']
-        to_print = []
-        prec_mz = nil
-        prec_int = nil
-        if level.to_i != 1
-          scan.elements.each("precursorMz") do |prec|
-            prec_mz = prec.text.to_f
-            prec_int = prec.attributes["precursorIntensity"].to_f
-          end
-        end
-        # remove the leading PT and trailing S on the retention time!
-        rt = rt[2...-1]
-        num = scan.attributes['num'].to_i
-        scans[num] = MS::Scan.new(num, scan.attributes['msLevel'].to_i, rt.to_f, prec_mz, prec_int)
-      end #doc.elements
-    else
-      throw ArgumentError, "invalid parse type: #{parse_type}"
-    end
-    ## update the scans for parents
-    MS::Scan.add_parent_scan(scans)
-    scans
-  end
-  # Returns a Hash indexed by filename (with no extension) for a given path
-  # extension = glob (string) or regex
-  # The basename is given as: file.split('.').first
-  def precursor_mz_by_scan_for_path(path, extension, parse_type=nil)
-    hash = {}
-    Dir.chdir path do
-      files = []
-      if extension.class == String
-        files = Dir[extension]
-      elsif extension.class == Regexp
-        files = Dir.entries(".").find_all do |dir|
-          dir =~ extension
-        end
-      else
-        puts "extension: #{extension} not a String or Regexp!"
-      end
-      files.each do |file|
-        base = file.split('.').first
-        hash[base] = precursor_mz_by_scan(file, parse_type)
-      end
-    end
-    hash
-  end
-  # Returns hash where hash[scan_num] = [precursorMz, precursorIntensity]
-  # Parent scans are not hashed
-  # Keys and values are both strings
-  def precursor_mz_and_inten_by_scan(file)
-    # in progress
-  end
-  # Returns array where array[scan_num] = precursorMz
-  # precursorMz are Floats
-  # Array index likely starts at 1!
-  def precursor_mz_by_scan_num(file)
-    ## THIS SHOULD BE CREATED IN specific XML LIBS
-  end
-  # Returns a hash of basic info on an mzXML run:
-  #   *mzXML_elemt*   *hash keys (symbols)*
-  #   scanCount       scan_count
-  #   startTime       start_time
-  #   endTime         end_time
-  #   startMz         start_mz
-  #   endMz           end_mz
-  def basic_info(mzxml_file)
-    puts "parsing: #{mzxml_file} #{File.exist?(mzxml_file)}" if $VERBOSE
-    hash = {}
-    scan_count_tmp = []
-    (1..5).to_a.each do |n| scan_count_tmp[n] = 0 end
-    @fh = File.open(mzxml_file)
-    @line = ""
-    scan_count_tmp[0] = _el("scanCount").to_i
-    hash[:start_time] = _el("startTime").sub(/^PT/, "").sub(/S$/,"").to_f
-    hash[:end_time] = _el("endTime").sub(/^PT/, "").sub(/S$/,"").to_f
-    hash[:ms_level] = _el("msLevel").to_i
-    scan_count_tmp[1] = 1
-    if hash[:ms_level] == 1
-      hash[:start_mz] = _el("startMz").to_f
-      hash[:end_mz] = _el("endMz").to_f
-    end
-    while !@fh.eof?
-      @line = @fh.readline
-      ms_level = _el("msLevel")
-      if ms_level
-        scan_count_tmp[ms_level.to_i] += 1
-      else
-        break
-      end
-    end
-    scan_count = []
-    scan_count_tmp.each do |cnt|
-      if cnt != 0
-        scan_count.push cnt
-      else
-        break
-      end
-    end
-    hash[:scan_count] = scan_count
-    @fh.close
-    hash
-  end
-  # returns [start_mz, end_mz] of the first full scan (ms_level == 1)
-  def start_and_end_mz(mzxml_file)
-    @fh = File.open(mzxml_file)
-    ms_level = 0
-    @line = ""
-    while ms_level != 1
-      ms_level = _el("msLevel").to_i
-    end
-    start_mz = _el("startMz").to_f
-    end_mz = _el("endMz").to_f
-    @fh.close
-    [start_mz, end_mz]
-  end
-  def _el(name)
-    re = /#{name}="(.*)"/
-    while @line !~ re && !@fh.eof?
-      @line = @fh.readline
-    end
-    if $1
-      return $1.dup
-    else
-      return nil
-    end
-  end
-end

data/lib/ms/parser.rb DELETED Viewed

@@ -1,108 +0,0 @@
-require 'xml_style_parser'
-module MS; end
-module MS::Parser
-  # inherits attr_accessor :method, :default_parser, and parse (which should
-  # be overridden)
-  include XMLStyleParser
-  Mzxml_regexp = /http:\/\/sashimi.sourceforge.net\/schema(_revision)?\/([\w\d_\.]+)/o
-  # 'http://sashimi.sourceforge.net/schema/MsXML.xsd' # version 1
-  # 'http://sashimi.sourceforge.net/schema_revision/mzXML_X.X' # others
-  Mzdata_regexp = /<mzData.*version="([\d\.]+)"/m
-  attr_accessor :version
-  ############################################
-  # POINTERS (to create META MAGIC)
-  ############################################
-  @@filetypes_to_upcase = {
-    :mzxml => 'MzXML',
-    :mzdata => 'MzData',
-    :mzml => 'MzML',
-    :raw => 'Raw',
-  }
-  @@filetypes_to_require = {}
-  @@filetypes_to_constant = {}
-  abbrevs = Dir.chdir(File.dirname(__FILE__) + "/parser") do
-    Dir["*.rb"].map {|f| f.sub(/\.rb$/,'') }
-  end
-  abbrevs.each do |abbr|
-    abb = abbr.to_sym
-    req = ['ms', 'parser', abbr].join("/")
-    @@filetypes_to_require[abb] = req
-    @@filetypes_to_constant[abb] = ['MS', 'Parser', @@filetypes_to_upcase[abb]].join("::")
-  end
-  ############################################
-  # END POINTERS
-  ############################################
-  # finds the filetype of a file (expects to be at the beginning) and rewinds
-  # the filehandle to the beginning returns [filetype, version].  nil if
-  # filetype and version could not be determined
-  def self.filetype_and_version(fh_or_filename)
-    if fh_or_filename.is_a? IO
-      fh = fh_or_filename
-      found = nil
-      # Test for RAW file:
-      header = fh.read(18).unpack('@2axaxaxaxaxaxaxa').join
-      if header == 'Finnigan'
-        return [:raw, nil]
-      end
-      fh.rewind
-      while (line = fh.gets)
-        found =
-          case line
-          when Mzxml_regexp
-            mtch = $2.dup
-            case mtch
-            when /mzXML_([\d\.]+)/
-              [:mzxml, $1.dup]
-            when /MsXML/
-              [:mzxml, '1.0']
-            else
-              abort "Cannot determine mzXML version!"
-            end
-          when Mzdata_regexp
-            [:mzdata, $1.dup]
-          end
-        if found
-          break
-        end
-      end
-      fh.rewind
-      found
-    else
-      File.open(fh_or_filename) do |fh|
-        filetype_and_version(fh)
-      end
-    end
-  end
-  # filetype_version is an example file to parse, or it is an array: [type, version].
-  # parse_type is the information to be gleaned (as symbol).
-  def self.new(filetype_version, parse_type, opts={})
-    unless filetype_version.is_a? Array
-      filetype_version = filetype_and_version(filetype_version)
-    end
-    require_and_create_parser(filetype_version, parse_type, opts)
-  end
-  private
-  # returns a working parser.
-  def self.require_and_create_parser(filetype_version, parse_type, opts)
-    (filetype, version) = filetype_version
-    #puts "FT: #{filetype} VERSION: #{version}"
-    reply = require @@filetypes_to_require[filetype]
-    @@filetypes_to_require[filetype]
-    parser_class = MS::Parser.const_get(@@filetypes_to_upcase[filetype])
-    parser_class.new(parse_type, version, opts)
-  end
-end

data/lib/ms/precursor.rb DELETED Viewed

@@ -1,25 +0,0 @@
-require 'arrayclass'
-module MS; end
-# charge_states are the possible charge states of the precursor
-# parent references a scan
-#                                 0  1         2      3
-MS::Precursor = Arrayclass.new(%w(mz intensity parent charge_states))
-class MS::Precursor
-  undef :intensity
-  def intensity
-    if self[1].nil?
-      if s = self[2].spectrum
-        self[1] = s.intensity_at_mz(self[0])
-      else
-        nil   # if we didn't read in the spectra, we can't get this value!
-      end
-    end
-    self[1]
-  end
-end

data/lib/ms/scan.rb DELETED Viewed

@@ -1,81 +0,0 @@
-require 'arrayclass'
-require 'ms/precursor'
-module MS ; end
-#                               0   1        2    3        4      5          6
-MS::Scan = Arrayclass.new( %w(num ms_level time start_mz end_mz precursor spectrum) )
-# time in seconds
-# everything else in float/int
-class MS::Scan
-  #@@order = %w(num ms_level time start_mz end_mz prec_mz prec_inten parent spectrum)
-  #attr_accessor :num, :ms_level, :time, :start_mz, :end_mz, :prec_mz, :prec_inten, :parent, :spectrum
-  #def initialize(ar=nil)
-  # @@order.zip(ar) do |x,v|
-  #   send((x+'=').to_sym, v)
-  # end
-  #end
-  def to_s
-    "<Scan num=#{num} ms_level=#{ms_level} time=#{time}>"
-  end
-  undef_method :inspect
-  def inspect
-    atts = %w(num ms_level time start_mz end_mz)
-    display = atts.map do |att|
-      if val = send(att.to_sym)
-        "#{att}=#{val}"
-      else
-        nil
-      end
-    end
-    display.compact!
-    spec_display =
-      if spectrum
-        spectrum.mzs.size
-      else
-        'nil'
-      end
-    "<MS::Scan:#{__id__} " + display.join(", ") + " precursor=#{precursor.inspect}" + " spectrum(size)=#{spec_display}" + " >"
-  end
-  # returns the string (space delimited): "ms_level num time [prec_mz prec_inten]"
-  def to_index_file_string
-    arr = [ms_level, num, time]
-    if precursor then arr << precursor.mz end
-    if x = precursor.intensity then arr << x end
-    arr.join(" ")
-  end
-  # adds the attribute parent to each scan with a parent
-  # (level 1 = no parent; level 2 = prev level 1, etc.
-  def self.add_parent_scan(scans)
-    prev_scan = nil
-    parent_stack = [nil]
-    ## we want to set the level to be the first mslevel we come to
-    prev_level = 1
-    scans.each do |scan|
-      if scan then prev_level = scan.ms_level; break; end
-    end
-    scans.each do |scan|
-      next unless scan  ## the first one is nil, (others?)
-      level = scan.ms_level
-      if prev_level < level
-        parent_stack.unshift prev_scan
-      end
-      if prev_level > level
-        (prev_level - level).times do parent_stack.shift end
-      end
-      scan.parent = parent_stack.first
-      prev_level = level
-      prev_scan = scan
-    end
-  end
-end

data/lib/mspire.rb DELETED Viewed

@@ -1,4 +0,0 @@
-module Mspire
-  Version = '0.4.9'
-end