RubyGems - mspire - Versions diffs - 0.2.4 → 0.3.0 - Mend

mspire 0.2.4 → 0.3.0

Files changed (233) hide show

data/INSTALL +1 -0
data/README +25 -0
data/Rakefile +129 -40
data/bin/{find_aa_freq.rb → aafreqs.rb} +2 -2
data/bin/bioworks_to_pepxml.rb +1 -0
data/bin/fasta_shaker.rb +1 -96
data/bin/filter_and_validate.rb +5 -0
data/bin/{mzxml_to_lmat.rb → ms_to_lmat.rb} +8 -7
data/bin/prob_validate.rb +6 -0
data/bin/raw_to_mzXML.rb +2 -2
data/bin/srf_group.rb +1 -0
data/bin/srf_to_sqt.rb +40 -0
data/changelog.txt +68 -0
data/lib/align/chams.rb +6 -6
data/lib/align.rb +4 -3
data/lib/bsearch.rb +120 -0
data/lib/fasta.rb +318 -86
data/lib/group_by.rb +10 -0
data/lib/index_by.rb +11 -0
data/lib/merge_deep.rb +21 -0
data/lib/{spec → ms/converter}/mzxml.rb +77 -109
data/lib/ms/gradient_program.rb +171 -0
data/lib/ms/msrun.rb +209 -0
data/lib/{spec/msrun.rb → ms/msrun_index.rb} +7 -40
data/lib/ms/parser/mzdata/axml.rb +12 -0
data/lib/ms/parser/mzdata/dom.rb +160 -0
data/lib/ms/parser/mzdata/libxml.rb +7 -0
data/lib/ms/parser/mzdata.rb +25 -0
data/lib/ms/parser/mzxml/axml.rb +11 -0
data/lib/ms/parser/mzxml/dom.rb +159 -0
data/lib/ms/parser/mzxml/hpricot.rb +253 -0
data/lib/ms/parser/mzxml/libxml.rb +15 -0
data/lib/ms/parser/mzxml/regexp.rb +122 -0
data/lib/ms/parser/mzxml/rexml.rb +72 -0
data/lib/ms/parser/mzxml/xmlparser.rb +248 -0
data/lib/ms/parser/mzxml.rb +175 -0
data/lib/ms/parser.rb +108 -0
data/lib/ms/precursor.rb +10 -0
data/lib/ms/scan.rb +81 -0
data/lib/ms/spectrum.rb +193 -0
data/lib/ms.rb +10 -0
data/lib/mspire.rb +4 -0
data/lib/roc.rb +61 -1
data/lib/sample_enzyme.rb +31 -8
data/lib/scan_i.rb +21 -0
data/lib/spec_id/aa_freqs.rb +7 -3
data/lib/spec_id/bioworks.rb +20 -14
data/lib/spec_id/digestor.rb +139 -0
data/lib/spec_id/mass.rb +116 -0
data/lib/spec_id/parser/proph.rb +236 -0
data/lib/spec_id/precision/filter/cmdline.rb +209 -0
data/lib/spec_id/precision/filter/interactive.rb +134 -0
data/lib/spec_id/precision/filter/output.rb +147 -0
data/lib/spec_id/precision/filter.rb +623 -0
data/lib/spec_id/precision/output.rb +60 -0
data/lib/spec_id/precision/prob/cmdline.rb +139 -0
data/lib/spec_id/precision/prob/output.rb +88 -0
data/lib/spec_id/precision/prob.rb +171 -0
data/lib/spec_id/proph/pep_summary.rb +92 -0
data/lib/spec_id/proph/prot_summary.rb +484 -0
data/lib/spec_id/proph.rb +2 -466
data/lib/spec_id/protein_summary.rb +2 -2
data/lib/spec_id/sequest/params.rb +316 -0
data/lib/spec_id/sequest/pepxml.rb +1513 -0
data/lib/spec_id/sequest.rb +2 -1672
data/lib/spec_id/srf.rb +445 -177
data/lib/spec_id.rb +183 -95
data/lib/spec_id_xml.rb +8 -10
data/lib/transmem/phobius.rb +147 -0
data/lib/transmem/toppred.rb +368 -0
data/lib/transmem.rb +157 -0
data/lib/validator/aa.rb +135 -0
data/lib/validator/background.rb +73 -0
data/lib/validator/bias.rb +95 -0
data/lib/validator/cmdline.rb +260 -0
data/lib/validator/decoy.rb +94 -0
data/lib/validator/digestion_based.rb +69 -0
data/lib/validator/probability.rb +48 -0
data/lib/validator/prot_from_pep.rb +234 -0
data/lib/validator/transmem.rb +272 -0
data/lib/validator/true_pos.rb +46 -0
data/lib/validator.rb +214 -0
data/lib/xml.rb +38 -0
data/lib/xml_style_parser.rb +105 -0
data/lib/xmlparser_wrapper.rb +19 -0
data/script/compile_and_plot_smriti_final.rb +97 -0
data/script/extract_gradient_programs.rb +56 -0
data/script/get_apex_values_rexml.rb +44 -0
data/script/mzXML2timeIndex.rb +1 -1
data/script/smriti_final_analysis.rb +103 -0
data/script/toppred_to_yaml.rb +47 -0
data/script/tpp_installer.rb +1 -1
data/{test/tc_align.rb → specs/align_spec.rb} +21 -27
data/{test/tc_bioworks_to_pepxml.rb → specs/bin/bioworks_to_pepxml_spec.rb} +25 -41
data/specs/bin/fasta_shaker_spec.rb +259 -0
data/specs/bin/filter_and_validate__multiple_vals_helper.yaml +202 -0
data/specs/bin/filter_and_validate_spec.rb +124 -0
data/specs/bin/ms_to_lmat_spec.rb +34 -0
data/specs/bin/prob_validate_spec.rb +62 -0
data/specs/bin/protein_summary_spec.rb +10 -0
data/{test/tc_fasta.rb → specs/fasta_spec.rb} +354 -310
data/specs/gi_spec.rb +22 -0
data/specs/load_bin_path.rb +7 -0
data/specs/merge_deep_spec.rb +13 -0
data/specs/ms/gradient_program_spec.rb +77 -0
data/specs/ms/msrun_spec.rb +455 -0
data/specs/ms/parser_spec.rb +92 -0
data/specs/ms/spectrum_spec.rb +89 -0
data/specs/roc_spec.rb +251 -0
data/specs/rspec_autotest.rb +149 -0
data/specs/sample_enzyme_spec.rb +41 -0
data/specs/spec_helper.rb +133 -0
data/specs/spec_id/aa_freqs_spec.rb +52 -0
data/{test/tc_bioworks.rb → specs/spec_id/bioworks_spec.rb} +56 -71
data/specs/spec_id/digestor_spec.rb +75 -0
data/specs/spec_id/precision/filter/cmdline_spec.rb +20 -0
data/specs/spec_id/precision/filter/output_spec.rb +31 -0
data/specs/spec_id/precision/filter_spec.rb +243 -0
data/specs/spec_id/precision/prob_spec.rb +111 -0
data/specs/spec_id/precision/prob_spec_helper.rb +0 -0
data/specs/spec_id/proph/pep_summary_spec.rb +143 -0
data/{test/tc_proph.rb → specs/spec_id/proph/prot_summary_spec.rb} +52 -32
data/{test/tc_protein_summary.rb → specs/spec_id/protein_summary_spec.rb} +85 -0
data/specs/spec_id/sequest/params_spec.rb +68 -0
data/specs/spec_id/sequest/pepxml_spec.rb +452 -0
data/specs/spec_id/sqt_spec.rb +138 -0
data/specs/spec_id/srf_spec.rb +209 -0
data/specs/spec_id/srf_spec_helper.rb +302 -0
data/specs/spec_id_helper.rb +33 -0
data/specs/spec_id_spec.rb +361 -0
data/specs/spec_id_xml_spec.rb +33 -0
data/specs/transmem/phobius_spec.rb +423 -0
data/specs/transmem/toppred_spec.rb +297 -0
data/specs/transmem_spec.rb +60 -0
data/specs/transmem_spec_shared.rb +64 -0
data/specs/validator/aa_spec.rb +107 -0
data/specs/validator/background_spec.rb +51 -0
data/specs/validator/bias_spec.rb +146 -0
data/specs/validator/decoy_spec.rb +51 -0
data/specs/validator/fasta_helper.rb +26 -0
data/specs/validator/prot_from_pep_spec.rb +141 -0
data/specs/validator/transmem_spec.rb +145 -0
data/specs/validator/true_pos_spec.rb +58 -0
data/specs/validator_helper.rb +33 -0
data/specs/xml_spec.rb +12 -0
data/test_files/000_pepxml18_small.xml +206 -0
data/test_files/020a.mzXML.timeIndex +4710 -0
data/test_files/4-03-03_mzXML/000.mzXML.timeIndex +3973 -0
data/test_files/4-03-03_mzXML/020.mzXML.timeIndex +3872 -0
data/test_files/4-03-03_small-prot.xml +321 -0
data/test_files/4-03-03_small.xml +3876 -0
data/test_files/7MIX_STD_110802_1.sequest_params_fragment.srf +0 -0
data/test_files/bioworks-3.3_10prots.xml +5999 -0
data/test_files/bioworks31.params +77 -0
data/test_files/bioworks32.params +62 -0
data/test_files/bioworks33.params +63 -0
data/test_files/bioworks_single_run_small.xml +7237 -0
data/test_files/bioworks_small.fasta +212 -0
data/test_files/bioworks_small.params +63 -0
data/test_files/bioworks_small.phobius +109 -0
data/test_files/bioworks_small.toppred.out +2847 -0
data/test_files/bioworks_small.xml +5610 -0
data/test_files/bioworks_with_INV_small.xml +3753 -0
data/test_files/bioworks_with_SHUFF_small.xml +2503 -0
data/test_files/corrupted_900.srf +0 -0
data/test_files/head_of_7MIX.srf +0 -0
data/test_files/interact-opd1_mods_small-prot.xml +304 -0
data/test_files/messups.fasta +297 -0
data/test_files/opd1/000.my_answer.100lines.xml +101 -0
data/test_files/opd1/000.tpp_1.2.3.first10.xml +115 -0
data/test_files/opd1/000.tpp_2.9.2.first10.xml +126 -0
data/test_files/opd1/000.v2.1.mzXML.timeIndex +3748 -0
data/test_files/opd1/000_020-prot.png +0 -0
data/test_files/opd1/000_020_3prots-prot.mod_initprob.xml +62 -0
data/test_files/opd1/000_020_3prots-prot.xml +62 -0
data/test_files/opd1/opd1_cat_inv_small-prot.xml +139 -0
data/test_files/opd1/sequest.3.1.params +77 -0
data/test_files/opd1/sequest.3.2.params +62 -0
data/test_files/opd1/twenty_scans.mzXML +418 -0
data/test_files/opd1/twenty_scans.v2.1.mzXML +382 -0
data/test_files/opd1/twenty_scans_answ.lmat +0 -0
data/test_files/opd1/twenty_scans_answ.lmata +9 -0
data/test_files/opd1_020_beginning.RAW +0 -0
data/test_files/opd1_2runs_2mods/interact-opd1_mods__small.xml +753 -0
data/test_files/orbitrap_mzData/000_cut.xml +1920 -0
data/test_files/pepproph_small.xml +4691 -0
data/test_files/phobius.small.noheader.txt +50 -0
data/test_files/phobius.small.small.txt +53 -0
data/test_files/s01_anC1_ld020mM.key.txt +25 -0
data/test_files/s01_anC1_ld020mM.meth +0 -0
data/test_files/small.fasta +297 -0
data/test_files/smallraw.RAW +0 -0
data/test_files/tf_bioworks2excel.bioXML +14340 -0
data/test_files/tf_bioworks2excel.txt.actual +1035 -0
data/test_files/toppred.small.out +416 -0
data/test_files/toppred.xml.out +318 -0
data/test_files/validator_hits_separate/bias_bioworks_small_HS.fasta +7 -0
data/test_files/validator_hits_separate/bioworks_small_HS.xml +5651 -0
data/test_files/yeast_gly_small-prot.xml +265 -0
data/test_files/yeast_gly_small.1.0_1.0_1.0.parentTimes +6 -0
data/test_files/yeast_gly_small.xml +3807 -0
data/test_files/yeast_gly_small2.parentTimes +6 -0
metadata +273 -57
data/bin/filter.rb +0 -6
data/bin/precision.rb +0 -5
data/lib/spec/mzdata/parser.rb +0 -108
data/lib/spec/mzdata.rb +0 -48
data/lib/spec/mzxml/parser.rb +0 -449
data/lib/spec/scan.rb +0 -55
data/lib/spec_id/filter.rb +0 -797
data/lib/spec_id/precision.rb +0 -421
data/lib/toppred.rb +0 -18
data/script/filter-peps.rb +0 -164
data/test/tc_aa_freqs.rb +0 -59
data/test/tc_fasta_shaker.rb +0 -149
data/test/tc_filter.rb +0 -203
data/test/tc_filter_peps.rb +0 -46
data/test/tc_gi.rb +0 -17
data/test/tc_id_class_anal.rb +0 -70
data/test/tc_id_precision.rb +0 -89
data/test/tc_msrun.rb +0 -88
data/test/tc_mzxml.rb +0 -88
data/test/tc_mzxml_to_lmat.rb +0 -36
data/test/tc_peptide_parent_times.rb +0 -27
data/test/tc_precision.rb +0 -60
data/test/tc_roc.rb +0 -166
data/test/tc_sample_enzyme.rb +0 -32
data/test/tc_scan.rb +0 -26
data/test/tc_sequest.rb +0 -336
data/test/tc_spec.rb +0 -78
data/test/tc_spec_id.rb +0 -201
data/test/tc_spec_id_xml.rb +0 -36
data/test/tc_srf.rb +0 -262

data/lib/spec/mzxml/parser.rb DELETED Viewed

@@ -1,449 +0,0 @@
-require 'spec/msrun'
-begin
-  require 'xmlparser'
-rescue LoadError
-  puts "*******************************************************************"
-  puts "WARNING: 'xmlparser' library not installed:"
-  puts "Defaulting to REXML (slower, but guaranteed to parse correct xml)"
-  puts "Use :parse_type => 'regex' for faster (but not guaranteed) parsing"
-  puts "Or install 'xmlparser'!"
-  puts "*******************************************************************"
-end
-begin
-  $XMLParserClass = XMLParser
-rescue NameError
-  $XMLParserClass = Object
-end
-require 'spec/mzxml'
-require 'rexml/document'
-require 'rexml/streamlistener'
-module Spec::MzXML::REXMLStreamListener; end
-module Spec::MzXML::PrecMzByNum; end
-# for REXML
-class Spec::MzXML::REXMLStreamListener::PrecMzByNum
-  include REXML::StreamListener
-  attr_accessor :prec_mz
-  def initialize
-    @prec_mz = []
-    @scan_num = nil
-    @get_data = false
-  end
-  def tag_start(name,attrs)
-    if name == "scan"
-      @scan_num = attrs["num"].to_i
-    elsif name == "precursorMz"
-      @get_data = true
-    end
-  end
-  def tag_end(name)
-    if name == "precursorMz"
-      @get_data = false
-    end
-  end
-  def text(txt)
-    if @get_data
-      @prec_mz[@scan_num] = txt
-    end
-  end
-end
-module Spec::MzXML::XMLParser; end
-class Spec::MzXML::XMLParser::PrecMzByNum < $XMLParserClass
-  @@scan_num = nil
-  @@get_data = false
-  attr_accessor :prec_mz
-  def initialize
-    @prec_mz = []
-  end
-  def startElement(name,attrs)
-    if name == "scan"
-      @@scan_num = attrs["num"].to_i
-    elsif name == "precursorMz"
-      @prec_mz[@@scan_num] = ""
-      @@get_data = true
-    end
-  end
-  def endElement(name)
-    if name == "precursorMz"
-      @@get_data = false
-    end
-  end
-  def character(data)
-    if @@get_data
-      @prec_mz[@@scan_num] << data
-    end
-  end
-end
-# Returns parallel arrays (times, spectra) where each spectra is an array
-# containing alternating mz and intensity (MS1 scans only)
-# and times are strings with the time in seconds
-class Spec::MzXML::XMLParser::TimesAndSpectra < $XMLParserClass
-  include Spec::MzXML
-  @@get_data = false
-  @@get_peaks = false
-  @@precision = 32 # @TODO: set dynamic
-  attr_accessor :times, :spectra
-  def times_and_spectra
-    [@times, @spectra]
-  end
-  def initialize(ms_level=1)
-    @ms_level = "#{ms_level}"
-    @times = []
-    @spectra = []
-  end
-  def startElement(name,attrs)
-    if name == "scan" && attrs["msLevel"] == @ms_level
-      @times << attrs["retentionTime"][2...-1]  # strip PT and S: "PTx.xxxxS"
-      @@get_peaks = true
-    elsif name == "peaks" && @@get_peaks
-      @@get_data = true
-      @data = ""
-    end
-  end
-  def character(data)
-    if @@get_data
-      @data << data
-    end
-  end
-  def endElement(name)
-    if name == "peaks" && @@get_peaks
-      @spectra << base64_peaks_to_array(@data, @@precision)
-      @@get_data = false
-      @@get_peaks = false
-    end
-  end
-end
-class Spec::MzXML::Regexp
-  @@scan_re = /<scan.*?num="(\d+)"(.*?)<\/scan>/mo
-  def self.precursor_mz_and_intensity_by_scan(file)
-    prec_re = /msLevel="2".*?<precursorMz precursorIntensity="([\d\.]+)".*?>([\d\.]+)<\/precursorMz>/mo
-    self.by_scan_num(file, prec_re) {|match_obj| match_obj.captures.reverse}
-  end
-  # (array will likely start at 1!)
-  def self.by_scan_num(file, regex)
-    arr = []
-    File.open(file) do |fh|
-      string = fh.read
-      matches = string.scan(@@scan_re)
-      matches.each do |matched|
-        if inner_match = regex.match(matched[1])
-          index = matched[0].to_i
-          arr[index] = yield(inner_match)
-        end
-      end
-    end
-    arr
-  end
-  # Returns array where array[scan_num] = precursorMz
-  # Parent scans are not arrayed
-  # Values are strings.  Array index likely starts at 1!
-  # @TODO: replace the use of a yield block
-  def self.precursor_mz_by_scan(file)
-    prec_re = /msLevel="2".*?<precursorMz.*?>([\d\.]+)<\/precursorMz>/mo
-    self.by_scan_num(file, prec_re) {|match_obj| match_obj.captures[0]}
-  end
-end
-class Spec::MzXML::Parser
-  def default_parser
-    xmlparser = false
-    $".each do |lib|
-      if lib =~ /xmlparser/
-        xmlparser = true
-      end
-    end
-    if xmlparser
-      return "xmlparser"
-    else
-      return "rexml"
-    end
-  end
-  def initialize(file=nil, parse_type=:parse, *args)
-    if file
-      send(parse_type, file, *args)
-    end
-  end
-  # Parse into a complete object structure (REXML??)
-  def parse(file)
-    # @TODO: write complete parser
-    puts "need to write this guy!!!!"
-    exit
-  end
-  # returns: [times_arr, [m/z,inten,m/z,inten...]]
-  # where times are time strings (in seconds)
-  def times_and_spectra(file)
-    parser = Spec::MzXML::XMLParser::TimesAndSpectra.new
-    parser.parse(IO.read(file))
-    parser.times_and_spectra
-  end
-  # Returns an array of scans indexed by scan number
-  # NOTE that the first scan (zero indexed) will likely be nil!
-  # accepts an optional parse_type = 'xmlparser' | 'rexml'
-  def scans_by_num(mzXML_file, parse_type=nil)
-    unless parse_type
-      parse_type = default_parser
-    end
-    scans = []
-    case parse_type
-    when 'xmlparser'
-      parser = Spec::MzXML::XMLParser::TimeMzIntenIndexer.new
-      parser.parse(IO.read(mzXML_file))
-      scans = parser.scans_by_num
-    when 'rexml' # use REXML
-      # This is really too slow for files of this size
-      doc = REXML::Document.new File.new(mzXML_file)
-      doc.elements.each('msRun/scan') do |scan|
-        rt = scan.attributes['retentionTime']  ## like PT0.154000S"
-        level = scan.attributes['msLevel']
-        to_print = []
-        prec_mz = nil
-        prec_int = nil
-        if level.to_i != 1
-          scan.elements.each("precursorMz") do |prec|
-            prec_mz = prec.text.to_f
-            prec_int = prec.attributes["precursorIntensity"].to_f
-          end
-        end
-        # remove the leading PT and trailing S on the retention time!
-        rt = rt[2...-1]
-        num = scan.attributes['num'].to_i
-        scans[num] = Spec::Scan.new(num, scan.attributes['msLevel'].to_i, rt.to_f, prec_mz, prec_int)
-      end #doc.elements
-    else
-      throw ArgumentError, "invalid parse type: #{parse_type}"
-    end
-    ## update the scans for parents
-    Spec::Scan.add_parent_scan(scans)
-    scans
-  end
-  # Returns a Hash indexed by filename (with no extension) for a given path
-  # extension = glob (string) or regex
-  # The basename is given as: file.split('.').first
-  def precursor_mz_by_scan_for_path(path, extension, parse_type=nil)
-    hash = {}
-    Dir.chdir path do
-      files = []
-      if extension.class == String
-        files = Dir[extension]
-      elsif extension.class == Regexp
-        files = Dir.entries(".").find_all do |dir|
-          dir =~ extension
-        end
-      else
-        puts "extension: #{extension} not a String or Regexp!"
-      end
-      files.each do |file|
-        base = file.split('.').first
-        hash[base] = precursor_mz_by_scan(file, parse_type)
-      end
-    end
-    hash
-  end
-  # Returns hash where hash[scan_num] = [precursorMz, precursorIntensity]
-  # Parent scans are not hashed
-  # Keys and values are both strings
-  def precursor_mz_and_inten_by_scan(file)
-    # in progress
-  end
-  def get_prec_mz_by_scan_for_time_index(file)
-    index = Spec::MSRunIndex.new(file)
-    prec_mz_by_scan = index.scans_by_num.collect do |scan|
-      if scan ; scan.prec_mz
-      else ; nil
-      end
-    end
-    prec_mz_by_scan
-  end
-  # Returns array where array[scan_num] = precursorMz
-  # Parent scans are not arrayed
-  # Values are strings.  Array index likely starts at 1!
-  # parse_type = "regex" | "rexml" | "xmlparser"
-  # also takes a MSRunIndex file (terminates with '.timeIndex')
-  # also takes .RAW or .raw files and converts them to mzXML using
-  # Spec::MzXML::MZXML_CONVERTER
-  # also takes a file without an extension, in which case tests to see if the
-  # index file exists, then the .mzXML file, then .RAW/.raw (and converts)
-  def precursor_mz_by_scan(file, parse_type=nil)
-    # If given a time index file:
-    if File.exist?(file + '.timeIndex')
-      return get_prec_mz_by_scan_for_time_index(file + '.timeIndex')
-    elsif File.exist?(file + '.mzXML.timeIndex')
-      return get_prec_mz_by_scan_for_time_index(file + '.mzXML.timeIndex')
-    elsif file =~ /\.timeIndex$/
-      return get_prec_mz_by_scan_for_time_index(file)
-    end
-    file = Spec::MzXML.file_to_mzxml(file)
-    unless parse_type then parse_type = default_parser end
-    case parse_type
-    when "xmlparser"
-      ##XMLParser:
-      parser = Spec::MzXML::XMLParser::PrecMzByNum.new
-      File.open(file) do |fh|
-        parser.parse(fh.read)
-      end
-      parser.prec_mz
-    when "regex"
-      Spec::MzXML::Regexp.precursor_mz_by_scan(file)
-    when "rexml"
-      listener = Spec::MzXML::REXMLStreamListener::PrecMzByNum.new
-      REXML::Document.parse_stream(File.new(file), listener)
-      listener.prec_mz
-    else
-      puts "Don't recognize parse_type: #{parse_type}"
-    end
-  end
-  # Returns a hash of basic info on an mzXML run:
-  #   *mzXML_elemt*   *hash keys (symbols)*
-  #   scanCount       scan_count
-  #   startTime       start_time
-  #   endTime         end_time
-  #   startMz         start_mz
-  #   endMz           end_mz
-  def basic_info(mzxml_file)
-    puts "parsing: #{mzxml_file} #{File.exist?(mzxml_file)}" if $VERBOSE
-    hash = {}
-    scan_count_tmp = []
-    (1..5).to_a.each do |n| scan_count_tmp[n] = 0 end
-    @fh = File.open(mzxml_file)
-    @line = ""
-    scan_count_tmp[0] = _el("scanCount").to_i
-    hash[:start_time] = _el("startTime").sub(/^PT/, "").sub(/S$/,"").to_f
-    hash[:end_time] = _el("endTime").sub(/^PT/, "").sub(/S$/,"").to_f
-    hash[:ms_level] = _el("msLevel").to_i
-    scan_count_tmp[1] = 1
-    if hash[:ms_level] == 1
-      hash[:start_mz] = _el("startMz").to_f
-      hash[:end_mz] = _el("endMz").to_f
-    end
-    while !@fh.eof?
-      @line = @fh.readline
-      ms_level = _el("msLevel")
-      if ms_level
-        scan_count_tmp[ms_level.to_i] += 1
-      else
-        break
-      end
-    end
-    scan_count = []
-    scan_count_tmp.each do |cnt|
-      if cnt != 0
-        scan_count.push cnt
-      else
-        break
-      end
-    end
-    hash[:scan_count] = scan_count
-    @fh.close
-    hash
-  end
-  # returns [start_mz, end_mz] of the first full scan (ms_level == 1)
-  def start_and_end_mz(mzxml_file)
-    @fh = File.open(mzxml_file)
-    ms_level = 0
-    @line = ""
-    while ms_level != 1
-      ms_level = _el("msLevel").to_i
-    end
-    start_mz = _el("startMz").to_f
-    end_mz = _el("endMz").to_f
-    @fh.close
-    [start_mz, end_mz]
-  end
-  def _el(name)
-    re = /#{name}="(.*)"/
-    while @line !~ re && !@fh.eof?
-      @line = @fh.readline
-    end
-    if $1
-      return $1.dup
-    else
-      return nil
-    end
-  end
-end
-class Spec::MzXML::XMLParser::TimeMzIntenIndexer < XMLParser
-  @@scan_num = nil
-  @@get_data = false
-  attr_accessor :scans_by_num
-  def initialize
-    @current_scan = nil
-    @scans_by_num = []
-  end
-  def startElement(name,attrs)
-    if name == "scan"
-      num = attrs["num"].to_i
-      @current_scan = Spec::Scan.new(num, attrs["msLevel"].to_i, attrs["retentionTime"].gsub(/^PT/,'').gsub(/S$/,'').to_f)
-      scans_by_num[num] = @current_scan
-    elsif name == "precursorMz"
-      @current_scan.prec_inten = attrs["precursorIntensity"].to_f
-      @@get_data = true
-    end
-  end
-  def endElement(name)
-    if name == "precursorMz"
-      @@get_data = false
-    end
-  end
-  def character(data)
-    if @@get_data
-      @current_scan.prec_mz = data
-    end
-  end
-end

data/lib/spec/scan.rb DELETED Viewed

@@ -1,55 +0,0 @@
-module Spec; end
-class Spec::Scan
-  attr_accessor :time, :ms_level, :num, :prec_mz, :prec_inten, :parent
-  def initialize(num=nil, ms_level=nil, time=nil, prec_mz=nil, prec_inten=nil, parent=nil)
-    @num = num
-    @ms_level = ms_level
-    @time = time
-    if prec_mz then @prec_mz = prec_mz end
-    if prec_inten then @prec_inten = prec_inten end
-    if parent then @parent = parent end
-  end
-  def to_s
-    "<Scan num=#{@num} ms_level=#{@ms_level} time=#{@time}>"
-  end
-  # returns the string (space delimited): "ms_level num time [prec_mz prec_inten]"
-  def to_index_file_string
-    arr = [@ms_level, @num, @time]
-    if prec_mz then arr << @prec_mz end
-    if prec_inten then arr << @prec_inten end
-    arr.join(" ")
-  end
-   # adds the attribute parent to each scan with a parent
-  # (level 1 = no parent; level 2 = prev level 1, etc.
-  def self.add_parent_scan(scans)
-    prev_scan = nil
-    parent_stack = [nil]
-    ## we want to set the level to be the first mslevel we come to
-    prev_level = 1
-    scans.each do |scan|
-      if scan then prev_level = scan.ms_level; break; end
-    end
-    scans.each do |scan|
-      next unless scan  ## the first one is nil, (others?)
-      level = scan.ms_level
-      if prev_level < level
-        parent_stack.unshift prev_scan
-      end
-      if prev_level > level
-        (prev_level - level).times do parent_stack.shift end
-      end
-      scan.parent = parent_stack.first
-      prev_level = level
-      prev_scan = scan
-    end
-  end
-end