RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/lib/ferret/index/segment_term_vector.rb DELETED Viewed

@@ -1,58 +0,0 @@
-module Ferret::Index
-  # Provides access to stored term vector of
-  # a document field.
-  class SegmentTermVector
-    # Array of term frequencies. Locations of the array correspond one to one
-    # to the terms in the array obtained from _terms_
-    # method. Each location in the array contains the number of times this
-    # term occurs in the document or the document field.
-    attr_reader :freqs, :positions, :offsets
-    attr_reader :field, :terms
-    def initialize(field, terms, freqs, positions=nil, offsets=nil)
-      @field = field
-      @terms = terms
-      @freqs = freqs
-      @positions = positions
-      @offsets = offsets
-    end
-    def to_s()
-      sb = @field.to_s + ": "
-      if @terms
-        terms.each_with_index do |term, i|
-          sb << ', ' if i > 0
-          sb << term + '/' + @freqs[i].to_s
-        end
-      end
-      sb << 'end'
-      return sb
-    end
-    # Returns the number of unique terms in the field
-    def size()
-      return @terms == nil ? 0 : @terms.size
-    end
-    # Return an index in the term numbers array returned from _get_terms_ at
-    # which the term with the specified _term_ appears. If this term does
-    # not appear in the array, return -1.
-    def index_of(term)
-      return @terms ? @terms.index(term) : nil
-    end
-    # Just like _index_of_ but searches for a number of terms at the same
-    # time. Returns an array that has the same size as the number of terms
-    # searched for, each slot containing the result of searching for that
-    # term number.
-    #
-    # terms:: array containing terms to look for
-    # start:: index in the array where the list of terms starts
-    # len:: the number of terms in the list
-    def indexes_of(terms, start, len)
-      return terms[start, len].map { |term| index_of(term) }
-    end
-  end
-end

data/lib/ferret/index/term.rb DELETED Viewed

@@ -1,53 +0,0 @@
-module Ferret::Index
-  # A Term represents a word from text.  This is the unit of search.  It is
-  # composed of two elements, the text of the word, as a string, and the name of
-  # the field that the text occured in, an interned string.
-  #
-  # Note that terms may represent more than words from text fields, but also
-  # things like dates, email addresses, urls, etc.
-  #
-  # A term contains two attributes;
-  # field:: The field indicates the part of a document which this term came from.
-  # text::  In the case of words, this is simply the text of the word.  In the case
-  #         of dates and other types, this is an encoding of the object as a string.
-  class Term
-    include Comparable
-    attr_accessor :field
-    attr_accessor :text
-    # Constructs a Term with the given field and text
-    def initialize(fld_name, txt)
-      @field = fld_name.to_s
-      @text = txt.to_s
-    end
-    # Combines the hash() of the field and the text.
-    def hash()
-      return field.hash() + text.hash()
-    end
-    # implements comparable giving us the methods >, >=, <, <= and between?
-    def <=>(other)
-      if @field == other.field
-        return @text <=> other.text
-      else
-        return @field <=> other.field
-      end
-    end
-    alias :eql? :==
-    # Resets the field and text of a Term.
-    def set!(fld_name, txt)
-      initialize(fld_name, txt)
-    end
-    def text=(text)
-      @text = text.to_s
-    end
-    def to_s
-      @field + ":" + @text
-    end
-  end
-end

data/lib/ferret/index/term_buffer.rb DELETED Viewed

@@ -1,83 +0,0 @@
-module Ferret::Index
-  class TermBuffer
-    include Comparable
-    attr_reader :text_buf, :text_length, :field
-    def initialize
-      @text_buf = String.new
-      @text_length = -1
-      @field = nil
-    end
-    def hash()
-      return text.hash + @field.hash
-    end
-    def <=>(other)
-      if (@field == other.field)
-        return text <=> other.text
-      end
-      @field <=> other.field
-    end
-    def read(input, field_infos)
-      @term = nil                           # invalidate cache
-      start = input.read_vint()
-      length = input.read_vint()
-      total_length = start + length
-      @text_length = total_length
-      input.read_chars(@text_buf, start, length)
-      @field = field_infos[input.read_vint()].name
-    end
-    def term=(term)
-      if (term == nil)
-        reset()
-        return
-      end
-      # copy text into the buffer
-      @text_buf = term.text.clone
-      @text_length = @text_buf.length
-      @field = term.field
-      @term = term
-    end
-    def set!(other)
-      @text_length = other.text_length
-      @text_buf = other.text_buf.clone if other.text_buf
-      @field = other.field
-      @term = other.term
-    end
-    alias :initialize_copy :set!
-    def reset()
-      @field = nil
-      @text_buf = ""
-      @text_length = 0
-      @term = nil
-    end
-    def to_term()
-      if @field.nil?                            # unset
-        return nil
-      end
-      if @term.nil?
-        @term = Term.new(@field, @text_buf[0,@text_length].to_s)
-      end
-      return @term
-    end
-    alias :term :to_term
-    def text()
-      @text_buf[0,@text_length]
-    end
-    def to_s()
-      to_term.to_s
-    end
-  end
-end

data/lib/ferret/index/term_doc_enum.rb DELETED Viewed

@@ -1,291 +0,0 @@
-module Ferret::Index
-  # TermDocEnum provides an interface for enumerating &lt;document,
-  # frequency&gt; pairs for a term.
-  #
-  # The document portion names each document containing the term.  Documents
-  # are indicated by number.  The frequency portion gives the number of times
-  # the term occurred in each document.
-  #
-  # The pairs are ordered by document number.
-  #
-  # See IndexReader#term_docs
-  class TermDocEnum
-    # Sets this to the data for a term.
-    # The enumeration is reset to the start of the data for this term.
-    def seek(term) raise NotImplementedError end
-    # Returns the current document number.
-    #
-    # This is invalid until #next() is called for the first time.
-    def doc() raise NotImplementedError end
-    # Returns the frequency of the term within the current document. This
-    # is invalid until {@link #next()} is called for the first time.
-    def freq() raise NotImplementedError end
-    # Moves to the next pair in the enumeration.
-    # Returns true iff there is such a next pair in the enumeration.
-    def next?() raise NotImplementedError end
-    # Attempts to read multiple entries from the enumeration, up to length of
-    # _docs_.  Document numbers are stored in _docs_, and term
-    # frequencies are stored in _freqs_.  The _freqs_ array must be as
-    # long as the _docs_ array.
-    #
-    # Returns the number of entries read.  Zero is only returned when the
-    # stream has been exhausted.
-    def read(docs, freqs)  raise NotImplementedError end
-    # Skips entries to the first beyond the current whose document number is
-    # greater than or equal to _target_.
-    #
-    # Returns true iff there is such an entry.
-    #
-    # Some implementations are considerably more efficient than that.
-    def skip_to(target)
-      while (target > doc())
-        return false if not next?()
-      end
-      return true
-    end
-    # Frees associated resources.
-    def close() raise NotImplementedError end
-  end
-  class SegmentTermDocEnum < TermDocEnum
-    attr_accessor :parent, :freq_stream, :count, :df, :deleted_docs, :doc, :freq
-    def initialize(parent)
-      @parent = parent
-      @freq_stream = parent.freq_stream.clone()
-      @deleted_docs = parent.deleted_docs
-      @skip_interval = parent.term_infos.skip_interval
-      @skip_stream = nil
-      @doc = 0
-    end
-    # Find the term, TermEnum or TermInfo in the doc
-    #
-    # t:: can be a Term, TermEnum of TermInfo object
-    def seek(t)
-      if t.instance_of?(Term)
-        ti = parent.term_infos[t]
-      elsif t.is_a?(TermEnum)
-        ti = t.term_info()
-        # The following is being done in the Java version. I don't think it's
-        # necessary.
-        # use comparison of fieldinfos to verify that term enum (t) belongs to the
-        # same segment as this SegmentTermDocEnum
-        #if (t.instance_of?(SegmentTermEnum) and t.field_infos == parent.field_infos)
-        #  ti = t.term_info()
-        #else                                          # punt case
-        #  ti = parent.term_infos[t.term]
-        #end
-      elsif t.is_a? TermInfo # this one is easy. That's exactly what we're looking for
-        ti = t
-      else
-        raise ArgumentError, "Must pass a Term, TermEnum or TermInfo object, not a " +
-          t.class.to_s
-      end
-      do_seek(ti)
-      #puts "pos = #{@freq_stream.pos} ti = #{ti}"
-    end
-    def do_seek(ti)
-      @count = 0
-      if (ti == nil)
-        @doc_freq = 0
-      else
-        @doc_freq = ti.doc_freq
-        @doc = 0
-        @skip_doc = 0
-        @skip_count = 0
-        @num_skips = @doc_freq / @skip_interval
-        @freq_pointer = ti.freq_pointer
-        @prox_pointer = ti.prox_pointer
-        @skip_pointer = @freq_pointer + ti.skip_offset
-        @freq_stream.seek(@freq_pointer)
-        @have_skipped = false
-      end
-    end
-    def close()
-      @freq_stream.close()
-      @freq_stream = nil
-      if (@skip_stream != nil)
-        @skip_stream.close()
-        @skip_stream = nil
-      end
-      @parent = nil
-    end
-    def skipping_doc()
-    end
-    def next?()
-      while (true)
-        return false if @count == @doc_freq
-        doc_code = @freq_stream.read_vint()
-        @doc += doc_code >> 1              # shift off low bit
-        if ((doc_code & 1) != 0)           # if low bit is set
-          @freq = 1                        # freq is one
-        else
-          @freq = @freq_stream.read_vint() # else read freq
-        end
-        @count += 1
-        break if (@deleted_docs == nil or not @deleted_docs[@doc])
-        skipping_doc()
-      end
-      return true
-    end
-    # Optimized implementation.
-    def read(docs, freqs, start = 0)
-      i = start
-      needed = docs.length
-      while (i < needed and @count < @doc_freq)
-        # manually inlined call to next?() for speed
-        doc_code = @freq_stream.read_vint()
-        @doc += doc_code >> 1              # shift off low bit
-        if ((doc_code & 1) != 0)           # if low bit is set
-          @freq = 1                        # freq is one
-        else
-          @freq = @freq_stream.read_vint() # else read freq
-        end
-        @count += 1
-        if (@deleted_docs == nil or not @deleted_docs[@doc])
-          docs[i] = @doc
-          freqs[i] = @freq
-          i += 1
-        end
-        skipping_doc()
-      end
-      return i
-    end
-    # Overridden by SegmentTermDocPosEnum to skip in prox stream.
-    def skip_prox(prox_pointer)
-    end
-    # Optimized implementation.
-    def skip_to(target)
-      if (@doc_freq >= @skip_interval) # optimized case
-        if (@skip_stream == nil)
-          @skip_stream = @freq_stream.clone() # lazily clone
-        end
-        if (!@have_skipped) # lazily seek skip stream
-          @skip_stream.seek(@skip_pointer)
-          @have_skipped = true
-        end
-        # scan skip data
-        last_skip_doc = @skip_doc
-        last_freq_pointer = @freq_stream.pos()
-        last_prox_pointer = -1
-        num_skipped = -1 - (@count % @skip_interval)
-        while (target > @skip_doc)
-          last_skip_doc = @skip_doc
-          last_freq_pointer = @freq_pointer
-          last_prox_pointer = @prox_pointer
-          if (@skip_doc != 0 and @skip_doc >= @doc)
-            num_skipped += @skip_interval
-          end
-          if(@skip_count >= @num_skips)
-            break
-          end
-          @skip_doc += @skip_stream.read_vint()
-          @freq_pointer += @skip_stream.read_vint()
-          @prox_pointer += @skip_stream.read_vint()
-          @skip_count += 1
-        end
-        # if we found something to skip, then skip it
-        if (last_freq_pointer > @freq_stream.pos())
-          @freq_stream.seek(last_freq_pointer)
-          skip_prox(last_prox_pointer)
-          @doc = last_skip_doc
-          @count += num_skipped
-        end
-      end
-      # done skipping, now just scan
-      begin
-        if not next?
-          return false
-        end
-      end while (target > @doc)
-      return true
-    end
-  end
-  class SegmentTermDocPosEnum < SegmentTermDocEnum
-    def initialize(p)
-      super
-      @prox_stream = p.prox_stream.clone()
-    end
-    def do_seek(ti)
-      super
-      if (ti != nil)
-        @prox_stream.seek(ti.prox_pointer)
-      end
-      @prox_count = 0
-    end
-    def close()
-      super
-      @prox_stream.close()
-    end
-    def next_position()
-      @prox_count -= 1
-      return @position += @prox_stream.read_vint()
-    end
-    def skipping_doc()
-      @freq.times { @prox_stream.read_vint() }
-    end
-    def next?()
-      @prox_count.times { @prox_stream.read_vint() }
-      if (super)
-        @prox_count = @freq    # note frequency
-        @position = 0         # reset position
-        return true
-      end
-      return false
-    end
-    def read(docs, freqs)
-      raise NotImplementedError, "TermDocPosEnum does not support processing multiple documents in one call. Use TermDocEnum instead."
-    end
-    # Called by super.skipTo().
-    def skip_prox(prox_pointer)
-      @prox_stream.seek(prox_pointer)
-      @prox_count = 0
-    end
-  end
-end