RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/lib/ferret/search/sort_comparator.rb DELETED Viewed

@@ -1,60 +0,0 @@
-module Ferret::Search
-  # Abstract base class for sorting hits returned by a Query.
-  #
-  # This class should only be used if the other SortField types (SCORE, DOC,
-  # STRING, INTEGER, FLOAT) do not provide an adequate sorting.  It maintains
-  # an internal cache of values which could be quite large.  The cache is an
-  # array of Comparable, one for each document in the index.  There is a
-  # distinct Comparable for each unique term in the field - if some documents
-  # have the same term in the field, the cache array will have entries which
-  # reference the same Comparable.
-  #
-  # Author::  Tim Jones
-  class SortComparator
-    # Creates a comparator for the field in the given index.
-    #
-    # reader:: Index to create comparator for.
-    # field_name::  Field to create comparator for.
-    # returns:: Comparator of ScoreDoc objects.
-    def new_comparator(reader, field_name)
-      cached_values = FieldCache::DEFAULT.custom(reader, field, self)
-      score_doc_comparator =  ScoreDocComparator.new()
-      class <<score_doc_comparator
-        attr_writer :cache_values
-        def compare(i, j)
-          return @cached_values[i.doc] <=> @cached_values[j.doc]
-        end
-        def sort_value(i)
-          return @cached_values[i.doc]
-        end
-        def sort_type()
-          return SortField::SortType::CUSTOM
-        end
-      end
-      score_doc_comparator.cached_values = cached_values
-      return score_doc_comparator
-    end
-    # Returns an object which, when sorted according to natural order, will
-    # order the Term values in the correct order.  For example, if the Terms
-    # contained integer values, this method would return +term_text.to_i+.
-    # Note that this might not always be the most efficient implementation -
-    # for this particular example, a better implementation might be to make a
-    # ScoreDocLookupComparator that uses an internal lookup table of int.
-    #
-    # term_text:: The textual value of the term.
-    #
-    # returns:: An object representing +term_text+ that sorts according to the
-    #           natural order of +term_text+.
-    #
-    # See ScoreDocComparator
-    def get_comparable(term_text)
-      raise NotImplementedError
-    end
-  end
-end

data/lib/ferret/search/sort_field.rb DELETED Viewed

@@ -1,91 +0,0 @@
-module Ferret::Search
-  # Stores information about how to sort documents by terms in an individual
-  # field.  Fields must be indexed in order to sort by them.
-  class SortField
-    class SortType < Ferret::Utils::Parameter
-      attr_reader :parser, :comparator
-      # Creates a new SortType. A SortType is used to specify how a field is
-      # sorted in a document. Each SortType *MUST* have a unique name. This is
-      # because the SortType object is used to cache a fields values for a
-      # particular reader, so each SortType should be created once only and
-      # stored in a constant. See the standard SortTypes stored hear for
-      # example.
-      def initialize(name, parser = lambda{|str| str}, comparator = nil)
-        super(name)
-        @parser = parser
-        @comparator = comparator
-      end
-      # Sort by document score (relevancy).  Sort values are Float and higher
-      # values are at the front.
-      SCORE = SortType.new("SCORE")
-      # Sort by document number (order).  Sort values are Integer and lower
-      # values are at the front.
-      DOC = SortType.new("DOC")
-      # Guess sort type of sort based on field contents. We try parsing the
-      # field as an integer and then as a floating point number. If we are
-      # unsuccessful, the field is parsed as a plain string.
-      AUTO = SortType.new("auto")
-      # Sort using term values as Strings.  Sort values are String and lower
-      # values are at the front.
-      STRING = SortType.new("string")
-      # Sort using term values as encoded Integers.  Sort values are Integer
-      # and lower values are at the front.
-      INTEGER = SortType.new("integer", lambda{|str| str.to_i})
-      # Sort using term values as encoded Floats.  Sort values are Float and
-      # lower values are at the front.
-      FLOAT = SortType.new("float", lambda{|str| str.to_f})
-    end
-    attr_reader :name, :sort_type, :comparator
-    def reverse?
-      return @reverse
-    end
-    # Creates a SortField which specifies which field the data is sorted on
-    # and how that field is sorted. See SortType.
-    #
-    # name:: Name of field to sort by.  Can be +nil+ if +sort_type+ is SCORE or
-    #     DOC.
-    #
-    # An options hash with the followind values can also be supplied;
-    # sort_type::  Type of values in the terms.
-    # reverse::    True if natural order should be reversed.
-    # comparator:: A proc used to compare two values from the index. You can
-    #              also give this value to the SortType object that you pass.
-    def initialize(name = nil, options= {})
-      @name = name.to_s if name
-      @sort_type = options[:sort_type]||SortType::AUTO
-      @reverse = options[:reverse]||false
-      @comparator = options[:comparator]||@sort_type.comparator
-      if (@name == nil and @sort_type != SortType::DOC and
-          @sort_type != SortType::SCORE)
-        raise ArgumentError, "You must supply a field name for your sort field"
-      end
-    end
-    # Represents sorting by document score (relevancy).
-    FIELD_SCORE = SortField.new(nil, {:sort_type => SortType::SCORE})
-    # Represents sorting by document number (order).
-    FIELD_DOC = SortField.new(nil, {:sort_type => SortType::DOC})
-    def to_s()
-      if @name
-        buffer = "#@name:<#@sort_type>"
-      else
-        buffer = "<#{@sort_type}>"
-      end
-      buffer << '!' if @reverse
-      return buffer
-    end
-  end
-end

data/lib/ferret/search/spans.rb DELETED Viewed

@@ -1,12 +0,0 @@
-$:.unshift File.dirname(__FILE__)
-require 'spans/spans_enum.rb'
-require 'spans/near_spans_enum.rb'
-require 'spans/span_query.rb'
-require 'spans/span_first_query.rb'
-require 'spans/span_near_query.rb'
-require 'spans/span_not_query.rb'
-require 'spans/span_or_query.rb'
-require 'spans/span_scorer.rb'
-require 'spans/span_term_query.rb'
-require 'spans/span_weight.rb'

data/lib/ferret/search/spans/near_spans_enum.rb DELETED Viewed

@@ -1,304 +0,0 @@
-module Ferret::Search::Spans
-  class NearSpansEnum < SpansEnum
-    class CellQueue < Ferret::Utils::PriorityQueue
-      def less_than(o1, o2)
-        if (o1.doc == o2.doc)
-          if (o1.start == o2.start)
-            if (o1.finish == o2.finish)
-              return o1.index > o2.index
-            else
-              return o1.finish < o2.finish
-            end
-          else
-            return o1.start < o2.start
-          end
-        else
-          return o1.doc < o2.doc
-        end
-      end
-    end
-    # Wraps a SpansEnum, and can be used to form a linked list.
-    class SpansCell < SpansEnum
-      attr_accessor :next, :index
-      def initialize(parent, spans, index)
-        @parent = parent
-        @spans = spans
-        @index = index
-        @length = -1
-      end
-      def next?()
-        if (@length != -1)                  # subtract old length
-          @parent.total_length -= @length
-        end
-        more = @spans.next?                 # move to next
-        if more
-          @length = finish() - start()      # compute new length
-          @parent.total_length += @length   # add new length to total
-          if (@parent.max.nil? or doc() > @parent.max.doc or     # maintain max
-              (doc() == @parent.max.doc and finish() > @parent.max.finish))
-            @parent.max = self
-          end
-        end
-        return more
-      end
-      def skip_to(target)
-        if (@length != -1)                  # subtract old length
-          @parent.total_length -= @length
-        end
-        more = @spans.skip_to(target)       # skip
-        if (more)
-          @length = finish() - start()      # compute new length
-          @parent.total_length += @length   # add new length to total
-          if (@parent.max.nil? or doc() > @parent.max.doc() or   # maintain max
-              (doc() == @parent.max.doc and finish() > @parent.max.finish))
-            @parent.max = self
-          end
-        end
-        return more
-      end
-      def doc() return @spans.doc() end
-      def start() return @spans.start() end
-      def finish() return @spans.finish() end
-      def to_s() return "#{@spans}##{@index}" end
-    end
-    attr_accessor :total_length, :max
-    def initialize(query, reader)
-      @ordered = []         # spans in query order
-      @first = nil          # linked list of spans
-      @last = nil           # sorted by doc only
-      @total_length = 0     # sum of current lengths
-      @queue = nil          # sorted queue of spans
-      @max = nil            # max element in queue
-      @more = true          # true iff not done
-      @first_time = true    # true before first next?
-      @query = query
-      @slop = query.slop
-      @in_order = query.in_order?
-      clauses = query.clauses # initialize spans & list
-      @queue = CellQueue.new(clauses.length)
-      clauses.length.times do |i|
-        # construct clause spans
-        cell = SpansCell.new(self, clauses[i].spans(reader), i)
-        @ordered << cell    # add to ordered
-      end
-    end
-    def next?()
-      if (@first_time)
-        init_list(true)
-        list_to_queue()                # initialize queue
-        @first_time = false
-      elsif (@more)
-        @more = min().next?            # trigger further scanning
-        @queue.adjust_top() if (@more) # maintain queue
-      end
-      while (@more)
-        queue_stale = false
-        if (min().doc != @max.doc)     # maintain list
-          queue_to_list()
-          queue_stale = true
-        end
-        # skip to doc w/ all clauses
-        while (@more and @first.doc < @last.doc)
-          @more = @first.skip_to(@last.doc) # skip first upto last
-          first_to_last()              # and move it to the end
-          queue_stale = true
-        end
-        return false if not @more
-        # found doc w/ all clauses
-        if (queue_stale) # maintain the queue
-          list_to_queue()
-          queue_stale = false
-        end
-        return true if at_match?
-        # trigger further scanning
-        if (@in_order and check_slop?())
-          # There is a non ordered match within slop and an ordered match is needed.
-          @more = first_non_ordered_next_to_partial_list()
-          if (@more)
-            partial_list_to_queue()
-          end
-        else
-          @more = min().next?()
-          if (@more)
-            @queue.adjust_top()        # maintain queue
-          end
-        end
-      end
-      return false                     # no more matches
-    end
-    def each()
-      cell = @first
-      while (cell)
-        yield cell
-        cell=cell.next
-      end
-    end
-    def skip_to(target)
-      if (@first_time) # initialize
-        init_list(false)
-        each() do |cell|
-          @more = cell.skip_to(target) # skip all
-          break if not @more
-        end
-        if (@more)
-          list_to_queue()
-        end
-        @first_time = false
-      else # normal case
-        while (@more and min().doc < target) # skip as needed
-          @more = min().skip_to(target)
-          @queue.adjust_top() if (@more)
-        end
-      end
-      if (@more)
-        return true if (at_match?())              # at a match?
-        return next?                              # no, scan
-      end
-      return false
-    end
-    def min() @queue.top() end
-    def doc() min().doc() end
-    def start() min().start() end
-    def finish() @max.finish() end
-    def to_s()
-      buffer = "spans(#{@query})@"
-      if @first_time
-        buffer << "START"
-      else
-        buffer << (@queue.size>0 ? ("#{doc}:#{start()}-#{finish}") : "END")
-      end
-      return buffer
-    end
-    def init_list(nxt)
-      @ordered.each do |cell|
-        @more = cell.next? if nxt
-        if @more
-          add_to_list(cell) # add to list
-        else
-          break
-        end
-      end
-    end
-    def add_to_list(cell)
-      if (@last != nil) # add next to end of list
-        @last.next = cell
-      else
-        @first = cell
-      end
-      @last = cell
-      cell.next = nil
-    end
-    def first_to_last()
-      @last.next = @first # move first to end of list
-      @last = @first
-      @first = @first.next
-      @last.next = nil
-    end
-    def queue_to_list()
-      @last = @first = nil
-      while (@queue.top() != nil)
-        add_to_list(@queue.pop())
-      end
-    end
-    def first_non_ordered_next_to_partial_list()
-      # Creates a partial list consisting of first non ordered and earlier.
-      # Returns first non ordered .next?.
-      @last = @first = nil
-      ordered_index = 0
-      while (@queue.top() != nil)
-        cell = @queue.pop()
-        add_to_list(cell)
-        if (cell.index == ordered_index)
-          ordered_index += 1
-        else
-          return cell.next?()
-          # FIXME: continue here, rename to eg. checkOrderedMatch():
-          # when check_slop?() and not ordered, repeat cell.next?().
-          # when check_slop?() and ordered, add to list and repeat queue.pop()
-          # without check_slop?(): no match, rebuild the queue from the partial list.
-          # When queue is empty and check_slop?() and ordered there is a match.
-        end
-      end
-      raise RuntimeException, "Unexpected: ordered"
-    end
-    def list_to_queue()
-      @queue.clear() # rebuild queue
-      partial_list_to_queue()
-    end
-    def partial_list_to_queue()
-      each() { |cell| @queue.push(cell) } # add to queue from list
-    end
-    def at_match?()
-      return ((min().doc() == @max.doc()) and check_slop?() and
-              (not @in_order or match_is_ordered?()))
-    end
-    def check_slop?()
-      match_length = @max.finish() - min.start()
-      return ((match_length - @total_length) <= @slop)
-    end
-    def match_is_ordered?()
-      last_start = -1
-      @ordered.each do |cell|
-        start = cell.start
-        return false if start <= last_start
-        last_start = start
-      end
-      return true
-    end
-  end
-end