RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/lib/ferret/search/range_query.rb DELETED Viewed

@@ -1,139 +0,0 @@
-module Ferret::Search
-  # A Query that matches documents within an exclusive range. A RangeQuery
-  # is built by QueryParser for input like +[010 120]+.
-  class RangeQuery < Query
-    include Ferret::Index
-    attr_reader :lower_term, :upper_term
-    # Constructs a query selecting all terms greater than
-    # +lower_term+ but less than +upper_term+.
-    # There must be at least one term and either term may be nil,
-    # in which case there is no bound on that side, but if there are
-    # two terms, both terms *must* be for the same field.
-    #
-    # field:: The field this range applies to
-    # lower_term:: The lower bound on this range
-    # upper_term:: The upper bound on this range
-    # include_lower:: Does this range include the lower bound?
-    # include_upper:: Does this range include the upper bound?
-    def initialize(field, lower_term, upper_term, include_lower, include_upper)
-      super()
-      @field = field
-      @lower_term = lower_term
-      @upper_term = upper_term
-      @include_lower = include_lower
-      @include_upper = include_upper
-      if (lower_term.nil? and upper_term.nil?)
-        raise ArgumentError, "At least one value must be non-nil"
-      end
-      if (include_lower and lower_term.nil?)
-        raise ArgumentError, "The lower bound must be non-nil to be inclusive"
-      end
-      if (include_upper and upper_term.nil?)
-        raise ArgumentError, "The upper bound must be non-nil to be inclusive"
-      end
-      if (upper_term and lower_term and upper_term < lower_term)
-        raise ArgumentError, "The lower bound must less than the upper bound"
-      end
-    end
-    # Constructs a query for field +field+ matching less than or equal to
-    # +upper_term+.
-    def RangeQuery.new_less(field, upper_term, include_upper = true)
-      return RangeQuery.new(field, nil, upper_term, false, include_upper)
-    end
-    # Constructs a query for field +field+ matching greater than or equal
-    # to +lower_term+.
-    def RangeQuery.new_more(field, lower_term, include_lower = true)
-      return RangeQuery.new(field, lower_term, nil, include_lower, false)
-    end
-    def rewrite(reader)
-      bq = BooleanQuery.new(true)
-      term_enum = reader.terms_from(Term.new(@field, @lower_term||""))
-      begin
-        check_lower = !@include_lower
-        test_field = field()
-        begin
-          term = term_enum.term
-          break if term.nil? or term.field != @field
-          if (!check_lower or @lower_term.nil? or term.text > @lower_term)
-            check_lower = false
-            if @upper_term
-              compare = @upper_term <=> term.text
-              # if beyond the upper term, or is exclusive and
-              # this is equal to the upper term, break out
-              if ((compare < 0) or (not @include_upper and compare == 0))
-                break
-              end
-            end
-            tq = TermQuery.new(term) # found a match
-            tq.boost = boost()       # set the boost
-            bq.add_query(tq, BooleanClause::Occur::SHOULD) # add to query
-          end
-        end while term_enum.next?
-      ensure
-        term_enum.close()
-      end
-      return bq
-    end
-    # Returns the field name for this query
-    attr_reader :field, :lower_term, :upper_term, :include_lower, :include_upper
-    # Prints a user-readable version of this query.
-    def to_s(f=nil)
-      buffer = ""
-      buffer << "#{@field}:" if field() != f
-      if @lower_term
-        buffer << (@include_lower ? "[" : "{")
-        buffer << @lower_term
-      else
-        buffer << "<"
-      end
-      buffer << " " if @upper_term and @lower_term
-      if @upper_term
-        buffer << @upper_term
-        buffer << (@include_upper ? "]" : "}")
-      else
-        buffer << ">"
-      end
-      if boost() != 1.0
-        buffer << "^#{boost()}"
-      end
-      return buffer
-    end
-    # Returns true iff +o+ is equal to this.
-    def eql?(o)
-      return ((o.instance_of?(RangeQuery)) and
-          (boost() == o.boost()) and
-          (@include_upper == o.include_upper) and
-          (@include_lower == o.include_lower) and
-          (@upper_term == o.upper_term) and
-          (@lower_term == o.lower_term) and
-          (@field == o.field))
-    end
-    alias :== :eql?
-    # Returns a hash code value for this object.
-    def hash()
-      return (boost().hash ^
-              @field.hash ^
-              @lower_term.hash ^
-              @upper_term.hash ^
-              @include_lower.hash ^
-              @include_upper.hash)
-    end
-  end
-end

data/lib/ferret/search/req_excl_scorer.rb DELETED Viewed

@@ -1,125 +0,0 @@
-module Ferret::Search
-  # A Scorer for queries with a required subscorer and an excluding (prohibited)
-  # subscorer.
-  #
-  # This +Scorer+ implements Scorer#skip_to(int), and it uses the skip_to() on
-  # the given scorers.
-  class ReqExclScorer < Scorer
-    # Construct a +ReqExclScorer+.
-    # req_scorer:: The scorer that must match, except where
-    # excl_scorer:: indicates exclusion.
-    def initialize(req_scorer, excl_scorer)
-      super(nil) # No similarity used.
-      @req_scorer = req_scorer
-      @excl_scorer = excl_scorer
-      @first_time = true
-    end
-    def next?
-      if @first_time
-        if not @excl_scorer.next?
-          @excl_scorer = nil # exhausted at start
-        end
-        @first_time = false
-      end
-      if @req_scorer == nil
-        return false
-      end
-      if not @req_scorer.next?
-        @req_scorer = nil; # exhausted, nothing left
-        return false
-      end
-      if @excl_scorer == nil
-        return true # @req_scorer.next? already returned true
-      end
-      return to_non_excluded()
-    end
-    # Advance to non excluded doc.
-    # On entry:
-    #
-    # * @req_scorer != nil
-    # * @excl_scorer != nil
-    # * @req_scorer was advanced once via next? or skip_to() and
-    #   @req_scorer.doc() may still be excluded.
-    #
-    # Advances @req_scorer a non excluded required doc, if any.
-    #
-    # returns:: true iff there is a non excluded required doc.
-    def to_non_excluded()
-      excl_doc = @excl_scorer.doc
-      begin
-        req_doc = @req_scorer.doc # may be excluded
-        if (req_doc < excl_doc)
-          return true # @req_scorer advanced to before @excl_scorer, ie. not excluded
-        elsif (req_doc > excl_doc)
-          unless @excl_scorer.skip_to(req_doc)
-            @excl_scorer = nil # exhausted, no more exclusions
-            return true
-          end
-          excl_doc = @excl_scorer.doc
-          if excl_doc > req_doc
-            return true; # not excluded
-          end
-        end
-      end while @req_scorer.next?
-      @req_scorer = nil; # exhausted, nothing left
-      return false
-    end
-    # @req_scorer may be nil when next? or skip_to() already return false so
-    # only call when you know that a doc exists
-    def doc()
-      return @req_scorer.doc
-    end
-    # Returns the score of the current document matching the query.
-    #
-    # Initially invalid, until #next? is called the first time.
-    #
-    # returns:: The score of the required scorer.
-    def score()
-      return @req_scorer.score()
-    end
-    # Skips to the first match beyond the current whose document number is
-    # greater than or equal to a given target.
-    #
-    # When this method is used the #explain(int) method should not be used.
-    #
-    # target:: The target document number.
-    # returns:: true iff there is such a match.
-    def skip_to(target)
-      if (@first_time)
-        @first_time = false
-        if (! @excl_scorer.skip_to(target))
-          @excl_scorer = nil; # exhausted
-        end
-      end
-      if (@req_scorer == nil)
-        return false
-      end
-      if (@excl_scorer == nil)
-        return @req_scorer.skip_to(target)
-      end
-      if (! @req_scorer.skip_to(target))
-        @req_scorer = nil
-        return false
-      end
-      return to_non_excluded()
-    end
-    def explain(doc)
-      e = Explanation.new()
-      if @excl_scorer.skip_to(doc) and @excl_scorer.doc == doc
-        e.description = "excluded"
-      else
-        e.description = "not excluded"
-        e.details << @req_scorer.explain(doc)
-      end
-      return e
-    end
-  end
-end

data/lib/ferret/search/req_opt_sum_scorer.rb DELETED Viewed

@@ -1,70 +0,0 @@
-module Ferret::Search
-  # A Scorer for queries with a required part and an optional part.
-  # Delays skip_to() on the optional part until a score() is needed.
-  #
-  # This +Scorer+ implements Scorer#skip_to(int).
-  class ReqOptSumScorer < Scorer
-    # The scorers passed from the constructor.
-    # These are set to nil as soon as their next? or skip_to() returns false.
-    #
-    # Construct a +ReqOptScorer+.
-    # req_scorer:: The required scorer. This must match.
-    # opt_scorer:: The optional scorer. This is used for scoring only.
-    def initialize(req_scorer, opt_scorer)
-      super(nil) # No similarity used.
-      @req_scorer = req_scorer
-      @opt_scorer = opt_scorer
-      @first_time_opt_scorer = true
-    end
-    def next?
-      return @req_scorer.next?
-    end
-    def skip_to(target)
-      return @req_scorer.skip_to(target)
-    end
-    def doc()
-      return @req_scorer.doc()
-    end
-    # Returns the score of the current document matching the query.
-    # Initially invalid, until #next? is called the first time.
-    #
-    # returns:: The score of the required scorer, eventually increased by the
-    #           score of the optional scorer when it also matches the current
-    #           document.
-    def score()
-      cur_doc = @req_scorer.doc
-      req_score = @req_scorer.score
-      if @first_time_opt_scorer
-        @first_time_opt_scorer = false
-        if not @opt_scorer.skip_to(cur_doc)
-          @opt_scorer = nil
-          return req_score
-        end
-      elsif @opt_scorer.nil?
-        return req_score
-      elsif @opt_scorer.doc < cur_doc and not @opt_scorer.skip_to(cur_doc)
-        @opt_scorer = nil
-        return req_score
-      end
-      # assert (@opt_scorer != nil) and (@opt_scorer.doc() >= cur_doc)
-      return (@opt_scorer.doc == cur_doc) ? req_score + @opt_scorer.score() : req_score
-    end
-    # Explain the score of a document.
-    # @todo Also show the total score.
-    # See BooleanScorer.explain() on how to do this.
-    def explain(doc)
-      e = Explanation.new()
-      e.description = "required, optional"
-      e.details << @req_scorer.explain(doc)
-      e.details << @opt_scorer.explain(doc)
-      return e
-    end
-  end
-end

data/lib/ferret/search/score_doc.rb DELETED Viewed

@@ -1,38 +0,0 @@
-module Ferret::Search
-  # Expert: Returned by low-level search implementations.
-  # See TopDocs
-  class ScoreDoc
-    include Comparable
-    # Expert: The score of this document for the query.
-    attr_accessor :score
-    # Expert: A hit document's number.
-    attr_accessor :doc
-    # Expert: Constructs a ScoreDoc.
-    def initialize(doc, score)
-      @doc = doc
-      @score = score
-    end
-    # returns a hash value for storage in a Hash
-    def hash()
-      return 100 * doc * score
-    end
-    # score_docA < score_docB if score_docA.score < score_docB.score or
-    # score_docA.doc > score_docB.doc
-    def <=>(other)
-      result = @score.<=>(other.score)
-      if (result == 0)
-        return other.doc.<=>(@doc)
-      else
-        return result
-      end
-    end
-    def to_s
-      "#{@doc} -> %0.2f" % @score
-    end
-  end
-end

data/lib/ferret/search/score_doc_comparator.rb DELETED Viewed

@@ -1,114 +0,0 @@
-module Ferret::Search
-  # Expert: Compares two ScoreDoc objects for sorting.
-  class ScoreDocComparator
-    # Special comparator for sorting hits according to computed relevance (score).
-    RELEVANCE = ScoreDocComparator.new()
-    class <<RELEVANCE
-      def compare(i, j)
-        return j.score <=> i.score
-      end
-      def sort_value(i)
-        return i.score
-      end
-      def sort_type()
-        return SortField::SortType::SCORE
-      end
-    end
-    # Special comparator for sorting hits according to index order (number).
-    INDEX_ORDER = ScoreDocComparator.new()
-    class <<INDEX_ORDER
-      def compare(i, j)
-        return i.doc <=> j.doc
-      end
-      def sort_value(i)
-        return i.doc
-      end
-      def sort_type()
-        return SortField::SortType::DOC
-      end
-    end
-    # Compares two ScoreDoc objects and returns a result indicating their
-    # sort order.
-    # i:: First ScoreDoc
-    # j:: Second ScoreDoc
-    # returns:: +-1+ if +i+ should come before +j+
-    #           +1+  if +i+ should come after +j+
-    #           +0+  if they are equal
-    def compare(i, j)
-      return NotImplementedError
-    end
-    # Returns the value used to sort the given document.  The object returned
-    # must implement the java.io.Serializable interface.  This is used by
-    # multisearchers to determine how to collate results from their searchers.
-    #
-    # See FieldDoc
-    # i:: Document
-    # returns:: Serializable object
-    def sort_value(i)
-      return NotImplementedError
-    end
-    # Returns the type of sort.  Should return +SortField.SCORE+,
-    # +SortField.DOC+, +SortField.STRING+, +SortField.INTEGER+,
-    # +SortField.FLOAT+ or +SortField.CUSTOM+.  It is not valid to return
-    # +SortField.AUTO+.
-    # This is used by multisearchers to determine how to collate results from
-    # their searchers.  returns:: One of the constants in SortField.
-    # See SortField
-    def sort_type()
-      return NotImplementedError
-    end
-  end
-  class SimpleFieldComparator < ScoreDocComparator
-    def initialize(index, sort_type)
-      @index = index
-      @sort_type = sort_type
-    end
-    def compare(i, j)
-      return @index[i.doc] <=> @index[j.doc]
-    end
-    def sort_value(i)
-      return @index[i.doc]
-    end
-    def sort_type()
-      return @sort_type
-    end
-  end
-  class SpecialFieldComparator < SimpleFieldComparator
-    def initialize(index, sort_type, comparator)
-      super(index, sort_type)
-      @comparator = comparator
-    end
-    def compare(i, j)
-      return @comparator.call(@index[i.doc], @index[j.doc])
-    end
-  end
-  class StringFieldComparator < ScoreDocComparator
-    def initialize(index)
-      @str_index = index.str_index
-      @str_map = index.str_map
-    end
-    def compare(i, j)
-      return @str_index[i.doc] <=> @str_index[j.doc]
-    end
-    def sort_value(i)
-      return @str_map[@str_index[i.doc]]
-    end
-    def sort_type()
-      return SortField::SortType::STRING
-    end
-  end
-end