RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/lib/ferret/search/phrase_scorer.rb DELETED Viewed

@@ -1,152 +0,0 @@
-module Ferret::Search
-  class PhraseScorer < Scorer
-    attr_reader :first, :last
-    protected   :first, :last
-    def initialize(weight, tps, positions, similarity, norms)
-      super(similarity)
-      @norms = norms
-      @weight = weight
-      @value = weight.value
-      @first_time = true
-      @more = true
-      # convert tps to a list
-      tps.length.times do |i|
-        pp = PhrasePositions.new(tps[i], positions[i])
-        if (@last != nil) # add next to end of list
-          @last.next = pp
-        else
-          @first = pp
-        end
-        @last = pp
-      end
-      @pq = PhraseQueue.new(tps.length)  # construct empty pq
-    end
-    def doc()
-      return @first.doc
-    end
-    def next?
-      if (@first_time)
-        init()
-        @first_time = false
-      elsif (@more)
-        @more = @last.next?                      # trigger further scanning
-      end
-      return do_next()
-    end
-    # next without initial increment
-    def do_next()
-      while (@more)
-        while (@more and @first.doc < @last.doc) # find doc w/ all the terms
-          @more = @first.skip_to(@last.doc)      # skip first upto last
-          first_to_last()                        # and move it to the end
-        end
-        if (@more)
-          # found a doc with all of the terms
-          @freq = phrase_freq()                  # check for phrase
-          if (@freq == 0.0)                      # no match
-            @more = @last.next?                  # trigger further scanning
-          else
-            return true                          # found a match
-          end
-        end
-      end
-      return false                               # no more matches
-    end
-    def each()
-      pp = @first
-      while (pp != nil)
-        yield pp
-        pp = pp.next
-      end
-    end
-    def score()
-      raw = similarity().tf(@freq) * @value      # raw score
-      return raw * Similarity.decode_norm(@norms[@first.doc])  # normalize
-    end
-    def skip_to(target)
-      each() { |pp| break if not @more = pp.skip_to(target) }
-      sort() if @more                            # re-sort
-      return do_next()
-    end
-    def phrase_freq()
-      raise NotImplementedError
-    end
-    def init()
-      each do |pp|
-        break if not @more = pp.next?
-      end
-      if @more
-        sort()
-      end
-    end
-    def sort()
-      @pq.clear()
-      each() do |pp|
-        @pq.push(pp)
-      end
-      pq_to_list()
-    end
-    def pq_to_list()
-      @last = @first = nil
-      while (@pq.top() != nil)
-        pp = @pq.pop()
-        if (@last != nil) # add next to end of list
-          @last.next = pp
-        else
-          @first = pp
-        end
-        @last = pp
-        pp.next = nil
-      end
-    end
-    def first_to_last()
-      @last.next = @first  # move first to end of list
-      @last = @first
-      @first = @first.next
-      @last.next = nil
-    end
-    def explain(doc)
-      tf_explanation = Explanation.new()
-      while (next? and doc() < doc)
-      end
-      phrase_freq = (doc() == doc) ? @freq : 0.0
-      tf_explanation.value = @similarity.tf(phrase_freq)
-      tf_explanation.description = "tf(phrase_freq=#{phrase_freq})"
-      return tf_explanation
-    end
-    def to_s() return "phrase_scorer(#{@weight})" end
-  end
-  class PhraseQueue < Ferret::Utils::PriorityQueue
-    def less_than(pp1, pp2)
-      if (pp1.doc == pp2.doc)
-        return pp1.position < pp2.position
-      else
-        return pp1.doc < pp2.doc
-      end
-    end
-  end
-end

data/lib/ferret/search/prefix_query.rb DELETED Viewed

@@ -1,54 +0,0 @@
-module Ferret::Search
-  # A Query that matches documents containing terms with a specified prefix. A
-  # PrefixQuery is built by QueryParser for input like +app*+.
-  class PrefixQuery < Query
-    attr_reader :prefix
-    # Constructs a query for terms starting with +prefix+.
-    def initialize(prefix)
-      super()
-      @prefix = prefix
-    end
-    def rewrite(reader)
-      bq = BooleanQuery.new(true)
-      enumerator = reader.terms_from(@prefix)
-      begin
-        prefix_text = @prefix.text
-        prefix_length = prefix_text.length
-        prefix_field = @prefix.field
-        begin
-          term = enumerator.term
-          if (term.nil? or
-            term.field != prefix_field or
-            term.text[0,prefix_length] != prefix_text)
-            break
-          end
-          tq = TermQuery.new(term)                        # found a match
-          tq.boost = boost()                              # set the boost
-          bq.add_query(tq, BooleanClause::Occur::SHOULD)  # add to query
-          #puts("added " + term)
-        end while (enumerator.next?)
-      ensure
-        enumerator.close()
-      end
-      return bq
-    end
-    # Prints a user-readable version of this query.
-    def to_s(f)
-      buffer = ""
-      buffer << "#{@prefix.field}:" if @prefix.field != f
-      buffer << "#{@prefix.text}*"
-      buffer << "^#{boost()}" if boost() != 1.0
-      return buffer
-    end
-    def eql?(o)
-      (@prefix == o.prefix and boost() == o.boost)
-    end
-    def hash()
-      boost().hash ^ @prefix.hash
-    end
-  end
-end

data/lib/ferret/search/query.rb DELETED Viewed

@@ -1,140 +0,0 @@
-module Ferret::Search
-  # The abstract base class for queries.
-  # Instantiable subclasses are:
-  #    * TermQuery
-  #    * MultiTermQuery
-  #    * BooleanQuery
-  #    * WildcardQuery
-  #    * PhraseQuery
-  #    * PrefixQuery
-  #    * MultiPhraseQuery
-  #    * FuzzyQuery
-  #    * RangeQuery
-  #    * Span::SpanQuery
-  #
-  # A parser for queries is contained in:
-  #    * Ferret::QueryParser::QueryParser
-  #
-  class Query
-    # documents matching this query clause will (in addition to the normal
-    # weightings) have their score multiplied by the boost factor. It is
-    # 1.0 be default.
-    attr_accessor :boost
-    def initialize()
-      @boost = 1.0
-    end
-    # Prints a query to a string, with +field+ as the default field for
-    # terms.  The representation used is one that is supposed to be readable
-    # by Ferret::QueryParser::QueryParser. However, there are the following
-    # limitations:
-    # * If the query was created by the parser, the printed representation
-    #   may not be exactly what was parsed. For example, characters that need
-    #   to be escaped will be represented without the required backslash.
-    # * Some of the more complicated queries (e.g. span queries)
-    #   don't have a representation that can be parsed by QueryParser.
-    def to_s(field=nil)
-      raise NotImplementedError
-    end
-    # Expert: Constructs an appropriate Weight implementation for this query.
-    #
-    # Only implemented by primitive queries, which re-write to themselves.
-    def create_weight(searcher)
-      raise NotImplementedError
-    end
-    # Expert: Constructs and initializes a Weight for a top-level query.
-    def weight(searcher)
-      query = searcher.rewrite(self)
-      weight = query.create_weight(searcher)
-      sum = weight.sum_of_squared_weights()
-      norm = similarity(searcher).query_norm(sum)
-      weight.normalize(norm)
-      return weight
-    end
-    # Expert: called to re-write queries into primitive queries.
-    def rewrite(reader)
-      return self
-    end
-    # Expert: called when re-writing queries under MultiSearcher.
-    #
-    # Create a single query suitable for use by all subsearchers (in 1-1
-    # correspondence with queries). This is an optimization of the OR of
-    # all queries. We handle the common optimization cases of equal
-    # queries and overlapping clauses of boolean OR queries (as generated
-    # by MultiTermQuery.rewrite() and RangeQuery.rewrite()).
-    # Be careful overriding this method as queries[0] determines which
-    # method will be called and is not necessarily of the same type as
-    # the other queries.
-    def combine(queries)
-      uniques = Set.new
-      queries.each do |query|
-        clauses = []
-        # check if we can split the query into clauses
-        splittable = query.respond_to? :clauses
-        if splittable
-          splittable = query.coord_disabled?
-          clauses = query.clauses
-          clauses.each do |clause|
-            splittable = clause.occur == BooleanClause::Occur::SHOULD
-            break unless splittable
-          end
-        end
-        if splittable
-          clauses.each { |clause| uniques << clause.query }
-        else
-          uniques << query
-        end
-      end
-      # optimization: if we have just one query, just return it
-      if uniques.size == 1
-        uniques.each { |query| return query }
-      end
-      result = BooleanQuery.new(true)
-      uniques.each do |query|
-        result.add_query(query, BooleanClause::Occur::SHOULD)
-      end
-      return result
-    end
-    # Expert: adds all terms occuring in this query to the terms set
-    def extract_terms(terms)
-      raise NotImplementedError
-    end
-    # Expert: merges the clauses of a set of BooleanQuery's into a single
-    # BooleanQuery.
-    #
-    # A utility for use by #combine() implementations.
-    def merge_boolean_queries(queries)
-      all_clauses = Set.new
-      queries.each do |query|
-        query.clauses.each do |clause|
-          all_clauses << clause
-        end
-      end
-      coord_disabled = queries.size==0 ? false : queries[0].coord_disabled?
-      result = BooleanQuery.new(coord_disabled)
-      all_clauses.each do |clause|
-        result << clause
-      end
-      return result
-    end
-    # Expert: Returns the Similarity implementation to be used for this
-    # query.  Subclasses may override this method to specify their own
-    # Similarity implementation, perhaps one that delegates through that of
-    # the Searcher.  By default the Searcher's Similarity implementation is
-    # returned.
-    def similarity(searcher)
-      return searcher.similarity
-    end
-  end
-end

data/lib/ferret/search/query_filter.rb DELETED Viewed

@@ -1,51 +0,0 @@
-module Ferret::Search
-  require 'monitor'
-  # Constrains search results to only match those which also match a provided
-  # query.  Results are cached, so that searches after the first on the same
-  # index using this filter are much faster.
-  #
-  # This could be used, for example, with a RangeQuery on a suitably formatted
-  # date field to implement date filtering.  One could re-use a single
-  # QueryFilter that matches, e.g., only documents modified within the last
-  # week.  The QueryFilter and RangeQuery would only need to be reconstructed
-  # once per day.
-  class QueryFilter < Filter
-    # Constructs a filter which only matches documents matching
-    # +query+.
-    def initialize(query)
-      @query = query
-      @cache = nil
-    end
-    def bits(reader)
-      if (@cache == nil)
-        @cache = Ferret::Utils::WeakKeyHash.new
-      end
-      @cache.synchronize() do # check cache
-        bits = @cache[reader]
-        if bits
-          return bits
-        end
-      end
-      bits = Ferret::Utils::BitVector.new()
-      IndexSearcher.new(reader).search_each(@query) do |doc, score|
-        bits.set(doc)  # set bit for hit
-      end
-      @cache.synchronize() do # update cache
-        @cache[reader] = bits
-      end
-      return bits
-    end
-    def to_s()
-      return "QueryFilter(#{@query})"
-    end
-  end
-end

data/lib/ferret/search/range_filter.rb DELETED Viewed

@@ -1,103 +0,0 @@
-module Ferret::Search
-  # A Filter that restricts search results to a range of values in a given
-  # field.
-  #
-  # This code borrows heavily from RangeQuery, but is implemented as a Filter.
-  class RangeFilter < Filter
-    include Ferret::Index
-    # field_name:: The field this range applies to
-    # lower_term:: The lower bound on this range
-    # upper_term:: The upper bound on this range
-    # include_lower:: Does this range include the lower bound?
-    # include_upper:: Does this range include the upper bound?
-    def initialize(field_name, lower_term, upper_term, include_lower, include_upper)
-      @field_name = field_name
-      @lower_term = lower_term
-      @upper_term = upper_term
-      @include_lower = include_lower
-      @include_upper = include_upper
-      if (lower_term.nil? and upper_term.nil?)
-        raise ArgumentError, "At least one value must be non-nil"
-      end
-      if (include_lower and lower_term.nil?)
-        raise ArgumentError, "The lower bound must be non-nil to be inclusive"
-      end
-      if (include_upper and upper_term.nil?)
-        raise ArgumentError, "The upper bound must be non-nil to be inclusive"
-      end
-      if (upper_term and lower_term and upper_term < lower_term)
-        raise ArgumentError, "The lower bound must less than the upper bound"
-      end
-    end
-    # Constructs a filter for field +field_name+ matching less than or equal to
-    # +upper_term+.
-    def RangeFilter.new_less(field_name, upper_term, include_upper = true)
-      return RangeFilter.new(field_name, nil, upper_term, false, include_upper)
-    end
-    # Constructs a filter for field +field_name+ matching greater than or equal
-    # to +lower_term+.
-    def RangeFilter.new_more(field_name, lower_term, include_lower = true)
-      return RangeFilter.new(field_name, lower_term, nil, include_lower, false)
-    end
-    # Returns a BitVector with true for documents which should be permitted in
-    # search results, and false for those that should not.
-    def bits(reader)
-      bits = Ferret::Utils::BitVector.new()
-      term_enum = reader.terms_from(Term.new(@field_name, @lower_term||""))
-      begin
-        if (term_enum.term() == nil)
-          return bits
-        end
-        check_lower = !@include_lower # make adjustments to set to exclusive
-        term_docs = reader.term_docs
-        begin
-          begin
-            term = term_enum.term()
-            break if (term.nil? or term.field != @field_name)
-            if (!check_lower or @lower_term.nil? or term.text > @lower_term)
-              check_lower = false
-              if @upper_term
-                compare = @upper_term <=> term.text
-                # if beyond the upper term, or is exclusive and
-                # this is equal to the upper term, break out
-                if ((compare < 0) or (!@include_upper and compare == 0))
-                  break
-                end
-              end
-              # we have a good term, find the docs
-              term_docs.seek(term_enum)
-              while term_docs.next?
-                bits.set(term_docs.doc)
-              end
-            end
-          end while term_enum.next?
-        ensure
-          term_docs.close()
-        end
-      ensure
-        term_enum.close()
-      end
-      return bits
-    end
-    def to_s()
-      buffer = "#{@field_name}:"
-      buffer << "[" if @include_lower
-      buffer << @lower_term if @lower_term
-      buffer << "-"
-      buffer << @upper_term if @upper_term
-      buffer << @include_upper ? "]" : "end"
-      return buffer
-    end
-  end
-end