RubyGems - ferret - Versions diffs - 0.9.6 → 0.10.0 - Mend

ferret 0.9.6 → 0.10.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (295) hide show

data/MIT-LICENSE +1 -1
data/README +12 -24
data/Rakefile +38 -54
data/TODO +14 -17
data/ext/analysis.c +982 -823
data/ext/analysis.h +133 -76
data/ext/array.c +96 -58
data/ext/array.h +40 -13
data/ext/bitvector.c +476 -118
data/ext/bitvector.h +264 -22
data/ext/compound_io.c +217 -229
data/ext/defines.h +49 -0
data/ext/document.c +107 -317
data/ext/document.h +31 -65
data/ext/except.c +81 -36
data/ext/except.h +117 -55
data/ext/extconf.rb +2 -9
data/ext/ferret.c +211 -104
data/ext/ferret.h +22 -11
data/ext/filter.c +97 -82
data/ext/fs_store.c +348 -367
data/ext/global.c +226 -188
data/ext/global.h +44 -26
data/ext/hash.c +474 -391
data/ext/hash.h +441 -68
data/ext/hashset.c +124 -96
data/ext/hashset.h +169 -20
data/ext/helper.c +56 -5
data/ext/helper.h +7 -0
data/ext/inc/lang.h +29 -49
data/ext/inc/threading.h +31 -0
data/ext/ind.c +288 -278
data/ext/ind.h +68 -0
data/ext/index.c +5688 -0
data/ext/index.h +663 -616
data/ext/lang.h +29 -49
data/ext/libstemmer.c +3 -3
data/ext/mem_pool.c +84 -0
data/ext/mem_pool.h +35 -0
data/ext/posh.c +1006 -0
data/ext/posh.h +1007 -0
data/ext/priorityqueue.c +117 -194
data/ext/priorityqueue.h +135 -39
data/ext/q_boolean.c +1305 -1108
data/ext/q_const_score.c +106 -93
data/ext/q_filtered_query.c +138 -135
data/ext/q_fuzzy.c +206 -242
data/ext/q_match_all.c +94 -80
data/ext/q_multi_term.c +663 -0
data/ext/q_parser.c +667 -593
data/ext/q_phrase.c +992 -555
data/ext/q_prefix.c +72 -61
data/ext/q_range.c +235 -210
data/ext/q_span.c +1480 -1166
data/ext/q_term.c +273 -246
data/ext/q_wildcard.c +127 -114
data/ext/r_analysis.c +1720 -711
data/ext/r_index.c +3049 -0
data/ext/r_qparser.c +433 -146
data/ext/r_search.c +2934 -1993
data/ext/r_store.c +372 -143
data/ext/r_utils.c +941 -0
data/ext/ram_store.c +330 -326
data/ext/search.c +1291 -668
data/ext/search.h +403 -702
data/ext/similarity.c +91 -113
data/ext/similarity.h +45 -30
data/ext/sort.c +721 -484
data/ext/stopwords.c +361 -273
data/ext/store.c +556 -58
data/ext/store.h +706 -126
data/ext/tags +3578 -2780
data/ext/term_vectors.c +352 -0
data/ext/threading.h +31 -0
data/ext/win32.h +54 -0
data/lib/ferret.rb +5 -17
data/lib/ferret/document.rb +130 -2
data/lib/ferret/index.rb +577 -26
data/lib/ferret/number_tools.rb +157 -0
data/lib/ferret_version.rb +3 -0
data/test/test_helper.rb +5 -13
data/test/unit/analysis/tc_analyzer.rb +513 -1
data/test/unit/analysis/{ctc_tokenstream.rb → tc_token_stream.rb} +23 -0
data/test/unit/index/tc_index.rb +183 -240
data/test/unit/index/tc_index_reader.rb +312 -479
data/test/unit/index/tc_index_writer.rb +397 -13
data/test/unit/index/th_doc.rb +269 -206
data/test/unit/query_parser/tc_query_parser.rb +40 -33
data/test/unit/search/tc_filter.rb +59 -71
data/test/unit/search/tc_fuzzy_query.rb +24 -16
data/test/unit/search/tc_index_searcher.rb +23 -201
data/test/unit/search/tc_multi_searcher.rb +78 -226
data/test/unit/search/tc_search_and_sort.rb +93 -81
data/test/unit/search/tc_sort.rb +23 -23
data/test/unit/search/tc_sort_field.rb +7 -7
data/test/unit/search/tc_spans.rb +51 -47
data/test/unit/search/tm_searcher.rb +339 -0
data/test/unit/store/tc_fs_store.rb +1 -1
data/test/unit/store/tm_store_lock.rb +3 -3
data/test/unit/tc_document.rb +81 -0
data/test/unit/ts_analysis.rb +1 -1
data/test/unit/ts_utils.rb +1 -1
data/test/unit/utils/tc_bit_vector.rb +288 -0
data/test/unit/utils/tc_number_tools.rb +117 -0
data/test/unit/utils/tc_priority_queue.rb +106 -0
metadata +140 -301
data/CHANGELOG +0 -9
data/ext/dummy.exe +0 -0
data/ext/field.c +0 -408
data/ext/frtio.h +0 -13
data/ext/inc/except.h +0 -90
data/ext/index_io.c +0 -382
data/ext/index_rw.c +0 -2658
data/ext/lang.c +0 -41
data/ext/nix_io.c +0 -134
data/ext/q_multi_phrase.c +0 -380
data/ext/r_doc.c +0 -582
data/ext/r_index_io.c +0 -1021
data/ext/r_term.c +0 -219
data/ext/term.c +0 -820
data/ext/termdocs.c +0 -611
data/ext/vector.c +0 -637
data/ext/w32_io.c +0 -150
data/lib/ferret/analysis.rb +0 -11
data/lib/ferret/analysis/analyzers.rb +0 -112
data/lib/ferret/analysis/standard_tokenizer.rb +0 -71
data/lib/ferret/analysis/token.rb +0 -100
data/lib/ferret/analysis/token_filters.rb +0 -86
data/lib/ferret/analysis/token_stream.rb +0 -26
data/lib/ferret/analysis/tokenizers.rb +0 -112
data/lib/ferret/analysis/word_list_loader.rb +0 -27
data/lib/ferret/document/document.rb +0 -152
data/lib/ferret/document/field.rb +0 -312
data/lib/ferret/index/compound_file_io.rb +0 -338
data/lib/ferret/index/document_writer.rb +0 -289
data/lib/ferret/index/field_infos.rb +0 -279
data/lib/ferret/index/fields_io.rb +0 -181
data/lib/ferret/index/index.rb +0 -675
data/lib/ferret/index/index_file_names.rb +0 -33
data/lib/ferret/index/index_reader.rb +0 -503
data/lib/ferret/index/index_writer.rb +0 -534
data/lib/ferret/index/multi_reader.rb +0 -377
data/lib/ferret/index/multiple_term_doc_pos_enum.rb +0 -98
data/lib/ferret/index/segment_infos.rb +0 -130
data/lib/ferret/index/segment_merge_info.rb +0 -49
data/lib/ferret/index/segment_merge_queue.rb +0 -16
data/lib/ferret/index/segment_merger.rb +0 -358
data/lib/ferret/index/segment_reader.rb +0 -412
data/lib/ferret/index/segment_term_enum.rb +0 -169
data/lib/ferret/index/segment_term_vector.rb +0 -58
data/lib/ferret/index/term.rb +0 -53
data/lib/ferret/index/term_buffer.rb +0 -83
data/lib/ferret/index/term_doc_enum.rb +0 -291
data/lib/ferret/index/term_enum.rb +0 -52
data/lib/ferret/index/term_info.rb +0 -37
data/lib/ferret/index/term_infos_io.rb +0 -321
data/lib/ferret/index/term_vector_offset_info.rb +0 -20
data/lib/ferret/index/term_vectors_io.rb +0 -553
data/lib/ferret/query_parser.rb +0 -312
data/lib/ferret/query_parser/query_parser.tab.rb +0 -928
data/lib/ferret/search.rb +0 -50
data/lib/ferret/search/boolean_clause.rb +0 -100
data/lib/ferret/search/boolean_query.rb +0 -299
data/lib/ferret/search/boolean_scorer.rb +0 -294
data/lib/ferret/search/caching_wrapper_filter.rb +0 -40
data/lib/ferret/search/conjunction_scorer.rb +0 -99
data/lib/ferret/search/disjunction_sum_scorer.rb +0 -205
data/lib/ferret/search/exact_phrase_scorer.rb +0 -32
data/lib/ferret/search/explanation.rb +0 -41
data/lib/ferret/search/field_cache.rb +0 -215
data/lib/ferret/search/field_doc.rb +0 -31
data/lib/ferret/search/field_sorted_hit_queue.rb +0 -184
data/lib/ferret/search/filter.rb +0 -11
data/lib/ferret/search/filtered_query.rb +0 -130
data/lib/ferret/search/filtered_term_enum.rb +0 -79
data/lib/ferret/search/fuzzy_query.rb +0 -154
data/lib/ferret/search/fuzzy_term_enum.rb +0 -247
data/lib/ferret/search/hit_collector.rb +0 -34
data/lib/ferret/search/hit_queue.rb +0 -11
data/lib/ferret/search/index_searcher.rb +0 -200
data/lib/ferret/search/match_all_query.rb +0 -104
data/lib/ferret/search/multi_phrase_query.rb +0 -216
data/lib/ferret/search/multi_searcher.rb +0 -261
data/lib/ferret/search/multi_term_query.rb +0 -65
data/lib/ferret/search/non_matching_scorer.rb +0 -22
data/lib/ferret/search/phrase_positions.rb +0 -55
data/lib/ferret/search/phrase_query.rb +0 -214
data/lib/ferret/search/phrase_scorer.rb +0 -152
data/lib/ferret/search/prefix_query.rb +0 -54
data/lib/ferret/search/query.rb +0 -140
data/lib/ferret/search/query_filter.rb +0 -51
data/lib/ferret/search/range_filter.rb +0 -103
data/lib/ferret/search/range_query.rb +0 -139
data/lib/ferret/search/req_excl_scorer.rb +0 -125
data/lib/ferret/search/req_opt_sum_scorer.rb +0 -70
data/lib/ferret/search/score_doc.rb +0 -38
data/lib/ferret/search/score_doc_comparator.rb +0 -114
data/lib/ferret/search/scorer.rb +0 -91
data/lib/ferret/search/similarity.rb +0 -278
data/lib/ferret/search/sloppy_phrase_scorer.rb +0 -47
data/lib/ferret/search/sort.rb +0 -112
data/lib/ferret/search/sort_comparator.rb +0 -60
data/lib/ferret/search/sort_field.rb +0 -91
data/lib/ferret/search/spans.rb +0 -12
data/lib/ferret/search/spans/near_spans_enum.rb +0 -304
data/lib/ferret/search/spans/span_first_query.rb +0 -79
data/lib/ferret/search/spans/span_near_query.rb +0 -108
data/lib/ferret/search/spans/span_not_query.rb +0 -130
data/lib/ferret/search/spans/span_or_query.rb +0 -176
data/lib/ferret/search/spans/span_query.rb +0 -25
data/lib/ferret/search/spans/span_scorer.rb +0 -74
data/lib/ferret/search/spans/span_term_query.rb +0 -105
data/lib/ferret/search/spans/span_weight.rb +0 -84
data/lib/ferret/search/spans/spans_enum.rb +0 -44
data/lib/ferret/search/term_query.rb +0 -128
data/lib/ferret/search/term_scorer.rb +0 -183
data/lib/ferret/search/top_docs.rb +0 -36
data/lib/ferret/search/top_field_docs.rb +0 -17
data/lib/ferret/search/weight.rb +0 -54
data/lib/ferret/search/wildcard_query.rb +0 -26
data/lib/ferret/search/wildcard_term_enum.rb +0 -61
data/lib/ferret/stemmers.rb +0 -1
data/lib/ferret/stemmers/porter_stemmer.rb +0 -218
data/lib/ferret/store.rb +0 -5
data/lib/ferret/store/buffered_index_io.rb +0 -190
data/lib/ferret/store/directory.rb +0 -141
data/lib/ferret/store/fs_store.rb +0 -381
data/lib/ferret/store/index_io.rb +0 -245
data/lib/ferret/store/ram_store.rb +0 -286
data/lib/ferret/utils.rb +0 -8
data/lib/ferret/utils/bit_vector.rb +0 -123
data/lib/ferret/utils/date_tools.rb +0 -138
data/lib/ferret/utils/number_tools.rb +0 -91
data/lib/ferret/utils/parameter.rb +0 -41
data/lib/ferret/utils/priority_queue.rb +0 -120
data/lib/ferret/utils/string_helper.rb +0 -47
data/lib/ferret/utils/thread_local.rb +0 -28
data/lib/ferret/utils/weak_key_hash.rb +0 -60
data/lib/rferret.rb +0 -37
data/rake_utils/code_statistics.rb +0 -106
data/test/benchmark/tb_ram_store.rb +0 -76
data/test/benchmark/tb_rw_vint.rb +0 -26
data/test/functional/thread_safety_index_test.rb +0 -81
data/test/functional/thread_safety_test.rb +0 -137
data/test/longrunning/tc_numbertools.rb +0 -60
data/test/longrunning/tm_store.rb +0 -19
data/test/unit/analysis/ctc_analyzer.rb +0 -532
data/test/unit/analysis/data/wordfile +0 -6
data/test/unit/analysis/rtc_letter_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_lower_case_filter.rb +0 -20
data/test/unit/analysis/rtc_lower_case_tokenizer.rb +0 -27
data/test/unit/analysis/rtc_per_field_analyzer_wrapper.rb +0 -39
data/test/unit/analysis/rtc_porter_stem_filter.rb +0 -16
data/test/unit/analysis/rtc_standard_analyzer.rb +0 -20
data/test/unit/analysis/rtc_standard_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_stop_analyzer.rb +0 -20
data/test/unit/analysis/rtc_stop_filter.rb +0 -14
data/test/unit/analysis/rtc_white_space_analyzer.rb +0 -21
data/test/unit/analysis/rtc_white_space_tokenizer.rb +0 -20
data/test/unit/analysis/rtc_word_list_loader.rb +0 -32
data/test/unit/analysis/tc_token.rb +0 -25
data/test/unit/document/rtc_field.rb +0 -28
data/test/unit/document/tc_document.rb +0 -47
data/test/unit/document/tc_field.rb +0 -98
data/test/unit/index/rtc_compound_file_io.rb +0 -107
data/test/unit/index/rtc_field_infos.rb +0 -127
data/test/unit/index/rtc_fields_io.rb +0 -167
data/test/unit/index/rtc_multiple_term_doc_pos_enum.rb +0 -83
data/test/unit/index/rtc_segment_infos.rb +0 -74
data/test/unit/index/rtc_segment_term_docs.rb +0 -17
data/test/unit/index/rtc_segment_term_enum.rb +0 -60
data/test/unit/index/rtc_segment_term_vector.rb +0 -71
data/test/unit/index/rtc_term_buffer.rb +0 -57
data/test/unit/index/rtc_term_info.rb +0 -19
data/test/unit/index/rtc_term_infos_io.rb +0 -192
data/test/unit/index/rtc_term_vectors_io.rb +0 -108
data/test/unit/index/tc_term.rb +0 -27
data/test/unit/index/tc_term_voi.rb +0 -18
data/test/unit/search/rtc_similarity.rb +0 -37
data/test/unit/search/rtc_sort_field.rb +0 -14
data/test/unit/search/tc_multi_searcher2.rb +0 -126
data/test/unit/store/rtc_fs_store.rb +0 -62
data/test/unit/store/rtc_ram_store.rb +0 -15
data/test/unit/store/rtm_store.rb +0 -150
data/test/unit/store/rtm_store_lock.rb +0 -2
data/test/unit/ts_document.rb +0 -2
data/test/unit/utils/rtc_bit_vector.rb +0 -73
data/test/unit/utils/rtc_date_tools.rb +0 -50
data/test/unit/utils/rtc_number_tools.rb +0 -59
data/test/unit/utils/rtc_parameter.rb +0 -40
data/test/unit/utils/rtc_priority_queue.rb +0 -62
data/test/unit/utils/rtc_string_helper.rb +0 -21
data/test/unit/utils/rtc_thread.rb +0 -61
data/test/unit/utils/rtc_weak_key_hash.rb +0 -25
data/test/utils/number_to_spoken.rb +0 -132

data/lib/ferret/utils/string_helper.rb DELETED Viewed

@@ -1,47 +0,0 @@
-module Ferret::Utils
-  module StringHelper
-  # Methods for manipulating strings.
-    class StringReader
-      attr_reader :length
-      def initialize(str)
-        @str = str
-        @pointer = 0
-        @length = @str.length
-      end
-      def read(len = nil)
-        return @str if len.nil?
-        return nil if @pointer > @length
-        res = @str[@pointer, len]
-        @pointer += len
-        return res
-      end
-      def reset() @pointer = 0 end
-      def close() str = nil end
-    end
-    # Compares two strings, character by character, and returns the
-    # first position where the two strings differ from one another.
-    # eg.
-    #   string_difference('dustbin', 'dusty') # => 4
-    #   string_difference('dustbin', 'evening') # => 0
-    #   string_difference('eve', 'evening') # => 3
-    #
-    # s1:: The first string to compare
-    # s2:: The second string to compare
-    # returns:: The first position where the two strings differ.
-    def StringHelper.string_difference(s1, s2)
-      len = [s1.length, s2.length].min
-      len.times do |i|
-        return i if (s1[i] != s2[i])
-      end
-      return len
-    end
-  end
-end

data/lib/ferret/utils/thread_local.rb DELETED Viewed

@@ -1,28 +0,0 @@
-require 'thread'
-class Thread
-  def make_deleter
-    lambda{|id| @ferret_cache.delete(id)}
-  end
-  # Set the local value for the thread
-  def set_local(key, value)
-    @del ||= make_deleter
-    @ferret_cache ||= {}
-    ObjectSpace.define_finalizer(key, @del)
-    @ferret_cache[key.object_id] = value
-  end
-  # Get the local value for the thread
-  def get_local(key)
-    return (@ferret_cache ||= {})[key.object_id]
-  end
-  # Returns the number of local variables stored. Useful for testing.
-  def local_size
-    return (@ferret_cache ||= {}).size
-  end
-  def clear_local
-    (@ferret_cache ||= {}).clear
-  end
-end

data/lib/ferret/utils/weak_key_hash.rb DELETED Viewed

@@ -1,60 +0,0 @@
-module Ferret::Utils
-  require 'weakref'
-  require 'monitor'
-  # This class implements a weak key hash. ie all keys that are stored in this
-  # hash can still be garbage collected, and if they are garbage collected
-  # then the key and it's corresponding value will be deleted from the hash.
-  #    eg.
-  #    name = "david"
-  #    last_names = WeakKeyHash.new()
-  #    last_names[name] = "balmain"
-  #    puts last_names["david"]  #=>"balmain"
-  #    GC.start
-  #    puts last_names["david"]  #=>"balmain"
-  #    name = nil
-  #    GC.start
-  #    # the name "david" will now have been garbage collected so it should
-  #    # have been removed from the hash
-  #    puts last_names["david"]  #=>nil
-  #
-  # WeakKeyHash subclasses Monitor so it can be synchronized on.
-  #
-  # === NOTE
-  # Unfortunately the ruby garbage collector is not always predictable so your
-  # results may differ but each key should eventually be freed when all other
-  # references have been removed and the garbage collector is ready.
-  class WeakKeyHash < Monitor
-    # Create a new WeakKeyHash.
-    def initialize
-      super()
-      @hash = {}
-      @deleter = lambda{|id| @hash.delete(id)}
-    end
-    # Set the value for the key just like a Hash
-    def []=(key, value)
-      ObjectSpace.define_finalizer(key, @deleter)
-      @hash[key.object_id] = value
-    end
-    # Get the value for the key
-    def [](key)
-      return @hash[key.object_id]
-    end
-    # Return the number of elements in the Hash
-    def size
-      @hash.size
-    end
-    # Print a string representation the WeakKeyHash
-    def to_s
-      buffer = ""
-      @hash.each_pair {|key, value| buffer << "<#{ObjectSpace._id2ref(key)}=>#{value}>"}
-      return buffer
-    end
-  end
-end

data/lib/rferret.rb DELETED Viewed

@@ -1,37 +0,0 @@
-$: << File.dirname(__FILE__)
-#--
-# Copyright (c) 2005 David Balmain
-#
-# Permission is hereby granted, free of charge, to any person obtaining
-# a copy of this software and associated documentation files (the
-# "Software"), to deal in the Software without restriction, including
-# without limitation the rights to use, copy, modify, merge, publish,
-# distribute, sublicense, and/or sell copies of the Software, and to
-# permit persons to whom the Software is furnished to do so, subject to
-# the following conditions:
-#
-# The above copyright notice and this permission notice shall be
-# included in all copies or substantial portions of the Software.
-#
-# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
-# EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
-# MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
-# NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
-# LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
-# OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
-# WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
-#++
-# :include: ../TUTORIAL
-module Ferret
-  VERSION = '0.9.6'
-end
-$ferret_pure_ruby = true
-require 'ferret/utils'
-require 'ferret/document'
-require 'ferret/stemmers'
-require 'ferret/analysis'
-require 'ferret/store'
-require 'ferret/index'
-require 'ferret/search'
-require 'ferret/query_parser'

data/rake_utils/code_statistics.rb DELETED Viewed

@@ -1,106 +0,0 @@
-# This code was taken from rails and is under the same license as ferret.
-# Thanks go to David Heinemeier Hansson
-class CodeStatistics
-  def initialize(*pairs)
-    @pairs      = pairs
-    @statistics = calculate_statistics
-    @total      = calculate_total if pairs.length > 1
-  end
-  def to_s
-    print_header
-    @pairs.each { |pair| print_line(pair.first, @statistics[pair.first]) }
-    print_splitter
-    if @total
-      print_line("Total", @total)
-      print_splitter
-    end
-    print_code_test_stats
-  end
-  private
-    def calculate_statistics
-      @pairs.inject({}) { |stats, pair| stats[pair.first] = calculate_directory_statistics(pair.last); stats }
-    end
-    def calculate_directory_statistics(directory, pattern = /.*\.rb$/)
-      stats = { "lines" => 0, "codelines" => 0, "classes" => 0, "methods" => 0 }
-      Dir.foreach(directory) do |file_name|
-        if File.stat(directory + "/" + file_name).directory? and (/^\./ !~ file_name)
-          newstats = calculate_directory_statistics(directory + "/" + file_name, pattern)
-          stats.each { |k, v| stats[k] += newstats[k] }
-        end
-        next unless file_name =~ pattern
-        f = File.open(directory + "/" + file_name)
-        while line = f.gets
-          stats["lines"]     += 1
-          stats["classes"]   += 1 if line =~ /class [A-Z]/
-          stats["methods"]   += 1 if line =~ /def [a-z]/
-          stats["codelines"] += 1 unless line =~ /^\s*$/ || line =~ /^\s*#/
-        end
-      end
-      stats
-    end
-    def calculate_total
-      total = { "lines" => 0, "codelines" => 0, "classes" => 0, "methods" => 0 }
-      @statistics.each_value { |pair| pair.each { |k, v| total[k] += v } }
-      total
-    end
-    def calculate_code
-      code_loc = 0
-      @statistics.each { |k, v| code_loc += v['codelines'] unless ['Units', 'Functionals'].include? k }
-      code_loc
-    end
-    def calculate_tests
-      test_loc = 0
-      @statistics.each { |k, v| test_loc += v['codelines'] if ['Units', 'Functionals'].include? k }
-      test_loc
-    end
-    def print_header
-      print_splitter
-      puts "| Name                 | Lines |   LOC | Classes | Methods | M/C | LOC/M |"
-      print_splitter
-    end
-    def print_splitter
-      puts "+----------------------+-------+-------+---------+---------+-----+-------+"
-    end
-    def print_line(name, statistics)
-      m_over_c   = (statistics["methods"] / statistics["classes"])   rescue m_over_c = 0
-      loc_over_m = (statistics["codelines"] / statistics["methods"]) - 2 rescue loc_over_m = 0
-      start = if ['Units', 'Functionals'].include? name
-        "|   #{name.ljust(18)} "
-      else
-        "| #{name.ljust(20)} "
-      end
-      puts start +
-           "| #{statistics["lines"].to_s.rjust(5)} " +
-           "| #{statistics["codelines"].to_s.rjust(5)} " +
-           "| #{statistics["classes"].to_s.rjust(7)} " +
-           "| #{statistics["methods"].to_s.rjust(7)} " +
-           "| #{m_over_c.to_s.rjust(3)} " +
-           "| #{loc_over_m.to_s.rjust(5)} |"
-    end
-    def print_code_test_stats
-      code  = calculate_code
-      tests = calculate_tests
-      puts "  Code LOC: #{code}     Test LOC: #{tests}     Code to Test Ratio: 1:#{sprintf("%.1f", tests.to_f/code)}"
-      puts ""
-    end
-  end

data/test/benchmark/tb_ram_store.rb DELETED Viewed

@@ -1,76 +0,0 @@
-require File.dirname(__FILE__) + "/../test_helper"
-require 'benchmark'
-class RAMStoreTest < Test::Unit::TestCase
-  def setup
-    @dir = Ferret::Store::RAMDirectory.new
-  end
-  def teardown
-    @dir.close()
-  end
-  def test_rw_bytes
-    bytes = [0x34, 0x87, 0xF9, 0xEA, 0x00, 0xFF]
-    rw_test(bytes, "byte")
-  end
-  def test_rw_ints
-    ints = [-2147483648, 2147483647, -1, 0]
-    rw_test(ints, "int")
-  end
-  def test_rw_longs
-    longs = [-9223372036854775808, 9223372036854775807, -1, 0]
-    rw_test(longs, "long")
-  end
-  def test_rw_uints
-    uints = [0xffffffff, 100000, 0]
-    rw_test(uints, "uint")
-  end
-  def test_rw_ulongs
-    ulongs = [0xffffffffffffffff, 100000000000000, 0]
-    rw_test(ulongs, "ulong")
-  end
-  def test_rw_vints
-    vints = [ 0xF8DC843342FE3484234987FE98AB987C897D214D123D123458EFBE2E238BACDEB9878790ABCDEF123DEF23988B89C,
-              0x0000000000000000000000000000000000000000,
-              0xFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF]
-    rw_test(vints, "vint")
-  end
-  def test_rw_vlongs
-    vlongs = [ 0xF8DC843342FE3484234987FE98AB987C897D214D123D123458EFBE2E238BACDEB9878790ABCDEF123DEF23988B89C,
-              0x0000000000000000000000000000000000000000,
-              0xFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF]
-    rw_test(vlongs, "vlong")
-  end
-  def test_rw_strings
-    strings = ['This is a ruby ferret test string ~!@#$%^&*()`123456790-=\)_+|', 'This is another string. I\'ll make this one a little longer than the last one. But I guess we need a few shorter ones too.', 'one', 'two', 'three', 'four', 'five', 'six', 'seven', 'eight', 'nine', 'ten']
-    rw_test(strings, "string")
-  end
-  # this test fills up the output stream so that the buffer will have to be
-  # written a few times. It then uses seek to make sure that it works
-  # correctly
-  def rw_test(values, type)
-    puts "\nrw_#{type} test"
-    Benchmark.bmbm do |x|
-      x.report("write") do
-        ostream = @dir.create_output("rw_#{type}.test")
-        1000.times {values.each { |b| ostream.__send__("write_" + type, b) }}
-        ostream.close
-      end
-      x.report("read") do
-        istream = @dir.open_input("rw_#{type}.test")
-        1000.times {values.each { |b| assert_equal(b, istream.__send__("read_" + type), "#{type} should be equal") }}
-        istream.close
-      end
-    end
-  end
-end

data/test/benchmark/tb_rw_vint.rb DELETED Viewed

@@ -1,26 +0,0 @@
-$:.unshift File.join(File.dirname(__FILE__), '../../lib')
-require 'ferret'
-vints = [ 9223372036854775807,
-          0x00,
-          0xFFFFFFFFFFFFFFFF]
-t = Time.new
-10.times do
-  dpath = File.join(File.dirname(__FILE__),
-                       'fsdir')
-  dir = Ferret::Store::FSDirectory.new(dpath, true)
-  100.times do
-    ostream = dir.create_output("rw_vint.test")
-    300.times { |i| ostream.write_vint(vints[i%3]) }
-    ostream.close
-    istream = dir.open_input("rw_vint.test")
-    300.times { istream.read_vint }
-    istream.close
-  end
-  dir.close
-end
-puts "took #{Time.new - t} seconds"

data/test/functional/thread_safety_index_test.rb DELETED Viewed

@@ -1,81 +0,0 @@
-require File.dirname(__FILE__) + "/../test_helper"
-require File.dirname(__FILE__) + "/../utils/number_to_spoken.rb"
-require 'thread'
-class IndexThreadSafetyTest < Test::Unit::TestCase
-  include Ferret::Index
-  include Ferret::Document
-  INDEX_DIR = File.expand_path(File.join(File.dirname(__FILE__), "index"))
-  ITERATIONS = 100
-  NUM_THREADS = 10
-  ANALYZER = Ferret::Analysis::Analyzer.new()
-  def setup
-    @index = Index.new(:path => 'index2',
-                       :create => true,
-                       :analyzer => ANALYZER,
-                       :default_field => 'contents')
-  end
-  def indexing_thread()
-    ITERATIONS.times do
-      choice = rand()
-      if choice > 0.98
-        do_optimize
-      elsif choice > 0.9
-        do_delete_doc
-      elsif choice > 0.7
-        do_search
-      else
-        do_add_doc
-      end
-    end
-  rescue => e
-    puts e
-    puts e.backtrace
-    @index = nil
-    raise e
-  end
-  def do_optimize
-    puts "Optimizing the index"
-    @index.optimize
-  end
-  def do_delete_doc
-    return if @index.size == 0
-    doc_num = rand(@index.size)
-    puts "Deleting #{doc_num} from index which has#{@index.has_deletions? ? "" : " no"} deletions"
-    puts "document was already deleted" if (@index.deleted?(doc_num))
-    @index.delete(doc_num)
-  end
-  def do_add_doc
-    d = Document.new()
-    n = rand(0xFFFFFFFF)
-    d << Field.new("id", n.to_s, Field::Store::YES, Field::Index::UNTOKENIZED)
-    d << Field.new("contents", n.to_spoken, Field::Store::NO, Field::Index::TOKENIZED)
-    puts("Adding #{n}")
-    @index << d
-  end
-  def do_search
-    n = rand(0xFFFFFFFF)
-    puts("Searching for #{n}")
-    hits = @index.search_each(n.to_spoken, :num_docs => 3) do |d, s|
-      puts "Hit for #{n}: #{@index[d]["id"]} - #{s}"
-    end
-    puts("Searched for #{n}: total = #{hits}")
-  end
-  def test_threading
-    threads = []
-    NUM_THREADS.times do
-      threads << Thread.new { indexing_thread }
-    end
-    threads.each {|t| t.join}
-  end
-end