RubyGems - lingo - Versions diffs - 1.8.0 → 1.8.1 - Mend

lingo 1.8.0 → 1.8.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (100) hide show

data/ChangeLog +13 -0
data/README +49 -29
data/Rakefile +28 -4
data/TODO +2 -9
data/bin/lingo +24 -0
data/bin/lingoctl +24 -0
data/de/lingo-dic.txt +559 -74
data/info/gpl-hdr.txt +21 -24
data/lib/lingo.rb +83 -112
data/lib/lingo/agenda_item.rb +53 -0
data/lib/lingo/attendee.rb +261 -0
data/lib/lingo/attendee/abbreviator.rb +95 -97
data/lib/lingo/attendee/debugger.rb +94 -93
data/lib/lingo/attendee/decomposer.rb +76 -83
data/lib/lingo/attendee/dehyphenizer.rb +141 -144
data/lib/lingo/attendee/formatter.rb +65 -0
data/lib/lingo/attendee/multi_worder.rb +302 -0
data/lib/lingo/attendee/noneword_filter.rb +89 -84
data/lib/lingo/attendee/object_filter.rb +91 -0
data/lib/lingo/attendee/sequencer.rb +159 -158
data/lib/lingo/attendee/synonymer.rb +81 -84
data/lib/lingo/attendee/text_reader.rb +242 -0
data/lib/lingo/attendee/text_writer.rb +169 -0
data/lib/lingo/attendee/tokenizer.rb +192 -191
data/lib/lingo/attendee/variator.rb +152 -156
data/lib/lingo/attendee/vector_filter.rb +140 -135
data/lib/lingo/attendee/word_searcher.rb +98 -0
data/lib/lingo/buffered_attendee.rb +69 -0
data/lib/lingo/cachable.rb +58 -0
data/lib/lingo/call.rb +72 -0
data/lib/lingo/cli.rb +26 -0
data/lib/lingo/config.rb +23 -26
data/lib/lingo/core_ext.rb +42 -0
data/lib/lingo/ctl.rb +239 -173
data/lib/lingo/database.rb +148 -496
data/lib/lingo/database/crypter.rb +85 -0
data/lib/lingo/database/gdbm_store.rb +49 -0
data/lib/lingo/database/hash_store.rb +67 -0
data/lib/lingo/database/libcdb_store.rb +58 -0
data/lib/lingo/database/sdbm_store.rb +64 -0
data/lib/lingo/database/show_progress.rb +81 -0
data/lib/lingo/database/source.rb +134 -0
data/lib/lingo/database/source/key_value.rb +62 -0
data/lib/lingo/database/source/multi_key.rb +65 -0
data/lib/lingo/database/source/multi_value.rb +65 -0
data/lib/lingo/database/source/single_word.rb +60 -0
data/lib/lingo/database/source/word_class.rb +64 -0
data/lib/lingo/error.rb +122 -0
data/lib/lingo/language.rb +78 -518
data/lib/lingo/language/dictionary.rb +173 -0
data/lib/lingo/language/grammar.rb +211 -0
data/lib/lingo/language/lexical.rb +66 -0
data/lib/lingo/language/lexical_hash.rb +88 -0
data/lib/lingo/language/token.rb +48 -0
data/lib/lingo/language/word.rb +130 -0
data/lib/lingo/language/word_form.rb +83 -0
data/lib/lingo/reportable.rb +59 -0
data/lib/lingo/version.rb +1 -1
data/lingo-all.cfg +14 -10
data/lingo-call.cfg +5 -5
data/lingo.cfg +14 -12
data/lingo.rb +26 -0
data/lir.cfg +13 -9
data/spec/spec_helper.rb +1 -0
data/test.cfg +11 -11
data/test/attendee/ts_abbreviator.rb +0 -6
data/test/attendee/ts_decomposer.rb +0 -6
data/test/attendee/{ts_multiworder.rb → ts_multi_worder.rb} +1 -7
data/test/attendee/ts_noneword_filter.rb +1 -7
data/test/attendee/{ts_objectfilter.rb → ts_object_filter.rb} +1 -7
data/test/attendee/ts_sequencer.rb +0 -6
data/test/attendee/ts_synonymer.rb +0 -6
data/test/attendee/{ts_textreader.rb → ts_text_reader.rb} +1 -7
data/test/attendee/{ts_textwriter.rb → ts_text_writer.rb} +1 -7
data/test/attendee/ts_tokenizer.rb +0 -6
data/test/attendee/ts_variator.rb +0 -6
data/test/attendee/ts_vector_filter.rb +1 -7
data/test/attendee/{ts_wordsearcher.rb → ts_word_searcher.rb} +1 -7
data/test/ref/artikel.non +2 -29
data/test/ref/artikel.seq +13 -8
data/test/ref/artikel.vec +30 -15
data/test/ref/artikel.ven +29 -14
data/test/ref/artikel.ver +58 -43
data/test/ref/lir.csv +146 -145
data/test/ref/lir.non +186 -210
data/test/ref/lir.seq +54 -50
data/test/test_helper.rb +41 -36
data/test/ts_database.rb +12 -11
data/test/ts_language.rb +118 -68
metadata +67 -29
data/lib/lingo/attendee/multiworder.rb +0 -301
data/lib/lingo/attendee/objectfilter.rb +0 -86
data/lib/lingo/attendee/textreader.rb +0 -237
data/lib/lingo/attendee/textwriter.rb +0 -196
data/lib/lingo/attendee/wordsearcher.rb +0 -96
data/lib/lingo/attendees.rb +0 -289
data/lib/lingo/const.rb +0 -131
data/lib/lingo/modules.rb +0 -98
data/lib/lingo/types.rb +0 -285
data/lib/lingo/utilities.rb +0 -40

metadata CHANGED

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: lingo
 version: !ruby/object:Gem::Version
-  version: 1.8.0
+  version: 1.8.1
   prerelease:
 platform: ruby
 authors:
@@ -10,22 +10,22 @@ authors:
 autorequire:
 bindir: bin
 cert_chain: []
-date: 2012-01-01 00:00:00.000000000 Z
+date: 2012-02-19 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: ruby-nuggets
-  requirement: &12570880 !ruby/object:Gem::Requirement
+  requirement: &10045620 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
       - !ruby/object:Gem::Version
-        version: 0.8.2
+        version: 0.8.5
   type: :runtime
   prerelease: false
-  version_requirements: *12570880
+  version_requirements: *10045620
 - !ruby/object:Gem::Dependency
   name: unicode
-  requirement: &12594600 !ruby/object:Gem::Requirement
+  requirement: &10045140 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -33,10 +33,21 @@ dependencies:
         version: '0'
   type: :runtime
   prerelease: false
-  version_requirements: *12594600
+  version_requirements: *10045140
+- !ruby/object:Gem::Dependency
+  name: highline
+  requirement: &10044660 !ruby/object:Gem::Requirement
+    none: false
+    requirements:
+    - - ! '>='
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :runtime
+  prerelease: false
+  version_requirements: *10044660
 - !ruby/object:Gem::Dependency
   name: diff-lcs
-  requirement: &12594100 !ruby/object:Gem::Requirement
+  requirement: &10044140 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -44,10 +55,10 @@ dependencies:
         version: 1.1.3
   type: :development
   prerelease: false
-  version_requirements: *12594100
+  version_requirements: *10044140
 - !ruby/object:Gem::Dependency
   name: open4
-  requirement: &12593700 !ruby/object:Gem::Requirement
+  requirement: &10043720 !ruby/object:Gem::Requirement
     none: false
     requirements:
     - - ! '>='
@@ -55,8 +66,12 @@ dependencies:
         version: '0'
   type: :development
   prerelease: false
-  version_requirements: *12593700
-description: The full-featured automatic indexing system
+  version_requirements: *10043720
+description: ! "Lingo is an open source indexing system for research and teachings.\nThe
+  main functions of Lingo are:\n\n* identification of (i.e. reduction to) basic word
+  form by means of\n  dictionaries and suffix lists\n* algorithmic decomposition\n*
+  dictionary-based synonymisation and identification of phrases\n* generic identification
+  of phrases/word sequences based on patterns\n  of word classes\n"
 email:
 - lingo@vorhauer.de
 - jens.wille@uni-koeln.de
@@ -69,32 +84,55 @@ extra_rdoc_files:
 - COPYING
 - ChangeLog
 files:
-- lib/lingo/attendees.rb
 - lib/lingo/ctl.rb
 - lib/lingo/database.rb
-- lib/lingo/types.rb
+- lib/lingo/error.rb
 - lib/lingo/version.rb
-- lib/lingo/utilities.rb
+- lib/lingo/database/source.rb
+- lib/lingo/database/libcdb_store.rb
+- lib/lingo/database/sdbm_store.rb
+- lib/lingo/database/show_progress.rb
+- lib/lingo/database/crypter.rb
+- lib/lingo/database/source/multi_key.rb
+- lib/lingo/database/source/key_value.rb
+- lib/lingo/database/source/single_word.rb
+- lib/lingo/database/source/word_class.rb
+- lib/lingo/database/source/multi_value.rb
+- lib/lingo/database/gdbm_store.rb
+- lib/lingo/database/hash_store.rb
 - lib/lingo/cli.rb
+- lib/lingo/cachable.rb
 - lib/lingo/attendee/variator.rb
 - lib/lingo/attendee/debugger.rb
+- lib/lingo/attendee/object_filter.rb
 - lib/lingo/attendee/synonymer.rb
-- lib/lingo/attendee/wordsearcher.rb
+- lib/lingo/attendee/text_writer.rb
+- lib/lingo/attendee/multi_worder.rb
+- lib/lingo/attendee/text_reader.rb
 - lib/lingo/attendee/dehyphenizer.rb
-- lib/lingo/attendee/multiworder.rb
 - lib/lingo/attendee/tokenizer.rb
 - lib/lingo/attendee/abbreviator.rb
-- lib/lingo/attendee/textwriter.rb
-- lib/lingo/attendee/objectfilter.rb
+- lib/lingo/attendee/formatter.rb
 - lib/lingo/attendee/noneword_filter.rb
 - lib/lingo/attendee/sequencer.rb
-- lib/lingo/attendee/textreader.rb
 - lib/lingo/attendee/decomposer.rb
+- lib/lingo/attendee/word_searcher.rb
 - lib/lingo/attendee/vector_filter.rb
 - lib/lingo/config.rb
-- lib/lingo/const.rb
-- lib/lingo/modules.rb
+- lib/lingo/core_ext.rb
+- lib/lingo/agenda_item.rb
+- lib/lingo/buffered_attendee.rb
+- lib/lingo/reportable.rb
 - lib/lingo/language.rb
+- lib/lingo/language/dictionary.rb
+- lib/lingo/language/word.rb
+- lib/lingo/language/lexical.rb
+- lib/lingo/language/word_form.rb
+- lib/lingo/language/token.rb
+- lib/lingo/language/grammar.rb
+- lib/lingo/language/lexical_hash.rb
+- lib/lingo/attendee.rb
+- lib/lingo/call.rb
 - lib/lingo.rb
 - bin/lingo
 - bin/lingoctl
@@ -147,17 +185,17 @@ files:
 - test/lir.csv
 - test/attendee/ts_abbreviator.rb
 - test/attendee/ts_noneword_filter.rb
-- test/attendee/ts_wordsearcher.rb
-- test/attendee/ts_textwriter.rb
+- test/attendee/ts_word_searcher.rb
+- test/attendee/ts_object_filter.rb
 - test/attendee/ts_vector_filter.rb
-- test/attendee/ts_multiworder.rb
-- test/attendee/ts_textreader.rb
-- test/attendee/ts_objectfilter.rb
+- test/attendee/ts_text_writer.rb
 - test/attendee/ts_decomposer.rb
 - test/attendee/ts_sequencer.rb
 - test/attendee/ts_synonymer.rb
 - test/attendee/ts_tokenizer.rb
 - test/attendee/ts_variator.rb
+- test/attendee/ts_text_reader.rb
+- test/attendee/ts_multi_worder.rb
 - test/mul.txt
 - test/test_helper.rb
 - test/ref/artikel.ven
@@ -185,7 +223,7 @@ rdoc_options:
 - --line-numbers
 - --all
 - --title
-- lingo Application documentation (v1.8.0)
+- lingo Application documentation (v1.8.1)
 - --main
 - README
 require_paths:
@@ -204,7 +242,7 @@ required_rubygems_version: !ruby/object:Gem::Requirement
       version: '0'
 requirements: []
 rubyforge_project:
-rubygems_version: 1.8.13
+rubygems_version: 1.8.17
 signing_key:
 specification_version: 3
 summary: The full-featured automatic indexing system

data/lib/lingo/attendee/multiworder.rb DELETED

@@ -1,301 +0,0 @@
-# encoding: utf-8
-#--
-# LINGO ist ein Indexierungssystem mit Grundformreduktion, Kompositumzerlegung,
-# Mehrworterkennung und Relationierung.
-#
-# Copyright (C) 2005-2007 John Vorhauer
-# Copyright (C) 2007-2011 John Vorhauer, Jens Wille
-#
-# This program is free software; you can redistribute it and/or modify it under
-# the terms of the GNU Affero General Public License as published by the Free
-# Software Foundation; either version 3 of the License, or (at your option)
-# any later version.
-#
-# This program is distributed in the hope that it will be useful, but WITHOUT
-# ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS
-# FOR A PARTICULAR PURPOSE. See the GNU Affero General Public License for more
-# details.
-#
-# You should have received a copy of the GNU Affero General Public License along
-# with this program; if not, write to the Free Software Foundation, Inc.,
-# 51 Franklin St, Fifth Floor, Boston, MA 02110, USA
-#
-# For more information visit http://www.lex-lingo.de or contact me at
-# welcomeATlex-lingoDOTde near 50°55'N+6°55'E.
-#
-# Lex Lingo rules from here on
-#++
-class Lingo
-  # Mit der bisher beschriebenen Vorgehensweise werden die durch den Tokenizer erkannten
-  # Token aufgelöst und in Words verwandelt und über den Abbreviator und Decomposer auch
-  # Spezialfälle behandelt, die einzelne Wörter betreffen.
-  # Um jedoch auch Namen wie z.B. John F. Kennedy als Sinneinheit erkennen zu können, muss
-  # eine Analyse über mehrere Objekte erfolgen. Dies ist die Hauptaufgabe des Multiworders.
-  # Der Multiworder analysiert die Teile des Datenstroms, die z.B. durch Satzzeichen oder
-  # weiteren Einzelzeichen (z.B. '(') begrenzt sind. Erkannte Mehrwortgruppen werden als
-  # zusätzliches Objekt in den Datenstrom mit eingefügt.
-  #
-  # === Mögliche Verlinkung
-  # Erwartet:: Daten vom Typ *Word* z.B. von Wordsearcher, Decomposer, Ocr_variator, Multiworder
-  # Erzeugt:: Daten vom Typ *Word* (mit Attribut WA_MULTIWORD). Je erkannter Mehrwortgruppe wird ein zusätzliches Word-Objekt in den Datenstrom eingefügt. Z.B. für Ocr_variator, Sequencer, Noneword_filter, Vector_filter
-  #
-  # === Parameter
-  # Kursiv dargestellte Parameter sind optional (ggf. mit Angabe der Voreinstellung).
-  # Alle anderen Parameter müssen zwingend angegeben werden.
-  # <b>in</b>:: siehe allgemeine Beschreibung des Attendee
-  # <b>out</b>:: siehe allgemeine Beschreibung des Attendee
-  # <b>source</b>:: siehe allgemeine Beschreibung des Dictionary
-  # <b><i>mode</i></b>:: (Standard: all) siehe allgemeine Beschreibung des Dictionary
-  # <b><i>stopper</i></b>:: (Standard: TA_PUNCTUATION, TA_OTHER) Gibt die Begrenzungen an, zwischen
-  #                         denen der Multiworder suchen soll, i.d.R. Satzzeichen und Sonderzeichen,
-  #                         weil sie kaum in einer Mehrwortgruppen vorkommen.
-  #
-  # === Beispiele
-  # Bei der Verarbeitung einer normalen Textdatei mit der Ablaufkonfiguration <tt>t1.cfg</tt>
-  #   meeting:
-  #     attendees:
-  #       - textreader:   { out: lines, files: '$(files)' }
-  #       - tokenizer:    { in: lines, out: token }
-  #       - abbreviator:   { in: token, out: abbrev, source: 'sys-abk' }
-  #       - wordsearcher: { in: abbrev, out: words, source: 'sys-dic' }
-  #       - decomposer:   { in: words, out: comps, source: 'sys-dic' }
-  #       - multiworder:  { in: comps, out: multi, source: 'sys-mul' }
-  #       - debugger:     { in: multi, prompt: 'out>' }
-  # ergibt die Ausgabe über den Debugger: <tt>lingo -c t1 test.txt</tt>
-  #   out> *FILE('test.txt')
-  #   out> <Sein = [(sein/s), (sein/v)]>
-  #   out> <Name = [(name/s)]>
-  #   out> <ist = [(sein/v)]>
-  #   out> <johann van siegen|MUL = [(johann van siegen/m)]>
-  #   out> <Johann = [(johann/e)]>
-  #   out> <van = [(van/w)]>
-  #   out> <Siegen = [(sieg/s), (siegen/v), (siegen/e)]>
-  #   out> :./PUNC:
-  #   out> *EOL('test.txt')
-  #   out> *EOF('test.txt')
-  class Attendee::Multiworder < BufferedAttendee
-    protected
-    def init
-      # Parameter verwerten
-      @stopper = get_array('stopper', TA_PUNCTUATION+','+TA_OTHER).collect {|s| s.upcase }
-      # Wörterbuch bereitstellen
-      mul_src = get_array('source')
-      mul_mod = get_key('mode', 'all')
-      @mul_dic = Dictionary.new({'source'=>mul_src, 'mode'=>mul_mod}, @lingo)
-      # combine lexical variants?
-      #
-      # false = old behaviour
-      # true  = first match
-      # 'all' = all matches
-      @combine  = get_key('combine', false)
-      @all_keys = @combine.is_a?(String) && @combine.downcase == 'all'
-      # Lexikalisierungs-Wörterbuch aus angegebenen Quellen ermitteln
-      lex_src, lex_mod, databases = nil, nil, @lingo.dictionary_config['databases']
-      mul_src.each { |src|
-        this_src, this_mod = databases[src].values_at('use-lex', 'lex-mode')
-        if lex_src.nil? || lex_src==this_src
-          lex_src, lex_mod = this_src, this_mod
-        else
-          forward(STR_CMD_WARN, "Die Mehrwortwörterbücher #{mul_src.join(',')} sind mit unterschiedlichen Wörterbüchern lexikalisiert worden")
-        end
-      }
-      lex_mod = get_key('lex-mode', lex_mod || 'first')
-      @lex_dic = Dictionary.new({'source'=>lex_src.split(STRING_SEPERATOR_PATTERN), 'mode'=>lex_mod}, @lingo)
-      @lex_gra = Grammar.new({'source'=>lex_src.split(STRING_SEPERATOR_PATTERN), 'mode'=>lex_mod}, @lingo)
-      if @combine && has_key?('use-syn')
-        syn_src = get_array('use-syn')
-        syn_mod = get_key('syn-mode', 'all')
-        @syn_dic = Dictionary.new({'source'=>syn_src, 'mode'=>syn_mod}, @lingo)
-      end
-      @number_of_expected_tokens_in_buffer = 3
-      @eof_handling = false
-    end
-    def control(cmd, par)
-      @mul_dic.report.each_pair { |key, value| set(key, value) } if cmd == STR_CMD_STATUS
-      # Jedes Control-Object ist auch Auslöser der Verarbeitung
-      if cmd == STR_CMD_RECORD || cmd == STR_CMD_EOF
-        @eof_handling = true
-        while number_of_valid_tokens_in_buffer > 1
-          process_buffer
-        end
-        forward_number_of_token( @buffer.size, false )
-        @eof_handling = false
-      end
-    end
-    def process_buffer?
-      number_of_valid_tokens_in_buffer >= @number_of_expected_tokens_in_buffer
-    end
-    def process_buffer
-      unless @buffer[0].form == CHAR_PUNCT
-        # Prüfe 3er Schlüssel
-        result = check_multiword_key( 3 )
-        unless result.empty?
-          # 3er Schlüssel gefunden
-          lengths = sort_result_len( result )
-          unless lengths[0] > 3
-            # Längster erkannter Schlüssel = 3
-            create_and_forward_multiword( 3, result )
-            forward_number_of_token( 3 )
-            return
-          else
-            # Längster erkannter Schlüssel > 3, Buffer voll genug?
-            unless @buffer.size >= lengths[0] || @eof_handling
-              @number_of_expected_tokens_in_buffer = lengths[0]
-              return
-            else
-              # Buffer voll genug, Verarbeitung kann beginnen
-              catch( :forward_one ) do
-                lengths.each do |len|
-                  result = check_multiword_key( len )
-                  unless result.empty?
-                    create_and_forward_multiword( len, result )
-                    forward_number_of_token( len )
-                    throw :forward_one
-                  end
-                end
-                # Keinen Match gefunden
-                forward_number_of_token( 1 )
-              end
-              @number_of_expected_tokens_in_buffer = 3
-              process_buffer if process_buffer?
-              return
-            end
-          end
-        end
-        # Prüfe 2er Schlüssel
-        result = check_multiword_key( 2 )
-        unless result.empty?
-          create_and_forward_multiword( 2, result )
-          forward_number_of_token( 1 )
-        end
-      end
-      # Buffer weiterschaufeln
-      forward_number_of_token( 1, false )
-      @number_of_expected_tokens_in_buffer = 3
-    end
-    private
-    def create_and_forward_multiword( len, lexicals )
-      # Form aus Buffer auslesen und Teile markieren
-      pos = 0
-      form_parts = []
-      begin
-        if @buffer[pos].form == CHAR_PUNCT
-          @buffer.delete_at( pos )
-          form_parts[-1] += CHAR_PUNCT
-        else
-          @buffer[pos].attr = WA_UNKMULPART if @buffer[pos].attr == WA_UNKNOWN
-          form_parts << @buffer[pos].form
-          pos += 1
-        end
-      end while pos < len
-      form = form_parts.join( ' ' )
-      # Multiword erstellen
-      word = Word.new( form, WA_MULTIWORD )
-      word << lexicals.collect { |lex| (lex.is_a?(Lexical)) ? lex : nil }.compact  # FIXME 1.60 - Ausstieg bei "*5" im Synonymer
-      # Forword Multiword
-      forward( word )
-    end
-    # Leitet 'len' Token weiter
-    def forward_number_of_token( len, count_punc = true )
-      begin
-        unless @buffer.empty?
-          forward( @buffer[0] )
-          len -= 1 unless count_punc && @buffer[0].form == CHAR_PUNCT
-          @buffer.delete_at( 0 )
-        end
-      end while len > 0
-    end
-    # Ermittelt die maximale Ergebnislänge
-    def sort_result_len( result )
-      result.collect do |res|
-        if res.is_a?( Lexical )
-          res.form.split( ' ' ).size
-        else
-          res =~ /^\*(\d+)/
-          $1.to_i
-        end
-      end.sort.reverse
-    end
-    # Prüft einen definiert langen Schlüssel ab Position 0 im Buffer
-    def check_multiword_key( len )
-      return [] if number_of_valid_tokens_in_buffer < len
-      # Wortformen aus der Wortliste auslesen
-      sequence = @buffer.map { |obj|
-        next [obj] unless obj.is_a?(StringA)
-        form = obj.form
-        next if form == CHAR_PUNCT
-        word = @lex_dic.find_word(form)
-        word = @lex_gra.find_compositum(form) if word.attr == WA_UNKNOWN
-        lexicals = word.attr == WA_KOMPOSITUM ?
-          [word.lexicals.first] : word.lexicals.dup
-        lexicals << word if lexicals.empty?
-        lexicals += @syn_dic.find_synonyms(word) if @syn_dic
-        lexicals.map { |lex| lex.form }.uniq
-      }.compact[0, len]
-      if @combine
-        keys, muls = [], []
-        sequence.each { |forms|
-          keys = forms.map { |form|
-            keys.empty? ? form : keys.map { |key| "#{key} #{form}" }
-          }.flatten(1)
-        }
-        keys.each { |key|
-          mul = @mul_dic.select(key.downcase)
-          unless mul.empty?
-            muls.concat(mul)
-            break unless @all_keys
-          end
-        }
-        muls.uniq
-      else
-        key = sequence.map { |forms| forms.first }.join(' ')
-        @mul_dic.select(key.downcase)
-      end
-    end
-    # Liefert die Anzahl gültiger Token zurück
-    def number_of_valid_tokens_in_buffer
-      @buffer.collect { |token| (token.form == CHAR_PUNCT) ? nil : 1 }.compact.size
-    end
-  end
-end