RubyGems - langscan - Versions diffs - 1.2 - Mend

langscan 1.2

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (168) hide show

data/AUTHORS.txt +19 -0
data/History.txt +126 -0
data/Manifest.txt +167 -0
data/README.rdoc +89 -0
data/Rakefile +40 -0
data/ext/langscan/_make_c.rb +20 -0
data/ext/langscan/_make_h.rb +30 -0
data/ext/langscan/_template.c +134 -0
data/ext/langscan/_template.h +53 -0
data/ext/langscan/c/c/Makefile +157 -0
data/ext/langscan/c/c/c.c +134 -0
data/ext/langscan/c/c/c.h +66 -0
data/ext/langscan/c/c/ctok.c +4622 -0
data/ext/langscan/c/c/ctok.l +212 -0
data/ext/langscan/c/c/extconf.rb +3 -0
data/ext/langscan/c/c/modulename.txt +1 -0
data/ext/langscan/c/c/tokenlist.txt +13 -0
data/ext/langscan/csharp/csharp/Makefile +157 -0
data/ext/langscan/csharp/csharp/csharp.c +134 -0
data/ext/langscan/csharp/csharp/csharp.h +65 -0
data/ext/langscan/csharp/csharp/csharptok.c +2965 -0
data/ext/langscan/csharp/csharp/csharptok.l +200 -0
data/ext/langscan/csharp/csharp/extconf.rb +3 -0
data/ext/langscan/csharp/csharp/modulename.txt +1 -0
data/ext/langscan/csharp/csharp/tokenlist.txt +12 -0
data/ext/langscan/d/d/Makefile +157 -0
data/ext/langscan/d/d/d.c +134 -0
data/ext/langscan/d/d/d.h +64 -0
data/ext/langscan/d/d/dtok.c +5461 -0
data/ext/langscan/d/d/dtok.l +282 -0
data/ext/langscan/d/d/extconf.rb +3 -0
data/ext/langscan/d/d/modulename.txt +1 -0
data/ext/langscan/d/d/tokenlist.txt +11 -0
data/ext/langscan/elisp/elisp/Makefile +157 -0
data/ext/langscan/elisp/elisp/elisp.c +134 -0
data/ext/langscan/elisp/elisp/elisp.h +62 -0
data/ext/langscan/elisp/elisp/elisptok.c +2101 -0
data/ext/langscan/elisp/elisp/elisptok.l +151 -0
data/ext/langscan/elisp/elisp/extconf.rb +3 -0
data/ext/langscan/elisp/elisp/modulename.txt +1 -0
data/ext/langscan/elisp/elisp/tokenlist.txt +9 -0
data/ext/langscan/java/java/Makefile +157 -0
data/ext/langscan/java/java/extconf.rb +3 -0
data/ext/langscan/java/java/java.c +134 -0
data/ext/langscan/java/java/java.h +64 -0
data/ext/langscan/java/java/javatok.c +2090 -0
data/ext/langscan/java/java/javatok.l +155 -0
data/ext/langscan/java/java/modulename.txt +1 -0
data/ext/langscan/java/java/tokenlist.txt +11 -0
data/ext/langscan/javascript/javascript/Makefile +157 -0
data/ext/langscan/javascript/javascript/extconf.rb +3 -0
data/ext/langscan/javascript/javascript/javascript.c +134 -0
data/ext/langscan/javascript/javascript/javascript.h +63 -0
data/ext/langscan/javascript/javascript/javascripttok.c +2051 -0
data/ext/langscan/javascript/javascript/javascripttok.l +147 -0
data/ext/langscan/javascript/javascript/modulename.txt +1 -0
data/ext/langscan/javascript/javascript/tokenlist.txt +10 -0
data/ext/langscan/pairmatcher/pairmatcher/Makefile +157 -0
data/ext/langscan/pairmatcher/pairmatcher/extconf.rb +3 -0
data/ext/langscan/pairmatcher/pairmatcher/pairmatcher.c +890 -0
data/ext/langscan/php/php/Makefile +157 -0
data/ext/langscan/php/php/extconf.rb +3 -0
data/ext/langscan/php/php/modulename.txt +1 -0
data/ext/langscan/php/php/php.c +134 -0
data/ext/langscan/php/php/php.h +64 -0
data/ext/langscan/php/php/phptok.c +2406 -0
data/ext/langscan/php/php/phptok.l +212 -0
data/ext/langscan/php/php/tokenlist.txt +11 -0
data/ext/langscan/post-distclean.rb +21 -0
data/ext/langscan/pre-config.rb +57 -0
data/ext/langscan/python/python/Makefile +157 -0
data/ext/langscan/python/python/extconf.rb +3 -0
data/ext/langscan/python/python/modulename.txt +1 -0
data/ext/langscan/python/python/python.c +134 -0
data/ext/langscan/python/python/python.h +61 -0
data/ext/langscan/python/python/pythontok.c +2102 -0
data/ext/langscan/python/python/pythontok.l +155 -0
data/ext/langscan/python/python/tokenlist.txt +8 -0
data/ext/langscan/ruby/compat/ripper/Makefile +158 -0
data/ext/langscan/ruby/compat/ripper/depend +1 -0
data/ext/langscan/ruby/compat/ripper/extconf.rb +4 -0
data/ext/langscan/ruby/compat/ripper/include/eventids1.c +251 -0
data/ext/langscan/ruby/compat/ripper/include/eventids2.c +277 -0
data/ext/langscan/ruby/compat/ripper/include/lex.c +138 -0
data/ext/langscan/ruby/compat/ripper/ripper.c +14420 -0
data/ext/langscan/scheme/scheme/Makefile +157 -0
data/ext/langscan/scheme/scheme/extconf.rb +3 -0
data/ext/langscan/scheme/scheme/modulename.txt +1 -0
data/ext/langscan/scheme/scheme/scheme.c +134 -0
data/ext/langscan/scheme/scheme/scheme.h +60 -0
data/ext/langscan/scheme/scheme/schemetok.c +2447 -0
data/ext/langscan/scheme/scheme/schemetok.l +177 -0
data/ext/langscan/scheme/scheme/tokenlist.txt +7 -0
data/ext/langscan/sh/sh/Makefile +157 -0
data/ext/langscan/sh/sh/extconf.rb +3 -0
data/ext/langscan/sh/sh/modulename.txt +1 -0
data/ext/langscan/sh/sh/sh.c +134 -0
data/ext/langscan/sh/sh/sh.h +61 -0
data/ext/langscan/sh/sh/shtok.c +2470 -0
data/ext/langscan/sh/sh/shtok.l +325 -0
data/ext/langscan/sh/sh/tokenlist.txt +8 -0
data/lib/langscan.rb +124 -0
data/lib/langscan/_common.rb +50 -0
data/lib/langscan/_easyscanner.rb +78 -0
data/lib/langscan/_pairmatcher.rb +46 -0
data/lib/langscan/_type.rb +125 -0
data/lib/langscan/autoconf.rb +51 -0
data/lib/langscan/automake.rb +51 -0
data/lib/langscan/brainfuck.rb +48 -0
data/lib/langscan/c.rb +144 -0
data/lib/langscan/csharp.rb +101 -0
data/lib/langscan/css.rb +109 -0
data/lib/langscan/d.rb +201 -0
data/lib/langscan/eiffel.rb +167 -0
data/lib/langscan/elisp.rb +132 -0
data/lib/langscan/io.rb +84 -0
data/lib/langscan/java.rb +95 -0
data/lib/langscan/javascript.rb +97 -0
data/lib/langscan/lua.rb +116 -0
data/lib/langscan/ocaml.rb +298 -0
data/lib/langscan/ocaml/camlexer.ml +28 -0
data/lib/langscan/ocaml/lexer.mll +230 -0
data/lib/langscan/ocaml/types.ml +36 -0
data/lib/langscan/perl.rb +87 -0
data/lib/langscan/perl/tokenizer.pl +231 -0
data/lib/langscan/php.rb +80 -0
data/lib/langscan/python.rb +101 -0
data/lib/langscan/rpmspec.rb +71 -0
data/lib/langscan/ruby.rb +164 -0
data/lib/langscan/ruby/compat/README +5 -0
data/lib/langscan/ruby/compat/ripper.rb +4 -0
data/lib/langscan/ruby/compat/ripper/core.rb +918 -0
data/lib/langscan/ruby/compat/ripper/filter.rb +70 -0
data/lib/langscan/ruby/compat/ripper/lexer.rb +179 -0
data/lib/langscan/ruby/compat/ripper/sexp.rb +100 -0
data/lib/langscan/scheme.rb +160 -0
data/lib/langscan/sh.rb +116 -0
data/lib/langscan/text.rb +37 -0
data/metaconfig +2 -0
data/script/console +10 -0
data/script/destroy +14 -0
data/script/generate +14 -0
data/script/makemanifest.rb +21 -0
data/setup.rb +1604 -0
data/tasks/extconf.rake +13 -0
data/tasks/extconf/langscan.rake +42 -0
data/test/langscan/brainfuck/test/test_scan.rb +55 -0
data/test/langscan/c/test/test_scan.rb +216 -0
data/test/langscan/c/test/test_token.rb +41 -0
data/test/langscan/csharp/test/test_scan.rb +157 -0
data/test/langscan/css/test/test_css.rb +79 -0
data/test/langscan/d/test/test_scan.rb +233 -0
data/test/langscan/d/test/test_token.rb +205 -0
data/test/langscan/eiffel/test/test_eiffel.rb +95 -0
data/test/langscan/elisp/test/test_elisp.rb +177 -0
data/test/langscan/io/test/test_io.rb +79 -0
data/test/langscan/java/test/test_java.rb +74 -0
data/test/langscan/javascript/test/test_javascript.rb +39 -0
data/test/langscan/lua/test/test_lua.rb +69 -0
data/test/langscan/ocaml/test/test_ocaml.rb +161 -0
data/test/langscan/php/test/test_scan.rb +138 -0
data/test/langscan/python/test/test_scan.rb +105 -0
data/test/langscan/rpmspec/test/test_rpmspec.rb +51 -0
data/test/langscan/ruby/test/test_scan.rb +71 -0
data/test/langscan/scheme/test/test_scan.rb +198 -0
data/test/test_helper.rb +7 -0
data/test/test_langscan.rb +123 -0
metadata +296 -0

data/lib/langscan/ruby/compat/ripper/filter.rb ADDED Viewed

@@ -0,0 +1,70 @@
+#
+# ripper/filter.rb
+#
+# Copyright (C) 2004 Minero Aoki
+#
+# This program is free software.
+# You can distribute and/or modify this program under the Ruby License.
+# For details of Ruby License, see ruby/COPYING.
+#
+require 'langscan/ruby/compat/ripper/lexer'
+class Ripper
+  # This class handles only scanner events,
+  # and they are dispatched in the `right' order (same with input).
+  class Filter
+    def initialize(src, filename = '-', lineno = 1)
+      @__lexer = Lexer.new(src, filename, lineno)
+      @__line = nil
+      @__col = nil
+    end
+    # The file name of the input.
+    def filename
+      @__lexer.filename
+    end
+    # The line number of the current token.
+    # This value starts from 1.
+    # This method is valid only in event handlers.
+    def lineno
+      @__line
+    end
+    # The column number of the current token.
+    # This value starts from 0.
+    # This method is valid only in event handlers.
+    def column
+      @__col
+    end
+    # Starts parsing.  _init_ is a data accumulator.
+    # It is passed to the next event handler (as of Enumerable#inject).
+    def parse(init = nil)
+      data = init
+      @__lexer.lex.each do |pos, event, tok|
+        @__line, @__col = *pos
+        data = if respond_to?(event, true)
+               then __send__(event, tok, data)
+               else on_default(event, tok, data)
+               end
+      end
+      data
+    end
+    private
+    # This method is called when some event handler have not defined.
+    # _event_ is :on_XXX, _token_ is scanned token, _data_ is a data
+    # accumulator.  The return value of this method is passed to the
+    # next event handler (as of Enumerable#inject).
+    def on_default(event, token, data)
+      data
+    end
+  end
+end

data/lib/langscan/ruby/compat/ripper/lexer.rb ADDED Viewed

@@ -0,0 +1,179 @@
+#
+# ripper/lexer.rb
+#
+# Copyright (C) 2004,2005 Minero Aoki
+#
+# This program is free software.
+# You can distribute and/or modify this program under the Ruby License.
+# For details of Ruby License, see ruby/COPYING.
+#
+require 'langscan/ruby/compat/ripper/core'
+class Ripper
+  # Tokenizes Ruby program and returns an Array of String.
+  def Ripper.tokenize(src, filename = '-', lineno = 1)
+    Lexer.new(src, filename, lineno).tokenize
+  end
+  # Tokenizes Ruby program and returns an Array of Array,
+  # which is formatted like [[lineno, column], type, token].
+  #
+  #   require 'ripper'
+  #   require 'pp'
+  #
+  #   p Ripper.scan("def m(a) nil end")
+  #     #=> [[[1,  0], :on_kw,     "def"],
+  #          [[1,  3], :on_sp,     " "  ],
+  #          [[1,  4], :on_ident,  "m"  ],
+  #          [[1,  5], :on_lparen, "("  ],
+  #          [[1,  6], :on_ident,  "a"  ],
+  #          [[1,  7], :on_rparen, ")"  ],
+  #          [[1,  8], :on_sp,     " "  ],
+  #          [[1,  9], :on_kw,     "nil"],
+  #          [[1, 12], :on_sp,     " "  ],
+  #          [[1, 13], :on_kw,     "end"]]
+  #
+  def Ripper.lex(src, filename = '-', lineno = 1)
+    Lexer.new(src, filename, lineno).lex
+  end
+  class Lexer < ::Ripper   #:nodoc: internal use only
+    def tokenize
+      lex().map {|pos, event, tok| tok }
+    end
+    def lex
+      parse().sort_by {|pos, event, tok| pos }
+    end
+    def parse
+      @buf = []
+      super
+      @buf
+    end
+    private
+    SCANNER_EVENTS.each do |event|
+      module_eval(<<-End, __FILE__+'/module_eval', __LINE__ + 1)
+        def on_#{event}(tok)
+          @buf.push [[lineno(), column()], :on_#{event}, tok]
+        end
+      End
+    end
+  end
+  # [EXPERIMENTAL]
+  # Parses +src+ and return a string which was matched to +pattern+.
+  # +pattern+ should be described as Regexp.
+  #
+  #   require 'ripper'
+  #
+  #   p Ripper.slice('def m(a) nil end', 'ident')                   #=> "m"
+  #   p Ripper.slice('def m(a) nil end', '[ident lparen rparen]+')  #=> "m(a)"
+  #   p Ripper.slice("<<EOS\nstring\nEOS",
+  #                  'heredoc_beg nl $(tstring_content*) heredoc_end', 1)
+  #       #=> "string\n"
+  #
+  def Ripper.slice(src, pattern, n = 0)
+    if m = token_match(src, pattern)
+    then m.string(n)
+    else nil
+    end
+  end
+  def Ripper.token_match(src, pattern)   #:nodoc:
+    TokenPattern.compile(pattern).match(src)
+  end
+  class TokenPattern   #:nodoc:
+    class Error < ::StandardError; end
+    class CompileError < Error; end
+    class MatchError < Error; end
+    class << self
+      alias compile new
+    end
+    def initialize(pattern)
+      @source = pattern
+      @re = compile(pattern)
+    end
+    def match(str)
+      match_list(::Ripper.lex(str))
+    end
+    def match_list(tokens)
+      if m = @re.match(map_tokens(tokens))
+      then MatchData.new(tokens, m)
+      else nil
+      end
+    end
+    private
+    def compile(pattern)
+      if m = /[^\w\s$()\[\]{}?*+\.]/.match(pattern)
+        raise CompileError, "invalid char in pattern: #{m[0].inspect}"
+      end
+      buf = ''
+      pattern.scan(/(?:\w+|\$\(|[()\[\]\{\}?*+\.]+)/) do |tok|
+        case tok
+        when /\w/
+          buf.concat map_token(tok)
+        when '$('
+          buf.concat '('
+        when '('
+          buf.concat '(?:'
+        when /[?*\[\])\.]/
+          buf.concat tok
+        else
+          raise 'must not happen'
+        end
+      end
+      Regexp.compile(buf)
+    rescue RegexpError => err
+      raise CompileError, err.message
+    end
+    def map_tokens(tokens)
+      tokens.map {|pos,type,str| map_token(type.to_s.sub(/\Aon_/,'')) }.join
+    end
+    MAP = {}
+    seed = ('a'..'z').to_a + ('A'..'Z').to_a + ('0'..'9').to_a
+    SCANNER_EVENT_TABLE.each do |ev, |
+      raise CompileError, "[RIPPER FATAL] too many system token" if seed.empty?
+      MAP[ev.to_s.sub(/\Aon_/,'')] = seed.shift
+    end
+    def map_token(tok)
+      MAP[tok]  or raise CompileError, "unknown token: #{tok}"
+    end
+    class MatchData
+      def initialize(tokens, match)
+        @tokens = tokens
+        @match = match
+      end
+      def string(n = 0)
+        return nil unless @match
+        match(n).join
+      end
+      private
+      def match(n = 0)
+        return [] unless @match
+        @tokens[@match.begin(n)...@match.end(n)].map {|pos,type,str| str }
+      end
+    end
+  end
+end

data/lib/langscan/ruby/compat/ripper/sexp.rb ADDED Viewed

@@ -0,0 +1,100 @@
+#
+# ripper/sexp.rb
+#
+# Copyright (C) 2004,2005 Minero Aoki
+#
+# This program is free software.
+# You can distribute and/or modify this program under the Ruby License.
+# For details of Ruby License, see ruby/COPYING.
+#
+require 'langscan/ruby/compat/ripper/core'
+class Ripper
+  # [EXPERIMENTAL]
+  # Parses +src+ and create S-exp tree.
+  # This method is for mainly developper use.
+  #
+  #   require 'ripper'
+  #   require 'pp
+  #
+  #   pp Ripper.sexp("def m(a) nil end")
+  #     #=> [:program,
+  #          [:stmts_add,
+  #           [:stmts_new],
+  #           [:def,
+  #            [:@ident, "m", [1, 4]],
+  #            [:paren, [:params, [[:@ident, "a", [1, 6]]], nil, nil, nil]],
+  #            [:bodystmt,
+  #             [:stmts_add, [:stmts_new], [:var_ref, [:@kw, "nil", [1, 9]]]],
+  #             nil,
+  #             nil,
+  #             nil]]]]
+  #
+  def Ripper.sexp(src, filename = '-', lineno = 1)
+    SexpBuilderPP.new(src, filename, lineno).parse
+  end
+  def Ripper.sexp_raw(src, filename = '-', lineno = 1)
+    SexpBuilder.new(src, filename, lineno).parse
+  end
+  class SexpBuilderPP < ::Ripper   #:nodoc:
+    private
+    PARSER_EVENTS.each do |event|
+      case event.to_s
+      when /_new\z/
+        module_eval(<<-End, __FILE__, __LINE__ + 1)
+          def on_#{event}(*args)
+            []
+          end
+        End
+      when /_add\z/
+        module_eval(<<-End, __FILE__, __LINE__ + 1)
+          def on_#{event}(list, item)
+            list.push item
+            list
+          end
+        End
+      else
+        module_eval(<<-End, __FILE__, __LINE__ + 1)
+          def on_#{event}(*args)
+            [:#{event}, *args]
+          end
+        End
+      end
+    end
+    SCANNER_EVENTS.each do |event|
+      module_eval(<<-End, __FILE__, __LINE__ + 1)
+        def on_#{event}(tok)
+          [:@#{event}, tok, [lineno(), column()]]
+        end
+      End
+    end
+  end
+  class SexpBuilder < ::Ripper   #:nodoc:
+    private
+    PARSER_EVENTS.each do |event|
+      module_eval(<<-End, __FILE__, __LINE__ + 1)
+        def on_#{event}(*args)
+          args.unshift :#{event}
+          args
+        end
+      End
+    end
+    SCANNER_EVENTS.each do |event|
+      module_eval(<<-End, __FILE__, __LINE__ + 1)
+        def on_#{event}(tok)
+          [:@#{event}, tok, [lineno(), column()]]
+        end
+      End
+    end
+  end
+end

data/lib/langscan/scheme.rb ADDED Viewed

@@ -0,0 +1,160 @@
+#
+# scheme.rb - a Scheme module of LangScan
+#
+# Copyright (C) 2005 Kenichi Ishibashi <bashi at dream.ie.ariake-nct.ac.jp>
+#     All rights reserved.
+#     This is free software with ABSOLUTELY NO WARRANTY.
+#
+# You can redistribute it and/or modify it under the terms of
+# the GNU General Public License version 2.
+#
+require 'langscan/scheme/scheme'
+require 'langscan/_common'
+require 'langscan/_pairmatcher'
+class Struct::LangScanPair
+  def each_outer
+    ret = self
+    while o = ret.outer
+      yield o
+    end
+  end
+end
+module LangScan
+  module Scheme
+    module_function
+    def name
+      "Scheme"
+    end
+    def abbrev
+      "scheme"
+    end
+    def extnames
+      [".scm"]
+    end
+    # LangScan::Scheme.scan iterates over Scheme program.
+    # It yields for each Fragment.
+    def scan(input, &block)
+      sorter = PairMatcher.fragmentsorter(block)
+      scan_unsorted(input, &sorter)
+    end
+    def scan_unsorted(input, &block)
+      pm = LangScan::PairMatcher.new(2,2,2,2)
+      pm.define_intertoken_fragment :space, nil
+      pm.define_intertoken_fragment :comment, nil
+      pm.define_pair :paren, :punct, "(", :punct, ")"
+      pm.define_pair :vector, :punct, "#(", :punct, ")"
+      reporter = lambda {|f|
+        if (f.type == :ident || f.type == :funcall) && KeywordsHash[f.text]
+          f.type = :keyword
+        end
+        if f.type == :number
+          f.type = if f.text.include?("i")
+                     :imaginary
+                   elsif f.text =~ /[.\/]|[0-9]#*[esfdl][0-9\-+]/
+                     :floating
+                   else
+                     :integer
+                   end
+        end
+        if f.type == :quote_chars
+          f.type = :punct
+        end
+        yield f
+      }
+      pm.parse(LangScan::Scheme::Tokenizer.new(input), reporter) {|list|
+        if list.around_open(1).type == :ident
+          list.around_open(1).type = case
+                                     when fundef_list?(list)
+                                       :fundef
+                                     when funcall_list?(list)
+                                       :funcall
+                                     else
+                                       :ident
+                                     end
+        end
+      }
+    end
+    def fundef_list?(list)
+      if list.before_open_length >= 1 && list.around_open(-1).text == "define"
+        return true
+      end
+      return false
+    end
+    def funcall_list?(list)
+      if list.before_open_length == 0
+        return true
+      end
+      if NotFuncallWordsHash[list.around_open(-1).text]
+        return false
+      end
+      if quote_list?(list)
+        return false
+      end
+      outer = list.outer
+      second_outer = outer.outer unless outer == nil
+      if second_outer and NotFuncall2ndOuterWordsHash[second_outer.around_open(1).text]
+        if NotFuncall2ndOuterWordsHash[outer.around_open(-1).text]
+          return false
+        end
+      end
+      return true
+    end
+    def quote_nestlevel(str)
+      str.count("`") - str.count(",")
+    end
+    def quote_list?(list)
+      l = list
+      nest = 0
+      while l
+        if l.before_open_length >= 1
+          before = l.around_open(-1)
+          if before.type == :quote_chars
+            return true if before.text.include?("'")
+            nest = nest + quote_nestlevel(before.text)
+          end
+        end
+        if l.after_open_length >= 1
+          after = l.around_open(1)
+          if after.text == 'quote'
+            return true
+          elsif after.text == 'quasiquote'
+            nest = nest + 1
+          elsif after.text == 'unquote'
+            nest = nest - 1
+          end
+        end
+        l = l.outer
+      end
+      return nest > 0
+    end
+    Keywords = %w(
+      else => define unquote unquote-splicing quote lambda if
+      set! begin cond and or case let let* letrec do delay quasiquote
+      syntax-rules define-syntax
+    )
+    KeywordsHash = {}
+    Keywords.each {|k| KeywordsHash[k] = k }
+    NotFuncallWordsHash = {"lambda" => "lambda"}
+    NotFuncall2ndOuterWords = %w(
+      let let* letrec let-syntax letrec-syntax do
+    )
+    NotFuncall2ndOuterWordsHash = {}
+    NotFuncall2ndOuterWords.each {|k| NotFuncall2ndOuterWordsHash[k] = k }
+    LangScan.register(self)
+  end
+end