RubyGems - coderay - Versions diffs - 1.0.0.598.pre → 1.0.0.738.pre - Mend

coderay 1.0.0.598.pre → 1.0.0.738.pre

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (55) hide show

data/bin/coderay +1 -1
data/lib/coderay.rb +38 -32
data/lib/coderay/duo.rb +1 -54
data/lib/coderay/encoder.rb +31 -33
data/lib/coderay/encoders/_map.rb +4 -2
data/lib/coderay/encoders/comment_filter.rb +0 -61
data/lib/coderay/encoders/count.rb +2 -23
data/lib/coderay/encoders/debug.rb +11 -60
data/lib/coderay/encoders/filter.rb +0 -46
data/lib/coderay/encoders/html.rb +83 -91
data/lib/coderay/encoders/html/css.rb +1 -6
data/lib/coderay/encoders/html/numbering.rb +18 -21
data/lib/coderay/encoders/html/output.rb +10 -52
data/lib/coderay/encoders/json.rb +19 -39
data/lib/coderay/encoders/lines_of_code.rb +7 -52
data/lib/coderay/encoders/null.rb +6 -13
data/lib/coderay/encoders/statistic.rb +30 -93
data/lib/coderay/encoders/terminal.rb +3 -4
data/lib/coderay/encoders/text.rb +1 -23
data/lib/coderay/encoders/token_kind_filter.rb +0 -58
data/lib/coderay/helpers/file_type.rb +119 -240
data/lib/coderay/helpers/gzip.rb +41 -0
data/lib/coderay/helpers/plugin.rb +237 -307
data/lib/coderay/scanner.rb +112 -88
data/lib/coderay/scanners/_map.rb +3 -3
data/lib/coderay/scanners/c.rb +7 -7
data/lib/coderay/scanners/clojure.rb +204 -0
data/lib/coderay/scanners/css.rb +10 -20
data/lib/coderay/scanners/debug.rb +9 -55
data/lib/coderay/scanners/diff.rb +21 -4
data/lib/coderay/scanners/html.rb +65 -18
data/lib/coderay/scanners/java.rb +3 -2
data/lib/coderay/scanners/java_script.rb +3 -3
data/lib/coderay/scanners/json.rb +7 -6
data/lib/coderay/scanners/php.rb +2 -1
data/lib/coderay/scanners/rhtml.rb +6 -2
data/lib/coderay/scanners/ruby.rb +193 -193
data/lib/coderay/scanners/ruby/patterns.rb +15 -82
data/lib/coderay/scanners/ruby/string_state.rb +71 -0
data/lib/coderay/scanners/sql.rb +1 -1
data/lib/coderay/scanners/yaml.rb +4 -2
data/lib/coderay/styles/_map.rb +2 -2
data/lib/coderay/styles/alpha.rb +48 -38
data/lib/coderay/styles/cycnus.rb +2 -1
data/lib/coderay/token_kinds.rb +88 -86
data/lib/coderay/tokens.rb +88 -112
data/test/functional/basic.rb +184 -5
data/test/functional/examples.rb +4 -4
data/test/functional/for_redcloth.rb +3 -2
data/test/functional/suite.rb +7 -6
metadata +11 -24
data/lib/coderay/helpers/gzip_simple.rb +0 -123
data/test/functional/load_plugin_scanner.rb +0 -11
data/test/functional/vhdl.rb +0 -126
data/test/functional/word_list.rb +0 -79

data/lib/coderay/scanners/css.rb CHANGED Viewed

@@ -14,12 +14,11 @@ module Scanners
     ]  # :nodoc:
     module RE  # :nodoc:
-      NonASCII = /[\x80-\xFF]/
       Hex = /[0-9a-fA-F]/
       Unicode = /\\#{Hex}{1,6}(?:\r\n|\s)?/ # differs from standard because it allows uppercase hex too
       Escape = /#{Unicode}|\\[^\r\n\f0-9a-fA-F]/
-      NMChar = /[-_a-zA-Z0-9]|#{NonASCII}|#{Escape}/
-      NMStart = /[_a-zA-Z]|#{NonASCII}|#{Escape}/
+      NMChar = /[-_a-zA-Z0-9]|#{Escape}/
+      NMStart = /[_a-zA-Z]|#{Escape}/
       NL = /\r\n|\r|\n|\f/
       String1 = /"(?:[^\n\r\f\\"]|\\#{NL}|#{Escape})*"?/  # FIXME: buggy regexp
       String2 = /'(?:[^\n\r\f\\']|\\#{NL}|#{Escape})*'?/  # FIXME: buggy regexp
@@ -55,12 +54,12 @@ module Scanners
       value_expected = nil
       states = [:initial]
       until eos?
         if match = scan(/\s+/)
           encoder.text_token match, :space
         elsif case states.last
           when :initial, :media
             if match = scan(/(?>#{RE::Ident})(?!\()|\*/ox)
@@ -102,24 +101,15 @@ module Scanners
               states[-1] = :media
             end
-          when :comment
-            if match = scan(/(?:[^*\s]|\*(?!\/))+/)
-              encoder.text_token match, :comment
-            elsif match = scan(/\*\//)
-              encoder.text_token match, :comment
-              states.pop
-            elsif match = scan(/\s+/)
-              encoder.text_token match, :space
-            end
           else
+            #:nocov:
             raise_inspect 'Unknown state', encoder
+            #:nocov:
           end
-        elsif match = scan(/\/\*/)
+        elsif match = scan(/\/\*(?:.*?\*\/|\z)/m)
           encoder.text_token match, :comment
-          states.push :comment
         elsif match = scan(/\{/)
           value_expected = false

data/lib/coderay/scanners/debug.rb CHANGED Viewed

@@ -1,30 +1,29 @@
-($:.unshift '../..'; require 'coderay') unless defined? CodeRay
 module CodeRay
 module Scanners
   # = Debug Scanner
   #
   # Interprets the output of the Encoders::Debug encoder.
   class Debug < Scanner
     register_for :debug
     title 'CodeRay Token Dump Import'
   protected
     def scan_tokens encoder, options
       opened_tokens = []
       until eos?
         if match = scan(/\s+/)
           encoder.text_token match, :space
         elsif match = scan(/ (\w+) \( ( [^\)\\]* ( \\. [^\)\\]* )* ) \)? /x)
           kind = self[1].to_sym
-          match = self[2].gsub(/\\(.)/, '\1')
-          unless Tokens::AbbreviationForKind.has_key? kind
+          match = self[2].gsub(/\\(.)/m, '\1')
+          unless TokenKinds.has_key? kind
             kind = :error
             match = matched
           end
@@ -59,53 +58,8 @@ module Scanners
       encoder
     end
-  end
-end
-end
-if $0 == __FILE__
-  $VERBOSE = true
-  $: << File.join(File.dirname(__FILE__), '..')
-  eval DATA.read, nil, $0, __LINE__ + 4
-end
-__END__
-require 'test/unit'
-class DebugScannerTest < Test::Unit::TestCase
-  def test_creation
-    assert CodeRay::Scanners::Debug < CodeRay::Scanners::Scanner
-    debug = nil
-    assert_nothing_raised do
-      debug = CodeRay.scanner :debug
-    end
-    assert_kind_of CodeRay::Scanners::Scanner, debug
-  end
-  TEST_INPUT = <<-'DEBUG'.chomp
-integer(10)operator((\\\))string<content(test)>test[
-method([])]
-  DEBUG
-  TEST_OUTPUT = CodeRay::Tokens[
-    ['10', :integer],
-    ['(\\)', :operator],
-    [:begin_group, :string],
-    ['test', :content],
-    [:end_group, :string],
-    [:begin_line, :test],
-    ["\n\n  \t   \n", :space],
-    ["[]", :method],
-    [:end_line, :test],
-  ].flatten
-  def test_filtering_text_tokens
-    assert_equal TEST_OUTPUT, CodeRay::Scanners::Debug.new.tokenize(TEST_INPUT)
-    assert_equal TEST_OUTPUT, CodeRay.scan(TEST_INPUT, :debug)
   end
 end
+end

data/lib/coderay/scanners/diff.rb CHANGED Viewed

@@ -81,7 +81,7 @@ module Scanners
               encoder.begin_group :change
             end
             encoder.text_token match[0,2], :change
-            encoder.text_token match[2...-2], :plain if match.size > 4
+            encoder.text_token match[2...-2], :plain
             encoder.text_token match[-2,2], :change
             encoder.end_group :change unless line_kind
             next unless match = scan(/.+/)
@@ -109,8 +109,9 @@ module Scanners
               if content_scanner.instance_variable_defined?(:@state)
                 content_scanner_entry_state = content_scanner.instance_variable_get(:@state)
               end
-              skip(/(.*)(.*?)(.*)\n\+\1(.*)\3$/)
-              pre, deleted, post = content_scanner.tokenize [self[1], self[2], self[3]], :tokens => Tokens.new
+              skip(/(.*)\n\+(.*)$/)
+              head, deletion, insertion, tail = diff self[1], self[2]
+              pre, deleted, post = content_scanner.tokenize [head, deletion, tail], :tokens => Tokens.new
               encoder.tokens pre
               encoder.begin_group :eyecatcher
               encoder.tokens deleted
@@ -121,7 +122,7 @@ module Scanners
               encoder.begin_line line_kind = :insert
               encoder.text_token '+', :insert
               content_scanner.instance_variable_set(:@state, content_scanner_entry_state || :initial)
-              pre, inserted, post = content_scanner.tokenize [self[1], self[4], self[3]], :tokens => Tokens.new
+              pre, inserted, post = content_scanner.tokenize [head, insertion, tail], :tokens => Tokens.new
               encoder.tokens pre
               encoder.begin_group :eyecatcher
               encoder.tokens inserted
@@ -177,6 +178,22 @@ module Scanners
       encoder
     end
+  private
+    def diff a, b
+      # i will be the index of the leftmost difference from the left.
+      i_max = [a.size, b.size].min
+      i = 0
+      i += 1 while i < i_max && a[i] == b[i]
+      # j_min will be the index of the leftmost difference from the right.
+      j_min = i - i_max
+      # j will be the index of the rightmost difference from the right which
+      # does not precede the leftmost one from the left.
+      j = -1
+      j -= 1 while j >= j_min && a[j] == b[j]
+      return a[0...i], a[i..j], b[i..j], (j < -1) ? a[j+1..-1] : ''
+    end
   end
 end

data/lib/coderay/scanners/html.rb CHANGED Viewed

@@ -53,10 +53,20 @@ module Scanners
       @plain_string_content = nil
     end
+    def scan_java_script encoder, code
+      if code && !code.empty?
+        @java_script_scanner ||= Scanners::JavaScript.new '', :keep_tokens => true
+        # encoder.begin_group :inline
+        @java_script_scanner.tokenize code, :tokens => encoder
+        # encoder.end_group :inline
+      end
+    end
     def scan_tokens encoder, options
       state = @state
       plain_string_content = @plain_string_content
+      in_tag = in_attribute = nil
       until eos?
@@ -68,19 +78,39 @@ module Scanners
           case state
           when :initial
-            if match = scan(/<!--.*?-->/m)
+            case in_tag
+            when 'script'
+              if scan(/(\s*<!--)(?:(.*?)(-->)|(.*))/m)
+                code = self[2] || self[4]
+                closing = self[3]
+                encoder.text_token self[1], :comment
+              else
+                code = scan_until(/(?=(?:\n\s*)?<\/script>)|\z/)
+                closing = false
+              end
+              unless code.empty?
+                encoder.begin_group :inline
+                scan_java_script encoder, code
+                encoder.end_group :inline
+              end
+              encoder.text_token closing, :comment if closing
+            end
+            next if eos?
+            if match = scan(/<!--(?:.*?-->|.*)/m)
               encoder.text_token match, :comment
-            elsif match = scan(/<!DOCTYPE.*?>/m)
+            elsif match = scan(/<!DOCTYPE(?:.*?>|.*)/m)
               encoder.text_token match, :doctype
-            elsif match = scan(/<\?xml.*?\?>/m)
+            elsif match = scan(/<\?xml(?:.*?\?>|.*)/m)
               encoder.text_token match, :preprocessor
-            elsif match = scan(/<\?.*?\?>|<%.*?%>/m)
+            elsif match = scan(/<\?(?:.*?\?>|.*)|<%(?:.*?%>|.*)/m)
               encoder.text_token match, :comment
-            elsif match = scan(/<\/[-\w.:]*>/m)
+            elsif match = scan(/<\/[-\w.:]*>?/m)
               encoder.text_token match, :tag
-            elsif match = scan(/<[-\w.:]+>?/m)
+              in_tag = nil
+            elsif match = scan(/<(?:(script)|[-\w.:]+)(>)?/m)
               encoder.text_token match, :tag
-              state = :attribute unless match[-1] == ?>
+              in_tag = self[1]
+              state = :attribute unless self[2]
             elsif match = scan(/[^<>&]+/)
               encoder.text_token match, :plain
             elsif match = scan(/#{ENTITY}/ox)
@@ -92,10 +122,14 @@ module Scanners
             end
           when :attribute
-            if match = scan(/#{TAG_END}/)
+            if match = scan(/#{TAG_END}/o)
               encoder.text_token match, :tag
+              in_attribute = nil
               state = :initial
             elsif match = scan(/#{ATTR_NAME}/o)
+              if match.downcase == 'onclick'
+                in_attribute = 'script'
+              end
               encoder.text_token match, :attribute_name
               state = :attribute_equal
             else
@@ -106,11 +140,9 @@ module Scanners
             if match = scan(/=/)
               encoder.text_token match, :operator
               state = :attribute_value
-            elsif match = scan(/#{ATTR_NAME}/o)
-              encoder.text_token match, :attribute_name
-            elsif match = scan(/#{TAG_END}/o)
-              encoder.text_token match, :tag
-              state = :initial
+            elsif scan(/#{ATTR_NAME}/o) || scan(/#{TAG_END}/o)
+              state = :attribute
+              next
             else
               encoder.text_token getch, :error
               state = :attribute
@@ -121,11 +153,26 @@ module Scanners
               encoder.text_token match, :attribute_value
               state = :attribute
             elsif match = scan(/["']/)
-              encoder.begin_group :string
-              state = :attribute_value_string
-              plain_string_content = PLAIN_STRING_CONTENT[match]
-              encoder.text_token match, :delimiter
-            elsif scan(/#{TAG_END}/o)
+              if in_attribute == 'script'
+                encoder.begin_group :inline
+                encoder.text_token match, :inline_delimiter
+                if scan(/javascript:\s*/)
+                  encoder.text_token matched, :comment
+                end
+                code = scan_until(match == '"' ? /(?="|\z)/ : /(?='|\z)/)
+                scan_java_script encoder, code
+                match = scan(/["']/)
+                encoder.text_token match, :inline_delimiter if match
+                encoder.end_group :inline
+                state = :attribute
+                in_attribute = nil
+              else
+                encoder.begin_group :string
+                state = :attribute_value_string
+                plain_string_content = PLAIN_STRING_CONTENT[match]
+                encoder.text_token match, :delimiter
+              end
+            elsif match = scan(/#{TAG_END}/o)
               encoder.text_token match, :tag
               state = :initial
             else

data/lib/coderay/scanners/java.rb CHANGED Viewed

@@ -3,9 +3,10 @@ module Scanners
   # Scanner for Java.
   class Java < Scanner
     register_for :java
-    helper :builtin_types
+    autoload :BuiltinTypes, 'coderay/scanners/java/builtin_types'
     # http://java.sun.com/docs/books/tutorial/java/nutsandbolts/_keywords.html
     KEYWORDS = %w[

data/lib/coderay/scanners/java_script.rb CHANGED Viewed

@@ -48,8 +48,8 @@ module Scanners
       '/' => /[^\\\/]+/,
     }  # :nodoc:
     KEY_CHECK_PATTERN = {
-      "'" => / [^\\']* (?: \\.? [^\\']* )* '? \s* : /x,
-      '"' => / [^\\"]* (?: \\.? [^\\"]* )* "? \s* : /x,
+      "'" => / (?> [^\\']* (?: \\. [^\\']* )* ) ' \s* : /mx,
+      '"' => / (?> [^\\"]* (?: \\. [^\\"]* )* ) " \s* : /mx,
     }  # :nodoc:
   protected
@@ -134,7 +134,7 @@ module Scanners
             string_delimiter = match
             encoder.text_token match, :delimiter
-          elsif value_expected && (match = scan(/\/(?=\S)/))
+          elsif value_expected && (match = scan(/\//))
             encoder.begin_group :regexp
             state = :regexp
             string_delimiter = '/'

data/lib/coderay/scanners/json.rb CHANGED Viewed

@@ -13,10 +13,11 @@ module Scanners
     ]  # :nodoc:
     ESCAPE = / [bfnrt\\"\/] /x  # :nodoc:
-    UNICODE_ESCAPE =  / u[a-fA-F0-9]{4} /x  # :nodoc:
+    UNICODE_ESCAPE = / u[a-fA-F0-9]{4} /x  # :nodoc:
   protected
+    # See http://json.org/ for a definition of the JSON lexic/grammar.
     def scan_tokens encoder, options
       state = :initial
@@ -44,14 +45,14 @@ module Scanners
             when '}', ']' then stack.pop  # no error recovery, but works for valid JSON
             end
           elsif match = scan(/ true | false | null /x)
-             encoder.text_token match, :value
+            encoder.text_token match, :value
           elsif match = scan(/ -? (?: 0 | [1-9]\d* ) /x)
-            kind = :integer
             if scan(/ \.\d+ (?:[eE][-+]?\d+)? | [eE][-+]? \d+ /x)
               match << matched
-              kind = :float
+              encoder.text_token match, :float
+            else
+              encoder.text_token match, :integer
             end
-            encoder.text_token match, kind
           else
             encoder.text_token getch, :error
           end
@@ -76,7 +77,7 @@ module Scanners
           end
         else
-          raise_inspect 'Unknown state', encoder
+          raise_inspect 'Unknown state: %p' % [state], encoder
         end
       end

data/lib/coderay/scanners/php.rb CHANGED Viewed

@@ -10,6 +10,7 @@ module Scanners
     register_for :php
     file_extension 'php'
+    encoding 'BINARY'
     KINDS_NOT_LOC = HTML::KINDS_NOT_LOC
@@ -461,7 +462,7 @@ module Scanners
               states.push :php
               encoder.text_token match, :delimiter
             else
-              encoder.text_token match, :string
+              encoder.text_token match, :content
             end
           elsif match = scan(/\$\{#{RE::IDENTIFIER}\}/o)
             encoder.text_token match, :local_variable

data/lib/coderay/scanners/rhtml.rb CHANGED Viewed

@@ -48,12 +48,16 @@ module Scanners
           @html_scanner.tokenize match, :tokens => encoder
         elsif match = scan(/#{ERB_RUBY_BLOCK}/o)
-          start_tag = match[/\A<%[-=]?/]
+          start_tag = match[/\A<%[-=#]?/]
           end_tag = match[/-?%?>?\z/]
           encoder.begin_group :inline
           encoder.text_token start_tag, :inline_delimiter
           code = match[start_tag.size .. -1 - end_tag.size]
-          @ruby_scanner.tokenize code
+          if start_tag[/\A<%#/]
+            encoder.text_token code, :comment
+          else
+            @ruby_scanner.tokenize code
+          end unless code.empty?
           encoder.text_token end_tag, :inline_delimiter unless end_tag.empty?
           encoder.end_group :inline