RubyGems - antlr4 - Versions diffs - 0.9.2 - Mend

antlr4 0.9.2

Files changed (64) hide show

checksums.yaml +7 -0
data/LICENSE +27 -0
data/README.md +46 -0
data/lib/antlr4.rb +262 -0
data/lib/antlr4/BufferedTokenStream.rb +306 -0
data/lib/antlr4/CommonTokenFactory.rb +53 -0
data/lib/antlr4/CommonTokenStream.rb +56 -0
data/lib/antlr4/FileStream.rb +14 -0
data/lib/antlr4/InputStream.rb +82 -0
data/lib/antlr4/IntervalSet.rb +341 -0
data/lib/antlr4/LL1Analyzer.rb +177 -0
data/lib/antlr4/Lexer.rb +335 -0
data/lib/antlr4/ListTokenSource.rb +140 -0
data/lib/antlr4/Parser.rb +562 -0
data/lib/antlr4/ParserInterpreter.rb +149 -0
data/lib/antlr4/ParserRuleContext.rb +162 -0
data/lib/antlr4/PredictionContext.rb +690 -0
data/lib/antlr4/Recognizer.rb +162 -0
data/lib/antlr4/RuleContext.rb +226 -0
data/lib/antlr4/Token.rb +124 -0
data/lib/antlr4/TokenFactory.rb +3 -0
data/lib/antlr4/TokenSource.rb +4 -0
data/lib/antlr4/TokenStream.rb +3 -0
data/lib/antlr4/TraceListener.rb +23 -0
data/lib/antlr4/atn/ATN.rb +133 -0
data/lib/antlr4/atn/ATNConfig.rb +146 -0
data/lib/antlr4/atn/ATNConfigSet.rb +215 -0
data/lib/antlr4/atn/ATNDeserializationOptions.rb +62 -0
data/lib/antlr4/atn/ATNDeserializer.rb +604 -0
data/lib/antlr4/atn/ATNSimulator.rb +43 -0
data/lib/antlr4/atn/ATNState.rb +253 -0
data/lib/antlr4/atn/ATNType.rb +22 -0
data/lib/antlr4/atn/LexerATNSimulator.rb +612 -0
data/lib/antlr4/atn/LexerAction.rb +311 -0
data/lib/antlr4/atn/LexerActionExecutor.rb +134 -0
data/lib/antlr4/atn/ParserATNSimulator.rb +1622 -0
data/lib/antlr4/atn/PredictionMode.rb +525 -0
data/lib/antlr4/atn/SemanticContext.rb +355 -0
data/lib/antlr4/atn/Transition.rb +297 -0
data/lib/antlr4/base.rb +60 -0
data/lib/antlr4/dfa/DFA.rb +128 -0
data/lib/antlr4/dfa/DFASerializer.rb +77 -0
data/lib/antlr4/dfa/DFAState.rb +133 -0
data/lib/antlr4/error.rb +151 -0
data/lib/antlr4/error/DiagnosticErrorListener.rb +136 -0
data/lib/antlr4/error/ErrorListener.rb +109 -0
data/lib/antlr4/error/ErrorStrategy.rb +742 -0
data/lib/antlr4/tree/Chunk.rb +31 -0
data/lib/antlr4/tree/ParseTreeMatch.rb +105 -0
data/lib/antlr4/tree/ParseTreePattern.rb +70 -0
data/lib/antlr4/tree/ParseTreePatternMatcher.rb +334 -0
data/lib/antlr4/tree/RuleTagToken.rb +39 -0
data/lib/antlr4/tree/TokenTagToken.rb +38 -0
data/lib/antlr4/tree/Tree.rb +204 -0
data/lib/antlr4/tree/Trees.rb +111 -0
data/lib/antlr4/version.rb +5 -0
data/lib/antlr4/xpath/XPath.rb +354 -0
data/lib/double_key_map.rb +78 -0
data/lib/java_symbols.rb +24 -0
data/lib/uuid.rb +87 -0
data/test/test_intervalset.rb +664 -0
data/test/test_tree.rb +140 -0
data/test/test_uuid.rb +122 -0
metadata +109 -0

data/lib/antlr4/CommonTokenFactory.rb ADDED

@@ -0,0 +1,53 @@
+# This default implementation of {@link TokenFactory} creates
+# {@link CommonToken} objects.
+class CommonTokenFactory < TokenFactory
+    #
+    # The default {@link CommonTokenFactory} instance.
+    #
+    # <p>
+    # This token factory does not explicitly copy token text when constructing
+    # tokens.</p>
+    #
+    @@default = nil
+    def self.DEFAULT
+      @@default = new() if @@default.nil?
+      @@default
+    end
+    attr_accessor :copyText
+    def initialize(_copyText=false)
+        # Indicates whether {@link CommonToken#setText} should be called after
+        # constructing tokens to explicitly set the text. This is useful for cases
+        # where the input stream might not be able to provide arbitrary substrings
+        # of text from the input after the lexer creates a token (e.g. the
+        # implementation of {@link CharStream#getText} in
+        # {@link UnbufferedCharStream} throws an
+        # {@link UnsupportedOperationException}). Explicitly setting the token text
+        # allows {@link Token#getText} to be called at any time regardless of the
+        # input stream implementation.
+        #
+        # <p>
+        # The default value is {@code false} to avoid the performance and memory
+        # overhead of copying text for every token unless explicitly requested.</p>
+        #
+        @copyText = _copyText
+    end
+    def create(source, type, text, channel, start, stop, line, column)
+        t = CommonToken.new(source, type, channel, start, stop)
+        t.line = line
+        t.column = column
+        if not text.nil? then
+            t.text = text
+        elsif self.copyText and not source[1].nil? then
+            t.text = source[1].getText(start,stop)
+        end
+        return t
+    end
+    def createThin(type, text)
+        t = CommonToken.new(type)
+        t.text = text
+        return t
+    end
+end

data/lib/antlr4/CommonTokenStream.rb ADDED

@@ -0,0 +1,56 @@
+class CommonTokenStream < BufferedTokenStream
+    attr_accessor :channel
+    def initialize(lexer, _channel=Token::DEFAULT_CHANNEL)
+        super(lexer)
+        @channel = _channel
+    end
+    def adjustSeekIndex(i)
+        return self.nextTokenOnChannel(i, self.channel)
+    end
+    def LB(k)
+        return nil if k==0 or (self.index-k)<0
+        i = self.index
+        n = 1
+        # find k good tokens looking backwards
+        while n <= k do
+            # skip off-channel tokens
+            i = self.previousTokenOnChannel(i - 1, self.channel)
+            n = n + 1
+        end
+        return nil if i < 0
+        return self.tokens[i]
+    end
+    def LT(k)
+        self.lazyInit()
+        return nil if k == 0
+        return self.LB(-k) if k < 0
+        i = self.index
+        n = 1 # we know tokens[pos] is a good one
+        # find k good tokens
+        while n < k do
+            # skip off-channel tokens, but make sure to not look past EOF
+            if self.sync(i + 1)
+                i = self.nextTokenOnChannel(i + 1, self.channel)
+            end
+            n = n + 1
+        end
+        return self.tokens[i]
+    end
+    # Count EOF just once.#/
+    def getNumberOfOnChannelTokens
+        n = 0
+        self.fill()
+        for i in 0..self.tokens.length-1 do
+            t = self.tokens[i]
+            if t.channel==self.channel
+                n = n + 1
+            end
+            break if t.type==Token::EOF
+        end
+        return n
+    end
+end

data/lib/antlr4/FileStream.rb ADDED

@@ -0,0 +1,14 @@
+#  This is an InputStream that is loaded from a file all at once
+#  when you construct the object.
+class FileStream < InputStream
+    def initialize(fileName, encoding=nil)
+        # read binary to avoid line ending conversion
+        bytes = nil
+        File.open(fileName, 'rb') do |file|
+            bytes = file.read()
+        end
+        super(bytes)
+        @name = fileName
+    end
+end

data/lib/antlr4/InputStream.rb ADDED

@@ -0,0 +1,82 @@
+#  Vacuum all input from a string and then treat it like a buffer.
+class InputStream
+    attr_accessor :index, :strdata, :name, :size, :data
+    def initialize(data)
+        @name = "<empty>"
+        @strdata = data
+        @index = 0
+        @data = @strdata.bytes
+        @size = @data.length
+    end
+    # Reset the stream so that it's in the same state it was
+    #  when the object was created *except* the data array is not
+    #  touched.
+    #
+    def reset()
+        @index = 0
+    end
+    def consume()
+        if self.index >= self.size then
+            # assert self.LA(1) == Token::EOF
+            raise Exception.new("cannot consume EOF")
+        end
+        self.index = self.index + 1
+    end
+    def LA(offset)
+        if offset==0 then
+            return 0 # undefined
+        end
+        if offset<0 then
+            offset = offset + 1 # e.g., translate LA(-1) to use offset=0
+        end
+        pos = self.index + offset - 1
+        if pos < 0 or pos >= @size then # invalid
+            return Token::EOF
+        end
+        return self.data[pos]
+    end
+    def LT(offset)
+        return self.LA(offset)
+    end
+    # mark/release do nothing; we have entire buffer
+    def mark()
+        return -1
+    end
+    def release(marker)
+    end
+    # consume() ahead until p==_index; can't just set p=_index as we must
+    # update line and column. If we seek backwards, just set p
+    #
+    def seek(_index)
+        if _index<=self.index then
+            self.index = _index # just jump; don't update stream state (line, ...)
+            return
+        end
+        # seek forward
+        self.index = [_index, self.size].min
+    end
+    def getText(start, stop)
+        if stop >= self.size then
+            stop = self.size - 1
+        end
+        if start >= self.size then
+            return ""
+        else
+            return self.strdata[start..stop] # start = inital, stop == offset?
+        end
+    end
+    def to_s
+        return self.strdata
+    end
+end

data/lib/antlr4/IntervalSet.rb ADDED

@@ -0,0 +1,341 @@
+class IntervalSet
+    extend Forwardable
+    attr_accessor :intervals , :readonly
+    attr_accessor :_internal
+    def initialize
+        self.intervals = Array.new
+        self.readonly = false
+        @_internal = Set.new
+    end
+    def_delegators :@intervals, :each, :map
+    include Enumerable
+    def self.copy(other)
+        s = IntervalSet.new
+        s.intervals = other.intervals.clone
+        s.readonly = other.readonly
+        s._internal = other._internal.clone
+        s
+    end
+    def self.of(a,b=nil)
+       s = IntervalSet.new
+       if b.nil? then
+          b = a
+       end
+       s.addRange(a..b)
+       s
+    end
+    def getMinElement
+        intervals.first
+    end
+    def addOne(v)
+        self.addRange(v..v)
+    end
+    def addRange(v)
+        type_check(v, Range)
+        if self.intervals.empty? then
+            self.intervals.push(v)
+        else
+            # find insert pos
+            k = 0
+            for i in self.intervals do
+                # distinct range -> insert
+                if v.stop<i.start then
+                    self.intervals.insert(k, v)
+                    return
+                # contiguous range -> adjust
+                elsif v.stop==i.start
+                    self.intervals[k] = v.start..i.stop
+                    return
+                # overlapping range -> adjust and reduce
+                elsif v.start<=i.stop
+                    self.intervals[k] = [i.start,v.start].min() ..  ([i.stop,v.stop].max())
+                    self.reduce(k)
+                    return
+                end
+                k = k + 1
+            end
+            # greater than any existing
+            self.intervals.push(v)
+        end
+    end
+    def addSet(other) # IntervalSet):
+        if other.kind_of?(IntervalSet) then
+          if other.intervals and not other.isNil then
+            other.intervals.each {|i| self.addRange(i) }
+          end
+        else
+            raise Exception.new("can't add a non-IntervalSet #{other.class}")
+        end
+        return self
+    end
+    def reduce(k)
+        # only need to reduce if k is not the last
+        if k<self.intervals.length()-1 then
+            l = self.intervals[k]
+            r = self.intervals[k+1]
+            # if r contained in l
+            if l.stop >= r.stop
+                self.intervals.pop(k+1)
+                self.reduce(k)
+            elsif l.stop >= r.start
+                self.intervals[k] = l.start..r.stop
+                self.intervals.pop(k+1)
+            end
+        end
+    end
+    def member?(item)
+        return false if self.intervals.empty?
+        self.intervals.each  do |i|
+            if i.member? item  then
+               return true
+            end
+        end
+        false
+    end
+    def length
+        xlen = 0
+        self.intervals.each do |i|
+          xlen = xlen + i.length
+        end
+        return xlen
+    end
+#    public int size() {
+#		int n = 0;
+#		int numIntervals = intervals.size();
+#		if ( numIntervals==1 ) {
+#			Interval firstInterval = this.intervals.get(0);
+#			return firstInterval.b-firstInterval.a+1;
+#		}
+#		for (int i = 0; i < numIntervals; i++) {
+#			Interval I = intervals.get(i);
+#			n += (I.b-I.a+1);
+#		}
+#		return n;
+#    }
+    def remove(v)
+        if not self.intervals.empty? then
+            k = 0
+            for i in self.intervals do
+                # intervals is ordered
+                if v<i.start then
+                    return
+                # check for single value range
+#                elsif v==i.start and v==i.stop-1
+                elsif v==i.start and v==i.stop
+                    self.intervals.pop(k)
+                    return
+                # check for lower boundary
+                elsif v==i.start
+#                    self.intervals[k] = i.start+1..i.stop-1
+                    self.intervals[k] = i.start+1..i.stop
+                    return
+                # check for upper boundary
+                elsif v==i.stop-1
+#                    self.intervals[k] = i.start..i.stop-1-1
+                    self.intervals[k] = i.start..i.stop
+                    return
+                # split existing range
+                elsif v<i.stop-1
+                    x = i.start..(v-1)
+                    i.start = v + 1
+                    self.intervals.insert(k, x)
+                    return
+                end
+                k = k + 1
+            end
+        end
+    end
+    def toString(tokenNames=nil)
+        if self.intervals.nil? or self.intervals.empty? then
+            return "{}"
+        end
+#        "{#{intervals.to_s}}"
+       StringIO.open  do |buf|
+            if length > 1 then
+                buf.write("{")
+            end
+            x = intervals.map { |i|
+                i.map { |j|
+                    if tokenNames then
+                        self.elementName(tokenNames, j).to_s
+                    else
+                        j.to_s
+                    end
+                }.join(', ')
+            }.join(", ")
+            buf.write(x)
+            if length > 1 then
+                buf.write("}")
+            end
+            return buf.string()
+       end
+    end
+    def elementName(tokenNames, a)
+        if a==Token::EOF then
+            return "<EOF>"
+        elsif a==Token::EPSILON
+            return "<EPSILON>"
+        else
+            return tokenNames[a]
+        end
+    end
+#IntervalSet implements IntSet {
+#  COMPLETE_CHAR_SET = IntervalSet.of(Lexer::MIN_CHAR_VALUE, Lexer::MAX_CHAR_VALUE);
+#	static { COMPLETE_CHAR_SET.setReadonly(true); }
+#	EMPTY_SET = new IntervalSet(); static { EMPTY_SET.setReadonly(true); }
+#
+#	public IntervalSet addAll(IntSet set) {
+#		if ( set==null ) { return this; }
+#		if (set instanceof IntervalSet) {
+#			IntervalSet other = (IntervalSet)set;
+#			int n = other.intervals.size();
+#			for (int i = 0; i < n; i++) {
+#				Interval I = other.intervals.get(i);
+#				this.add(I.a,I.b);
+#			}
+#		return this;
+#}
+    def isNil()
+       self.intervals.empty?
+    end
+#
+#   this.complement(IntervalSet.of(minElement,maxElement));
+#
+    def complement(vocabulary)
+      if vocabulary.nil? || vocabulary.isNil() then
+        return nil
+      end
+      vocabularyIS = vocabulary
+      vocabularyIS.subtract(self);
+    end
+    def subtract(a)
+  		if (a.nil? || a.isNil()) then
+			  s = IntervalSet.new
+        s.addSet(self)
+        return s
+		  end
+			return IntervalSet.subtract(self, a);
+    end
+	 # Compute the set difference between two interval sets. The specific
+	 # operation is {@code left - right}. If either of the input sets is
+	 # {@code null}, it is treated as though it was an empty set.
+  def self.subtract(left,right)
+    if left.nil? or left.isNil() then
+        return IntervalSet.new()
+    end
+    result = IntervalSet.copy(left)
+		if right.nil? or right.isNil() then
+			# right set has no elements; just return the copy of the current set
+			return result
+		end
+		resultI = 0
+		rightI = 0
+		while (resultI < result.intervals.size() && rightI < right.intervals.size()) do
+			resultInterval = result.intervals[resultI]
+			rightInterval = right.intervals[rightI]
+			# operation: (resultInterval - rightInterval) and update indexes
+			if (rightInterval.b < resultInterval.a) then
+				rightI += 1
+				next
+			end
+			if (rightInterval.a > resultInterval.b) then
+				resultI += 1
+				next
+			end
+			beforeCurrent = nil
+			afterCurrent = nil
+			if (rightInterval.a > resultInterval.a) then
+				beforeCurrent = (resultInterval.a .. rightInterval.a - 1)
+			end
+			if (rightInterval.b < resultInterval.b) then
+				afterCurrent =  (rightInterval.b + 1  .. resultInterval.b)
+			end
+			if not beforeCurrent.nil? then
+				if not afterCurrent.nil? then
+					# split the current interval into two
+					result.intervals[resultI] =  beforeCurrent
+					result.intervals[resultI + 1] =  afterCurrent
+					resultI += 1
+					rightI += 1
+				else
+					# replace the current interval
+					result.intervals[resultI]= beforeCurrent
+					resultI += 1
+				end
+			  next
+			else
+				if not afterCurrent.nil?  then
+					# replace the current interval
+					result.intervals[resultI] =  afterCurrent
+					rightI += 1
+				else
+					# remove the current interval (thus no need to increment resultI)
+					result.intervals.delete_at(resultI)
+				end
+			  next
+			end
+		end
+		# If rightI reached right.intervals.size(), no more intervals to subtract from result.
+		# If resultI reached result.intervals.size(), we would be subtracting from an empty set.
+		# Either way, we are done.
+		result
+	end
+end
+# Returns the maximum value contained in the set.
+# If the set is empty, this method returns {@link Token#INVALID_TYPE}.
+#	def getMaxElement()
+#		if ( isNil() ) { return Token::INVALID_TYPE; }
+#		Interval last = intervals.get(intervals.size()-1);
+#		return last.b;
+#	end
+#
+## Returns the minimum value contained in the set.
+#	def getMinElement()
+#		if ( isNil() ) { return Token::INVALID_TYPE; }
+#		return intervals.get(0).a;
+# end
+#	/** Get the ith element of ordered set.  Used only by RandomPhrase so
+#	 *  don't bother to implement if you're not doing that for a new
+#	 *  ANTLR code gen target.
+#	public int get(int i) {
+#		int n = intervals.size();
+#		int index = 0;
+#		for (int j = 0; j < n; j++) {
+#			Interval I = intervals.get(j);
+#			int a = I.a;
+#			int b = I.b;
+#			for (int v=a; v<=b; v++) {
+#				if ( index==i ) {
+#					return v;
+#				}
+#				index++;
+#			}
+#		}
+#		return -1;
+#	}