RubyGems - treetop - Versions diffs - 1.5.3 → 1.6.12 - Mend

treetop 1.5.3 → 1.6.12

Files changed (95) hide show

checksums.yaml +5 -13
data/Gemfile +12 -0
data/History.txt +18 -0
data/README.md +4 -0
data/Rakefile +20 -40
data/Treetop.tmbundle/Preferences/Comments.tmPreferences +28 -0
data/Treetop.tmbundle/Snippets/grammar ___ end.tmSnippet +20 -0
data/Treetop.tmbundle/Snippets/rule ___ end.tmSnippet +18 -0
data/Treetop.tmbundle/Support/nibs/SyntaxTreeViewer.nib/designable.nib +1524 -0
data/Treetop.tmbundle/Support/nibs/SyntaxTreeViewer.nib/keyedobjects.nib +0 -0
data/Treetop.tmbundle/Support/syntax_tree_viewer.rb +117 -0
data/Treetop.tmbundle/Syntaxes/Treetop Grammar.tmLanguage +358 -0
data/Treetop.tmbundle/info.plist +10 -0
data/doc/pitfalls_and_advanced_techniques.markdown +7 -1
data/doc/syntactic_recognition.markdown +7 -2
data/doc/tt.1 +1 -1
data/examples/indented_blocks/indented_blocks.tt +73 -0
data/examples/indented_blocks/indented_blocks_test.rb +24 -0
data/lib/treetop/compiler/grammar_compiler.rb +6 -3
data/lib/treetop/compiler/metagrammar.rb +301 -159
data/lib/treetop/compiler/metagrammar.treetop +96 -13
data/lib/treetop/compiler/node_classes/anything_symbol.rb +10 -2
data/lib/treetop/compiler/node_classes/atomic_expression.rb +2 -2
data/lib/treetop/compiler/node_classes/character_class.rb +10 -2
data/lib/treetop/compiler/node_classes/choice.rb +11 -7
data/lib/treetop/compiler/node_classes/nonterminal.rb +6 -2
data/lib/treetop/compiler/node_classes/parenthesized_expression.rb +5 -1
data/lib/treetop/compiler/node_classes/parsing_expression.rb +10 -1
data/lib/treetop/compiler/node_classes/parsing_rule.rb +1 -1
data/lib/treetop/compiler/node_classes/predicate.rb +8 -1
data/lib/treetop/compiler/node_classes/predicate_block.rb +7 -0
data/lib/treetop/compiler/node_classes/repetition.rb +28 -8
data/lib/treetop/compiler/node_classes/sequence.rb +5 -1
data/lib/treetop/compiler/node_classes/terminal.rb +36 -22
data/lib/treetop/compiler/ruby_builder.rb +2 -2
data/lib/treetop/ruby_extensions/string.rb +0 -6
data/lib/treetop/runtime/compiled_parser.rb +33 -14
data/lib/treetop/runtime/syntax_node.rb +24 -15
data/lib/treetop/runtime/terminal_parse_failure.rb +4 -3
data/lib/treetop/runtime/terminal_syntax_node.rb +4 -4
data/lib/treetop/version.rb +2 -2
data/treetop.gemspec +25 -165
metadata +43 -98
data/doc/site.rb +0 -112
data/doc/sitegen.rb +0 -65
data/examples/lambda_calculus/lambda_calculus +0 -0
data/spec/compiler/and_predicate_spec.rb +0 -36
data/spec/compiler/anything_symbol_spec.rb +0 -44
data/spec/compiler/character_class_spec.rb +0 -301
data/spec/compiler/choice_spec.rb +0 -80
data/spec/compiler/circular_compilation_spec.rb +0 -30
data/spec/compiler/failure_propagation_functional_spec.rb +0 -21
data/spec/compiler/grammar_compiler_spec.rb +0 -113
data/spec/compiler/grammar_spec.rb +0 -41
data/spec/compiler/multibyte_chars_spec.rb +0 -38
data/spec/compiler/namespace_spec.rb +0 -42
data/spec/compiler/nonterminal_symbol_spec.rb +0 -40
data/spec/compiler/not_predicate_spec.rb +0 -38
data/spec/compiler/occurrence_range_spec.rb +0 -189
data/spec/compiler/one_or_more_spec.rb +0 -35
data/spec/compiler/optional_spec.rb +0 -37
data/spec/compiler/parenthesized_expression_spec.rb +0 -19
data/spec/compiler/parsing_rule_spec.rb +0 -61
data/spec/compiler/repeated_subrule_spec.rb +0 -29
data/spec/compiler/semantic_predicate_spec.rb +0 -175
data/spec/compiler/sequence_spec.rb +0 -129
data/spec/compiler/terminal_spec.rb +0 -170
data/spec/compiler/terminal_symbol_spec.rb +0 -37
data/spec/compiler/test_grammar.treetop +0 -7
data/spec/compiler/test_grammar.tt +0 -7
data/spec/compiler/test_grammar_do.treetop +0 -7
data/spec/compiler/test_grammar_magic_coding.treetop +0 -8
data/spec/compiler/test_grammar_magic_encoding.treetop +0 -8
data/spec/compiler/tt_compiler_spec.rb +0 -224
data/spec/compiler/zero_or_more_spec.rb +0 -56
data/spec/composition/a.treetop +0 -11
data/spec/composition/b.treetop +0 -11
data/spec/composition/c.treetop +0 -10
data/spec/composition/d.treetop +0 -10
data/spec/composition/f.treetop +0 -17
data/spec/composition/grammar_composition_spec.rb +0 -40
data/spec/composition/subfolder/e_includes_c.treetop +0 -15
data/spec/ruby_extensions/string_spec.rb +0 -32
data/spec/runtime/compiled_parser_spec.rb +0 -123
data/spec/runtime/interval_skip_list/delete_spec.rb +0 -147
data/spec/runtime/interval_skip_list/expire_range_spec.rb +0 -349
data/spec/runtime/interval_skip_list/insert_and_delete_node_spec.rb +0 -385
data/spec/runtime/interval_skip_list/insert_spec.rb +0 -660
data/spec/runtime/interval_skip_list/interval_skip_list_spec.graffle +0 -6175
data/spec/runtime/interval_skip_list/interval_skip_list_spec.rb +0 -58
data/spec/runtime/interval_skip_list/palindromic_fixture.rb +0 -35
data/spec/runtime/interval_skip_list/palindromic_fixture_spec.rb +0 -163
data/spec/runtime/interval_skip_list/spec_helper.rb +0 -91
data/spec/runtime/syntax_node_spec.rb +0 -77
data/spec/spec_helper.rb +0 -115

data/Treetop.tmbundle/Support/nibs/SyntaxTreeViewer.nib/keyedobjects.nib ADDED Viewed

Binary file

data/Treetop.tmbundle/Support/syntax_tree_viewer.rb ADDED Viewed

@@ -0,0 +1,117 @@
+#!/usr/bin/env ruby
+require 'rubygems'
+require 'treetop'
+require "#{ENV["TM_SUPPORT_PATH"]}/lib/ui"
+# Monkey-patch SyntaxNode in a gross violation of its privacy.
+module Treetop
+  module Runtime
+    class SyntaxNode
+      def interesting_methods
+        # Copied from SyntaxNode#inspect
+        methods-[extension_modules.last ? extension_modules.last.methods : nil]-self.class.instance_methods
+      end
+      def to_hash
+        {
+          "class_and_modules" => self.class.to_s.sub(/.*:/,'') + extension_modules.map{|m| "+"+m.to_s.sub(/.*:/,'')}*"",
+          "offset" => interval.first,
+          "text_value" => text_value,
+          "methods" => interesting_methods * ", ",
+          "elements" => elements ? elements.map {|e| e.to_hash} : []
+        }
+      end
+    end
+  end
+end
+class SyntaxTreeViewer
+  def self.nib_path
+    File.dirname(__FILE__) + "/SyntaxTreeViewer.nib"
+  end
+  def self.new_with_unknown_grammar
+    parser = if ENV['TM_SCOPE'] =~ /source\.ruby/ && ENV['TM_SELECTED_TEXT']
+      eval(ENV['TM_SELECTED_TEXT'])
+    else
+      parser_file = if ENV['TM_SCOPE'] =~ /source\.treetop/
+        ENV['TM_FILEPATH']
+      else
+        ask_for_grammar
+      end
+      return unless parser_file
+      Treetop.load(parser_file)
+    end
+    new(parser.new)
+  end
+  def self.ask_for_grammar
+    files = TextMate::UI.request_file("title" => "Select a Grammar File")
+    if files.nil? || files.empty?
+      nil
+    else
+      files[0]
+    end
+  end
+  def self.nib_path
+    File.dirname(__FILE__) + "/nibs/SyntaxTreeViewer.nib"
+  end
+  def initialize(_parser)
+    @parser = _parser
+    run_parser!
+  end
+  def dialog
+    TextMate::UI.dialog(
+      :nib => self.class.nib_path,
+      :parameters => parameters
+    ) do |d|
+      d.wait_for_input do |params|
+        if params["returnArgument"]
+          self.input = params["returnArgument"]
+          run_parser!
+          d.parameters = parameters
+          true
+        else
+          false
+        end
+      end
+    end
+  end
+  def input
+    ENV['TM_TREETOP_SYNTAX_VIEWER_INPUT'] ||= ""
+  end
+  def input=(new_input)
+    ENV['TM_TREETOP_SYNTAX_VIEWER_INPUT'] = new_input
+  end
+  private
+  def run_parser!
+    if input && !input.empty?
+      @syntax_tree = @parser.parse(input)
+      TextMate::UI.alert(:warning, "Parse error", @parser.failure_reason) unless @syntax_tree
+    end
+  end
+  def parameters
+    p = {
+      "input" => input,
+      "syntax_tree" => @syntax_tree ? @syntax_tree.to_hash : {},
+      "selected_tab" => !input.empty? && @syntax_tree ? "Syntax Tree" : "Input"
+    }
+    puts p
+    p
+  end
+end
+if __FILE__ == $0
+  Dir.chdir("/Users/aobrien/Work/canopy/play/sparql/")
+  require "/Users/aobrien/Work/canopy/play/sparql/lib/sparql"
+  v = SyntaxTreeViewer.new(SparqlParser.new)
+  v.input = %{PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?foo WHERE { ?x foaf:knows ?y . ?z foaf:knows ?x .}}
+  v.dialog
+end

data/Treetop.tmbundle/Syntaxes/Treetop Grammar.tmLanguage ADDED Viewed

@@ -0,0 +1,358 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
+<plist version="1.0">
+<dict>
+	<key>fileTypes</key>
+	<array>
+		<string>treetop</string>
+		<string>tt</string>
+	</array>
+	<key>foldingStartMarker</key>
+	<string>(module|grammer|rule).*$</string>
+	<key>foldingStopMarker</key>
+	<string>^\s*end</string>
+	<key>keyEquivalent</key>
+	<string>^~T</string>
+	<key>name</key>
+	<string>Treetop Grammar</string>
+	<key>patterns</key>
+	<array>
+		<dict>
+			<key>include</key>
+			<string>#comment</string>
+		</dict>
+		<dict>
+			<key>begin</key>
+			<string>^(\s*)(module) ([A-Z]\w+)</string>
+			<key>beginCaptures</key>
+			<dict>
+				<key>2</key>
+				<dict>
+					<key>name</key>
+					<string>keyword.begin.module.treetop</string>
+				</dict>
+				<key>3</key>
+				<dict>
+					<key>name</key>
+					<string>entity.name.module.treetop</string>
+				</dict>
+			</dict>
+			<key>end</key>
+			<string>^\1(end)$</string>
+			<key>endCaptures</key>
+			<dict>
+				<key>1</key>
+				<dict>
+					<key>name</key>
+					<string>keyword.end.module.treetop</string>
+				</dict>
+			</dict>
+			<key>name</key>
+			<string>meta.module.treetop</string>
+			<key>patterns</key>
+			<array>
+				<dict>
+					<key>include</key>
+					<string>$self</string>
+				</dict>
+			</array>
+		</dict>
+		<dict>
+			<key>begin</key>
+			<string>^(\s*)(grammar) ([A-Z]\w+)</string>
+			<key>beginCaptures</key>
+			<dict>
+				<key>2</key>
+				<dict>
+					<key>name</key>
+					<string>keyword.begin.grammar.treetop</string>
+				</dict>
+				<key>3</key>
+				<dict>
+					<key>name</key>
+					<string>entity.name.grammar.treetop</string>
+				</dict>
+			</dict>
+			<key>end</key>
+			<string>^\1(end)$</string>
+			<key>endCaptures</key>
+			<dict>
+				<key>1</key>
+				<dict>
+					<key>name</key>
+					<string>keyword.end.grammar.treetop</string>
+				</dict>
+			</dict>
+			<key>name</key>
+			<string>meta.grammar.treetop</string>
+			<key>patterns</key>
+			<array>
+				<dict>
+					<key>include</key>
+					<string>$self</string>
+				</dict>
+			</array>
+		</dict>
+		<dict>
+			<key>captures</key>
+			<dict>
+				<key>1</key>
+				<dict>
+					<key>name</key>
+					<string>keyword.include.treetop</string>
+				</dict>
+				<key>2</key>
+				<dict>
+					<key>name</key>
+					<string>entity.name.include.treetop</string>
+				</dict>
+			</dict>
+			<key>match</key>
+			<string>(include)\s+(\w+)</string>
+			<key>name</key>
+			<string>meta.include.treetop</string>
+		</dict>
+		<dict>
+			<key>begin</key>
+			<string>\b(rule)\b (\w+)</string>
+			<key>beginCaptures</key>
+			<dict>
+				<key>1</key>
+				<dict>
+					<key>name</key>
+					<string>keyword.begin.rule.treetop</string>
+				</dict>
+				<key>2</key>
+				<dict>
+					<key>name</key>
+					<string>entity.name.rule.treetop</string>
+				</dict>
+			</dict>
+			<key>end</key>
+			<string>^\s+\bend\b\s*$</string>
+			<key>endCaptures</key>
+			<dict>
+				<key>0</key>
+				<dict>
+					<key>name</key>
+					<string>keyword.end.rule.treetop</string>
+				</dict>
+			</dict>
+			<key>name</key>
+			<string>meta.rule.treetop</string>
+			<key>patterns</key>
+			<array>
+				<dict>
+					<key>include</key>
+					<string>#comment</string>
+				</dict>
+				<dict>
+					<key>include</key>
+					<string>#strings</string>
+				</dict>
+				<dict>
+					<key>include</key>
+					<string>#character-class</string>
+				</dict>
+				<dict>
+					<key>match</key>
+					<string>\/</string>
+					<key>name</key>
+					<string>keyword.operator.or.treetop</string>
+				</dict>
+				<dict>
+					<key>match</key>
+					<string>&lt;\w+?&gt;</string>
+					<key>name</key>
+					<string>variable.class-instance.treetop</string>
+				</dict>
+				<dict>
+					<key>match</key>
+					<string>\w+?:</string>
+					<key>name</key>
+					<string>support.operand.treetop</string>
+				</dict>
+				<dict>
+					<key>begin</key>
+					<string>\{</string>
+					<key>end</key>
+					<string>\}</string>
+					<key>name</key>
+					<string>meta.embedded-ruby.treetop</string>
+					<key>patterns</key>
+					<array>
+						<dict>
+							<key>include</key>
+							<string>source.ruby</string>
+						</dict>
+					</array>
+				</dict>
+			</array>
+		</dict>
+	</array>
+	<key>repository</key>
+	<dict>
+		<key>character-class</key>
+		<dict>
+			<key>patterns</key>
+			<array>
+				<dict>
+					<key>match</key>
+					<string>\\[wWsSdDhH]|\.</string>
+					<key>name</key>
+					<string>constant.character.character-class.regexp</string>
+				</dict>
+				<dict>
+					<key>match</key>
+					<string>\\.</string>
+					<key>name</key>
+					<string>constant.character.escape.backslash.regexp</string>
+				</dict>
+				<dict>
+					<key>begin</key>
+					<string>(\[)(\^)?</string>
+					<key>beginCaptures</key>
+					<dict>
+						<key>1</key>
+						<dict>
+							<key>name</key>
+							<string>punctuation.definition.character-class.regexp</string>
+						</dict>
+						<key>2</key>
+						<dict>
+							<key>name</key>
+							<string>keyword.operator.negation.regexp</string>
+						</dict>
+					</dict>
+					<key>end</key>
+					<string>(\])</string>
+					<key>endCaptures</key>
+					<dict>
+						<key>1</key>
+						<dict>
+							<key>name</key>
+							<string>punctuation.definition.character-class.regexp</string>
+						</dict>
+					</dict>
+					<key>name</key>
+					<string>constant.other.character-class.set.regexp</string>
+					<key>patterns</key>
+					<array>
+						<dict>
+							<key>include</key>
+							<string>#character-class</string>
+						</dict>
+						<dict>
+							<key>captures</key>
+							<dict>
+								<key>2</key>
+								<dict>
+									<key>name</key>
+									<string>constant.character.escape.backslash.regexp</string>
+								</dict>
+								<key>4</key>
+								<dict>
+									<key>name</key>
+									<string>constant.character.escape.backslash.regexp</string>
+								</dict>
+							</dict>
+							<key>match</key>
+							<string>(.|(\\.))\-([^\]]|(\\.))</string>
+							<key>name</key>
+							<string>constant.other.character-class.range.regexp</string>
+						</dict>
+						<dict>
+							<key>match</key>
+							<string>&amp;&amp;</string>
+							<key>name</key>
+							<string>keyword.operator.intersection.regexp</string>
+						</dict>
+					</array>
+				</dict>
+			</array>
+		</dict>
+		<key>comment</key>
+		<dict>
+			<key>captures</key>
+			<dict>
+				<key>1</key>
+				<dict>
+					<key>name</key>
+					<string>punctuation.definition.comment.treetop</string>
+				</dict>
+			</dict>
+			<key>match</key>
+			<string>(#).*$\n?</string>
+			<key>name</key>
+			<string>comment.line.number-sign.treetop</string>
+		</dict>
+		<key>strings</key>
+		<dict>
+			<key>patterns</key>
+			<array>
+				<dict>
+					<key>begin</key>
+					<string>'</string>
+					<key>beginCaptures</key>
+					<dict>
+						<key>0</key>
+						<dict>
+							<key>name</key>
+							<string>punctuation.definition.string.begin.treetop</string>
+						</dict>
+					</dict>
+					<key>end</key>
+					<string>'</string>
+					<key>endCaptures</key>
+					<dict>
+						<key>0</key>
+						<dict>
+							<key>name</key>
+							<string>punctuation.definition.string.end.treetop</string>
+						</dict>
+					</dict>
+					<key>name</key>
+					<string>string.quoted.single.treetop</string>
+					<key>patterns</key>
+					<array>
+						<dict>
+							<key>match</key>
+							<string>\\(u\h{4}|.)</string>
+							<key>name</key>
+							<string>constant.character.escape.antlr</string>
+						</dict>
+					</array>
+				</dict>
+				<dict>
+					<key>begin</key>
+					<string>"</string>
+					<key>beginCaptures</key>
+					<dict>
+						<key>0</key>
+						<dict>
+							<key>name</key>
+							<string>punctuation.definition.string.begin.treetop</string>
+						</dict>
+					</dict>
+					<key>end</key>
+					<string>"</string>
+					<key>endCaptures</key>
+					<dict>
+						<key>0</key>
+						<dict>
+							<key>name</key>
+							<string>punctuation.definition.string.end.treetop</string>
+						</dict>
+					</dict>
+					<key>name</key>
+					<string>string.quoted.double.treetop</string>
+				</dict>
+			</array>
+		</dict>
+	</dict>
+	<key>scopeName</key>
+	<string>source.treetop</string>
+	<key>uuid</key>
+	<string>A1604A34-0B73-4D5A-9499-87D881DFA8D5</string>
+</dict>
+</plist>

data/Treetop.tmbundle/info.plist ADDED Viewed

@@ -0,0 +1,10 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
+<plist version="1.0">
+<dict>
+	<key>name</key>
+	<string>Treetop</string>
+	<key>uuid</key>
+	<string>83A8B700-143D-4BD6-B4EA-D73796E8F883</string>
+</dict>
+</plist>

data/doc/pitfalls_and_advanced_techniques.markdown CHANGED Viewed

@@ -30,7 +30,7 @@ Say I want to parse a diabolical wiki syntax in which the following interpretati
     end
     rule em
-      '**' (strong / !'*' . / '\*')+ '**'
+      '*' (strong / !'*' . / '\*')+ '*'
     end
 Emphasized text is allowed within strong text by virtue of `em` being the first alternative. Since `em` will only successfully parse if a matching `*` is found, it is permitted, but other than that, no `*` characters are allowed unless they are escaped.
@@ -49,3 +49,9 @@ This says that `'end'` must be followed by a space, but this space is not consum
     end
 In general, when the syntax gets tough, it helps to focus on what you really mean. A keyword is a character not followed by another character that isn't a space.
+## Poor Performance with Large Unicode Strings
+Treetop may perform poorly when parsing very large (more than 100KB) unicode strings. This is due to the fact that substring lookups on Ruby unicode strings are linear-time operations, and not constant-time operations like they are on ASCII encoded strings. This means that parse times for larger strings can be exponentially worse than for smaller strings.
+If your input and grammar only expect ASCII strings, you can achieve significant performance improvements for large strings by re-encoding them to ASCII using `input.encode(Encoding::US_ASCII)`. See [this issue on GitHub](https://github.com/cjheath/treetop/issues/31) for more information and other possible workarounds for unicode strings.

data/doc/syntactic_recognition.markdown CHANGED Viewed

@@ -32,13 +32,15 @@ The main keywords are:
 * `rule` : This defines a parsing rule within the grammar. It is followed by a name by which this rule can be referenced within other rules. It is then followed by a parsing expression defining the rule.
-A grammar may be surrounded by one or more nested `module` statements, which provides a namespace for the generated Ruby parser.
+A grammar may be surrounded by one or more nested `module` or `class` statements, which provides a namespace for the generated Ruby parser. Note that you cannot specify a superclass for a class, so if your class has a superclass, it must be declared elsewhere and loaded first.
-Treetop will emit a module called `GrammarName` and a parser class called `GrammarNameParser` (in the module namespace, if specified).
+Treetop will emit a module called `GrammarName` and a parser class called `GrammarNameParser` (in the namespace, if specified).
 #Parsing Expressions
 Each rule associates a name with a _parsing expression_. Parsing expressions are a generalization of vanilla regular expressions. Their key feature is the ability to reference other expressions in the grammar by name.
+Treetop parsers will try to match the first rule defined in the grammar, unless you pass an optional parameter to set a different top rule.
 ##Terminal Symbols
 ###Strings
 Strings are surrounded in double or single quotes and must be matched exactly.
@@ -213,3 +215,6 @@ tried at which locations in the input, and what the result was. This process, ca
 requires that the rule would produce the same result (if run again) as it produced the first time when
 the result was remembered. If you violate this principle in your semantic predicates, be prepared to
 fight Cerberus before you're allowed out of Hades again.
+There's an example of how to use semantic predicates to parse a language with white-space indented blocks
+in the examples directory.

data/doc/tt.1 CHANGED Viewed

@@ -80,4 +80,4 @@ tt \-o alterate_name.rb foo
 The treetop website:
-.B http://treetop.rubyforge.org
+.B http://cjheath.github.io/treetop/

data/examples/indented_blocks/indented_blocks.tt ADDED Viewed

@@ -0,0 +1,73 @@
+grammar IndentedBlocks
+  rule top
+    # Initialise the indent stack with a sentinel:
+    &{|s| @indents = [-1] }
+    foo:('foo'?)
+    nested_blocks
+    {
+      def inspect
+	nested_blocks.inspect
+      end
+    }
+  end
+  rule nested_blocks
+    (
+      # Do not try to extract this semantic predicate into a new rule.
+      # It will be memo-ized incorrectly because @indents.last will change.
+      !{|s|
+	# Peek at the following indentation:
+	save = index; i = _nt_indentation; index = save
+	# We're closing if the indentation is less or the same as our enclosing block's:
+	closing = i.text_value.length <= @indents.last
+      }
+      block
+    )*
+    {
+      def inspect
+	elements.map{|e| e.block.inspect}*"\n"
+      end
+    }
+  end
+  rule block
+    indented_line       # The block's opening line
+    &{|s|               # Push the indent level to the stack
+      level = s[0].indentation.text_value.length
+      @indents << level
+      true
+    }
+    nested_blocks       # Parse any nested blocks
+    &{|s|               # Pop the indent stack
+      # Note that under no circumstances should "nested_blocks" fail, or the stack will be mis-aligned
+      @indents.pop
+      true
+    }
+    {
+      def inspect
+	indented_line.inspect +
+	  (nested_blocks.elements.size > 0 ? (
+	    "\n{\n" +
+	    nested_blocks.elements.map { |content|
+	      content.block.inspect+"\n"
+	    }*'' +
+	    "}"
+	  )
+	  : "")
+      end
+    }
+  end
+  rule indented_line
+    indentation text:((!"\n" .)*) "\n"
+    {
+      def inspect
+	text.text_value
+      end
+    }
+  end
+  rule indentation
+    ' '*
+  end
+end

data/examples/indented_blocks/indented_blocks_test.rb ADDED Viewed

@@ -0,0 +1,24 @@
+require 'polyglot'
+require 'byebug'
+require 'treetop'
+require 'indented_blocks'
+parser = IndentedBlocksParser.new
+input = <<END
+def foo
+  here is some indented text
+    here it's further indented
+    and here the same
+      but here it's further again
+      and some more like that
+    before going back to here
+      down again
+  back twice
+and start from the beginning again
+  with only a small block this time
+END
+parse_tree = parser.parse input
+p parse_tree

data/lib/treetop/compiler/grammar_compiler.rb CHANGED Viewed

@@ -33,10 +33,13 @@ module Treetop
   # compile a treetop source file and load it
   def self.load(path)
-    adjusted_path = path =~ /\.(treetop|tt)\Z/ ? path : path + '.treetop'
-    File.open(adjusted_path) do |source_file|
+    unless path =~ Treetop::Polyglot::VALID_GRAMMAR_EXT_REGEXP
+      ext = Treetop::Polyglot::VALID_GRAMMAR_EXT.select {|ext| File.exist?(path+".#{ext}")}.shift
+      path += ".#{ext}" unless ext.nil?
+    end
+    File.open(path) do |source_file|
       source = source_file.read
-      source.gsub!(/\b__FILE__\b/, %Q{"#{adjusted_path}"})
+      source.gsub!(/\b__FILE__\b/, %Q{"#{path}"})
       load_from_string(source)
     end
   end