RubyGems - bai-maruku - Versions diffs - 0.5.9 - Mend

bai-maruku 0.5.9

Files changed (190) hide show

data/Rakefile +102 -0
data/bin/marudown +29 -0
data/bin/maruku +181 -0
data/bin/marutest +345 -0
data/bin/marutex +31 -0
data/docs/changelog.md +334 -0
data/docs/div_syntax.md +36 -0
data/docs/entity_test.md +23 -0
data/docs/markdown_syntax.md +899 -0
data/docs/maruku.md +346 -0
data/docs/math.md +194 -0
data/docs/other_stuff.md +51 -0
data/docs/proposal.md +309 -0
data/lib/maruku.rb +141 -0
data/lib/maruku/attributes.rb +227 -0
data/lib/maruku/defaults.rb +71 -0
data/lib/maruku/errors_management.rb +92 -0
data/lib/maruku/ext/div.rb +133 -0
data/lib/maruku/ext/math.rb +41 -0
data/lib/maruku/ext/math/elements.rb +27 -0
data/lib/maruku/ext/math/latex_fix.rb +12 -0
data/lib/maruku/ext/math/mathml_engines/blahtex.rb +107 -0
data/lib/maruku/ext/math/mathml_engines/itex2mml.rb +29 -0
data/lib/maruku/ext/math/mathml_engines/none.rb +20 -0
data/lib/maruku/ext/math/mathml_engines/ritex.rb +24 -0
data/lib/maruku/ext/math/parsing.rb +119 -0
data/lib/maruku/ext/math/to_html.rb +187 -0
data/lib/maruku/ext/math/to_latex.rb +26 -0
data/lib/maruku/helpers.rb +260 -0
data/lib/maruku/input/charsource.rb +326 -0
data/lib/maruku/input/extensions.rb +69 -0
data/lib/maruku/input/html_helper.rb +189 -0
data/lib/maruku/input/linesource.rb +111 -0
data/lib/maruku/input/parse_block.rb +614 -0
data/lib/maruku/input/parse_doc.rb +227 -0
data/lib/maruku/input/parse_span_better.rb +746 -0
data/lib/maruku/input/rubypants.rb +225 -0
data/lib/maruku/input/type_detection.rb +147 -0
data/lib/maruku/input_textile2/t2_parser.rb +163 -0
data/lib/maruku/maruku.rb +33 -0
data/lib/maruku/output/s5/fancy.rb +756 -0
data/lib/maruku/output/s5/to_s5.rb +138 -0
data/lib/maruku/output/to_html.rb +991 -0
data/lib/maruku/output/to_latex.rb +590 -0
data/lib/maruku/output/to_latex_entities.rb +367 -0
data/lib/maruku/output/to_latex_strings.rb +64 -0
data/lib/maruku/output/to_markdown.rb +164 -0
data/lib/maruku/output/to_s.rb +56 -0
data/lib/maruku/string_utils.rb +191 -0
data/lib/maruku/structures.rb +167 -0
data/lib/maruku/structures_inspect.rb +87 -0
data/lib/maruku/structures_iterators.rb +61 -0
data/lib/maruku/tests/benchmark.rb +82 -0
data/lib/maruku/tests/new_parser.rb +373 -0
data/lib/maruku/tests/tests.rb +136 -0
data/lib/maruku/textile2.rb +1 -0
data/lib/maruku/toc.rb +199 -0
data/lib/maruku/usage/example1.rb +33 -0
data/lib/maruku/version.rb +40 -0
data/maruku.gemspec +32 -0
data/tests/bugs/code_in_links.md +101 -0
data/tests/bugs/complex_escaping.md +38 -0
data/tests/math/syntax.md +46 -0
data/tests/math_usage/document.md +13 -0
data/tests/others/abbreviations.md +11 -0
data/tests/others/blank.md +4 -0
data/tests/others/code.md +5 -0
data/tests/others/code2.md +8 -0
data/tests/others/code3.md +16 -0
data/tests/others/email.md +4 -0
data/tests/others/entities.md +19 -0
data/tests/others/escaping.md +16 -0
data/tests/others/extra_dl.md +101 -0
data/tests/others/extra_header_id.md +13 -0
data/tests/others/extra_table1.md +40 -0
data/tests/others/footnotes.md +17 -0
data/tests/others/headers.md +10 -0
data/tests/others/hrule.md +10 -0
data/tests/others/images.md +20 -0
data/tests/others/inline_html.md +42 -0
data/tests/others/links.md +38 -0
data/tests/others/list1.md +4 -0
data/tests/others/list2.md +5 -0
data/tests/others/list3.md +8 -0
data/tests/others/lists.md +32 -0
data/tests/others/lists_after_paragraph.md +44 -0
data/tests/others/lists_ol.md +39 -0
data/tests/others/misc_sw.md +105 -0
data/tests/others/one.md +1 -0
data/tests/others/paragraphs.md +13 -0
data/tests/others/sss06.md +352 -0
data/tests/others/test.md +4 -0
data/tests/s5/s5profiling.md +48 -0
data/tests/unittest/abbreviations.md +64 -0
data/tests/unittest/alt.md +29 -0
data/tests/unittest/attributes/att2.md +32 -0
data/tests/unittest/attributes/att3.md +40 -0
data/tests/unittest/attributes/attributes.md +69 -0
data/tests/unittest/attributes/circular.md +38 -0
data/tests/unittest/attributes/default.md +34 -0
data/tests/unittest/blank.md +36 -0
data/tests/unittest/blanks_in_code.md +87 -0
data/tests/unittest/bug_def.md +28 -0
data/tests/unittest/bug_table.md +58 -0
data/tests/unittest/code.md +46 -0
data/tests/unittest/code2.md +40 -0
data/tests/unittest/code3.md +83 -0
data/tests/unittest/data_loss.md +37 -0
data/tests/unittest/divs/div1.md +179 -0
data/tests/unittest/divs/div2.md +33 -0
data/tests/unittest/divs/div3_nest.md +57 -0
data/tests/unittest/easy.md +27 -0
data/tests/unittest/email.md +32 -0
data/tests/unittest/encoding/iso-8859-1.md +35 -0
data/tests/unittest/encoding/utf-8.md +30 -0
data/tests/unittest/entities.md +106 -0
data/tests/unittest/escaping.md +79 -0
data/tests/unittest/extra_dl.md +64 -0
data/tests/unittest/extra_header_id.md +75 -0
data/tests/unittest/extra_table1.md +49 -0
data/tests/unittest/footnotes.md +109 -0
data/tests/unittest/headers.md +49 -0
data/tests/unittest/hex_entities.md +49 -0
data/tests/unittest/hrule.md +51 -0
data/tests/unittest/html2.md +34 -0
data/tests/unittest/html3.md +43 -0
data/tests/unittest/html4.md +37 -0
data/tests/unittest/html5.md +35 -0
data/tests/unittest/ie.md +61 -0
data/tests/unittest/images.md +102 -0
data/tests/unittest/images2.md +43 -0
data/tests/unittest/inline_html.md +187 -0
data/tests/unittest/inline_html2.md +33 -0
data/tests/unittest/links.md +164 -0
data/tests/unittest/links2.md +34 -0
data/tests/unittest/list1.md +58 -0
data/tests/unittest/list12.md +40 -0
data/tests/unittest/list2.md +68 -0
data/tests/unittest/list3.md +76 -0
data/tests/unittest/list4.md +101 -0
data/tests/unittest/lists.md +204 -0
data/tests/unittest/lists10.md +46 -0
data/tests/unittest/lists11.md +28 -0
data/tests/unittest/lists6.md +53 -0
data/tests/unittest/lists9.md +76 -0
data/tests/unittest/lists_after_paragraph.md +220 -0
data/tests/unittest/lists_ol.md +274 -0
data/tests/unittest/loss.md +28 -0
data/tests/unittest/math/equations.md +86 -0
data/tests/unittest/math/inline.md +58 -0
data/tests/unittest/math/math2.md +88 -0
data/tests/unittest/math/notmath.md +37 -0
data/tests/unittest/math/table.md +52 -0
data/tests/unittest/math/table2.md +54 -0
data/tests/unittest/misc_sw.md +537 -0
data/tests/unittest/notyet/escape.md +33 -0
data/tests/unittest/notyet/header_after_par.md +70 -0
data/tests/unittest/notyet/ticks.md +30 -0
data/tests/unittest/notyet/triggering.md +169 -0
data/tests/unittest/olist.md +57 -0
data/tests/unittest/one.md +27 -0
data/tests/unittest/paragraph.md +28 -0
data/tests/unittest/paragraph_rules/dont_merge_ref.md +54 -0
data/tests/unittest/paragraph_rules/tab_is_blank.md +36 -0
data/tests/unittest/paragraphs.md +58 -0
data/tests/unittest/pending/amps.md +27 -0
data/tests/unittest/pending/empty_cells.md +49 -0
data/tests/unittest/pending/link.md +84 -0
data/tests/unittest/pending/ref.md +33 -0
data/tests/unittest/recover/recover_links.md +27 -0
data/tests/unittest/red_tests/abbrev.md +1388 -0
data/tests/unittest/red_tests/lists7.md +68 -0
data/tests/unittest/red_tests/lists7b.md +128 -0
data/tests/unittest/red_tests/lists8.md +76 -0
data/tests/unittest/references/long_example.md +83 -0
data/tests/unittest/references/spaces_and_numbers.md +27 -0
data/tests/unittest/smartypants.md +126 -0
data/tests/unittest/syntax_hl.md +64 -0
data/tests/unittest/table_attributes.md +46 -0
data/tests/unittest/test.md +31 -0
data/tests/unittest/underscore_in_words.md +27 -0
data/tests/unittest/wrapping.md +79 -0
data/tests/unittest/xml.md +45 -0
data/tests/unittest/xml2.md +31 -0
data/tests/unittest/xml3.md +38 -0
data/tests/unittest/xml_instruction.md +64 -0
data/tests/utf8-files/simple.md +1 -0
data/unit_test_block.sh +5 -0
data/unit_test_span.sh +3 -0
metadata +251 -0

data/lib/maruku/input/parse_doc.rb ADDED Viewed

@@ -0,0 +1,227 @@
+#--
+#   Copyright (C) 2006  Andrea Censi  <andrea (at) rubyforge.org>
+#
+# This file is part of Maruku.
+#
+#   Maruku is free software; you can redistribute it and/or modify
+#   it under the terms of the GNU General Public License as published by
+#   the Free Software Foundation; either version 2 of the License, or
+#   (at your option) any later version.
+#
+#   Maruku is distributed in the hope that it will be useful,
+#   but WITHOUT ANY WARRANTY; without even the implied warranty of
+#   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+#   GNU General Public License for more details.
+#
+#   You should have received a copy of the GNU General Public License
+#   along with Maruku; if not, write to the Free Software
+#   Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
+#++
+require 'iconv'
+module MaRuKu; module In; module Markdown; module BlockLevelParser
+	def parse_doc(s)
+		# FIXME \r\n => \n
+		meta2 =  parse_email_headers(s)
+		data = meta2[:data]
+		meta2.delete :data
+		self.attributes.merge! meta2
+=begin maruku_doc
+Attribute: encoding
+Scope:     document
+Summary:   Encoding for the document.
+If the `encoding` attribute is specified, then the content
+will be converted from the specified encoding to UTF-8.
+Conversion happens using the `iconv` library.
+=end
+		enc = self.attributes[:encoding]
+		self.attributes.delete :encoding
+		if enc && enc.downcase != 'utf-8'
+			converted = Iconv.new('utf-8', enc).iconv(data)
+#			puts "Data: #{data.inspect}: #{data}"
+#			puts "Conv: #{converted.inspect}: #{converted}"
+			data = converted
+		end
+		@children = parse_text_as_markdown(data)
+		if true #markdown_extra?
+			self.search_abbreviations
+			self.substitute_markdown_inside_raw_html
+		end
+		toc = create_toc
+		# use title if not set
+		if not self.attributes[:title] and toc.header_element
+			title = toc.header_element.to_s
+			self.attributes[:title]  = title
+#			puts "Set document title to #{title}"
+		end
+		# save for later use
+		self.toc = toc
+		# Now do the attributes magic
+		each_element do |e|
+			# default attribute list
+			if default = self.ald[e.node_type.to_s]
+				expand_attribute_list(default, e.attributes)
+			end
+			expand_attribute_list(e.al, e.attributes)
+#			puts "#{e.node_type}: #{e.attributes.inspect}"
+		end
+=begin maruku_doc
+Attribute: unsafe_features
+Scope:     global
+Summary:   Enables execution of XML instructions.
+Disabled by default because of security concerns.
+=end
+		if Maruku::Globals[:unsafe_features]
+			self.execute_code_blocks
+			# TODO: remove executed code blocks
+		end
+	end
+	# Expands an attribute list in an Hash
+	def expand_attribute_list(al, result)
+		al.each do |k, v|
+			case k
+			when :class
+				if not result[:class]
+					result[:class] = v
+				else
+					result[:class] += " " + v
+				end
+			when :id; result[:id] = v
+			when :ref;
+				if self.ald[v]
+					already = (result[:expanded_references] ||= [])
+					if not already.include?(v)
+						already.push v
+						expand_attribute_list(self.ald[v], result)
+					else
+						already.push  v
+						maruku_error "Circular reference between labels.\n\n"+
+						"Label #{v.inspect} calls itself via recursion.\nThe recursion is "+
+							(already.map{|x| x.inspect}.join(' => '))
+					end
+				else
+					if not result[:unresolved_references]
+						result[:unresolved_references] = v
+					else
+						result[:unresolved_references] << " #{v}"
+					end
+				#	$stderr.puts "Unresolved reference #{v.inspect} (avail: #{self.ald.keys.inspect})"
+					result[v.to_sym] = true
+				end
+			else
+				result[k.to_sym]=v
+			end
+		end
+	end
+	def safe_execute_code(object, code)
+		begin
+			return object.instance_eval(code)
+		rescue Exception => e
+			maruku_error "Exception while executing this:\n"+
+				add_tabs(code, 1, ">")+
+				"\nThe error was:\n"+
+				add_tabs(e.inspect+"\n"+e.caller.join("\n"), 1, "|")
+		rescue RuntimeError => e
+			maruku_error "2: Exception while executing this:\n"+
+				add_tabs(code, 1, ">")+
+				"\nThe error was:\n"+
+				add_tabs(e.inspect, 1, "|")
+		rescue SyntaxError => e
+			maruku_error "2: Exception while executing this:\n"+
+				add_tabs(code, 1, ">")+
+				"\nThe error was:\n"+
+				add_tabs(e.inspect, 1, "|")
+		end
+		nil
+	end
+	def execute_code_blocks
+		self.each_element(:xml_instr) do |e|
+			if e.target == 'maruku'
+				result = safe_execute_code(e, e.code)
+				if result.kind_of?(String)
+					puts "Result is : #{result.inspect}"
+				end
+			end
+		end
+	end
+	def search_abbreviations
+		self.abbreviations.each do |abbrev, title|
+			reg = Regexp.new(Regexp.escape(abbrev))
+			self.replace_each_string do |s|
+				# bug if many abbreviations are present (agorf)
+				if m = reg.match(s)
+					e = md_abbr(abbrev.dup, title ? title.dup : nil)
+					[m.pre_match, e, m.post_match]
+				else
+					s
+				end
+			end
+		end
+	end
+	include REXML
+	# (PHP Markdown extra) Search for elements that have
+	# markdown=1 or markdown=block defined
+	def substitute_markdown_inside_raw_html
+		self.each_element(:raw_html) do |e|
+			doc = e.instance_variable_get :@parsed_html
+			if doc # valid html
+				# parse block-level markdown elements in these HTML tags
+				block_tags = ['div']
+				# use xpath to find elements with 'markdown' attribute
+				XPath.match(doc, "//*[attribute::markdown]" ).each do |e|
+#					puts "Found #{e}"
+					# should we parse block-level or span-level?
+					parse_blocks = (e.attributes['markdown'] == 'block') ||
+					               block_tags.include?(e.name)
+					# remove 'markdown' attribute
+					e.delete_attribute 'markdown'
+					# Select all text elements of e
+					XPath.match(e, "//text()" ).each { |original_text|
+						s = original_text.value.strip
+						if s.size > 0
+							el = md_el(:dummy,
+							 	parse_blocks ? parse_text_as_markdown(s) :
+							                  parse_lines_as_span([s]) )
+							p = original_text.parent
+							el.children_to_html.each do |x|
+								p.insert_before(original_text, x)
+							end
+							p.delete(original_text)
+						end
+					}
+				end
+			end
+		end
+	end
+end end end end

data/lib/maruku/input/parse_span_better.rb ADDED Viewed

@@ -0,0 +1,746 @@
+#--
+#   Copyright (C) 2006  Andrea Censi  <andrea (at) rubyforge.org>
+#
+# This file is part of Maruku.
+#
+#   Maruku is free software; you can redistribute it and/or modify
+#   it under the terms of the GNU General Public License as published by
+#   the Free Software Foundation; either version 2 of the License, or
+#   (at your option) any later version.
+#
+#   Maruku is distributed in the hope that it will be useful,
+#   but WITHOUT ANY WARRANTY; without even the implied warranty of
+#   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+#   GNU General Public License for more details.
+#
+#   You should have received a copy of the GNU General Public License
+#   along with Maruku; if not, write to the Free Software
+#   Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
+#++
+require 'set'
+module MaRuKu; module In; module Markdown; module SpanLevelParser
+	include MaRuKu::Helpers
+	EscapedCharInText =
+		Set.new [?\\,?`,?*,?_,?{,?},?[,?],?(,?),?#,?.,?!,?|,?:,?+,?-,?>]
+	EscapedCharInQuotes =
+		Set.new [?\\,?`,?*,?_,?{,?},?[,?],?(,?),?#,?.,?!,?|,?:,?+,?-,?>,?',?"]
+	EscapedCharInInlineCode = [?\\,?`]
+	def parse_lines_as_span(lines, parent=nil)
+		parse_span_better lines.join("\n"), parent
+	end
+	def parse_span_better(string, parent=nil)
+		if not string.kind_of? String then
+			error "Passed #{string.class}." end
+		st = (string + "")
+		st.freeze
+		src = CharSource.new(st, parent)
+		read_span(src, EscapedCharInText, [nil])
+	end
+	# This is the main loop for reading span elements
+	#
+	# It's long, but not *complex* or difficult to understand.
+	#
+	#
+	def read_span(src, escaped, exit_on_chars, exit_on_strings=nil)
+		con = SpanContext.new
+		c = d = nil
+		while true
+			c = src.cur_char
+			# This is only an optimization which cuts 50% of the time used.
+			# (but you can't use a-zA-z in exit_on_chars)
+			if c && ((c>=?a && c<=?z) || ((c>=?A && c<=?Z)))
+				con.cur_string << src.shift_char
+				next
+			end
+			break if exit_on_chars && exit_on_chars.include?(c)
+			break if exit_on_strings && exit_on_strings.any? {|x| src.cur_chars_are x}
+			# check if there are extensions
+			if check_span_extensions(src, con)
+				next
+			end
+			case c = src.cur_char
+			when ?\ # it's space (32)
+				if src.cur_chars_are "  \n"
+					src.ignore_chars(3)
+					con.push_element  md_br()
+					next
+				else
+					src.ignore_char
+					con.push_space
+				end
+			when ?\n, ?\t
+				src.ignore_char
+				con.push_space
+			when ?`
+				read_inline_code(src,con)
+			when ?<
+				# It could be:
+				# 1) HTML "<div ..."
+				# 2) HTML "<!-- ..."
+				# 3) url "<http:// ", "<ftp:// ..."
+				# 4) email "<andrea@... ", "<mailto:andrea@..."
+				# 5) on itself! "a < b	"
+				# 6) Start of <<guillemettes>>
+				case d = src.next_char
+					when ?<;  # guillemettes
+						src.ignore_chars(2)
+						con.push_char ?<
+						con.push_char ?<
+					when ?!;
+						if src.cur_chars_are '<!--'
+							read_inline_html(src, con)
+						else
+							con.push_char src.shift_char
+						end
+					when ??
+						read_xml_instr_span(src, con)
+					when ?\ , ?\t
+						con.push_char src.shift_char
+					else
+						if src.next_matches(/<mailto:/) or
+						   src.next_matches(/<[\w\.]+\@/)
+							read_email_el(src, con)
+						elsif src.next_matches(/<\w+:/)
+							read_url_el(src, con)
+						elsif src.next_matches(/<\w/)
+							#puts "This is HTML: #{src.cur_chars(20)}"
+							read_inline_html(src, con)
+						else
+							#puts "This is NOT HTML: #{src.cur_chars(20)}"
+							con.push_char src.shift_char
+						end
+				end
+			when ?\\
+				d = src.next_char
+				if d == ?'
+					src.ignore_chars(2)
+					con.push_element md_entity('apos')
+				elsif d == ?"
+					src.ignore_chars(2)
+					con.push_element md_entity('quot')
+				elsif escaped.include? d
+					src.ignore_chars(2)
+					con.push_char d
+				else
+					con.push_char src.shift_char
+				end
+			when ?[
+				if markdown_extra? && src.next_char == ?^
+					read_footnote_ref(src,con)
+				else
+					read_link(src, con)
+				end
+			when ?!
+				if src.next_char == ?[
+					read_image(src, con)
+				else
+					con.push_char src.shift_char
+				end
+			when ?&
+				# named references
+				if m = src.read_regexp(/\&([\w\d]+);/)
+					con.push_element md_entity(m[1])
+				# numeric
+				elsif m = src.read_regexp(/\&\#(x)?([\w\d]+);/)
+					num = m[1]  ? m[2].hex : m[2].to_i
+					con.push_element md_entity(num)
+				else
+					con.push_char src.shift_char
+				end
+			when ?*
+				if not src.next_char
+					maruku_error "Opening * as last char.", src, con
+					maruku_recover "Threating as literal"
+					con.push_char src.shift_char
+				else
+					follows = src.cur_chars(4)
+					if follows =~ /^\*\*\*[^\s\*]/
+						con.push_element read_emstrong(src,'***')
+					elsif follows  =~ /^\*\*[^\s\*]/
+						con.push_element read_strong(src,'**')
+					elsif follows =~ /^\*[^\s\*]/
+						con.push_element read_em(src,'*')
+					else # * is just a normal char
+						con.push_char src.shift_char
+					end
+				end
+			when ?_
+				if not src.next_char
+					maruku_error "Opening _ as last char", src, con
+					maruku_recover "Threating as literal", src, con
+					con.push_char src.shift_char
+				else
+					# we don't want "mod_ruby" to start an emphasis
+					# so we start one only if
+					# 1) there's nothing else in the span (first char)
+					# or 2) the last char was a space
+					# or 3) the current string is empty
+					#if con.elements.empty? ||
+					if	 (con.cur_string =~ /\s\Z/) || (con.cur_string.size == 0)
+						# also, we check the next characters
+						follows = src.cur_chars(4)
+						if  follows =~ /^\_\_\_[^\s\_]/
+							con.push_element read_emstrong(src,'___')
+						elsif follows  =~ /^\_\_[^\s\_]/
+							con.push_element read_strong(src,'__')
+						elsif follows =~ /^\_[^\s\_]/
+							con.push_element read_em(src,'_')
+						else # _ is just a normal char
+							con.push_char src.shift_char
+						end
+					else
+						# _ is just a normal char
+							con.push_char src.shift_char
+					end
+				end
+			when ?{ # extension
+				if [?#, ?., ?:].include? src.next_char
+					src.ignore_char # {
+					interpret_extension(src, con, [?}])
+					src.ignore_char # }
+				else
+					con.push_char src.shift_char
+				end
+			when nil
+				maruku_error( ("Unclosed span (waiting for %s"+
+				 "#{exit_on_strings.inspect})") % [
+						exit_on_chars ? "#{exit_on_chars.inspect} or" : ""],
+						src,con)
+				break
+			else # normal text
+				con.push_char src.shift_char
+			end # end case
+		end # end while true
+		con.push_string_if_present
+		# Assign IAL to elements
+		merge_ial(con.elements, src, con)
+		# Remove leading space
+		if (s = con.elements.first).kind_of? String
+			if s[0] == ?\ then con.elements[0] = s[1, s.size-1] end
+			con.elements.shift if s.size == 0
+		end
+		# Remove final spaces
+		if (s = con.elements.last).kind_of? String
+			s.chop! if s[-1] == ?\
+			con.elements.pop if s.size == 0
+		end
+		educated = educate(con.elements)
+		educated
+	end
+	def read_xml_instr_span(src, con)
+		src.ignore_chars(2) # starting <?
+		# read target <?target code... ?>
+		target = if m = src.read_regexp(/(\w+)/)
+			m[1]
+		else
+			''
+		end
+		delim = "?>"
+		code =
+			read_simple(src, escaped=[], break_on_chars=[],
+			break_on_strings=[delim])
+		src.ignore_chars delim.size
+		code = (code || "").strip
+		con.push_element md_xml_instr(target, code)
+	end
+	# Start: cursor on character **after** '{'
+	# End: curson on '}' or EOF
+	def interpret_extension(src, con, break_on_chars)
+		case src.cur_char
+		when ?:
+			src.ignore_char # :
+			extension_meta(src, con, break_on_chars)
+		when ?#, ?.
+			extension_meta(src, con, break_on_chars)
+		else
+			stuff = read_simple(src, escaped=[?}], break_on_chars, [])
+			if stuff =~ /^(\w+\s|[^\w])/
+				extension_id = $1.strip
+				if false
+				else
+					maruku_recover "I don't know what to do with extension '#{extension_id}'\n"+
+						"I will threat this:\n\t{#{stuff}} \n as meta-data.\n", src, con
+					extension_meta(src, con, break_on_chars)
+				end
+			else
+				maruku_recover "I will threat this:\n\t{#{stuff}} \n as meta-data.\n", src, con
+				extension_meta(src, con, break_on_chars)
+			end
+		end
+	end
+	def extension_meta(src, con, break_on_chars)
+		if m = src.read_regexp(/([^\s\:\"\']+):/)
+			name = m[1]
+			al = read_attribute_list(src, con, break_on_chars)
+#			puts "#{name}=#{al.inspect}"
+			self.doc.ald[name] = al
+		 	con.push md_ald(name, al)
+		else
+			al = read_attribute_list(src, con, break_on_chars)
+			self.doc.ald[name] = al
+			con.push md_ial(al)
+		end
+	end
+	def read_url_el(src,con)
+		src.ignore_char # leading <
+		url = read_simple(src, [], [?>])
+		src.ignore_char # closing >
+		con.push_element md_url(url)
+	end
+	def read_email_el(src,con)
+		src.ignore_char # leading <
+		mail = read_simple(src, [], [?>])
+		src.ignore_char # closing >
+		address = mail.gsub(/^mailto:/,'')
+		con.push_element md_email(address)
+	end
+	def read_url(src, break_on)
+		if [?',?"].include? src.cur_char
+			error 'Invalid char for url', src
+		end
+		url = read_simple(src, [], break_on)
+		if not url # empty url
+			url = ""
+		end
+		if url[0] == ?< && url[-1] == ?>
+			url = url[1, url.size-2]
+		end
+		if url.size == 0
+			return nil
+		end
+		url
+	end
+	def read_quoted_or_unquoted(src, con, escaped, exit_on_chars)
+		case src.cur_char
+		when ?', ?"
+			read_quoted(src, con)
+		else
+			read_simple(src, escaped, exit_on_chars)
+		end
+	end
+	# Tries to read a quoted value. If stream does not
+	# start with ' or ", returns nil.
+	def read_quoted(src, con)
+		case src.cur_char
+			when ?', ?"
+				quote_char = src.shift_char # opening quote
+				string = read_simple(src, EscapedCharInQuotes, [quote_char])
+				src.ignore_char # closing quote
+				return string
+			else
+#				puts "Asked to read quote from: #{src.cur_chars(10).inspect}"
+				return nil
+		end
+	end
+	# Reads a simple string (no formatting) until one of break_on_chars,
+	# while escaping the escaped.
+	# If the string is empty, it returns nil.
+	# Raises on error if the string terminates unexpectedly.
+#	# If eat_delim is true, and if the delim is not the EOF, then the delim
+#	# gets eaten from the stream.
+	def read_simple(src, escaped, exit_on_chars, exit_on_strings=nil)
+		text = ""
+		while true
+#			puts "Reading simple #{text.inspect}"
+			c = src.cur_char
+			if exit_on_chars && exit_on_chars.include?(c)
+#				src.ignore_char if eat_delim
+				break
+			end
+			break if exit_on_strings &&
+				exit_on_strings.any? {|x| src.cur_chars_are x}
+			case c
+			when nil
+				s= "String finished while reading (break on "+
+				"#{exit_on_chars.map{|x|""<<x}.inspect})"+
+				" already read: #{text.inspect}"
+				maruku_error s, src
+				maruku_recover "I boldly continue", src
+				break
+			when ?\\
+				d = src.next_char
+				if escaped.include? d
+					src.ignore_chars(2)
+					text << d
+				else
+					text << src.shift_char
+				end
+			else
+				text << src.shift_char
+			end
+		end
+#		puts "Read simple #{text.inspect}"
+		text.empty? ? nil : text
+	end
+	def read_em(src, delim)
+		src.ignore_char
+		children = read_span(src, EscapedCharInText, nil, [delim])
+		src.ignore_char
+		md_em(children)
+	end
+	def read_strong(src, delim)
+		src.ignore_chars(2)
+		children = read_span(src, EscapedCharInText, nil, [delim])
+		src.ignore_chars(2)
+		md_strong(children)
+	end
+	def read_emstrong(src, delim)
+		src.ignore_chars(3)
+		children = read_span(src, EscapedCharInText, nil, [delim])
+		src.ignore_chars(3)
+		md_emstrong(children)
+	end
+	SPACE = ?\ # = 32
+#	R_REF_ID = Regexp.compile(/([^\]\s]*)(\s*\])/)
+#	R_REF_ID = Regexp.compile(/([^\]\s]*)(\s*\])/)
+	R_REF_ID = Regexp.compile(/([^\]]*)\]/)
+	# Reads a bracketed id "[refid]". Consumes also both brackets.
+	def read_ref_id(src, con)
+		src.ignore_char # [
+		src.consume_whitespace
+#		puts "Next: #{src.cur_chars(10).inspect}"
+		if m = src.read_regexp(R_REF_ID)
+#			puts "Got: #{m[1].inspect} Ignored: #{m[2].inspect}"
+#			puts "Then: #{src.cur_chars(10).inspect}"
+			m[1]
+		else
+			nil
+		end
+	end
+	def read_footnote_ref(src,con)
+		ref = read_ref_id(src,con)
+		con.push_element md_foot_ref(ref)
+	end
+	def read_inline_html(src, con)
+		h = HTMLHelper.new
+		begin
+			# This is our current buffer in the context
+			next_stuff = src.current_remaining_buffer
+			consumed = 0
+			while true
+				if consumed >= next_stuff.size
+					maruku_error "Malformed HTML starting at #{next_stuff.inspect}", src, con
+					break
+				end
+				h.eat_this next_stuff[consumed].chr; consumed += 1
+				break if h.is_finished?
+			end
+			src.ignore_chars(consumed)
+			con.push_element md_html(h.stuff_you_read)
+			#start = src.current_remaining_buffer
+			# h.eat_this start
+			# if not h.is_finished?
+			# 	error "inline_html: Malformed:\n "+
+			# 		"#{start.inspect}\n #{h.inspect}",src,con
+			# end
+			#
+			# consumed = start.size - h.rest.size
+			# if consumed > 0
+			# 	con.push_element md_html(h.stuff_you_read)
+			# 	src.ignore_chars(consumed)
+			# else
+			# 	puts "HTML helper did not work on #{start.inspect}"
+			# 	con.push_char src.shift_char
+			# end
+		rescue Exception => e
+			maruku_error "Bad html: \n" +
+				add_tabs(e.inspect+e.backtrace.join("\n"),1,'>'),
+				src,con
+			maruku_recover "I will try to continue after bad HTML.", src, con
+			con.push_char src.shift_char
+		end
+	end
+	def read_inline_code(src, con)
+		# Count the number of ticks
+		num_ticks = 0
+		while src.cur_char == ?`
+			num_ticks += 1
+			src.ignore_char
+		end
+		# We will read until this string
+		end_string = "`"*num_ticks
+		code =
+			read_simple(src, escaped=[], break_on_chars=[],
+				break_on_strings=[end_string])
+#		puts "Now I expects #{num_ticks} ticks: #{src.cur_chars(10).inspect}"
+		src.ignore_chars num_ticks
+		# Ignore at most one space
+		if num_ticks > 1 && code[0] == SPACE
+			code = code[1, code.size-1]
+		end
+		# drop last space
+		if num_ticks > 1 && code[-1] == SPACE
+			code = code[0,code.size-1]
+		end
+#		puts "Read `` code: #{code.inspect}; after: #{src.cur_chars(10).inspect} "
+		con.push_element md_code(code)
+	end
+	def read_link(src, con)
+		# we read the string and see what happens
+		src.ignore_char # opening bracket
+		children = read_span(src, EscapedCharInText, [?]])
+		src.ignore_char # closing bracket
+		# ignore space
+		if src.cur_char == SPACE and
+			(src.next_char == ?[ or src.next_char == ?( )
+			src.shift_char
+		end
+		case src.cur_char
+		when ?(
+			src.ignore_char # opening (
+			src.consume_whitespace
+			url = read_url(src, [SPACE,?\t,?)])
+			if not url
+				url = '' # no url is ok
+			end
+			src.consume_whitespace
+			title = nil
+			if src.cur_char != ?) # we have a title
+				quote_char = src.cur_char
+				title = read_quoted(src,con)
+				if not title
+					maruku_error 'Must quote title',src,con
+				else
+					# Tries to read a title with quotes: ![a](url "ti"tle")
+					# this is the most ugly thing in Markdown
+					if not src.next_matches(/\s*\)/)
+						# if there is not a closing par ), then read
+						# the rest and guess it's title with quotes
+						rest = read_simple(src, escaped=[], break_on_chars=[?)],
+							break_on_strings=[])
+						# chop the closing char
+						rest.chop!
+						title << quote_char << rest
+					end
+				end
+			end
+			src.consume_whitespace
+			closing = src.shift_char # closing )
+			if closing != ?)
+				maruku_error 'Unclosed link',src,con
+				maruku_recover "No closing ): I will not create"+
+				" the link for #{children.inspect}", src, con
+				con.push_elements children
+				return
+			end
+			con.push_element md_im_link(children,url, title)
+		when ?[ # link ref
+			ref_id = read_ref_id(src,con)
+			if ref_id
+				if ref_id.size == 0
+					ref_id = sanitize_ref_id(children.to_s)
+				else
+					ref_id = sanitize_ref_id(ref_id)
+				end
+				con.push_element md_link(children, ref_id)
+			else
+				maruku_error "Could not read ref_id", src, con
+				maruku_recover "I will not create the link for "+
+					"#{children.inspect}", src, con
+				con.push_elements children
+				return
+			end
+		else # empty [link]
+			id = sanitize_ref_id(children.to_s) #. downcase.gsub(' ','_')
+			con.push_element md_link(children, id)
+		end
+	end # read link
+	def read_image(src, con)
+		src.ignore_chars(2) # opening "!["
+		alt_text = read_span(src, EscapedCharInText, [?]])
+		src.ignore_char # closing bracket
+		# ignore space
+		if src.cur_char == SPACE and
+			(src.next_char == ?[ or src.next_char == ?( )
+			src.ignore_char
+		end
+		case src.cur_char
+		when ?(
+			src.ignore_char # opening (
+			src.consume_whitespace
+			url = read_url(src, [SPACE,?\t,?)])
+			if not url
+				error "Could not read url from #{src.cur_chars(10).inspect}",
+					src,con
+			end
+			src.consume_whitespace
+			title = nil
+			if src.cur_char != ?) # we have a title
+				quote_char = src.cur_char
+				title = read_quoted(src,con)
+				if not title
+					maruku_error 'Must quote title',src,con
+				else
+					# Tries to read a title with quotes: ![a](url "ti"tle")
+					# this is the most ugly thing in Markdown
+					if not src.next_matches(/\s*\)/)
+						# if there is not a closing par ), then read
+						# the rest and guess it's title with quotes
+						rest = read_simple(src, escaped=[], break_on_chars=[?)],
+							break_on_strings=[])
+						# chop the closing char
+						rest.chop!
+						title << quote_char << rest
+					end
+				end
+			end
+			src.consume_whitespace
+			closing = src.shift_char # closing )
+			if closing != ?)
+				error( ("Unclosed link: '"<<closing<<"'")+
+					" Read url=#{url.inspect} title=#{title.inspect}",src,con)
+			end
+			con.push_element md_im_image(alt_text, url, title)
+		when ?[ # link ref
+			ref_id = read_ref_id(src,con)
+			if not ref_id # TODO: check around
+				error('Reference not closed.', src, con)
+				ref_id = ""
+			end
+			if ref_id.size == 0
+				ref_id =  alt_text.to_s
+			end
+			ref_id = sanitize_ref_id(ref_id)
+			con.push_element md_image(alt_text, ref_id)
+		else # no stuff
+			ref_id =  sanitize_ref_id(alt_text.to_s)
+			con.push_element md_image(alt_text, ref_id)
+		end
+	end # read link
+	class SpanContext
+		include MaRuKu::Strings
+		# Read elements
+		attr_accessor :elements
+		attr_accessor :cur_string
+		def initialize
+			@elements = []
+			@cur_string = ""
+		end
+		def push_element(e)
+			raise "Only MDElement and String, please. You pushed #{e.class}: #{e.inspect} " if
+			 not (e.kind_of?(String) or e.kind_of?(MDElement))
+			push_string_if_present
+			@elements << e
+			nil
+		end
+		alias push push_element
+		def push_elements(a)
+			for e in a
+				if e.kind_of? String
+					e.each_byte do |b| push_char b end
+				else
+					push_element e
+				end
+			end
+		end
+		def push_string_if_present
+			if @cur_string.size > 0
+				@elements << @cur_string
+				@cur_string = ""
+			end
+			nil
+		end
+		def push_char(c)
+			@cur_string << c
+			nil
+		end
+		# push space into current string if
+		# there isn't one
+		def push_space
+			last = @cur_string[@cur_string.size-1]
+			@cur_string << ?\  if last != ?\
+		end
+		def describe
+			lines = @elements.map{|x| x.inspect}.join("\n")
+			s = "Elements read in span: \n" +
+			add_tabs(lines,1, ' -')+"\n"
+			if @cur_string.size > 0
+			s += "Current string: \n  #{@cur_string.inspect}\n"
+			end
+			s
+		end
+	end # SpanContext
+end end end end # module MaRuKu; module In; module Markdown; module SpanLevelParser