RubyGems - maruku - Versions diffs - 0.2.13 → 0.3.0 - Mend

maruku 0.2.13 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (86) hide show

data/bin/maruku +23 -15
data/bin/maruku0.3 +37 -0
data/bin/marutest +277 -0
data/docs/changelog-0.3.html +99 -0
data/docs/changelog-0.3.md +84 -0
data/docs/faq.html +46 -0
data/docs/faq.md +32 -0
data/docs/index.html +629 -64
data/docs/markdown_extra2.html +67 -14
data/docs/markdown_syntax.html +631 -94
data/docs/markdown_syntax_2.html +152 -0
data/docs/maruku.html +629 -64
data/docs/maruku.md +108 -105
data/docs/proposal.html +362 -55
data/docs/proposal.md +133 -169
data/docs/todo.html +30 -0
data/lib/maruku.rb +13 -3
data/lib/maruku/errors_management.rb +75 -0
data/lib/maruku/helpers.rb +164 -0
data/lib/maruku/html_helper.rb +33 -13
data/lib/maruku/parse_block.rb +89 -92
data/lib/maruku/parse_doc.rb +43 -18
data/lib/maruku/parse_span.rb +17 -46
data/lib/maruku/parse_span_better.rb +681 -0
data/lib/maruku/string_utils.rb +17 -10
data/lib/maruku/structures.rb +62 -35
data/lib/maruku/structures_iterators.rb +39 -0
data/lib/maruku/tests/benchmark.rb +12 -4
data/lib/maruku/tests/new_parser.rb +318 -0
data/lib/maruku/to_html.rb +113 -44
data/lib/maruku/to_latex.rb +32 -14
data/lib/maruku/to_markdown.rb +110 -0
data/lib/maruku/toc.rb +35 -1
data/lib/maruku/version.rb +10 -1
data/lib/test.rb +29 -0
data/tests/others/escaping.md +6 -4
data/tests/others/links.md +1 -1
data/tests/others/lists_after_paragraph.md +44 -0
data/tests/unittest/abbreviations.md +71 -0
data/tests/unittest/blank.md +43 -0
data/tests/unittest/blanks_in_code.md +131 -0
data/tests/unittest/code.md +64 -0
data/tests/unittest/code2.md +59 -0
data/tests/unittest/code3.md +121 -0
data/tests/unittest/easy.md +36 -0
data/tests/unittest/email.md +39 -0
data/tests/unittest/encoding/iso-8859-1.md +9 -0
data/tests/unittest/encoding/utf-8.md +38 -0
data/tests/unittest/entities.md +174 -0
data/tests/unittest/escaping.md +97 -0
data/tests/unittest/extra_dl.md +81 -0
data/tests/unittest/extra_header_id.md +96 -0
data/tests/unittest/extra_table1.md +78 -0
data/tests/unittest/footnotes.md +120 -0
data/tests/unittest/headers.md +64 -0
data/tests/unittest/hrule.md +77 -0
data/tests/unittest/images.md +114 -0
data/tests/unittest/inline_html.md +185 -0
data/tests/unittest/links.md +162 -0
data/tests/unittest/list1.md +80 -0
data/tests/unittest/list2.md +75 -0
data/tests/unittest/list3.md +111 -0
data/tests/unittest/list4.md +43 -0
data/tests/unittest/lists.md +262 -0
data/tests/unittest/lists_after_paragraph.md +280 -0
data/tests/unittest/lists_ol.md +323 -0
data/tests/unittest/misc_sw.md +751 -0
data/tests/unittest/notyet/escape.md +46 -0
data/tests/unittest/notyet/header_after_par.md +85 -0
data/tests/unittest/notyet/ticks.md +67 -0
data/tests/unittest/notyet/triggering.md +210 -0
data/tests/unittest/one.md +33 -0
data/tests/unittest/paragraph.md +34 -0
data/tests/unittest/paragraph_rules/dont_merge_ref.md +60 -0
data/tests/unittest/paragraph_rules/tab_is_blank.md +43 -0
data/tests/unittest/paragraphs.md +84 -0
data/tests/unittest/recover/recover_links.md +32 -0
data/tests/unittest/references/long_example.md +87 -0
data/tests/unittest/references/spaces_and_numbers.md +27 -0
data/tests/unittest/syntax_hl.md +99 -0
data/tests/unittest/test.md +36 -0
data/tests/unittest/wrapping.md +88 -0
data/tests/utf8-files/simple.md +1 -0
metadata +139 -86
data/lib/maruku/maruku.rb +0 -50
data/tests/a.md +0 -10

data/lib/maruku/parse_doc.rb CHANGED

@@ -16,14 +16,17 @@
 #   along with Maruku; if not, write to the Free Software
 #   Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
+require 'iconv'
 class Maruku
-	def initialize(s=nil)
+	def initialize(s=nil, meta={})
 		@node_type = :document
 		@doc       = self
 		@refs = {}
 		@footnotes = {}
 		@abbreviations = {}
+		@meta = meta
 		parse_doc(s) if s
 	end
@@ -32,14 +35,31 @@ class Maruku
 		# setup initial stack
 		@stack = []
-		@meta = parse_email_headers(s)
-		data = @meta[:data]
-		@meta.delete :data
-		lines =  split_lines(data)
+		meta2 =  parse_email_headers(s)
+		data = meta2[:data]
+		meta2.delete :data
+		@meta.merge! meta2
+		enc = @meta[:encoding]
+		@meta.delete :encoding
+		if enc && enc.downcase != 'utf-8'
+#			puts "Converting from #{enc} to UTF-8."
+			converted = Iconv.new('utf-8', enc).iconv(data)
+#			puts "Data: #{data.inspect}: #{data}"
+#			puts "Conv: #{converted.inspect}: #{converted}"
+			data = converted
+		end
+		lines = Maruku.split_lines(data)
 		@children = parse_lines_as_markdown(lines)
-		self.search_abbreviations
-		self.substitute_markdown_inside_raw_html
+		if true #markdown_extra?
+			self.search_abbreviations
+			self.substitute_markdown_inside_raw_html
+		end
 		toc = create_toc
@@ -47,24 +67,28 @@ class Maruku
 		if not self.meta[:title] and toc.header_element
 			title = toc.header_element.to_s
 			self.meta[:title]  = title
-			puts "Set document title to #{title}"
+#			puts "Set document title to #{title}"
 		end
 		# save for later use
 		self.toc = toc
-		#puts toc.inspect
+#		puts self.inspect
 	end
 	def search_abbreviations
 		@abbreviations.each do |abbrev, title|
-#		puts "#{abbrev} => #{title}"
-			self.map_match(Regexp.new(Regexp.escape(abbrev))) {
-				e = create_md_element(:abbreviation)
-				e.children = [abbrev.dup]
-				e.meta[:title] = title.dup if title
-				e
-			}
+			reg = Regexp.new(Regexp.escape(abbrev))
+			self.replace_each_string do |s|
+				if m = reg.match(s)
+					e = create_md_element(:abbreviation)
+					e.children = [abbrev.dup]
+					e.meta[:title] = title.dup if title
+					[m.pre_match, e, m.post_match]
+				else
+					s
+				end
+			end
 		end
 	end
@@ -72,7 +96,7 @@ class Maruku
 	# markdown=1 or markdown=block defined
 	def substitute_markdown_inside_raw_html
 		self.each_element(:raw_html) do |e|
-			doc = e.meta[:parsed_html]
+			doc = e.instance_variable_get :@parsed_html
 			if doc # valid html
 				# parse block-level markdown elements in these HTML tags
 				block_tags = ['div']
@@ -89,7 +113,7 @@ class Maruku
 						s = original_text.to_s.strip # XXX
 						el = create_md_element(:dummy,
 						 	parse_blocks ? parse_text_as_markdown(s) :
-						                  parse_lines_as_span(s) )
+						                  parse_lines_as_span([s]) )
 						el.children_to_html.each do |x|
 							e.insert_before(original_text, x)
 						end
@@ -100,5 +124,6 @@ class Maruku
 			end
 		end
 	end
 end

data/lib/maruku/parse_span.rb CHANGED

@@ -31,8 +31,7 @@ class Maruku
 		# first, get rid of linebreaks
 		res = resolve_linebreaks(lines)
-		span = MDElement.new
-		span.children = res
+		span = MDElement.new(:dummy, res)
 		# encode all escapes
 		span.replace_each_string { |s| s.escape_md_special }
@@ -97,15 +96,8 @@ class Maruku
 		for reg in [inlineHTML1, inlineHTML2]
 			span.map_match(reg) { |match|
-				raw_html = (match[1] || raise("No html?"))
-				e = create_md_element(:raw_html)
-				e.meta[:raw_html]  = raw_html
-				begin
-					e.meta[:parsed_html] = Document.new(raw_html)
-				rescue
-					$stderr.puts "Malformed HTML:\n#{raw_html}"
-				end
-				e
+				raw_html = match[1]
+				convert_raw_html_in_list(raw_html)
 			}
 		end
@@ -321,44 +313,23 @@ class Maruku
 		res
 	end
+	# raw_html is something like
+	#  <em> A</em> dopwkk *maruk* <em>A</em>
+	def convert_raw_html_in_list(raw_html)
+		e = create_md_element(:raw_html)
+		e.meta[:raw_html]  = raw_html
+		begin
+			e.meta[:parsed_html] = Document.new(raw_html)
+		rescue
+			$stderr.puts "convert_raw_html_in_list Malformed HTML:\n#{raw_html}"
+		end
+		e
+	end
 end
 # And now the black magic that makes the part above so elegant
-class MDElement
-	# yields to each element of specified node_type
-	def each_element(e_node_type, &block)
-		@children.each do |c|
-			if c.kind_of? MDElement
-				if (not e_node_type) || (e_node_type == c.node_type)
-					block.call c
-				end
-				c.each_element(e_node_type, &block)
-			end
-		end
-	end
-	# Apply passed block to each String in the hierarchy.
-	def replace_each_string(&block)
-		for c in @children
-			if c.kind_of? MDElement
-				c.replace_each_string(&block)
-			end
-		end
-		processed = []
-		until @children.empty?
-			c = @children.shift
-			if c.kind_of? String
-				result = block.call(c)
-				[*result].each do |e| processed << e end
-			else
-				processed << c
-			end
-		end
-		@children = processed
-	end
+class MDElement
 	# Try to match the regexp to each string in the hierarchy
 	# (using `replace_each_string`). If the regexp match, eliminate

data/lib/maruku/parse_span_better.rb ADDED

@@ -0,0 +1,681 @@
+require 'set'
+class Maruku
+	include Helpers
+	EscapedCharInText =
+		Set.new [?\\,?`,?*,?_,?{,?},?[,?],?(,?),?#,?.,?!,?|,?:,?+,?-,?>]
+	EscapedCharInQuotes =
+		Set.new [?\\,?`,?*,?_,?{,?},?[,?],?(,?),?#,?.,?!,?|,?:,?+,?-,?>,?',?"]
+	EscapedCharInInlineCode = [?\\,?`]
+	def parse_lines_as_span(lines)
+		parse_span_better lines.join("\n")
+	end
+	def parse_span_better(string)
+		if not string.kind_of? String then
+			error "Passed #{string.class}." end
+		st = (string + "")
+		st.freeze
+		src = CharSource.new(st)
+		read_span(src, EscapedCharInText, [nil])
+	end
+	# This is the main loop for reading span elements
+	#
+	# It's long, but not *complex* or difficult to understand.
+	#
+	#
+	def read_span(src, escaped, exit_on_chars, exit_on_strings=nil)
+		con = SpanContext.new
+		c = d = nil
+		while true
+			c = src.cur_char
+			if c && ((c>=?a && c<=?z) || ((c>=?A && c<=?Z)))
+#				src.read_text_chars con.cur_string
+				con.cur_string << src.shift_char
+				next
+			end
+			break if exit_on_chars && exit_on_chars.include?(c)
+			break if exit_on_strings && exit_on_strings.any? {|x| src.cur_chars_are x}
+			case c
+			when ?\ # it's space (32)
+				if src.cur_chars_are "  \n"
+					src.ignore_chars(3)
+					con.push_element  create_md_element(:linebreak)
+					next
+				else
+					src.ignore_char
+					con.push_space
+				end
+			when ?\n, ?\t
+				src.ignore_char
+				con.push_space
+			when ?`
+				read_inline_code(src,con)
+			when ?<
+				# It could be:
+				# 1) HTML "<div ..."
+				# 2) HTML "<!-- ..."
+				# 3) url "<http:// ", "<ftp:// ..."
+				# 4) email "<andrea@... ", "<mailto:andrea@..."
+				# 5) on itself! "a < b	"
+				case d = src.next_char
+					when ?!;
+						if src.cur_chars_are '<!--'
+							read_inline_html(src, con)
+						else
+							con.push_char src.shift_char
+						end
+					when ??; read_server_directive
+					when ?\ , ?\t
+						con.push_char src.shift_char
+					else;
+						if src.next_matches(/<mailto:/) or
+						   src.next_matches(/<[\w\.]+\@/)
+							read_email_el(src, con)
+						elsif src.next_matches(/<\w+:/)
+							read_url_el(src, con)
+						elsif src.next_matches(/<\w/)
+#							puts "This is HTML: #{src.cur_chars(20)}"
+							read_inline_html(src, con)
+						else
+#							puts "This is NOT HTML: #{src.cur_chars(20)}"
+							con.push_char src.shift_char
+						end
+				end
+			when ?\\
+				d = src.next_char
+				if escaped.include? d
+					src.ignore_chars(2)
+					con.push_char d
+				else
+					con.push_char src.shift_char
+				end
+			when ?[
+				if markdown_extra? && src.next_char == ?^
+					read_footnote_ref(src,con)
+				else
+					read_link(src, con)
+				end
+			when ?!
+				if src.next_char == ?[
+					read_image(src, con)
+				else
+					con.push_char src.shift_char
+				end
+			when ?&
+				if m = src.read_regexp(/&([\w\d]+);/)
+					con.push_element md_entity(m[1])
+				else
+					con.push_char src.shift_char
+				end
+			when ?*
+				if not src.next_char
+					error "Opening * as last char", src, con
+					tell_user "Threating as literal"
+					con.push_char src.shift_char
+				else
+					follows = src.cur_chars(4)
+					if follows =~ /^\*\*\*[^\s\*]/
+						con.push_element read_emstrong(src,'***')
+					elsif follows  =~ /^\*\*[^\s\*]/
+						con.push_element read_strong(src,'**')
+					elsif follows =~ /^\*[^\s\*]/
+						con.push_element read_em(src,'*')
+					else # * is just a normal char
+						con.push_char src.shift_char
+					end
+				end
+			when ?_
+				if not src.next_char
+					error "Opening _ as last char", src, con
+					tell_user "Threating as literal"
+					con.push_char src.shift_char
+				else
+					follows = src.cur_chars(4)
+					if  follows =~ /^\_\_\_[^\s\_]/
+						con.push_element read_emstrong(src,'___')
+					elsif follows  =~ /^\_\_[^\s\_]/
+						con.push_element read_strong(src,'__')
+					elsif follows =~ /^\_[^\s\_]/
+						con.push_element read_em(src,'_')
+					else # _ is just a normal char
+						con.push_char src.shift_char
+					end
+				end
+			when nil
+				error ("Unclosed span (waiting for %s"+
+				 "#{exit_on_strings.inspect})") % [
+						exit_on_chars ? "#{exit_on_chars.inspect} or" : ""],
+						src,con
+				tell_user "I will boldly  go ahead."
+				break
+			else # normal text
+				con.push_char src.shift_char
+			end # end case
+		end # end while true
+		con.push_string_if_present
+		con.elements
+	end
+	def read_url_el(src,con)
+		src.ignore_char # leading <
+		url = read_simple(src, [], [?>])
+		src.ignore_char # closing >
+		con.push_element md_url(url)
+	end
+	def read_email_el(src,con)
+		src.ignore_char # leading <
+		mail = read_simple(src, [], [?>])
+		src.ignore_char # closing >
+		address = mail.gsub(/^mailto:/,'')
+		con.push_element md_email(address)
+	end
+	def read_url(src, break_on)
+		if [?',?"].include? src.cur_char
+			error 'Invalid char for url', src
+		end
+		url = read_simple(src, [], break_on)
+		if url[0] == ?< && url[-1] == ?>
+			url = url[1, url.size-2]
+		end
+		if url.size == 0
+			return nil
+		end
+		url
+	end
+	# Tries to read a quoted value. If stream does not
+	# start with ' or ", returns nil.
+	def read_quoted(src,con)
+		case src.cur_char
+			when ?', ?"
+				quote_char = src.shift_char # opening quote
+				string = read_simple(src, EscapedCharInQuotes, [quote_char])
+				src.ignore_char # closing quote
+				return string
+			else
+#				puts "Asked to read quote from: #{src.cur_chars(10).inspect}"
+				return nil
+		end
+	end
+	# Reads a simple string (no formatting) until one of break_on_chars,
+	# while escaping the escaped
+	def read_simple(src, escaped, exit_on_chars)
+		text = ""
+		while true
+#			puts "Reading simple #{text.inspect}"
+			c = src.cur_char
+			if exit_on_chars && exit_on_chars.include?(c)
+#				puts ("  breaking on "<<c)+" contained in "+exit_on_chars.inspect
+				break
+			end
+			case c
+			when nil
+				s= "String finished while reading (break on #{exit_on_chars.inspect})"+
+				" already read: #{text.inspect}"
+				error s, src
+				tell_user "I boldly continue"
+				break
+			when ?\\
+				d = src.next_char
+				if escaped.include? d
+					src.ignore_chars(2)
+					text << d
+				else
+					text << src.shift_char
+				end
+			else
+				text << src.shift_char
+			end
+		end
+#		puts "Read simple #{text.inspect}"
+		text
+	end
+	def read_em(src, delim)
+		src.ignore_char
+		children = read_span(src, EscapedCharInText, nil, [delim])
+		src.ignore_char
+		md_em(children)
+	end
+	def read_strong(src, delim)
+		src.ignore_chars(2)
+		children = read_span(src, EscapedCharInText, nil, [delim])
+		src.ignore_chars(2)
+		md_strong(children)
+	end
+	def read_emstrong(src, delim)
+		src.ignore_chars(3)
+		children = read_span(src, EscapedCharInText, nil, [delim])
+		src.ignore_chars(3)
+		md_emstrong(children)
+	end
+	SPACE = ?\ # = 32
+#	R_REF_ID = Regexp.compile(/([^\]\s]*)(\s*\])/)
+	R_REF_ID = Regexp.compile(/([^\]\s]*)(\s*\])/)
+	# Reads a bracketed id "[refid]". Consumes also both brackets.
+	def read_ref_id(src, con)
+		src.ignore_char # [
+		src.consume_whitespace
+#		puts "Next: #{src.cur_chars(10).inspect}"
+		if m = src.read_regexp(R_REF_ID)
+#			puts "Got: #{m[1].inspect} Ignored: #{m[2].inspect}"
+#			puts "Then: #{src.cur_chars(10).inspect}"
+			m[1]
+		else
+			nil
+		end
+	end
+	def read_footnote_ref(src,con)
+		ref = read_ref_id(src,con)
+		con.push_element md_foot_ref(ref)
+	end
+	def read_inline_html(src, con)
+		h = HTMLHelper.new
+		begin
+			# This is our current buffer in the context
+			start = src.current_remaining_buffer
+			h.eat_this start
+			if not h.is_finished?
+				error "inline_html: Malformed:\n "+
+					"#{start.inspect}\n #{h.inspect}",src,con
+			end
+			consumed = start.size - h.rest.size
+			if consumed > 0
+				con.push_element md_html(h.stuff_you_read)
+				src.ignore_chars(consumed)
+			else
+				puts "HTML helper did not work on #{start.inspect}"
+				con.push_char src.shift_char
+			end
+		rescue Exception => e
+			maruku_error "Bad html: \n" +
+				add_tabs(e.inspect+e.backtrace.join("\n"),1,'>'),
+				src,con
+			tell_user "I will try to continue after bad HTML."
+			con.push_char src.shift_char
+		end
+	end
+	def read_inline_code(src, con)
+		num_ticks = 0
+		while src.cur_char == ?`
+			num_ticks += 1
+			src.ignore_char
+		end
+		# ignore space
+		if num_ticks > 1 && src.cur_char == SPACE
+			src.ignore_char
+		end
+#		puts "Ticks: #{num_ticks } next: #{src.some} "
+		end_string = "`"*num_ticks
+		code = ''
+		while true
+			if not src.cur_char
+				error("Ticks not finished: read #{code.inspect}"+
+				      " and waiting for #{end_string.inspect} num=#{num_ticks}",
+						src,con)
+				tell_user "Read invalid code block: #{code.inspect}"
+				break
+			end
+			if src.cur_chars(num_ticks) ==end_string # bah
+#				puts "Breaking on #{src.some}  (end:#{end_string.inspect})"
+				src.ignore_chars num_ticks
+				break
+			end
+			code << src.shift_char
+		end
+		# drop last space
+		if num_ticks > 1 && code[-1] == SPACE
+			code = code[0,code.size-1]
+		end
+#		puts "Read `` code: #{code.inspect}; after: #{src.cur_chars(10).inspect} "
+		con.push_element md_code(code)
+	end
+	def read_server_directive
+		# match = gimme(/^(.*)\?>/)
+		# if not match
+		# 	error "Server directive not closed"
+		# end
+		# server = match[1]
+		# con.found_object create_md_element(:server, server)
+	end
+	def read_link(src, con)
+		# we read the string and see what happens
+		src.ignore_char # opening bracket
+		children = read_span(src, EscapedCharInText, [?]])
+		src.ignore_char # closing bracket
+		# ignore space
+		if src.cur_char == SPACE and
+			(src.next_char == ?[ or src.next_char == ?( )
+			src.shift_char
+		end
+		case src.cur_char
+		when ?(
+			src.ignore_char # opening (
+			src.consume_whitespace
+			url = read_url(src, [SPACE,?\t,?)])
+			if not url
+				url = '' # no url is ok
+			end
+			src.consume_whitespace
+			title = nil
+			if src.cur_char != ?) # we have a title
+				title = read_quoted(src,con)
+			end
+			src.consume_whitespace
+			closing = src.shift_char # closing )
+			if closing != ?)
+				error 'Unclosed link',src,con
+				tell_user "No closing ): I will not create"+
+				" the link for #{children.inspect}"
+				con.push_elements children
+				return
+			end
+			con.push_element md_im_link(children,url, title)
+		when ?[ # link ref
+			ref_id = read_ref_id(src,con)
+			if ref_id
+				con.push_element md_link(children, ref_id)
+			else
+				maruku_error "Could not read ref_id", src, con
+				tell_user "I will not create the link for #{children.inspect}"
+				con.push_elements children
+				return
+			end
+		else # no stuff
+			con.push_elements children
+		end
+	end # read link
+	def read_image(src, con)
+		src.ignore_chars(2) # opening "!["
+		alt_text = read_span(src, EscapedCharInText, [?]])
+		src.ignore_char # closing bracket
+		# ignore space
+		if src.cur_char == SPACE and
+			(src.next_char == ?[ or src.next_char == ?( )
+			src.ignore_char
+		end
+		case src.cur_char
+		when ?(
+			src.ignore_char # opening (
+			src.consume_whitespace
+			url = read_url(src, [SPACE,?\t,?)])
+			if not url
+				error "Could not read url from #{src.cur_chars(10).inspect}",
+					src,con
+			end
+			src.consume_whitespace
+			title = nil
+			if src.cur_char != ?) # we have a title
+				title = read_quoted(src,con)
+				error 'Must quote title',src,con if not title
+			end
+			src.consume_whitespace
+			closing = src.shift_char # closing )
+			if closing != ?)
+				error ("Unclosed link: '"<<closing<<"'")+
+					" Read url=#{url.inspect} title=#{title.inspect}",src,con
+			end
+			con.push_element md_im_image(alt_text, url, title)
+		when ?[ # link ref
+			ref_id = read_ref_id(src,con)
+			con.push_element md_image(alt_text, ref_id)
+		else # no stuff
+			con.push_elements children
+		end
+	end # read link
+end
+class SpanContext
+	include MarukuStrings
+	# Read elements
+	attr_accessor :elements
+	attr_accessor :cur_string
+	def initialize
+		@elements = []
+		@cur_string = ""
+	end
+	def push_element(e)
+		raise "Only MDElement and String, please. You pushed #{e.class}: #{e.inspect} " if
+		 not (e.kind_of?(String) or e.kind_of?(MDElement))
+		push_string_if_present
+		@elements << e
+		nil
+	end
+	def push_elements(a)
+		for e in a
+			if e.kind_of? String
+				e.each_byte do |b| push_char b end
+			else
+				push_element e
+			end
+		end
+	end
+	def push_string_if_present
+		if @cur_string.size > 0
+			@elements << @cur_string
+			@cur_string = ""
+		end
+		nil
+	end
+	def push_char(c)
+		@cur_string << c
+		nil
+	end
+	# push space into current string if
+	# there isn't one
+	def push_space
+		last = @cur_string[@cur_string.size-1]
+		@cur_string << ?\  if last != ?\
+	end
+	def describe
+		lines = @elements.map{|x| x.inspect}.join("\n")
+		s = "Elements read in span: \n" +
+		add_tabs(lines,1, ' -')+"\n"
+		if @cur_string.size > 0
+		s += "Current string: \n  #{@cur_string.inspect}\n"
+		end
+		s
+	end
+end
+class CharSource
+	include MarukuStrings
+	def initialize(s)
+		@elements = []
+		@cur_string = ""
+		@buffer = s
+		@buffer_index = 0
+	end
+	# Return current char as a FixNum (or nil).
+	def cur_char; @buffer[@buffer_index]   end
+	# Return the next n chars as a String.
+	def cur_chars(n); @buffer[@buffer_index,n]  end
+	# Return the char after current char as a FixNum (or nil).
+	def next_char; @buffer[@buffer_index+1] end
+	def shift_char
+		c = @buffer[@buffer_index]
+		@buffer_index+=1
+		c
+	end
+	def ignore_char
+		@buffer_index+=1
+	end
+	def ignore_chars(n)
+		@buffer_index+=n
+		nil
+	end
+	def current_remaining_buffer
+		@buffer[@buffer_index, @buffer.size-@buffer_index]
+	end
+	def cur_chars_are(string)
+		r2 = /^.{#{@buffer_index}}#{Regexp.escape string}/m
+		@buffer =~ r2
+	end
+	def next_matches(r)
+		r2 = /^.{#{@buffer_index}}#{r}/m
+		r2.match @buffer
+	end
+	def read_regexp(r)
+		r2 = /^.{#{@buffer_index}}#{r}/m
+		m = r2.match @buffer
+		if m
+			consumed = m.to_s.size - @buffer_index
+#			puts "Consumed #{consumed} chars (entire is #{m.to_s.inspect})"
+			ignore_chars consumed
+		else
+#			puts "Could not read regexp #{r2.inspect} from buffer "+
+#			" index=#{@buffer_index}"
+#			puts "Cur chars = #{cur_chars(20).inspect}"
+#			puts "Matches? = #{cur_chars(20) =~ r}"
+		end
+		m
+	end
+	def consume_whitespace
+		while c = cur_char
+			if (c == 32 || c == ?\t)
+#				puts "ignoring #{c}"
+				ignore_char
+			else
+#				puts "#{c} is not ws: "<<c
+				break
+			end
+		end
+	end
+	def read_text_chars(out)
+		s = @buffer.size; c=nil
+		while @buffer_index < s && (c=@buffer[@buffer_index]) &&
+			 ((c>=?a && c<=?z) || (c>=?A && c<=?Z))
+				out << c
+				@buffer_index += 1
+		end
+	end
+	def describe
+		len = 75
+		num_before = [len/2, @buffer_index].min
+		num_after = [len/2, @buffer.size-@buffer_index].min
+		num_before_max = @buffer_index
+		num_after_max = @buffer.size-@buffer_index
+#		puts "num #{num_before} #{num_after}"
+		num_before = [num_before_max, len-num_after].min
+		num_after  = [num_after_max, len-num_before].min
+#		puts "num #{num_before} #{num_after}"
+		index_start = [@buffer_index - num_before, 0].max
+		index_end   = [@buffer_index + num_after, @buffer.size].min
+		size = index_end- index_start
+#		puts "- #{index_start} #{size}"
+		str = @buffer[index_start, size]
+		str.gsub!("\n",'N')
+		str.gsub!("\t",'T')
+		if index_end == @buffer.size
+			str += "EOF"
+		end
+		pre_s = @buffer_index-index_start
+		pre_s = [pre_s, 0].max
+		pre_s2 = [len-pre_s,0].max
+#		puts "pre_S = #{pre_s}"
+		pre =" "*(pre_s)
+		"-"*len+"\n"+
+		str + "\n" +
+		"-"*pre_s + "|" + "-"*(pre_s2)+"\n"+
+#		pre + "|\n"+
+		pre + "+--- Byte #{@buffer_index}\n"+
+		"Shown bytes [#{index_start} to #{size}] of #{@buffer.size}:\n"+
+		add_tabs(@buffer,1,">")
+#		"CharSource: At character #{@buffer_index} of block "+
+#		" beginning with:\n    #{@buffer[0,50].inspect} ...\n"+
+#		" before: \n     ... #{cur_chars(50).inspect} ... "
+	end
+	def some
+		cur_chars(15).inspect
+	end
+end