RubyGems - textile - Versions diffs - 0.4.0 - Mend

textile 0.4.0

Files changed (8) hide show

checksums.yaml ADDED

@@ -0,0 +1,7 @@
+---
+SHA1:
+  metadata.gz: 29b8619628c3c467404af4c62c21abe0fe57315c
+  data.tar.gz: 58c3225030b2fc5182bb20540f738b40fd0a3ad2
+SHA512:
+  metadata.gz: 2f0744c414b3e4f81e2c03555b5a87697b9ce41670e05cfbc1a561e88d2b55907a679e4105e22c74ac83eab556d3729302953c29d8330d3a79d768b4d9bb8730
+  data.tar.gz: cc332b9b6d3cb62f57e76217b9836fa6b35319a4fe52c93a98087818bacc3acbbca9ecfd934a4c8d43fe81fa7e3b050f31a299e1db6547ddfd0d7444ea648342

data/README ADDED

@@ -0,0 +1,41 @@
+Recursive-descent Textile parser in Ruby
+operand = operand1+ ?;
+operand1 =
+  <text>
+  | '[==', operand, '==]'
+  | '[bq=", <author>, '"]', operand, '[/bq]'
+  | '[bq]', operand, '[/bq]'
+  | '[spoiler]', operand, '[/spoiler]'
+  | '==', operand, '=='
+  | link
+  | image
+  | '[**', operand, '**]' | '**', operand, '**'
+  | '[*', operand, '*]' | '*', operand, '*'
+  | '[__', operand, '__]' | '__', operand, '__'
+  | '[_', operand, '_]' | '_', operand, '_'
+  | '[@', operand, '@]' | '@', operand, '@'
+  | '[+', operand, '+]' | '+', operand, '+'
+  | '[^', operand, '^]' | '^', operand, '^'
+  | '[-', operand, '-]' | '-', operand, '-'
+  | '[~', operand, '~]' | '~', operand, '~'
+  | '[??', operand, '??]' | '??', operand, '??'
+  ;
+link =
+    '["', operand, '(', <text>, ')":', <url>, ']'
+  | '"', operand, '(', <text>, ')":', <url>
+  | '["', operand, '":', <url>, ']'
+  | '"', operand, '":', <url>;
+image =
+    '[!', <url>, '(', <text>, ')!:', <url>, ']'
+  | '!', <url>, '(', <text>, ')!:', <url>
+  | '[!', <url>, '(', <text>, ')!]'
+  | '!', <url>, '(', <text>, ')!'
+  | '[!', <url>, '!]'
+  | '!', <url>, '!';

data/lib/textile.rb ADDED

@@ -0,0 +1,7 @@
+require 'textile/parser'
+module Textile
+  def self.parse(text)
+    TextileParser.parse(text.dup)
+  end
+end

data/lib/textile/nodes.rb ADDED

@@ -0,0 +1,79 @@
+# frozen_string_literal: true
+require 'cgi'
+class MultiNode
+  def initialize(nodes)
+    @nodes = nodes || []
+  end
+  def build
+    @nodes.map(&:build).join('')
+  end
+end
+class TextNode
+  def initialize(text)
+    @text = text
+  end
+  # Hook for booru monkeypatch
+  def build
+    CGI.escapeHTML(@text).gsub("\n", '<br>')
+  end
+end
+class RawTextNode
+  def initialize(text)
+    @text = text
+  end
+  def build
+    CGI.escapeHTML(@text).gsub("\n", '<br>')
+  end
+end
+class HTMLNode
+  def initialize(tag_name, inner, attributes = {})
+    @tag_name = tag_name
+    @inner = inner
+    @attributes = attributes || {}
+  end
+  def build
+    output = []
+    output << '<'
+    output << @tag_name
+    @attributes.each do |name, value|
+      output << ' '
+      output << name
+      output << '="'
+      output << CGI.escapeHTML(value)
+      output << '"'
+    end
+    output << '>'
+    output << @inner.build
+    output << '</'
+    output << @tag_name
+    output << '>'
+    output.join('')
+  end
+end
+class ImageNode
+  def initialize(src)
+    @src = src
+  end
+  def build
+    output = []
+    output << '<img src="'
+    output << transform_src
+    output << '"/>'
+    output.join('')
+  end
+  # Hook for booru monkeypatch
+  def transform_src
+    CGI.escapeHTML(@src)
+  end
+end

data/lib/textile/parser.rb ADDED

@@ -0,0 +1,199 @@
+# frozen_string_literal: true
+require 'textile/nodes'
+module TextileParser
+  extend self
+  def parse(text)
+    ary = []
+    operand(ary, text) until text.empty?
+    MultiNode.new(ary)
+  end
+  def find_syms(text)
+    # Find possible symbol matches
+    syms = SYM_TO_INDEX.map    { |sym, index| [sym, text.index(index)] }
+                       .reject { |sym, index| index.nil? }
+    # Sort by starting position - closer is better
+    syms = syms.sort_by{ |x| x[1] }
+    # Get associated regexps and find first
+    matchdata = nil
+    match = syms.map    { |sym, index| [sym, SYM_TO_REGEX[sym]] }
+                .detect { |sym, re| matchdata = re.match(text) }
+    # [sym, matchdata]
+    [match[0], matchdata] if match
+  end
+  def operand(ary, text)
+    sym, md = find_syms(text)
+    if sym.nil? || md.nil?
+      # No match, consume entire string.
+      return ary << TextNode.new(text.slice!(0 .. text.length))
+    end
+    # Consume string before match.
+    if md.pre_match.size > 0
+      ary << TextNode.new(text.slice!(0 ... md.pre_match.size))
+    end
+    # Act on match.
+    # FIXME: Separate logic for string consumption:
+    case sym
+    when :raw_bracket
+      balanced = balance_markup(text, md.to_s, '[==', '==]').match(SYM_TO_REGEX[:raw_bracket])[1]
+      ary << RawTextNode.new(balanced)
+    when :bq_author
+      balanced = balance_markup(text, md.to_s, BQ_LEFT, '[/bq]').match(SYM_TO_REGEX[:bq_author])[2]
+      ary << HTMLNode.new(:blockquote, parse(balanced), title: $1)
+    when :bq
+      balanced = balance_markup(text, md.to_s, BQ_LEFT, '[/bq]').match(SYM_TO_REGEX[:bq])[1]
+      ary << HTMLNode.new(:blockquote, parse(balanced))
+    when :spoiler
+      balanced = balance_markup(text, md.to_s, '[spoiler]', '[/spoiler]').match(SYM_TO_REGEX[:spoiler])[1]
+      ary << HTMLNode.new(:span, parse(balanced), class: 'spoiler')
+    else
+      text.slice!(0 .. md.to_s.size)
+    end
+    case sym
+    when :raw
+      ary << RawTextNode.new(md[1])
+    when :link_title_bracket, :link_title
+      ary << HTMLNode.new(:a, parse(md[1]), title: md[2], href: md[3])
+    when :link_bracket, :link
+      ary << HTMLNode.new(:a, parse(md[1]), href: md[2])
+    when :image_link_title_bracket, :image_link_title
+      ary << HTMLNode.new(:a, ImageNode.new(md[1]), title: md[2], href: md[3])
+    when :image_link_bracket, :image_link
+      ary << HTMLNode.new(:a, ImageNode.new(md[1]), href: md[2])
+    when :image_title_bracket, :image_title
+      ary << HTMLNode.new(:span, ImageNode.new(md[1]), title: md[2])
+    when :image_bracket, :image
+      ary << ImageNode.new(md[1])
+    when :dblbold_bracket, :dblbold
+      ary << HTMLNode.new(:b, parse(md[1]))
+    when :bold_bracket, :bold
+      ary << HTMLNode.new(:strong, parse(md[1]))
+    when :dblitalic_bracket, :dblitalic
+      ary << HTMLNode.new(:i, parse(md[1]))
+    when :italic_bracket, :italic
+      ary << HTMLNode.new(:em, parse(md[1]))
+    when :code_bracket, :code
+      ary << HTMLNode.new(:code, parse(md[1]))
+    when :ins_bracket, :ins
+      ary << HTMLNode.new(:ins, parse(md[1]))
+    when :sup_bracket, :sup
+      ary << HTMLNode.new(:sup, parse(md[1]))
+    when :del_bracket, :del
+      ary << HTMLNode.new(:del, parse(md[1]))
+    when :sub_bracket, :sub
+      ary << HTMLNode.new(:sub, parse(md[1]))
+    when :cite_bracket, :cite
+      ary << HTMLNode.new(:cite, parse(md[1]))
+    end
+  end
+  private
+  # Find the longest substring that contains balanced markup,
+  # or the whole string if this is impossible.
+  def balance_markup(text, matched, left, right)
+    both = Regexp.union(left, right)
+    left = Regexp.union(left)
+    right = Regexp.union(right)
+    s = StringScanner.new(matched)
+    n, lowest_pos = 0, 0
+    i = loop do
+      match = s.scan(both)
+      case
+      when match =~ left
+        n += 1
+      when match =~ right
+        n -= 1
+        lowest_pos = s.pos
+      else
+        m = s.scan_until(both)
+        s.pos = s.pos - s.matched.size if m
+        s.terminate if m.nil?
+      end
+      break lowest_pos.pred if n.zero? || s.eos?
+    end
+    text.slice!(0 .. i)
+    matched[0 .. i]
+  end
+  # Properly nesting operator pairs:
+  # [bq][/bq] [bq="author"][/bq]
+  # [spoiler][/spoiler]
+  # [== ==]
+  # Non-nesting operator pairs:
+  # == " ! ** * __ _ @ + ^ - ~ ??
+  # Ruby \s does not match extra unicode space characters.
+  RX_SPACE_CHARS = ' \t\u00a0\u1680\u180E\u2000-\u200A\u202F\u205F\u3000'
+  RX_URL = %r{
+             (?:http:\/\/|https:\/\/|\/\/|\/|\#)                     # protocol
+             (?:[^%#{RX_SPACE_CHARS}"!\n\r]|%[0-9a-fA-F]{2})+        # path
+             [^#{RX_SPACE_CHARS}`~!@$^&"\n\r\*_+\-=\[\]\\|;:,.'?\#)] # invalid
+           }x
+  BQ_LEFT = /\[bq="([^"]*)"\]|\[bq\]/
+  # Symbol table, in operator precedence order:
+  #   0. Symbol name.
+  #   1. Start string for optimized matching.
+  #   2. Complete match definition.
+  SYMS = [
+    [:raw_bracket, '[==',       /\[==(.*)==\]/],
+    [:bq_author,   '[bq="',     /\[bq="([^"]*)"\](.*)\[\/bq\]/],
+    [:bq,          '[bq]',      /\[bq\](.*)\[\/bq\]/],
+    [:spoiler,     '[spoiler]', /\[spoiler\](.*)\[\/spoiler\]/],
+    [:raw,         '==',        /==(.*)==/],
+    [:link_title_bracket, '["', /\A\["([^"]*)\(([^\)]*)\)":(#{RX_URL})\]/],
+    [:link_title,         '"',  /"([^"]*)\(([^\)]*)\)":(#{RX_URL})/],
+    [:link_bracket,       '["', /\["([^"]*)":(#{RX_URL})\]/],
+    [:link,               '"',  /"([^"]*)":(#{RX_URL})/],
+    [:image_link_title_bracket, '[!', /\[!(#{RX_URL})\(([^\)]*)\)!:(#{RX_URL})\]/],
+    [:image_link_title,         '!',  /!(#{RX_URL})\(([^\)]*)\)!:(#{RX_URL})/],
+    [:image_link_bracket,       '[!', /\[!(#{RX_URL})!:(#{RX_URL})\]/],
+    [:image_link,               '!',  /!(#{RX_URL})!:(#{RX_URL})/],
+    [:image_title_bracket,      '[!', /\[!(#{RX_URL})\(([^\)]*)\)!\]/],
+    [:image_title,              '!',  /!(#{RX_URL})\(([^\)]*)\)!/],
+    [:image_bracket,            '[!', /\[!(#{RX_URL})!\]/],
+    [:image,                    '!',  /!(#{RX_URL})!/],
+    [:dblbold_bracket,   '[**', /\[\*\*((?:.|\n.|\n(?=\*\*\]))+?)\*\*\]/],
+    [:dblbold,           '**',  /\*\*((?:.|\n.|\n(?=\*\*))+?)\*\*/],
+    [:bold_bracket,      '[*',  /\[\*((?:.|\n.|\n(?=\*\]))+?)\*\]/],
+    [:bold,              '*',   /\*((?:.|\n.|\n(?=\*\]))+?)\*/],
+    [:dblitalic_bracket, '[__', /\[__((?:.|\n.|\n(?=__\]))+?)__\]/],
+    [:dblitalic,         '__',  /__((?:.|\n.|\n(?=__))+?)__/],
+    [:italic_bracket,    '[_',  /\[_((?:.|\n.|\n(?=_\]))+?)_\]/],
+    [:italic,            '_',   /_((?:.|\n.|\n(?=_))+?)_/],
+    [:code_bracket,      '[@',  /\[@((?:.|\n.|\n(?=@\]))+?)@\]/],
+    [:code,              '@',   /@((?:.|\n.|\n(?=@))+?)@/],
+    [:ins_bracket,       '[+',  /\[\+((?:.|\n.|\n(?=\+\]))+?)\+\]/],
+    [:ins,               '+',   /\+((?:.|\n.|\n(?=\+))+?)\+/],
+    [:sup_bracket,       '[^',  /\[\^((?:.|\n.|\n(?=\^\]))+?)\^\]/],
+    [:sup,               '^',   /\^((?:.|\n.|\n(?=\^))+?)\^/],
+    [:del_bracket,       '[-',  /\[\-((?:.|\n.|\n(?=\-\]))+?)\-\]/],
+    [:del,               '-',   /\-((?:.|\n.|\n(?=\-))+?)\-/],
+    [:sub_bracket,       '[~',  /\[\~((?:.|\n.|\n(?=\~\]))+?)\~\]/],
+    [:sub,               '~',   /\~((?:.|\n.|\n(?=\~))+?)\~/],
+    [:cite_bracket,      '[??', /\[\?\?((?:.|\n.|\n(?=\?\?\]))+?)\?\?\]/],
+    [:cite,              '??',  /\?\?((?:.|\n.|\n(?=\?\?))+?)\?\?/],
+  ]
+  SYM_TO_INDEX = Hash[SYMS.map { |name, index, re| [name, index] }]
+  SYM_TO_REGEX = Hash[SYMS.map { |name, index, re| [name, re]    }]
+end

data/lib/textile/version.rb ADDED

@@ -0,0 +1,3 @@
+module Textile
+  VERSION = '0.4.0'.freeze
+end

data/textile.gemspec ADDED

@@ -0,0 +1,15 @@
+$:.push File.expand_path("../lib", __FILE__)
+require 'textile/version'
+Gem::Specification.new do |s|
+  s.name        = 'textile'
+  s.version     = Textile::VERSION.dup
+  s.license     = "MIT"
+  s.summary     = "Recursive-descent style Textile parser"
+  s.description = "Recursive-descent style Textile parser"
+  s.authors     = ["Liam P. White"]
+  s.email       = 'example@example.com'
+  s.files         = `git ls-files`.split("\n")
+  s.require_paths = ["lib"]
+end

metadata ADDED

@@ -0,0 +1,49 @@
+--- !ruby/object:Gem::Specification
+name: textile
+version: !ruby/object:Gem::Version
+  version: 0.4.0
+platform: ruby
+authors:
+- Liam P. White
+autorequire:
+bindir: bin
+cert_chain: []
+date: 2016-11-14 00:00:00.000000000 Z
+dependencies: []
+description: Recursive-descent style Textile parser
+email: example@example.com
+executables: []
+extensions: []
+extra_rdoc_files: []
+files:
+- README
+- lib/textile.rb
+- lib/textile/nodes.rb
+- lib/textile/parser.rb
+- lib/textile/version.rb
+- textile.gemspec
+homepage:
+licenses:
+- MIT
+metadata: {}
+post_install_message:
+rdoc_options: []
+require_paths:
+- lib
+required_ruby_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+required_rubygems_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+requirements: []
+rubyforge_project:
+rubygems_version: 2.5.1
+signing_key:
+specification_version: 4
+summary: Recursive-descent style Textile parser
+test_files: []