RubyGems - ad_hoc_template - Versions diffs - 0.2.0 → 0.3.0 - Mend

ad_hoc_template 0.2.0 → 0.3.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (16) hide show

checksums.yaml +4 -4
data/README.md +1 -1
data/lib/ad_hoc_template.rb +24 -3
data/lib/ad_hoc_template/command_line_interface.rb +27 -11
data/lib/ad_hoc_template/entry_format_generator.rb +49 -0
data/lib/ad_hoc_template/parser.rb +127 -58
data/lib/ad_hoc_template/pseudohiki_formatter.rb +1 -1
data/lib/ad_hoc_template/record_reader.rb +294 -160
data/lib/ad_hoc_template/version.rb +1 -1
data/spec/ad_hoc_template_spec.rb +151 -5
data/spec/command_line_interface_spec.rb +107 -7
data/spec/entry_format_generator_spec.rb +163 -0
data/spec/parser_spec.rb +114 -18
data/spec/pseudohiki_formatter_spec.rb +2 -2
data/spec/record_reader_spec.rb +253 -9
metadata +6 -3

data/lib/ad_hoc_template/pseudohiki_formatter.rb CHANGED Viewed

@@ -14,7 +14,7 @@ module AdHocTemplate
       end
       def self.choose_parser(hiki_source)
-        hiki_source[/(?:\r?\n|\r)/] ? BlockParser : InlineParser
+        hiki_source[LINE_END_RE] ? BlockParser : InlineParser
       end
       private_class_method :choose_parser

data/lib/ad_hoc_template/record_reader.rb CHANGED Viewed

@@ -11,8 +11,8 @@ module AdHocTemplate
         YAML.load(yaml_data)
       end
-      def self.to_yaml(config_data)
-        data = RecordReader.read_record(config_data)
+      def self.dump(config_data)
+        data = RecordReader.parse_if_necessary(config_data)
         YAML.dump(data)
       end
     end
@@ -22,13 +22,20 @@ module AdHocTemplate
         JSON.parse(json_data)
       end
-      def self.to_json(config_data)
-        data = RecordReader.read_record(config_data)
-        JSON.dump(data)
+      def self.dump(config_data)
+        data = RecordReader.parse_if_necessary(config_data)
+        JSON.pretty_generate(data)
       end
     end
     module CSVReader
+      COL_SEP = {
+        csv: CSV::DEFAULT_OPTIONS[:col_sep],
+        tsv: "\t"
+      }
+      class NotSupportedError < StandardError; end
       def self.read_record(csv_data, config={ csv: nil })
         label, sep  = parse_config(config)
         header, *data = CSV.new(csv_data, col_sep: sep).to_a
@@ -42,6 +49,19 @@ module AdHocTemplate
         end
       end
+      def self.dump(config_data, col_sep=COL_SEP[:csv])
+        data = RecordReader.parse_if_necessary(config_data)
+        raise NotSupportedError unless csv_compatible_format?(data)
+        if kv_pairs = find_sub_records(data)
+          records = hashes_to_arrays(kv_pairs)
+        else
+          records = data.to_a.transpose
+        end
+        array_to_csv(records, col_sep)
+      end
       def self.convert_to_hash(header, row_array)
         {}.tap do |record|
           header.zip(row_array).each do |key, value|
@@ -60,221 +80,335 @@ module AdHocTemplate
         when Hash
           format, label = config.to_a[0]
         end
-        field_sep = format == :tsv ? "\t" : CSV::DEFAULT_OPTIONS[:col_sep]
-        return label, field_sep
+        col_sep = COL_SEP[format||:csv]
+        return label, col_sep
       end
-      private_class_method :convert_to_hash, :parse_config
-    end
-    SEPARATOR = /:\s*/o
-    BLOCK_HEAD = /\A\/\/\/@/o
-    ITERATION_HEAD = /\A\/\/\/@#/o
-    EMPTY_LINE = /\A(?:\r?\n|\r)\Z/o
-    ITERATION_MARK = /\A#/o
-    READERS_RE = {
-      key_value: SEPARATOR,
-      iteration: ITERATION_HEAD,
-      block: BLOCK_HEAD,
-      empty_line: EMPTY_LINE,
-    }
-    class ReaderState
-      attr_accessor :current_block_label
-      def initialize(config={}, stack=[])
-        @stack = stack
-        @configs = [config]
-        setup_reader
+      def self.csv_compatible_format?(data)
+        iteration_blocks_count = data.values.select {|v| v.kind_of? Array }.size
+        iteration_blocks_count == 0 or (iteration_blocks_count == 1 && data.size == 1)
       end
-      def push(reader)
-        @stack.push reader
+      def self.hashes_to_arrays(data)
+        headers = data.max_by {|h| h.keys.size }.keys
+        records = data.map {|record| headers.map {|header| record[header] } }
+        records.unshift headers
       end
-      def pop
-        @stack.pop unless @stack.length == 1
+      def self.find_sub_records(data)
+        data.values.find {|v| v.kind_of? Array }
       end
-      def setup_stack(line)
-        @stack[-1].setup_stack(line)
-      end
+      def self.array_to_csv(records, col_sep)
+        # I do not adopt "records.map {|rec| rec.to_csv }.join",
+        # because I'm not sure if it is sufficient for certain data or not.
+        # For example, a field value may contain carriage returns or line feeds,
+        # and in that case, improper handling of the end of record would be damaging.
-      def current_reader
-        @stack[-1]
+        CSV.generate('', col_sep: col_sep) do |csv|
+          records.each {|record| csv << record }
+        end
       end
-      def read(line)
-        @stack[-1].read(line)
-      end
+      private_class_method :convert_to_hash, :parse_config
+      private_class_method :csv_compatible_format?, :hashes_to_arrays
+      private_class_method :find_sub_records, :array_to_csv
+    end
-      def push_new_record
-        new_record = {}
-        @configs.push new_record
-        new_record
-      end
+    module TSVReader
+      COL_SEP = CSVReader::COL_SEP
-      def pop_current_record
-        @configs.pop
+      def self.read_record(tsv_data, config={ tsv: nil })
+        config = { tsv: config } if config.kind_of? String
+        CSVReader.read_record(tsv_data, config)
       end
-      def current_record
-        @configs[-1]
+      def self.dump(config_data, col_sep=COL_SEP[:tsv])
+        CSVReader.dump(config_data, col_sep)
       end
+    end
-      def parsed_record
-        @configs[0]
-      end
+    module DefaultFormReader
+      SEPARATOR = /:\s*/o
+      BLOCK_HEAD = /\A\/\/\/@/o
+      ITERATION_HEAD = /\A\/\/\/@#/o
+      EMPTY_LINE = /\A#{LINE_END_STR}\Z/o
+      ITERATION_MARK = /\A#/o
+      READERS_RE = {
+        key_value: SEPARATOR,
+        iteration: ITERATION_HEAD,
+        block: BLOCK_HEAD,
+        empty_line: EMPTY_LINE,
+      }
+      class ReaderState
+        attr_accessor :current_block_label
+        def initialize(config={}, stack=[])
+          @stack = stack
+          @configs = [config]
+          setup_reader
+        end
-      def read_record(lines)
-        lines = lines.each_line.to_a if lines.kind_of? String
-        lines.each do |line|
-          setup_stack(line)
-          read(line)
+        def push(reader)
+          @stack.push reader
         end
-        remove_trailing_empty_lines_from_last_block!
-        parsed_record
-      end
-      def last_block_value
-        current_record[current_block_label]
-      end
+        def pop
+          @stack.pop unless @stack.length == 1
+        end
-      def remove_trailing_empty_lines_from_last_block!
-        if current_reader.kind_of? BlockReader
-          last_block_value.sub!(/(#{$/})+\Z/, $/)
+        def setup_stack(line)
+          @stack[-1].setup_stack(line)
+        end
+        def current_reader
+          @stack[-1]
         end
-      end
-      private
+        def read(line)
+          @stack[-1].read(line)
+        end
+        def push_new_record
+          new_record = {}
+          @configs.push new_record
+          new_record
+        end
+        def pop_current_record
+          @configs.pop
+        end
+        def current_record
+          @configs[-1]
+        end
+        def parsed_record
+          @configs[0]
+        end
-      def setup_reader
-        Reader.setup_reader(self)
+        def read_record(lines)
+          lines = lines.each_line.to_a if lines.kind_of? String
+          lines.each do |line|
+            setup_stack(line)
+            read(line)
+          end
+          remove_trailing_empty_lines_from_last_block!
+          parsed_record
+        end
+        def last_block_value
+          current_record[current_block_label]
+        end
+        def remove_trailing_empty_lines_from_last_block!
+          if current_reader.kind_of? BlockReader
+            last_block_value.sub!(/(#{$/})+\Z/, $/)
+          end
+        end
+        private
+        def setup_reader
+          Reader.setup_reader(self)
+        end
       end
-    end
-    class Reader
-      def self.setup_reader(stack)
-        readers = {}
-        {
-          base: BaseReader,
-          key_value: KeyValueReader,
-          block: BlockReader,
-          iteration: IterationReader,
-        }.each do |k, v|
-          readers[k] = v.new(stack, readers)
-        end
-        stack.push readers[:base]
-        readers
+      class Reader
+        def self.setup_reader(stack)
+          readers = {}
+          {
+            base: BaseReader,
+            key_value: KeyValueReader,
+            block: BlockReader,
+            iteration: IterationReader,
+          }.each do |k, v|
+            readers[k] = v.new(stack, readers)
+          end
+          stack.push readers[:base]
+          readers
+        end
+        def initialize(stack, readers)
+          @stack = stack
+          @readers = readers
+        end
+        def pop_stack
+          @stack.pop
+        end
+        def read(line)
+        end
+        private
+        def push_reader_if_match(line, readers)
+          readers.each do |reader|
+            return @stack.push(@readers[reader]) if READERS_RE[reader] === line
+          end
+        end
+        def setup_new_block(line, initial_value)
+          label = line.sub(BLOCK_HEAD, "").chomp
+          @stack.current_record[label] ||= initial_value
+          @stack.current_block_label = label
+        end
       end
-      def initialize(stack, readers)
-        @stack = stack
-        @readers = readers
+      class BaseReader < Reader
+        def setup_stack(line)
+          push_reader_if_match(line, [:iteration, :block, :key_value])
+        end
       end
-      def pop_stack
-        @stack.pop
+      class KeyValueReader < Reader
+        def setup_stack(line)
+          case line
+          when EMPTY_LINE, ITERATION_HEAD, BLOCK_HEAD
+            pop_stack
+          end
+          push_reader_if_match(line, [:iteration, :block])
+        end
+        def read(line)
+          key, value = line.split(SEPARATOR, 2)
+          @stack.current_record[key] = value.chomp
+        end
       end
-      def read(line)
+      class BlockReader < Reader
+        def setup_stack(line)
+          case line
+          when ITERATION_HEAD, BLOCK_HEAD
+            @stack.remove_trailing_empty_lines_from_last_block!
+            pop_stack
+          end
+          push_reader_if_match(line, [:iteration, :block])
+        end
+        def read(line)
+          block_value = @stack.last_block_value
+          case line
+          when BLOCK_HEAD
+            setup_new_block(line, String.new)
+          when EMPTY_LINE
+            block_value << line unless block_value.empty?
+          else
+            block_value << line
+          end
+        end
       end
-      private
+      class IterationReader < Reader
+        def setup_stack(line)
+          case line
+          when ITERATION_HEAD
+            @stack.pop_current_record
+          when BLOCK_HEAD
+            @stack.pop_current_record
+            pop_stack
+            @stack.push @readers[:block]
+          when SEPARATOR
+            @stack.pop_current_record
+            @stack.last_block_value.push @stack.push_new_record
+            @stack.push @readers[:key_value]
+          end
+        end
-      def push_reader_if_match(line, readers)
-        readers.each do |reader|
-          return @stack.push(@readers[reader]) if READERS_RE[reader] === line
+        def read(line)
+          case line
+          when ITERATION_HEAD
+            setup_new_block(line, [])
+            @stack.push_new_record
+          end
         end
       end
-      def setup_new_block(line, initial_value)
-        label = line.sub(BLOCK_HEAD, "").chomp
-        @stack.current_record[label] ||= initial_value
-        @stack.current_block_label = label
+      def self.read_record(input)
+        ReaderState.new.read_record(input)
       end
-    end
+      def self.dump(labels)
+        iteration_keys, kv_keys, block_keys = categorize_keys(labels)
-    class BaseReader < Reader
-      def setup_stack(line)
-        push_reader_if_match(line, [:iteration, :block, :key_value])
+        key_value_part = format_key_value_pairs(kv_keys, labels)
+        iteration_part = format_iteration_block(iteration_keys, labels)
+        block_part = format_key_value_block(block_keys, labels)
+        [key_value_part, iteration_part, block_part].join($/).sub(/(#{$/}+)\Z/, $/)
       end
-    end
-    class KeyValueReader < Reader
-      def setup_stack(line)
-        case line
-        when EMPTY_LINE, ITERATION_HEAD, BLOCK_HEAD
-          pop_stack
-        end
-        push_reader_if_match(line, [:iteration, :block])
+      def self.format_key_value_pairs(key_names, labels={})
+        key_names.map {|key| "#{key}: #{labels[key]}#{$/}" }.join
       end
-      def read(line)
-        key, value = line.split(SEPARATOR, 2)
-        @stack.current_record[key] = value.chomp
+      def self.format_key_value_block(key_names, labels)
+        [].tap do |blocks|
+          key_names.each do |key|
+            blocks.push "///@#{key}#{$/*2}#{labels[key]}"
+          end
+        end.join($/)
       end
-    end
-    class BlockReader < Reader
-      def setup_stack(line)
-        case line
-        when ITERATION_HEAD, BLOCK_HEAD
-          @stack.remove_trailing_empty_lines_from_last_block!
-          pop_stack
-        end
-        push_reader_if_match(line, [:iteration, :block])
+      def self.format_iteration_block(key_names, labels)
+        key_names.map do |iteration_label|
+          iteration_block = ["///@#{iteration_label}#{$/}"]
+          labels[iteration_label].each do |sub_record|
+             iteration_block.push format_key_value_pairs(sub_record.keys, sub_record)
+          end
+          iteration_block.join($/)
+        end.join($/)
       end
-      def read(line)
-        block_value = @stack.last_block_value
-        case line
-        when BLOCK_HEAD
-          setup_new_block(line, String.new)
-        when EMPTY_LINE
-          block_value << line unless block_value.empty?
-        else
-          block_value << line
+      def self.categorize_keys(labels)
+        iteration_part, rest = labels.partition do |e|
+          e[1].kind_of? Array
+        end.map {|e| e.map(&:first) }
+        block_part, key_value_part = rest.partition do |e|
+          LINE_END_RE =~ labels[e]
         end
+        return iteration_part, key_value_part, block_part
       end
+      private_class_method :format_key_value_pairs
+      private_class_method :format_key_value_block
+      private_class_method :format_iteration_block
+      private_class_method :categorize_keys
     end
-    class IterationReader < Reader
-      def setup_stack(line)
-        case line
-        when ITERATION_HEAD
-          @stack.pop_current_record
-        when BLOCK_HEAD
-          @stack.pop_current_record
-          pop_stack
-          @stack.push @readers[:block]
-        when SEPARATOR
-          @stack.pop_current_record
-          @stack.last_block_value.push @stack.push_new_record
-          @stack.push @readers[:key_value]
-        end
-      end
+    FORMAT_NAME_TO_READER = {
+      yaml: YAMLReader,
+      json: JSONReader,
+      csv: CSVReader,
+      tsv: TSVReader,
+      default: DefaultFormReader,
+    }
-      def read(line)
-        case line
-        when ITERATION_HEAD
-          setup_new_block(line, [])
-          @stack.push_new_record
-        end
-      end
+    FORMAT_NAME_TO_READER.default = DefaultFormReader
+    def self.dump(data_source, target_format=:default)
+      FORMAT_NAME_TO_READER[target_format].dump(data_source)
     end
     def self.read_record(input, source_format=:default)
       case source_format
-      when :default
-        ReaderState.new.read_record(input)
-      when :yaml
-        YAMLReader.read_record(input)
-      when :json
-        JSONReader.read_record(input)
       when :csv, :tsv, Hash
         CSVReader.read_record(input, source_format)
+      else
+        FORMAT_NAME_TO_READER[source_format].read_record(input)
+      end
+    end
+    def self.parse_if_necessary(source)
+      if source.kind_of? String
+        RecordReader.read_record(source)
+      else
+        source
       end
     end
   end