RubyGems - herb - Versions diffs - 0.7.4-aarch64-linux-gnu → 0.8.0-aarch64-linux-gnu - Mend

herb 0.7.4-aarch64-linux-gnu → 0.8.0-aarch64-linux-gnu

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (176) hide show

checksums.yaml +4 -4
data/Makefile +8 -5
data/config.yml +40 -20
data/ext/herb/error_helpers.c +57 -3
data/ext/herb/error_helpers.h +1 -1
data/ext/herb/extconf.rb +1 -0
data/ext/herb/extension.c +10 -24
data/ext/herb/extension_helpers.c +12 -18
data/ext/herb/extension_helpers.h +4 -4
data/ext/herb/nodes.c +72 -37
data/herb.gemspec +0 -2
data/lib/herb/3.0/herb.so +0 -0
data/lib/herb/3.1/herb.so +0 -0
data/lib/herb/3.2/herb.so +0 -0
data/lib/herb/3.3/herb.so +0 -0
data/lib/herb/3.4/herb.so +0 -0
data/lib/herb/ast/helpers.rb +11 -0
data/lib/herb/ast/node.rb +15 -6
data/lib/herb/ast/nodes.rb +609 -392
data/lib/herb/cli.rb +31 -0
data/lib/herb/colors.rb +82 -0
data/lib/herb/engine/compiler.rb +140 -14
data/lib/herb/engine/debug_visitor.rb +1 -5
data/lib/herb/engine/parser_error_overlay.rb +1 -1
data/lib/herb/engine.rb +18 -20
data/lib/herb/errors.rb +166 -56
data/lib/herb/location.rb +2 -2
data/lib/herb/project.rb +86 -21
data/lib/herb/token.rb +14 -2
data/lib/herb/version.rb +1 -1
data/lib/herb.rb +1 -0
data/sig/herb/ast/helpers.rbs +3 -0
data/sig/herb/ast/node.rbs +12 -5
data/sig/herb/ast/nodes.rbs +124 -62
data/sig/herb/colors.rbs +35 -0
data/sig/herb/engine/compiler.rbs +23 -1
data/sig/herb/errors.rbs +74 -20
data/sig/herb/token.rbs +8 -0
data/sig/herb_c_extension.rbs +1 -1
data/sig/serialized_ast_errors.rbs +8 -0
data/src/analyze.c +461 -249
data/src/analyze_helpers.c +5 -0
data/src/analyze_missing_end.c +147 -0
data/src/analyze_transform.c +196 -0
data/src/analyzed_ruby.c +23 -2
data/src/ast_node.c +14 -17
data/src/ast_nodes.c +179 -181
data/src/ast_pretty_print.c +232 -232
data/src/element_source.c +7 -6
data/src/errors.c +272 -152
data/src/extract.c +92 -34
data/src/herb.c +37 -49
data/src/html_util.c +34 -96
data/src/include/analyze.h +10 -2
data/src/include/analyze_helpers.h +3 -0
data/src/include/analyzed_ruby.h +4 -2
data/src/include/ast_node.h +4 -4
data/src/include/ast_nodes.h +68 -67
data/src/include/ast_pretty_print.h +2 -2
data/src/include/element_source.h +3 -1
data/src/include/errors.h +42 -26
data/src/include/extract.h +4 -4
data/src/include/herb.h +6 -7
data/src/include/html_util.h +4 -5
data/src/include/lexer.h +1 -3
data/src/include/lexer_peek_helpers.h +21 -19
data/src/include/lexer_struct.h +12 -10
data/src/include/location.h +10 -13
data/src/include/macros.h +4 -0
data/src/include/parser.h +12 -6
data/src/include/parser_helpers.h +26 -16
data/src/include/position.h +3 -14
data/src/include/pretty_print.h +38 -28
data/src/include/prism_helpers.h +1 -1
data/src/include/range.h +4 -13
data/src/include/token.h +5 -11
data/src/include/token_struct.h +2 -2
data/src/include/utf8.h +3 -2
data/src/include/util/hb_arena.h +31 -0
data/src/include/util/hb_arena_debug.h +8 -0
data/src/include/util/hb_array.h +33 -0
data/src/include/util/hb_buffer.h +34 -0
data/src/include/util/hb_string.h +29 -0
data/src/include/util/hb_system.h +9 -0
data/src/include/util.h +3 -14
data/src/include/version.h +1 -1
data/src/include/visitor.h +1 -1
data/src/io.c +7 -4
data/src/lexer.c +62 -88
data/src/lexer_peek_helpers.c +42 -38
data/src/location.c +9 -37
data/src/main.c +19 -23
data/src/parser.c +373 -313
data/src/parser_helpers.c +60 -54
data/src/parser_match_tags.c +316 -0
data/src/pretty_print.c +88 -117
data/src/prism_helpers.c +7 -7
data/src/range.c +2 -35
data/src/token.c +36 -87
data/src/utf8.c +4 -4
data/src/util/hb_arena.c +179 -0
data/src/util/hb_arena_debug.c +237 -0
data/src/{array.c → util/hb_array.c} +26 -27
data/src/util/hb_buffer.c +203 -0
data/src/util/hb_string.c +85 -0
data/src/util/hb_system.c +30 -0
data/src/util.c +29 -99
data/src/visitor.c +54 -54
data/templates/ext/herb/error_helpers.c.erb +3 -3
data/templates/ext/herb/error_helpers.h.erb +1 -1
data/templates/ext/herb/nodes.c.erb +11 -6
data/templates/java/error_helpers.c.erb +75 -0
data/templates/java/error_helpers.h.erb +20 -0
data/templates/java/nodes.c.erb +97 -0
data/templates/java/nodes.h.erb +23 -0
data/templates/java/org/herb/ast/Errors.java.erb +121 -0
data/templates/java/org/herb/ast/NodeVisitor.java.erb +14 -0
data/templates/java/org/herb/ast/Nodes.java.erb +220 -0
data/templates/java/org/herb/ast/Visitor.java.erb +56 -0
data/templates/javascript/packages/core/src/visitor.ts.erb +29 -1
data/templates/javascript/packages/node/extension/error_helpers.cpp.erb +8 -8
data/templates/javascript/packages/node/extension/error_helpers.h.erb +1 -1
data/templates/javascript/packages/node/extension/nodes.cpp.erb +9 -9
data/templates/javascript/packages/node/extension/nodes.h.erb +1 -1
data/templates/lib/herb/ast/nodes.rb.erb +28 -16
data/templates/lib/herb/errors.rb.erb +17 -12
data/templates/rust/src/ast/nodes.rs.erb +220 -0
data/templates/rust/src/errors.rs.erb +216 -0
data/templates/rust/src/nodes.rs.erb +374 -0
data/templates/src/analyze_missing_end.c.erb +36 -0
data/templates/src/analyze_transform.c.erb +24 -0
data/templates/src/ast_nodes.c.erb +14 -16
data/templates/src/ast_pretty_print.c.erb +36 -36
data/templates/src/errors.c.erb +36 -38
data/templates/src/include/ast_nodes.h.erb +11 -10
data/templates/src/include/ast_pretty_print.h.erb +2 -2
data/templates/src/include/errors.h.erb +9 -9
data/templates/src/parser_match_tags.c.erb +38 -0
data/templates/src/visitor.c.erb +4 -4
data/templates/template.rb +22 -3
data/templates/wasm/error_helpers.cpp.erb +9 -9
data/templates/wasm/error_helpers.h.erb +1 -1
data/templates/wasm/nodes.cpp.erb +9 -9
data/templates/wasm/nodes.h.erb +1 -1
data/vendor/prism/Rakefile +4 -1
data/vendor/prism/config.yml +2 -1
data/vendor/prism/include/prism/ast.h +31 -1
data/vendor/prism/include/prism/diagnostic.h +1 -0
data/vendor/prism/include/prism/version.h +3 -3
data/vendor/prism/src/diagnostic.c +3 -1
data/vendor/prism/src/prism.c +130 -71
data/vendor/prism/src/util/pm_string.c +6 -8
data/vendor/prism/templates/include/prism/ast.h.erb +2 -0
data/vendor/prism/templates/java/org/prism/Loader.java.erb +2 -2
data/vendor/prism/templates/javascript/src/deserialize.js.erb +2 -2
data/vendor/prism/templates/lib/prism/serialize.rb.erb +2 -2
data/vendor/prism/templates/sig/prism.rbs.erb +4 -0
data/vendor/prism/templates/src/diagnostic.c.erb +1 -0
metadata +34 -21
data/lib/herb/libherb/array.rb +0 -51
data/lib/herb/libherb/ast_node.rb +0 -50
data/lib/herb/libherb/buffer.rb +0 -56
data/lib/herb/libherb/extract_result.rb +0 -20
data/lib/herb/libherb/lex_result.rb +0 -32
data/lib/herb/libherb/libherb.rb +0 -52
data/lib/herb/libherb/parse_result.rb +0 -20
data/lib/herb/libherb/token.rb +0 -46
data/lib/herb/libherb.rb +0 -35
data/src/buffer.c +0 -232
data/src/include/array.h +0 -33
data/src/include/buffer.h +0 -39
data/src/include/json.h +0 -28
data/src/include/memory.h +0 -12
data/src/json.c +0 -205
data/src/memory.c +0 -53
data/src/position.c +0 -33

data/src/pretty_print.c CHANGED Viewed

@@ -3,146 +3,149 @@
 #include "include/ast_node.h"
 #include "include/ast_nodes.h"
 #include "include/ast_pretty_print.h"
-#include "include/buffer.h"
 #include "include/errors.h"
 #include "include/token_struct.h"
 #include "include/util.h"
+#include "include/util/hb_buffer.h"
+#include "include/util/hb_string.h"
 #include <stdbool.h>
 #include <stdio.h>
 #include <stdlib.h>
-void pretty_print_indent(buffer_T* buffer, const size_t indent) {
+void pretty_print_indent(hb_buffer_T* buffer, const size_t indent) {
   for (size_t i = 0; i < indent; i++) {
-    buffer_append(buffer, "    ");
+    hb_buffer_append(buffer, "    ");
   }
 }
-void pretty_print_newline(const size_t indent, const size_t relative_indent, buffer_T* buffer) {
+void pretty_print_newline(const size_t indent, const size_t relative_indent, hb_buffer_T* buffer) {
   pretty_print_indent(buffer, indent);
   pretty_print_indent(buffer, relative_indent);
-  buffer_append(buffer, "\n");
+  hb_buffer_append(buffer, "\n");
 }
 void pretty_print_label(
-  const char* name,
+  hb_string_T name,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
   pretty_print_indent(buffer, indent);
   pretty_print_indent(buffer, relative_indent);
   if (last_property) {
-    buffer_append(buffer, "└── ");
+    hb_buffer_append(buffer, "└── ");
   } else {
-    buffer_append(buffer, "├── ");
+    hb_buffer_append(buffer, "├── ");
   }
-  buffer_append(buffer, name);
-  buffer_append(buffer, ": ");
+  hb_buffer_append_string(buffer, name);
+  hb_buffer_append(buffer, ": ");
 }
 void pretty_print_quoted_property(
-  const char* name,
-  const char* value,
+  hb_string_T name,
+  hb_string_T value,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
-  char* quoted = quoted_string(value);
+  hb_string_T quoted = quoted_string(value);
   pretty_print_property(name, quoted, indent, relative_indent, last_property, buffer);
-  free(quoted);
+  free(quoted.data);
 }
 void pretty_print_boolean_property(
-  const char* name,
+  hb_string_T name,
   bool value,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
-  pretty_print_property(name, value ? "true" : "false", indent, relative_indent, last_property, buffer);
+  pretty_print_property(name, hb_string(value ? "true" : "false"), indent, relative_indent, last_property, buffer);
 }
 void pretty_print_property(
-  const char* name,
-  const char* value,
+  hb_string_T name,
+  hb_string_T value,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
   pretty_print_label(name, indent, relative_indent, last_property, buffer);
-  buffer_append(buffer, value);
-  buffer_append(buffer, "\n");
+  hb_buffer_append_string(buffer, value);
+  hb_buffer_append(buffer, "\n");
 }
 void pretty_print_size_t_property(
   size_t value,
-  const char* name,
+  hb_string_T name,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
   pretty_print_label(name, indent, relative_indent, last_property, buffer);
-  char* string = size_t_to_string(value);
-  buffer_append(buffer, string);
-  buffer_append(buffer, "\n");
-  free(string);
+  char size_string[21];
+  snprintf(size_string, 21, "%zu", value);
+  hb_buffer_append(buffer, size_string);
+  hb_buffer_append(buffer, "\n");
 }
 void pretty_print_array(
-  const char* name,
-  array_T* array,
+  hb_string_T name,
+  hb_array_T* array,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
   if (array == NULL) {
-    pretty_print_property(name, "∅", indent, relative_indent, last_property, buffer);
+    pretty_print_property(name, hb_string("∅"), indent, relative_indent, last_property, buffer);
     return;
   }
-  if (array_size(array) == 0) {
-    pretty_print_property(name, "[]", indent, relative_indent, last_property, buffer);
+  if (hb_array_size(array) == 0) {
+    pretty_print_property(name, hb_string("[]"), indent, relative_indent, last_property, buffer);
     return;
   }
   pretty_print_label(name, indent, relative_indent, last_property, buffer);
-  buffer_append(buffer, "(");
+  hb_buffer_append(buffer, "(");
   char count[16];
-  sprintf(count, "%zu", array_size(array));
-  buffer_append(buffer, count);
-  buffer_append(buffer, ")\n");
+  sprintf(count, "%zu", hb_array_size(array));
+  hb_buffer_append(buffer, count);
+  hb_buffer_append(buffer, ")\n");
   if (indent < 20) {
-    for (size_t i = 0; i < array_size(array); i++) {
-      AST_NODE_T* child = array_get(array, i);
+    for (size_t i = 0; i < hb_array_size(array); i++) {
+      AST_NODE_T* child = hb_array_get(array, i);
       pretty_print_indent(buffer, indent);
       pretty_print_indent(buffer, relative_indent + 1);
-      if (i == array_size(array) - 1) {
-        buffer_append(buffer, "└── ");
+      if (i == hb_array_size(array) - 1) {
+        hb_buffer_append(buffer, "└── ");
       } else {
-        buffer_append(buffer, "├── ");
+        hb_buffer_append(buffer, "├── ");
       }
       ast_pretty_print_node(child, indent + 1, relative_indent + 1, buffer);
-      if (i != array_size(array) - 1) { pretty_print_newline(indent + 1, relative_indent, buffer); }
+      if (i != hb_array_size(array) - 1) { pretty_print_newline(indent + 1, relative_indent, buffer); }
     }
   }
-  buffer_append(buffer, "\n");
+  hb_buffer_append(buffer, "\n");
 }
 void pretty_print_errors(
@@ -150,97 +153,92 @@ void pretty_print_errors(
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
-  if (node->errors != NULL && array_size(node->errors) > 0) {
+  if (node->errors != NULL && hb_array_size(node->errors) > 0) {
     error_pretty_print_array("errors", node->errors, indent, relative_indent, last_property, buffer);
-    buffer_append(buffer, "\n");
+    hb_buffer_append(buffer, "\n");
   }
 }
-void pretty_print_location(location_T* location, buffer_T* buffer) {
-  buffer_append(buffer, "(location: (");
+void pretty_print_location(location_T location, hb_buffer_T* buffer) {
+  hb_buffer_append(buffer, "(location: (");
   char location_string[128];
   sprintf(
     location_string,
-    "%zu,%zu)-(%zu,%zu",
-    (location->start && location->start->line) ? location->start->line : 0,
-    (location->start && location->start->column) ? location->start->column : 0,
-    (location->end && location->end->line) ? location->end->line : 0,
-    (location->end && location->end->column) ? location->end->column : 0
+    "%u,%u)-(%u,%u",
+    location.start.line,
+    location.start.column,
+    location.end.line,
+    location.end.column
   );
-  buffer_append(buffer, location_string);
-  buffer_append(buffer, "))");
+  hb_buffer_append(buffer, location_string);
+  hb_buffer_append(buffer, "))");
 }
 void pretty_print_position_property(
   position_T* position,
-  const char* name,
+  hb_string_T name,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
   pretty_print_label(name, indent, relative_indent, last_property, buffer);
   if (position != NULL) {
-    buffer_append(buffer, "(");
+    hb_buffer_append(buffer, "(");
     char position_string[128];
-    sprintf(
-      position_string,
-      "%zu:%zu",
-      (position->line) ? position->line : 0,
-      (position->column) ? position->column : 0
-    );
+    sprintf(position_string, "%u:%u", (position->line) ? position->line : 0, (position->column) ? position->column : 0);
-    buffer_append(buffer, position_string);
-    buffer_append(buffer, ")");
+    hb_buffer_append(buffer, position_string);
+    hb_buffer_append(buffer, ")");
   } else {
-    buffer_append(buffer, "∅");
+    hb_buffer_append(buffer, "∅");
   }
-  buffer_append(buffer, "\n");
+  hb_buffer_append(buffer, "\n");
 }
 void pretty_print_token_property(
   token_T* token,
-  const char* name,
+  hb_string_T name,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
   pretty_print_label(name, indent, relative_indent, last_property, buffer);
   if (token != NULL && token->value != NULL) {
-    char* quoted = quoted_string(token->value);
-    buffer_append(buffer, quoted);
-    free(quoted);
+    hb_string_T quoted = quoted_string(hb_string(token->value));
+    hb_buffer_append_string(buffer, quoted);
+    free(quoted.data);
-    buffer_append(buffer, " ");
+    hb_buffer_append(buffer, " ");
     pretty_print_location(token->location, buffer);
   } else {
-    buffer_append(buffer, "∅");
+    hb_buffer_append(buffer, "∅");
   }
-  buffer_append(buffer, "\n");
+  hb_buffer_append(buffer, "\n");
 }
 void pretty_print_string_property(
-  const char* string,
-  const char* name,
+  hb_string_T string,
+  hb_string_T name,
   const size_t indent,
   const size_t relative_indent,
   const bool last_property,
-  buffer_T* buffer
+  hb_buffer_T* buffer
 ) {
-  const char* value = "∅";
-  char* escaped = NULL;
-  char* quoted = NULL;
+  hb_string_T value = hb_string("∅");
+  hb_string_T escaped = { .data = NULL, .length = 0 };
+  hb_string_T quoted;
-  if (string != NULL) {
+  if (!hb_string_is_empty(string)) {
     escaped = escape_newlines(string);
     quoted = quoted_string(escaped);
     value = quoted;
@@ -248,35 +246,8 @@ void pretty_print_string_property(
   pretty_print_property(name, value, indent, relative_indent, last_property, buffer);
-  if (string != NULL) {
-    if (escaped != NULL) { free(escaped); }
-    if (quoted != NULL) { free(quoted); }
+  if (!hb_string_is_empty(string)) {
+    if (!hb_string_is_empty(escaped)) { free(escaped.data); }
+    if (!hb_string_is_empty(quoted)) { free(quoted.data); }
   }
 }
-void pretty_print_analyzed_ruby(analyzed_ruby_T* analyzed, const char* source) {
-  printf(
-    "------------------------\nanalyzed (%p)\n------------------------\n%s\n------------------------\n  if:     %i\n "
-    " elsif:  %i\n  else:   %i\n  end:    %i\n  block:  %i\n  block_closing: %i\n  case:   %i\n  when:   %i\n  for:    "
-    "%i\n  while:  %i\n "
-    " until:  %i\n  begin:  %i\n  "
-    "rescue: %i\n  ensure: %i\n  unless: %i\n==================\n\n",
-    (void*) analyzed,
-    source,
-    analyzed->has_if_node,
-    analyzed->has_elsif_node,
-    analyzed->has_else_node,
-    analyzed->has_end,
-    analyzed->has_block_node,
-    analyzed->has_block_closing,
-    analyzed->has_case_node,
-    analyzed->has_when_node,
-    analyzed->has_for_node,
-    analyzed->has_while_node,
-    analyzed->has_until_node,
-    analyzed->has_begin_node,
-    analyzed->has_rescue_node,
-    analyzed->has_ensure_node,
-    analyzed->has_unless_node
-  );
-}

data/src/prism_helpers.c CHANGED Viewed

@@ -16,15 +16,15 @@ const char* pm_error_level_to_string(pm_error_level_t level) {
   }
 }
-position_T* position_from_source_with_offset(const char* source, size_t offset) {
-  position_T* position = position_init(1, 0);
+position_T position_from_source_with_offset(const char* source, size_t offset) {
+  position_T position = { .line = 1, .column = 0 };
   for (size_t i = 0; i < offset; i++) {
     if (is_newline(source[i])) {
-      position->line++;
-      position->column = 0;
+      position.line++;
+      position.column = 0;
     } else {
-      position->column++;
+      position.column++;
     }
   }
@@ -40,8 +40,8 @@ RUBY_PARSE_ERROR_T* ruby_parse_error_from_prism_error(
   size_t start_offset = (size_t) (error->location.start - parser->start);
   size_t end_offset = (size_t) (error->location.end - parser->start);
-  position_T* start = position_from_source_with_offset(source, start_offset);
-  position_T* end = position_from_source_with_offset(source, end_offset);
+  position_T start = position_from_source_with_offset(source, start_offset);
+  position_T end = position_from_source_with_offset(source, end_offset);
   return ruby_parse_error_init(
     error->message,

data/src/range.c CHANGED Viewed

@@ -1,38 +1,5 @@
 #include "include/range.h"
-size_t range_sizeof(void) {
-  return sizeof(range_T);
-}
-range_T* range_init(const size_t from, const size_t to) {
-  range_T* range = calloc(1, range_sizeof());
-  range->from = from;
-  range->to = to;
-  return range;
-}
-size_t range_from(const range_T* range) {
-  return range->from;
-}
-size_t range_to(const range_T* range) {
-  return range->to;
-}
-size_t range_length(range_T* range) {
-  return range_to(range) - range_from(range);
-}
-range_T* range_copy(range_T* range) {
-  if (!range) { return NULL; }
-  return range_init(range_from(range), range_to(range));
-}
-void range_free(range_T* range) {
-  if (range == NULL) { return; }
-  free(range);
+uint32_t range_length(range_T range) {
+  return range.to - range.from;
 }

data/src/token.c CHANGED Viewed

@@ -1,37 +1,35 @@
 #include "include/token.h"
-#include "include/json.h"
 #include "include/lexer.h"
 #include "include/position.h"
+#include "include/range.h"
 #include "include/token_struct.h"
 #include "include/util.h"
+#include <stdbool.h>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
-size_t token_sizeof(void) {
-  return sizeof(struct TOKEN_STRUCT);
-}
-token_T* token_init(const char* value, const token_type_T type, lexer_T* lexer) {
-  token_T* token = calloc(1, token_sizeof());
+token_T* token_init(hb_string_T value, const token_type_T type, lexer_T* lexer) {
+  token_T* token = calloc(1, sizeof(token_T));
   if (type == TOKEN_NEWLINE) {
     lexer->current_line++;
     lexer->current_column = 0;
   }
-  if (value) {
-    token->value = herb_strdup(value);
-  } else {
-    token->value = NULL;
-  }
+  token->value = hb_string_to_c_string_using_malloc(value);
   token->type = type;
-  token->range = range_init(lexer->previous_position, lexer->current_position);
-  token->location =
-    location_from(lexer->previous_line, lexer->previous_column, lexer->current_line, lexer->current_column);
+  token->range = (range_T) { .from = lexer->previous_position, .to = lexer->current_position };
+  location_from(
+    &token->location,
+    lexer->previous_line,
+    lexer->previous_column,
+    lexer->current_line,
+    lexer->current_column
+  );
   lexer->previous_line = lexer->current_line;
   lexer->previous_column = lexer->current_column;
@@ -82,93 +80,42 @@ const char* token_type_to_string(const token_type_T type) {
   return "Unknown token_type_T";
 }
-char* token_to_string(const token_T* token) {
+hb_string_T token_to_string(const token_T* token) {
   const char* type_string = token_type_to_string(token->type);
-  const char* template = "#<Herb::Token type=\"%s\" value=\"%s\" range=[%d, %d] start=(%d:%d) end=(%d:%d)>";
+  const char* template = "#<Herb::Token type=\"%s\" value=\"%.*s\" range=[%u, %u] start=(%u:%u) end=(%u:%u)>";
   char* string = calloc(strlen(type_string) + strlen(template) + strlen(token->value) + 16, sizeof(char));
-  char* escaped;
+  hb_string_T escaped;
   if (token->type == TOKEN_EOF) {
-    escaped = herb_strdup("<EOF>");
+    escaped = hb_string(herb_strdup("<EOF>"));
   } else {
-    escaped = escape_newlines(token->value);
+    escaped = escape_newlines(hb_string(token->value));
   }
   sprintf(
     string,
     template,
     type_string,
-    escaped,
-    token->range->from,
-    token->range->to,
-    token->location->start->line,
-    token->location->start->column,
-    token->location->end->line,
-    token->location->end->column
+    escaped.length,
+    escaped.data,
+    token->range.from,
+    token->range.to,
+    token->location.start.line,
+    token->location.start.column,
+    token->location.end.line,
+    token->location.end.column
   );
-  free(escaped);
-  return string;
-}
-char* token_to_json(const token_T* token) {
-  buffer_T json = buffer_new();
-  json_start_root_object(&json);
-  json_add_string(&json, "type", token_type_to_string(token->type));
-  json_add_string(&json, "value", token->value);
-  buffer_T range = buffer_new();
-  json_start_array(&json, "range");
-  json_add_size_t(&range, NULL, token->range->from);
-  json_add_size_t(&range, NULL, token->range->to);
-  buffer_concat(&json, &range);
-  buffer_free(&range);
-  json_end_array(&json);
-  buffer_T start = buffer_new();
-  json_start_object(&json, "start");
-  json_add_size_t(&start, "line", token->location->start->line);
-  json_add_size_t(&start, "column", token->location->start->column);
-  buffer_concat(&json, &start);
-  buffer_free(&start);
-  json_end_object(&json);
-  buffer_T end = buffer_new();
-  json_start_object(&json, "end");
-  json_add_size_t(&end, "line", token->location->end->line);
-  json_add_size_t(&end, "column", token->location->end->column);
-  buffer_concat(&json, &end);
-  buffer_free(&end);
-  json_end_object(&json);
-  json_end_object(&json);
-  return buffer_value(&json);
-}
-char* token_value(const token_T* token) {
-  return token->value;
-}
-int token_type(const token_T* token) {
-  return token->type;
-}
+  free(escaped.data);
-position_T* token_start_position(token_T* token) {
-  return token->location->start;
-}
-position_T* token_end_position(token_T* token) {
-  return token->location->end;
+  return hb_string(string);
 }
 token_T* token_copy(token_T* token) {
   if (!token) { return NULL; }
-  token_T* new_token = calloc(1, token_sizeof());
+  token_T* new_token = calloc(1, sizeof(token_T));
   if (!new_token) { return NULL; }
@@ -184,18 +131,20 @@ token_T* token_copy(token_T* token) {
   }
   new_token->type = token->type;
-  new_token->range = range_copy(token->range);
-  new_token->location = location_copy(token->location);
+  new_token->range = token->range;
+  new_token->location = token->location;
   return new_token;
 }
+bool token_value_empty(const token_T* token) {
+  return token == NULL || token->value == NULL || token->value[0] == '\0';
+}
 void token_free(token_T* token) {
   if (!token) { return; }
   if (token->value != NULL) { free(token->value); }
-  if (token->range != NULL) { range_free(token->range); }
-  if (token->location != NULL) { location_free(token->location); }
   free(token);
 }

data/src/utf8.c CHANGED Viewed

@@ -5,7 +5,7 @@
 //   110xxxxx = 2 bytes
 //   1110xxxx = 3 bytes
 //   11110xxx = 4 bytes
-int utf8_char_byte_length(unsigned char first_byte) {
+uint32_t utf8_char_byte_length(unsigned char first_byte) {
   if ((first_byte & 0x80) == 0) {
     return 1;
   } else if ((first_byte & 0xE0) == 0xC0) {
@@ -24,18 +24,18 @@ bool utf8_is_valid_continuation_byte(unsigned char byte) {
   return (byte & 0xC0) == 0x80;
 }
-int utf8_sequence_length(const char* str, size_t position, size_t max_length) {
+uint32_t utf8_sequence_length(const char* str, size_t position, size_t max_length) {
   if (position >= max_length) { return 0; }
   unsigned char first_byte = (unsigned char) str[position];
-  int expected_length = utf8_char_byte_length(first_byte);
+  uint32_t expected_length = utf8_char_byte_length(first_byte);
   if (position + expected_length > max_length) {
     return 1; // Not enough bytes, treat as single byte
   }
   if (expected_length > 1) {
-    for (int i = 1; i < expected_length; i++) {
+    for (uint32_t i = 1; i < expected_length; i++) {
       if (!utf8_is_valid_continuation_byte((unsigned char) str[position + i])) {
         return 1; // Invalid continuation byte, treat first byte as single byte
       }