PyPI - omlish - Versions diffs - 0.0.0.dev437__py3-none-any.whl → 0.0.0.dev438__py3-none-any.whl - Mend

omlish 0.0.0.dev437py3-none-any.whl → 0.0.0.dev438py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (89) hide show

omlish/__about__.py +2 -2
omlish/formats/json/stream/__init__.py +3 -1
omlish/formats/json/stream/lexing.py +187 -42
omlish/formats/json/stream/parsing.py +27 -5
omlish/formats/json/stream/utils.py +106 -33
omlish/formats/json5/literals.py +7 -4
omlish/formats/json5/parsing.py +33 -79
omlish/formats/json5/stream.py +45 -50
omlish/http/all.py +59 -53
{omlish-0.0.0.dev437.dist-info → omlish-0.0.0.dev438.dist-info}/METADATA +1 -1
{omlish-0.0.0.dev437.dist-info → omlish-0.0.0.dev438.dist-info}/RECORD +15 -89
omlish/formats/json5/Json5.g4 +0 -168
omlish/formats/json5/_antlr/Json5Lexer.py +0 -354
omlish/formats/json5/_antlr/Json5Listener.py +0 -79
omlish/formats/json5/_antlr/Json5Parser.py +0 -617
omlish/formats/json5/_antlr/Json5Visitor.py +0 -52
omlish/formats/json5/_antlr/__init__.py +0 -0
omlish/text/antlr/__init__.py +0 -3
omlish/text/antlr/_runtime/BufferedTokenStream.py +0 -305
omlish/text/antlr/_runtime/CommonTokenFactory.py +0 -64
omlish/text/antlr/_runtime/CommonTokenStream.py +0 -90
omlish/text/antlr/_runtime/FileStream.py +0 -30
omlish/text/antlr/_runtime/InputStream.py +0 -90
omlish/text/antlr/_runtime/IntervalSet.py +0 -183
omlish/text/antlr/_runtime/LICENSE.txt +0 -28
omlish/text/antlr/_runtime/LL1Analyzer.py +0 -176
omlish/text/antlr/_runtime/Lexer.py +0 -332
omlish/text/antlr/_runtime/ListTokenSource.py +0 -147
omlish/text/antlr/_runtime/Parser.py +0 -583
omlish/text/antlr/_runtime/ParserInterpreter.py +0 -173
omlish/text/antlr/_runtime/ParserRuleContext.py +0 -189
omlish/text/antlr/_runtime/PredictionContext.py +0 -632
omlish/text/antlr/_runtime/Recognizer.py +0 -150
omlish/text/antlr/_runtime/RuleContext.py +0 -230
omlish/text/antlr/_runtime/StdinStream.py +0 -14
omlish/text/antlr/_runtime/Token.py +0 -158
omlish/text/antlr/_runtime/TokenStreamRewriter.py +0 -258
omlish/text/antlr/_runtime/Utils.py +0 -36
omlish/text/antlr/_runtime/__init__.py +0 -2
omlish/text/antlr/_runtime/_all.py +0 -24
omlish/text/antlr/_runtime/_pygrun.py +0 -174
omlish/text/antlr/_runtime/atn/ATN.py +0 -135
omlish/text/antlr/_runtime/atn/ATNConfig.py +0 -162
omlish/text/antlr/_runtime/atn/ATNConfigSet.py +0 -215
omlish/text/antlr/_runtime/atn/ATNDeserializationOptions.py +0 -27
omlish/text/antlr/_runtime/atn/ATNDeserializer.py +0 -449
omlish/text/antlr/_runtime/atn/ATNSimulator.py +0 -50
omlish/text/antlr/_runtime/atn/ATNState.py +0 -267
omlish/text/antlr/_runtime/atn/ATNType.py +0 -20
omlish/text/antlr/_runtime/atn/LexerATNSimulator.py +0 -573
omlish/text/antlr/_runtime/atn/LexerAction.py +0 -301
omlish/text/antlr/_runtime/atn/LexerActionExecutor.py +0 -146
omlish/text/antlr/_runtime/atn/ParserATNSimulator.py +0 -1664
omlish/text/antlr/_runtime/atn/PredictionMode.py +0 -502
omlish/text/antlr/_runtime/atn/SemanticContext.py +0 -333
omlish/text/antlr/_runtime/atn/Transition.py +0 -271
omlish/text/antlr/_runtime/atn/__init__.py +0 -4
omlish/text/antlr/_runtime/dfa/DFA.py +0 -136
omlish/text/antlr/_runtime/dfa/DFASerializer.py +0 -76
omlish/text/antlr/_runtime/dfa/DFAState.py +0 -129
omlish/text/antlr/_runtime/dfa/__init__.py +0 -4
omlish/text/antlr/_runtime/error/DiagnosticErrorListener.py +0 -111
omlish/text/antlr/_runtime/error/ErrorListener.py +0 -75
omlish/text/antlr/_runtime/error/ErrorStrategy.py +0 -712
omlish/text/antlr/_runtime/error/Errors.py +0 -176
omlish/text/antlr/_runtime/error/__init__.py +0 -4
omlish/text/antlr/_runtime/tree/Chunk.py +0 -33
omlish/text/antlr/_runtime/tree/ParseTreeMatch.py +0 -121
omlish/text/antlr/_runtime/tree/ParseTreePattern.py +0 -75
omlish/text/antlr/_runtime/tree/ParseTreePatternMatcher.py +0 -377
omlish/text/antlr/_runtime/tree/RuleTagToken.py +0 -53
omlish/text/antlr/_runtime/tree/TokenTagToken.py +0 -50
omlish/text/antlr/_runtime/tree/Tree.py +0 -194
omlish/text/antlr/_runtime/tree/Trees.py +0 -114
omlish/text/antlr/_runtime/tree/__init__.py +0 -2
omlish/text/antlr/_runtime/xpath/XPath.py +0 -278
omlish/text/antlr/_runtime/xpath/XPathLexer.py +0 -98
omlish/text/antlr/_runtime/xpath/__init__.py +0 -4
omlish/text/antlr/delimit.py +0 -109
omlish/text/antlr/dot.py +0 -41
omlish/text/antlr/errors.py +0 -14
omlish/text/antlr/input.py +0 -96
omlish/text/antlr/parsing.py +0 -54
omlish/text/antlr/runtime.py +0 -102
omlish/text/antlr/utils.py +0 -38
{omlish-0.0.0.dev437.dist-info → omlish-0.0.0.dev438.dist-info}/WHEEL +0 -0
{omlish-0.0.0.dev437.dist-info → omlish-0.0.0.dev438.dist-info}/entry_points.txt +0 -0
{omlish-0.0.0.dev437.dist-info → omlish-0.0.0.dev438.dist-info}/licenses/LICENSE +0 -0
{omlish-0.0.0.dev437.dist-info → omlish-0.0.0.dev438.dist-info}/top_level.txt +0 -0

omlish/__about__.py CHANGED Viewed

@@ -1,5 +1,5 @@
-__version__ = '0.0.0.dev437'
-__revision__ = '6e7eba22d4b3eb0dc36e24d1612b485ffa1e3c00'
+__version__ = '0.0.0.dev438'
+__revision__ = '5451232ca0015e84e38bd53d3c368a9d659ea8ec'
 #

omlish/formats/json/stream/__init__.py CHANGED Viewed

@@ -8,6 +8,7 @@ from .errors import (  # noqa
 from .lexing import (  # noqa
+    IdentTokenKind,
     ValueTokenKind,
     VALUE_TOKEN_KINDS,
     ControlTokenKind,
@@ -22,7 +23,7 @@ from .lexing import (  # noqa
     Token,
     CONTROL_TOKENS,
-    CONST_TOKENS,
+    CONST_IDENT_VALUES,
     JsonStreamLexError,
     JsonStreamLexer,
@@ -54,4 +55,5 @@ from .utils import (  # noqa
     stream_parse_values,
     stream_parse_one_value,
+    stream_parse_exactly_one_value,
 )

omlish/formats/json/stream/lexing.py CHANGED Viewed

@@ -13,20 +13,23 @@ import re
 import typing as ta
 from .... import check
+from .... import lang
 from ....funcs.genmachine import GenMachine
 from .errors import JsonStreamError
+with lang.auto_proxy_import(globals()):
+    import unicodedata
 ##
+IdentTokenKind: ta.TypeAlias = ta.Literal['IDENT']
 ValueTokenKind: ta.TypeAlias = ta.Literal[
     'STRING',
     'NUMBER',
-    'SPECIAL_NUMBER',
-    'BOOLEAN',
-    'NULL',
 ]
 VALUE_TOKEN_KINDS = frozenset(check.isinstance(a, str) for a in ta.get_args(ValueTokenKind))
@@ -45,6 +48,7 @@ SpaceTokenKind: ta.TypeAlias = ta.Literal['SPACE']
 CommentTokenKind: ta.TypeAlias = ta.Literal['COMMENT']
 TokenKind: ta.TypeAlias = ta.Union[  # noqa
+    IdentTokenKind,
     ValueTokenKind,
     ControlTokenKind,
     SpaceTokenKind,
@@ -93,16 +97,19 @@ CONTROL_TOKENS: ta.Mapping[str, TokenKind] = {
     ':': 'COLON',
 }
-CONST_TOKENS: ta.Mapping[str, tuple[TokenKind, str | float | None]] = {
-    'NaN': ('SPECIAL_NUMBER', float('nan')),
-    'Infinity': ('SPECIAL_NUMBER', float('inf')),
-    '-Infinity': ('SPECIAL_NUMBER', float('-inf')),
+CONST_IDENT_VALUES: ta.Mapping[str, str | float | None] = {
+    'NaN': float('nan'),
+    '-NaN': float('-nan'),  # distinguished in parsing even if indistinguishable in value
+    'Infinity': float('inf'),
+    '-Infinity': float('-inf'),
-    'true': ('BOOLEAN', True),
-    'false': ('BOOLEAN', False),
-    'null': ('NULL', None),
+    'true': True,
+    'false': False,
+    'null': None,
 }
+MAX_CONST_IDENT_LEN = max(map(len, CONST_IDENT_VALUES))
 ##
@@ -119,21 +126,39 @@ class JsonStreamLexer(GenMachine[str, Token]):
             self,
             *,
             include_raw: bool = False,
+            allow_extended_space: bool = False,
             include_space: bool = False,
             allow_comments: bool = False,
             include_comments: bool = False,
             allow_single_quotes: bool = False,
             string_literal_parser: ta.Callable[[str], str] | None = None,
+            allow_extended_number_literals: bool = False,
+            number_literal_parser: ta.Callable[[str], ta.Any] | None = None,
+            allow_extended_idents: bool = False,
     ) -> None:
         self._include_raw = include_raw
+        self._allow_extended_space = allow_extended_space
         self._include_space = include_space
         self._allow_comments = allow_comments
         self._include_comments = include_comments
         self._allow_single_quotes = allow_single_quotes
         if string_literal_parser is None:
-            string_literal_parser = json.loads
+            string_literal_parser = json.loads  # noqa
         self._string_literal_parser = string_literal_parser
+        self._allow_extended_number_literals = allow_extended_number_literals
+        self._number_literal_parser = number_literal_parser
+        self._allow_extended_idents = allow_extended_idents
         self._ofs = 0
         self._line = 1
         self._col = 0
@@ -199,7 +224,33 @@ class JsonStreamLexer(GenMachine[str, Token]):
             if not c:
                 return None
-            if c.isspace():
+            if c.isspace() or (self._allow_extended_space and c in (
+                    '\u0009'
+                    '\u000A'
+                    '\u000B'
+                    '\u000C'
+                    '\u000D'
+                    '\u0020'
+                    '\u00A0'
+                    '\u2028'
+                    '\u2029'
+                    '\uFEFF'
+                    '\u1680'
+                    '\u2000'
+                    '\u2001'
+                    '\u2002'
+                    '\u2003'
+                    '\u2004'
+                    '\u2005'
+                    '\u2006'
+                    '\u2007'
+                    '\u2008'
+                    '\u2009'
+                    '\u200A'
+                    '\u202F'
+                    '\u205F'
+                    '\u3000'
+            )):
                 if self._include_space:
                     yield self._make_tok('SPACE', c, c, self.pos)
                 continue
@@ -211,16 +262,18 @@ class JsonStreamLexer(GenMachine[str, Token]):
             if c == '"' or (self._allow_single_quotes and c == "'"):
                 return self._do_string(c)
-            if c.isdigit() or c == '-':
+            if c.isdigit() or c == '-' or (self._allow_extended_number_literals and c in '.+'):
                 return self._do_number(c)
+            if self._allow_comments and c == '/':
+                return self._do_comment()
+            if self._allow_extended_idents:
+                return self._do_extended_ident(c)
             if c in 'tfnIN':
                 return self._do_const(c)
-            if self._allow_comments and c == '/':
-                yield from self._do_comment()
-                continue
             self._raise(f'Unexpected character: {c}')
     def _do_string(self, q: str):
@@ -269,7 +322,7 @@ class JsonStreamLexer(GenMachine[str, Token]):
             if not c:
                 break
-            if not (c.isdigit() or c in '.eE+-'):
+            if not (c.isdigit() or c in '.eE+-' or (self._allow_extended_number_literals and c in 'xXabcdefABCDEF')):
                 break
             self._buf.write(c)
@@ -277,33 +330,58 @@ class JsonStreamLexer(GenMachine[str, Token]):
         #
-        if not NUMBER_PAT.fullmatch(raw):
-            # Can only be -Infinity
+        if self._allow_extended_number_literals:
+            p = 1 if raw[0] in '+-' else 0
+            if (len(raw) - p) > 1 and raw[p] == '0' and raw[p + 1].isdigit():
+                self._raise('Invalid number literal')
-            if not c:
-                self._raise('Unexpected end of input')
+        if raw == '-' or (self._allow_extended_number_literals and raw == '+'):
+            for svs in [
+                'Infinity',
+                *(['NaN'] if self._allow_extended_number_literals else []),
+            ]:
+                if c != svs[0]:
+                    continue
-            raw += c
-            try:
-                for _ in range(7):
-                    raw += self._char_in((yield None))  # noqa
-            except GeneratorExit:
-                self._raise('Unexpected end of input')
+                if not c:
+                    self._raise('Unexpected end of input')
-            if raw != '-Infinity':
-                self._raise(f'Invalid number format: {raw}')
+                raw += c
+                try:
+                    for _ in range(len(svs) - 1):
+                        c = self._char_in((yield None))  # noqa
+                        if not c:
+                            break
+                        raw += c
+                except GeneratorExit:
+                    self._raise('Unexpected end of input')
+                if raw[1:] != svs:
+                    self._raise(f'Invalid number format: {raw}')
-            tk, tv = CONST_TOKENS[raw]
-            yield self._make_tok(tk, tv, raw, pos)
+                if raw[0] == '+':
+                    raw = raw[1:]
-            return self._do_main()
+                yield self._make_tok('IDENT', raw, raw, pos)
+                return self._do_main()
         #
-        if '.' in raw or 'e' in raw or 'E' in raw:
-            nv = float(raw)
+        nv: ta.Any
+        if (np := self._number_literal_parser) is not None:
+            nv = np(raw)
         else:
-            nv = int(raw)
+            if not NUMBER_PAT.fullmatch(raw):
+                self._raise(f'Invalid number format: {raw}')
+            if '.' in raw or 'e' in raw or 'E' in raw:
+                nv = float(raw)
+            else:
+                nv = int(raw)
         yield self._make_tok('NUMBER', nv, raw, pos)
         #
@@ -322,17 +400,79 @@ class JsonStreamLexer(GenMachine[str, Token]):
             except GeneratorExit:
                 self._raise('Unexpected end of input')
-            if raw in CONST_TOKENS:
+            if raw in CONST_IDENT_VALUES:
                 break
-            if len(raw) > 8:  # None of the keywords are longer than 8 characters
+            if len(raw) > MAX_CONST_IDENT_LEN:
                 self._raise(f'Invalid literal: {raw}')
-        tk, tv = CONST_TOKENS[raw]
-        yield self._make_tok(tk, tv, raw, pos)
+        yield self._make_tok('IDENT', raw, raw, pos)
         return self._do_main()
+    def _do_unicode_escape(self):
+        try:
+            c = self._char_in((yield None))  # noqa
+        except GeneratorExit:
+            self._raise('Unexpected end of input')
+        if c != 'u':
+            self._raise('Illegal identifier escape')
+        ux = []
+        for _ in range(4):
+            try:
+                c = self._char_in((yield None))  # noqa
+            except GeneratorExit:
+                self._raise('Unexpected end of input')
+            if c not in '0123456789abcdefABCDEF':
+                self._raise('Illegal identifier escape')
+            ux.append(c)
+        return chr(int(''.join(ux), 16))
+    def _do_extended_ident(self, c: str):
+        check.state(self._buf.tell() == 0)
+        if c == '\\':
+            c = yield from self._do_unicode_escape()
+        elif not (c in '$_' or unicodedata.category(c).startswith('L')):
+            self._raise('Illegal identifier start')
+        self._buf.write(c)
+        pos = self.pos
+        while True:
+            try:
+                c = self._char_in((yield None))  # noqa
+            except GeneratorExit:
+                self._raise('Unexpected end of input')
+            if c == '\\':
+                c = yield from self._do_unicode_escape()
+                self._buf.write(c)
+                continue
+            if not c:
+                break
+            if c not in '$_\u200C\u200D':
+                uc = unicodedata.category(c)
+                if not (uc.startswith(('L', 'M', 'N')) or uc == 'Pc'):
+                    break
+            self._buf.write(c)
+        raw = self._flip_buf()
+        yield self._make_tok('IDENT', raw, raw, pos)
+        return self._do_main(c)
     def _do_comment(self):
         check.state(self._buf.tell() == 0)
@@ -349,7 +489,7 @@ class JsonStreamLexer(GenMachine[str, Token]):
                 except GeneratorExit:
                     self._raise('Unexpected end of input')
-                if ic == '\n':
+                if not ic or ic == '\n':
                     break
                 if self._include_comments:
@@ -360,6 +500,9 @@ class JsonStreamLexer(GenMachine[str, Token]):
                 raw = f'//{cmt}\n' if self._include_raw else None
                 yield self._make_tok('COMMENT', cmt, raw, pos)
+            if not ic:
+                return
         elif oc == '*':
             lc: str | None = None
             while True:
@@ -382,3 +525,5 @@ class JsonStreamLexer(GenMachine[str, Token]):
         else:
             self._raise(f'Unexpected character after comment start: {oc}')
+        return self._do_main()

omlish/formats/json/stream/parsing.py CHANGED Viewed

@@ -4,6 +4,7 @@ import typing as ta
 from .... import lang
 from ....funcs.genmachine import GenMachine
 from .errors import JsonStreamError
+from .lexing import CONST_IDENT_VALUES
 from .lexing import SCALAR_VALUE_TYPES
 from .lexing import VALUE_TOKEN_KINDS
 from .lexing import Position
@@ -95,11 +96,21 @@ class JsonStreamObject(list):
 class JsonStreamParser(GenMachine[Token, JsonStreamParserEvent]):
-    def __init__(self) -> None:
-        super().__init__(self._do_value())
+    def __init__(
+            self,
+            *,
+            allow_trailing_commas: bool = False,
+            allow_extended_idents: bool = False,
+    ) -> None:
+        self._allow_trailing_commas = allow_trailing_commas
+        self._allow_extended_idents = allow_extended_idents
         self._stack: list[ta.Literal['OBJECT', 'KEY', 'ARRAY']] = []
+        super().__init__(self._do_value())
     #
     def _next_tok(self):
@@ -144,12 +155,23 @@ class JsonStreamParser(GenMachine[Token, JsonStreamParserEvent]):
                 raise JsonStreamParseError('Expected value') from None
             else:
                 raise
+        # except Exception as e:
+        #     raise
         if tok.kind in VALUE_TOKEN_KINDS:
             y, r = self._emit_event(tok.value)
             yield y
             return r
+        elif tok.kind == 'IDENT':
+            try:
+                cv = CONST_IDENT_VALUES[tok.value]
+            except KeyError:
+                raise JsonStreamParseError('Expected value', tok.pos) from None
+            y, r = self._emit_event(cv)
+            yield y
+            return r
         elif tok.kind == 'LBRACE':
             y, r = self._emit_begin_object()
             yield y
@@ -193,7 +215,7 @@ class JsonStreamParser(GenMachine[Token, JsonStreamParserEvent]):
         except GeneratorExit:
             raise JsonStreamParseError('Expected object body') from None
-        if tok.kind == 'STRING':
+        if tok.kind == 'STRING' or (self._allow_trailing_commas and tok.kind == 'IDENT'):
             k = tok.value
             try:
@@ -225,7 +247,7 @@ class JsonStreamParser(GenMachine[Token, JsonStreamParserEvent]):
             raise JsonStreamParseError('Expected continuation') from None
         if tok.kind == 'COMMA':
-            return self._do_object_body(must_be_present=True)
+            return self._do_object_body(must_be_present=not self._allow_trailing_commas)
         elif tok.kind == 'RBRACE':
             y, r = self._emit_end_object()
@@ -258,7 +280,7 @@ class JsonStreamParser(GenMachine[Token, JsonStreamParserEvent]):
             raise JsonStreamParseError('Expected continuation') from None
         if tok.kind == 'COMMA':
-            return self._do_value(must_be_present=True)
+            return self._do_value(must_be_present=not self._allow_trailing_commas)
         elif tok.kind == 'RBRACKET':
             y, r = self._emit_end_array()

omlish/formats/json/stream/utils.py CHANGED Viewed

@@ -23,63 +23,136 @@ TODO:
    - Names and values separated by = or => instead of :.
    - Name/value pairs separated by ; instead of ,.
 """
-import dataclasses as dc
+import itertools
 import typing as ta
 from .... import lang
 from .building import JsonValueBuilder
+from .errors import JsonStreamError
 from .lexing import JsonStreamLexer
+from .lexing import Token
 from .parsing import JsonStreamParser
+from .parsing import JsonStreamParserEvent
 ##
-@dc.dataclass(kw_only=True)
 class JsonStreamValueParser(lang.ExitStacked):
-    include_raw: bool = False
-    yield_object_lists: bool = False
+    class Machinery(ta.NamedTuple):
+        lex: JsonStreamLexer
+        parse: JsonStreamParser
+        build: JsonValueBuilder
-    json5: bool = False
+    def __init__(self, m: Machinery) -> None:
+        super().__init__()
-    #
+        self._m = m
-    _lex: JsonStreamLexer = dc.field(init=False)
-    _parse: JsonStreamParser = dc.field(init=False)
-    _build: JsonValueBuilder = dc.field(init=False)
+    #
     def _enter_contexts(self) -> None:
-        self._lex = JsonStreamLexer(
-            include_raw=self.include_raw,
-            allow_comments=self.json5,
-            allow_single_quotes=self.json5,
-        )
+        self._enter_context(self._m.lex)
+        self._enter_context(self._m.parse)
+    def feed(self, i: ta.Iterable[str]) -> ta.Iterator[ta.Any]:
+        for c in i:
+            for t in self._m.lex(c):
+                for e in self._m.parse(t):
+                    for v in self._m.build(e):  # noqa
+                        yield v
+    #
+    @classmethod
+    def parse_values(
+            cls,
+            m: Machinery,
+            i: ta.Iterable[str],
+    ) -> ta.Iterator[ta.Any]:
+        with cls(m) as p:
+            yield from p.feed(itertools.chain(i, ['']))
+    @classmethod
+    def parse_one_value(
+            cls,
+            m: Machinery,
+            i: ta.Iterable[str],
+    ) -> ta.Any:
+        with cls(m) as p:
+            return next(p.feed(itertools.chain(i, [''])))
+    @classmethod
+    def parse_exactly_one_value(
+            cls,
+            m: Machinery,
+            i: ta.Iterable[str],
+    ) -> ta.Any:
+        r: ta.Any
+        r = not_set = object()
+        with cls(m) as p:
+            for v in p.feed(itertools.chain(i, [''])):
+                if r is not_set:
+                    r = v
+                else:
+                    raise JsonStreamError('Unexpected input')
+        if r is not_set:
+            raise JsonStreamError('No value')
+        return r
+##
-        self._parse = JsonStreamParser()
+class DebugJsonStreamValueParser(JsonStreamValueParser):
+    def __init__(self, m: JsonStreamValueParser.Machinery) -> None:
+        super().__init__(m)
-        self._build = JsonValueBuilder(
-            yield_object_lists=self.yield_object_lists,
-        )
+        self._chars: list[str] = []
+        self._tokens: list[Token] = []
+        self._events: list[JsonStreamParserEvent] = []
+        self._values: list[ta.Any] = []
     def feed(self, i: ta.Iterable[str]) -> ta.Iterator[ta.Any]:
         for c in i:
-            for t in self._lex(c):
-                for e in self._parse(t):
-                    for v in self._build(e):  # noqa
+            self._chars.append(c)
+            for t in self._m.lex(c):
+                self._tokens.append(t)
+                for e in self._m.parse(t):
+                    self._events.append(e)
+                    for v in self._m.build(e):
+                        self._values.append(v)
                         yield v
-def stream_parse_values(
-        i: ta.Iterable[str],
-        **kwargs: ta.Any,
-) -> ta.Generator[ta.Any]:
-    with JsonStreamValueParser(**kwargs) as p:
-        yield from p.feed(i)
+##
+def make_machinery(
+        *,
+        include_raw: bool = False,
+        yield_object_lists: bool = False,
+) -> JsonStreamValueParser.Machinery:
+    return JsonStreamValueParser.Machinery(
+        JsonStreamLexer(
+            include_raw=include_raw,
+        ),
+        JsonStreamParser(),
+        JsonValueBuilder(
+            yield_object_lists=yield_object_lists,
+        ),
+    )
+def stream_parse_values(i: ta.Iterable[str], **kwargs: ta.Any) -> ta.Iterator[ta.Any]:
+    return JsonStreamValueParser.parse_values(make_machinery(**kwargs), i)
+def stream_parse_one_value(i: ta.Iterable[str], **kwargs: ta.Any) -> ta.Any:
+    return JsonStreamValueParser.parse_one_value(make_machinery(**kwargs), i)
-def stream_parse_one_value(
-        i: ta.Iterable[str],
-        **kwargs: ta.Any,
-) -> ta.Any:
-    with JsonStreamValueParser(**kwargs) as p:
-        return next(p.feed(i))
+def stream_parse_exactly_one_value(i: ta.Iterable[str], **kwargs: ta.Any) -> ta.Any:
+    return JsonStreamValueParser.parse_exactly_one_value(make_machinery(**kwargs), i)

omlish/formats/json5/literals.py CHANGED Viewed

@@ -124,7 +124,10 @@ def parse_string_literal(s: str) -> str:
 def parse_number_literal(s: str) -> int | float:
     s = s.lower()
-    if 'x' in s:
-        return int(s, 16)
-    else:
-        return float(s)
+    try:
+        if 'x' in s:
+            return int(s, 16)
+        else:
+            return float(s)
+    except ValueError as e:
+        raise Json5Error from e

omlish 0.0.0.dev437__py3-none-any.whl → 0.0.0.dev438__py3-none-any.whl

omlish 0.0.0.dev437py3-none-any.whl → 0.0.0.dev438py3-none-any.whl