npm - @ansi-tools/parser - Versions diffs - 1.0.4 → 1.0.6 - Mend

@ansi-tools/parser 1.0.4 → 1.0.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (4) hide show

package/dist/escaped.js +142 -118
package/dist/index.js +1 -1
package/dist/{parse-BrF7Yirl.js → parse-Dtk-XHF4.js} +26 -10
package/package.json +1 -1

package/dist/escaped.js CHANGED Viewed

@@ -1,4 +1,4 @@
-import { APC, APC_OPEN, BACKSLASH, BELL, CODE_TYPES, CSI, CSI_OPEN, DCS, DCS_OPEN, DEC_OPEN, ESC, OSC, OSC_OPEN, PM, PM_OPEN, PRIVATE_OPENERS, SOS, SOS_OPEN, ST, STRING_OPENERS, TOKEN_TYPES, parser } from "./parse-BrF7Yirl.js";
+import { APC, APC_OPEN, BACKSLASH, BELL, CODE_TYPES, CSI, CSI_OPEN, DCS, DCS_OPEN, DEC_OPEN, ESC, OSC, OSC_OPEN, PM, PM_OPEN, PRIVATE_OPENERS, SOS, SOS_OPEN, ST, STRING_OPENERS, TOKEN_TYPES, parser } from "./parse-Dtk-XHF4.js";
 //#region src/tokenize.escaped.ts
 const CSI_ESCAPED = "\\u009b";
@@ -11,28 +11,18 @@ const INTRODUCERS = [
 	["\\e", 2]
 ];
 const INTRODUCER_LOOKUP = /* @__PURE__ */ new Map();
+const INTRODUCER_FIRST_CHAR_CACHE = /* @__PURE__ */ new Map();
 for (const [sequence, len] of INTRODUCERS) {
 	const secondChar = sequence[1];
 	if (!INTRODUCER_LOOKUP.has(secondChar)) INTRODUCER_LOOKUP.set(secondChar, []);
 	INTRODUCER_LOOKUP.get(secondChar)?.push([sequence, len]);
+	INTRODUCER_FIRST_CHAR_CACHE.set(sequence, true);
 }
-const STRING_TERMINATORS = new Map([
-	["\\x9c", 4],
-	["\\e\\\\", 4],
-	["\\x1b\\\\", 8]
-]);
-const OSC_ONLY_TERMINATORS = new Map([
-	["\\a", 2],
-	["\\x07", 4],
-	["\\u0007", 6]
-]);
-const ST_MAX_LENGTH = Math.max(...STRING_TERMINATORS.values());
-const OSC_TERM_MAX_LENGTH = Math.max(...OSC_ONLY_TERMINATORS.values());
-const INTRODUCER_PEEK_AHEAD = new Set(INTRODUCERS.map((entry) => entry[0][1]));
 function emit(token) {
 	return token;
 }
 function* tokenizer(input) {
+	const l = input.length;
 	let i = 0;
 	let state = "GROUND";
 	let currentCode;
@@ -40,16 +30,29 @@ function* tokenizer(input) {
 		state = next;
 		currentCode = code;
 	}
-	while (i < input.length) if (state === "GROUND") {
+	while (i < l) if (state === "GROUND") {
 		const textStart = i;
-		while (i < input.length) {
+		while (i < l) {
 			const backslashIndex = input.indexOf(BACKSLASH, i);
 			if (backslashIndex === -1) {
-				i = input.length;
+				i = l;
 				break;
 			}
-			const nextChar = input[backslashIndex + 1];
-			if (nextChar && INTRODUCER_PEEK_AHEAD.has(nextChar)) {
+			let isIntroducer = false;
+			const candidates = INTRODUCER_LOOKUP.get(input[backslashIndex + 1]);
+			if (candidates) for (const [seq, len] of candidates) {
+				if (backslashIndex + len > l) continue;
+				let matched = true;
+				for (let k = 0; k < len && matched; k += 2) {
+					matched = input[backslashIndex + k] === seq[k];
+					if (matched && k + 1 < len) matched = input[backslashIndex + k + 1] === seq[k + 1];
+				}
+				if (matched) {
+					isIntroducer = true;
+					break;
+				}
+			}
+			if (isIntroducer) {
 				i = backslashIndex;
 				break;
 			} else i = backslashIndex + 1;
@@ -59,76 +62,84 @@ function* tokenizer(input) {
 			pos: textStart,
 			raw: input.substring(textStart, i)
 		});
-		if (i < input.length) {
+		if (i < l) {
 			const candidates = INTRODUCER_LOOKUP.get(input[i + 1]);
 			if (candidates) {
-				let matched = false;
-				for (const [seq, len] of candidates) if (i + len <= input.length && input.substring(i, i + len) === seq) {
-					matched = true;
-					if (seq === CSI_ESCAPED) {
-						yield emit({
-							type: TOKEN_TYPES.INTRODUCER,
-							pos: i,
-							raw: seq,
-							code: CSI
-						});
-						i += len;
-						setState("SEQUENCE", CSI);
-					} else {
-						const next = input[i + len];
-						if (next === CSI_OPEN) {
+				let isMatch = false;
+				for (const [seq, len] of candidates) {
+					if (i + len > l) continue;
+					let isSeqMatch = true;
+					for (let k = 0; k < len && isSeqMatch; k += 2) {
+						isSeqMatch = input[i + k] === seq[k];
+						if (isSeqMatch && k + 1 < len) isSeqMatch = input[i + k + 1] === seq[k + 1];
+					}
+					if (isSeqMatch) {
+						isMatch = true;
+						if (seq === CSI_ESCAPED) {
 							yield emit({
 								type: TOKEN_TYPES.INTRODUCER,
 								pos: i,
-								raw: seq + next,
+								raw: seq,
 								code: CSI
 							});
-							i += len + 1;
+							i += len;
 							setState("SEQUENCE", CSI);
-						} else if (next === OSC_OPEN) {
-							yield emit({
-								type: TOKEN_TYPES.INTRODUCER,
-								pos: i,
-								raw: seq + next,
-								code: OSC
-							});
-							i += len + 1;
-							setState("SEQUENCE", OSC);
-						} else if (STRING_OPENERS.has(next)) {
-							yield emit({
-								type: TOKEN_TYPES.INTRODUCER,
-								pos: i,
-								raw: seq + next,
-								code: next
-							});
-							i += len + 1;
-							setState("SEQUENCE", next);
-						} else if (next) {
-							let j = i + len;
-							while (j < input.length && input.charCodeAt(j) >= 32 && input.charCodeAt(j) <= 47) j++;
-							if (j < input.length) {
-								const is = input.slice(i + len, j);
-								if (is) yield emit({
+						} else {
+							const next = input[i + len];
+							if (next === CSI_OPEN) {
+								yield emit({
 									type: TOKEN_TYPES.INTRODUCER,
 									pos: i,
-									raw: seq + is,
-									code: ESC,
-									intermediate: is
+									raw: seq + next,
+									code: CSI
 								});
-								else yield emit({
+								i += len + 1;
+								setState("SEQUENCE", CSI);
+							} else if (next === OSC_OPEN) {
+								yield emit({
 									type: TOKEN_TYPES.INTRODUCER,
 									pos: i,
-									raw: seq,
-									code: ESC
+									raw: seq + next,
+									code: OSC
 								});
-								i = j;
-								setState("SEQUENCE", ESC);
-							} else i = j;
-						} else i += len;
+								i += len + 1;
+								setState("SEQUENCE", OSC);
+							} else if (STRING_OPENERS.has(next)) {
+								yield emit({
+									type: TOKEN_TYPES.INTRODUCER,
+									pos: i,
+									raw: seq + next,
+									code: next
+								});
+								i += len + 1;
+								setState("SEQUENCE", next);
+							} else if (next) {
+								let j = i + len;
+								while (j < l && input.charCodeAt(j) >= 32 && input.charCodeAt(j) <= 47) j++;
+								if (j < l) {
+									const is = input.slice(i + len, j);
+									if (is) yield emit({
+										type: TOKEN_TYPES.INTRODUCER,
+										pos: i,
+										raw: seq + is,
+										code: ESC,
+										intermediate: is
+									});
+									else yield emit({
+										type: TOKEN_TYPES.INTRODUCER,
+										pos: i,
+										raw: seq,
+										code: ESC
+									});
+									i = j;
+									setState("SEQUENCE", ESC);
+								} else i = j;
+							} else i += len;
+						}
+						break;
 					}
-					break;
 				}
-				if (!matched) i++;
+				if (!isMatch) i++;
 			} else i++;
 		}
 	} else if (state === "SEQUENCE") {
@@ -136,66 +147,79 @@ function* tokenizer(input) {
 		let terminatorPos = -1;
 		const pos = i;
 		const code = currentCode;
-		while (!terminator && i < input.length) {
+		while (!terminator && i < l) {
 			const char = input[i];
-			if (code === CSI) {
-				const charCode = input.charCodeAt(i);
-				if (charCode >= 64 && charCode <= 126) {
-					terminator = char;
-					terminatorPos = i;
-					i++;
-				}
-			} else if (code === ESC) {
-				terminator = char;
-				terminatorPos = i;
-				i++;
-			} else if (code) {
-				if (char === BACKSLASH) {
-					if (code === OSC) {
-						for (let len = OSC_TERM_MAX_LENGTH; len >= 2; len -= 2) if (i + len <= input.length) {
-							const sequence = input.substring(i, i + len);
-							if (OSC_ONLY_TERMINATORS.has(sequence)) {
-								terminator = sequence;
-								terminatorPos = i;
-								i += len;
-								break;
-							}
+			if (char === BACKSLASH) {
+				if (code !== CSI && code !== ESC) {
+					const next = input[i + 1];
+					if (next === "a" && i + 2 <= l) {
+						if (code === OSC && input[i + 1] === "a") {
+							terminator = "\\a";
+							terminatorPos = i;
+							i += 2;
 						}
-					}
-					if (!terminator) {
-						for (let len = ST_MAX_LENGTH; len >= 2; len -= 2) if (i + len <= input.length) {
-							const sequence = input.substring(i, i + len);
-							if (STRING_TERMINATORS.has(sequence)) {
-								terminator = sequence;
+					} else if (next === "x") {
+						if (i + 4 <= l) {
+							const char3 = input[i + 2];
+							const char4 = input[i + 3];
+							if (char3 === "0" && char4 === "7" && code === OSC) {
+								terminator = "\\x07";
 								terminatorPos = i;
-								i += len;
-								break;
+								i += 4;
+							} else if (char3 === "9" && char4 === "c") {
+								terminator = "\\x9c";
+								terminatorPos = i;
+								i += 4;
+							} else if (char3 === "1" && char4 === "b" && i + 6 <= l && input[i + 4] === BACKSLASH && input[i + 5] === BACKSLASH) {
+								terminator = "\\x1b\\\\";
+								terminatorPos = i;
+								i += 6;
 							}
 						}
+					} else if (next === "u" && code === OSC && i + 6 <= l) {
+						if (input[i + 2] === "0" && input[i + 3] === "0" && input[i + 4] === "0" && input[i + 5] === "7") {
+							terminator = "\\u0007";
+							terminatorPos = i;
+							i += 6;
+						}
+					} else if (next === "e" && i + 4 <= l) {
+						if (input[i + 2] === BACKSLASH && input[i + 3] === BACKSLASH) {
+							terminator = "\\e\\\\";
+							terminatorPos = i;
+							i += 4;
+						}
 					}
 				}
-			}
-			if (!terminator && char === BACKSLASH) {
-				const nextChar = input[i + 1];
-				if (nextChar) {
-					const candidates = INTRODUCER_LOOKUP.get(nextChar);
-					if (candidates) {
-						for (const [seq, len] of candidates) {
-							if (i + len > input.length) continue;
-							let matches = true;
-							for (let j = 0; j < len; j++) if (input[i + j] !== seq[j]) {
-								matches = false;
-								break;
+				if (!terminator) {
+					const next = input[i + 1];
+					if (next) {
+						const candidates = INTRODUCER_LOOKUP.get(next);
+						if (candidates) for (const [seq, len] of candidates) {
+							if (i + len > l) continue;
+							let matched = true;
+							for (let k = 0; k < len && matched; k += 2) {
+								matched = input[i + k] === seq[k];
+								if (matched && k + 1 < len) matched = input[i + k + 1] === seq[k + 1];
 							}
-							if (matches) {
+							if (matched) {
 								terminator = ABANDONED;
 								terminatorPos = i;
 								break;
 							}
 						}
-						if (terminator === ABANDONED) break;
 					}
 				}
+			} else if (code === CSI) {
+				const charCode = input.charCodeAt(i);
+				if (charCode >= 64 && charCode <= 126) {
+					terminator = char;
+					terminatorPos = i;
+					i++;
+				}
+			} else if (code === ESC) {
+				terminator = char;
+				terminatorPos = i;
+				i++;
 			}
 			if (!terminator) i++;
 		}

package/dist/index.js CHANGED Viewed

@@ -1,3 +1,3 @@
-import { APC, APC_OPEN, BACKSLASH, BELL, CODE_TYPES, CSI, CSI_OPEN, DCS, DCS_OPEN, DEC_OPEN, ESC, OSC, OSC_OPEN, PM, PM_OPEN, PRIVATE_OPENERS, SOS, SOS_OPEN, ST, STRING_OPENERS, TOKEN_TYPES, parse, parser, tokenize, tokenizer } from "./parse-BrF7Yirl.js";
+import { APC, APC_OPEN, BACKSLASH, BELL, CODE_TYPES, CSI, CSI_OPEN, DCS, DCS_OPEN, DEC_OPEN, ESC, OSC, OSC_OPEN, PM, PM_OPEN, PRIVATE_OPENERS, SOS, SOS_OPEN, ST, STRING_OPENERS, TOKEN_TYPES, parse, parser, tokenize, tokenizer } from "./parse-Dtk-XHF4.js";
 export { APC, APC_OPEN, BACKSLASH, BELL, CODE_TYPES, CSI, CSI_OPEN, DCS, DCS_OPEN, DEC_OPEN, ESC, OSC, OSC_OPEN, PM, PM_OPEN, PRIVATE_OPENERS, SOS, SOS_OPEN, ST, STRING_OPENERS, TOKEN_TYPES, parse, parser, tokenize, tokenizer };

package/dist/{parse-BrF7Yirl.js → parse-Dtk-XHF4.js} RENAMED Viewed

@@ -380,6 +380,15 @@ function* tokenizer(input) {
 		let data = "";
 		if (code === CSI) while (i < input.length) {
 			const char = input[i];
+			if (INTRODUCERS.has(char)) {
+				if (data) yield emit$1({
+					type: TOKEN_TYPES.DATA,
+					pos,
+					raw: data
+				});
+				setState("GROUND");
+				break;
+			}
 			const charCode = char.charCodeAt(0);
 			if (charCode >= 64 && charCode <= 126) {
 				if (data) yield emit$1({
@@ -393,6 +402,7 @@ function* tokenizer(input) {
 					raw: char
 				});
 				i++;
+				setState("GROUND");
 				break;
 			}
 			data += char;
@@ -401,19 +411,23 @@ function* tokenizer(input) {
 		else if (code === ESC) {
 			if (i < input.length) {
 				const char = input[i];
-				yield emit$1({
-					type: TOKEN_TYPES.FINAL,
-					pos: i,
-					raw: char
-				});
-				i++;
+				if (INTRODUCERS.has(char)) setState("GROUND");
+				else {
+					yield emit$1({
+						type: TOKEN_TYPES.FINAL,
+						pos: i,
+						raw: char
+					});
+					i++;
+					setState("GROUND");
+				}
 			}
 		} else if (code) while (i < input.length) {
 			const char = input[i];
 			let terminator;
-			if (char === ST) terminator = ST;
+			if (char === ESC && input[i + 1] === BACKSLASH) terminator = ESC + BACKSLASH;
+			else if (char === ST) terminator = ST;
 			else if (char === BELL && code === OSC) terminator = BELL;
-			else if (char === ESC && input[i + 1] === BACKSLASH) terminator = ESC + BACKSLASH;
 			if (terminator) {
 				if (data) yield emit$1({
 					type: TOKEN_TYPES.DATA,
@@ -426,20 +440,22 @@ function* tokenizer(input) {
 					raw: terminator
 				});
 				i += terminator.length;
+				setState("GROUND");
 				break;
 			}
-			if (char === ESC) {
+			if (INTRODUCERS.has(char)) {
 				if (data) yield emit$1({
 					type: TOKEN_TYPES.DATA,
 					pos,
 					raw: data
 				});
+				setState("GROUND");
 				break;
 			}
 			data += char;
 			i++;
 		}
-		setState("GROUND");
+		if (state === "SEQUENCE") setState("GROUND");
 	}
 }
 function tokenize(input) {

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@ansi-tools/parser",
-  "version": "1.0.4",
+  "version": "1.0.6",
   "description": "Tokenize and parse strings containing ANSI escape sequences and control codes",
   "main": "./dist/index.js",
   "type": "module",