npm - bbcode-compiler - Versions diffs - 0.1.0 - Mend

bbcode-compiler 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (83) hide show

package/LICENSE +21 -0
package/README.md +77 -0
package/dist/generateHtml.d.ts +2 -0
package/dist/generateHtml.d.ts.map +1 -0
package/dist/generateHtml.js +13 -0
package/dist/generateHtml.js.map +1 -0
package/dist/generator/Generator.d.ts +8 -0
package/dist/generator/Generator.d.ts.map +1 -0
package/dist/generator/Generator.js +54 -0
package/dist/generator/Generator.js.map +1 -0
package/dist/generator/transforms/Transform.d.ts +10 -0
package/dist/generator/transforms/Transform.d.ts.map +1 -0
package/dist/generator/transforms/Transform.js +2 -0
package/dist/generator/transforms/Transform.js.map +1 -0
package/dist/generator/transforms/htmlTransforms.d.ts +3 -0
package/dist/generator/transforms/htmlTransforms.d.ts.map +1 -0
package/dist/generator/transforms/htmlTransforms.js +198 -0
package/dist/generator/transforms/htmlTransforms.js.map +1 -0
package/dist/generator/utils/getTagImmediateAttrVal.d.ts +14 -0
package/dist/generator/utils/getTagImmediateAttrVal.d.ts.map +1 -0
package/dist/generator/utils/getTagImmediateAttrVal.js +19 -0
package/dist/generator/utils/getTagImmediateAttrVal.js.map +1 -0
package/dist/generator/utils/getTagImmediateText.d.ts +12 -0
package/dist/generator/utils/getTagImmediateText.d.ts.map +1 -0
package/dist/generator/utils/getTagImmediateText.js +29 -0
package/dist/generator/utils/getTagImmediateText.js.map +1 -0
package/dist/generator/utils/getWidthHeightAttr.d.ts +31 -0
package/dist/generator/utils/getWidthHeightAttr.d.ts.map +1 -0
package/dist/generator/utils/getWidthHeightAttr.js +47 -0
package/dist/generator/utils/getWidthHeightAttr.js.map +1 -0
package/dist/generator/utils/isDangerousUrl.d.ts +2 -0
package/dist/generator/utils/isDangerousUrl.d.ts.map +1 -0
package/dist/generator/utils/isDangerousUrl.js +14 -0
package/dist/generator/utils/isDangerousUrl.js.map +1 -0
package/dist/generator/utils/isOrderedList.d.ts +19 -0
package/dist/generator/utils/isOrderedList.d.ts.map +1 -0
package/dist/generator/utils/isOrderedList.js +26 -0
package/dist/generator/utils/isOrderedList.js.map +1 -0
package/dist/index.d.ts +16 -0
package/dist/index.d.ts.map +1 -0
package/dist/index.js +16 -0
package/dist/index.js.map +1 -0
package/dist/lexer/Lexer.d.ts +5 -0
package/dist/lexer/Lexer.d.ts.map +1 -0
package/dist/lexer/Lexer.js +81 -0
package/dist/lexer/Lexer.js.map +1 -0
package/dist/lexer/Token.d.ts +8 -0
package/dist/lexer/Token.d.ts.map +1 -0
package/dist/lexer/Token.js +54 -0
package/dist/lexer/Token.js.map +1 -0
package/dist/lexer/TokenType.d.ts +17 -0
package/dist/lexer/TokenType.d.ts.map +1 -0
package/dist/lexer/TokenType.js +41 -0
package/dist/lexer/TokenType.js.map +1 -0
package/dist/parser/AstNode.d.ts +105 -0
package/dist/parser/AstNode.d.ts.map +1 -0
package/dist/parser/AstNode.js +263 -0
package/dist/parser/AstNode.js.map +1 -0
package/dist/parser/Parser.d.ts +11 -0
package/dist/parser/Parser.d.ts.map +1 -0
package/dist/parser/Parser.js +265 -0
package/dist/parser/Parser.js.map +1 -0
package/dist/parser/nodeIsType.d.ts +13 -0
package/dist/parser/nodeIsType.d.ts.map +1 -0
package/dist/parser/nodeIsType.js +5 -0
package/dist/parser/nodeIsType.js.map +1 -0
package/package.json +68 -0
package/src/generateHtml.ts +15 -0
package/src/generator/Generator.ts +60 -0
package/src/generator/transforms/Transform.ts +15 -0
package/src/generator/transforms/htmlTransforms.ts +205 -0
package/src/generator/utils/getTagImmediateAttrVal.ts +21 -0
package/src/generator/utils/getTagImmediateText.ts +33 -0
package/src/generator/utils/getWidthHeightAttr.ts +51 -0
package/src/generator/utils/isDangerousUrl.ts +17 -0
package/src/generator/utils/isOrderedList.ts +28 -0
package/src/index.ts +18 -0
package/src/lexer/Lexer.ts +89 -0
package/src/lexer/Token.ts +64 -0
package/src/lexer/TokenType.ts +65 -0
package/src/parser/AstNode.ts +338 -0
package/src/parser/Parser.ts +316 -0
package/src/parser/nodeIsType.ts +15 -0

package/src/parser/Parser.ts ADDED Viewed

@@ -0,0 +1,316 @@
+import { htmlTransforms } from '../generator/transforms/htmlTransforms'
+import { stringifyTokens, Token } from '../lexer/Token'
+import { isStringToken, TokenType } from '../lexer/TokenType'
+import { RootNode, AttrNode, TextNode, LinebreakNode, StartTagNode, EndTagNode, AstNodeType, TagNode, AstNode } from './AstNode'
+import { nodeIsType } from './nodeIsType'
+export class Parser {
+    readonly tags: Set<string>
+    readonly linebreakTerminatedTags: Set<string>
+    readonly standaloneTags: Set<string>
+    constructor(transforms = htmlTransforms) {
+        this.tags = new Set(transforms.map((transform) => transform.name))
+        this.linebreakTerminatedTags = new Set(transforms.filter((transform) => transform.isLinebreakTerminated).map((transform) => transform.name.toLowerCase()))
+        this.standaloneTags = new Set(transforms.filter((transform) => transform.isStandalone).map((transform) => transform.name.toLowerCase()))
+    }
+    parse(ogText: string, tokens: Array<Token>): RootNode {
+        let idx = 0
+        const parseRoot = (): RootNode => {
+            const root = new RootNode()
+            while (idx < tokens.length) {
+                if (tokens[idx].type === TokenType.L_BRACKET) {
+                    const startIdx = idx
+                    const tagNode = parseTag()
+                    if (tagNode !== null) {
+                        root.addChild(tagNode)
+                    } else {
+                        const invalidTokens = tokens.slice(startIdx, idx)
+                        const str = stringifyTokens(ogText, invalidTokens)
+                        const textNode = new TextNode(str)
+                        root.addChild(textNode)
+                    }
+                } else if (tokens[idx].type === TokenType.LINEBREAK) {
+                    idx += 1 // Consume LINEBREAK
+                    root.addChild(new LinebreakNode())
+                } else {
+                    const startIdx = idx
+                    // Advance until we see the start of another RootNode's child (TagNode or LinebreakNode)
+                    while (idx < tokens.length && tokens[idx].type !== TokenType.L_BRACKET && tokens[idx].type !== TokenType.LINEBREAK) {
+                        idx += 1
+                    }
+                    const slice = tokens.slice(startIdx, idx)
+                    const str = stringifyTokens(ogText, slice)
+                    root.addChild(new TextNode(str))
+                }
+            }
+            return root
+        }
+        const parseTag = (): StartTagNode | EndTagNode | null => {
+            if (idx + 1 >= tokens.length) {
+                return null
+            }
+            if (tokens[idx].type !== TokenType.L_BRACKET) {
+                return null
+            }
+            // If L_BRACKET is followed by text, then it must be StartTag or is invalid
+            if (isStringToken(tokens[idx + 1].type)) {
+                const startIdx = idx
+                idx += 1 // Consume L_BRACKET
+                const labelText = parseLabel()
+                if (!this.tags.has(labelText)) {
+                    return null
+                }
+                const attrNodes = new Array<AttrNode>()
+                while (true) {
+                    const attrNode = parseAttr()
+                    if (attrNode === null) {
+                        break
+                    }
+                    attrNodes.push(attrNode)
+                }
+                if (tokens[idx].type !== TokenType.R_BRACKET) {
+                    return null
+                }
+                idx += 1 // Consume R_BRACKET
+                const slice = tokens.slice(startIdx, idx)
+                const ogTag = stringifyTokens(ogText, slice)
+                const startTagNode = new StartTagNode(labelText, ogTag, attrNodes)
+                return startTagNode
+            }
+            // If L_BRACKET is followed by BACKSLASH, then it must be EndTag or is invalid
+            if (tokens[idx + 1].type === TokenType.BACKSLASH) {
+                const startIdx = idx
+                idx += 1 // Consume L_BRACKET
+                idx += 1 // Consume BACKSLASH
+                const labelText = parseLabel()
+                if (!this.tags.has(labelText)) {
+                    return null
+                }
+                if (tokens[idx].type !== TokenType.R_BRACKET) {
+                    return null
+                }
+                idx += 1 // Consume R_BRACKET
+                const slice = tokens.slice(startIdx, idx)
+                const ogTag = stringifyTokens(ogText, slice)
+                const endTagNode = new EndTagNode(labelText, ogTag)
+                return endTagNode
+            }
+            return null
+        }
+        const parseLabel = (): string => {
+            const slice = tokens.slice(idx, idx + 1)
+            const label = stringifyTokens(ogText, slice)
+            idx += 1 // Consume LABEL
+            return label.toLowerCase()
+        }
+        const parseText = (endOnQuotes = false, endOnSpace = false): TextNode => {
+            const startIdx = idx
+            while (idx < tokens.length) {
+                if (!isStringToken(tokens[idx].type)) {
+                    break
+                }
+                if (endOnQuotes && (tokens[idx].type === TokenType.XSS_S_QUOTE || tokens[idx].type === TokenType.XSS_D_QUOTE)) {
+                    break
+                }
+                /**
+                 * If this text must end on space, then it must not endOnQuote (implies that the space is part of the entire text)
+                 * When we encounter a space, then we must split the current token into 2 tokens and only consume the first half
+                 *
+                 *      <a b>    ->      <a>< b>
+                 *      |                |  |
+                 *      |                |  idx (new)
+                 *      |                |
+                 *      idx              (consumed)
+                 */
+                if (endOnSpace && !endOnQuotes) {
+                    const origStr = stringifyTokens(ogText, [tokens[idx]])
+                    const spaceIdx = origStr.indexOf(' ')
+                    if (spaceIdx >= 0) {
+                        const oldToken: Token = {
+                            type: TokenType.STR,
+                            offset: tokens[idx].offset,
+                            length: spaceIdx,
+                        }
+                        const newToken: Token = {
+                            type: TokenType.STR,
+                            offset: tokens[idx].offset + spaceIdx,
+                            length: tokens[idx].length - spaceIdx,
+                        }
+                        tokens.splice(idx + 0, 1, oldToken)
+                        tokens.splice(idx + 1, 0, newToken)
+                        idx += 1
+                        break
+                    }
+                }
+                idx += 1
+            }
+            const slice = tokens.slice(startIdx, idx)
+            const str = stringifyTokens(ogText, slice)
+            return new TextNode(str)
+        }
+        const parseAttr = (): AttrNode | null => {
+            if (idx + 1 >= tokens.length) {
+                return null
+            }
+            const attrNode = new AttrNode()
+            if (tokens[idx].type === TokenType.EQUALS && isStringToken(tokens[idx + 1].type)) { // [Tag = VAL ...] or [Tag = "VAL"]
+                idx += 1 // Consume EQUALS
+                const openedWithQuotes = tokens[idx].type === TokenType.XSS_S_QUOTE || tokens[idx].type === TokenType.XSS_D_QUOTE
+                if (openedWithQuotes) {
+                    idx += 1
+                }
+                const valNode = parseText(openedWithQuotes, true)
+                attrNode.addChild(valNode)
+                if (openedWithQuotes) {
+                    if (tokens[idx].type !== TokenType.XSS_S_QUOTE && tokens[idx].type !== TokenType.XSS_D_QUOTE) {
+                        return null
+                    }
+                    idx += 1
+                }
+            } else if (isStringToken(tokens[idx].type) && tokens[idx + 1].type === TokenType.EQUALS && (idx + 2 < tokens.length && isStringToken(tokens[idx + 2].type))) { // [Tag KEY = VAL ...] or [Tag KEY = "VAL" ...]
+                const keyNode = parseText()
+                attrNode.addChild(keyNode)
+                idx += 1 // Consume EQUALS
+                const openedWithQuotes = tokens[idx].type === TokenType.XSS_S_QUOTE || tokens[idx].type === TokenType.XSS_D_QUOTE
+                if (openedWithQuotes) {
+                    idx += 1
+                }
+                const valNode = parseText(openedWithQuotes, true)
+                if (openedWithQuotes) {
+                    if (tokens[idx].type !== TokenType.XSS_S_QUOTE && tokens[idx].type !== TokenType.XSS_D_QUOTE) {
+                        return null
+                    }
+                    idx += 1
+                }
+                attrNode.addChild(valNode)
+            } else if (isStringToken(tokens[idx].type) && tokens[idx + 1].type !== TokenType.EQUALS) { // [Tag VAL ...]
+                const valNode = parseText()
+                attrNode.addChild(valNode)
+            } else {
+                return null
+            }
+            return attrNode
+        }
+        let root = parseRoot()
+        root = this.#matchTagNodes(root)
+        return root
+    }
+    // ------------------------------------------------------------------------
+    // Post Parsing Transforms
+    // ------------------------------------------------------------------------
+    #matchTagNodes(rootNode: RootNode): RootNode {
+        const transformedRoot = new RootNode()
+        for (let i = 0; i < rootNode.children.length; i++) {
+            const child = rootNode.children[i]
+            if (nodeIsType(child, AstNodeType.StartTagNode)) {
+                const endTag = this.#findMatchingEndTag(rootNode.children, i, child.tagName)
+                const isStandalone = this.standaloneTags.has(child.tagName)
+                if (endTag || isStandalone) {
+                    const tagNode = new TagNode(child, endTag?.node)
+                    transformedRoot.addChild(tagNode)
+                    // If matching end tag exists, consume all nodes between start/end (exclusive) as a subtree
+                    if (endTag) {
+                        const subRoot = new RootNode(rootNode.children.slice(i + 1, endTag.idx))
+                        i = endTag.idx
+                        const transformedSubRoot = this.#matchTagNodes(subRoot)
+                        tagNode.addChild(transformedSubRoot)
+                    }
+                } else {
+                    // If no end tag exists, then treat tag as string literal
+                    transformedRoot.addChild(new TextNode(child.ogTag))
+                }
+            } else if (nodeIsType(child, AstNodeType.EndTagNode)) {
+                // Encountered end tag when we're not expecting an end tag so we treat it as a string literal
+                transformedRoot.addChild(new TextNode(child.ogTag))
+            } else if (nodeIsType(child, AstNodeType.TextNode)) {
+                // Normal text nodes get copied
+                transformedRoot.addChild(child)
+            } else if (nodeIsType(child, AstNodeType.LinebreakNode)) {
+                // Linebreak nodes get copied
+                transformedRoot.addChild(child)
+            } else {
+                throw new Error('Unexpected child of RootNode')
+            }
+        }
+        return transformedRoot
+    }
+    #findMatchingEndTag(siblings: Array<AstNode>, startIdx: number, tagName: string): { idx: number; node: EndTagNode | LinebreakNode } | null {
+        if (this.standaloneTags.has(tagName)) {
+            return null
+        }
+        for (let i = startIdx; i < siblings.length; i++) {
+            const sibling = siblings[i]
+            const isEndTag =
+                (nodeIsType(sibling, AstNodeType.LinebreakNode) && this.linebreakTerminatedTags.has(tagName)) ||
+                (nodeIsType(sibling, AstNodeType.EndTagNode) && sibling.tagName === tagName)
+            if (isEndTag) {
+                return {
+                    idx: i,
+                    node: sibling,
+                }
+            }
+        }
+        return null
+    }
+}

package/src/parser/nodeIsType.ts ADDED Viewed

@@ -0,0 +1,15 @@
+import { AstNodeType, AstNode, AttrNode, RootNode, TagNode, TextNode, LinebreakNode, EndTagNode, StartTagNode } from './AstNode'
+interface AstMap {
+    [AstNodeType.RootNode]: RootNode
+    [AstNodeType.LinebreakNode]: LinebreakNode
+    [AstNodeType.TextNode]: TextNode
+    [AstNodeType.TagNode]: TagNode
+    [AstNodeType.StartTagNode]: StartTagNode
+    [AstNodeType.EndTagNode]: EndTagNode
+    [AstNodeType.AttrNode]: AttrNode
+}
+export function nodeIsType<T extends keyof AstMap>(node: AstNode, nodeType: T): node is AstMap[T] {
+    return node.nodeType === nodeType
+}