securemark 0.288.2 → 0.289.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
package/CHANGELOG.md CHANGED
@@ -1,5 +1,9 @@
1
1
  # Changelog
2
2
 
3
+ ## 0.289.0
4
+
5
+ - Improve bracket parser.
6
+
3
7
  ## 0.288.2
4
8
 
5
9
  - Fix signature syntax.
package/README.md CHANGED
@@ -67,7 +67,7 @@ Secure markdown renderer working on browsers for user input data.
67
67
 
68
68
  |P| Operators |
69
69
  |-|------------------------------|
70
- |9| \n, \\\n |
70
+ |9| \n |
71
71
  |6| ` |
72
72
  |5| ${}$ |
73
73
  |4| [% %] |
package/design.md CHANGED
@@ -290,8 +290,8 @@ CodeMirrorが素では速いがVimModeでは数万文字程度でも耐え難く
290
290
  ### バックトラック
291
291
 
292
292
  SecuremarkのAnnotation構文に典型的であるように文脈を変更する構文の中にその文脈に依存し変更される他の構文が存在する場合文脈の相違から解析結果を再利用不能(`αAβ | αA'B`)なバックトラックが生じる。またこの結果再帰的バックトラックが生じる可能性があり再帰的バックトラックは一般的にメモ化により解決されるがCommonMarkは実行性能追及のためメモ化を廃止しているためメモ化により性能を低下させてまで文脈依存構文の問題を解決するつもりはないと思われる(すなわちCommonMarkは機械を至上とし人間に制約を課す低水準の言語であり人間の需要を至上とするSecuremarkとは対極に位置する)。従って現在の再帰的バックトラックなしで解析可能な構文と最小計算量に制約されるCommonMarkにはこれ以上再帰的バックトラックが生じる可能性を増加させて文脈依存構文を追加できないという拡張性の欠陥が存在する。CommonMarkの仕様策定者が構文の拡張に(名称を維持するか否かにかかわらず)不自然なまでに消極的または進展がないのは正当な理由や怠慢からでなく文脈依存構文を追加するにつれて構文解析戦略の失敗が明白になっていくためおよび現在の高い実行性能を低下させたくないためであり陳腐な自尊心を守るためにこのような拡張性の欠陥を秘匿しCommonMarkとその仕様策定者である自分の評価が下がらないよう画策しているからである。でなければ何年も隠さず速やかにこの拡張性の欠陥を公表して助力を求めていなければならず不都合な事実を隠し全Markdown利用者および開発者を不必要に足止めした罪は重い。CommonMarkは`~~a~~`のような文脈自由構文は容易に追加できるがこうしたマージンを失えばもはや後はない。
293
- CommonMarkは小さく単純であるがゆえに正しくいられる象牙の塔であり仕様策定者はこの正しさを失わず正しいままでいたいがために象牙の塔に引きこもり小さな表面的完全性に固執し続けているに過ぎない。しかし実際にはCommonMarkはまったく完全ではなく本来文脈依存構文である構文を文脈自由構文として解析しているため破綻している部分があり実際のところCommonMarkは最初から現在までずっと壊れている。またCommonMarkはバックトラックなく最小計算量で解析するために文脈自由言語として設計されているが実際には文脈依存言語であるMarkdownから文脈依存構文を文脈自由構文に変換して除去することができずCommonMarkは最初の数年間は再帰的バックトラックに気づかず最悪計算量が指数関数計算量になっており修正後は最悪計算量が当初の想定の1nから32nへと32倍に劇的に悪化している。CommonMarkは未だにバックトラックを忌避し1nの最小計算量に固執しているがそんなものはとっくの昔に破綻してるのを未練がましく執着しているだけである。最悪計算量が32nにまで悪化するのであれば計算量が少ないよう適切に設計された文脈依存言語と大差なく最初から文脈依存言語として適切に設計するほうが自然で破綻がなく拡張性を確保できていた。文脈依存構文を強引に文脈自由構文として解析して最悪計算量が当初の想定の1nから32nに劇的に悪化し結局文脈依存言語の妥当な最悪計算量の水準に落ちていることから文脈自由言語として設計されたCommonMarkの破綻と失敗は明らかでありCommonMarkは文脈自由構文に固執せず最初から多少の文脈依存構文を許容するよう設計しなければならなかった。実際には文脈依存言語であるにもかかわらず文脈自由言語としてしか構文解析できなければ構文解析が破綻し構文が増えるほど破綻が拡大することは自明でありすでに破綻済みで失敗済みのCommonMarkに未来などない。文脈依存言語であるMarkdownに対して文脈自由構文解析器として作られたCommonMarkは最初から技術選択を間違え失敗しており最初から破綻していた。Markdownを文脈自由言語として解析しようとして行き詰ったCommonMarkとその閉塞に技術的合理性はなくCommonMarkは最初からの失敗していた過去の遺物であり廃棄すべき負債である。CommonMarkに動きがないのはすでに破綻しており死んでいることに気付かれないように死んでいるからに過ぎない。このようにCommonMarkは完全に破綻し失敗に終わっているためCommonMarkの拡張や発展を期待しても無駄であり既存の文脈依存構文による破綻がなく新たに文脈依存構文を追加可能な拡張性の高いMarkdown仕様は新しく作り直さなければ作れない。しかしCommonMarkの仕様策定者は独自の新しい仕様においてもMarkdownをバックトラックを排除した文脈自由言語として設計しているため救いようがない。しかもその構文と仕様は機械可読性を至上としているため非常に醜く人間が書くことも読むことも困難で実用性の欠如したものである。
294
- Securemarkはスーパークラス構文が解析に失敗した入力をサブクラス構文で解析しないことにより再帰的バックトラックを回避する(ここで解析中の構文自身はスーパークラスとサブクラスの両方に含まれるものとする)。スーパークラス構文A(`αAβ`)の解析が失敗すればサブクラス構文B(`α'A'β'`)の解析も失敗することは自明であり解析を試みるまでもなく省略できる。これは構文の文法が生成する言語空間がスーパーセットとサブセットの関係にあるならスーパーセットの言語空間の外にある文字列はサブセットの言語空間の内に入る余地がないことからも自明である(この解析法は事前処理によっても可能だが文脈内外のオートリンクURLの括弧解析などを高速に行うことは困難であるためMarkdownをこの事前処理により高速化することは難しい)。メモ化は解析結果を再利用することで結果的に副次的効果としてバックトラックを回避しているのでありメモ化はバックトラックを回避するだけなら過剰機能であり不要である(メモ化はバックトラックがなければ使用されないためバックトラックの少ないほとんどの入力に対してはほとんど使用されず無駄であり空間計算量を常に不必要に数倍以上に増加させてまで行う利益は少ないことから構文解析において必須ではない。バックトラック回避のためにメモ化するとバックトラックなしで解析可能な場合も常に不必要に空間計算量が増加することがメモ化の最大の欠点である(この問題は解析失敗時のみメモ化すれば解消可能のはずだが基本的にはこうなる)。特に文脈自由構文解析器におけるメモ化の使用は完全に無駄でありバグである。バックトラックが他の方法で解決されるならば最終的に文脈ごと破棄され使用されないメモ化も無駄であり複数の文脈で解析結果が同一である文脈独立性のある構文ならメモ化した解析結果を異なる文脈で再利用でき有用だがそのような構文は基本的に少数であるため効果が限定的であり最悪計算量は改善されない)。この独自の解析法によりSecuremarkはメモ化なしに線形時間で解析不能な文脈依存言語をメモ化なしでおおよそ12nの最悪時間計算量に改善しさらに一定時間内で解析不能な入力の影響を解析時間と解析範囲の局限することで解決している。この解析方法はほとんどの自然な入力に対して1nに近い時間で効率的に動作し、最悪計算量で低速に動作させる入力に対してもこの開発効率と安全性優先の低速な実装をサーバーで使用し多数のユーザーのリクエストに応じるには低速で脆弱性となる可能性があるがクライアントで個別のユーザーの操作に応じるには十分高速であるためクライアントで解析する限り解析の効率または速度が実用上問題となることはなく仕様が固まり実行効率優先の高速な実装に移れば速度面の懸念もないだろう。またSecuremarkはメモ化を行っていないため実装依存の非効率性を除けば空間計算量も小さく、異なる構文や状態の解析結果を利用して未知の入力に対してもバックトラックを回避できるためメモ化より時間計算量が小さい。時間計算量と空間計算量を合わせてO(n, n)と表記すると文脈依存言語の通常の最悪計算量はO(n^2, n)、メモ化により効率化できた場合もO(nm, nm)(解析結果の構文木等を記録するため空間使用量S(m)>=m byte)に過ぎないがSecuremarkの失敗単一化はO(nm, n + nm)(解析失敗のフラグしか記録しないためS(m)=m bit。また包含文字列を含め全体でn byteの構文1つに対してメモ化は少なくともn byteを消費するが失敗単一化のメモリ消費量は構文全体のサイズにかかわらず1 bit固定である。なお成功フラグによる解析は解析済みかの情報が追加で必要になり処理が複雑化かつほとんどの成功した解析に対してメモリ消費と追加処理が発生し解析効率が全体として悪化するが失敗フラグは少数の失敗した解析でしか解析効率が悪化しないため失敗フラグを記録するほうが全体として解析効率が高く優れている)と極めて効率的であり最も優れている。なお現在のSecuremarkは開発効率優先の実装により空間計算量が低下しているが時間計算量は低下せずメモ化より優れている。またSecuremarkの再帰数制限はパーサーコンビネーターの使用による実装依存の制限であるため再帰が生じないよう書き換えれば再帰数制限もない。SecuremarkをCommonMarkのような再帰数制限のない実装に変換することは設計上何の支障もないがCommonMarkをSecuremarkのような文脈依存言語解析器に変更することは根本的な設計変更なしに不可能である。例えば二重リンク`[[]()]()`を解析するときCommonMarkはバックトラックと計算量を最小化すべく文脈自由構文解析器として設計されているためリンク構文内を異なる文脈として解析せず外側のリンク構文の解析を破棄して内側のみリンクとして解析するがSecuremarkは文脈依存構文解析器とし設計されているため内側のリンク構文を無効化して外側のみリンクとして解析する。旧構文だけ従来通り文脈自由構文として解析し新構文を文脈依存構文として解析することも不可能ではないが構文としても解析器としてもキメラ的な非常に不自然で歪なものとなり解析規則の一貫性のなさによりユーザーを混乱させることになる。いずれにせよCommonMarkはこのような根本的設計変更なしに文脈依存構文解析器に変更して拡張性を確保することはできないためMarkdownは素直にCommonMarkの文脈自由言語特有の解析規則を捨てて素直な文脈依存構文言語として新しい仕様を作るのが賢明である。
293
+ CommonMarkは小さく単純であるがゆえに正しくいられる象牙の塔であり仕様策定者はこの正しさを失わず正しいままでいたいがために象牙の塔に引きこもり小さな表面的完全性に固執し続けているに過ぎない。しかしCommonMarkは実際にはまったく完全ではなく本来文脈依存構文である構文を文脈自由構文として解析しているため破綻している部分があり実際のところCommonMarkは最初から現在までずっと壊れている。またCommonMarkはバックトラックなく最小計算量で解析するために文脈自由言語として設計されているが実際には文脈依存言語であるMarkdownから文脈依存構文を文脈自由構文に変換して除去することに失敗しているためCommonMarkは最初の数年間は再帰的バックトラックに気づかず最悪計算量が指数関数計算量になっており修正後は最悪計算量が当初の想定の2nから32nへと劇的に悪化している。CommonMarkが最初の数年間指数関数計算量であった事実はCommonMarkが初歩的な再帰的バックトラックの原理すら理解していない素人により設計された素人仕事である事実を証明している。一貫して素人により設計開発仕様策定されているCommonMarkは未だにバックトラックを忌避し2nの最小計算量に固執しているがそんなものはとっくの昔に破綻してるのを未練がましく執着しているだけである。最悪計算量が32nにまで悪化するのであれば計算量が少ないよう適切に設計された文脈依存言語と大差なく最初から文脈依存言語として適切に設計するほうが自然で破綻がなく拡張性を確保できていた。文脈依存構文を強引に文脈自由構文として解析して最悪計算量が当初の想定の2nから32nに劇的に悪化し結局文脈依存言語の妥当な最悪計算量の水準に落ちていることから文脈自由言語として設計されたCommonMarkの破綻と失敗は明らかでありCommonMarkは文脈自由構文に固執せず最初から多少の文脈依存構文を許容するよう設計しなければならなかった。実際には文脈依存言語であるにもかかわらず文脈自由言語としてしか構文解析できなければ構文解析が破綻し構文が増えるほど破綻が拡大することは自明でありすでに破綻済みで失敗済みのCommonMarkに未来などない。文脈依存言語であるMarkdownに対して文脈自由構文解析器として作られたCommonMarkは最初から技術選択を間違え失敗しており最初から破綻していた。CommonMarkが文脈依存言語を文脈自由言語として最小計算量で解析するために使用した手法は邪道の小手先の技術に過ぎずCommonMarkは邪道を選んだ挙句失敗に終わったのである。文脈依存言語を文脈依存言語のまま解析する正道を選んだSecuremarkが正着し文脈自由言語に歪める邪道を選んだCommonMarkが失着に終わったのは当然の帰結であり最初の言語選択の時点で決まっていたことである。文脈依存言語であるMarkdownを文脈自由言語として解析しようとして行き詰ったCommonMarkとその閉塞に技術的合理性はなくCommonMarkは最初からの失敗していた過去の遺物であり廃棄すべき負債である。CommonMarkに動きがないのはすでに破綻しており死んでいることに気付かれないように死んでいるからに過ぎない。このようにCommonMarkは完全に破綻し失敗に終わっているためCommonMarkの拡張や発展を期待しても無駄であり既存の文脈依存構文による破綻がなく新たに文脈依存構文を追加可能な拡張性の高いMarkdown仕様は新しく作り直さなければ作れない。しかしCommonMarkの仕様策定者は独自の新しい仕様においてもMarkdownをバックトラックを排除した文脈自由言語として設計しているため救いようがない。しかもその構文と仕様は機械可読性を至上としているため非常に醜く人間が書くことも読むことも困難で実用性の欠如したものである。
294
+ Securemarkはスーパークラス構文が解析に失敗した入力をサブクラス構文で解析しないことにより再帰的バックトラックを回避する(ここで解析中の構文自身はスーパークラスとサブクラスの両方に含まれるものとする)。スーパークラス構文A(`αAβ`)の解析が失敗すればサブクラス構文B(`α'A'β'`)の解析も失敗することは自明であり解析を試みるまでもなく省略できる。これは構文の文法が生成する言語空間がスーパーセットとサブセットの関係にあるならスーパーセットの言語空間の外にある文字列はサブセットの言語空間の内に入る余地がないことからも自明である(この解析法は事前処理によっても可能だが文脈内外のオートリンクURLの括弧解析などを高速に行うことは困難であるためMarkdownをこの事前処理により高速化することは難しい)。メモ化は解析結果を再利用することで結果的に副次的効果としてバックトラックを回避しているのでありメモ化はバックトラックを回避するだけなら過剰機能であり不要である(メモ化はバックトラックがなければ使用されないためバックトラックの少ないほとんどの入力に対してはほとんど使用されず無駄であり空間計算量を常に不必要に数倍以上に増加させてまで行う利益は少ないことから構文解析において必須ではない。バックトラック回避のためにメモ化するとバックトラックなしで解析可能な場合も常に不必要に空間計算量が増加することがメモ化の最大の欠点である(この問題は解析失敗時のみメモ化すれば解消可能のはずだが基本的にはこうなる)。特に文脈自由構文解析器におけるメモ化の使用は完全に無駄でありバグである。バックトラックが他の方法で解決されるならば最終的に文脈ごと破棄され使用されないメモ化も無駄であり複数の文脈で解析結果が同一である文脈独立性のある構文ならメモ化した解析結果を異なる文脈で再利用でき有用だがそのような構文は基本的に少数であるため効果が限定的であり最悪計算量は改善されない)。この独自の解析法により、CommonMarkならば最悪時間計算量384nを要する拡張Markdown言語をSecuremarkはメモ化なしで12nの最悪時間計算量で解析しさらに一定時間内で解析不能な入力の影響を解析時間と解析範囲の制限により局限している。またSecuremarkはメモ化を行っていないため実装依存の非効率性を除けば空間計算量も小さい。時間計算量と空間計算量を合わせてO(n, n)と表記すると文脈依存言語の通常の最悪計算量はO(n^2, n)、メモ化により効率化できた場合もO(nm, nm)(S(m)>=m byte)(解析結果の構文木等を記録するため空間使用量S(m)>=m byte)に過ぎないがSecuremarkのマーキング法はO(nm, nm)(S(m)=m bit)(解析の失敗フラグしか記録しないためS(m)=m bit。また包含文字列を含め全体でn byteの構文1つに対してメモ化は少なくともn byteを消費するがマーキング法のメモリ消費量は構文全体のサイズにかかわらず1bit固定である。よって100KBの構文1つに対してメモ化は100KB以上消費するがこの場合もマーキング法は1bitしか消費しない。なお成功フラグによる解析は解析済みかの情報が追加で必要になり処理が複雑化かつほとんどの成功した解析に対してメモリ消費と追加処理が発生し解析効率が全体として悪化するが失敗フラグは少数の失敗した解析でしか解析効率が悪化しないため失敗フラグを記録するほうが全体として解析効率が高く優れている)と極めて効率的であり最も優れている。以上のようにSecuremarkの構文解析アルゴリズムの優位性は理論と実践いずれにおいても革新的かつ圧倒的である。現在のSecuremarkは開発効率と安全性優先の実装により実行性能が大きく低下しているが最悪計算量で低速に動作させる入力に対してもこの実装をサーバーで使用し多数のユーザーのリクエストに応じるには低速で脆弱性となる可能性があるがクライアントで個別のユーザーの操作に応じるには十分高速であるためクライアントで解析する限り解析の効率または速度が実用上問題となることはなく仕様が固まり実行効率優先の高速な実装に移れば速度面の懸念もないだろう。またSecuremarkの再帰数制限はパーサーコンビネーターの使用による実装依存の制限であるため再帰が生じないよう書き換えれば再帰数制限もない。SecuremarkをCommonMarkのような再帰数制限のない実装に変換することは設計上何の支障もないがCommonMarkをSecuremarkのような正常な文脈依存言語解析器に変更することは解析規則の破壊的変更なしに不可能である。具体的には二重リンク`[[]()]()`を解析するときCommonMarkはバックトラックと計算量を最小化すべく文脈自由構文解析器として設計されているためリンク構文内をリンク構文が定義されていない異なる文脈として解析せず外側のリンク構文の解析を破棄して内側のみリンク構文として解析するがSecuremarkは文脈依存構文解析器とし設計されているためリンク構文内にリンク構文が定義されておらず外側のみリンクとして解析する(ここでCommonMarkはリンク構文`[]()`の文脈自由化に角括弧`[]`に対しては成功したが丸括弧`()`に対しては失敗したことで最悪計算量が指数関数計算量ないし32nに悪化した)。多くのプログラミング言語を見ても明らかなように文脈依存言語は構文内で使用可能な構文を定義しその他の構文は構文内で使用できず例外処理するのが通常でありCommonMarkのように本来使用不能な構文を外側の構文を無効化して使用可能に変える異常な言語はほとんどの人間はCommonMark以外に見たことがないだろう。ほぼすべての人間において他のすべての言語が同じ一貫した規則を持ち同じ規則で統一的に使用できるのに対してCommonMarkだけが他と異なる異常な挙動をして認知的負荷をかけるのである。破壊的変更を避けるため旧構文で使用した苦肉の策を不必要に新構文でも使用して一貫させれば文脈依存言語なのに文脈自由言語の苦肉の策で解析される非常に不自然で理論的に設計ミスが明白で実用的にも認知的負荷の高い言語となり旧構文だけ従来通り文脈自由構文として解析し新構文を文脈依存構文として解析すればキメラ的な非常に不自然かつ歪で一貫性のない解析規則によりCommonMarkという一つの言語の中だけでもユーザーを混乱させるものとなる。そして構文エラーであることが明らかな二重リンクを意図的に入力することはほぼないためCommonMarkの異常な挙動はこれまであまり人目に付かなかったがMarkdownに文脈依存構文を追加して明らかでない構文エラーが頻発すると他の言語と逆に外側の構文を無効化していくCommonMarkの異常な挙動を頻繁に目撃し認知的負荷をかけられることになる。このようにCommonMarkは内部設計だけ文脈依存構文解析器に変更しても理論的齟齬が解析結果と使用感に明白に表れるためCommonMarkが失敗した言語である事実は到底隠し切れるものではない。Markdownはもはや負債以外の何物でもないCommonMarkの異常な解析規則を捨てて素直な文脈依存構文言語として新しい仕様を作り直すのが賢明である。
295
295
 
296
296
  ### 最適化
297
297
 
@@ -323,7 +323,7 @@ Markdownに本当に必要な仕様はSecuremarkのクラス化制約のよう
323
323
  - リンクのURLを効率的に解析不可能
324
324
  - altはまだしもURLは文脈依存構文としての解析を避けられないため再帰もまた避けられず公式デモページのCommonMarkで`[](`を1万文字程度繰り返しただけで解析時間が1秒を超える
325
325
  - この欠陥は入れ子数を制限することで回避可能だがこれはCommonmarkは文脈依存構文全般に入れ子数制限を要することを意味する
326
- - CommonMarkは最初のバージョンから数年後にこの欠陥を入れ子数制限により修正しこれにより最悪計算量が当初の想定の1nから32nへと32倍に劇的に悪化したことから文脈自由言語および最小計算量としての設計と開発が破綻し失敗に終わったことが明らかである
326
+ - CommonMarkは最初のバージョンから数年後にこの欠陥を入れ子数制限により修正しこれにより最悪計算量が当初の想定の2nから32nへと32倍に劇的に悪化したことから文脈自由言語および最小計算量としての設計と開発が破綻し失敗に終わったことが明らかである
327
327
  - これほど計算量が悪ければ入れ子数制限付き文脈依存言語と大差ない計算量であり素直に文脈依存言語として作り直したほうが遥かに拡張性と発展性が高く優れている
328
328
  - 計算資源は使うためにあるにもかかわらず言語と一致しない不適切な解析方法を使用してまでこの程度の計算資源を惜しんで人間に不便と不自由を強いて生産性を下げるのは本末転倒である
329
329
  - 計算機は人間の生産性に奉仕しなければならない
package/dist/index.js CHANGED
@@ -1,4 +1,4 @@
1
- /*! securemark v0.288.2 https://github.com/falsandtru/securemark | (c) 2017, falsandtru | UNLICENSED License */
1
+ /*! securemark v0.289.0 https://github.com/falsandtru/securemark | (c) 2017, falsandtru | UNLICENSED License */
2
2
  (function webpackUniversalModuleDefinition(root, factory) {
3
3
  if(typeof exports === 'object' && typeof module === 'object')
4
4
  module.exports = factory(require("Prism"), require("DOMPurify"));
@@ -3177,11 +3177,15 @@ function surround(opener, parser, closer, optional = false, f, g, backtracks = [
3177
3177
  }) => {
3178
3178
  const lmr_ = source;
3179
3179
  if (lmr_ === '') return;
3180
+ const {
3181
+ linebreak
3182
+ } = context;
3183
+ context.linebreak = undefined;
3180
3184
  const res1 = opener({
3181
3185
  source: lmr_,
3182
3186
  context
3183
3187
  });
3184
- if (res1 === undefined) return;
3188
+ if (res1 === undefined) return void revert(context, linebreak);
3185
3189
  const rl = (0, parser_1.eval)(res1);
3186
3190
  const mr_ = (0, parser_1.exec)(res1);
3187
3191
  for (const backtrack of backtracks) {
@@ -3197,7 +3201,7 @@ function surround(opener, parser, closer, optional = false, f, g, backtracks = [
3197
3201
  if (!(pos in backtracks)) continue;
3198
3202
  // bracket only
3199
3203
  const shift = backtrack >>> 2 === state >>> 2 ? state & 3 : 0;
3200
- if (backtracks[pos] & 1 << (backtrack >>> 2) + shift) return;
3204
+ if (backtracks[pos] & 1 << (backtrack >>> 2) + shift) return void revert(context, linebreak);
3201
3205
  }
3202
3206
  }
3203
3207
  }
@@ -3212,14 +3216,14 @@ function surround(opener, parser, closer, optional = false, f, g, backtracks = [
3212
3216
  context.backtrack = state;
3213
3217
  const rm = (0, parser_1.eval)(res2);
3214
3218
  const r_ = (0, parser_1.exec)(res2, mr_);
3215
- if (!rm && !optional) return;
3219
+ if (!rm && !optional) return void revert(context, linebreak);
3216
3220
  const res3 = closer({
3217
3221
  source: r_,
3218
3222
  context
3219
3223
  });
3220
3224
  const rr = (0, parser_1.eval)(res3);
3221
3225
  const rest = (0, parser_1.exec)(res3, r_);
3222
- if (rest.length === lmr_.length) return;
3226
+ if (rest.length === lmr_.length) return void revert(context, linebreak);
3223
3227
  for (const backtrack of backtracks) {
3224
3228
  if (backtrack & 2 && rr === undefined) {
3225
3229
  const {
@@ -3233,7 +3237,13 @@ function surround(opener, parser, closer, optional = false, f, g, backtracks = [
3233
3237
  }
3234
3238
  }
3235
3239
  context.recent = [lmr_.slice(0, lmr_.length - mr_.length), mr_.slice(0, mr_.length - r_.length), r_.slice(0, r_.length - rest.length)];
3236
- return rr ? f ? f([rl, rm, rr], rest, context) : [(0, array_1.push)((0, array_1.unshift)(rl, rm ?? []), rr), rest] : g ? g([rl, rm, mr_], rest, context) : undefined;
3240
+ const result = rr ? f ? f([rl, rm, rr], rest, context) : [(0, array_1.push)((0, array_1.unshift)(rl, rm ?? []), rr), rest] : g ? g([rl, rm, mr_], rest, context) : undefined;
3241
+ if (result) {
3242
+ context.linebreak ??= linebreak;
3243
+ } else {
3244
+ revert(context, linebreak);
3245
+ }
3246
+ return result;
3237
3247
  };
3238
3248
  }
3239
3249
  exports.surround = surround;
@@ -3252,6 +3262,9 @@ function match(pattern) {
3252
3262
  };
3253
3263
  }
3254
3264
  }
3265
+ function revert(context, linebreak) {
3266
+ context.linebreak = linebreak;
3267
+ }
3255
3268
  function open(opener, parser, optional = false) {
3256
3269
  return surround(opener, parser, '', optional);
3257
3270
  }
@@ -3570,7 +3583,8 @@ class Delimiters {
3570
3583
  const {
3571
3584
  signature,
3572
3585
  matcher,
3573
- precedence
3586
+ precedence,
3587
+ linebreakable
3574
3588
  } = delims[i];
3575
3589
  const memory = registry(signature);
3576
3590
  const index = memory[0]?.index ?? delimiters.length;
@@ -3580,6 +3594,7 @@ class Delimiters {
3580
3594
  signature,
3581
3595
  matcher,
3582
3596
  precedence,
3597
+ linebreakable: linebreakable,
3583
3598
  state: true
3584
3599
  };
3585
3600
  delimiters[index] = delimiter;
@@ -3632,7 +3647,10 @@ class Delimiters {
3632
3647
  delimiters[indexes[i]].state = true;
3633
3648
  }
3634
3649
  }
3635
- match(source, precedence = 0) {
3650
+ match(source, {
3651
+ precedence = 0,
3652
+ linebreak = 0
3653
+ }) {
3636
3654
  const {
3637
3655
  delimiters
3638
3656
  } = this;
@@ -3641,6 +3659,7 @@ class Delimiters {
3641
3659
  if (delimiter.precedence <= precedence || !delimiter.state) continue;
3642
3660
  switch (delimiter.matcher(source)) {
3643
3661
  case true:
3662
+ if (!delimiter.linebreakable && linebreak > 0) return false;
3644
3663
  return true;
3645
3664
  case false:
3646
3665
  return false;
@@ -3688,7 +3707,7 @@ function inits(parsers, resume) {
3688
3707
  let nodes;
3689
3708
  for (let len = parsers.length, i = 0; i < len; ++i) {
3690
3709
  if (rest === '') break;
3691
- if (context.delimiters?.match(rest, context.precedence)) break;
3710
+ if (context.delimiters?.match(rest, context)) break;
3692
3711
  const result = parsers[i]({
3693
3712
  source: rest,
3694
3713
  context
@@ -3727,7 +3746,7 @@ function sequence(parsers, resume) {
3727
3746
  let nodes;
3728
3747
  for (let len = parsers.length, i = 0; i < len; ++i) {
3729
3748
  if (rest === '') return;
3730
- if (context.delimiters?.match(rest, context.precedence)) return;
3749
+ if (context.delimiters?.match(rest, context)) return;
3731
3750
  const result = parsers[i]({
3732
3751
  source: rest,
3733
3752
  context
@@ -3760,10 +3779,11 @@ const array_1 = __webpack_require__(6876);
3760
3779
  function some(parser, end, delimiters = [], limit = -1) {
3761
3780
  if (typeof end === 'number') return some(parser, undefined, delimiters, end);
3762
3781
  const match = delimiter_1.Delimiters.matcher(end);
3763
- const delims = delimiters.map(([delimiter, precedence]) => ({
3782
+ const delims = delimiters.map(([delimiter, precedence, linebreakable = true]) => ({
3764
3783
  signature: delimiter_1.Delimiters.signature(delimiter),
3765
3784
  matcher: delimiter_1.Delimiters.matcher(delimiter),
3766
- precedence
3785
+ precedence,
3786
+ linebreakable
3767
3787
  }));
3768
3788
  return ({
3769
3789
  source,
@@ -3779,7 +3799,7 @@ function some(parser, end, delimiters = [], limit = -1) {
3779
3799
  while (true) {
3780
3800
  if (rest === '') break;
3781
3801
  if (match(rest)) break;
3782
- if (context.delimiters?.match(rest, context.precedence)) break;
3802
+ if (context.delimiters?.match(rest, context)) break;
3783
3803
  const result = parser({
3784
3804
  source: rest,
3785
3805
  context
@@ -6111,7 +6131,9 @@ exports.bracket = (0, combinator_1.lazy)(() => (0, combinator_1.union)([(0, comb
6111
6131
  class: 'paren'
6112
6132
  }, (0, dom_1.defrag)((0, array_1.push)((0, array_1.unshift)(as, bs), cs)))], rest], ([as, bs = []], rest) => [(0, array_1.unshift)(as, bs), rest]), (0, combinator_1.surround)((0, source_1.str)('['), (0, combinator_1.recursion)(5 /* Recursion.bracket */, (0, combinator_1.precedence)(1, (0, combinator_1.some)(inline_1.inline, ']', [[']', 1]]))), (0, source_1.str)(']'), true, undefined, ([as, bs = []], rest) => [(0, array_1.unshift)(as, bs), rest], [2 | 8 /* Backtrack.bracket */]), (0, combinator_1.surround)((0, source_1.str)('['), (0, combinator_1.recursion)(5 /* Recursion.bracket */, (0, combinator_1.precedence)(1, (0, combinator_1.some)(inline_1.inline, ']', [[']', 1]]))), (0, source_1.str)(']'), true, undefined, ([as, bs = []], rest) => [(0, array_1.unshift)(as, bs), rest]), (0, combinator_1.surround)((0, source_1.str)('{'), (0, combinator_1.recursion)(5 /* Recursion.bracket */, (0, combinator_1.precedence)(1, (0, combinator_1.some)(inline_1.inline, '}', [['}', 1]]))), (0, source_1.str)('}'), true, undefined, ([as, bs = []], rest) => [(0, array_1.unshift)(as, bs), rest], [2 | 8 /* Backtrack.bracket */]), (0, combinator_1.surround)((0, source_1.str)('{'), (0, combinator_1.recursion)(5 /* Recursion.bracket */, (0, combinator_1.precedence)(1, (0, combinator_1.some)(inline_1.inline, '}', [['}', 1]]))), (0, source_1.str)('}'), true, undefined, ([as, bs = []], rest) => [(0, array_1.unshift)(as, bs), rest]),
6113
6133
  // 改行禁止はバックトラックなしでは内側の構文を破壊するため安易に行えない。
6114
- (0, combinator_1.surround)((0, source_1.str)('"'), (0, combinator_1.recursion)(5 /* Recursion.bracket */, (0, combinator_1.precedence)(2, (0, combinator_1.some)(inline_1.inline, '"', [['\n', 9], ['"', 2]]))), (0, source_1.str)('"'), true, undefined, ([as, bs = []], rest) => [(0, array_1.unshift)(as, bs), rest], [2 | 8 /* Backtrack.bracket */])]));
6134
+ (0, combinator_1.surround)((0, source_1.str)('"'), (0, combinator_1.recursion)(5 /* Recursion.bracket */, (0, combinator_1.precedence)(2, (0, combinator_1.some)(inline_1.inline, '"', [['"', 2, false]]))), (0, source_1.str)('"'), true, ([as, bs = [], cs], rest, {
6135
+ linebreak = 0
6136
+ }) => linebreak > rest.length ? [(0, array_1.unshift)(as, bs), cs[0] + rest] : [(0, array_1.push)((0, array_1.unshift)(as, bs), cs), rest], ([as, bs = []], rest) => [(0, array_1.unshift)(as, bs), rest], [2 | 8 /* Backtrack.bracket */])]));
6115
6137
 
6116
6138
  /***/ },
6117
6139
 
@@ -7650,6 +7672,7 @@ const escsource = ({
7650
7672
  return [[source.slice(0, 2)], source.slice(2)];
7651
7673
  }
7652
7674
  case '\n':
7675
+ context.linebreak ??= source.length;
7653
7676
  return [[source[0]], source.slice(1)];
7654
7677
  default:
7655
7678
  const b = source[0].trimStart() === '';
@@ -7763,6 +7786,7 @@ const text = ({
7763
7786
  return [[source.slice(1, 2)], source.slice(2)];
7764
7787
  }
7765
7788
  case '\n':
7789
+ context.linebreak ??= source.length;
7766
7790
  return [[(0, dom_1.html)('br')], source.slice(1)];
7767
7791
  case '*':
7768
7792
  case '`':
@@ -7825,6 +7849,7 @@ const unescsource = ({
7825
7849
  (0, combinator_1.consume)(1, context);
7826
7850
  return [[source.slice(1, 2)], source.slice(2)];
7827
7851
  case '\n':
7852
+ context.linebreak ??= source.length;
7828
7853
  return [[source[0]], source.slice(1)];
7829
7854
  default:
7830
7855
  const b = source[0].trimStart() === '';
package/package.json CHANGED
@@ -1,6 +1,6 @@
1
1
  {
2
2
  "name": "securemark",
3
- "version": "0.288.2",
3
+ "version": "0.289.0",
4
4
  "description": "Secure markdown renderer working on browsers for user input data.",
5
5
  "private": false,
6
6
  "homepage": "https://github.com/falsandtru/securemark",
@@ -55,9 +55,11 @@ export function surround<T>(
55
55
  return ({ source, context }) => {
56
56
  const lmr_ = source;
57
57
  if (lmr_ === '') return;
58
+ const { linebreak } = context;
59
+ context.linebreak = undefined;
58
60
  const res1 = opener({ source: lmr_, context });
59
61
  assert(check(lmr_, res1, false));
60
- if (res1 === undefined) return;
62
+ if (res1 === undefined) return void revert(context, linebreak);
61
63
  const rl = eval(res1);
62
64
  const mr_ = exec(res1);
63
65
  for (const backtrack of backtracks) {
@@ -69,7 +71,7 @@ export function surround<T>(
69
71
  if (!(pos in backtracks)) continue;
70
72
  // bracket only
71
73
  const shift = backtrack >>> 2 === state >>> 2 ? state & 3 : 0;
72
- if (backtracks[pos] & 1 << (backtrack >>> 2) + shift) return;
74
+ if (backtracks[pos] & 1 << (backtrack >>> 2) + shift) return void revert(context, linebreak);
73
75
  }
74
76
  }
75
77
  }
@@ -80,12 +82,12 @@ export function surround<T>(
80
82
  context.backtrack = state;
81
83
  const rm = eval(res2);
82
84
  const r_ = exec(res2, mr_);
83
- if (!rm && !optional) return;
85
+ if (!rm && !optional) return void revert(context, linebreak);
84
86
  const res3 = closer({ source: r_, context });
85
87
  assert(check(r_, res3, false));
86
88
  const rr = eval(res3);
87
89
  const rest = exec(res3, r_);
88
- if (rest.length === lmr_.length) return;
90
+ if (rest.length === lmr_.length) return void revert(context, linebreak);
89
91
  for (const backtrack of backtracks) {
90
92
  if (backtrack & 2 && rr === undefined) {
91
93
  const { backtracks = {}, backtrack: state = 0, offset = 0 } = context;
@@ -99,13 +101,20 @@ export function surround<T>(
99
101
  mr_.slice(0, mr_.length - r_.length),
100
102
  r_.slice(0, r_.length - rest.length),
101
103
  ];
102
- return rr
104
+ const result = rr
103
105
  ? f
104
106
  ? f([rl, rm!, rr], rest, context)
105
- : [push(unshift(rl, rm ?? []), rr), rest]
107
+ : [push(unshift(rl, rm ?? []), rr), rest] satisfies [T[], string]
106
108
  : g
107
109
  ? g([rl, rm!, mr_], rest, context)
108
110
  : undefined;
111
+ if (result) {
112
+ context.linebreak ??= linebreak;
113
+ }
114
+ else {
115
+ revert(context, linebreak);
116
+ }
117
+ return result;
109
118
  };
110
119
  }
111
120
 
@@ -123,6 +132,10 @@ function match(pattern: string | RegExp): (input: Input) => [never[], string] |
123
132
  }
124
133
  }
125
134
 
135
+ function revert(context: Ctx, linebreak: number | undefined): void {
136
+ context.linebreak = linebreak;
137
+ }
138
+
126
139
  export function open<P extends Parser<unknown>>(opener: string | RegExp | Parser<Tree<P>, Context<P>>, parser: P, optional?: boolean): P;
127
140
  export function open<T>(opener: string | RegExp | Parser<T>, parser: Parser<T>, optional = false): Parser<T> {
128
141
  return surround(opener, parser, '', optional);
@@ -1,3 +1,4 @@
1
+ import { Ctx } from '../../parser';
1
2
  import { memoize } from 'spica/memoize';
2
3
 
3
4
  interface Delimiter {
@@ -5,6 +6,7 @@ interface Delimiter {
5
6
  readonly signature: string;
6
7
  readonly matcher: (source: string) => boolean | undefined;
7
8
  readonly precedence: number;
9
+ readonly linebreakable: boolean;
8
10
  state: boolean;
9
11
  }
10
12
 
@@ -40,13 +42,14 @@ export class Delimiters {
40
42
  readonly signature: string;
41
43
  readonly matcher: (source: string) => boolean | undefined;
42
44
  readonly precedence: number;
45
+ readonly linebreakable: boolean;
43
46
  }[]
44
47
  ): void {
45
48
  const { registry, delimiters, stack } = this;
46
49
  // シグネチャ数以下
47
50
  assert(delimiters.length < 100);
48
51
  for (let i = 0; i < delims.length; ++i) {
49
- const { signature, matcher, precedence } = delims[i];
52
+ const { signature, matcher, precedence, linebreakable } = delims[i];
50
53
  const memory = registry(signature);
51
54
  const index = memory[0]?.index ?? delimiters.length;
52
55
  if (memory.length === 0 || precedence > delimiters[index].precedence) {
@@ -55,6 +58,7 @@ export class Delimiters {
55
58
  signature,
56
59
  matcher,
57
60
  precedence,
61
+ linebreakable: linebreakable,
58
62
  state: true,
59
63
  };
60
64
  delimiters[index] = delimiter;
@@ -107,13 +111,14 @@ export class Delimiters {
107
111
  delimiters[indexes[i]].state = true;
108
112
  }
109
113
  }
110
- public match(source: string, precedence = 0): boolean {
114
+ public match(source: string, { precedence = 0, linebreak = 0 }: Ctx): boolean {
111
115
  const { delimiters } = this;
112
116
  for (let i = delimiters.length; i--;) {
113
117
  const delimiter = delimiters[i];
114
118
  if (delimiter.precedence <= precedence || !delimiter.state) continue;
115
119
  switch (delimiter.matcher(source)) {
116
120
  case true:
121
+ if (!delimiter.linebreakable && linebreak > 0) return false;
117
122
  return true;
118
123
  case false:
119
124
  return false;
@@ -10,7 +10,7 @@ export function inits<T, D extends Parser<T>[]>(parsers: D, resume?: (nodes: T[]
10
10
  let nodes: T[] | undefined;
11
11
  for (let len = parsers.length, i = 0; i < len; ++i) {
12
12
  if (rest === '') break;
13
- if (context.delimiters?.match(rest, context.precedence)) break;
13
+ if (context.delimiters?.match(rest, context)) break;
14
14
  const result = parsers[i]({ source: rest, context });
15
15
  assert(check(rest, result, false));
16
16
  if (result === undefined) break;
@@ -10,7 +10,7 @@ export function sequence<T, D extends Parser<T>[]>(parsers: D, resume?: (nodes:
10
10
  let nodes: T[] | undefined;
11
11
  for (let len = parsers.length, i = 0; i < len; ++i) {
12
12
  if (rest === '') return;
13
- if (context.delimiters?.match(rest, context.precedence)) return;
13
+ if (context.delimiters?.match(rest, context)) return;
14
14
  const result = parsers[i]({ source: rest, context });
15
15
  assert(check(rest, result, false));
16
16
  if (result === undefined) return;
@@ -2,7 +2,7 @@ import { Parser, eval, exec, check } from '../parser';
2
2
  import { Delimiters } from './context/delimiter';
3
3
  import { unshift, push } from 'spica/array';
4
4
 
5
- type DelimiterOption = readonly [delimiter: string | RegExp, precedence: number];
5
+ type DelimiterOption = readonly [delimiter: string | RegExp, precedence: number, linebreak?: boolean];
6
6
 
7
7
  export function some<P extends Parser<unknown>>(parser: P, limit?: number): P;
8
8
  export function some<P extends Parser<unknown>>(parser: P, end?: string | RegExp, delimiters?: readonly DelimiterOption[], limit?: number): P;
@@ -11,10 +11,11 @@ export function some<T>(parser: Parser<T>, end?: string | RegExp | number, delim
11
11
  assert(parser);
12
12
  assert([end].concat(delimiters.map(o => o[0])).every(d => d instanceof RegExp ? !d.flags.match(/[gmy]/) && d.source.startsWith('^') : true));
13
13
  const match = Delimiters.matcher(end);
14
- const delims = delimiters.map(([delimiter, precedence]) => ({
14
+ const delims = delimiters.map(([delimiter, precedence, linebreakable = true]) => ({
15
15
  signature: Delimiters.signature(delimiter),
16
16
  matcher: Delimiters.matcher(delimiter),
17
17
  precedence,
18
+ linebreakable,
18
19
  }));
19
20
  return ({ source, context }) => {
20
21
  if (source === '') return;
@@ -28,7 +29,7 @@ export function some<T>(parser: Parser<T>, end?: string | RegExp | number, delim
28
29
  while (true) {
29
30
  if (rest === '') break;
30
31
  if (match(rest)) break;
31
- if (context.delimiters?.match(rest, context.precedence)) break;
32
+ if (context.delimiters?.match(rest, context)) break;
32
33
  const result = parser({ source: rest, context });
33
34
  assert.doesNotThrow(() => limit < 0 && check(rest, result));
34
35
  if (result === undefined) break;
@@ -21,6 +21,7 @@ export interface Ctx {
21
21
  state?: number;
22
22
  backtracks?: Record<number, number>;
23
23
  backtrack?: number;
24
+ linebreak?: number;
24
25
  recent?: string[];
25
26
  }
26
27
  export type Tree<P extends Parser<unknown>> = P extends Parser<infer T> ? T : never;
@@ -79,6 +79,8 @@ describe('Unit: parser/inline/bracket', () => {
79
79
  assert.deepStrictEqual(inspect(parser('"(")"')), [['"', '(', '"'], ')"']);
80
80
  assert.deepStrictEqual(inspect(parser('"(("')), [['"', '(', '(', '"'], '']);
81
81
  assert.deepStrictEqual(inspect(parser('"(\\")"')), [['"', '<span class="paren">(")</span>', '"'], '']);
82
+ assert.deepStrictEqual(inspect(parser('"\n"')), [['"', '<br>', '"'], '']);
83
+ assert.deepStrictEqual(inspect(parser('"\n"(")')), [['"', '<br>', '"', '(', '"'], ')']);
82
84
  });
83
85
 
84
86
  });
@@ -40,7 +40,10 @@ export const bracket: BracketParser = lazy(() => union([
40
40
  undefined,
41
41
  ([as, bs = []], rest) => [unshift(as, bs), rest]),
42
42
  // 改行禁止はバックトラックなしでは内側の構文を破壊するため安易に行えない。
43
- surround(str('"'), recursion(Recursion.bracket, precedence(2, some(inline, '"', [['\n', 9], ['"', 2]]))), str('"'), true,
44
- undefined,
43
+ surround(str('"'), recursion(Recursion.bracket, precedence(2, some(inline, '"', [['"', 2, false]]))), str('"'), true,
44
+ ([as, bs = [], cs], rest, { linebreak = 0 }) =>
45
+ linebreak > rest.length
46
+ ? [unshift(as, bs), cs[0] + rest]
47
+ : [push(unshift(as, bs), cs), rest],
45
48
  ([as, bs = []], rest) => [unshift(as, bs), rest], [2 | Backtrack.bracket]),
46
49
  ]));
@@ -79,6 +79,14 @@ describe('Unit: parser/inline', () => {
79
79
  assert.deepStrictEqual(inspect(parser('*++ a ++*')), [['<em><ins> a </ins></em>'], '']);
80
80
  assert.deepStrictEqual(inspect(parser('*++ a ++*')), [['<em><ins> a </ins></em>'], '']);
81
81
  assert.deepStrictEqual(inspect(parser('*<bdi>`a`</bdi>*')), [['<em><bdi><code data-src="`a`">a</code></bdi></em>'], '']);
82
+ assert.deepStrictEqual(inspect(parser('*a"\nb*')), [['*', 'a', '"', '<br>', 'b', '*'], '']);
83
+ assert.deepStrictEqual(inspect(parser('*a"\n"("b*')), [['<em>a"<br>"("b</em>'], '']);
84
+ assert.deepStrictEqual(inspect(parser('"*a\nb*')), [['"', '<em>a<br>b</em>'], '']);
85
+ assert.deepStrictEqual(inspect(parser('"*a\n""b*')), [['"', '<em>a<br>""b</em>'], '']);
86
+ assert.deepStrictEqual(inspect(parser('"a\n"*b"c*')), [['"', 'a', '<br>', '"', '*', 'b', '"', 'c', '*'], '']);
87
+ assert.deepStrictEqual(inspect(parser('"*a\n**b**"("c*')), [['"', '<em>a<br><strong>b</strong>"("c</em>'], '']);
88
+ assert.deepStrictEqual(inspect(parser('<bdi>a"\nb</bdi>')), [['<bdi>a"<br>b</bdi>'], '']);
89
+ assert.deepStrictEqual(inspect(parser('"<bdi>"a\n""b</bdi>"')), [['"', '<bdi>"a<br>""b</bdi>', '"'], '']);
82
90
  assert.deepStrictEqual(inspect(parser('<bdi>*<bdi>a</bdi>*</bdi>')), [['<bdi><em><bdi>a</bdi></em></bdi>'], '']);
83
91
  assert.deepStrictEqual(inspect(parser('<bdi>((<bdi>((a))</bdi>))</bdi>')), [['<bdi><sup class="annotation"><span><bdi><span class="paren">((a))</span></bdi></span></sup></bdi>'], '']);
84
92
  assert.deepStrictEqual(inspect(parser('<bdi>[[<bdi>[[a]]</bdi>]]</bdi>')), [['<bdi><sup class="reference"><span><bdi>[[a]]</bdi></span></sup></bdi>'], '']);
@@ -35,6 +35,7 @@ export const escsource: EscapableSourceParser = ({ source, context }) => {
35
35
  }
36
36
  case '\n':
37
37
  assert(false);
38
+ context.linebreak ??= source.length;
38
39
  return [[source[0]], source.slice(1)];
39
40
  default:
40
41
  assert(source[0] !== '\n');
@@ -36,6 +36,7 @@ export const text: TextParser = ({ source, context }) => {
36
36
  return [[source.slice(1, 2)], source.slice(2)];
37
37
  }
38
38
  case '\n':
39
+ context.linebreak ??= source.length;
39
40
  return [[html('br')], source.slice(1)];
40
41
  case '*':
41
42
  case '`':
@@ -23,6 +23,7 @@ export const unescsource: UnescapableSourceParser = ({ source, context }) => {
23
23
  return [[source.slice(1, 2)], source.slice(2)];
24
24
  case '\n':
25
25
  assert(false);
26
+ context.linebreak ??= source.length;
26
27
  return [[source[0]], source.slice(1)];
27
28
  default:
28
29
  assert(source[0] !== '\n');