kordoc 2.9.1 → 3.0.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (40) hide show
  1. package/README.md +37 -0
  2. package/dist/-5BWAV4ZY.js +73 -0
  3. package/dist/-5BWAV4ZY.js.map +1 -0
  4. package/dist/chunk-MUOQXDZ4.cjs.map +1 -1
  5. package/dist/{chunk-FWAXCTSX.cjs → chunk-NBJB6TJB.cjs} +185 -16
  6. package/dist/chunk-NBJB6TJB.cjs.map +1 -0
  7. package/dist/{chunk-ODF24QXC.js → chunk-O5P6EG5L.js} +182 -13
  8. package/dist/chunk-O5P6EG5L.js.map +1 -0
  9. package/dist/{chunk-Z6TLTWYK.js → chunk-X3SCCO5Q.js} +182 -13
  10. package/dist/chunk-X3SCCO5Q.js.map +1 -0
  11. package/dist/{chunk-GQQNAYZA.js → chunk-X7VQVMXQ.js} +7453 -3997
  12. package/dist/chunk-X7VQVMXQ.js.map +1 -0
  13. package/dist/cli.js +44 -3
  14. package/dist/cli.js.map +1 -1
  15. package/dist/formula-XGG6ZP42.cjs.map +1 -1
  16. package/dist/index.cjs +4087 -829
  17. package/dist/index.cjs.map +1 -1
  18. package/dist/index.d.cts +87 -2
  19. package/dist/index.d.ts +87 -2
  20. package/dist/index.js +3867 -609
  21. package/dist/index.js.map +1 -1
  22. package/dist/mcp.js +3 -3
  23. package/dist/page-range-3C7UGGEK.cjs.map +1 -1
  24. package/dist/{parser-FJNQEW7K.js → parser-3N6FZSKU.js} +677 -85
  25. package/dist/parser-3N6FZSKU.js.map +1 -0
  26. package/dist/{parser-BTIPAEDZ.cjs → parser-5FZJVLQL.cjs} +689 -97
  27. package/dist/parser-5FZJVLQL.cjs.map +1 -0
  28. package/dist/{parser-BKYM3LKN.js → parser-LZH7ZELV.js} +677 -85
  29. package/dist/parser-LZH7ZELV.js.map +1 -0
  30. package/dist/provider-SNONEZNW.cjs.map +1 -1
  31. package/dist/{watch-SBLSWHL7.js → watch-4FMRS7QU.js} +3 -3
  32. package/package.json +1 -1
  33. package/dist/chunk-FWAXCTSX.cjs.map +0 -1
  34. package/dist/chunk-GQQNAYZA.js.map +0 -1
  35. package/dist/chunk-ODF24QXC.js.map +0 -1
  36. package/dist/chunk-Z6TLTWYK.js.map +0 -1
  37. package/dist/parser-BKYM3LKN.js.map +0 -1
  38. package/dist/parser-BTIPAEDZ.cjs.map +0 -1
  39. package/dist/parser-FJNQEW7K.js.map +0 -1
  40. /package/dist/{watch-SBLSWHL7.js.map → watch-4FMRS7QU.js.map} +0 -0
package/README.md CHANGED
@@ -62,11 +62,45 @@ Windows 도 자동으로 `cmd /c npx` 래핑. 수동 JSON 편집 불필요. 재
62
62
  * **📊 복잡한 표(Table) 완벽 재현**: 선이 없는 PDF나 복잡하게 병합된 HWP 표도 구조를 분석하여 정확한 마크다운 테이블로 복원합니다.
63
63
  * **🔍 신구대조표 자동 생성**: 두 문서의 차이점을 분석하여 무엇이 바뀌었는지 한눈에 보여줍니다. (HWP와 HWPX 간의 비교도 가능!)
64
64
  * **📝 마크다운을 다시 HWPX로**: AI가 작성한 내용을 다시 보고서 양식(`HWPX`)으로 되돌려줍니다. 이제 복사-붙여넣기 노가다에서 해방되세요.
65
+ * **🔄 서식 보존 무손실 라운드트립 (v3.0)**: 변환된 마크다운을 편집해서 `patchHwpx`(HWPX) / `patchHwp`(HWP 5.x 바이너리)에 넘기면, **원본 서식을 1바이트도 건드리지 않고** 바뀐 문단/표 셀의 텍스트만 원본 안에서 교체합니다. AI가 공문 내용을 고치고 서식 그대로 돌려받는 워크플로가 가능해집니다.
65
66
  * **✏️ 양식 자동 채우기**: 공문서 양식 템플릿(신청서, 보고서)에 값을 넣으면 자동으로 빈칸을 채웁니다. 원본 서식(글꼴, 크기, 정렬)을 100% 보존합니다.
66
67
  * **🤖 AI 에이전트 연동 (MCP)**: `Claude`, `Cursor`와 같은 도구에서 직접 `kordoc`을 호출해 문서를 읽고 코딩할 수 있습니다.
67
68
 
68
69
  ---
69
70
 
71
+ ## v3.0.1 변경사항
72
+
73
+ - **🔄 HWP 5.x 바이너리 서식 보존 패치** — `patchHwp(원본HWP, 편집된마크다운)` 신규 API. HWPX 패치(`patchHwpx`)의 HWP 5.x(OLE2 바이너리) 대응으로, 변경된 문단/표 셀의 PARA_TEXT만 레코드 안에서 치환합니다 (PARA_HEADER 글자수·CHAR_SHAPE·LINE_SEG 연쇄 갱신).
74
+ - **섹터 레벨 컨테이너 수술**: CFB 전체 재조립 없이 대상 스트림의 섹터/FAT 체인/디렉토리 엔트리만 갱신 — 수정 외 영역은 원본과 바이트 동일 (실측: 133섹터 중 5섹터만 변경)
75
+ - 안전 게이트: 레코드 재직렬화 바이트 동일성 검증, 순수 텍스트 문단만 수정, 암호화/배포용/DRM 거부, 미지원 편집은 `skipped[]`로 graceful skip
76
+ - CLI `kordoc patch`가 .hwp/.hwpx를 매직바이트로 자동 분기
77
+ - **CI**: Node 18 ESM `__dirname` 미정의로 테스트 매트릭스가 실패하던 문제 수정
78
+
79
+ ## v3.0.0 변경사항
80
+
81
+ - **🔄 서식 보존 무손실 라운드트립** — `patchHwpx(원본HWPX, 편집된마크다운)` 신규 API. 변경된 문단/셀의 텍스트만 원본 XML 안에서 in-place 치환하고 나머지 ZIP 엔트리는 바이트 그대로 보존. 미지원 편집(블록 추가/삭제, 표 구조 변경)은 원본을 건드리지 않고 `skipped[]`로 정직하게 보고하며, 패치 후 자동 재파싱 검증 리포트(`verification`)를 제공합니다.
82
+
83
+ ```ts
84
+ import { parse, patchHwpx } from "kordoc"
85
+
86
+ const r = await parse(buf) // HWPX → 마크다운
87
+ const edited = r.markdown.replace("개최 예정", "개최 완료") // LLM이 편집했다고 가정
88
+ const res = await patchHwpx(new Uint8Array(buf), edited)
89
+ // res.data — 서식 그대로, 텍스트만 바뀐 HWPX 바이트
90
+ // res.applied / res.skipped / res.verification — 적용·미지원·검증 리포트
91
+ ```
92
+
93
+ - **🎯 "99.9% 정확도" 파서 대도약** — 실측 공문서 코퍼스 324건(정부 보도자료 + 서울시 결재문서 + 2014~2016 옛 문서) 자기참조 채점 기준:
94
+
95
+ | 지표 | v2.9.1 | v3.0.0 |
96
+ |------|--------|--------|
97
+ | HWPX 텍스트 재현율 | 99.699% | **99.998%** |
98
+ | HWPX 표 구조 정확일치 | 99.875% | **100%** (1,421표 · 중첩표 343 포함) |
99
+ | PDF coverage | 97.013% | **99.16%** |
100
+ | HWP5↔HWPX 쌍 유사도 | — | **99.94%** |
101
+
102
+ 중첩표 구조 보존(`IRCell.blocks`), 한컴 PUA 매핑, HWP5 이미지 추출(0→90건), 자동번호 카운터, 머리말/각주 정밀 처리 등. 채점기·코퍼스 수집기·게이트는 `bench/`에 포함 — `node bench/score.mjs`로 재현 가능.
103
+
70
104
  ## v2.9.0 변경사항
71
105
 
72
106
  - **📊 PDF 텍스트 품질 신호 + OCR 필요 판정** — PDF는 텍스트층이 있어도 ToUnicode/CMap 이 깨져 한글이 깨진 글리프로 떨어지거나 NUL 등 제어문자가 섞이는 경우가 많습니다. `parsePdf` 결과에 페이지별 품질 신호(`pageQuality`)와 문서 요약(`qualitySummary`)을 추가 — `needsOcr`/`ocrReason` 으로 OCR 큐 자동 라우팅이 가능. kordoc 은 OCR 을 기본 탑재하지 않고 **신호만** 노출합니다. 전국 지자체 주요업무계획 PDF 190건(45,399쪽) 대량 처리 중 도출. (아래 [PDF 텍스트 품질 신호](#pdf-텍스트-품질-신호-v290) 참고)
@@ -442,6 +476,8 @@ npx -y kordoc setup
442
476
  | `fillForm(buffer, values, options?)` | 양식 템플릿에 값 채우기 (markdown/hwpx/hwpx-preserve) |
443
477
  | `fillFormFields(blocks, values)` | IRBlock[] 기반 필드 값 교체 |
444
478
  | `fillHwpx(buffer, values)` | HWPX XML 직접 조작 (원본 서식 보존) |
479
+ | `patchHwpx(original, editedMarkdown, options?)` | 편집 마크다운 → 원본 HWPX 서식 보존 in-place 패치 (v3.0) |
480
+ | `patchHwp(original, editedMarkdown, options?)` | 편집 마크다운 → 원본 HWP 5.x 바이너리 서식 보존 패치 (v3.0.1) |
445
481
  | `markdownToHwpx(markdown, options?)` | Markdown → HWPX 역변환 (테마 옵션 지원) |
446
482
  | `markdownToPdf(markdown, options?)` | Markdown → PDF 생성 (Print Renderer) |
447
483
  | `blocksToPdf(blocks, options?)` | IRBlock[] → PDF 생성 |
@@ -457,6 +493,7 @@ import type {
457
493
  DocumentMetadata, ParseOptions, ErrorCode, OutlineItem,
458
494
  DiffResult, BlockDiff, CellDiff, DiffChangeType,
459
495
  FormField, FormResult, FillResult, HwpxFillResult, FillOutputFormat, FillFormOutput,
496
+ PatchOptions, PatchResult, PatchSkip,
460
497
  HwpxTheme, MarkdownToHwpxOptions,
461
498
  PrintPreset, PrintOptions, PageMargin,
462
499
  OcrProvider, WatchOptions,
@@ -0,0 +1,73 @@
1
+ #!/usr/bin/env node
2
+ import {
3
+ blocksToPdf,
4
+ compare,
5
+ diffBlocks,
6
+ extractFormFields,
7
+ fillForm,
8
+ fillFormFields,
9
+ fillHwpx,
10
+ isLabelCell,
11
+ markdownToHwpx,
12
+ markdownToPdf,
13
+ parse,
14
+ parseDocx,
15
+ parseHwp,
16
+ parseHwp3,
17
+ parseHwpml,
18
+ parseHwpx,
19
+ parsePdf,
20
+ parseXls,
21
+ parseXlsx,
22
+ patchHwp,
23
+ patchHwpx,
24
+ renderHtml
25
+ } from "./chunk-X7VQVMXQ.js";
26
+ import {
27
+ detectFormat,
28
+ detectOle2Format,
29
+ detectZipFormat,
30
+ isHwpxFile,
31
+ isOldHwpFile,
32
+ isPdfFile,
33
+ isZipFile
34
+ } from "./chunk-MEPHGCPQ.js";
35
+ import {
36
+ VERSION,
37
+ blocksToMarkdown
38
+ } from "./chunk-O5P6EG5L.js";
39
+ import "./chunk-MOL7MDBG.js";
40
+ export {
41
+ VERSION,
42
+ blocksToMarkdown,
43
+ blocksToPdf,
44
+ compare,
45
+ detectFormat,
46
+ detectOle2Format,
47
+ detectZipFormat,
48
+ diffBlocks,
49
+ extractFormFields,
50
+ fillForm,
51
+ fillFormFields,
52
+ fillHwpx,
53
+ isHwpxFile,
54
+ isLabelCell,
55
+ isOldHwpFile,
56
+ isPdfFile,
57
+ isZipFile,
58
+ markdownToHwpx,
59
+ markdownToPdf,
60
+ parse,
61
+ parseDocx,
62
+ parseHwp,
63
+ parseHwp3,
64
+ parseHwpml,
65
+ parseHwpx,
66
+ parsePdf,
67
+ parseXls,
68
+ parseXlsx,
69
+ patchHwp,
70
+ patchHwpx,
71
+ renderHtml
72
+ };
73
+ //# sourceMappingURL=-5BWAV4ZY.js.map
@@ -0,0 +1 @@
1
+ {"version":3,"sources":[],"sourcesContent":[],"mappings":"","names":[]}
@@ -1 +1 @@
1
- {"version":3,"sources":["/Users/mong-e/workspace/kordoc/dist/chunk-MUOQXDZ4.cjs","../src/page-range.ts"],"names":[],"mappings":"AAAA;ACSO,SAAS,cAAA,CAAe,IAAA,EAAyB,QAAA,EAA+B;AACrF,EAAA,MAAM,OAAA,kBAAS,IAAI,GAAA,CAAY,CAAA;AAC/B,EAAA,GAAA,CAAI,SAAA,GAAY,CAAA,EAAG,OAAO,MAAA;AAE1B,EAAA,GAAA,CAAI,KAAA,CAAM,OAAA,CAAQ,IAAI,CAAA,EAAG;AACvB,IAAA,IAAA,CAAA,MAAW,EAAA,GAAK,IAAA,EAAM;AACpB,MAAA,MAAM,KAAA,EAAO,IAAA,CAAK,KAAA,CAAM,CAAC,CAAA;AACzB,MAAA,GAAA,CAAI,KAAA,GAAQ,EAAA,GAAK,KAAA,GAAQ,QAAA,EAAU,MAAA,CAAO,GAAA,CAAI,IAAI,CAAA;AAAA,IACpD;AACA,IAAA,OAAO,MAAA;AAAA,EACT;AAEA,EAAA,GAAA,CAAI,OAAO,KAAA,IAAS,SAAA,GAAY,IAAA,CAAK,IAAA,CAAK,EAAA,IAAM,EAAA,EAAI,OAAO,MAAA;AAE3D,EAAA,MAAM,MAAA,EAAQ,IAAA,CAAK,KAAA,CAAM,GAAG,CAAA;AAC5B,EAAA,IAAA,CAAA,MAAW,KAAA,GAAQ,KAAA,EAAO;AACxB,IAAA,MAAM,QAAA,EAAU,IAAA,CAAK,IAAA,CAAK,CAAA;AAC1B,IAAA,GAAA,CAAI,CAAC,OAAA,EAAS,QAAA;AAEd,IAAA,MAAM,WAAA,EAAa,OAAA,CAAQ,KAAA,CAAM,qBAAqB,CAAA;AACtD,IAAA,GAAA,CAAI,UAAA,EAAY;AACd,MAAA,MAAM,MAAA,EAAQ,IAAA,CAAK,GAAA,CAAI,CAAA,EAAG,QAAA,CAAS,UAAA,CAAW,CAAC,CAAA,EAAG,EAAE,CAAC,CAAA;AACrD,MAAA,MAAM,IAAA,EAAM,IAAA,CAAK,GAAA,CAAI,QAAA,EAAU,QAAA,CAAS,UAAA,CAAW,CAAC,CAAA,EAAG,EAAE,CAAC,CAAA;AAC1D,MAAA,IAAA,CAAA,IAAS,EAAA,EAAI,KAAA,EAAO,EAAA,GAAK,GAAA,EAAK,CAAA,EAAA,EAAK,MAAA,CAAO,GAAA,CAAI,CAAC,CAAA;AAAA,IACjD,EAAA,KAAO;AACL,MAAA,MAAM,KAAA,EAAO,QAAA,CAAS,OAAA,EAAS,EAAE,CAAA;AACjC,MAAA,GAAA,CAAI,CAAC,KAAA,CAAM,IAAI,EAAA,GAAK,KAAA,GAAQ,EAAA,GAAK,KAAA,GAAQ,QAAA,EAAU,MAAA,CAAO,GAAA,CAAI,IAAI,CAAA;AAAA,IACpE;AAAA,EACF;AAEA,EAAA,OAAO,MAAA;AACT;ADZA;AACA;AACE;AACF,wCAAC","file":"/Users/mong-e/workspace/kordoc/dist/chunk-MUOQXDZ4.cjs","sourcesContent":[null,"/** 페이지/섹션 범위 파싱 유틸리티 */\n\n/**\n * 페이지 범위 지정을 1-based Set<number>로 변환.\n *\n * @param spec - [1,2,3] 또는 \"1-3\" 또는 \"1,3,5-7\"\n * @param maxPages - 최대 페이지 수 (클램핑 상한)\n * @returns 1-based 페이지 번호 Set\n */\nexport function parsePageRange(spec: number[] | string, maxPages: number): Set<number> {\n const result = new Set<number>()\n if (maxPages <= 0) return result\n\n if (Array.isArray(spec)) {\n for (const n of spec) {\n const page = Math.round(n)\n if (page >= 1 && page <= maxPages) result.add(page)\n }\n return result\n }\n\n if (typeof spec !== \"string\" || spec.trim() === \"\") return result\n\n const parts = spec.split(\",\")\n for (const part of parts) {\n const trimmed = part.trim()\n if (!trimmed) continue\n\n const rangeMatch = trimmed.match(/^(\\d+)\\s*-\\s*(\\d+)$/)\n if (rangeMatch) {\n const start = Math.max(1, parseInt(rangeMatch[1], 10))\n const end = Math.min(maxPages, parseInt(rangeMatch[2], 10))\n for (let i = start; i <= end; i++) result.add(i)\n } else {\n const page = parseInt(trimmed, 10)\n if (!isNaN(page) && page >= 1 && page <= maxPages) result.add(page)\n }\n }\n\n return result\n}\n"]}
1
+ {"version":3,"sources":["/Users/chris_gomdori/workspace/kordoc/dist/chunk-MUOQXDZ4.cjs","../src/page-range.ts"],"names":[],"mappings":"AAAA;ACSO,SAAS,cAAA,CAAe,IAAA,EAAyB,QAAA,EAA+B;AACrF,EAAA,MAAM,OAAA,kBAAS,IAAI,GAAA,CAAY,CAAA;AAC/B,EAAA,GAAA,CAAI,SAAA,GAAY,CAAA,EAAG,OAAO,MAAA;AAE1B,EAAA,GAAA,CAAI,KAAA,CAAM,OAAA,CAAQ,IAAI,CAAA,EAAG;AACvB,IAAA,IAAA,CAAA,MAAW,EAAA,GAAK,IAAA,EAAM;AACpB,MAAA,MAAM,KAAA,EAAO,IAAA,CAAK,KAAA,CAAM,CAAC,CAAA;AACzB,MAAA,GAAA,CAAI,KAAA,GAAQ,EAAA,GAAK,KAAA,GAAQ,QAAA,EAAU,MAAA,CAAO,GAAA,CAAI,IAAI,CAAA;AAAA,IACpD;AACA,IAAA,OAAO,MAAA;AAAA,EACT;AAEA,EAAA,GAAA,CAAI,OAAO,KAAA,IAAS,SAAA,GAAY,IAAA,CAAK,IAAA,CAAK,EAAA,IAAM,EAAA,EAAI,OAAO,MAAA;AAE3D,EAAA,MAAM,MAAA,EAAQ,IAAA,CAAK,KAAA,CAAM,GAAG,CAAA;AAC5B,EAAA,IAAA,CAAA,MAAW,KAAA,GAAQ,KAAA,EAAO;AACxB,IAAA,MAAM,QAAA,EAAU,IAAA,CAAK,IAAA,CAAK,CAAA;AAC1B,IAAA,GAAA,CAAI,CAAC,OAAA,EAAS,QAAA;AAEd,IAAA,MAAM,WAAA,EAAa,OAAA,CAAQ,KAAA,CAAM,qBAAqB,CAAA;AACtD,IAAA,GAAA,CAAI,UAAA,EAAY;AACd,MAAA,MAAM,MAAA,EAAQ,IAAA,CAAK,GAAA,CAAI,CAAA,EAAG,QAAA,CAAS,UAAA,CAAW,CAAC,CAAA,EAAG,EAAE,CAAC,CAAA;AACrD,MAAA,MAAM,IAAA,EAAM,IAAA,CAAK,GAAA,CAAI,QAAA,EAAU,QAAA,CAAS,UAAA,CAAW,CAAC,CAAA,EAAG,EAAE,CAAC,CAAA;AAC1D,MAAA,IAAA,CAAA,IAAS,EAAA,EAAI,KAAA,EAAO,EAAA,GAAK,GAAA,EAAK,CAAA,EAAA,EAAK,MAAA,CAAO,GAAA,CAAI,CAAC,CAAA;AAAA,IACjD,EAAA,KAAO;AACL,MAAA,MAAM,KAAA,EAAO,QAAA,CAAS,OAAA,EAAS,EAAE,CAAA;AACjC,MAAA,GAAA,CAAI,CAAC,KAAA,CAAM,IAAI,EAAA,GAAK,KAAA,GAAQ,EAAA,GAAK,KAAA,GAAQ,QAAA,EAAU,MAAA,CAAO,GAAA,CAAI,IAAI,CAAA;AAAA,IACpE;AAAA,EACF;AAEA,EAAA,OAAO,MAAA;AACT;ADZA;AACA;AACE;AACF,wCAAC","file":"/Users/chris_gomdori/workspace/kordoc/dist/chunk-MUOQXDZ4.cjs","sourcesContent":[null,"/** 페이지/섹션 범위 파싱 유틸리티 */\n\n/**\n * 페이지 범위 지정을 1-based Set<number>로 변환.\n *\n * @param spec - [1,2,3] 또는 \"1-3\" 또는 \"1,3,5-7\"\n * @param maxPages - 최대 페이지 수 (클램핑 상한)\n * @returns 1-based 페이지 번호 Set\n */\nexport function parsePageRange(spec: number[] | string, maxPages: number): Set<number> {\n const result = new Set<number>()\n if (maxPages <= 0) return result\n\n if (Array.isArray(spec)) {\n for (const n of spec) {\n const page = Math.round(n)\n if (page >= 1 && page <= maxPages) result.add(page)\n }\n return result\n }\n\n if (typeof spec !== \"string\" || spec.trim() === \"\") return result\n\n const parts = spec.split(\",\")\n for (const part of parts) {\n const trimmed = part.trim()\n if (!trimmed) continue\n\n const rangeMatch = trimmed.match(/^(\\d+)\\s*-\\s*(\\d+)$/)\n if (rangeMatch) {\n const start = Math.max(1, parseInt(rangeMatch[1], 10))\n const end = Math.min(maxPages, parseInt(rangeMatch[2], 10))\n for (let i = start; i <= end; i++) result.add(i)\n } else {\n const page = parseInt(trimmed, 10)\n if (!isNaN(page) && page >= 1 && page <= maxPages) result.add(page)\n }\n }\n\n return result\n}\n"]}
@@ -1,5 +1,5 @@
1
1
  "use strict";Object.defineProperty(exports, "__esModule", {value: true}); function _nullishCoalesce(lhs, rhsFn) { if (lhs != null) { return lhs; } else { return rhsFn(); } } function _optionalChain(ops) { let lastAccessLHS = undefined; let value = ops[0]; let i = 1; while (i < ops.length) { const op = ops[i]; const fn = ops[i + 1]; i += 2; if ((op === 'optionalAccess' || op === 'optionalCall') && value == null) { return undefined; } if (op === 'access' || op === 'optionalAccess') { lastAccessLHS = value; value = fn(value); } else if (op === 'call' || op === 'optionalCall') { value = fn((...args) => value.call(lastAccessLHS, ...args)); lastAccessLHS = undefined; } } return value; }// src/utils.ts
2
- var VERSION = true ? "2.9.1" : "0.0.0-dev";
2
+ var VERSION = true ? "3.0.1" : "0.0.0-dev";
3
3
  function toArrayBuffer(buf) {
4
4
  if (buf.byteOffset === 0 && buf.byteLength === buf.buffer.byteLength) {
5
5
  return buf.buffer;
@@ -88,6 +88,145 @@ function classifyError(err) {
88
88
  return "PARSE_ERROR";
89
89
  }
90
90
 
91
+ // src/shared/pua.ts
92
+ var BMP_SYMBOL_MAP = {
93
+ // 도형/기호
94
+ 108: "\u25CF",
95
+ // ●
96
+ 109: "\u25CF",
97
+ // ● (그림자 원 근사)
98
+ 110: "\u25A0",
99
+ // ■
100
+ 111: "\u25A1",
101
+ // □
102
+ 112: "\u25A1",
103
+ // □ (굵은 흰 사각 근사)
104
+ 113: "\u25A1",
105
+ // □ (그림자 근사)
106
+ 114: "\u25A1",
107
+ // □ (그림자 근사)
108
+ 115: "\u2B27",
109
+ // ⬧
110
+ 116: "\u29EB",
111
+ // ⧫
112
+ 117: "\u25C6",
113
+ // ◆
114
+ 118: "\u2756",
115
+ // ❖
116
+ 119: "\u2B25",
117
+ // ⬥
118
+ // 체크/별/점
119
+ 158: "\xB7",
120
+ // ·
121
+ 159: "\u2022",
122
+ // •
123
+ 160: "\xB7",
124
+ // · (한컴 PDF 정답지 정합 — ▪ 아님)
125
+ 161: "\u26AA",
126
+ // ⚪
127
+ 162: "\u25CB",
128
+ // ○
129
+ 163: "\u25CB",
130
+ // ○
131
+ 164: "\u25C9",
132
+ // ◉
133
+ 165: "\u25CE",
134
+ // ◎
135
+ 167: "\u25AA",
136
+ // ▪
137
+ 168: "\u25FB",
138
+ // ◻
139
+ 170: "\u2726",
140
+ // ✦
141
+ 171: "\u2605",
142
+ // ★
143
+ 172: "\u2736",
144
+ // ✶
145
+ 173: "\u2734",
146
+ // ✴
147
+ 174: "\u2739",
148
+ // ✹
149
+ // 손 모양
150
+ 69: "\u261C",
151
+ // ☜
152
+ 70: "\u261E",
153
+ // ☞
154
+ 71: "\u261D",
155
+ // ☝
156
+ 72: "\u261F",
157
+ // ☟
158
+ // 체크마크
159
+ 251: "\u2717",
160
+ // ✗
161
+ 252: "\u2714",
162
+ // ✔
163
+ 253: "\u2612",
164
+ // ☒
165
+ 254: "\u2611",
166
+ // ☑
167
+ // 화살표
168
+ 232: "\u2794",
169
+ // ➔ (heavy wide-headed — 한컴 PDF 정답지 정합)
170
+ 239: "\u21E6",
171
+ // ⇦
172
+ 240: "\u21E8",
173
+ // ⇨
174
+ 241: "\u21E7",
175
+ // ⇧
176
+ 242: "\u21E9",
177
+ // ⇩
178
+ // 기타
179
+ 34: "\u2702",
180
+ // ✂
181
+ 54: "\u231B",
182
+ // ⌛
183
+ 74: "\u263A",
184
+ // ☺
185
+ 78: "\u2620",
186
+ // ☠
187
+ 82: "\u263C",
188
+ // ☼
189
+ 84: "\u2744",
190
+ // ❄
191
+ 88: "\u2720",
192
+ // ✠
193
+ 89: "\u2721"
194
+ // ✡
195
+ };
196
+ var SUPPLEMENTARY_MAP = {
197
+ 983099: "\u2193",
198
+ // ↓
199
+ 983791: "\xB7",
200
+ // ·
201
+ 985172: "\u300A",
202
+ // 《
203
+ 985173: "\u300B",
204
+ // 》
205
+ 983258: "\u25B8",
206
+ // ▸
207
+ 985103: "\u2501",
208
+ // ━
209
+ 985127: "\u25A0"
210
+ // ■
211
+ };
212
+ function mapPuaChar(code) {
213
+ if (code >= 61472 && code <= 61695) {
214
+ return BMP_SYMBOL_MAP[code - 61440];
215
+ }
216
+ if (code >= 983040 && code <= 985599) {
217
+ return SUPPLEMENTARY_MAP[code];
218
+ }
219
+ return void 0;
220
+ }
221
+ function mapPuaText(text) {
222
+ let out = "";
223
+ for (const ch of text) {
224
+ const code = ch.codePointAt(0);
225
+ out += _nullishCoalesce(mapPuaChar(code), () => ( ch));
226
+ }
227
+ return out;
228
+ }
229
+
91
230
  // src/table/builder.ts
92
231
  var MAX_COLS = 200;
93
232
  var MAX_ROWS = 1e4;
@@ -196,7 +335,7 @@ function escapeGfm(text) {
196
335
  }
197
336
  var HWP_SHAPE_ALT_TEXT_RE = /(?:모서리가 둥근 |둥근 )?(?:사각형|직사각형|정사각형|원|타원|삼각형|이등변 삼각형|직각 삼각형|선|직선|곡선|화살표|굵은 화살표|이중 화살표|오각형|육각형|팔각형|별|[4-8]점별|십자|십자형|구름|구름형|마름모|도넛|평행사변형|사다리꼴|부채꼴|호|반원|물결|번개|하트|빗금|블록 화살표|수식|표|그림|개체|그리기\s?개체|묶음\s?개체|글상자|수식\s?개체|OLE\s?개체)\s?입니다\.?/g;
198
337
  function sanitizeText(text) {
199
- let result = text.replace(/[\u{F0000}-\u{FFFFD}]/gu, "").replace(HWP_SHAPE_ALT_TEXT_RE, "").replace(/ +/g, " ").trim();
338
+ let result = mapPuaText(text).replace(/[\u{F0000}-\u{FFFFD}]/gu, "").replace(HWP_SHAPE_ALT_TEXT_RE, "").replace(/ +/g, " ").trim();
200
339
  if (result.length <= 30 && result.includes(" ")) {
201
340
  const tokens = result.split(" ");
202
341
  const koreanSingleCharCount = tokens.filter((t) => t.length === 1 && /[\uAC00-\uD7AF\u3131-\u318E]/.test(t)).length;
@@ -228,7 +367,7 @@ function flattenLayoutTables(blocks) {
228
367
  totalTextLen += t.length;
229
368
  }
230
369
  }
231
- if (totalNewlines > 5 || numRows <= 2 && totalTextLen > 300) {
370
+ if (numCols < 4 && (totalNewlines > 5 || numRows <= 2 && totalTextLen > 300)) {
232
371
  for (let r = 0; r < numRows; r++) {
233
372
  for (let c = 0; c < numCols; c++) {
234
373
  const cellText = _optionalChain([cells, 'access', _9 => _9[r], 'optionalAccess', _10 => _10[c], 'optionalAccess', _11 => _11.text, 'optionalAccess', _12 => _12.trim, 'call', _13 => _13()]);
@@ -308,6 +447,10 @@ function blocksToMarkdown(blocks) {
308
447
  if (lines.length > 0 && lines[lines.length - 1] !== "") {
309
448
  lines.push("");
310
449
  }
450
+ if (block.table.caption) {
451
+ const caption = sanitizeText(block.table.caption);
452
+ if (caption) lines.push(`**${escapeGfm(caption)}**`, "");
453
+ }
311
454
  const tableMd = tableToMarkdown(block.table);
312
455
  if (tableMd) {
313
456
  lines.push(tableMd);
@@ -325,6 +468,28 @@ function hasMergedCells(table) {
325
468
  }
326
469
  return false;
327
470
  }
471
+ function hasNestedTables(table) {
472
+ for (const row of table.cells) {
473
+ for (const cell of row) {
474
+ if (_optionalChain([cell, 'access', _15 => _15.blocks, 'optionalAccess', _16 => _16.some, 'call', _17 => _17((b) => b.type === "table" && b.table)])) return true;
475
+ }
476
+ }
477
+ return false;
478
+ }
479
+ function cellInnerHtml(cell) {
480
+ if (_optionalChain([cell, 'access', _18 => _18.blocks, 'optionalAccess', _19 => _19.length])) {
481
+ return cell.blocks.map((b) => {
482
+ if (b.type === "table" && b.table) {
483
+ const cap = b.table.caption ? sanitizeText(b.table.caption) : "";
484
+ return (cap ? cap + "<br>" : "") + tableToHtml(b.table);
485
+ }
486
+ if (b.type === "image" && b.text) return `<img src="${b.text}" alt="image">`;
487
+ const t = sanitizeText(_nullishCoalesce(b.text, () => ( "")));
488
+ return t ? t.replace(/\n/g, "<br>") : "";
489
+ }).filter(Boolean).join("<br>");
490
+ }
491
+ return sanitizeText(cell.text).replace(/\n/g, "<br>");
492
+ }
328
493
  function containsInlineMath(text) {
329
494
  return /(^|[^\\])\$(?=\S)(?:\\.|[^$\n])+?\S\$/.test(text);
330
495
  }
@@ -345,7 +510,7 @@ function tableToHtml(table) {
345
510
  const rowHtml = [];
346
511
  for (let c = 0; c < numCols; c++) {
347
512
  if (skip.has(`${r},${c}`)) continue;
348
- const cell = _optionalChain([cells, 'access', _15 => _15[r], 'optionalAccess', _16 => _16[c]]);
513
+ const cell = _optionalChain([cells, 'access', _20 => _20[r], 'optionalAccess', _21 => _21[c]]);
349
514
  if (!cell) continue;
350
515
  for (let dr = 0; dr < cell.rowSpan; dr++) {
351
516
  for (let dc = 0; dc < cell.colSpan; dc++) {
@@ -353,7 +518,7 @@ function tableToHtml(table) {
353
518
  if (r + dr < numRows && c + dc < numCols) skip.add(`${r + dr},${c + dc}`);
354
519
  }
355
520
  }
356
- const text = sanitizeText(cell.text).replace(/\n/g, "<br>");
521
+ const text = cellInnerHtml(cell);
357
522
  const attrs = [];
358
523
  if (cell.colSpan > 1) attrs.push(`colspan="${cell.colSpan}"`);
359
524
  if (cell.rowSpan > 1) attrs.push(`rowspan="${cell.rowSpan}"`);
@@ -368,7 +533,9 @@ function tableToHtml(table) {
368
533
  function tableToMarkdown(table) {
369
534
  if (table.rows === 0 || table.cols === 0) return "";
370
535
  const { cells, rows: numRows, cols: numCols } = table;
371
- if (hasMergedCells(table) && !tableContainsInlineMath(table)) return tableToHtml(table);
536
+ if ((hasMergedCells(table) || hasNestedTables(table)) && !tableContainsInlineMath(table)) {
537
+ return tableToHtml(table);
538
+ }
372
539
  if (numRows === 1 && numCols === 1) {
373
540
  const content = sanitizeText(cells[0][0].text);
374
541
  if (!content) return "";
@@ -388,7 +555,7 @@ function tableToMarkdown(table) {
388
555
  for (let r = 0; r < numRows; r++) {
389
556
  for (let c = 0; c < numCols; c++) {
390
557
  if (skip.has(`${r},${c}`)) continue;
391
- const cell = _optionalChain([cells, 'access', _17 => _17[r], 'optionalAccess', _18 => _18[c]]);
558
+ const cell = _optionalChain([cells, 'access', _22 => _22[r], 'optionalAccess', _23 => _23[c]]);
392
559
  if (!cell) continue;
393
560
  display[r][c] = escapeGfm(sanitizeText(cell.text)).replace(/\|/g, "\\|").replace(/\n/g, "<br>");
394
561
  for (let dr = 0; dr < cell.rowSpan; dr++) {
@@ -403,7 +570,7 @@ function tableToMarkdown(table) {
403
570
  }
404
571
  }
405
572
  const uniqueRows = [];
406
- let pendingFirstCol = "";
573
+ let pendingLabelRow = null;
407
574
  for (let r = 0; r < display.length; r++) {
408
575
  const row = display[r];
409
576
  const isEmptyPlaceholder = row.every((cell) => cell === "");
@@ -411,17 +578,18 @@ function tableToMarkdown(table) {
411
578
  const nonEmptyCols = row.filter((cell) => cell !== "");
412
579
  const hasSkipInRow = row.some((_, c) => skip.has(`${r},${c}`));
413
580
  if (!hasSkipInRow && nonEmptyCols.length === 1 && row[0] !== "" && row.slice(1).every((c) => c === "")) {
414
- pendingFirstCol = row[0];
581
+ if (pendingLabelRow) uniqueRows.push(pendingLabelRow);
582
+ pendingLabelRow = row;
415
583
  continue;
416
584
  }
417
- if (pendingFirstCol && row[0] === "") {
418
- row[0] = pendingFirstCol;
419
- pendingFirstCol = "";
420
- } else {
421
- pendingFirstCol = "";
585
+ if (pendingLabelRow) {
586
+ if (row[0] === "") row[0] = pendingLabelRow[0];
587
+ else uniqueRows.push(pendingLabelRow);
588
+ pendingLabelRow = null;
422
589
  }
423
590
  uniqueRows.push(row);
424
591
  }
592
+ if (pendingLabelRow) uniqueRows.push(pendingLabelRow);
425
593
  if (uniqueRows.length === 0) return "";
426
594
  const md = [];
427
595
  md.push("| " + uniqueRows[0].join(" | ") + " |");
@@ -457,5 +625,6 @@ var HEADING_RATIO_H3 = 1.15;
457
625
 
458
626
 
459
627
 
460
- exports.VERSION = VERSION; exports.toArrayBuffer = toArrayBuffer; exports.KordocError = KordocError; exports.isPathTraversal = isPathTraversal; exports.precheckZipSize = precheckZipSize; exports.stripDtd = stripDtd; exports.sanitizeHref = sanitizeHref; exports.safeMin = safeMin; exports.safeMax = safeMax; exports.classifyError = classifyError; exports.MAX_COLS = MAX_COLS; exports.MAX_ROWS = MAX_ROWS; exports.buildTable = buildTable; exports.convertTableToText = convertTableToText; exports.flattenLayoutTables = flattenLayoutTables; exports.blocksToMarkdown = blocksToMarkdown; exports.HEADING_RATIO_H1 = HEADING_RATIO_H1; exports.HEADING_RATIO_H2 = HEADING_RATIO_H2; exports.HEADING_RATIO_H3 = HEADING_RATIO_H3;
461
- //# sourceMappingURL=chunk-FWAXCTSX.cjs.map
628
+
629
+ exports.VERSION = VERSION; exports.toArrayBuffer = toArrayBuffer; exports.KordocError = KordocError; exports.isPathTraversal = isPathTraversal; exports.precheckZipSize = precheckZipSize; exports.stripDtd = stripDtd; exports.sanitizeHref = sanitizeHref; exports.safeMin = safeMin; exports.safeMax = safeMax; exports.classifyError = classifyError; exports.mapPuaText = mapPuaText; exports.MAX_COLS = MAX_COLS; exports.MAX_ROWS = MAX_ROWS; exports.buildTable = buildTable; exports.convertTableToText = convertTableToText; exports.flattenLayoutTables = flattenLayoutTables; exports.blocksToMarkdown = blocksToMarkdown; exports.HEADING_RATIO_H1 = HEADING_RATIO_H1; exports.HEADING_RATIO_H2 = HEADING_RATIO_H2; exports.HEADING_RATIO_H3 = HEADING_RATIO_H3;
630
+ //# sourceMappingURL=chunk-NBJB6TJB.cjs.map
@@ -0,0 +1 @@
1
+ {"version":3,"sources":["/Users/chris_gomdori/workspace/kordoc/dist/chunk-NBJB6TJB.cjs","../src/utils.ts","../src/shared/pua.ts","../src/table/builder.ts","../src/types.ts"],"names":[],"mappings":"AAAA;ACIO,IAAM,QAAA,EAAkB,KAAA,EAA4C,QAAA,EAAqB,WAAA;AAOzF,SAAS,aAAA,CAAc,GAAA,EAA0B;AACtD,EAAA,GAAA,CAAI,GAAA,CAAI,WAAA,IAAe,EAAA,GAAK,GAAA,CAAI,WAAA,IAAe,GAAA,CAAI,MAAA,CAAO,UAAA,EAAY;AACpE,IAAA,OAAO,GAAA,CAAI,MAAA;AAAA,EACb;AACA,EAAA,OAAO,GAAA,CAAI,MAAA,CAAO,KAAA,CAAM,GAAA,CAAI,UAAA,EAAY,GAAA,CAAI,WAAA,EAAa,GAAA,CAAI,UAAU,CAAA;AACzE;AAMO,IAAM,YAAA,EAAN,MAAA,QAA0B,MAAM;AAAA,EACrC,WAAA,CAAY,OAAA,EAAiB;AAC3B,IAAA,KAAA,CAAM,OAAO,CAAA;AACb,IAAA,IAAA,CAAK,KAAA,EAAO,aAAA;AAAA,EACd;AACF,CAAA;AAeO,SAAS,eAAA,CAAgB,IAAA,EAAuB;AACrD,EAAA,GAAA,CAAI,IAAA,CAAK,QAAA,CAAS,IAAM,CAAA,EAAG,OAAO,IAAA;AAClC,EAAA,MAAM,WAAA,EAAa,IAAA,CAAK,OAAA,CAAQ,KAAA,EAAO,GAAG,CAAA;AAC1C,EAAA,MAAM,SAAA,EAAW,UAAA,CAAW,KAAA,CAAM,GAAG,CAAA;AACrC,EAAA,OAAO,QAAA,CAAS,IAAA,CAAK,CAAA,CAAA,EAAA,GAAK,EAAA,IAAM,IAAI,EAAA,GAAK,UAAA,CAAW,UAAA,CAAW,GAAG,EAAA,GAAK,YAAA,CAAa,IAAA,CAAK,UAAU,CAAA;AACrG;AAQO,SAAS,eAAA,CACd,MAAA,EACA,oBAAA,EAAsB,IAAA,EAAM,KAAA,EAAO,IAAA,EACnC,WAAA,EAAa,GAAA,EACsC;AACnD,EAAA,IAAI;AACF,IAAA,MAAM,KAAA,EAAO,IAAI,QAAA,CAAS,MAAM,CAAA;AAChC,IAAA,MAAM,IAAA,EAAM,MAAA,CAAO,UAAA;AAEnB,IAAA,IAAI,WAAA,EAAa,CAAA,CAAA;AACjB,IAAA,IAAA,CAAA,IAAS,EAAA,EAAI,IAAA,EAAM,EAAA,EAAI,EAAA,GAAK,IAAA,CAAK,GAAA,CAAI,CAAA,EAAG,IAAA,EAAM,KAAK,CAAA,EAAG,CAAA,EAAA,EAAK;AACzD,MAAA,GAAA,CAAI,IAAA,CAAK,SAAA,CAAU,CAAA,EAAG,IAAI,EAAA,IAAM,SAAA,EAAY;AAAE,QAAA,WAAA,EAAa,CAAA;AAAG,QAAA,KAAA;AAAA,MAAM;AAAA,IACtE;AACA,IAAA,GAAA,CAAI,WAAA,EAAa,CAAA,EAAG,OAAO,EAAE,iBAAA,EAAmB,CAAA,EAAG,UAAA,EAAY,EAAE,CAAA;AAEjE,IAAA,MAAM,WAAA,EAAa,IAAA,CAAK,SAAA,CAAU,WAAA,EAAa,EAAA,EAAI,IAAI,CAAA;AACvD,IAAA,GAAA,CAAI,WAAA,EAAa,UAAA,EAAY;AAC3B,MAAA,MAAM,IAAI,WAAA,CAAY,CAAA,4CAAA,EAAiB,UAAU,CAAA,eAAA,EAAQ,UAAU,CAAA,CAAA,CAAG,CAAA;AAAA,IACxE;AAEA,IAAA,MAAM,OAAA,EAAS,IAAA,CAAK,SAAA,CAAU,WAAA,EAAa,EAAA,EAAI,IAAI,CAAA;AACnD,IAAA,MAAM,SAAA,EAAW,IAAA,CAAK,SAAA,CAAU,WAAA,EAAa,EAAA,EAAI,IAAI,CAAA;AACrD,IAAA,GAAA,CAAI,SAAA,EAAW,OAAA,EAAS,GAAA,EAAK,OAAO,EAAE,iBAAA,EAAmB,CAAA,EAAG,WAAW,CAAA;AAEvE,IAAA,IAAI,kBAAA,EAAoB,CAAA;AACxB,IAAA,IAAI,IAAA,EAAM,QAAA;AACV,IAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,WAAA,GAAc,IAAA,EAAM,GAAA,GAAM,SAAA,EAAW,MAAA,EAAQ,CAAA,EAAA,EAAK;AACpE,MAAA,GAAA,CAAI,IAAA,CAAK,SAAA,CAAU,GAAA,EAAK,IAAI,EAAA,IAAM,QAAA,EAAY,KAAA;AAC9C,MAAA,kBAAA,GAAqB,IAAA,CAAK,SAAA,CAAU,IAAA,EAAM,EAAA,EAAI,IAAI,CAAA;AAClD,MAAA,MAAM,QAAA,EAAU,IAAA,CAAK,SAAA,CAAU,IAAA,EAAM,EAAA,EAAI,IAAI,CAAA;AAC7C,MAAA,MAAM,SAAA,EAAW,IAAA,CAAK,SAAA,CAAU,IAAA,EAAM,EAAA,EAAI,IAAI,CAAA;AAC9C,MAAA,MAAM,WAAA,EAAa,IAAA,CAAK,SAAA,CAAU,IAAA,EAAM,EAAA,EAAI,IAAI,CAAA;AAChD,MAAA,IAAA,GAAO,GAAA,EAAK,QAAA,EAAU,SAAA,EAAW,UAAA;AAAA,IACnC;AAEA,IAAA,GAAA,CAAI,kBAAA,EAAoB,mBAAA,EAAqB;AAC3C,MAAA,MAAM,IAAI,WAAA,CAAY,CAAA,kDAAA,EAAA,CAAmB,kBAAA,EAAoB,KAAA,EAAO,IAAA,CAAA,CAAM,OAAA,CAAQ,CAAC,CAAC,CAAA,iBAAA,EAAU,oBAAA,EAAsB,KAAA,EAAO,IAAI,CAAA,GAAA,CAAK,CAAA;AAAA,IACtI;AAEA,IAAA,OAAO,EAAE,iBAAA,EAAmB,WAAW,CAAA;AAAA,EACzC,EAAA,MAAA,CAAS,GAAA,EAAK;AACZ,IAAA,GAAA,CAAI,IAAA,WAAe,WAAA,EAAa,MAAM,GAAA;AACtC,IAAA,OAAO,EAAE,iBAAA,EAAmB,CAAA,EAAG,UAAA,EAAY,EAAE,CAAA;AAAA,EAC/C;AACF;AAGO,SAAS,QAAA,CAAS,GAAA,EAAqB;AAC5C,EAAA,OAAO,GAAA,CAAI,OAAA,CAAQ,wCAAA,EAA0C,EAAE,CAAA;AACjE;AAGA,IAAM,aAAA,EAAe,8BAAA;AACd,SAAS,YAAA,CAAa,IAAA,EAA6B;AACxD,EAAA,MAAM,QAAA,EAAU,IAAA,CAAK,IAAA,CAAK,CAAA;AAC1B,EAAA,GAAA,CAAI,CAAC,QAAA,GAAW,CAAC,YAAA,CAAa,IAAA,CAAK,OAAO,CAAA,EAAG,OAAO,IAAA;AACpD,EAAA,OAAO,OAAA;AACT;AAKO,SAAS,OAAA,CAAQ,GAAA,EAAuB;AAC7C,EAAA,IAAI,IAAA,EAAM,QAAA;AACV,EAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,GAAA,CAAI,MAAA,EAAQ,CAAA,EAAA,EAAK,GAAA,CAAI,GAAA,CAAI,CAAC,EAAA,EAAI,GAAA,EAAK,IAAA,EAAM,GAAA,CAAI,CAAC,CAAA;AAClE,EAAA,OAAO,GAAA;AACT;AAGO,SAAS,OAAA,CAAQ,GAAA,EAAuB;AAC7C,EAAA,IAAI,IAAA,EAAM,CAAA,QAAA;AACV,EAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,GAAA,CAAI,MAAA,EAAQ,CAAA,EAAA,EAAK,GAAA,CAAI,GAAA,CAAI,CAAC,EAAA,EAAI,GAAA,EAAK,IAAA,EAAM,GAAA,CAAI,CAAC,CAAA;AAClE,EAAA,OAAO,GAAA;AACT;AAOO,SAAS,aAAA,CAAc,GAAA,EAAyB;AACrD,EAAA,GAAA,CAAI,CAAA,CAAE,IAAA,WAAe,KAAA,CAAA,EAAQ,OAAO,aAAA;AACpC,EAAA,MAAM,IAAA,EAAM,GAAA,CAAI,OAAA;AAChB,EAAA,GAAA,CAAI,GAAA,CAAI,QAAA,CAAS,oBAAK,CAAA,EAAG,OAAO,WAAA;AAChC,EAAA,GAAA,CAAI,GAAA,CAAI,QAAA,CAAS,KAAK,CAAA,EAAG,OAAO,eAAA;AAChC,EAAA,GAAA,CAAI,GAAA,CAAI,QAAA,CAAS,UAAU,EAAA,GAAK,GAAA,CAAI,QAAA,CAAS,kDAAe,EAAA,GAAK,GAAA,CAAI,QAAA,CAAS,4CAAc,CAAA,EAAG,OAAO,UAAA;AACtG,EAAA,GAAA,CAAI,GAAA,CAAI,QAAA,CAAS,MAAM,EAAA,GAAK,GAAA,CAAI,QAAA,CAAS,2BAAO,EAAA,GAAK,GAAA,CAAI,QAAA,CAAS,2BAAO,CAAA,EAAG,OAAO,oBAAA;AACnF,EAAA,GAAA,CAAI,GAAA,CAAI,QAAA,CAAS,iCAAQ,CAAA,EAAG,OAAO,iBAAA;AACnC,EAAA,GAAA,CAAI,GAAA,CAAI,QAAA,CAAS,cAAI,EAAA,GAAA,CAAM,GAAA,CAAI,QAAA,CAAS,4BAAQ,EAAA,GAAK,GAAA,CAAI,QAAA,CAAS,cAAI,CAAA,CAAA,EAAI,OAAO,aAAA;AACjF,EAAA,GAAA,CAAI,GAAA,CAAI,QAAA,CAAS,0BAAM,EAAA,GAAK,GAAA,CAAI,QAAA,CAAS,kCAAS,CAAA,EAAG,OAAO,WAAA;AAC5D,EAAA,OAAO,aAAA;AACT;ADzDA;AACA;AE9EA,IAAM,eAAA,EAAyC;AAAA;AAAA,EAE7C,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA;AAAA,EAEN,GAAA,EAAM,MAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,MAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA;AAAA,EAEN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA;AAAA,EAEN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA;AAAA,EAEN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA,EACN,GAAA,EAAM,QAAA;AAAA;AAAA;AAAA,EAEN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM,QAAA;AAAA;AAAA,EACN,EAAA,EAAM;AAAA;AACR,CAAA;AAGA,IAAM,kBAAA,EAA4C;AAAA,EAChD,MAAA,EAAS,QAAA;AAAA;AAAA,EACT,MAAA,EAAS,MAAA;AAAA;AAAA,EACT,MAAA,EAAS,QAAA;AAAA;AAAA,EACT,MAAA,EAAS,QAAA;AAAA;AAAA,EACT,MAAA,EAAS,QAAA;AAAA;AAAA,EACT,MAAA,EAAS,QAAA;AAAA;AAAA,EACT,MAAA,EAAS;AAAA;AACX,CAAA;AAGO,SAAS,UAAA,CAAW,IAAA,EAAkC;AAC3D,EAAA,GAAA,CAAI,KAAA,GAAQ,MAAA,GAAU,KAAA,GAAQ,KAAA,EAAQ;AACpC,IAAA,OAAO,cAAA,CAAe,KAAA,EAAO,KAAM,CAAA;AAAA,EACrC;AACA,EAAA,GAAA,CAAI,KAAA,GAAQ,OAAA,GAAW,KAAA,GAAQ,MAAA,EAAS;AACtC,IAAA,OAAO,iBAAA,CAAkB,IAAI,CAAA;AAAA,EAC/B;AACA,EAAA,OAAO,KAAA,CAAA;AACT;AAYO,SAAS,UAAA,CAAW,IAAA,EAAsB;AAC/C,EAAA,IAAI,IAAA,EAAM,EAAA;AACV,EAAA,IAAA,CAAA,MAAW,GAAA,GAAM,IAAA,EAAM;AACrB,IAAA,MAAM,KAAA,EAAO,EAAA,CAAG,WAAA,CAAY,CAAC,CAAA;AAC7B,IAAA,IAAA,oBAAO,UAAA,CAAW,IAAI,CAAA,UAAK,IAAA;AAAA,EAC7B;AACA,EAAA,OAAO,GAAA;AACT;AFwHA;AACA;AG9NO,IAAM,SAAA,EAAW,GAAA;AAEjB,IAAM,SAAA,EAAW,GAAA;AAEjB,SAAS,UAAA,CAAW,IAAA,EAAgC;AACzD,EAAA,GAAA,CAAI,IAAA,CAAK,OAAA,EAAS,QAAA,EAAU,KAAA,EAAO,IAAA,CAAK,KAAA,CAAM,CAAA,EAAG,QAAQ,CAAA;AACzD,EAAA,MAAM,QAAA,EAAU,IAAA,CAAK,MAAA;AAGrB,EAAA,MAAM,QAAA,EAAU,IAAA,CAAK,IAAA,CAAK,CAAA,GAAA,EAAA,GAAO,GAAA,CAAI,IAAA,CAAK,CAAA,CAAA,EAAA,GAAK,CAAA,CAAE,QAAA,IAAY,KAAA,EAAA,GAAa,CAAA,CAAE,QAAA,IAAY,KAAA,CAAS,CAAC,CAAA;AAClG,EAAA,GAAA,CAAI,OAAA,EAAS,OAAO,gBAAA,CAAiB,IAAA,EAAM,OAAO,CAAA;AAGlD,EAAA,IAAI,QAAA,EAAU,CAAA;AACd,EAAA,MAAM,aAAA,EAA4B,KAAA,CAAM,IAAA,CAAK,EAAE,MAAA,EAAQ,QAAQ,CAAA,EAAG,CAAA,EAAA,GAAM,CAAC,CAAC,CAAA;AAE1E,EAAA,IAAA,CAAA,IAAS,OAAA,EAAS,CAAA,EAAG,OAAA,EAAS,OAAA,EAAS,MAAA,EAAA,EAAU;AAC/C,IAAA,IAAI,OAAA,EAAS,CAAA;AACb,IAAA,IAAA,CAAA,MAAW,KAAA,GAAQ,IAAA,CAAK,MAAM,CAAA,EAAG;AAC/B,MAAA,MAAA,CAAO,OAAA,EAAS,SAAA,GAAY,YAAA,CAAa,MAAM,CAAA,CAAE,MAAM,CAAA,EAAG,MAAA,EAAA;AAC1D,MAAA,GAAA,CAAI,OAAA,GAAU,QAAA,EAAU,KAAA;AAExB,MAAA,IAAA,CAAA,IAAS,EAAA,EAAI,MAAA,EAAQ,EAAA,EAAI,IAAA,CAAK,GAAA,CAAI,OAAA,EAAS,IAAA,CAAK,OAAA,EAAS,OAAO,CAAA,EAAG,CAAA,EAAA,EAAK;AACtE,QAAA,IAAA,CAAA,IAAS,EAAA,EAAI,MAAA,EAAQ,EAAA,EAAI,IAAA,CAAK,GAAA,CAAI,OAAA,EAAS,IAAA,CAAK,OAAA,EAAS,QAAQ,CAAA,EAAG,CAAA,EAAA,EAAK;AACvE,UAAA,YAAA,CAAa,CAAC,CAAA,CAAE,CAAC,EAAA,EAAI,IAAA;AAAA,QACvB;AAAA,MACF;AACA,MAAA,OAAA,GAAU,IAAA,CAAK,OAAA;AACf,MAAA,GAAA,CAAI,OAAA,EAAS,OAAA,EAAS,QAAA,EAAU,MAAA;AAAA,IAClC;AAAA,EACF;AAEA,EAAA,GAAA,CAAI,QAAA,IAAY,CAAA,EAAG,OAAO,EAAE,IAAA,EAAM,CAAA,EAAG,IAAA,EAAM,CAAA,EAAG,KAAA,EAAO,CAAC,CAAA,EAAG,SAAA,EAAW,MAAM,CAAA;AAG1E,EAAA,MAAM,KAAA,EAAmB,KAAA,CAAM,IAAA;AAAA,IAAK,EAAE,MAAA,EAAQ,QAAQ,CAAA;AAAA,IAAG,CAAA,EAAA,GACvD,KAAA,CAAM,IAAA,CAAK,EAAE,MAAA,EAAQ,QAAQ,CAAA,EAAG,CAAA,EAAA,GAAA,CAAO,EAAE,IAAA,EAAM,EAAA,EAAI,OAAA,EAAS,CAAA,EAAG,OAAA,EAAS,EAAE,CAAA,CAAE;AAAA,EAC9E,CAAA;AACA,EAAA,MAAM,SAAA,EAAwB,KAAA,CAAM,IAAA,CAAK,EAAE,MAAA,EAAQ,QAAQ,CAAA,EAAG,CAAA,EAAA,GAAM,KAAA,CAAM,OAAO,CAAA,CAAE,IAAA,CAAK,KAAK,CAAC,CAAA;AAE9F,EAAA,IAAA,CAAA,IAAS,OAAA,EAAS,CAAA,EAAG,OAAA,EAAS,OAAA,EAAS,MAAA,EAAA,EAAU;AAC/C,IAAA,IAAI,OAAA,EAAS,CAAA;AACb,IAAA,IAAI,QAAA,EAAU,CAAA;AAEd,IAAA,MAAA,CAAO,OAAA,EAAS,QAAA,GAAW,QAAA,EAAU,IAAA,CAAK,MAAM,CAAA,CAAE,MAAA,EAAQ;AACxD,MAAA,MAAA,CAAO,OAAA,EAAS,QAAA,GAAW,QAAA,CAAS,MAAM,CAAA,CAAE,MAAM,CAAA,EAAG,MAAA,EAAA;AACrD,MAAA,GAAA,CAAI,OAAA,GAAU,OAAA,EAAS,KAAA;AAEvB,MAAA,MAAM,KAAA,EAAO,IAAA,CAAK,MAAM,CAAA,CAAE,OAAO,CAAA;AACjC,MAAA,IAAA,CAAK,MAAM,CAAA,CAAE,MAAM,EAAA,EAAI;AAAA,QACrB,IAAA,EAAM,IAAA,CAAK,IAAA,CAAK,IAAA,CAAK,CAAA;AAAA,QACrB,OAAA,EAAS,IAAA,CAAK,OAAA;AAAA,QACd,OAAA,EAAS,IAAA,CAAK;AAAA,MAChB,CAAA;AAEA,MAAA,IAAA,CAAA,IAAS,EAAA,EAAI,MAAA,EAAQ,EAAA,EAAI,IAAA,CAAK,GAAA,CAAI,OAAA,EAAS,IAAA,CAAK,OAAA,EAAS,OAAO,CAAA,EAAG,CAAA,EAAA,EAAK;AACtE,QAAA,IAAA,CAAA,IAAS,EAAA,EAAI,MAAA,EAAQ,EAAA,EAAI,IAAA,CAAK,GAAA,CAAI,OAAA,EAAS,IAAA,CAAK,OAAA,EAAS,OAAO,CAAA,EAAG,CAAA,EAAA,EAAK;AACtE,UAAA,QAAA,CAAS,CAAC,CAAA,CAAE,CAAC,EAAA,EAAI,IAAA;AAAA,QACnB;AAAA,MACF;AAEA,MAAA,OAAA,GAAU,IAAA,CAAK,OAAA;AACf,MAAA,OAAA,EAAA;AAAA,IACF;AAAA,EACF;AAEA,EAAA,OAAO,aAAA,CAAc,IAAA,EAAM,OAAA,EAAS,OAAO,CAAA;AAC7C;AAGA,SAAS,gBAAA,CAAiB,IAAA,EAAuB,OAAA,EAA0B;AAEzE,EAAA,IAAI,QAAA,EAAU,CAAA;AACd,EAAA,IAAA,CAAA,MAAW,IAAA,GAAO,IAAA,EAAM;AACtB,IAAA,IAAA,CAAA,MAAW,KAAA,GAAQ,GAAA,EAAK;AACtB,MAAA,MAAM,IAAA,EAAA,kBAAO,IAAA,CAAK,OAAA,UAAW,GAAA,EAAA,EAAK,IAAA,CAAK,OAAA;AACvC,MAAA,GAAA,CAAI,IAAA,EAAM,OAAA,EAAS,QAAA,EAAU,GAAA;AAAA,IAC/B;AAAA,EACF;AACA,EAAA,GAAA,CAAI,QAAA,EAAU,QAAA,EAAU,QAAA,EAAU,QAAA;AAClC,EAAA,GAAA,CAAI,QAAA,IAAY,CAAA,EAAG,OAAO,EAAE,IAAA,EAAM,CAAA,EAAG,IAAA,EAAM,CAAA,EAAG,KAAA,EAAO,CAAC,CAAA,EAAG,SAAA,EAAW,MAAM,CAAA;AAE1E,EAAA,MAAM,KAAA,EAAmB,KAAA,CAAM,IAAA;AAAA,IAAK,EAAE,MAAA,EAAQ,QAAQ,CAAA;AAAA,IAAG,CAAA,EAAA,GACvD,KAAA,CAAM,IAAA,CAAK,EAAE,MAAA,EAAQ,QAAQ,CAAA,EAAG,CAAA,EAAA,GAAA,CAAO,EAAE,IAAA,EAAM,EAAA,EAAI,OAAA,EAAS,CAAA,EAAG,OAAA,EAAS,EAAE,CAAA,CAAE;AAAA,EAC9E,CAAA;AAEA,EAAA,IAAA,CAAA,MAAW,IAAA,GAAO,IAAA,EAAM;AACtB,IAAA,IAAA,CAAA,MAAW,KAAA,GAAQ,GAAA,EAAK;AACtB,MAAA,MAAM,EAAA,mBAAI,IAAA,CAAK,OAAA,UAAW,GAAA;AAC1B,MAAA,MAAM,EAAA,mBAAI,IAAA,CAAK,OAAA,UAAW,GAAA;AAC1B,MAAA,GAAA,CAAI,EAAA,GAAK,QAAA,GAAW,EAAA,GAAK,QAAA,GAAW,EAAA,EAAI,EAAA,GAAK,EAAA,EAAI,CAAA,EAAG,QAAA;AAEpD,MAAA,IAAA,CAAK,CAAC,CAAA,CAAE,CAAC,EAAA,EAAI,EAAE,IAAA,EAAM,IAAA,CAAK,IAAA,CAAK,IAAA,CAAK,CAAA,EAAG,OAAA,EAAS,IAAA,CAAK,OAAA,EAAS,OAAA,EAAS,IAAA,CAAK,QAAQ,CAAA;AAGpF,MAAA,IAAA,CAAA,IAAS,GAAA,EAAK,CAAA,EAAG,GAAA,EAAK,IAAA,CAAK,OAAA,EAAS,EAAA,EAAA,EAAM;AACxC,QAAA,IAAA,CAAA,IAAS,GAAA,EAAK,CAAA,EAAG,GAAA,EAAK,IAAA,CAAK,OAAA,EAAS,EAAA,EAAA,EAAM;AACxC,UAAA,GAAA,CAAI,GAAA,IAAO,EAAA,GAAK,GAAA,IAAO,CAAA,EAAG,QAAA;AAC1B,UAAA,GAAA,CAAI,EAAA,EAAI,GAAA,EAAK,QAAA,GAAW,EAAA,EAAI,GAAA,EAAK,OAAA,EAAS;AACxC,YAAA,IAAA,CAAK,EAAA,EAAI,EAAE,CAAA,CAAE,EAAA,EAAI,EAAE,EAAA,EAAI,EAAE,IAAA,EAAM,EAAA,EAAI,OAAA,EAAS,CAAA,EAAG,OAAA,EAAS,EAAE,CAAA;AAAA,UAC5D;AAAA,QACF;AAAA,MACF;AAAA,IACF;AAAA,EACF;AAEA,EAAA,OAAO,aAAA,CAAc,IAAA,EAAM,OAAA,EAAS,OAAO,CAAA;AAC7C;AAGA,SAAS,aAAA,CAAc,IAAA,EAAkB,OAAA,EAAiB,OAAA,EAA0B;AAClF,EAAA,IAAI,cAAA,EAAgB,OAAA;AACpB,EAAA,MAAA,CAAO,cAAA,EAAgB,CAAA,EAAG;AACxB,IAAA,MAAM,SAAA,EAAW,IAAA,CAAK,KAAA,CAAM,CAAA,GAAA,EAAA,GAAO,iBAAC,GAAA,qBAAI,cAAA,EAAgB,CAAC,CAAA,6BAAG,IAAA,6BAAM,IAAA,mBAAK,GAAC,CAAA;AACxE,IAAA,GAAA,CAAI,CAAC,QAAA,EAAU,KAAA;AACf,IAAA,aAAA,EAAA;AAAA,EACF;AACA,EAAA,GAAA,CAAI,cAAA,EAAgB,QAAA,GAAW,cAAA,EAAgB,CAAA,EAAG;AAChD,IAAA,MAAM,QAAA,EAAU,IAAA,CAAK,GAAA,CAAI,CAAA,GAAA,EAAA,GAAO,GAAA,CAAI,KAAA,CAAM,CAAA,EAAG,aAAa,CAAC,CAAA;AAC3D,IAAA,OAAO,EAAE,IAAA,EAAM,OAAA,EAAS,IAAA,EAAM,aAAA,EAAe,KAAA,EAAO,OAAA,EAAS,SAAA,EAAW,QAAA,EAAU,EAAE,CAAA;AAAA,EACtF;AACA,EAAA,OAAO,EAAE,IAAA,EAAM,OAAA,EAAS,IAAA,EAAM,OAAA,EAAS,KAAA,EAAO,IAAA,EAAM,SAAA,EAAW,QAAA,EAAU,EAAE,CAAA;AAC7E;AAEO,SAAS,kBAAA,CAAmB,IAAA,EAA+B;AAChE,EAAA,OAAO,IAAA,CACJ,GAAA;AAAA,IAAI,CAAA,GAAA,EAAA,GACH,GAAA,CACG,GAAA,CAAI,CAAA,CAAA,EAAA,GAAK,CAAA,CAAE,IAAA,CAAK,IAAA,CAAK,CAAA,CAAE,OAAA,CAAQ,KAAA,EAAO,GAAG,CAAA,CAAE,OAAA,CAAQ,KAAA,EAAO,KAAK,CAAC,CAAA,CAChE,MAAA,CAAO,OAAO,CAAA,CACd,IAAA,CAAK,KAAK;AAAA,EACf,CAAA,CACC,MAAA,CAAO,OAAO,CAAA,CACd,IAAA,CAAK,IAAI,CAAA;AACd;AAGA,SAAS,SAAA,CAAU,IAAA,EAAsB;AAEvC,EAAA,OAAO,IAAA,CAAK,OAAA,CAAQ,IAAA,EAAM,KAAK,CAAA;AACjC;AAGA,IAAM,sBAAA,EAAwB,mOAAA;AAG9B,SAAS,YAAA,CAAa,IAAA,EAAsB;AAE1C,EAAA,IAAI,OAAA,EAAS,UAAA,CAAW,IAAI,CAAA,CAEzB,OAAA,CAAQ,yBAAA,EAA2B,EAAE,CAAA,CAErC,OAAA,CAAQ,qBAAA,EAAuB,EAAE,CAAA,CACjC,OAAA,CAAQ,MAAA,EAAQ,GAAG,CAAA,CACnB,IAAA,CAAK,CAAA;AAGR,EAAA,GAAA,CAAI,MAAA,CAAO,OAAA,GAAU,GAAA,GAAM,MAAA,CAAO,QAAA,CAAS,GAAG,CAAA,EAAG;AAC/C,IAAA,MAAM,OAAA,EAAS,MAAA,CAAO,KAAA,CAAM,GAAG,CAAA;AAE/B,IAAA,MAAM,sBAAA,EAAwB,MAAA,CAAO,MAAA,CAAO,CAAA,CAAA,EAAA,GAAK,CAAA,CAAE,OAAA,IAAW,EAAA,GAAK,8BAAA,CAA+B,IAAA,CAAK,CAAC,CAAC,CAAA,CAAE,MAAA;AAC3G,IAAA,GAAA,CAAI,MAAA,CAAO,OAAA,GAAU,EAAA,GAAK,sBAAA,EAAwB,MAAA,CAAO,OAAA,GAAU,GAAA,EAAK;AACtE,MAAA,OAAA,EAAS,MAAA,CAAO,IAAA,CAAK,EAAE,CAAA;AAAA,IACzB;AAAA,EACF;AACA,EAAA,OAAO,MAAA;AACT;AAOO,SAAS,mBAAA,CAAoB,MAAA,EAA8B;AAChE,EAAA,MAAM,OAAA,EAAoB,CAAC,CAAA;AAE3B,EAAA,IAAA,CAAA,MAAW,MAAA,GAAS,MAAA,EAAQ;AAC1B,IAAA,GAAA,CAAI,KAAA,CAAM,KAAA,IAAS,QAAA,GAAW,CAAC,KAAA,CAAM,KAAA,EAAO;AAC1C,MAAA,MAAA,CAAO,IAAA,CAAK,KAAK,CAAA;AACjB,MAAA,QAAA;AAAA,IACF;AAEA,IAAA,MAAM,EAAE,IAAA,EAAM,OAAA,EAAS,IAAA,EAAM,OAAA,EAAS,MAAM,EAAA,EAAI,KAAA,CAAM,KAAA;AAGtD,IAAA,GAAA,CAAI,QAAA,IAAY,EAAA,GAAK,QAAA,IAAY,CAAA,EAAG;AAClC,MAAA,MAAA,CAAO,IAAA,CAAK,KAAK,CAAA;AACjB,MAAA,QAAA;AAAA,IACF;AAGA,IAAA,GAAA,CAAI,QAAA,GAAW,CAAA,EAAG;AAChB,MAAA,IAAI,cAAA,EAAgB,CAAA;AACpB,MAAA,IAAI,aAAA,EAAe,CAAA;AACnB,MAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,OAAA,EAAS,CAAA,EAAA,EAAK;AAChC,QAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,OAAA,EAAS,CAAA,EAAA,EAAK;AAChC,UAAA,MAAM,EAAA,kBAAI,KAAA,qBAAM,CAAC,CAAA,4BAAA,CAAI,CAAC,CAAA,6BAAG,OAAA,GAAQ,EAAA;AACjC,UAAA,cAAA,GAAA,CAAkB,CAAA,CAAE,KAAA,CAAM,KAAK,EAAA,GAAK,CAAC,CAAA,CAAA,CAAG,MAAA;AACxC,UAAA,aAAA,GAAgB,CAAA,CAAE,MAAA;AAAA,QACpB;AAAA,MACF;AAKA,MAAA,GAAA,CAAI,QAAA,EAAU,EAAA,GAAA,CAAM,cAAA,EAAgB,EAAA,GAAM,QAAA,GAAW,EAAA,GAAK,aAAA,EAAe,GAAA,CAAA,EAAO;AAE9E,QAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,OAAA,EAAS,CAAA,EAAA,EAAK;AAChC,UAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,OAAA,EAAS,CAAA,EAAA,EAAK;AAChC,YAAA,MAAM,SAAA,kBAAW,KAAA,qBAAM,CAAC,CAAA,8BAAA,CAAI,CAAC,CAAA,+BAAG,IAAA,+BAAM,IAAA,qBAAK,GAAA;AAC3C,YAAA,GAAA,CAAI,CAAC,QAAA,EAAU,QAAA;AAEf,YAAA,IAAA,CAAA,MAAW,KAAA,GAAQ,QAAA,CAAS,KAAA,CAAM,IAAI,CAAA,EAAG;AACvC,cAAA,MAAM,QAAA,EAAU,IAAA,CAAK,IAAA,CAAK,CAAA;AAC1B,cAAA,GAAA,CAAI,CAAC,OAAA,EAAS,QAAA;AACd,cAAA,MAAA,CAAO,IAAA,CAAK,EAAE,IAAA,EAAM,WAAA,EAAa,IAAA,EAAM,OAAA,EAAS,UAAA,EAAY,KAAA,CAAM,WAAW,CAAC,CAAA;AAAA,YAChF;AAAA,UACF;AAAA,QACF;AACA,QAAA,QAAA;AAAA,MACF;AAAA,IACF;AAEA,IAAA,MAAA,CAAO,IAAA,CAAK,KAAK,CAAA;AAAA,EACnB;AAEA,EAAA,OAAO,MAAA;AACT;AAEO,SAAS,gBAAA,CAAiB,MAAA,EAA2B;AAC1D,EAAA,MAAM,MAAA,EAAkB,CAAC,CAAA;AAEzB,EAAA,IAAA,CAAA,IAAS,EAAA,EAAI,CAAA,EAAG,EAAA,EAAI,MAAA,CAAO,MAAA,EAAQ,CAAA,EAAA,EAAK;AACtC,IAAA,MAAM,MAAA,EAAQ,MAAA,CAAO,CAAC,CAAA;AAGtB,IAAA,GAAA,CAAI,KAAA,CAAM,KAAA,IAAS,UAAA,GAAa,KAAA,CAAM,IAAA,EAAM;AAC1C,MAAA,MAAM,OAAA,EAAS,GAAA,CAAI,MAAA,CAAO,IAAA,CAAK,GAAA,CAAI,KAAA,CAAM,MAAA,GAAS,CAAA,EAAG,CAAC,CAAC,CAAA;AACvD,MAAA,MAAM,YAAA,EAAc,YAAA,CAAa,KAAA,CAAM,IAAI,CAAA;AAC3C,MAAA,GAAA,CAAI,WAAA,EAAa,KAAA,CAAM,IAAA,CAAK,EAAA,EAAI,CAAA,EAAA;AAChC,MAAA;AACF,IAAA;AAG8B,IAAA;AACK,MAAA;AACjC,MAAA;AACF,IAAA;AAGgC,IAAA;AACN,MAAA;AACxB,MAAA;AACF,IAAA;AAGmC,IAAA;AACH,MAAA;AACf,MAAA;AAEe,MAAA;AACG,MAAA;AACA,MAAA;AACb,MAAA;AACQ,QAAA;AACE,UAAA;AACC,UAAA;AAC7B,QAAA;AACF,MAAA;AACA,MAAA;AACF,IAAA;AAEkC,IAAA;AACF,MAAA;AACnB,MAAA;AAGmB,MAAA;AACE,QAAA;AACN,QAAA;AACO,UAAA;AAC7B,UAAA;AACK,QAAA;AACwB,UAAA;AAC/B,QAAA;AACA,QAAA;AACF,MAAA;AAE+B,MAAA;AACH,QAAA;AAC1B,QAAA;AACF,MAAA;AAGgB,MAAA;AACY,QAAA;AACI,QAAA;AAChC,MAAA;AAGwB,MAAA;AACA,QAAA;AACxB,MAAA;AAE8B,MAAA;AACN,IAAA;AAEM,MAAA;AACf,QAAA;AACf,MAAA;AAEyB,MAAA;AACM,QAAA;AACA,QAAA;AAC/B,MAAA;AACgC,MAAA;AACnB,MAAA;AACO,QAAA;AACL,QAAA;AACf,MAAA;AACF,IAAA;AACF,EAAA;AAE6B,EAAA;AAC/B;AAGiD;AAChB,EAAA;AACL,IAAA;AACO,MAAA;AAC/B,IAAA;AACF,EAAA;AACO,EAAA;AACT;AAGkD;AACjB,EAAA;AACL,IAAA;AACO,MAAA;AAC/B,IAAA;AACF,EAAA;AACO,EAAA;AACT;AAG6C;AAClB,EAAA;AAEX,IAAA;AACoB,MAAA;AAEI,QAAA;AACD,QAAA;AAC/B,MAAA;AACkC,MAAA;AACD,MAAA;AACL,MAAA;AAGlB,IAAA;AAChB,EAAA;AAC+B,EAAA;AACjC;AAEmD;AAC1C,EAAA;AACT;AAEiC;AACA,EAAA;AACL,IAAA;AACU,MAAA;AAClC,IAAA;AACF,EAAA;AACO,EAAA;AACT;AAG6C;AACP,EAAA;AACP,EAAA;AACK,EAAA;AAEA,EAAA;AACH,IAAA;AACF,IAAA;AACO,IAAA;AACL,MAAA;AACF,MAAA;AACd,MAAA;AAGgB,MAAA;AACE,QAAA;AACC,UAAA;AACE,UAAA;AAC9B,QAAA;AACF,MAAA;AAE+B,MAAA;AACN,MAAA;AACQ,MAAA;AACA,MAAA;AACF,MAAA;AACD,MAAA;AAChC,IAAA;AAC+B,IAAA;AACjC,EAAA;AAEqB,EAAA;AACC,EAAA;AACxB;AAEiD;AACjB,EAAA;AAEM,EAAA;AAIN,EAAA;AACJ,IAAA;AAC1B,EAAA;AAGoC,EAAA;AACC,IAAA;AACd,IAAA;AAGd,IAAA;AACuB,MAAA;AACL,MAAA;AACS,MAAA;AACE,MAAA;AACR,MAAA;AAGhB,IAAA;AACd,EAAA;AAGmC,EAAA;AAEnB,IAAA;AAGhB,EAAA;AAGiD,EAAA;AACpB,EAAA;AAEK,EAAA;AACE,IAAA;AACL,MAAA;AACF,MAAA;AACd,MAAA;AACe,MAAA;AAGC,MAAA;AACE,QAAA;AACC,UAAA;AACE,UAAA;AACA,YAAA;AAC5B,UAAA;AACF,QAAA;AACF,MAAA;AAEoB,MAAA;AACtB,IAAA;AACF,EAAA;AAMgC,EAAA;AACO,EAAA;AACH,EAAA;AACb,IAAA;AACU,IAAA;AACP,IAAA;AAIQ,IAAA;AACE,IAAA;AACA,IAAA;AACA,MAAA;AACd,MAAA;AAClB,MAAA;AACF,IAAA;AAGqB,IAAA;AACS,MAAA;AACP,MAAA;AACH,MAAA;AACpB,IAAA;AACmB,IAAA;AACrB,EAAA;AACqC,EAAA;AAED,EAAA;AAEd,EAAA;AACY,EAAA;AACD,EAAA;AACF,EAAA;AACK,IAAA;AACpC,EAAA;AACmB,EAAA;AACrB;AH8EuC;AACA;AI/NP;AACA;AACA;AJiOO;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA;AACA","file":"/Users/chris_gomdori/workspace/kordoc/dist/chunk-NBJB6TJB.cjs","sourcesContent":[null,"/** kordoc 공용 유틸리티 */\n\n/** 빌드 타임에 tsup define으로 주입되는 버전 */\ndeclare const __KORDOC_VERSION__: string\nexport const VERSION: string = typeof __KORDOC_VERSION__ !== \"undefined\" ? __KORDOC_VERSION__ : \"0.0.0-dev\"\n\n/**\n * Node.js Buffer → ArrayBuffer 변환\n * pool Buffer의 공유 ArrayBuffer 문제를 안전하게 처리.\n * offset=0이고 전체 ArrayBuffer를 차지하면 복사 없이 직접 반환.\n */\nexport function toArrayBuffer(buf: Buffer): ArrayBuffer {\n if (buf.byteOffset === 0 && buf.byteLength === buf.buffer.byteLength) {\n return buf.buffer as ArrayBuffer\n }\n return buf.buffer.slice(buf.byteOffset, buf.byteOffset + buf.byteLength) as ArrayBuffer\n}\n\n/**\n * kordoc 내부 에러 클래스 — 사용자에게 노출해도 안전한 메시지만 포함.\n * MCP 에러 정제에서 instanceof로 판별하여 allowlist 패턴 매칭 없이 안전하게 통과.\n */\nexport class KordocError extends Error {\n constructor(message: string) {\n super(message)\n this.name = \"KordocError\"\n }\n}\n\n/**\n * 에러 메시지 정제 — KordocError는 그대로, 나머지는 일반 메시지로 대체.\n * 파일시스템 경로, 스택 트레이스 등 내부 정보 노출 방지.\n */\nexport function sanitizeError(err: unknown): string {\n if (err instanceof KordocError) return err.message\n return \"문서 처리 중 오류가 발생했습니다\"\n}\n\n/**\n * ZIP 엔트리 경로의 경로 순회 여부 판별.\n * 백슬래시 정규화, .., 절대경로, Windows 드라이브 문자 모두 차단.\n */\nexport function isPathTraversal(name: string): boolean {\n if (name.includes(\"\\x00\")) return true\n const normalized = name.replace(/\\\\/g, \"/\")\n const segments = normalized.split(\"/\")\n return segments.some(s => s === \"..\") || normalized.startsWith(\"/\") || /^[A-Za-z]:/.test(normalized)\n}\n\n// ─── ZIP 안전 로딩 (ZIP bomb 방지) ────────────────────\n\n/**\n * ZIP bomb 사전 검사 — Central Directory에서 비압축 합계와 엔트리 수 확인.\n * HWPX/XLSX/DOCX 등 모든 ZIP 기반 포맷에서 공통 사용.\n */\nexport function precheckZipSize(\n buffer: ArrayBuffer,\n maxUncompressedSize = 100 * 1024 * 1024,\n maxEntries = 500,\n): { totalUncompressed: number; entryCount: number } {\n try {\n const data = new DataView(buffer)\n const len = buffer.byteLength\n // EOCD 시그니처 역방향 스캔\n let eocdOffset = -1\n for (let i = len - 22; i >= Math.max(0, len - 65557); i--) {\n if (data.getUint32(i, true) === 0x06054b50) { eocdOffset = i; break }\n }\n if (eocdOffset < 0) return { totalUncompressed: 0, entryCount: 0 }\n\n const entryCount = data.getUint16(eocdOffset + 10, true)\n if (entryCount > maxEntries) {\n throw new KordocError(`ZIP 엔트리 수 초과: ${entryCount} (최대 ${maxEntries})`)\n }\n\n const cdSize = data.getUint32(eocdOffset + 12, true)\n const cdOffset = data.getUint32(eocdOffset + 16, true)\n if (cdOffset + cdSize > len) return { totalUncompressed: 0, entryCount }\n\n let totalUncompressed = 0\n let pos = cdOffset\n for (let i = 0; i < entryCount && pos + 46 <= cdOffset + cdSize; i++) {\n if (data.getUint32(pos, true) !== 0x02014b50) break\n totalUncompressed += data.getUint32(pos + 24, true)\n const nameLen = data.getUint16(pos + 28, true)\n const extraLen = data.getUint16(pos + 30, true)\n const commentLen = data.getUint16(pos + 32, true)\n pos += 46 + nameLen + extraLen + commentLen\n }\n\n if (totalUncompressed > maxUncompressedSize) {\n throw new KordocError(`ZIP 비압축 크기 초과: ${(totalUncompressed / 1024 / 1024).toFixed(1)}MB (최대 ${maxUncompressedSize / 1024 / 1024}MB)`)\n }\n\n return { totalUncompressed, entryCount }\n } catch (err) {\n if (err instanceof KordocError) throw err\n return { totalUncompressed: 0, entryCount: 0 }\n }\n}\n\n/** XXE/Billion Laughs 방지 — DOCTYPE 제거 (내부 DTD 서브셋 포함) */\nexport function stripDtd(xml: string): string {\n return xml.replace(/<!DOCTYPE\\s[^[>]*(\\[[\\s\\S]*?\\])?\\s*>/gi, \"\")\n}\n\n/** 하이퍼링크 URL 살균 — javascript: 등 XSS 위험 스킴 차단 */\nconst SAFE_HREF_RE = /^(?:https?:|mailto:|tel:|#)/i\nexport function sanitizeHref(href: string): string | null {\n const trimmed = href.trim()\n if (!trimmed || !SAFE_HREF_RE.test(trimmed)) return null\n return trimmed\n}\n\n// ─── 안전한 min/max (스택 오버플로 방지) ─────────────\n\n/** Math.min(...arr) 대체 — 대형 배열에서 스택 오버플로 방지 */\nexport function safeMin(arr: number[]): number {\n let min = Infinity\n for (let i = 0; i < arr.length; i++) if (arr[i] < min) min = arr[i]\n return min\n}\n\n/** Math.max(...arr) 대체 — 대형 배열에서 스택 오버플로 방지 */\nexport function safeMax(arr: number[]): number {\n let max = -Infinity\n for (let i = 0; i < arr.length; i++) if (arr[i] > max) max = arr[i]\n return max\n}\n\n// ─── 에러 분류 ──────────────────────────────────────\n\nimport type { ErrorCode } from \"./types.js\"\n\n/** 에러를 구조화된 ErrorCode로 분류 — KordocError 메시지 패턴 매칭 */\nexport function classifyError(err: unknown): ErrorCode {\n if (!(err instanceof Error)) return \"PARSE_ERROR\"\n const msg = err.message\n if (msg.includes(\"암호화\")) return \"ENCRYPTED\"\n if (msg.includes(\"DRM\")) return \"DRM_PROTECTED\"\n if (msg.includes(\"ZIP bomb\") || msg.includes(\"ZIP 비압축 크기 초과\") || msg.includes(\"ZIP 엔트리 수 초과\")) return \"ZIP_BOMB\"\n if (msg.includes(\"bomb\") || msg.includes(\"크기 초과\") || msg.includes(\"압축 해제\")) return \"DECOMPRESSION_BOMB\"\n if (msg.includes(\"이미지 기반\")) return \"IMAGE_BASED_PDF\"\n if (msg.includes(\"섹션\") && (msg.includes(\"찾을 수 없\") || msg.includes(\"없음\"))) return \"NO_SECTIONS\"\n if (msg.includes(\"시그니처\") || msg.includes(\"복구할 수 없\")) return \"CORRUPTED\"\n return \"PARSE_ERROR\"\n}\n","/**\n * 한컴 PUA(Private Use Area) 문자 → 유니코드 표준 문자 매핑.\n *\n * 한글(HWP)은 글머리표·문자표 기호를 Symbol/Wingdings 계열 PUA 코드포인트\n * (U+F020~U+F0FF)와 한컴 자체 Supplementary PUA-A 영역(U+F0000대)에 저장한다.\n * 매핑 없이 마크다운에 내보내면 빈 네모로 깨진다.\n *\n * 매핑 출처: rhwp (MIT, https://github.com/edwardkim/rhwp)\n * paragraph_layout.rs map_pua_bullet_char — 한컴 PDF 정답지 시각 검증 테이블.\n */\n\n/** BMP Symbol 영역 (U+F020~U+F0FF) 매핑 — 키는 (code - 0xF000) */\nconst BMP_SYMBOL_MAP: Record<number, string> = {\n // 도형/기호\n 0x6c: \"●\", // ●\n 0x6d: \"●\", // ● (그림자 원 근사)\n 0x6e: \"■\", // ■\n 0x6f: \"□\", // □\n 0x70: \"□\", // □ (굵은 흰 사각 근사)\n 0x71: \"□\", // □ (그림자 근사)\n 0x72: \"□\", // □ (그림자 근사)\n 0x73: \"⬧\", // ⬧\n 0x74: \"⧫\", // ⧫\n 0x75: \"◆\", // ◆\n 0x76: \"❖\", // ❖\n 0x77: \"⬥\", // ⬥\n // 체크/별/점\n 0x9e: \"·\", // ·\n 0x9f: \"•\", // •\n 0xa0: \"·\", // · (한컴 PDF 정답지 정합 — ▪ 아님)\n 0xa1: \"⚪\", // ⚪\n 0xa2: \"○\", // ○\n 0xa3: \"○\", // ○\n 0xa4: \"◉\", // ◉\n 0xa5: \"◎\", // ◎\n 0xa7: \"▪\", // ▪\n 0xa8: \"◻\", // ◻\n 0xaa: \"✦\", // ✦\n 0xab: \"★\", // ★\n 0xac: \"✶\", // ✶\n 0xad: \"✴\", // ✴\n 0xae: \"✹\", // ✹\n // 손 모양\n 0x45: \"☜\", // ☜\n 0x46: \"☞\", // ☞\n 0x47: \"☝\", // ☝\n 0x48: \"☟\", // ☟\n // 체크마크\n 0xfb: \"✗\", // ✗\n 0xfc: \"✔\", // ✔\n 0xfd: \"☒\", // ☒\n 0xfe: \"☑\", // ☑\n // 화살표\n 0xe8: \"➔\", // ➔ (heavy wide-headed — 한컴 PDF 정답지 정합)\n 0xef: \"⇦\", // ⇦\n 0xf0: \"⇨\", // ⇨\n 0xf1: \"⇧\", // ⇧\n 0xf2: \"⇩\", // ⇩\n // 기타\n 0x22: \"✂\", // ✂\n 0x36: \"⌛\", // ⌛\n 0x4a: \"☺\", // ☺\n 0x4e: \"☠\", // ☠\n 0x52: \"☼\", // ☼\n 0x54: \"❄\", // ❄\n 0x58: \"✠\", // ✠\n 0x59: \"✡\", // ✡\n}\n\n/** Supplementary PUA-A (U+F0000대) — 한컴 자체 영역 매핑 */\nconst SUPPLEMENTARY_MAP: Record<number, string> = {\n 0xf003b: \"↓\", // ↓\n 0xf02ef: \"·\", // ·\n 0xf0854: \"《\", // 《\n 0xf0855: \"》\", // 》\n 0xf00da: \"▸\", // ▸\n 0xf080f: \"━\", // ━\n 0xf0827: \"■\", // ■\n}\n\n/** 단일 코드포인트 매핑 — 매핑 없으면 원본 유지 */\nexport function mapPuaChar(code: number): string | undefined {\n if (code >= 0xf020 && code <= 0xf0ff) {\n return BMP_SYMBOL_MAP[code - 0xf000]\n }\n if (code >= 0xf0000 && code <= 0xf09ff) {\n return SUPPLEMENTARY_MAP[code]\n }\n return undefined\n}\n\n/** BMP PUA 영역 여부 (U+E000~U+F8FF) */\nexport function isBmpPua(code: number): boolean {\n return code >= 0xe000 && code <= 0xf8ff\n}\n\n/**\n * 문자열 내 한컴 PUA 문자를 표준 유니코드로 치환.\n * 매핑 없는 BMP PUA는 원본 유지(옛한글 한양PUA 가능성 — 제거하면 안 됨),\n * 매핑 없는 Supplementary PUA-A는 호출부의 기존 제거 로직에 위임한다.\n */\nexport function mapPuaText(text: string): string {\n let out = \"\"\n for (const ch of text) {\n const code = ch.codePointAt(0)!\n out += mapPuaChar(code) ?? ch\n }\n return out\n}\n","/** 2-pass colSpan/rowSpan 테이블 빌더 및 Markdown 변환 */\n\nimport type { CellContext, IRBlock, IRCell, IRTable } from \"../types.js\"\nimport { sanitizeHref } from \"../utils.js\"\nimport { mapPuaText } from \"../shared/pua.js\"\n\n/** 테이블 열 수 상한 — 한국 공공문서 기준 충분한 값 */\nexport const MAX_COLS = 200\n/** 테이블 행 수 상한 — 메모리 폭주 방지 */\nexport const MAX_ROWS = 10000\n\nexport function buildTable(rows: CellContext[][]): IRTable {\n if (rows.length > MAX_ROWS) rows = rows.slice(0, MAX_ROWS)\n const numRows = rows.length\n\n // colAddr/rowAddr가 있으면 직접 배치 (HWPX cellAddr, HWP5 colAddr/rowAddr)\n const hasAddr = rows.some(row => row.some(c => c.colAddr !== undefined && c.rowAddr !== undefined))\n if (hasAddr) return buildTableDirect(rows, numRows)\n\n // Pass 1: maxCols 계산 — 2D 배열 사용 (동적 확장)\n let maxCols = 0\n const tempOccupied: boolean[][] = Array.from({ length: numRows }, () => [])\n\n for (let rowIdx = 0; rowIdx < numRows; rowIdx++) {\n let colIdx = 0\n for (const cell of rows[rowIdx]) {\n while (colIdx < MAX_COLS && tempOccupied[rowIdx][colIdx]) colIdx++\n if (colIdx >= MAX_COLS) break\n\n for (let r = rowIdx; r < Math.min(rowIdx + cell.rowSpan, numRows); r++) {\n for (let c = colIdx; c < Math.min(colIdx + cell.colSpan, MAX_COLS); c++) {\n tempOccupied[r][c] = true\n }\n }\n colIdx += cell.colSpan\n if (colIdx > maxCols) maxCols = colIdx\n }\n }\n\n if (maxCols === 0) return { rows: 0, cols: 0, cells: [], hasHeader: false }\n\n // Pass 2: 실제 배치\n const grid: IRCell[][] = Array.from({ length: numRows }, () =>\n Array.from({ length: maxCols }, () => ({ text: \"\", colSpan: 1, rowSpan: 1 }))\n )\n const occupied: boolean[][] = Array.from({ length: numRows }, () => Array(maxCols).fill(false))\n\n for (let rowIdx = 0; rowIdx < numRows; rowIdx++) {\n let colIdx = 0\n let cellIdx = 0\n\n while (colIdx < maxCols && cellIdx < rows[rowIdx].length) {\n while (colIdx < maxCols && occupied[rowIdx][colIdx]) colIdx++\n if (colIdx >= maxCols) break\n\n const cell = rows[rowIdx][cellIdx]\n grid[rowIdx][colIdx] = {\n text: cell.text.trim(),\n colSpan: cell.colSpan,\n rowSpan: cell.rowSpan,\n }\n\n for (let r = rowIdx; r < Math.min(rowIdx + cell.rowSpan, numRows); r++) {\n for (let c = colIdx; c < Math.min(colIdx + cell.colSpan, maxCols); c++) {\n occupied[r][c] = true\n }\n }\n\n colIdx += cell.colSpan\n cellIdx++\n }\n }\n\n return trimAndReturn(grid, numRows, maxCols)\n}\n\n/** colAddr/rowAddr 절대 좌표 기반 직접 배치 */\nfunction buildTableDirect(rows: CellContext[][], numRows: number): IRTable {\n // 전체 셀에서 maxCols 계산 (MAX_COLS 상한 적용)\n let maxCols = 0\n for (const row of rows) {\n for (const cell of row) {\n const end = (cell.colAddr ?? 0) + cell.colSpan\n if (end > maxCols) maxCols = end\n }\n }\n if (maxCols > MAX_COLS) maxCols = MAX_COLS\n if (maxCols === 0) return { rows: 0, cols: 0, cells: [], hasHeader: false }\n\n const grid: IRCell[][] = Array.from({ length: numRows }, () =>\n Array.from({ length: maxCols }, () => ({ text: \"\", colSpan: 1, rowSpan: 1 }))\n )\n\n for (const row of rows) {\n for (const cell of row) {\n const r = cell.rowAddr ?? 0\n const c = cell.colAddr ?? 0\n if (r >= numRows || c >= maxCols || r < 0 || c < 0) continue\n\n grid[r][c] = { text: cell.text.trim(), colSpan: cell.colSpan, rowSpan: cell.rowSpan }\n\n // 병합 영역 마킹\n for (let dr = 0; dr < cell.rowSpan; dr++) {\n for (let dc = 0; dc < cell.colSpan; dc++) {\n if (dr === 0 && dc === 0) continue\n if (r + dr < numRows && c + dc < maxCols) {\n grid[r + dr][c + dc] = { text: \"\", colSpan: 1, rowSpan: 1 }\n }\n }\n }\n }\n }\n\n return trimAndReturn(grid, numRows, maxCols)\n}\n\n/** 빈 후행 열 제거 후 IRTable 반환 */\nfunction trimAndReturn(grid: IRCell[][], numRows: number, maxCols: number): IRTable {\n let effectiveCols = maxCols\n while (effectiveCols > 0) {\n const colEmpty = grid.every(row => !row[effectiveCols - 1]?.text?.trim())\n if (!colEmpty) break\n effectiveCols--\n }\n if (effectiveCols < maxCols && effectiveCols > 0) {\n const trimmed = grid.map(row => row.slice(0, effectiveCols))\n return { rows: numRows, cols: effectiveCols, cells: trimmed, hasHeader: numRows > 1 }\n }\n return { rows: numRows, cols: maxCols, cells: grid, hasHeader: numRows > 1 }\n}\n\nexport function convertTableToText(rows: CellContext[][]): string {\n return rows\n .map(row =>\n row\n .map(c => c.text.trim().replace(/\\n/g, \" \").replace(/\\|/g, \"\\\\|\"))\n .filter(Boolean)\n .join(\" / \")\n )\n .filter(Boolean)\n .join(\"\\n\")\n}\n\n/** 마크다운 GFM 특수문자 이스케이프 — remark-gfm 오해석 방지 */\nfunction escapeGfm(text: string): string {\n // ~ → \\~ (GFM strikethrough 방지)\n return text.replace(/~/g, \"\\\\~\")\n}\n\n/** HWP 자동생성 도형/개체 대체텍스트 정규식 — 한컴오피스가 삽입하는 모든 알려진 패턴 */\nconst HWP_SHAPE_ALT_TEXT_RE = /(?:모서리가 둥근 |둥근 )?(?:사각형|직사각형|정사각형|원|타원|삼각형|이등변 삼각형|직각 삼각형|선|직선|곡선|화살표|굵은 화살표|이중 화살표|오각형|육각형|팔각형|별|[4-8]점별|십자|십자형|구름|구름형|마름모|도넛|평행사변형|사다리꼴|부채꼴|호|반원|물결|번개|하트|빗금|블록 화살표|수식|표|그림|개체|그리기\\s?개체|묶음\\s?개체|글상자|수식\\s?개체|OLE\\s?개체)\\s?입니다\\.?/g\n\n/** HWP PUA 특수문자 및 도형 대체텍스트 제거 — 모든 포맷 공통 */\nfunction sanitizeText(text: string): string {\n // 한컴 PUA → 표준 유니코드 매핑 (rhwp 검증 테이블) — 제거 regex보다 먼저 적용\n let result = mapPuaText(text)\n // Supplementary Private Use Area (U+F0000-U+FFFFD) — HWP 전용 기호 (매핑 안 된 잔여분)\n .replace(/[\\u{F0000}-\\u{FFFFD}]/gu, \"\")\n // HWP 도형/개체 자동생성 대체텍스트 제거\n .replace(HWP_SHAPE_ALT_TEXT_RE, \"\")\n .replace(/ +/g, \" \")\n .trim()\n // 균등배분 스페이스 정리 (\"현 장 대 응 단 장\" → \"현장대응단장\")\n // 짧은 텍스트(30자 이하)에서 70%+ 토큰이 한글 1글자면 균등배분으로 판단\n if (result.length <= 30 && result.includes(\" \")) {\n const tokens = result.split(\" \")\n // 한글 1글자 토큰만 카운트 — ASCII 특수문자(< > & 등)는 균등배분이 아님\n const koreanSingleCharCount = tokens.filter(t => t.length === 1 && /[\\uAC00-\\uD7AF\\u3131-\\u318E]/.test(t)).length\n if (tokens.length >= 3 && koreanSingleCharCount / tokens.length >= 0.7) {\n result = tokens.join(\"\")\n }\n }\n return result\n}\n\n/**\n * 레이아웃 테이블 감지 및 해체 — IRBlock 레벨에서 수행\n * 적은 행(≤3) + 셀 내 줄바꿈 다량 → table 블록을 paragraph 블록들로 분해\n * heading 감지 전에 호출해야 해체된 텍스트에 heading 감지 적용 가능\n */\nexport function flattenLayoutTables(blocks: IRBlock[]): IRBlock[] {\n const result: IRBlock[] = []\n\n for (const block of blocks) {\n if (block.type !== \"table\" || !block.table) {\n result.push(block)\n continue\n }\n\n const { rows: numRows, cols: numCols, cells } = block.table\n\n // 1x1 테이블은 기존 로직(tableToMarkdown)에서 처리\n if (numRows === 1 && numCols === 1) {\n result.push(block)\n continue\n }\n\n // 레이아웃 테이블 휴리스틱\n if (numRows <= 3) {\n let totalNewlines = 0\n let totalTextLen = 0\n for (let r = 0; r < numRows; r++) {\n for (let c = 0; c < numCols; c++) {\n const t = cells[r]?.[c]?.text || \"\"\n totalNewlines += (t.match(/\\n/g) || []).length\n totalTextLen += t.length\n }\n }\n\n // 레이아웃 테이블 판정: 많은 줄바꿈(>5), 또는 적은 행에 비해 총 텍스트 과다(>300)\n // 단, 열이 4개 이상이면 헤더-값 구조의 데이터 표일 가능성이 높아 해체하지 않는다\n // (실증: 2×10 모집프로그램 표가 문단으로 해체되어 헤더↔값 연결 파괴)\n if (numCols < 4 && (totalNewlines > 5 || (numRows <= 2 && totalTextLen > 300))) {\n // 레이아웃 테이블 → 각 셀을 paragraph 블록으로 분해\n for (let r = 0; r < numRows; r++) {\n for (let c = 0; c < numCols; c++) {\n const cellText = cells[r]?.[c]?.text?.trim()\n if (!cellText) continue\n // 셀 내 줄바꿈을 별도 paragraph로 분리\n for (const line of cellText.split(\"\\n\")) {\n const trimmed = line.trim()\n if (!trimmed) continue\n result.push({ type: \"paragraph\", text: trimmed, pageNumber: block.pageNumber })\n }\n }\n }\n continue\n }\n }\n\n result.push(block)\n }\n\n return result\n}\n\nexport function blocksToMarkdown(blocks: IRBlock[]): string {\n const lines: string[] = []\n\n for (let i = 0; i < blocks.length; i++) {\n const block = blocks[i]\n\n // 헤딩 블록\n if (block.type === \"heading\" && block.text) {\n const prefix = \"#\".repeat(Math.min(block.level || 2, 6))\n const headingText = sanitizeText(block.text)\n if (headingText) lines.push(\"\", `${prefix} ${headingText}`, \"\")\n continue\n }\n\n // 이미지 블록 — ![alt](filename) 참조\n if (block.type === \"image\" && block.text) {\n lines.push(\"\", `![image](${block.text})`, \"\")\n continue\n }\n\n // 구분선 블록\n if (block.type === \"separator\") {\n lines.push(\"\", \"---\", \"\")\n continue\n }\n\n // 리스트 블록\n if (block.type === \"list\" && block.text) {\n const listText = sanitizeText(block.text)\n if (!listText) continue\n // 텍스트가 이미 번호로 시작하면 그대로 출력 (원래 번호 보존)\n const alreadyNumbered = block.listType === \"ordered\" && /^\\d+\\.\\s/.test(listText)\n const prefix = alreadyNumbered ? \"\" : block.listType === \"ordered\" ? \"1. \" : \"- \"\n lines.push(`${prefix}${listText}`)\n if (block.children) {\n for (const child of block.children) {\n const childPrefix = child.listType === \"ordered\" ? \"1.\" : \"-\"\n lines.push(` ${childPrefix} ${child.text || \"\"}`)\n }\n }\n continue\n }\n\n if (block.type === \"paragraph\" && block.text) {\n let text = sanitizeText(block.text)\n if (!text) continue\n\n // 별표 패턴 (기존 호환)\n if (/^\\[별표\\s*\\d+/.test(text)) {\n const nextBlock = blocks[i + 1]\n if (nextBlock?.type === \"paragraph\" && nextBlock.text && /관련\\)?$/.test(nextBlock.text)) {\n lines.push(\"\", `## ${text} ${nextBlock.text}`, \"\")\n i++\n } else {\n lines.push(\"\", `## ${text}`, \"\")\n }\n continue\n }\n\n if (/^\\([^)]*조[^)]*관련\\)$/.test(text)) {\n lines.push(`*${text}*`, \"\")\n continue\n }\n\n // 하이퍼링크가 있으면 텍스트에 링크 삽입 (javascript: 등 위험 스킴 제거)\n if (block.href) {\n const href = sanitizeHref(block.href)\n if (href) text = `[${text}](${href})`\n }\n\n // 각주가 있으면 괄호로 인라인 삽입\n if (block.footnoteText) {\n text += ` (주: ${block.footnoteText})`\n }\n\n lines.push(escapeGfm(text), \"\")\n } else if (block.type === \"table\" && block.table) {\n // 테이블 앞에 빈 줄 보장 (마크다운 렌더링 필수)\n if (lines.length > 0 && lines[lines.length - 1] !== \"\") {\n lines.push(\"\")\n }\n // 표 캡션 — 표 위에 강조 문단으로 출력 (v3.0)\n if (block.table.caption) {\n const caption = sanitizeText(block.table.caption)\n if (caption) lines.push(`**${escapeGfm(caption)}**`, \"\")\n }\n const tableMd = tableToMarkdown(block.table)\n if (tableMd) {\n lines.push(tableMd)\n lines.push(\"\")\n }\n }\n }\n\n return lines.join(\"\\n\").trim()\n}\n\n/** 병합 셀 존재 여부 확인 */\nfunction hasMergedCells(table: IRTable): boolean {\n for (const row of table.cells) {\n for (const cell of row) {\n if (cell.colSpan > 1 || cell.rowSpan > 1) return true\n }\n }\n return false\n}\n\n/** 셀 내부에 중첩 표 블록 존재 여부 — v3.0 */\nfunction hasNestedTables(table: IRTable): boolean {\n for (const row of table.cells) {\n for (const cell of row) {\n if (cell.blocks?.some(b => b.type === \"table\" && b.table)) return true\n }\n }\n return false\n}\n\n/** 셀 내부 콘텐츠 → HTML — blocks(중첩표/다중문단) 있으면 구조 보존 재귀 렌더링 */\nfunction cellInnerHtml(cell: IRCell): string {\n if (cell.blocks?.length) {\n return cell.blocks\n .map(b => {\n if (b.type === \"table\" && b.table) {\n // 중첩표 캡션도 보존 — 표 위에 텍스트로\n const cap = b.table.caption ? sanitizeText(b.table.caption) : \"\"\n return (cap ? cap + \"<br>\" : \"\") + tableToHtml(b.table)\n }\n if (b.type === \"image\" && b.text) return `<img src=\"${b.text}\" alt=\"image\">`\n const t = sanitizeText(b.text ?? \"\")\n return t ? t.replace(/\\n/g, \"<br>\") : \"\"\n })\n .filter(Boolean)\n .join(\"<br>\")\n }\n return sanitizeText(cell.text).replace(/\\n/g, \"<br>\")\n}\n\nfunction containsInlineMath(text: string): boolean {\n return /(^|[^\\\\])\\$(?=\\S)(?:\\\\.|[^$\\n])+?\\S\\$/.test(text)\n}\n\nfunction tableContainsInlineMath(table: IRTable): boolean {\n for (const row of table.cells) {\n for (const cell of row) {\n if (containsInlineMath(cell.text)) return true\n }\n }\n return false\n}\n\n/** 병합 테이블 → HTML <table> 출력 (rowspan/colspan 보존) */\nfunction tableToHtml(table: IRTable): string {\n const { cells, rows: numRows, cols: numCols } = table\n const skip = new Set<string>()\n const lines: string[] = [\"<table>\"]\n\n for (let r = 0; r < numRows; r++) {\n const tag = r === 0 ? \"th\" : \"td\"\n const rowHtml: string[] = []\n for (let c = 0; c < numCols; c++) {\n if (skip.has(`${r},${c}`)) continue\n const cell = cells[r]?.[c]\n if (!cell) continue\n\n // 병합 영역 skip 마킹\n for (let dr = 0; dr < cell.rowSpan; dr++) {\n for (let dc = 0; dc < cell.colSpan; dc++) {\n if (dr === 0 && dc === 0) continue\n if (r + dr < numRows && c + dc < numCols) skip.add(`${r + dr},${c + dc}`)\n }\n }\n\n const text = cellInnerHtml(cell)\n const attrs: string[] = []\n if (cell.colSpan > 1) attrs.push(`colspan=\"${cell.colSpan}\"`)\n if (cell.rowSpan > 1) attrs.push(`rowspan=\"${cell.rowSpan}\"`)\n const attrStr = attrs.length ? \" \" + attrs.join(\" \") : \"\"\n rowHtml.push(`<${tag}${attrStr}>${text}</${tag}>`)\n }\n if (rowHtml.length) lines.push(`<tr>${rowHtml.join(\"\")}</tr>`)\n }\n\n lines.push(\"</table>\")\n return lines.join(\"\\n\")\n}\n\nfunction tableToMarkdown(table: IRTable): string {\n if (table.rows === 0 || table.cols === 0) return \"\"\n\n const { cells, rows: numRows, cols: numCols } = table\n\n // 병합 셀·중첩표가 있으면 HTML 테이블로 출력하되, 수식이 있으면 GFM 표로 출력한다.\n // 많은 Markdown 렌더러가 raw HTML table 내부의 $...$를 수식으로 다시 처리하지 않는다.\n if ((hasMergedCells(table) || hasNestedTables(table)) && !tableContainsInlineMath(table)) {\n return tableToHtml(table)\n }\n\n // 1행 1열 → 구조화된 텍스트 (빈 셀이면 스킵)\n if (numRows === 1 && numCols === 1) {\n const content = sanitizeText(cells[0][0].text)\n if (!content) return \"\"\n return content\n .split(/\\n/)\n .map(line => {\n const trimmed = line.trim()\n if (!trimmed) return \"\"\n if (/^\\d+\\.\\s/.test(trimmed)) return `**${escapeGfm(trimmed)}**`\n if (/^[가-힣]\\.\\s/.test(trimmed)) return ` ${escapeGfm(trimmed)}`\n return escapeGfm(trimmed)\n })\n .filter(Boolean)\n .join(\"\\n\")\n }\n\n // 1열 다행 테이블 → 각 행을 별도 라인으로 출력 (목록성 데이터)\n if (numCols === 1 && numRows >= 2) {\n return cells\n .map(row => escapeGfm(sanitizeText(row[0].text)).replace(/\\n/g, \" \"))\n .filter(Boolean)\n .join(\"\\n\")\n }\n\n // 병합 셀: 행/열 병합된 셀은 빈 칸으로\n const display: string[][] = Array.from({ length: numRows }, () => Array(numCols).fill(\"\"))\n const skip = new Set<string>()\n\n for (let r = 0; r < numRows; r++) {\n for (let c = 0; c < numCols; c++) {\n if (skip.has(`${r},${c}`)) continue\n const cell = cells[r]?.[c]\n if (!cell) continue\n display[r][c] = escapeGfm(sanitizeText(cell.text)).replace(/\\|/g, \"\\\\|\").replace(/\\n/g, \"<br>\")\n\n // colSpan/rowSpan: 병합된 열은 빈 칸으로 유지 (텍스트 중복 방지)\n for (let dr = 0; dr < cell.rowSpan; dr++) {\n for (let dc = 0; dc < cell.colSpan; dc++) {\n if (dr === 0 && dc === 0) continue\n if (r + dr < numRows && c + dc < numCols) {\n skip.add(`${r + dr},${c + dc}`)\n }\n }\n }\n // colSpan > 1이면 display 열 인덱스를 건너뜀\n c += cell.colSpan - 1\n }\n }\n\n // rowSpan 잔류 처리:\n // 1) 완전 빈 행 제거\n // 2) \"첫 열만 값, 나머지 빈\" 행 → 다음 데이터 행의 첫 열에 값을 전파\n // 단, colSpan으로 인한 빈 열(skip 셀)은 이 대상이 아님\n const uniqueRows: string[][] = []\n let pendingLabelRow: string[] | null = null\n for (let r = 0; r < display.length; r++) {\n const row = display[r]\n const isEmptyPlaceholder = row.every(cell => cell === \"\")\n if (isEmptyPlaceholder) continue\n\n // 첫 열만 값이 있고 나머지 모두 빈 행 → 다음 데이터 행의 첫 열에 전파\n // 단, colSpan으로 인한 빈 열(skip 셀)은 \"진짜 빈\"이 아니므로 제외\n const nonEmptyCols = row.filter(cell => cell !== \"\")\n const hasSkipInRow = row.some((_, c) => skip.has(`${r},${c}`))\n if (!hasSkipInRow && nonEmptyCols.length === 1 && row[0] !== \"\" && row.slice(1).every(c => c === \"\")) {\n if (pendingLabelRow) uniqueRows.push(pendingLabelRow) // 연속 보류 — 앞 행 소실 방지\n pendingLabelRow = row\n continue\n }\n\n // 보류한 첫 열 값을 현재 행의 빈 첫 열에 전파, 전파 불가면 보류 행 그대로 출력\n if (pendingLabelRow) {\n if (row[0] === \"\") row[0] = pendingLabelRow[0]\n else uniqueRows.push(pendingLabelRow)\n pendingLabelRow = null\n }\n uniqueRows.push(row)\n }\n if (pendingLabelRow) uniqueRows.push(pendingLabelRow) // 표 끝 보류 행 소실 방지\n\n if (uniqueRows.length === 0) return \"\"\n\n const md: string[] = []\n md.push(\"| \" + uniqueRows[0].join(\" | \") + \" |\")\n md.push(\"| \" + uniqueRows[0].map(() => \"---\").join(\" | \") + \" |\")\n for (let i = 1; i < uniqueRows.length; i++) {\n md.push(\"| \" + uniqueRows[i].join(\" | \") + \" |\")\n }\n return md.join(\"\\n\")\n}\n","/** kordoc 공통 타입 정의 */\n\n// ─── 중간 표현 (Intermediate Representation) ─────────\n\nexport interface CellContext {\n text: string\n colSpan: number\n rowSpan: number\n /** HWP5 셀 열 주소 (0-based) — 병합 테이블 배치용 */\n colAddr?: number\n /** HWP5 셀 행 주소 (0-based) — 병합 테이블 배치용 */\n rowAddr?: number\n}\n\n/** 블록 타입 — v2.0에서 heading, list, image, separator 추가 */\nexport type IRBlockType = \"paragraph\" | \"table\" | \"heading\" | \"list\" | \"image\" | \"separator\"\n\nexport interface IRBlock {\n type: IRBlockType\n text?: string\n table?: IRTable\n /** 헤딩 레벨 (1-6), type=\"heading\"일 때 사용 */\n level?: number\n /** 원본 페이지 번호 (1-based) */\n pageNumber?: number\n /** 바운딩 박스 — PDF에서만 제공 */\n bbox?: BoundingBox\n /** 텍스트 스타일 정보 (선택) */\n style?: InlineStyle\n /** 리스트 타입, type=\"list\"일 때 사용 */\n listType?: \"ordered\" | \"unordered\"\n /** 중첩 리스트 아이템 */\n children?: IRBlock[]\n /** 하이퍼링크 URL */\n href?: string\n /** 각주/미주 텍스트 (인라인 삽입용) */\n footnoteText?: string\n /** 이미지 데이터 (type=\"image\"일 때) */\n imageData?: ImageData\n}\n\n/** 추출된 이미지 바이너리 데이터 */\nexport interface ImageData {\n /** 이미지 바이너리 */\n data: Uint8Array\n /** MIME 타입 (image/png, image/jpeg, image/gif, image/bmp, image/wmf, image/emf) */\n mimeType: string\n /** 원본 파일명 (있는 경우) */\n filename?: string\n}\n\n/** 바운딩 박스 — PDF 포인트 단위 (72pt = 1인치) */\nexport interface BoundingBox {\n page: number\n x: number\n y: number\n width: number\n height: number\n}\n\n/** 인라인 텍스트 스타일 */\nexport interface InlineStyle {\n bold?: boolean\n italic?: boolean\n fontSize?: number\n fontName?: string\n}\n\nexport interface IRTable {\n rows: number\n cols: number\n cells: IRCell[][]\n /** 첫 행을 헤더로 렌더링할지 여부 (현재: rows > 1이면 true — 의미적 감지가 아닌 레이아웃 힌트) */\n hasHeader: boolean\n /** 표 캡션 (예: \"표 1. 부서별 예산\") — v3.0 */\n caption?: string\n}\n\nexport interface IRCell {\n text: string\n colSpan: number\n rowSpan: number\n /**\n * 셀 내부 블록 콘텐츠 — v3.0.\n * 중첩 표·이미지·다중 문단을 구조 그대로 보존한다.\n * blocks가 있으면 text는 blocks의 평탄화 텍스트(하위 호환용)다.\n */\n blocks?: IRBlock[]\n /** 제목 셀 여부 (HWP5 width_ref bit2 / HWPX header 속성) — v3.0 */\n isHeader?: boolean\n}\n\n// ─── 메타데이터 ─────────────────────────────────────\n\n/** 문서 메타데이터 — 각 포맷에서 추출 가능한 필드만 채워짐 */\nexport interface DocumentMetadata {\n /** 문서 제목 */\n title?: string\n /** 작성자 */\n author?: string\n /** 작성 프로그램 (예: \"한글 2020\", \"Adobe Acrobat\") */\n creator?: string\n /** 생성일시 (ISO 8601) */\n createdAt?: string\n /** 수정일시 (ISO 8601) */\n modifiedAt?: string\n /** 페이지/섹션 수 */\n pageCount?: number\n /** 문서 포맷 버전 (예: HWP \"5.1.0.1\") */\n version?: string\n /** 설명 */\n description?: string\n /** 키워드 */\n keywords?: string[]\n}\n\n// ─── 파싱 옵션 ──────────────────────────────────────\n\n/** 파싱 옵션 — parse() 함수에 전달 */\nexport interface ParseOptions {\n /**\n * 파싱할 페이지/섹션 범위 (1-based).\n * - 배열: [1, 2, 3]\n * - 문자열: \"1-3\", \"1,3,5-7\"\n *\n * PDF: 정확한 페이지 단위. HWP/HWPX: 섹션 단위 근사치.\n */\n pages?: number[] | string\n /** 이미지 기반 PDF용 OCR 프로바이더 (선택) */\n ocr?: OcrProvider\n /** 진행률 콜백 — current: 현재 페이지/섹션, total: 전체 수 */\n onProgress?: (current: number, total: number) => void\n /** PDF 머리글/바닥글 자동 제거 */\n removeHeaderFooter?: boolean\n /** 원본 파일 경로 (DRM COM fallback에 필요, 내부 전용) */\n filePath?: string\n /**\n * PDF 수식 OCR 활성화 (기본 false).\n *\n * 활성화 시 각 PDF 페이지를 이미지로 렌더링 → YOLOv8 기반 수식 영역 검출 →\n * TrOCR 기반 LaTeX 인식. 감지된 수식은 `$...$` (inline) / `$$...$$` (display) 로\n * 블록 텍스트에 삽입된다.\n *\n * 필수 optional 의존성: `onnxruntime-node`, `@huggingface/transformers`,\n * `@hyzyla/pdfium`, `sharp`. 미설치 시 parse 에 실패하지 않고 **경고만** 남기고\n * 수식 인식은 skip 한다 (일반 텍스트 추출은 정상 동작).\n *\n * 모델(~155MB) 은 첫 사용 시 HuggingFace 에서 자동 다운로드 되어\n * `~/.cache/kordoc/models/pix2text/` 에 SHA-256 검증과 함께 저장된다.\n */\n formulaOcr?: boolean\n}\n\n// ─── 파싱 경고 ──────────────────────────────────────\n\n/** 파싱 중 스킵/실패한 요소 보고 */\nexport interface ParseWarning {\n /** 관련 페이지 번호 (알 수 있는 경우) */\n page?: number\n /** 경고 메시지 */\n message: string\n /** 구조화된 경고 코드 */\n code: WarningCode\n}\n\nexport type WarningCode =\n | \"SKIPPED_IMAGE\"\n | \"SKIPPED_OLE\"\n | \"TRUNCATED_TABLE\"\n | \"OCR_FALLBACK\"\n | \"UNSUPPORTED_ELEMENT\"\n | \"BROKEN_ZIP_RECOVERY\"\n | \"HIDDEN_TEXT_FILTERED\"\n | \"MALFORMED_XML\"\n | \"PARTIAL_PARSE\"\n | \"LENIENT_CFB_RECOVERY\"\n | \"NEEDS_OCR\"\n\n/** 문서 구조 (헤딩 트리) */\nexport interface OutlineItem {\n level: number\n text: string\n pageNumber?: number\n}\n\n// ─── 에러 코드 ──────────────────────────────────────\n\n/** 구조화된 에러 코드 — 프로그래밍적 에러 핸들링용 */\nexport type ErrorCode =\n | \"EMPTY_INPUT\"\n | \"UNSUPPORTED_FORMAT\"\n | \"ENCRYPTED\"\n | \"DRM_PROTECTED\"\n | \"CORRUPTED\"\n | \"DECOMPRESSION_BOMB\"\n | \"ZIP_BOMB\"\n | \"IMAGE_BASED_PDF\"\n | \"NO_SECTIONS\"\n | \"PARSE_ERROR\"\n | \"MISSING_DEPENDENCY\"\n\n// ─── 파싱 결과 (discriminated union) ────────────────\n\nexport type FileType = \"hwpx\" | \"hwp\" | \"hwp3\" | \"hwpml\" | \"pdf\" | \"xlsx\" | \"xls\" | \"docx\" | \"unknown\"\n\ninterface ParseResultBase {\n fileType: FileType\n /** 페이지/섹션 수 — PDF: 실제 페이지 수, HWP/HWPX: 섹션 수, XLSX: 시트 수 */\n pageCount?: number\n /** 이미지 기반 PDF 여부 (텍스트 추출 불가) */\n isImageBased?: boolean\n}\n\nexport interface ParseSuccess extends ParseResultBase {\n success: true\n /** 추출된 마크다운 텍스트 */\n markdown: string\n /** 중간 표현 블록 (구조화된 데이터 접근용) */\n blocks: IRBlock[]\n /** 문서 메타데이터 */\n metadata?: DocumentMetadata\n /** 문서 구조 (헤딩 트리) — v2.0 */\n outline?: OutlineItem[]\n /** 파싱 중 발생한 경고 — v2.0 */\n warnings?: ParseWarning[]\n /** 추출된 이미지 목록 — 마크다운에서 파일명으로 참조됨 */\n images?: ExtractedImage[]\n /** 페이지별 텍스트 품질 신호 — PDF에서만 제공 */\n pageQuality?: PageQuality[]\n /** 문서 단위 품질 요약 — PDF에서만 제공 */\n qualitySummary?: DocumentQualitySummary\n}\n\n/** 페이지별 텍스트 품질 신호 (PDF 전용). 자세한 설명은 src/pdf/quality.ts */\nexport interface PageQuality {\n page: number\n textChars: number\n hangulRatio: number\n controlCharRatio: number\n replacementCharRatio: number\n puaRatio: number\n needsOcr: boolean\n ocrReason?: \"low_text\" | \"high_pua\" | \"high_control\" | \"high_replacement\"\n}\n\n/** 문서 단위 품질 요약 (PDF 전용). */\nexport interface DocumentQualitySummary {\n totalPages: number\n totalTextChars: number\n avgHangulRatio: number\n avgControlCharRatio: number\n avgReplacementCharRatio: number\n avgPuaRatio: number\n lowTextPageCount: number\n highPuaPageCount: number\n needsOcr: boolean\n ocrCandidatePages: number[]\n}\n\n/** 추출된 이미지 — ParseSuccess.images에 포함 */\nexport interface ExtractedImage {\n /** 마크다운에서 참조되는 파일명 (예: image_001.png) */\n filename: string\n /** 이미지 바이너리 */\n data: Uint8Array\n /** MIME 타입 */\n mimeType: string\n}\n\nexport interface ParseFailure extends ParseResultBase {\n success: false\n /** 오류 메시지 */\n error: string\n /** 구조화된 에러 코드 */\n code?: ErrorCode\n}\n\nexport type ParseResult = ParseSuccess | ParseFailure\n\n// ─── 문서 비교 (Diff) ───────────────────────────────\n\nexport type DiffChangeType = \"added\" | \"removed\" | \"modified\" | \"unchanged\"\n\nexport interface BlockDiff {\n type: DiffChangeType\n /** 원본 블록 (added이면 undefined) */\n before?: IRBlock\n /** 변경 후 블록 (removed이면 undefined) */\n after?: IRBlock\n /** modified 테이블의 셀 단위 diff */\n cellDiffs?: CellDiff[][]\n /** 유사도 (0-1) */\n similarity?: number\n}\n\nexport interface CellDiff {\n type: DiffChangeType\n before?: string\n after?: string\n}\n\nexport interface DiffResult {\n stats: { added: number; removed: number; modified: number; unchanged: number }\n diffs: BlockDiff[]\n}\n\n// ─── 라운드트립 패치 (v3.0) ─────────────────────────\n\n/** 패치 중 매핑 실패/미지원으로 건너뛴 항목 — silent 실패 금지 */\nexport interface PatchSkip {\n /** 건너뛴 사유 */\n reason: string\n /** 원본 쪽 내용 요약 (최대 80자) */\n before?: string\n /** 편집 쪽 내용 요약 (최대 80자) */\n after?: string\n}\n\n/** patchHwpx 옵션 */\nexport interface PatchOptions {\n /** 패치 후 재파싱 자동 검증 (기본 true) */\n verify?: boolean\n}\n\n/** patchHwpx 결과 */\nexport interface PatchResult {\n success: boolean\n /** 패치된 HWPX (success=true) */\n data?: Uint8Array\n /** 적용된 변경 수 */\n applied: number\n /** 매핑 실패 항목 (이유 포함) */\n skipped: PatchSkip[]\n /** 자동 검증: 패치본 재파싱 vs 편집 마크다운 diff */\n verification?: DiffResult\n /** 실패 사유 (success=false) */\n error?: string\n}\n\n// ─── 양식 인식 ──────────────────────────────────────\n\nexport interface FormField {\n label: string\n value: string\n /** 0-based 소스 행 */\n row: number\n /** 0-based 소스 열 */\n col: number\n}\n\nexport interface FormResult {\n fields: FormField[]\n /** 양식 확신도 (0-1) */\n confidence: number\n}\n\n// ─── OCR 프로바이더 ─────────────────────────────────\n\n/** 사용자 제공 OCR 함수 — 페이지 이미지를 받아 텍스트 반환 */\nexport type OcrProvider = (\n pageImage: Uint8Array,\n pageNumber: number,\n mimeType: \"image/png\"\n) => Promise<string>\n\n// ─── Watch 모드 ─────────────────────────────────────\n\nexport interface WatchOptions {\n dir: string\n outDir?: string\n webhook?: string\n format?: \"markdown\" | \"json\"\n pages?: string\n silent?: boolean\n}\n\n// ─── 헤딩 감지 공통 임계값 ──────────────────────────\n\n/** 폰트 크기 비율 → heading level (전 파서 공통) */\nexport const HEADING_RATIO_H1 = 1.5\nexport const HEADING_RATIO_H2 = 1.3\nexport const HEADING_RATIO_H3 = 1.15\n\n// ─── 내부 파서 반환 타입 ─────────────────────────────\n\n/** 내부 파서가 index.ts에 반환하는 공통 타입 (HWP5/HWPX/PDF/XLSX/DOCX) */\nexport interface InternalParseResult {\n markdown: string\n blocks: IRBlock[]\n metadata?: DocumentMetadata\n outline?: OutlineItem[]\n warnings?: ParseWarning[]\n images?: ExtractedImage[]\n /** PDF 전용: 이미지 기반 PDF 여부 */\n isImageBased?: boolean\n /** PDF 전용: 페이지별 품질 신호 */\n pageQuality?: PageQuality[]\n /** PDF 전용: 문서 단위 품질 요약 */\n qualitySummary?: DocumentQualitySummary\n}\n"]}