npm - @clazic/kordoc - Versions diffs - 2.4.11 → 2.4.12 - Mend

@clazic/kordoc 2.4.11 → 2.4.12

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

package/README.md +25 -0
package/dist/{chunk-PJSXZBZB.js → chunk-5R37N6KE.js} +19 -4
package/dist/chunk-5R37N6KE.js.map +1 -0
package/dist/chunk-I6YC6ZGK.js +219 -0
package/dist/chunk-I6YC6ZGK.js.map +1 -0
package/dist/{chunk-JGMLDBW5.js → chunk-KJEZPVEK.js} +680 -301
package/dist/chunk-KJEZPVEK.js.map +1 -0
package/dist/cli.js +68 -8
package/dist/cli.js.map +1 -1
package/dist/index.cjs +1678 -329
package/dist/index.cjs.map +1 -1
package/dist/index.d.cts +121 -1
package/dist/index.d.ts +121 -1
package/dist/index.js +1656 -310
package/dist/index.js.map +1 -1
package/dist/mcp.js +11 -2
package/dist/mcp.js.map +1 -1
package/dist/{provider-PYZL2VNN.js → provider-T2D5XRTI.js} +30 -2
package/dist/provider-T2D5XRTI.js.map +1 -0
package/dist/{resolve-4I65IGMM.js → resolve-673XFZQ6.js} +18 -1
package/dist/resolve-673XFZQ6.js.map +1 -0
package/dist/{utils-HKVOS2O3.js → utils-XLLXVB7V.js} +4 -2
package/dist/{watch-EYOGF3HY.js → watch-SOMS2KR7.js} +4 -3
package/dist/{watch-EYOGF3HY.js.map → watch-SOMS2KR7.js.map} +1 -1
package/package.json +2 -1
package/dist/chunk-JGMLDBW5.js.map +0 -1
package/dist/chunk-PJSXZBZB.js.map +0 -1
package/dist/provider-PYZL2VNN.js.map +0 -1
package/dist/resolve-4I65IGMM.js.map +0 -1
/package/dist/{utils-HKVOS2O3.js.map → utils-XLLXVB7V.js.map} +0 -0

package/dist/{chunk-JGMLDBW5.js → chunk-KJEZPVEK.js} RENAMED Viewed

@@ -6,10 +6,11 @@ import {
   KordocError,
   classifyError,
   isPathTraversal,
+  normalizeKordocError,
   precheckZipSize,
   sanitizeHref,
   toArrayBuffer
-} from "./chunk-PJSXZBZB.js";
+} from "./chunk-5R37N6KE.js";
 import {
   parsePageRange
 } from "./chunk-MOL7MDBG.js";
@@ -19,6 +20,10 @@ import {
 import {
   createCliOcrProvider
 } from "./chunk-34WIGIQC.js";
+import {
+  createLoggerFromEnv,
+  generateRunId
+} from "./chunk-I6YC6ZGK.js";
 import {
   __commonJS,
   __require,
@@ -344,8 +349,8 @@ var require_cfb = __commonJS({
         }
         return L.length - R.length;
       }
-      function dirname(p) {
-        if (p.charAt(p.length - 1) == "/") return p.slice(0, -1).indexOf("/") === -1 ? p : dirname(p.slice(0, -1));
+      function dirname2(p) {
+        if (p.charAt(p.length - 1) == "/") return p.slice(0, -1).indexOf("/") === -1 ? p : dirname2(p.slice(0, -1));
         var c = p.lastIndexOf("/");
         return c === -1 ? p : p.slice(0, c + 1);
       }
@@ -766,10 +771,10 @@ var require_cfb = __commonJS({
           data.push([cfb.FullPaths[i2], cfb.FileIndex[i2]]);
         }
         for (i2 = 0; i2 < data.length; ++i2) {
-          var dad = dirname(data[i2][0]);
+          var dad = dirname2(data[i2][0]);
           s = fullPaths[dad];
           while (!s) {
-            while (dirname(dad) && !fullPaths[dirname(dad)]) dad = dirname(dad);
+            while (dirname2(dad) && !fullPaths[dirname2(dad)]) dad = dirname2(dad);
             data.push([dad, {
               name: filename(dad).replace("/", ""),
               type: 1,
@@ -779,7 +784,7 @@ var require_cfb = __commonJS({
               content: null
             }]);
             fullPaths[dad] = true;
-            dad = dirname(data[i2][0]);
+            dad = dirname2(data[i2][0]);
             s = fullPaths[dad];
           }
         }
@@ -805,13 +810,13 @@ var require_cfb = __commonJS({
             elt.size = 0;
             elt.type = 5;
           } else if (nm.slice(-1) == "/") {
-            for (j = i2 + 1; j < data.length; ++j) if (dirname(cfb.FullPaths[j]) == nm) break;
+            for (j = i2 + 1; j < data.length; ++j) if (dirname2(cfb.FullPaths[j]) == nm) break;
             elt.C = j >= data.length ? -1 : j;
-            for (j = i2 + 1; j < data.length; ++j) if (dirname(cfb.FullPaths[j]) == dirname(nm)) break;
+            for (j = i2 + 1; j < data.length; ++j) if (dirname2(cfb.FullPaths[j]) == dirname2(nm)) break;
             elt.R = j >= data.length ? -1 : j;
             elt.type = 1;
           } else {
-            if (dirname(cfb.FullPaths[i2 + 1] || "") == dirname(nm)) elt.R = i2 + 1;
+            if (dirname2(cfb.FullPaths[i2 + 1] || "") == dirname2(nm)) elt.R = i2 + 1;
             elt.type = 2;
           }
         }
@@ -2308,50 +2313,89 @@ function stripDtd(xml) {
   return xml.replace(/<!DOCTYPE\s[^[>]*(\[[\s\S]*?\])?\s*>/gi, "");
 }
 async function parseHwpxDocument(buffer, options, existingZip) {
-  precheckZipSize(buffer, MAX_DECOMPRESS_SIZE, MAX_ZIP_ENTRIES);
-  let zip;
+  const logger = createLoggerFromEnv().child({ component: "hwpx/parser.ts", stage: "detect" });
+  logger.log({ level: "info", event: "start", message: "HWPX \uD30C\uC2F1 \uC2DC\uC791", meta: { size: buffer.byteLength } });
+  let lastParsedSection = 0;
   try {
-    zip = existingZip ?? await JSZip2.loadAsync(buffer);
-  } catch {
-    return await extractFromBrokenZip(buffer);
-  }
-  const actualEntryCount = Object.keys(zip.files).length;
-  if (actualEntryCount > MAX_ZIP_ENTRIES) {
-    throw new KordocError("ZIP \uC5D4\uD2B8\uB9AC \uC218 \uCD08\uACFC (ZIP bomb \uC758\uC2EC)");
-  }
-  const decompressed = { total: 0 };
-  const metadata = {};
-  await extractHwpxMetadata(zip, metadata, decompressed);
-  const styleMap = await extractHwpxStyles(zip, decompressed);
-  const warnings = [];
-  const sectionPaths = await resolveSectionPaths(zip);
-  if (sectionPaths.length === 0) throw new KordocError("HWPX\uC5D0\uC11C \uC139\uC158 \uD30C\uC77C\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4");
-  metadata.pageCount = sectionPaths.length;
-  const pageFilter = options?.pages ? parsePageRange(options.pages, sectionPaths.length) : null;
-  const totalTarget = pageFilter ? pageFilter.size : sectionPaths.length;
-  const blocks = [];
-  let parsedSections = 0;
-  for (let si = 0; si < sectionPaths.length; si++) {
-    if (pageFilter && !pageFilter.has(si + 1)) continue;
-    const file = zip.file(sectionPaths[si]);
-    if (!file) continue;
+    precheckZipSize(buffer, MAX_DECOMPRESS_SIZE, MAX_ZIP_ENTRIES);
+    let zip;
     try {
-      const xml = await file.async("text");
-      decompressed.total += xml.length * 2;
-      if (decompressed.total > MAX_DECOMPRESS_SIZE) throw new KordocError("ZIP \uC555\uCD95 \uD574\uC81C \uD06C\uAE30 \uCD08\uACFC (ZIP bomb \uC758\uC2EC)");
-      blocks.push(...parseSectionXml(xml, styleMap, warnings, si + 1));
-      parsedSections++;
-      options?.onProgress?.(parsedSections, totalTarget);
-    } catch (secErr) {
-      if (secErr instanceof KordocError) throw secErr;
-      warnings.push({ page: si + 1, message: `\uC139\uC158 ${si + 1} \uD30C\uC2F1 \uC2E4\uD328: ${secErr instanceof Error ? secErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958"}`, code: "PARTIAL_PARSE" });
-    }
-  }
-  const images = await extractImagesFromZip(zip, blocks, decompressed, warnings);
-  detectHwpxHeadings(blocks, styleMap);
-  const outline = blocks.filter((b) => b.type === "heading" && b.level && b.text).map((b) => ({ level: b.level, text: b.text, pageNumber: b.pageNumber }));
-  const markdown = blocksToMarkdown(blocks);
-  return { markdown, blocks, metadata, outline: outline.length > 0 ? outline : void 0, warnings: warnings.length > 0 ? warnings : void 0, images: images.length > 0 ? images : void 0 };
+      zip = existingZip ?? await JSZip2.loadAsync(buffer);
+    } catch {
+      return await extractFromBrokenZip(buffer);
+    }
+    const actualEntryCount = Object.keys(zip.files).length;
+    if (actualEntryCount > MAX_ZIP_ENTRIES) {
+      throw new KordocError("ZIP \uC5D4\uD2B8\uB9AC \uC218 \uCD08\uACFC (ZIP bomb \uC758\uC2EC)");
+    }
+    const decompressed = { total: 0 };
+    const metadata = {};
+    await extractHwpxMetadata(zip, metadata, decompressed);
+    const styleMap = await extractHwpxStyles(zip, decompressed);
+    const warnings = [];
+    const sectionPaths = await resolveSectionPaths(zip);
+    if (sectionPaths.length === 0) throw new KordocError("HWPX\uC5D0\uC11C \uC139\uC158 \uD30C\uC77C\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4");
+    metadata.pageCount = sectionPaths.length;
+    logger.log({ level: "debug", stage: "convert", event: "progress", message: "\uC139\uC158 \uACBD\uB85C \uD574\uC11D \uC644\uB8CC", meta: { sections: sectionPaths.length } });
+    const pageFilter = options?.pages ? parsePageRange(options.pages, sectionPaths.length) : null;
+    const totalTarget = pageFilter ? pageFilter.size : sectionPaths.length;
+    const blocks = [];
+    let parsedSections = 0;
+    for (let si = 0; si < sectionPaths.length; si++) {
+      if (pageFilter && !pageFilter.has(si + 1)) continue;
+      const file = zip.file(sectionPaths[si]);
+      if (!file) continue;
+      try {
+        const xml = await file.async("text");
+        decompressed.total += xml.length * 2;
+        if (decompressed.total > MAX_DECOMPRESS_SIZE) throw new KordocError("ZIP \uC555\uCD95 \uD574\uC81C \uD06C\uAE30 \uCD08\uACFC (ZIP bomb \uC758\uC2EC)");
+        blocks.push(...parseSectionXml(xml, styleMap, warnings, si + 1));
+        parsedSections++;
+        options?.onProgress?.(parsedSections, totalTarget);
+        logger.log({
+          level: "debug",
+          stage: "convert",
+          event: "progress",
+          message: "\uC139\uC158 \uD30C\uC2F1 \uC644\uB8CC",
+          meta: { section: si + 1, parsedSections, totalTarget }
+        });
+        lastParsedSection = si + 1;
+      } catch (secErr) {
+        if (secErr instanceof KordocError) throw secErr;
+        warnings.push({ page: si + 1, message: `\uC139\uC158 ${si + 1} \uD30C\uC2F1 \uC2E4\uD328: ${secErr instanceof Error ? secErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958"}`, code: "PARTIAL_PARSE" });
+        logger.log({
+          level: "warn",
+          stage: "convert",
+          event: "progress",
+          message: "\uC139\uC158 \uD30C\uC2F1 \uC2E4\uD328",
+          meta: { section: si + 1 },
+          error: { message: secErr instanceof Error ? secErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: secErr instanceof Error ? secErr.name : "Error" }
+        });
+      }
+    }
+    const images = await extractImagesFromZip(zip, blocks, decompressed, warnings);
+    detectHwpxHeadings(blocks, styleMap);
+    const outline = blocks.filter((b) => b.type === "heading" && b.level && b.text).map((b) => ({ level: b.level, text: b.text, pageNumber: b.pageNumber }));
+    const markdown = blocksToMarkdown(blocks);
+    logger.log({
+      level: "info",
+      stage: "finalize",
+      event: "done",
+      message: "HWPX \uD30C\uC2F1 \uC644\uB8CC",
+      meta: { blocks: blocks.length, warnings: warnings.length, images: images.length, outline: outline.length }
+    });
+    return { markdown, blocks, metadata, outline: outline.length > 0 ? outline : void 0, warnings: warnings.length > 0 ? warnings : void 0, images: images.length > 0 ? images : void 0 };
+  } catch (err) {
+    logger.log({
+      level: "error",
+      stage: "finalize",
+      event: "error",
+      message: "HWPX \uD30C\uC2F1 \uC2E4\uD328",
+      meta: { lastParsedSection },
+      error: { message: err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: err instanceof Error ? err.name : "Error", stack: err instanceof Error ? err.stack : void 0 }
+    });
+    throw err;
+  }
 }
 function imageExtToMime(ext) {
   switch (ext.toLowerCase()) {
@@ -4084,71 +4128,110 @@ var CFB = __toESM(require_cfb(), 1);
 var MAX_SECTIONS = 100;
 var MAX_TOTAL_DECOMPRESS = 500 * 1024 * 1024;
 function parseHwp5Document(buffer, options) {
-  let cfb = null;
-  let lenientCfb = null;
-  const warnings = [];
+  const logger = createLoggerFromEnv().child({ component: "hwp5/parser.ts", stage: "detect" });
+  logger.log({ level: "info", event: "start", message: "HWP5 \uD30C\uC2F1 \uC2DC\uC791", meta: { size: buffer.length } });
+  let lastParsedSection = 0;
   try {
-    cfb = CFB.parse(buffer);
-  } catch {
+    let cfb = null;
+    let lenientCfb = null;
+    const warnings = [];
     try {
-      lenientCfb = parseLenientCfb(buffer);
-      warnings.push({ message: "\uC190\uC0C1\uB41C CFB \uCEE8\uD14C\uC774\uB108 \u2014 lenient \uBAA8\uB4DC\uB85C \uBCF5\uAD6C", code: "LENIENT_CFB_RECOVERY" });
+      cfb = CFB.parse(buffer);
     } catch {
-      throw new KordocError("CFB \uCEE8\uD14C\uC774\uB108 \uD30C\uC2F1 \uC2E4\uD328 (strict \uBC0F lenient \uBAA8\uB450)");
+      try {
+        lenientCfb = parseLenientCfb(buffer);
+        warnings.push({ message: "\uC190\uC0C1\uB41C CFB \uCEE8\uD14C\uC774\uB108 \u2014 lenient \uBAA8\uB4DC\uB85C \uBCF5\uAD6C", code: "LENIENT_CFB_RECOVERY" });
+      } catch {
+        throw new KordocError("CFB \uCEE8\uD14C\uC774\uB108 \uD30C\uC2F1 \uC2E4\uD328 (strict \uBC0F lenient \uBAA8\uB450)");
+      }
     }
-  }
-  const findStream = (path) => {
-    if (cfb) {
-      const entry = CFB.find(cfb, path);
-      return entry?.content ? Buffer.from(entry.content) : null;
+    const findStream = (path) => {
+      if (cfb) {
+        const entry = CFB.find(cfb, path);
+        return entry?.content ? Buffer.from(entry.content) : null;
+      }
+      return lenientCfb.findStream(path);
+    };
+    const headerData = findStream("/FileHeader");
+    if (!headerData) throw new KordocError("FileHeader \uC2A4\uD2B8\uB9BC \uC5C6\uC74C");
+    const header = parseFileHeader(headerData);
+    if (header.signature !== "HWP Document File") throw new KordocError("HWP \uC2DC\uADF8\uB2C8\uCC98 \uBD88\uC77C\uCE58");
+    if (header.flags & FLAG_ENCRYPTED) throw new KordocError("\uC554\uD638\uD654\uB41C HWP\uB294 \uC9C0\uC6D0\uD558\uC9C0 \uC54A\uC2B5\uB2C8\uB2E4");
+    if (header.flags & FLAG_DRM) throw new KordocError("DRM \uBCF4\uD638\uB41C HWP\uB294 \uC9C0\uC6D0\uD558\uC9C0 \uC54A\uC2B5\uB2C8\uB2E4");
+    const compressed = (header.flags & FLAG_COMPRESSED) !== 0;
+    const distribution = (header.flags & FLAG_DISTRIBUTION) !== 0;
+    const metadata = {
+      version: `${header.versionMajor}.x`
+    };
+    if (cfb) extractHwp5Metadata(cfb, metadata);
+    const docInfo = cfb ? parseDocInfoStream(cfb, compressed) : parseDocInfoFromStream(findStream("/DocInfo"), compressed);
+    const sections = distribution ? cfb ? findViewTextSections(cfb, compressed) : findViewTextSectionsLenient(lenientCfb, compressed) : cfb ? findSections(cfb) : findSectionsLenient(lenientCfb, compressed);
+    if (sections.length === 0) throw new KordocError("\uC139\uC158 \uC2A4\uD2B8\uB9BC\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4");
+    logger.log({ level: "debug", stage: "convert", event: "progress", message: "\uC139\uC158 \uBAA9\uB85D \uD574\uC11D \uC644\uB8CC", meta: { sections: sections.length, distribution } });
+    metadata.pageCount = sections.length;
+    const pageFilter = options?.pages ? parsePageRange(options.pages, sections.length) : null;
+    const totalTarget = pageFilter ? pageFilter.size : sections.length;
+    const blocks = [];
+    let totalDecompressed = 0;
+    let parsedSections = 0;
+    for (let si = 0; si < sections.length; si++) {
+      if (pageFilter && !pageFilter.has(si + 1)) continue;
+      try {
+        const sectionData = sections[si];
+        const data = !distribution && compressed ? decompressStream(Buffer.from(sectionData)) : Buffer.from(sectionData);
+        totalDecompressed += data.length;
+        if (totalDecompressed > MAX_TOTAL_DECOMPRESS) throw new KordocError("\uCD1D \uC555\uCD95 \uD574\uC81C \uD06C\uAE30 \uCD08\uACFC (decompression bomb \uC758\uC2EC)");
+        const records = readRecords(data);
+        const sectionBlocks = parseSection(records, docInfo, warnings, si + 1);
+        blocks.push(...sectionBlocks);
+        parsedSections++;
+        options?.onProgress?.(parsedSections, totalTarget);
+        logger.log({
+          level: "debug",
+          stage: "convert",
+          event: "progress",
+          message: "\uC139\uC158 \uD30C\uC2F1 \uC644\uB8CC",
+          meta: { section: si + 1, parsedSections, totalTarget }
+        });
+        lastParsedSection = si + 1;
+      } catch (secErr) {
+        if (secErr instanceof KordocError) throw secErr;
+        warnings.push({ page: si + 1, message: `\uC139\uC158 ${si + 1} \uD30C\uC2F1 \uC2E4\uD328: ${secErr instanceof Error ? secErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958"}`, code: "PARTIAL_PARSE" });
+        logger.log({
+          level: "warn",
+          stage: "convert",
+          event: "progress",
+          message: "\uC139\uC158 \uD30C\uC2F1 \uC2E4\uD328",
+          meta: { section: si + 1 },
+          error: { message: secErr instanceof Error ? secErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: secErr instanceof Error ? secErr.name : "Error" }
+        });
+      }
     }
-    return lenientCfb.findStream(path);
-  };
-  const headerData = findStream("/FileHeader");
-  if (!headerData) throw new KordocError("FileHeader \uC2A4\uD2B8\uB9BC \uC5C6\uC74C");
-  const header = parseFileHeader(headerData);
-  if (header.signature !== "HWP Document File") throw new KordocError("HWP \uC2DC\uADF8\uB2C8\uCC98 \uBD88\uC77C\uCE58");
-  if (header.flags & FLAG_ENCRYPTED) throw new KordocError("\uC554\uD638\uD654\uB41C HWP\uB294 \uC9C0\uC6D0\uD558\uC9C0 \uC54A\uC2B5\uB2C8\uB2E4");
-  if (header.flags & FLAG_DRM) throw new KordocError("DRM \uBCF4\uD638\uB41C HWP\uB294 \uC9C0\uC6D0\uD558\uC9C0 \uC54A\uC2B5\uB2C8\uB2E4");
-  const compressed = (header.flags & FLAG_COMPRESSED) !== 0;
-  const distribution = (header.flags & FLAG_DISTRIBUTION) !== 0;
-  const metadata = {
-    version: `${header.versionMajor}.x`
-  };
-  if (cfb) extractHwp5Metadata(cfb, metadata);
-  const docInfo = cfb ? parseDocInfoStream(cfb, compressed) : parseDocInfoFromStream(findStream("/DocInfo"), compressed);
-  const sections = distribution ? cfb ? findViewTextSections(cfb, compressed) : findViewTextSectionsLenient(lenientCfb, compressed) : cfb ? findSections(cfb) : findSectionsLenient(lenientCfb, compressed);
-  if (sections.length === 0) throw new KordocError("\uC139\uC158 \uC2A4\uD2B8\uB9BC\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4");
-  metadata.pageCount = sections.length;
-  const pageFilter = options?.pages ? parsePageRange(options.pages, sections.length) : null;
-  const totalTarget = pageFilter ? pageFilter.size : sections.length;
-  const blocks = [];
-  let totalDecompressed = 0;
-  let parsedSections = 0;
-  for (let si = 0; si < sections.length; si++) {
-    if (pageFilter && !pageFilter.has(si + 1)) continue;
-    try {
-      const sectionData = sections[si];
-      const data = !distribution && compressed ? decompressStream(Buffer.from(sectionData)) : Buffer.from(sectionData);
-      totalDecompressed += data.length;
-      if (totalDecompressed > MAX_TOTAL_DECOMPRESS) throw new KordocError("\uCD1D \uC555\uCD95 \uD574\uC81C \uD06C\uAE30 \uCD08\uACFC (decompression bomb \uC758\uC2EC)");
-      const records = readRecords(data);
-      const sectionBlocks = parseSection(records, docInfo, warnings, si + 1);
-      blocks.push(...sectionBlocks);
-      parsedSections++;
-      options?.onProgress?.(parsedSections, totalTarget);
-    } catch (secErr) {
-      if (secErr instanceof KordocError) throw secErr;
-      warnings.push({ page: si + 1, message: `\uC139\uC158 ${si + 1} \uD30C\uC2F1 \uC2E4\uD328: ${secErr instanceof Error ? secErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958"}`, code: "PARTIAL_PARSE" });
-    }
-  }
-  const images = cfb ? extractHwp5Images(cfb, blocks, compressed, warnings) : extractHwp5ImagesLenient(lenientCfb, blocks, compressed, warnings);
-  if (docInfo) {
-    detectHwp5Headings(blocks, docInfo);
-  }
-  const outline = blocks.filter((b) => b.type === "heading" && b.level && b.text).map((b) => ({ level: b.level, text: b.text, pageNumber: b.pageNumber }));
-  const markdown = blocksToMarkdown(blocks);
-  return { markdown, blocks, metadata, outline: outline.length > 0 ? outline : void 0, warnings: warnings.length > 0 ? warnings : void 0, images: images.length > 0 ? images : void 0 };
+    const images = cfb ? extractHwp5Images(cfb, blocks, compressed, warnings) : extractHwp5ImagesLenient(lenientCfb, blocks, compressed, warnings);
+    if (docInfo) {
+      detectHwp5Headings(blocks, docInfo);
+    }
+    const outline = blocks.filter((b) => b.type === "heading" && b.level && b.text).map((b) => ({ level: b.level, text: b.text, pageNumber: b.pageNumber }));
+    const markdown = blocksToMarkdown(blocks);
+    logger.log({
+      level: "info",
+      stage: "finalize",
+      event: "done",
+      message: "HWP5 \uD30C\uC2F1 \uC644\uB8CC",
+      meta: { blocks: blocks.length, warnings: warnings.length, images: images.length, outline: outline.length }
+    });
+    return { markdown, blocks, metadata, outline: outline.length > 0 ? outline : void 0, warnings: warnings.length > 0 ? warnings : void 0, images: images.length > 0 ? images : void 0 };
+  } catch (err) {
+    logger.log({
+      level: "error",
+      stage: "finalize",
+      event: "error",
+      message: "HWP5 \uD30C\uC2F1 \uC2E4\uD328",
+      meta: { lastParsedSection },
+      error: { message: err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: err instanceof Error ? err.name : "Error", stack: err instanceof Error ? err.stack : void 0 }
+    });
+    throw err;
+  }
 }
 function parseDocInfoStream(cfb, compressed) {
   try {
@@ -4707,6 +4790,10 @@ function arrangeCells(rows, cols, cells) {
   return grid.map((row) => row.map((c) => c || { text: "", colSpan: 1, rowSpan: 1 }));
 }
+// src/pdf/parser.ts
+import { createRequire } from "module";
+import { dirname, join, resolve } from "path";
 // src/pdf/line-detector.ts
 import { OPS } from "pdfjs-dist/legacy/build/pdf.mjs";
 var ORIENTATION_TOL = 2;
@@ -4893,12 +4980,17 @@ function buildTableGrids(horizontals, verticals) {
     const rawXs = vLines.map((l) => l.x1);
     const colXs = clusterCoordinates(rawXs).sort((a, b) => a - b);
     if (rowYs.length < 2 || colXs.length < 2) continue;
+    const rowCount = rowYs.length - 1;
+    const colCount = colXs.length - 1;
+    if (rowCount <= 0 || colCount <= 0) continue;
+    if (rowCount * colCount < 2) continue;
     const bbox = {
       x1: colXs[0],
       y1: rowYs[rowYs.length - 1],
       x2: colXs[colXs.length - 1],
       y2: rowYs[0]
     };
+    if (!hasReliableGridStructure(rowYs, colXs, hLines, vLines, bbox)) continue;
     grids.push({ rowYs, colXs, bbox });
   }
   return mergeAdjacentGrids(grids);
@@ -4948,6 +5040,35 @@ function clusterCoordinates(values) {
   }
   return clusters.map((c) => c.sum / c.count);
 }
+function hasReliableGridStructure(rowYs, colXs, hLines, vLines, bbox) {
+  const internalRows = rowYs.slice(1, -1);
+  const internalCols = colXs.slice(1, -1);
+  const width = Math.max(1, bbox.x2 - bbox.x1);
+  const height = Math.max(1, bbox.y2 - bbox.y1);
+  const coverageThreshold = 0.55;
+  const coveredRows = internalRows.filter(
+    (y) => hLines.some((h) => Math.abs(h.y1 - y) <= COORD_MERGE_TOL && lineOverlapRatio(h.x1, h.x2, bbox.x1, bbox.x2) >= coverageThreshold)
+  ).length;
+  const coveredCols = internalCols.filter(
+    (x) => vLines.some((v) => Math.abs(v.x1 - x) <= COORD_MERGE_TOL && lineOverlapRatio(v.y1, v.y2, bbox.y1, bbox.y2) >= coverageThreshold)
+  ).length;
+  const rowCoverage = internalRows.length > 0 ? coveredRows / internalRows.length : 1;
+  const colCoverage = internalCols.length > 0 ? coveredCols / internalCols.length : 1;
+  const longHorizontal = hLines.filter((h) => Math.abs(h.x2 - h.x1) >= width * 0.7).length;
+  const longVertical = vLines.filter((v) => Math.abs(v.y2 - v.y1) >= height * 0.7).length;
+  const hasAxisSupport = longHorizontal >= 2 && longVertical >= 2;
+  if (!hasAxisSupport) return false;
+  if (internalRows.length > 0 && rowCoverage < 0.5) return false;
+  if (internalCols.length > 0 && colCoverage < 0.5) return false;
+  return true;
+}
+function lineOverlapRatio(a1, a2, b1, b2) {
+  const left = Math.max(Math.min(a1, a2), Math.min(b1, b2));
+  const right = Math.min(Math.max(a1, a2), Math.max(b1, b2));
+  const overlap = Math.max(0, right - left);
+  const target = Math.max(1, Math.abs(b2 - b1));
+  return overlap / target;
+}
 function groupConnectedLines(lines) {
   const parent = lines.map((_, i) => i);
   function find2(x) {
@@ -5344,6 +5465,17 @@ g.pdfjsWorker = pdfjsWorker;
 // src/pdf/parser.ts
 import { getDocument, GlobalWorkerOptions } from "pdfjs-dist/legacy/build/pdf.mjs";
 GlobalWorkerOptions.workerSrc = "";
+var require2 = createRequire(
+  typeof __filename !== "undefined" ? __filename : resolve(process.cwd(), "kordoc.require.cjs")
+);
+function resolvePdfjsWasmUrl() {
+  try {
+    const pdfjsPkg = require2.resolve("pdfjs-dist/package.json");
+    return join(dirname(pdfjsPkg), "wasm/");
+  } catch {
+    return resolve(process.cwd(), "node_modules/pdfjs-dist/wasm/");
+  }
+}
 var MAX_PAGES = 5e3;
 var MAX_TOTAL_TEXT = 500 * 1024 * 1024;
 function calcPdfTimeout(bufferSize) {
@@ -5359,7 +5491,8 @@ async function loadPdfWithTimeout(buffer) {
     data: new Uint8Array(buffer),
     useSystemFonts: true,
     disableFontFace: true,
-    isEvalSupported: false
+    isEvalSupported: false,
+    wasmUrl: resolvePdfjsWasmUrl()
   });
   let timer;
   try {
@@ -5376,7 +5509,47 @@ async function loadPdfWithTimeout(buffer) {
     if (timer !== void 0) clearTimeout(timer);
   }
 }
+function estimateImageBasedPdf(metrics) {
+  if (metrics.length === 0) {
+    return { isImageBased: true, score: 1, reason: "\uC0D8\uD50C \uD1B5\uACC4 \uC5C6\uC74C" };
+  }
+  const totalPages = metrics.length;
+  const totalChars = metrics.reduce((s, m) => s + m.nonWhitespaceChars, 0);
+  const totalItems = metrics.reduce((s, m) => s + m.visibleItems, 0);
+  const pagesWithText = metrics.filter((m) => m.nonWhitespaceChars >= 20 || m.visibleItems >= 15).length;
+  const avgChars = totalChars / totalPages;
+  const avgItems = totalItems / totalPages;
+  const textPresenceRatio = pagesWithText / totalPages;
+  let score = 0;
+  if (avgChars < 10) score += 0.45;
+  if (avgItems < 8) score += 0.35;
+  if (textPresenceRatio < 0.35) score += 0.25;
+  if (avgChars > 40) score -= 0.35;
+  if (avgItems > 25) score -= 0.35;
+  if (textPresenceRatio > 0.7) score -= 0.25;
+  score = Math.max(0, Math.min(1, score));
+  const isImageBased = score >= 0.5;
+  const reason = `avgChars=${avgChars.toFixed(1)}, avgItems=${avgItems.toFixed(1)}, textPresence=${(textPresenceRatio * 100).toFixed(0)}%, score=${score.toFixed(2)}`;
+  return { isImageBased, score, reason };
+}
+function summarizePartialFailures(failedPages, totalTarget) {
+  if (failedPages.length === 0) return null;
+  const sorted = [...failedPages].sort((a, b) => a - b);
+  const preview = sorted.slice(0, 10).join(", ");
+  const suffix = sorted.length > 10 ? ` \uC678 ${sorted.length - 10}\uD398\uC774\uC9C0` : "";
+  return `\uBD80\uBD84 \uD30C\uC2F1 \uC2E4\uD328 \uC694\uC57D: ${sorted.length}/${totalTarget}\uD398\uC774\uC9C0 \uC2E4\uD328 (p${preview}${suffix})`;
+}
+function shouldAbortForPartialFailures(failedPages, totalTarget, maxPartialFailureRatio) {
+  if (typeof maxPartialFailureRatio !== "number") {
+    return { abort: false, ratio: 0, threshold: 0 };
+  }
+  const threshold = Math.max(0, Math.min(1, maxPartialFailureRatio));
+  const ratio = totalTarget > 0 ? failedPages.length / totalTarget : 0;
+  return { abort: ratio > threshold, ratio, threshold };
+}
 async function parsePdfDocument(buffer, options) {
+  const logger = createLoggerFromEnv().child({ component: "pdf/parser.ts", stage: "detect" });
+  logger.log({ level: "info", event: "start", message: "PDF \uD30C\uC2F1 \uC2DC\uC791", meta: { size: buffer.byteLength } });
   const doc = await loadPdfWithTimeout(buffer);
   try {
     const pageCount = doc.numPages;
@@ -5385,9 +5558,13 @@ async function parsePdfDocument(buffer, options) {
     await extractPdfMetadata(doc, metadata);
     const blocks = [];
     const warnings = [];
+    const failedPages = [];
+    let lastParsedPage2 = 0;
+    const sampleMetricsByPage = /* @__PURE__ */ new Map();
     let totalChars = 0;
     let totalTextBytes = 0;
     const effectivePageCount = Math.min(pageCount, MAX_PAGES);
+    logger.log({ level: "debug", event: "progress", message: "PDF \uB85C\uB529 \uC644\uB8CC", meta: { pageCount, effectivePageCount } });
     const pageFilter = options?.pages ? parsePageRange(options.pages, effectivePageCount) : null;
     const totalTarget = pageFilter ? pageFilter.size : effectivePageCount;
     const fontSizeFreq = /* @__PURE__ */ new Map();
@@ -5424,11 +5601,17 @@ async function parsePdfDocument(buffer, options) {
           totalChars += t.replace(/\s/g, "").length;
           totalTextBytes += t.length * 2;
         }
+        sampleMetricsByPage.set(i, {
+          nonWhitespaceChars: visible.reduce((sum, it) => sum + it.text.replace(/\s/g, "").length, 0),
+          visibleItems: visible.length
+        });
+        lastParsedPage2 = i;
         if (totalTextBytes > MAX_TOTAL_TEXT) throw new KordocError("\uD14D\uC2A4\uD2B8 \uCD94\uCD9C \uD06C\uAE30 \uCD08\uACFC");
         parsedPages++;
         options?.onProgress?.(parsedPages, totalTarget);
       } catch (pageErr) {
         if (pageErr instanceof KordocError) throw pageErr;
+        if (!failedPages.includes(i)) failedPages.push(i);
         warnings.push({ page: i, message: `\uD398\uC774\uC9C0 ${i} \uD30C\uC2F1 \uC2E4\uD328: ${pageErr instanceof Error ? pageErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958"}`, code: "PARTIAL_PARSE" });
       }
     };
@@ -5445,8 +5628,21 @@ async function parsePdfDocument(buffer, options) {
     for (const si of sampledIndices) {
       await parseSinglePage(targetPageNums[si]);
     }
-    const sampleParsed = parsedPages || sampledIndices.size;
-    const isImageBased = totalChars / Math.max(sampleParsed, 1) < 10;
+    const sampledMetrics = [];
+    for (const si of sampledIndices) {
+      const pageNum = targetPageNums[si];
+      const m = sampleMetricsByPage.get(pageNum);
+      if (m) sampledMetrics.push(m);
+    }
+    const imageBasedDecision = estimateImageBasedPdf(sampledMetrics);
+    const isImageBased = imageBasedDecision.isImageBased;
+    logger.log({
+      level: "info",
+      stage: "probe",
+      event: "done",
+      message: "\uC774\uBBF8\uC9C0 \uAE30\uBC18 \uD310\uC815",
+      meta: { isImageBased, reason: imageBasedDecision.reason, sampledPages: sampledMetrics.length }
+    });
     if (!isImageBased) {
       for (let si = 0; si < targetPageNums.length; si++) {
         if (!sampledIndices.has(si)) {
@@ -5454,20 +5650,52 @@ async function parsePdfDocument(buffer, options) {
         }
       }
     }
+    const partialSummary = summarizePartialFailures(failedPages, totalTarget);
+    if (partialSummary) {
+      warnings.push({
+        message: partialSummary,
+        code: "PARTIAL_PARSE"
+      });
+    }
+    if (isImageBased) {
+      warnings.push({
+        message: `\uC774\uBBF8\uC9C0 \uAE30\uBC18 \uD310\uC815: ${imageBasedDecision.reason}`,
+        code: "OCR_FALLBACK"
+      });
+    }
+    const partialPolicy = shouldAbortForPartialFailures(
+      failedPages,
+      totalTarget,
+      options?.maxPartialFailureRatio
+    );
+    if (partialPolicy.abort) {
+      throw new KordocError(
+        `\uBD80\uBD84 \uD30C\uC2F1 \uC2E4\uD328 \uBE44\uC728 \uCD08\uACFC: ${(partialPolicy.ratio * 100).toFixed(1)}% (\uD5C8\uC6A9 ${(partialPolicy.threshold * 100).toFixed(1)}%)`
+      );
+    }
     const parsedPageCount = parsedPages || (pageFilter ? pageFilter.size : effectivePageCount);
     if (isImageBased) {
       const ocrMode = options?.ocrMode ?? "auto";
       const concurrency = options?.ocrConcurrency ?? 1;
       const batchSize = options?.ocrBatchSize;
+      logger.log({
+        level: "info",
+        stage: "ocr",
+        event: "start",
+        message: "\uC774\uBBF8\uC9C0 \uAE30\uBC18 PDF OCR \uC2DC\uC791",
+        meta: { ocrMode, concurrency, batchSize, totalTarget }
+      });
       if (ocrMode === "off") {
         throw Object.assign(new KordocError(`\uC774\uBBF8\uC9C0 \uAE30\uBC18 PDF (${pageCount}\uD398\uC774\uC9C0, ${totalChars}\uC790)`), { isImageBased: true });
       }
-      const { resolveOcrProvider } = await import("./resolve-4I65IGMM.js");
-      const { ocrPages } = await import("./provider-PYZL2VNN.js");
+      const { resolveOcrProvider } = await import("./resolve-673XFZQ6.js");
+      const { ocrPages } = await import("./provider-T2D5XRTI.js");
       const tryProvider = async (provider, filter) => {
         try {
+          logger.log({ level: "debug", stage: "ocr", event: "progress", message: "OCR provider \uC2E4\uD589", meta: { filteredPages: filter?.size } });
           return await ocrPages(doc, provider, filter, effectivePageCount, warnings, concurrency, options?.onProgress);
         } catch {
+          logger.log({ level: "warn", stage: "ocr", event: "progress", message: "OCR provider \uC2E4\uD589 \uC2E4\uD328(\uBE48 \uACB0\uACFC\uB85C \uCC98\uB9AC)" });
           return [];
         } finally {
           const terminable = provider;
@@ -5490,6 +5718,7 @@ async function parsePdfDocument(buffer, options) {
         for (const mode of getAutoFallbackChain()) {
           if (pendingPages.size === 0) break;
           try {
+            logger.log({ level: "info", stage: "ocr", event: "progress", message: "OCR \uC5D4\uC9C4 \uC2DC\uB3C4", meta: { mode, pendingPages: pendingPages.size } });
             const modeFilter = pendingPages.size < effectivePageCount ? new Set(pendingPages) : pageFilter;
             const provider = await resolveOcrProvider(mode, warnings, concurrency, batchSize);
             const blocks2 = await tryProvider(provider, modeFilter);
@@ -5504,10 +5733,20 @@ async function parsePdfDocument(buffer, options) {
                   code: "OCR_CLI_FALLBACK"
                 });
               }
+              logger.log({ level: "info", stage: "ocr", event: "progress", message: "OCR \uC5D4\uC9C4 \uCC98\uB9AC \uC644\uB8CC", meta: { mode, blocks: blocks2.length, pendingPages: pendingPages.size } });
             } else {
               warnings.push({ message: `OCR: '${mode}' \uACB0\uACFC \uC5C6\uC74C, \uB2E4\uC74C \uC5D4\uC9C4\uC73C\uB85C \uC2DC\uB3C4`, code: "OCR_CLI_FALLBACK" });
+              logger.log({ level: "warn", stage: "ocr", event: "progress", message: "OCR \uC5D4\uC9C4 \uACB0\uACFC \uC5C6\uC74C", meta: { mode } });
             }
-          } catch {
+          } catch (engineErr) {
+            logger.log({
+              level: "warn",
+              stage: "ocr",
+              event: "progress",
+              message: "OCR \uC5D4\uC9C4 \uCD08\uAE30\uD654/\uC2E4\uD589 \uC2E4\uD328",
+              meta: { mode },
+              error: { message: engineErr instanceof Error ? engineErr.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: engineErr instanceof Error ? engineErr.name : "Error" }
+            });
           }
         }
         allOcrBlocks.sort((a, b) => (a.pageNumber ?? 0) - (b.pageNumber ?? 0));
@@ -5525,6 +5764,7 @@ async function parsePdfDocument(buffer, options) {
       }
       if (ocrBlocks.length > 0) {
         const ocrMarkdown = blocksToMarkdown(ocrBlocks);
+        logger.log({ level: "info", stage: "ocr", event: "done", message: "\uC774\uBBF8\uC9C0 \uAE30\uBC18 OCR \uC644\uB8CC", meta: { blocks: ocrBlocks.length } });
         return {
           markdown: ocrMarkdown,
           blocks: ocrBlocks,
@@ -5550,8 +5790,25 @@ async function parsePdfDocument(buffer, options) {
     }
     detectMarkerHeadings(blocks);
     const outline = blocks.filter((b) => b.type === "heading" && b.level && b.text).map((b) => ({ level: b.level, text: b.text, pageNumber: b.pageNumber }));
-    let markdown = cleanPdfText(blocksToMarkdown(blocks));
+    let markdown = cleanPdfText(blocksToMarkdown(blocks), options?.pdfTextNormalization ?? "default");
+    logger.log({
+      level: "info",
+      stage: "finalize",
+      event: "done",
+      message: "PDF \uD30C\uC2F1 \uC644\uB8CC",
+      meta: { blocks: blocks.length, warnings: warnings.length, outline: outline.length, isImageBased: false }
+    });
     return { markdown, blocks, metadata, outline: outline.length > 0 ? outline : void 0, warnings: warnings.length > 0 ? warnings : void 0 };
+  } catch (err) {
+    logger.log({
+      level: "error",
+      stage: "finalize",
+      event: "error",
+      message: "PDF \uD30C\uC2F1 \uC2E4\uD328",
+      meta: { lastParsedPage },
+      error: { message: err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: err instanceof Error ? err.name : "Error", stack: err instanceof Error ? err.stack : void 0 }
+    });
+    throw err;
   } finally {
     await doc.destroy().catch(() => {
     });
@@ -5656,6 +5913,17 @@ function shouldDemoteTable(table) {
   const emptyCells = totalCells - allCells.length;
   if (table.rows <= 2 && emptyCells > totalCells * 0.5) return true;
   if (table.rows === 1 && !/\d{2,}/.test(allText)) return true;
+  if (table.cols >= 3 && table.rows <= 4) {
+    const markerCells = allCells.filter((t) => /^[□■◆○●▶▷◇◆]/.test(t)).length;
+    const numericCells = allCells.filter((t) => /\d/.test(t)).length;
+    if (markerCells >= Math.max(1, Math.floor(allCells.length * 0.35)) && numericCells <= Math.floor(allCells.length * 0.15)) {
+      return true;
+    }
+  }
+  if (table.cols >= 3 && table.rows >= 2) {
+    const sparseRows = table.cells.filter((row) => row.filter((c) => c.text.trim()).length <= 1).length;
+    if (sparseRows >= Math.ceil(table.rows * 0.7)) return true;
+  }
   return false;
 }
 function demoteTableToText(table) {
@@ -6211,10 +6479,15 @@ function mergeLineSimple(items) {
   }
   return result;
 }
-function cleanPdfText(text) {
-  return mergeKoreanLines(
-    text.replace(/^[\s]*[-–—]\s*[-–—]?\d+[-–—]?[\s]*[-–—]?[\s]*$/gm, "").replace(/^\s*\d+\s*\/\s*\d+\s*$/gm, "").replace(/\n\d{1,4}\n/g, "\n").replace(/\n\d{1,4}$/, "")
-  ).replace(/^(?!\|).{3,30}$/gm, (line) => collapseEvenSpacing(line)).replace(/\n{3,}/g, "\n\n").trim();
+function stripPdfPageNumberArtifacts(text) {
+  return text.replace(/^[\s]*[-–—]\s*[-–—]?\d+[-–—]?[\s]*[-–—]?[\s]*$/gm, "").replace(/^\s*\d+\s*\/\s*\d+\s*$/gm, "").replace(/\n\d{1,4}\n/g, "\n").replace(/\n\d{1,4}$/, "");
+}
+function cleanPdfText(text, mode = "default") {
+  const stripped = stripPdfPageNumberArtifacts(text);
+  if (mode === "strict-preserve") {
+    return stripped.replace(/\n{4,}/g, "\n\n\n").trim();
+  }
+  return mergeKoreanLines(stripped).replace(/^(?!\|).{3,30}$/gm, (line) => collapseEvenSpacing(line)).replace(/\n{3,}/g, "\n\n").trim();
 }
 function startsWithMarker(line) {
   const t = line.trimStart();
@@ -6610,100 +6883,139 @@ function sheetToBlocks(sheetName, grid, merges, maxRow, maxCol, sheetIndex) {
   return blocks;
 }
 async function parseXlsxDocument(buffer, options, existingZip) {
-  precheckZipSize(buffer, MAX_DECOMPRESS_SIZE3);
-  const zip = existingZip ?? await JSZip3.loadAsync(buffer);
-  const warnings = [];
-  const workbookFile = zip.file("xl/workbook.xml");
-  if (!workbookFile) {
-    throw new KordocError("\uC720\uD6A8\uD558\uC9C0 \uC54A\uC740 XLSX \uD30C\uC77C: xl/workbook.xml\uC774 \uC5C6\uC2B5\uB2C8\uB2E4");
-  }
-  let sharedStrings = [];
-  const ssFile = zip.file("xl/sharedStrings.xml");
-  if (ssFile) {
-    sharedStrings = parseSharedStrings(await ssFile.async("text"));
-  }
-  const sheets = parseWorkbook(await workbookFile.async("text"));
-  if (sheets.length === 0) {
-    throw new KordocError("XLSX \uD30C\uC77C\uC5D0 \uC2DC\uD2B8\uAC00 \uC5C6\uC2B5\uB2C8\uB2E4");
-  }
-  let relsMap = /* @__PURE__ */ new Map();
-  const relsFile = zip.file("xl/_rels/workbook.xml.rels");
-  if (relsFile) {
-    relsMap = parseRels(await relsFile.async("text"));
-  }
-  let pageFilter = null;
-  if (options?.pages) {
-    const { parsePageRange: parsePageRange2 } = await import("./page-range-ALIRXAL5.js");
-    pageFilter = parsePageRange2(options.pages, sheets.length);
-  }
-  const blocks = [];
-  const processedSheets = Math.min(sheets.length, MAX_SHEETS);
-  let totalCells = 0;
-  for (let i = 0; i < processedSheets; i++) {
-    if (pageFilter && !pageFilter.has(i + 1)) continue;
-    const sheet = sheets[i];
-    options?.onProgress?.(i + 1, processedSheets);
-    let sheetPath = relsMap.get(sheet.rId);
-    if (sheetPath) {
-      if (!sheetPath.startsWith("xl/") && !sheetPath.startsWith("/")) {
-        sheetPath = `xl/${sheetPath}`;
-      } else if (sheetPath.startsWith("/")) {
-        sheetPath = sheetPath.slice(1);
-      }
-    } else {
-      sheetPath = `xl/worksheets/sheet${i + 1}.xml`;
-    }
-    const sheetFile = zip.file(sheetPath);
-    if (!sheetFile) {
-      warnings.push({
-        page: i + 1,
-        message: `\uC2DC\uD2B8 "${sheet.name}" \uD30C\uC77C\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4: ${sheetPath}`,
-        code: "PARTIAL_PARSE"
-      });
-      continue;
+  const logger = createLoggerFromEnv().child({ component: "xlsx/parser.ts", stage: "detect" });
+  logger.log({ level: "info", event: "start", message: "XLSX \uD30C\uC2F1 \uC2DC\uC791", meta: { size: buffer.byteLength } });
+  let lastProcessedSheet = 0;
+  try {
+    precheckZipSize(buffer, MAX_DECOMPRESS_SIZE3);
+    const zip = existingZip ?? await JSZip3.loadAsync(buffer);
+    const warnings = [];
+    const workbookFile = zip.file("xl/workbook.xml");
+    if (!workbookFile) {
+      throw new KordocError("\uC720\uD6A8\uD558\uC9C0 \uC54A\uC740 XLSX \uD30C\uC77C: xl/workbook.xml\uC774 \uC5C6\uC2B5\uB2C8\uB2E4");
+    }
+    let sharedStrings = [];
+    const ssFile = zip.file("xl/sharedStrings.xml");
+    if (ssFile) {
+      sharedStrings = parseSharedStrings(await ssFile.async("text"));
+    }
+    const sheets = parseWorkbook(await workbookFile.async("text"));
+    if (sheets.length === 0) {
+      throw new KordocError("XLSX \uD30C\uC77C\uC5D0 \uC2DC\uD2B8\uAC00 \uC5C6\uC2B5\uB2C8\uB2E4");
+    }
+    logger.log({ level: "debug", event: "progress", message: "\uC2DC\uD2B8 \uBAA9\uB85D \uB85C\uB4DC", meta: { sheets: sheets.length } });
+    let relsMap = /* @__PURE__ */ new Map();
+    const relsFile = zip.file("xl/_rels/workbook.xml.rels");
+    if (relsFile) {
+      relsMap = parseRels(await relsFile.async("text"));
+    }
+    let pageFilter = null;
+    if (options?.pages) {
+      const { parsePageRange: parsePageRange2 } = await import("./page-range-ALIRXAL5.js");
+      pageFilter = parsePageRange2(options.pages, sheets.length);
     }
-    try {
-      const sheetXml = await sheetFile.async("text");
-      const { grid, merges, maxRow, maxCol } = parseWorksheet(sheetXml, sharedStrings);
-      totalCells += maxRow * maxCol;
-      if (totalCells > MAX_TOTAL_CELLS) {
-        warnings.push({ message: `\uCD1D \uC140 \uC218 \uC81C\uD55C \uCD08\uACFC (${totalCells.toLocaleString()}\uC140), \uC774\uD6C4 \uC2DC\uD2B8 \uC0DD\uB7B5`, code: "PARTIAL_PARSE" });
-        break;
+    const blocks = [];
+    const processedSheets = Math.min(sheets.length, MAX_SHEETS);
+    let totalCells = 0;
+    for (let i = 0; i < processedSheets; i++) {
+      if (pageFilter && !pageFilter.has(i + 1)) continue;
+      const sheet = sheets[i];
+      options?.onProgress?.(i + 1, processedSheets);
+      let sheetPath = relsMap.get(sheet.rId);
+      if (sheetPath) {
+        if (!sheetPath.startsWith("xl/") && !sheetPath.startsWith("/")) {
+          sheetPath = `xl/${sheetPath}`;
+        } else if (sheetPath.startsWith("/")) {
+          sheetPath = sheetPath.slice(1);
+        }
+      } else {
+        sheetPath = `xl/worksheets/sheet${i + 1}.xml`;
+      }
+      const sheetFile = zip.file(sheetPath);
+      if (!sheetFile) {
+        warnings.push({
+          page: i + 1,
+          message: `\uC2DC\uD2B8 "${sheet.name}" \uD30C\uC77C\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4: ${sheetPath}`,
+          code: "PARTIAL_PARSE"
+        });
+        continue;
+      }
+      try {
+        const sheetXml = await sheetFile.async("text");
+        const { grid, merges, maxRow, maxCol } = parseWorksheet(sheetXml, sharedStrings);
+        totalCells += maxRow * maxCol;
+        if (totalCells > MAX_TOTAL_CELLS) {
+          warnings.push({ message: `\uCD1D \uC140 \uC218 \uC81C\uD55C \uCD08\uACFC (${totalCells.toLocaleString()}\uC140), \uC774\uD6C4 \uC2DC\uD2B8 \uC0DD\uB7B5`, code: "PARTIAL_PARSE" });
+          break;
+        }
+        const sheetBlocks = sheetToBlocks(sheet.name, grid, merges, maxRow, maxCol, i);
+        blocks.push(...sheetBlocks);
+        logger.log({
+          level: "debug",
+          stage: "convert",
+          event: "progress",
+          message: "\uC2DC\uD2B8 \uD30C\uC2F1 \uC644\uB8CC",
+          meta: { sheet: sheet.name, index: i + 1, processedSheets }
+        });
+        lastProcessedSheet = i + 1;
+      } catch (err) {
+        warnings.push({
+          page: i + 1,
+          message: `\uC2DC\uD2B8 "${sheet.name}" \uD30C\uC2F1 \uC2E4\uD328: ${err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958"}`,
+          code: "PARTIAL_PARSE"
+        });
+        logger.log({
+          level: "warn",
+          stage: "convert",
+          event: "progress",
+          message: "\uC2DC\uD2B8 \uD30C\uC2F1 \uC2E4\uD328",
+          meta: { sheet: sheet.name, index: i + 1 },
+          error: { message: err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: err instanceof Error ? err.name : "Error" }
+        });
       }
-      const sheetBlocks = sheetToBlocks(sheet.name, grid, merges, maxRow, maxCol, i);
-      blocks.push(...sheetBlocks);
-    } catch (err) {
-      warnings.push({
-        page: i + 1,
-        message: `\uC2DC\uD2B8 "${sheet.name}" \uD30C\uC2F1 \uC2E4\uD328: ${err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958"}`,
-        code: "PARTIAL_PARSE"
-      });
     }
-  }
-  const metadata = {
-    pageCount: processedSheets
-  };
-  const coreFile = zip.file("docProps/core.xml");
-  if (coreFile) {
-    try {
-      const coreXml = await coreFile.async("text");
-      const doc = parseXml(coreXml);
-      const getFirst = (tag) => {
-        const els = doc.getElementsByTagName(tag);
-        return els.length > 0 ? (els[0].textContent ?? "").trim() : void 0;
-      };
-      metadata.title = getFirst("dc:title") || getFirst("dcterms:title");
-      metadata.author = getFirst("dc:creator");
-      metadata.description = getFirst("dc:description");
-      const created = getFirst("dcterms:created");
-      if (created) metadata.createdAt = created;
-      const modified = getFirst("dcterms:modified");
-      if (modified) metadata.modifiedAt = modified;
-    } catch {
+    const metadata = {
+      pageCount: processedSheets
+    };
+    const coreFile = zip.file("docProps/core.xml");
+    if (coreFile) {
+      try {
+        const coreXml = await coreFile.async("text");
+        const doc = parseXml(coreXml);
+        const getFirst = (tag) => {
+          const els = doc.getElementsByTagName(tag);
+          return els.length > 0 ? (els[0].textContent ?? "").trim() : void 0;
+        };
+        metadata.title = getFirst("dc:title") || getFirst("dcterms:title");
+        metadata.author = getFirst("dc:creator");
+        metadata.description = getFirst("dc:description");
+        const created = getFirst("dcterms:created");
+        if (created) metadata.createdAt = created;
+        const modified = getFirst("dcterms:modified");
+        if (modified) metadata.modifiedAt = modified;
+      } catch {
+      }
     }
+    const markdown = blocksToMarkdown(blocks);
+    logger.log({
+      level: "info",
+      stage: "finalize",
+      event: "done",
+      message: "XLSX \uD30C\uC2F1 \uC644\uB8CC",
+      meta: { blocks: blocks.length, warnings: warnings.length, pageCount: processedSheets }
+    });
+    return { markdown, blocks, metadata, warnings: warnings.length > 0 ? warnings : void 0 };
+  } catch (err) {
+    logger.log({
+      level: "error",
+      stage: "finalize",
+      event: "error",
+      message: "XLSX \uD30C\uC2F1 \uC2E4\uD328",
+      meta: { lastProcessedSheet },
+      error: { message: err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: err instanceof Error ? err.name : "Error", stack: err instanceof Error ? err.stack : void 0 }
+    });
+    throw err;
   }
-  const markdown = blocksToMarkdown(blocks);
-  return { markdown, blocks, metadata, warnings: warnings.length > 0 ? warnings : void 0 };
 }
 // src/docx/parser.ts
@@ -7070,95 +7382,120 @@ async function extractImages(zip, rels, doc) {
   return { blocks, images };
 }
 async function parseDocxDocument(buffer, options, existingZip) {
-  precheckZipSize(buffer, MAX_DECOMPRESS_SIZE4);
-  const zip = existingZip ?? await JSZip4.loadAsync(buffer);
-  const warnings = [];
-  const docFile = zip.file("word/document.xml");
-  if (!docFile) {
-    throw new KordocError("\uC720\uD6A8\uD558\uC9C0 \uC54A\uC740 DOCX \uD30C\uC77C: word/document.xml\uC774 \uC5C6\uC2B5\uB2C8\uB2E4");
-  }
-  let rels = /* @__PURE__ */ new Map();
-  const relsFile = zip.file("word/_rels/document.xml.rels");
-  if (relsFile) {
-    rels = parseRels2(await relsFile.async("text"));
-  }
-  let styles = /* @__PURE__ */ new Map();
-  const stylesFile = zip.file("word/styles.xml");
-  if (stylesFile) {
-    try {
-      styles = parseStyles(await stylesFile.async("text"));
-    } catch {
+  const logger = createLoggerFromEnv().child({ component: "docx/parser.ts", stage: "detect" });
+  logger.log({ level: "info", event: "start", message: "DOCX \uD30C\uC2F1 \uC2DC\uC791", meta: { size: buffer.byteLength } });
+  let lastProcessedNode = 0;
+  try {
+    precheckZipSize(buffer, MAX_DECOMPRESS_SIZE4);
+    const zip = existingZip ?? await JSZip4.loadAsync(buffer);
+    const warnings = [];
+    const docFile = zip.file("word/document.xml");
+    if (!docFile) {
+      throw new KordocError("\uC720\uD6A8\uD558\uC9C0 \uC54A\uC740 DOCX \uD30C\uC77C: word/document.xml\uC774 \uC5C6\uC2B5\uB2C8\uB2E4");
+    }
+    let rels = /* @__PURE__ */ new Map();
+    const relsFile = zip.file("word/_rels/document.xml.rels");
+    if (relsFile) {
+      rels = parseRels2(await relsFile.async("text"));
+    }
+    let styles = /* @__PURE__ */ new Map();
+    const stylesFile = zip.file("word/styles.xml");
+    if (stylesFile) {
+      try {
+        styles = parseStyles(await stylesFile.async("text"));
+      } catch {
+      }
     }
-  }
-  let numbering = /* @__PURE__ */ new Map();
-  const numFile = zip.file("word/numbering.xml");
-  if (numFile) {
-    try {
-      numbering = parseNumbering(await numFile.async("text"));
-    } catch {
+    let numbering = /* @__PURE__ */ new Map();
+    const numFile = zip.file("word/numbering.xml");
+    if (numFile) {
+      try {
+        numbering = parseNumbering(await numFile.async("text"));
+      } catch {
+      }
     }
-  }
-  let footnotes = /* @__PURE__ */ new Map();
-  const fnFile = zip.file("word/footnotes.xml");
-  if (fnFile) {
-    try {
-      footnotes = parseFootnotes(await fnFile.async("text"));
-    } catch {
+    let footnotes = /* @__PURE__ */ new Map();
+    const fnFile = zip.file("word/footnotes.xml");
+    if (fnFile) {
+      try {
+        footnotes = parseFootnotes(await fnFile.async("text"));
+      } catch {
+      }
     }
-  }
-  const docXml = await docFile.async("text");
-  const doc = parseXml2(docXml);
-  const body = findElements(doc, "body");
-  if (body.length === 0) {
-    throw new KordocError("DOCX \uBCF8\uBB38(w:body)\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4");
-  }
-  const blocks = [];
-  const bodyEl = body[0];
-  const children = bodyEl.childNodes;
-  for (let i = 0; i < children.length; i++) {
-    const node = children[i];
-    if (node.nodeType !== 1) continue;
-    const el = node;
-    const localName = el.localName ?? el.tagName?.split(":").pop();
-    if (localName === "p") {
-      const block = parseParagraph(el, styles, numbering, footnotes, rels);
-      if (block) blocks.push(block);
-    } else if (localName === "tbl") {
-      const block = parseTable(el, styles, numbering, footnotes, rels);
-      if (block) blocks.push(block);
-    }
-  }
-  const { blocks: imgBlocks, images } = await extractImages(zip, rels, doc);
-  const metadata = {};
-  const coreFile = zip.file("docProps/core.xml");
-  if (coreFile) {
-    try {
-      const coreXml = await coreFile.async("text");
-      const coreDoc = parseXml2(coreXml);
-      const getFirst = (tag) => {
-        const els = coreDoc.getElementsByTagName(tag);
-        return els.length > 0 ? (els[0].textContent ?? "").trim() : void 0;
-      };
-      metadata.title = getFirst("dc:title") || getFirst("dcterms:title");
-      metadata.author = getFirst("dc:creator");
-      metadata.description = getFirst("dc:description");
-      const created = getFirst("dcterms:created");
-      if (created) metadata.createdAt = created;
-      const modified = getFirst("dcterms:modified");
-      if (modified) metadata.modifiedAt = modified;
-    } catch {
+    const docXml = await docFile.async("text");
+    const doc = parseXml2(docXml);
+    const body = findElements(doc, "body");
+    if (body.length === 0) {
+      throw new KordocError("DOCX \uBCF8\uBB38(w:body)\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4");
     }
+    const blocks = [];
+    const bodyEl = body[0];
+    const children = bodyEl.childNodes;
+    for (let i = 0; i < children.length; i++) {
+      const node = children[i];
+      if (node.nodeType !== 1) continue;
+      const el = node;
+      const localName = el.localName ?? el.tagName?.split(":").pop();
+      if (localName === "p") {
+        const block = parseParagraph(el, styles, numbering, footnotes, rels);
+        if (block) blocks.push(block);
+      } else if (localName === "tbl") {
+        const block = parseTable(el, styles, numbering, footnotes, rels);
+        if (block) blocks.push(block);
+      }
+      lastProcessedNode = i + 1;
+    }
+    logger.log({ level: "debug", stage: "convert", event: "progress", message: "\uBCF8\uBB38 \uBE14\uB85D \uD30C\uC2F1 \uC644\uB8CC", meta: { blocks: blocks.length } });
+    const { blocks: imgBlocks, images } = await extractImages(zip, rels, doc);
+    logger.log({ level: "debug", stage: "convert", event: "progress", message: "\uC774\uBBF8\uC9C0 \uCD94\uCD9C \uC644\uB8CC", meta: { imageBlocks: imgBlocks.length, images: images.length } });
+    const metadata = {};
+    const coreFile = zip.file("docProps/core.xml");
+    if (coreFile) {
+      try {
+        const coreXml = await coreFile.async("text");
+        const coreDoc = parseXml2(coreXml);
+        const getFirst = (tag) => {
+          const els = coreDoc.getElementsByTagName(tag);
+          return els.length > 0 ? (els[0].textContent ?? "").trim() : void 0;
+        };
+        metadata.title = getFirst("dc:title") || getFirst("dcterms:title");
+        metadata.author = getFirst("dc:creator");
+        metadata.description = getFirst("dc:description");
+        const created = getFirst("dcterms:created");
+        if (created) metadata.createdAt = created;
+        const modified = getFirst("dcterms:modified");
+        if (modified) metadata.modifiedAt = modified;
+      } catch {
+      }
+    }
+    const outline = blocks.filter((b) => b.type === "heading").map((b) => ({ level: b.level ?? 2, text: b.text ?? "" }));
+    const markdown = blocksToMarkdown(blocks);
+    logger.log({
+      level: "info",
+      stage: "finalize",
+      event: "done",
+      message: "DOCX \uD30C\uC2F1 \uC644\uB8CC",
+      meta: { blocks: blocks.length, warnings: warnings.length, outline: outline.length, images: images.length }
+    });
+    return {
+      markdown,
+      blocks,
+      metadata,
+      outline: outline.length > 0 ? outline : void 0,
+      warnings: warnings.length > 0 ? warnings : void 0,
+      images: images.length > 0 ? images : void 0
+    };
+  } catch (err) {
+    logger.log({
+      level: "error",
+      stage: "finalize",
+      event: "error",
+      message: "DOCX \uD30C\uC2F1 \uC2E4\uD328",
+      meta: { lastProcessedNode },
+      error: { message: err instanceof Error ? err.message : "\uC54C \uC218 \uC5C6\uB294 \uC624\uB958", name: err instanceof Error ? err.name : "Error", stack: err instanceof Error ? err.stack : void 0 }
+    });
+    throw err;
   }
-  const outline = blocks.filter((b) => b.type === "heading").map((b) => ({ level: b.level ?? 2, text: b.text ?? "" }));
-  const markdown = blocksToMarkdown(blocks);
-  return {
-    markdown,
-    blocks,
-    metadata,
-    outline: outline.length > 0 ? outline : void 0,
-    warnings: warnings.length > 0 ? warnings : void 0,
-    images: images.length > 0 ? images : void 0
-  };
 }
 // src/form/recognize.ts
@@ -9487,8 +9824,22 @@ async function markdownToXlsx(markdown, options) {
   return buffer.buffer.slice(buffer.byteOffset, buffer.byteOffset + buffer.byteLength);
 }
+// src/pipeline/unified-ocr.ts
+import libre from "libreoffice-convert";
+var libreConvert = libre.convert;
+var PROOFREAD_PROMPT = [
+  "\uC544\uB798 Markdown\uC744 \uBE44\uD30C\uAD34 \uAD50\uC815\uB9CC \uC218\uD589\uD558\uC138\uC694.",
+  "\uADDC\uCE59:",
+  "- \uC0AC\uC2E4 \uCD94\uAC00/\uC0AD\uC81C/\uCD94\uCE21 \uAE08\uC9C0",
+  "- \uC22B\uC790, \uB2E8\uC704, \uACE0\uC720\uBA85\uC0AC \uBCC0\uACBD \uAE08\uC9C0",
+  "- \uC624\uD0C8\uC790, \uB744\uC5B4\uC4F0\uAE30, \uC904\uBC14\uAFC8, Markdown \uAD6C\uC870\uB9CC \uAD50\uC815",
+  "- \uACB0\uACFC\uB294 Markdown \uBCF8\uBB38\uB9CC \uCD9C\uB825"
+].join("\n");
 // src/index.ts
 async function parse2(input, options) {
+  const logger = createLoggerFromEnv().withRun(generateRunId("parse")).child({ component: "index.ts", stage: "detect" });
+  logger.log({ level: "info", event: "start", message: "parse \uD638\uCD9C \uC2DC\uC791" });
   let buffer;
   if (typeof input === "string") {
     try {
@@ -9496,6 +9847,13 @@ async function parse2(input, options) {
       buffer = toArrayBuffer(buf);
     } catch (err) {
       const msg = err instanceof Error && "code" in err && err.code === "ENOENT" ? `\uD30C\uC77C\uC744 \uCC3E\uC744 \uC218 \uC5C6\uC2B5\uB2C8\uB2E4: ${input}` : `\uD30C\uC77C \uC77D\uAE30 \uC2E4\uD328: ${input}`;
+      logger.log({
+        level: "error",
+        stage: "detect",
+        event: "error",
+        message: msg,
+        error: { code: "PARSE_ERROR", message: msg, name: err instanceof Error ? err.name : "Error" }
+      });
       return { success: false, fileType: "unknown", error: msg, code: "PARSE_ERROR" };
     }
   } else if (Buffer.isBuffer(input)) {
@@ -9504,13 +9862,23 @@ async function parse2(input, options) {
     buffer = input;
   }
   if (!buffer || buffer.byteLength === 0) {
+    logger.log({ level: "error", stage: "detect", event: "error", message: "\uBE48 \uC785\uB825 \uBC84\uD37C", error: { code: "EMPTY_INPUT", message: "\uBE48 \uC785\uB825 \uBC84\uD37C", name: "KordocError" } });
     return { success: false, fileType: "unknown", error: "\uBE48 \uBC84\uD37C\uC774\uAC70\uB098 \uC720\uD6A8\uD558\uC9C0 \uC54A\uC740 \uC785\uB825\uC785\uB2C8\uB2E4.", code: "EMPTY_INPUT" };
   }
   const MAX_FILE_SIZE = 500 * 1024 * 1024;
   if (buffer.byteLength > MAX_FILE_SIZE) {
+    logger.log({
+      level: "error",
+      stage: "detect",
+      event: "error",
+      message: "\uD30C\uC77C \uD06C\uAE30 \uCD08\uACFC",
+      meta: { size: buffer.byteLength },
+      error: { code: "FILE_TOO_LARGE", message: "\uD30C\uC77C \uD06C\uAE30 \uCD08\uACFC", name: "KordocError" }
+    });
     return { success: false, fileType: "unknown", error: `\uD30C\uC77C \uD06C\uAE30 \uCD08\uACFC: ${(buffer.byteLength / 1024 / 1024).toFixed(1)}MB (\uCD5C\uB300 500MB)`, code: "FILE_TOO_LARGE" };
   }
   const format = detectFormat(buffer);
+  logger.log({ level: "info", event: "done", message: "\uD3EC\uB9F7 \uAC10\uC9C0 \uC644\uB8CC", meta: { format } });
   switch (format) {
     case "hwpx": {
       const { format: zipFormat, zip } = await detectZipFormat(buffer);
@@ -9588,7 +9956,8 @@ async function parseHwpx(buffer, options, zip) {
     const { markdown, blocks, metadata, outline, warnings, images } = await parseHwpxDocument(buffer, options, zip);
     return { success: true, fileType: "hwpx", markdown, blocks, metadata, outline, warnings, images: images?.length ? images : void 0 };
   } catch (err) {
-    return { success: false, fileType: "hwpx", error: err instanceof Error ? err.message : "HWPX \uD30C\uC2F1 \uC2E4\uD328", code: classifyError(err) };
+    const normalized = normalizeKordocError(err, "HWPX \uD30C\uC2F1 \uC2E4\uD328", "finalize");
+    return { success: false, fileType: "hwpx", error: normalized.message, code: normalized.code ?? classifyError(normalized) };
   }
 }
 async function parseHwp(buffer, options) {
@@ -9596,7 +9965,8 @@ async function parseHwp(buffer, options) {
     const { markdown, blocks, metadata, outline, warnings, images } = parseHwp5Document(Buffer.from(buffer), options);
     return { success: true, fileType: "hwp", markdown, blocks, metadata, outline, warnings, images: images?.length ? images : void 0 };
   } catch (err) {
-    return { success: false, fileType: "hwp", error: err instanceof Error ? err.message : "HWP \uD30C\uC2F1 \uC2E4\uD328", code: classifyError(err) };
+    const normalized = normalizeKordocError(err, "HWP \uD30C\uC2F1 \uC2E4\uD328", "finalize");
+    return { success: false, fileType: "hwp", error: normalized.message, code: normalized.code ?? classifyError(normalized) };
   }
 }
 async function parsePdf(buffer, options) {
@@ -9604,8 +9974,15 @@ async function parsePdf(buffer, options) {
     const { markdown, blocks, metadata, outline, warnings, isImageBased } = await parsePdfDocument(buffer, options);
     return { success: true, fileType: "pdf", markdown, blocks, metadata, outline, warnings, isImageBased };
   } catch (err) {
+    const normalized = normalizeKordocError(err, "PDF \uD30C\uC2F1 \uC2E4\uD328", "finalize");
     const isImageBased = err instanceof Error && "isImageBased" in err ? true : void 0;
-    return { success: false, fileType: "pdf", error: err instanceof Error ? err.message : "PDF \uD30C\uC2F1 \uC2E4\uD328", code: classifyError(err), isImageBased };
+    return {
+      success: false,
+      fileType: "pdf",
+      error: normalized.message,
+      code: normalized.code ?? classifyError(normalized),
+      isImageBased
+    };
   }
 }
 async function parseXlsx(buffer, options, zip) {
@@ -9613,7 +9990,8 @@ async function parseXlsx(buffer, options, zip) {
     const { markdown, blocks, metadata, warnings } = await parseXlsxDocument(buffer, options, zip);
     return { success: true, fileType: "xlsx", markdown, blocks, metadata, warnings };
   } catch (err) {
-    return { success: false, fileType: "xlsx", error: err instanceof Error ? err.message : "XLSX \uD30C\uC2F1 \uC2E4\uD328", code: classifyError(err) };
+    const normalized = normalizeKordocError(err, "XLSX \uD30C\uC2F1 \uC2E4\uD328", "finalize");
+    return { success: false, fileType: "xlsx", error: normalized.message, code: normalized.code ?? classifyError(normalized) };
   }
 }
 async function parseDocx(buffer, options, zip) {
@@ -9621,7 +9999,8 @@ async function parseDocx(buffer, options, zip) {
     const { markdown, blocks, metadata, outline, warnings, images } = await parseDocxDocument(buffer, options, zip);
     return { success: true, fileType: "docx", markdown, blocks, metadata, outline, warnings, images: images?.length ? images : void 0 };
   } catch (err) {
-    return { success: false, fileType: "docx", error: err instanceof Error ? err.message : "DOCX \uD30C\uC2F1 \uC2E4\uD328", code: classifyError(err) };
+    const normalized = normalizeKordocError(err, "DOCX \uD30C\uC2F1 \uC2E4\uD328", "finalize");
+    return { success: false, fileType: "docx", error: normalized.message, code: normalized.code ?? classifyError(normalized) };
   }
 }
@@ -9813,4 +10192,4 @@ export {
 cfb/cfb.js:
   (*! crc32.js (C) 2014-present SheetJS -- http://sheetjs.com *)
 */
-//# sourceMappingURL=chunk-JGMLDBW5.js.map
+//# sourceMappingURL=chunk-KJEZPVEK.js.map