npm - @lobehub/chat - Versions diffs - 1.81.4 → 1.81.5 - Mend

@lobehub/chat 1.81.4 → 1.81.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (59) hide show

package/.eslintrc.js +1 -0
package/.github/workflows/release.yml +5 -0
package/.github/workflows/test.yml +5 -0
package/CHANGELOG.md +25 -0
package/changelog/v1.json +9 -0
package/locales/ar/models.json +3 -0
package/locales/bg-BG/models.json +3 -0
package/locales/de-DE/models.json +3 -0
package/locales/en-US/models.json +3 -0
package/locales/es-ES/models.json +3 -0
package/locales/fa-IR/models.json +3 -0
package/locales/fr-FR/models.json +3 -0
package/locales/it-IT/models.json +3 -0
package/locales/ja-JP/models.json +3 -0
package/locales/ko-KR/models.json +3 -0
package/locales/nl-NL/models.json +3 -0
package/locales/pl-PL/models.json +3 -0
package/locales/pt-BR/models.json +3 -0
package/locales/ru-RU/models.json +3 -0
package/locales/tr-TR/models.json +3 -0
package/locales/vi-VN/models.json +3 -0
package/locales/zh-CN/models.json +3 -0
package/locales/zh-TW/models.json +3 -0
package/package.json +2 -2
package/packages/file-loaders/README.md +63 -0
package/packages/file-loaders/package.json +42 -0
package/packages/file-loaders/src/index.ts +2 -0
package/packages/file-loaders/src/loadFile.ts +206 -0
package/packages/file-loaders/src/loaders/docx/__snapshots__/index.test.ts.snap +74 -0
package/packages/file-loaders/src/loaders/docx/fixtures/test.docx +0 -0
package/packages/file-loaders/src/loaders/docx/index.test.ts +41 -0
package/packages/file-loaders/src/loaders/docx/index.ts +73 -0
package/packages/file-loaders/src/loaders/excel/__snapshots__/index.test.ts.snap +58 -0
package/packages/file-loaders/src/loaders/excel/fixtures/test.xlsx +0 -0
package/packages/file-loaders/src/loaders/excel/index.test.ts +47 -0
package/packages/file-loaders/src/loaders/excel/index.ts +121 -0
package/packages/file-loaders/src/loaders/index.ts +19 -0
package/packages/file-loaders/src/loaders/pdf/__snapshots__/index.test.ts.snap +98 -0
package/packages/file-loaders/src/loaders/pdf/index.test.ts +49 -0
package/packages/file-loaders/src/loaders/pdf/index.ts +133 -0
package/packages/file-loaders/src/loaders/pptx/__snapshots__/index.test.ts.snap +40 -0
package/packages/file-loaders/src/loaders/pptx/fixtures/test.pptx +0 -0
package/packages/file-loaders/src/loaders/pptx/index.test.ts +47 -0
package/packages/file-loaders/src/loaders/pptx/index.ts +186 -0
package/packages/file-loaders/src/loaders/text/__snapshots__/index.test.ts.snap +15 -0
package/packages/file-loaders/src/loaders/text/fixtures/test.txt +2 -0
package/packages/file-loaders/src/loaders/text/index.test.ts +38 -0
package/packages/file-loaders/src/loaders/text/index.ts +53 -0
package/packages/file-loaders/src/types.ts +200 -0
package/packages/file-loaders/src/utils/isTextReadableFile.ts +68 -0
package/packages/file-loaders/src/utils/parser-utils.ts +112 -0
package/packages/file-loaders/test/__snapshots__/loaders.test.ts.snap +93 -0
package/packages/file-loaders/test/fixtures/test.csv +4 -0
package/packages/file-loaders/test/fixtures/test.docx +0 -0
package/packages/file-loaders/test/fixtures/test.epub +0 -0
package/packages/file-loaders/test/fixtures/test.md +3 -0
package/packages/file-loaders/test/fixtures/test.pptx +0 -0
package/packages/file-loaders/test/fixtures/test.txt +3 -0
package/packages/file-loaders/test/loaders.test.ts +39 -0

package/.eslintrc.js CHANGED Viewed

@@ -17,6 +17,7 @@ config.rules['unicorn/prefer-spread'] = 0;
 config.rules['unicorn/catch-error-name'] = 0;
 config.rules['unicorn/no-array-for-each'] = 0;
 config.rules['unicorn/prefer-number-properties'] = 0;
+config.rules['unicorn/prefer-query-selector'] = 0;
 config.rules['unicorn/no-array-callback-reference'] = 0;
 config.overrides = [

package/.github/workflows/release.yml CHANGED Viewed

@@ -22,6 +22,11 @@ jobs:
     steps:
       - uses: actions/checkout@v4
+      - name: Setup Node.js
+        uses: actions/setup-node@v4
+        with:
+          node-version: 22
       - name: Install bun
         uses: oven-sh/setup-bun@v1
         with:

package/.github/workflows/test.yml CHANGED Viewed

@@ -21,6 +21,11 @@ jobs:
     steps:
       - uses: actions/checkout@v4
+      - name: Setup Node.js
+        uses: actions/setup-node@v4
+        with:
+          node-version: 22
       - name: Install bun
         uses: oven-sh/setup-bun@v1
         with:

package/CHANGELOG.md CHANGED Viewed

@@ -2,6 +2,31 @@
 # Changelog
+### [Version 1.81.5](https://github.com/lobehub/lobe-chat/compare/v1.81.4...v1.81.5)
+<sup>Released on **2025-04-20**</sup>
+#### 🐛 Bug Fixes
+- **misc**: Lock nextauth to beta.25.
+<br/>
+<details>
+<summary><kbd>Improvements and Fixes</kbd></summary>
+#### What's fixed
+- **misc**: Lock nextauth to beta.25, closes [#7491](https://github.com/lobehub/lobe-chat/issues/7491) ([d1fd40d](https://github.com/lobehub/lobe-chat/commit/d1fd40d))
+</details>
+<div align="right">
+[![](https://img.shields.io/badge/-BACK_TO_TOP-151515?style=flat-square)](#readme-top)
+</div>
 ### [Version 1.81.4](https://github.com/lobehub/lobe-chat/compare/v1.81.3...v1.81.4)
 <sup>Released on **2025-04-19**</sup>

package/changelog/v1.json CHANGED Viewed

@@ -1,4 +1,13 @@
 [
+  {
+    "children": {
+      "fixes": [
+        "Lock nextauth to beta.25."
+      ]
+    },
+    "date": "2025-04-20",
+    "version": "1.81.5"
+  },
   {
     "children": {
       "fixes": [

package/locales/ar/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental هو أحدث نموذج ذكاء اصطناعي متعدد الوسائط التجريبي من Google، مع تحسينات ملحوظة في الجودة مقارنة بالإصدارات السابقة، خاصة في المعرفة العالمية، والبرمجة، والسياقات الطويلة."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "معاينة فلاش جمنّي 2.5 هي النموذج الأكثر كفاءة من جوجل، حيث تقدم مجموعة شاملة من الميزات."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "نموذج Gemini 2.5 Pro التجريبي هو الأكثر تقدمًا من Google، قادر على استنتاج المشكلات المعقدة في البرمجة والرياضيات وعلوم STEM، بالإضافة إلى تحليل مجموعات البيانات الكبيرة ومكتبات الشيفرات والمستندات باستخدام سياقات طويلة."
   },

package/locales/bg-BG/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental е най-новият експериментален многомодален AI модел на Google, който предлага значително подобрение в качеството в сравнение с предишните версии, особено по отношение на световни знания, код и дълги контексти."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview е моделът с най-добро съотношение цена-качество на Google, предлагащ пълна функционалност."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental е най-напредналият модел на мислене на Google, способен да разсъждава по сложни проблеми в код, математика и STEM области, както и да анализира големи набори от данни, кодови библиотеки и документи, използвайки дълъг контекст."
   },

package/locales/de-DE/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental ist Googles neuestes experimentelles multimodales KI-Modell, das im Vergleich zu früheren Versionen eine gewisse Qualitätsverbesserung aufweist, insbesondere in Bezug auf Weltwissen, Code und lange Kontexte."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview ist das kosteneffizienteste Modell von Google und bietet umfassende Funktionen."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental ist Googles fortschrittlichstes Denkmodell, das in der Lage ist, komplexe Probleme in den Bereichen Code, Mathematik und STEM zu analysieren. Es kann auch lange Kontexte nutzen, um große Datensätze, Codebasen und Dokumente zu analysieren."
   },

package/locales/en-US/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental is Google's latest experimental multimodal AI model, showing a quality improvement compared to previous versions, especially in world knowledge, coding, and long context."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview is Google's most cost-effective model, offering a comprehensive set of features."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental is Google's most advanced thinking model, capable of reasoning about complex problems in code, mathematics, and STEM fields, as well as analyzing large datasets, codebases, and documents using long context."
   },

package/locales/es-ES/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental es el último modelo de IA multimodal experimental de Google, con mejoras de calidad en comparación con versiones anteriores, especialmente en conocimiento del mundo, código y contextos largos."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview es el modelo más rentable de Google, que ofrece una funcionalidad completa."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y campos STEM, además de utilizar contextos largos para analizar grandes conjuntos de datos, bibliotecas de código y documentos."
   },

package/locales/fa-IR/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental جدیدترین مدل AI چندرسانه‌ای آزمایشی گوگل است که نسبت به نسخه‌های قبلی خود بهبود کیفیت قابل توجهی داشته است، به ویژه در زمینه دانش جهانی، کد و متن‌های طولانی."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "پیش‌نمایش فلش Gemini 2.5 مدل با بهترین قیمت و کیفیت گوگل است که امکانات جامع و کاملی را ارائه می‌دهد."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental پیشرفته‌ترین مدل تفکر گوگل است که قادر به استدلال در مورد مسائل پیچیده در زمینه‌های کد، ریاضیات و STEM می‌باشد و همچنین می‌تواند با استفاده از زمینه‌های طولانی، مجموعه‌های داده بزرگ، کتابخانه‌های کد و مستندات را تحلیل کند."
   },

package/locales/fr-FR/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental est le dernier modèle AI multimodal expérimental de Google, offrant une amélioration de la qualité par rapport aux versions précédentes, en particulier pour les connaissances générales, le code et les longs contextes."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview est le modèle le plus rentable de Google, offrant des fonctionnalités complètes."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental est le modèle de pensée le plus avancé de Google, capable de raisonner sur des problèmes complexes en code, mathématiques et dans les domaines STEM, tout en utilisant un long contexte pour analyser de grands ensembles de données, des bibliothèques de code et des documents."
   },

package/locales/it-IT/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental è il più recente modello AI multimodale sperimentale di Google, con un miglioramento della qualità rispetto alle versioni precedenti, in particolare per quanto riguarda la conoscenza del mondo, il codice e i contesti lunghi."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview è il modello più conveniente di Google, che offre funzionalità complete."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental è il modello di pensiero più avanzato di Google, in grado di ragionare su problemi complessi in codice, matematica e nei campi STEM, e di analizzare grandi set di dati, codebase e documenti utilizzando contesti lunghi."
   },

package/locales/ja-JP/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimentalは、Googleの最新の実験的なマルチモーダルAIモデルで、歴史的なバージョンと比較して品質が向上しています。特に、世界の知識、コード、長いコンテキストにおいて顕著です。"
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Previewは、Googleのコストパフォーマンスに優れたモデルで、包括的な機能を提供します。"
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimentalは、Googleの最先端の思考モデルであり、コード、数学、STEM分野の複雑な問題に対して推論を行うことができ、長いコンテキストを利用して大規模なデータセット、コードベース、文書を分析します。"
   },

package/locales/ko-KR/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental은 Google의 최신 실험적 다중 모달 AI 모델로, 이전 버전과 비교하여 품질이 향상되었습니다. 특히 세계 지식, 코드 및 긴 문맥에 대해 개선되었습니다."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview는 Google의 가장 가성비 높은 모델로, 포괄적인 기능을 제공합니다."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental은 Google의 최첨단 사고 모델로, 코드, 수학 및 STEM 분야의 복잡한 문제를 추론할 수 있으며, 긴 문맥을 활용하여 대규모 데이터 세트, 코드베이스 및 문서를 분석할 수 있습니다."
   },

package/locales/nl-NL/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental is Google's nieuwste experimentele multimodale AI-model, met aanzienlijke kwaliteitsverbeteringen ten opzichte van eerdere versies, vooral op het gebied van wereldkennis, code en lange context."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview is het meest kosteneffectieve model van Google, dat uitgebreide functionaliteit biedt."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental is Google's meest geavanceerde denkmodel, dat in staat is om te redeneren over complexe problemen in code, wiskunde en STEM-gebieden, en bovendien gebruik maakt van lange contexten om grote datasets, codebases en documenten te analyseren."
   },

package/locales/pl-PL/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental to najnowszy eksperymentalny model AI o wielu modalnościach od Google, który w porównaniu do wcześniejszych wersji oferuje pewne poprawy jakości, szczególnie w zakresie wiedzy o świecie, kodu i długiego kontekstu."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview to najbardziej opłacalny model Google, oferujący wszechstronne funkcje."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental to najnowocześniejszy model myślenia Google, zdolny do wnioskowania w zakresie kodu, matematyki i złożonych problemów w dziedzinie STEM, a także do analizy dużych zbiorów danych, repozytoriów kodu i dokumentów, wykorzystując długi kontekst."
   },

package/locales/pt-BR/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental é o mais recente modelo de IA multimodal experimental do Google, apresentando melhorias de qualidade em comparação com versões anteriores, especialmente em conhecimento mundial, código e contextos longos."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "O Gemini 2.5 Flash Preview é o modelo mais acessível do Google, oferecendo uma gama completa de funcionalidades."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "O Gemini 2.5 Pro Experimental é o modelo de pensamento mais avançado do Google, capaz de raciocinar sobre problemas complexos em código, matemática e áreas STEM, além de analisar grandes conjuntos de dados, repositórios de código e documentos utilizando contextos longos."
   },

package/locales/ru-RU/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental — это последняя экспериментальная многомодальная AI модель от Google, которая демонстрирует определенное улучшение качества по сравнению с предыдущими версиями, особенно в области мировых знаний, кода и длинного контекста."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview — это наиболее выгодная модель от Google, предлагающая широкий спектр возможностей."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental — это самая современная модель мышления от Google, способная рассуждать о сложных задачах в области кода, математики и STEM, а также анализировать большие наборы данных, кодовые базы и документы, используя длинный контекст."
   },

package/locales/tr-TR/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Deneysel, Google'ın en son deneysel çok modlu AI modelidir ve önceki sürümlere göre belirli bir kalite artışı sağlamaktadır, özellikle dünya bilgisi, kod ve uzun bağlam için."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Önizleme, Google'ın en iyi fiyat-performans oranına sahip modelidir ve kapsamlı özellikler sunar."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Deneysel, Google'ın en gelişmiş düşünce modeli olup, kod, matematik ve STEM alanlarındaki karmaşık sorunları akıl yürütebilmektedir. Ayrıca, uzun bağlamları kullanarak büyük veri setlerini, kod havuzlarını ve belgeleri analiz edebilir."
   },

package/locales/vi-VN/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental là mô hình AI đa phương tiện thử nghiệm mới nhất của Google, có sự cải thiện chất lượng nhất định so với các phiên bản trước, đặc biệt là về kiến thức thế giới, mã và ngữ cảnh dài."
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview là mô hình có giá trị tốt nhất của Google, cung cấp đầy đủ các tính năng."
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental là mô hình tư duy tiên tiến nhất của Google, có khả năng suy luận về mã, toán học và các vấn đề phức tạp trong lĩnh vực STEM, đồng thời có thể phân tích các tập dữ liệu lớn, kho mã và tài liệu bằng cách sử dụng ngữ cảnh dài."
   },

package/locales/zh-CN/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental 是 Google 最新的实验性多模态AI模型，与历史版本相比有一定的质量提升，特别是对于世界知识、代码和长上下文。"
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview 是 Google 性价比最高的模型，提供全面的功能。"
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro Experimental 是 Google 最先进的思维模型，能够对代码、数学和STEM领域的复杂问题进行推理，以及使用长上下文分析大型数据集、代码库和文档。"
   },

package/locales/zh-TW/models.json CHANGED Viewed

@@ -983,6 +983,9 @@
   "gemini-2.0-pro-exp-02-05": {
     "description": "Gemini 2.0 Pro Experimental 是 Google 最新的實驗性多模態AI模型，與歷史版本相比有一定的質量提升，特別是對於世界知識、代碼和長上下文。"
   },
+  "gemini-2.5-flash-preview-04-17": {
+    "description": "Gemini 2.5 Flash Preview 是 Google 性價比最高的模型，提供全面的功能。"
+  },
   "gemini-2.5-pro-exp-03-25": {
     "description": "Gemini 2.5 Pro 實驗版是 Google 最先進的思維模型，能夠對代碼、數學和 STEM 領域的複雜問題進行推理，還能利用長上下文來分析大型數據集、代碼庫和文檔。"
   },

package/package.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "name": "@lobehub/chat",
-  "version": "1.81.4",
+  "version": "1.81.5",
   "description": "Lobe Chat - an open-source, high-performance chatbot framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.",
   "keywords": [
     "framework",
@@ -200,7 +200,7 @@
     "modern-screenshot": "^4.6.0",
     "nanoid": "^5.1.5",
     "next": "^15.3.0",
-    "next-auth": "beta",
+    "next-auth": "5.0.0-beta.25",
     "next-mdx-remote": "^5.0.0",
     "nextjs-toploader": "^3.8.16",
     "numeral": "^2.0.6",

package/packages/file-loaders/README.md ADDED Viewed

@@ -0,0 +1,63 @@
+# @lobehub/file-loaders
+`@lobehub/file-loaders` 是 LobeChat 项目中的一个工具包，专门用于从本地文件路径加载各种类型的文件，并将其内容转换为标准化的 `Document` 对象数组。
+它的主要目的是提供一个统一的接口来读取不同的文件格式，提取其核心文本内容，并为后续处理（例如在 LobeChat 中进行文件预览、内容提取或将其作为知识库数据源）做好准备。
+## ✨ 功能特性
+- **统一接口**: 提供 `loadFile(filePath: string)` 函数作为核心入口点。
+- **自动类型检测**: 根据文件扩展名自动选择合适的加载方式。
+- **广泛的格式支持**:
+  - **纯文本类**: `.txt`, `.csv`, `.md`, `.json`, `.xml`, `.yaml`, `.html` 以及多种代码和配置文件格式。
+  - **PDF**: `.pdf` 文件。
+  - **Word**: `.docx` 文件。
+  - **Excel**: `.xlsx`, `.xls` 文件，每个工作表作为一个 `Page`。
+  - **PowerPoint**: `.pptx` 文件，每个幻灯片作为一个 `Page`。
+- **标准化输出**: 始终返回 `Promise<Document>`。 `Document` 对象代表一个加载的文件，其内部包含一个 `Page` 数组，代表文件的各个逻辑单元（页、幻灯片、工作表、文本块等）。
+- **层级结构**: 采用 `Document` 包含 `Page[]` 的结构，更好地反映文件原始组织方式。
+- **丰富的元数据**: 在 `Document` 和 `Page` 层面提供详细的元数据，包括文件信息、内容统计和结构信息。
+## 核心数据结构
+`loadFile` 函数返回一个 `FileDocument` 对象，包含文件级信息和其所有逻辑页面 / 块 (`DocumentPage`)。
+### `FileDocument` Interface
+| 字段              | 类型              | 描述                                                           |
+| :---------------- | :---------------- | :------------------------------------------------------------- |
+| `content`         | `string`          | 文件内容 (聚合后的内容)                                        |
+| `createdTime`     | `Date`            | 文件创建时间戳。                                               |
+| `fileType`        | `string`          | 文件类型或扩展名。                                             |
+| `filename`        | `string`          | 原始文件名。                                                   |
+| `metadata`        | `object`          | 文件级别的元数据。                                             |
+| `metadata.author` | `string?`         | 文档作者 (如果可用)。                                          |
+| `metadata.error`  | `string?`         | 如果整个文件加载失败，记录错误信息。                           |
+| `metadata.title`  | `string?`         | 文档标题 (如果可用)。                                          |
+| `...`             | `any`             | 其他文件级别的元数据。                                         |
+| `modifiedTime`    | `Date`            | 文件最后修改时间戳。                                           |
+| `pages`           | `DocumentPage[]?` | 包含文档中所有逻辑页面 / 块的数组 (可选)。                     |
+| `source`          | `string`          | 原始文件的完整路径。                                           |
+| `totalCharCount`  | `number`          | 整个文档的总字符数 (所有 `DocumentPage` 的 `charCount` 之和)。 |
+| `totalLineCount`  | `number`          | 整个文档的总行数 (所有 `DocumentPage` 的 `lineCount` 之和)。   |
+### `DocumentPage` Interface
+| 字段                       | 类型      | 描述                         |
+| :------------------------- | :-------- | :--------------------------- |
+| `charCount`                | `number`  | 此页 / 块内容的字符数。      |
+| `lineCount`                | `number`  | 此页 / 块内容的行数。        |
+| `metadata`                 | `object`  | 与此页 / 块相关的元数据。    |
+| `metadata.chunkIndex`      | `number?` | 如果分割成块，当前块的索引。 |
+| `metadata.error`           | `string?` | 处理此页 / 块时发生的错误。  |
+| `metadata.lineNumberEnd`   | `number?` | 在原始文件中的结束行号。     |
+| `metadata.lineNumberStart` | `number?` | 在原始文件中的起始行号。     |
+| `metadata.pageNumber`      | `number?` | 页码 (适用于 PDF, DOCX)。    |
+| `metadata.sectionTitle`    | `string?` | 相关的章节标题。             |
+| `metadata.sheetName`       | `string?` | 工作表名称 (适用于 XLSX)。   |
+| `metadata.slideNumber`     | `number?` | 幻灯片编号 (适用于 PPTX)。   |
+| `metadata.totalChunks`     | `number?` | 如果分割成块，总块数。       |
+| `...`                      | `any`     | 其他特定于页 / 块的元数据。  |
+| `pageContent`              | `string`  | 此页 / 块的核心文本内容。    |
+如果你对我们的项目感兴趣，欢迎在 [GitHub](https://github.com/lobehub/lobe-chat) 上查看、点赞或贡献代码！

package/packages/file-loaders/package.json ADDED Viewed

@@ -0,0 +1,42 @@
+{
+  "name": "@lobechat/file-loaders",
+  "version": "1.0.0",
+  "private": true,
+  "description": "Utilities for reading and processing various file types",
+  "keywords": [
+    "file",
+    "loader",
+    "parser",
+    "lobehub"
+  ],
+  "homepage": "https://github.com/lobehub/lobe-chat/tree/master/packages/file-loaders",
+  "bugs": {
+    "url": "https://github.com/lobehub/lobe-chat/issues/new"
+  },
+  "repository": {
+    "type": "git",
+    "url": "https://github.com/lobehub/lobe-chat.git"
+  },
+  "author": "LobeHub <i@lobehub.com>",
+  "sideEffects": false,
+  "main": "./src/index.ts",
+  "dependencies": {
+    "@langchain/community": "^0.3.41",
+    "@langchain/core": "^0.3.45",
+    "@xmldom/xmldom": "^0.9.8",
+    "concat-stream": "^2.0.0",
+    "mammoth": "^1.8.0",
+    "officeparser": "^5.1.1",
+    "pdfjs-dist": "4.8.69",
+    "xlsx": "^0.18.5",
+    "yauzl": "^3.2.0"
+  },
+  "devDependencies": {
+    "@types/concat-stream": "^2.0.3",
+    "@types/yauzl": "^2.10.3",
+    "typescript": "^5"
+  },
+  "peerDependencies": {
+    "typescript": ">=5"
+  }
+}

package/packages/file-loaders/src/index.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ export * from './loadFile';
2	+ export * from './types';

package/packages/file-loaders/src/loadFile.ts ADDED Viewed

@@ -0,0 +1,206 @@
+import { stat } from 'node:fs/promises';
+import * as path from 'node:path';
+import { fileLoaders } from './loaders';
+import { TextLoader } from './loaders/text';
+import { FileDocument, FileMetadata, SupportedFileType } from './types';
+import type { DocumentPage, FileLoaderInterface } from './types';
+import { isTextReadableFile } from './utils/isTextReadableFile';
+/**
+ * Determines the file type based on the filename extension.
+ * @param filePath The path to the file.
+ * @returns The determined file type or 'txt' if text-readable, undefined otherwise.
+ */
+const getFileType = (filePath: string): SupportedFileType | undefined => {
+  const extension = path.extname(filePath).toLowerCase().replace('.', '');
+  if (!extension) return 'txt'; // Treat files without extension as text?
+  // Prioritize checking if it's a generally text-readable type
+  if (isTextReadableFile(extension)) {
+    return 'txt';
+  }
+  // Handle specific non-text or complex types
+  switch (extension) {
+    case 'pdf': {
+      return 'pdf';
+    }
+    case 'docx': {
+      return 'docx';
+    }
+    case 'xlsx':
+    case 'xls': {
+      return 'excel';
+    }
+    case 'pptx': {
+      return 'pptx';
+    }
+    default: {
+      // If not text-readable and not a specific known type, it's unsupported
+      return undefined;
+    }
+  }
+};
+// Default fallback loader class
+const DefaultLoader = TextLoader;
+/**
+ * Loads a file from the specified path, automatically detecting the file type
+ * and using the appropriate loader class.
+ *
+ * @param filePath The path to the file to load.
+ * @param fileMetadata Optional metadata to override information read from the filesystem.
+ * @returns A Promise resolving to a FileDocument object.
+ */
+export const loadFile = async (
+  filePath: string,
+  fileMetadata?: FileMetadata,
+): Promise<FileDocument> => {
+  let stats;
+  let fsError: string | undefined;
+  try {
+    stats = await stat(filePath);
+  } catch (e) {
+    const error = e as Error;
+    console.error(`Error getting file stats for ${filePath}: ${error.message}`);
+    fsError = `Failed to access file stats: ${error.message}`;
+  }
+  // Determine base file info from path and stats (if available)
+  const fileExtension = path.extname(filePath).slice(1).toLowerCase();
+  const baseFilename = path.basename(filePath);
+  // Apply overrides from fileMetadata or use defaults
+  const source = fileMetadata?.source ?? filePath;
+  const filename = fileMetadata?.filename ?? baseFilename;
+  const fileType = fileMetadata?.fileType ?? fileExtension;
+  const createdTime = fileMetadata?.createdTime ?? stats?.ctime ?? new Date();
+  const modifiedTime = fileMetadata?.modifiedTime ?? stats?.mtime ?? new Date();
+  const paserType = getFileType(filePath);
+  // Select the loader CLASS based on the determined fileType, fallback to DefaultLoader
+  const LoaderClass: new () => FileLoaderInterface = paserType
+    ? fileLoaders[paserType]
+    : DefaultLoader;
+  if (!paserType) {
+    console.warn(
+      `No specific loader found for file type '${fileType}'. Using default loader (${DefaultLoader.name}) as fallback.`,
+    );
+  }
+  let pages: DocumentPage[] = [];
+  let aggregatedContent = '';
+  let loaderError: string | undefined;
+  let aggregationError: string | undefined;
+  let metadataError: string | undefined;
+  let loaderSpecificMetadata: any | undefined;
+  // Instantiate the loader
+  const loaderInstance = new LoaderClass();
+  // If we couldn't even get stats, skip loader execution
+  if (!fsError) {
+    try {
+      // 1. Load pages using the instance
+      pages = await loaderInstance.loadPages(filePath);
+      try {
+        // 2. Aggregate content using the instance
+        aggregatedContent = await loaderInstance.aggregateContent(pages);
+      } catch (aggError) {
+        const error = aggError as Error;
+        console.error(
+          `Error aggregating content for ${filePath} using ${LoaderClass.name}: ${error.message}`,
+        );
+        aggregationError = `Content aggregation failed: ${error.message}`;
+        // Keep the pages loaded, but content might be empty/incomplete
+      }
+      // 3. Attach document-specific metadata if loader supports it
+      if (typeof loaderInstance.attachDocumentMetadata === 'function') {
+        try {
+          loaderSpecificMetadata = await loaderInstance.attachDocumentMetadata(filePath);
+        } catch (metaErr) {
+          const error = metaErr as Error;
+          console.error(
+            `Error attaching metadata for ${filePath} using ${LoaderClass.name}: ${error.message}`,
+          );
+          metadataError = `Metadata attachment failed: ${error.message}`;
+        }
+      }
+    } catch (loadErr) {
+      const error = loadErr as Error;
+      console.error(
+        `Error loading pages for ${filePath} using ${LoaderClass.name}: ${error.message}`,
+      );
+      loaderError = `Loader execution failed: ${error.message}`;
+      // Provide a minimal error page if loader failed critically
+      pages = [
+        {
+          charCount: 0,
+          lineCount: 0,
+          metadata: { error: loaderError },
+          pageContent: '',
+        },
+      ];
+      // Aggregated content remains empty
+    }
+  } else {
+    // If stats failed, create a minimal error page
+    pages = [
+      {
+        charCount: 0,
+        lineCount: 0,
+        metadata: { error: fsError },
+        pageContent: '',
+      },
+    ];
+    // Aggregated content remains empty
+  }
+  // Calculate totals from the loaded pages
+  let totalCharCount = 0;
+  let totalLineCount = 0;
+  for (const page of pages) {
+    totalCharCount += page.charCount;
+    totalLineCount += page.lineCount;
+  }
+  // Combine all potential errors
+  const combinedError =
+    [fsError, loaderError, aggregationError, metadataError].filter(Boolean).join('; ') || undefined;
+  // Construct the final FileDocument
+  const fileDocument: FileDocument = {
+    content: aggregatedContent, // Use content from aggregateContent
+    createdTime,
+    fileType,
+    filename,
+    metadata: {
+      // Include combined errors
+      error: combinedError,
+      // Add loader specific metadata under a namespace
+      loaderSpecific: loaderSpecificMetadata ?? undefined,
+      // Add other file-level metadata
+      ...fileMetadata,
+    },
+    modifiedTime,
+    pages, // Use pages from loadPages
+    source,
+    totalCharCount,
+    totalLineCount,
+  };
+  // Clean up undefined error field if no error occurred
+  if (!fileDocument.metadata.error) {
+    delete fileDocument.metadata.error;
+  }
+  return fileDocument;
+};