PyPI - docid - Versions diffs - 0.1.4__tar.gz → 0.1.5__tar.gz - Mend

docid 0.1.4tar.gz → 0.1.5tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (26) hide show

{docid-0.1.4 → docid-0.1.5}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: docid
-Version: 0.1.4
+Version: 0.1.5
 Summary: Deterministyczny generator identyfikatorów dokumentów z OCR
 Home-page: https://github.com/softreck/docid
 Author: Softreck
@@ -55,7 +55,7 @@ Dynamic: author
 Dynamic: home-page
 Dynamic: requires-python
-# EXEF Document ID Generator
+# DOC Document ID Generator
 Deterministyczny generator identyfikatorów dokumentów z OCR. Generuje **zawsze ten sam ID** dla tego samego dokumentu, niezależnie od formatu źródłowego (skan, PDF, KSeF XML, obrazy).
@@ -71,12 +71,12 @@ Jak uzyskać **ten sam identyfikator** dla wszystkich trzech?
 ## ✨ Rozwiązanie
 ```python
-from exef_docid import get_document_id
+from docid import get_document_id
 # Wszystkie trzy zwrócą TEN SAM ID!
-get_document_id("faktura_skan.jpg")    # EXEF-FV-A7B3C9D2E1F04856
-get_document_id("faktura.pdf")          # EXEF-FV-A7B3C9D2E1F04856
-get_document_id("faktura_ksef.xml")     # EXEF-FV-A7B3C9D2E1F04856
+get_document_id("faktura_skan.jpg")    # DOC-FV-A7B3C9D2E1F04856
+get_document_id("faktura.pdf")          # DOC-FV-A7B3C9D2E1F04856
+get_document_id("faktura_ksef.xml")     # DOC-FV-A7B3C9D2E1F04856
 ```
 ## 📦 Instalacja
@@ -85,8 +85,8 @@ get_document_id("faktura_ksef.xml")     # EXEF-FV-A7B3C9D2E1F04856
 ```bash
 # Klonuj repozytorium
-git clone https://github.com/softreck/exef-pl.git
-cd exef-pl/app/docid
+git clone https://github.com/softreck/doc-pl.git
+cd doc-pl/app/docid
 # Utwórz środowisko wirtualne
 python3 -m venv venv
@@ -124,7 +124,7 @@ pip install docid[all]
 ### Generator ID dla dokumentów biznesowych
 ```python
-from exef_docid import generate_invoice_id, generate_receipt_id, generate_contract_id
+from docid import generate_invoice_id, generate_receipt_id, generate_contract_id
 # Faktura VAT
 invoice_id = generate_invoice_id(
@@ -133,7 +133,7 @@ invoice_id = generate_invoice_id(
     issue_date="2025-01-15",
     gross_amount=1230.50
 )
-print(invoice_id)  # EXEF-FV-F0BE35240C77B2DB
+print(invoice_id)  # DOC-FV-F0BE35240C77B2DB
 # Paragon fiskalny
 receipt_id = generate_receipt_id(
@@ -142,7 +142,7 @@ receipt_id = generate_receipt_id(
     gross_amount=37.88,
     cash_register_number="001"
 )
-print(receipt_id)  # EXEF-PAR-8142B3FC69D7778C
+print(receipt_id)  # DOC-PAR-8142B3FC69D7778C
 # Umowa
 contract_id = generate_contract_id(
@@ -151,13 +151,13 @@ contract_id = generate_contract_id(
     contract_date="2025-01-15",
     contract_number="001/2025"
 )
-print(contract_id)  # EXEF-UMO-C54CB968D1342642
+print(contract_id)  # DOC-UMO-C54CB968D1342642
 ```
 ### Uniwersalny generator ID (dowolne dokumenty)
 ```python
-from exef_docid import generate_universal_document_id
+from docid import generate_universal_document_id
 # Dowolny dokument
 doc_id = generate_universal_document_id("dokument.pdf")
@@ -175,20 +175,20 @@ print(doc_id)  # UNIV-IMG-E2E2131A335F0918
 ### Pełne przetwarzanie z OCR
 ```python
-from exef_docid import process_document, get_document_id
+from docid import process_document, get_document_id
 # Pełne przetwarzanie z ekstrakcją danych
 result = process_document("faktura.pdf")
-print(result.document_id)           # EXEF-FV-F0BE35240C77B2DB
+print(result.document_id)           # DOC-FV-F0BE35240C77B2DB
 print(result.extraction.issuer_nip) # 5213017228
 print(result.extraction.invoice_number) # FV/2025/00142
 # Tylko wygeneruj ID
 doc_id = get_document_id("paragon.jpg")
-print(doc_id)  # EXEF-PAR-8142B3FC69D7778C
+print(doc_id)  # DOC-PAR-8142B3FC69D7778C
 # Weryfikacja ID
-is_valid = verify_document_id("skan.png", "EXEF-FV-F0BE35240C77B2DB")
+is_valid = verify_document_id("skan.png", "DOC-FV-F0BE35240C77B2DB")
 print(is_valid)  # True/False
 ```
@@ -250,7 +250,7 @@ curl -X POST -F "file=@faktura.pdf" http://localhost:8000/process
 **2. Weryfikacja ID:**
 ```bash
-curl -X POST -F "file=@skan.jpg" -F "document_id=EXEF-FV-F0BE35240C77B2DB" http://localhost:8000/verify
+curl -X POST -F "file=@skan.jpg" -F "document_id=DOC-FV-F0BE35240C77B2DB" http://localhost:8000/verify
 ```
 **3. Porównywanie plików:**
@@ -303,7 +303,7 @@ make run-web          # Uruchom serwer API
 ### 1. Przetwarzanie faktur
 ```python
-from exef_docid import process_document
+from docid import process_document
 # Przetwarzanie faktury PDF
 result = process_document("faktura.pdf")
@@ -319,7 +319,7 @@ print(f"ID: {result.document_id}")
 ### 2. Porównywanie dokumentów
 ```python
-from exef_docid import compare_universal_documents
+from docid import compare_universal_documents
 # Porównaj dwa dokumenty
 comparison = compare_universal_documents("dokument1.pdf", "dokument2.png")
@@ -331,10 +331,10 @@ print(f"Ten sam rozmiar: {comparison['same_size']}")
 ### 3. Weryfikacja ID
 ```python
-from exef_docid import verify_document_id, verify_universal_document_id
+from docid import verify_document_id, verify_universal_document_id
 # Weryfikacja ID dokumentu biznesowego
-is_valid = verify_document_id("faktura.pdf", "EXEF-FV-F0BE35240C77B2DB")
+is_valid = verify_document_id("faktura.pdf", "DOC-FV-F0BE35240C77B2DB")
 # Weryfikacja uniwersalnego ID
 is_valid = verify_universal_document_id("dowolny_plik.jpg", "UNIV-IMG-4225A473A725978D")
@@ -344,7 +344,7 @@ is_valid = verify_universal_document_id("dowolny_plik.jpg", "UNIV-IMG-4225A473A7
 ```python
 from pathlib import Path
-from exef_docid import generate_universal_document_id
+from docid import generate_universal_document_id
 # Przetwarzaj wszystkie pliki w folderze
 documents_dir = Path("dokumenty")
@@ -372,16 +372,16 @@ for file_path in documents_dir.glob("*"):
 **TAK!** Formaty PNG i JPG są w pełni przetwarzane przez OCR:
 ```python
-from exef_docid import process_document
+from docid import process_document
 # Przetwarzanie skanu PNG z OCR
 result = process_document("skan_faktury.png")
-print(result.document_id)  # EXEF-FV-F0BE35240C77B2DB
+print(result.document_id)  # DOC-FV-F0BE35240C77B2DB
 print(result.extraction.issuer_nip)  # 5213017228
 # Przetwarzanie zdjęcia JPG z OCR
 result = process_document("zdjecie_paragonu.jpg")
-print(result.document_id)  # EXEF-PAR-8142B3FC69D7778C
+print(result.document_id)  # DOC-PAR-8142B3FC69D7778C
 ```
 #### Co jest ekstrahowane z PNG/JPG:
@@ -402,13 +402,13 @@ print(result.document_id)  # EXEF-PAR-8142B3FC69D7778C
 ```python
 # Ten sam dokument w różnych formatach - ten sam ID biznesowy
-generate_invoice_id(...)  # -> EXEF-FV-F0BE35240C77B2DB
+generate_invoice_id(...)  # -> DOC-FV-F0BE35240C77B2DB
 # Przetwarzanie przez OCR daje ten sam wynik
-process_document("faktura.pdf")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.png")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.jpg")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.xml")    # -> EXEF-FV-F0BE35240C77B2DB
+process_document("faktura.pdf")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.png")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.jpg")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.xml")    # -> DOC-FV-F0BE35240C77B2DB
 # Różne ID uniwersalne dla różnych formatów
 generate_universal_document_id("faktura.pdf")  # -> UNIV-PDF-...
@@ -451,25 +451,25 @@ TEST WSZYSTKICH FORMATÓW - PDF, PNG, JPG, HTML, TXT, XML
 ================================================================================
 FOLDER: FAKTURY (invoices/)
-  📄 faktura_full.pdf          (.pdf ) [   2242B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.xml          (.xml ) [   2077B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.html         (.html) [   3334B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.jpg          (.jpg ) [  28182B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.png          (.png ) [  32325B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.txt          (.txt ) [   2839B] -> EXEF-FV-F0BE35240C77B2DB
+  📄 faktura_full.pdf          (.pdf ) [   2242B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.xml          (.xml ) [   2077B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.html         (.html) [   3334B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.jpg          (.jpg ) [  28182B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.png          (.png ) [  32325B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.txt          (.txt ) [   2839B] -> DOC-FV-F0BE35240C77B2DB
   📊 Podsumowanie folderu invoices:
      Plików przetworzonych: 6
      Unikalnych ID: 1
      Wszystkie identyczne: True
-     ✅ ID: EXEF-FV-F0BE35240C77B2DB
+     ✅ ID: DOC-FV-F0BE35240C77B2DB
 ```
 ## 📁 Struktura projektu
 ```
 docid/
-├── exef_docid/              # Główny pakiet
+├── docid/              # Główny pakiet
 │   ├── __init__.py         # Eksporty API
 │   ├── document_id.py      # Generator ID biznesowy
 │   ├── document_id_universal.py # Generator ID uniwersalny
@@ -493,7 +493,7 @@ docid/
 ### Silniki OCR
 ```python
-from exef_docid import OCREngine, get_pipeline
+from docid import OCREngine, get_pipeline
 # Użyj PaddleOCR (domyślnie)
 pipeline = get_pipeline(ocr_engine=OCREngine.PADDLE)
@@ -505,7 +505,7 @@ pipeline = get_pipeline(ocr_engine=OCREngine.TESSERACT)
 ### Custom prefix
 ```python
-from exef_docid import UniversalDocumentIDGenerator
+from docid import UniversalDocumentIDGenerator
 generator = UniversalDocumentIDGenerator(prefix="MOJA")
 doc_id = generator.generate_universal_id("plik.pdf")
@@ -549,8 +549,8 @@ MIT License - zobacz [LICENSE](LICENSE) dla szczegółów.
 ## 🆘 Wsparcie
 - 📧 Email: info@softreck.dev
-- 🐛 Issues: [GitHub Issues](https://github.com/softreck/exef-pl/issues)
-- 📖 Dokumentacja: [GitHub Wiki](https://github.com/softreck/exef-pl/wiki)
+- 🐛 Issues: [GitHub Issues](https://github.com/softreck/doc-pl/issues)
+- 📖 Dokumentacja: [GitHub Wiki](https://github.com/softreck/doc-pl/wiki)
 ## 🗺️ Roadmap
@@ -563,4 +563,4 @@ MIT License - zobacz [LICENSE](LICENSE) dla szczegółów.
 ---
-**EXEF Document ID Generator** - Deterministyczne identyfikatory dla każdego dokumentu! 🚀
+**DOC Document ID Generator** - Deterministyczne identyfikatory dla każdego dokumentu! 🚀

{docid-0.1.4 → docid-0.1.5}/README.md RENAMED Viewed

@@ -1,4 +1,4 @@
-# EXEF Document ID Generator
+# DOC Document ID Generator
 Deterministyczny generator identyfikatorów dokumentów z OCR. Generuje **zawsze ten sam ID** dla tego samego dokumentu, niezależnie od formatu źródłowego (skan, PDF, KSeF XML, obrazy).
@@ -14,12 +14,12 @@ Jak uzyskać **ten sam identyfikator** dla wszystkich trzech?
 ## ✨ Rozwiązanie
 ```python
-from exef_docid import get_document_id
+from docid import get_document_id
 # Wszystkie trzy zwrócą TEN SAM ID!
-get_document_id("faktura_skan.jpg")    # EXEF-FV-A7B3C9D2E1F04856
-get_document_id("faktura.pdf")          # EXEF-FV-A7B3C9D2E1F04856
-get_document_id("faktura_ksef.xml")     # EXEF-FV-A7B3C9D2E1F04856
+get_document_id("faktura_skan.jpg")    # DOC-FV-A7B3C9D2E1F04856
+get_document_id("faktura.pdf")          # DOC-FV-A7B3C9D2E1F04856
+get_document_id("faktura_ksef.xml")     # DOC-FV-A7B3C9D2E1F04856
 ```
 ## 📦 Instalacja
@@ -28,8 +28,8 @@ get_document_id("faktura_ksef.xml")     # EXEF-FV-A7B3C9D2E1F04856
 ```bash
 # Klonuj repozytorium
-git clone https://github.com/softreck/exef-pl.git
-cd exef-pl/app/docid
+git clone https://github.com/softreck/doc-pl.git
+cd doc-pl/app/docid
 # Utwórz środowisko wirtualne
 python3 -m venv venv
@@ -67,7 +67,7 @@ pip install docid[all]
 ### Generator ID dla dokumentów biznesowych
 ```python
-from exef_docid import generate_invoice_id, generate_receipt_id, generate_contract_id
+from docid import generate_invoice_id, generate_receipt_id, generate_contract_id
 # Faktura VAT
 invoice_id = generate_invoice_id(
@@ -76,7 +76,7 @@ invoice_id = generate_invoice_id(
     issue_date="2025-01-15",
     gross_amount=1230.50
 )
-print(invoice_id)  # EXEF-FV-F0BE35240C77B2DB
+print(invoice_id)  # DOC-FV-F0BE35240C77B2DB
 # Paragon fiskalny
 receipt_id = generate_receipt_id(
@@ -85,7 +85,7 @@ receipt_id = generate_receipt_id(
     gross_amount=37.88,
     cash_register_number="001"
 )
-print(receipt_id)  # EXEF-PAR-8142B3FC69D7778C
+print(receipt_id)  # DOC-PAR-8142B3FC69D7778C
 # Umowa
 contract_id = generate_contract_id(
@@ -94,13 +94,13 @@ contract_id = generate_contract_id(
     contract_date="2025-01-15",
     contract_number="001/2025"
 )
-print(contract_id)  # EXEF-UMO-C54CB968D1342642
+print(contract_id)  # DOC-UMO-C54CB968D1342642
 ```
 ### Uniwersalny generator ID (dowolne dokumenty)
 ```python
-from exef_docid import generate_universal_document_id
+from docid import generate_universal_document_id
 # Dowolny dokument
 doc_id = generate_universal_document_id("dokument.pdf")
@@ -118,20 +118,20 @@ print(doc_id)  # UNIV-IMG-E2E2131A335F0918
 ### Pełne przetwarzanie z OCR
 ```python
-from exef_docid import process_document, get_document_id
+from docid import process_document, get_document_id
 # Pełne przetwarzanie z ekstrakcją danych
 result = process_document("faktura.pdf")
-print(result.document_id)           # EXEF-FV-F0BE35240C77B2DB
+print(result.document_id)           # DOC-FV-F0BE35240C77B2DB
 print(result.extraction.issuer_nip) # 5213017228
 print(result.extraction.invoice_number) # FV/2025/00142
 # Tylko wygeneruj ID
 doc_id = get_document_id("paragon.jpg")
-print(doc_id)  # EXEF-PAR-8142B3FC69D7778C
+print(doc_id)  # DOC-PAR-8142B3FC69D7778C
 # Weryfikacja ID
-is_valid = verify_document_id("skan.png", "EXEF-FV-F0BE35240C77B2DB")
+is_valid = verify_document_id("skan.png", "DOC-FV-F0BE35240C77B2DB")
 print(is_valid)  # True/False
 ```
@@ -193,7 +193,7 @@ curl -X POST -F "file=@faktura.pdf" http://localhost:8000/process
 **2. Weryfikacja ID:**
 ```bash
-curl -X POST -F "file=@skan.jpg" -F "document_id=EXEF-FV-F0BE35240C77B2DB" http://localhost:8000/verify
+curl -X POST -F "file=@skan.jpg" -F "document_id=DOC-FV-F0BE35240C77B2DB" http://localhost:8000/verify
 ```
 **3. Porównywanie plików:**
@@ -246,7 +246,7 @@ make run-web          # Uruchom serwer API
 ### 1. Przetwarzanie faktur
 ```python
-from exef_docid import process_document
+from docid import process_document
 # Przetwarzanie faktury PDF
 result = process_document("faktura.pdf")
@@ -262,7 +262,7 @@ print(f"ID: {result.document_id}")
 ### 2. Porównywanie dokumentów
 ```python
-from exef_docid import compare_universal_documents
+from docid import compare_universal_documents
 # Porównaj dwa dokumenty
 comparison = compare_universal_documents("dokument1.pdf", "dokument2.png")
@@ -274,10 +274,10 @@ print(f"Ten sam rozmiar: {comparison['same_size']}")
 ### 3. Weryfikacja ID
 ```python
-from exef_docid import verify_document_id, verify_universal_document_id
+from docid import verify_document_id, verify_universal_document_id
 # Weryfikacja ID dokumentu biznesowego
-is_valid = verify_document_id("faktura.pdf", "EXEF-FV-F0BE35240C77B2DB")
+is_valid = verify_document_id("faktura.pdf", "DOC-FV-F0BE35240C77B2DB")
 # Weryfikacja uniwersalnego ID
 is_valid = verify_universal_document_id("dowolny_plik.jpg", "UNIV-IMG-4225A473A725978D")
@@ -287,7 +287,7 @@ is_valid = verify_universal_document_id("dowolny_plik.jpg", "UNIV-IMG-4225A473A7
 ```python
 from pathlib import Path
-from exef_docid import generate_universal_document_id
+from docid import generate_universal_document_id
 # Przetwarzaj wszystkie pliki w folderze
 documents_dir = Path("dokumenty")
@@ -315,16 +315,16 @@ for file_path in documents_dir.glob("*"):
 **TAK!** Formaty PNG i JPG są w pełni przetwarzane przez OCR:
 ```python
-from exef_docid import process_document
+from docid import process_document
 # Przetwarzanie skanu PNG z OCR
 result = process_document("skan_faktury.png")
-print(result.document_id)  # EXEF-FV-F0BE35240C77B2DB
+print(result.document_id)  # DOC-FV-F0BE35240C77B2DB
 print(result.extraction.issuer_nip)  # 5213017228
 # Przetwarzanie zdjęcia JPG z OCR
 result = process_document("zdjecie_paragonu.jpg")
-print(result.document_id)  # EXEF-PAR-8142B3FC69D7778C
+print(result.document_id)  # DOC-PAR-8142B3FC69D7778C
 ```
 #### Co jest ekstrahowane z PNG/JPG:
@@ -345,13 +345,13 @@ print(result.document_id)  # EXEF-PAR-8142B3FC69D7778C
 ```python
 # Ten sam dokument w różnych formatach - ten sam ID biznesowy
-generate_invoice_id(...)  # -> EXEF-FV-F0BE35240C77B2DB
+generate_invoice_id(...)  # -> DOC-FV-F0BE35240C77B2DB
 # Przetwarzanie przez OCR daje ten sam wynik
-process_document("faktura.pdf")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.png")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.jpg")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.xml")    # -> EXEF-FV-F0BE35240C77B2DB
+process_document("faktura.pdf")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.png")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.jpg")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.xml")    # -> DOC-FV-F0BE35240C77B2DB
 # Różne ID uniwersalne dla różnych formatów
 generate_universal_document_id("faktura.pdf")  # -> UNIV-PDF-...
@@ -394,25 +394,25 @@ TEST WSZYSTKICH FORMATÓW - PDF, PNG, JPG, HTML, TXT, XML
 ================================================================================
 FOLDER: FAKTURY (invoices/)
-  📄 faktura_full.pdf          (.pdf ) [   2242B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.xml          (.xml ) [   2077B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.html         (.html) [   3334B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.jpg          (.jpg ) [  28182B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.png          (.png ) [  32325B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.txt          (.txt ) [   2839B] -> EXEF-FV-F0BE35240C77B2DB
+  📄 faktura_full.pdf          (.pdf ) [   2242B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.xml          (.xml ) [   2077B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.html         (.html) [   3334B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.jpg          (.jpg ) [  28182B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.png          (.png ) [  32325B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.txt          (.txt ) [   2839B] -> DOC-FV-F0BE35240C77B2DB
   📊 Podsumowanie folderu invoices:
      Plików przetworzonych: 6
      Unikalnych ID: 1
      Wszystkie identyczne: True
-     ✅ ID: EXEF-FV-F0BE35240C77B2DB
+     ✅ ID: DOC-FV-F0BE35240C77B2DB
 ```
 ## 📁 Struktura projektu
 ```
 docid/
-├── exef_docid/              # Główny pakiet
+├── docid/              # Główny pakiet
 │   ├── __init__.py         # Eksporty API
 │   ├── document_id.py      # Generator ID biznesowy
 │   ├── document_id_universal.py # Generator ID uniwersalny
@@ -436,7 +436,7 @@ docid/
 ### Silniki OCR
 ```python
-from exef_docid import OCREngine, get_pipeline
+from docid import OCREngine, get_pipeline
 # Użyj PaddleOCR (domyślnie)
 pipeline = get_pipeline(ocr_engine=OCREngine.PADDLE)
@@ -448,7 +448,7 @@ pipeline = get_pipeline(ocr_engine=OCREngine.TESSERACT)
 ### Custom prefix
 ```python
-from exef_docid import UniversalDocumentIDGenerator
+from docid import UniversalDocumentIDGenerator
 generator = UniversalDocumentIDGenerator(prefix="MOJA")
 doc_id = generator.generate_universal_id("plik.pdf")
@@ -492,8 +492,8 @@ MIT License - zobacz [LICENSE](LICENSE) dla szczegółów.
 ## 🆘 Wsparcie
 - 📧 Email: info@softreck.dev
-- 🐛 Issues: [GitHub Issues](https://github.com/softreck/exef-pl/issues)
-- 📖 Dokumentacja: [GitHub Wiki](https://github.com/softreck/exef-pl/wiki)
+- 🐛 Issues: [GitHub Issues](https://github.com/softreck/doc-pl/issues)
+- 📖 Dokumentacja: [GitHub Wiki](https://github.com/softreck/doc-pl/wiki)
 ## 🗺️ Roadmap
@@ -506,4 +506,4 @@ MIT License - zobacz [LICENSE](LICENSE) dla szczegółów.
 ---
-**EXEF Document ID Generator** - Deterministyczne identyfikatory dla każdego dokumentu! 🚀
+**DOC Document ID Generator** - Deterministyczne identyfikatory dla każdego dokumentu! 🚀

{docid-0.1.4/exef_docid → docid-0.1.5/docid}/__init__.py RENAMED Viewed

@@ -6,7 +6,7 @@ Generuje zawsze ten sam ID dla tego samego dokumentu,
 niezależnie od formatu źródłowego (skan, PDF, KSeF XML).
 Przykład użycia:
-    from exef_docid import process_document, get_document_id
+    from docid import process_document, get_document_id
     # Pełne przetwarzanie
     result = process_document("faktura.pdf")
@@ -27,7 +27,7 @@ Wymagania:
     pip install pytesseract pdf2image pillow
 """
-__version__ = "0.1.0"
+__version__ = "0.1.5"
 __author__ = "Softreck"
 # Główne API

{docid-0.1.4 → docid-0.1.5}/docid.egg-info/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: docid
-Version: 0.1.4
+Version: 0.1.5
 Summary: Deterministyczny generator identyfikatorów dokumentów z OCR
 Home-page: https://github.com/softreck/docid
 Author: Softreck
@@ -55,7 +55,7 @@ Dynamic: author
 Dynamic: home-page
 Dynamic: requires-python
-# EXEF Document ID Generator
+# DOC Document ID Generator
 Deterministyczny generator identyfikatorów dokumentów z OCR. Generuje **zawsze ten sam ID** dla tego samego dokumentu, niezależnie od formatu źródłowego (skan, PDF, KSeF XML, obrazy).
@@ -71,12 +71,12 @@ Jak uzyskać **ten sam identyfikator** dla wszystkich trzech?
 ## ✨ Rozwiązanie
 ```python
-from exef_docid import get_document_id
+from docid import get_document_id
 # Wszystkie trzy zwrócą TEN SAM ID!
-get_document_id("faktura_skan.jpg")    # EXEF-FV-A7B3C9D2E1F04856
-get_document_id("faktura.pdf")          # EXEF-FV-A7B3C9D2E1F04856
-get_document_id("faktura_ksef.xml")     # EXEF-FV-A7B3C9D2E1F04856
+get_document_id("faktura_skan.jpg")    # DOC-FV-A7B3C9D2E1F04856
+get_document_id("faktura.pdf")          # DOC-FV-A7B3C9D2E1F04856
+get_document_id("faktura_ksef.xml")     # DOC-FV-A7B3C9D2E1F04856
 ```
 ## 📦 Instalacja
@@ -85,8 +85,8 @@ get_document_id("faktura_ksef.xml")     # EXEF-FV-A7B3C9D2E1F04856
 ```bash
 # Klonuj repozytorium
-git clone https://github.com/softreck/exef-pl.git
-cd exef-pl/app/docid
+git clone https://github.com/softreck/doc-pl.git
+cd doc-pl/app/docid
 # Utwórz środowisko wirtualne
 python3 -m venv venv
@@ -124,7 +124,7 @@ pip install docid[all]
 ### Generator ID dla dokumentów biznesowych
 ```python
-from exef_docid import generate_invoice_id, generate_receipt_id, generate_contract_id
+from docid import generate_invoice_id, generate_receipt_id, generate_contract_id
 # Faktura VAT
 invoice_id = generate_invoice_id(
@@ -133,7 +133,7 @@ invoice_id = generate_invoice_id(
     issue_date="2025-01-15",
     gross_amount=1230.50
 )
-print(invoice_id)  # EXEF-FV-F0BE35240C77B2DB
+print(invoice_id)  # DOC-FV-F0BE35240C77B2DB
 # Paragon fiskalny
 receipt_id = generate_receipt_id(
@@ -142,7 +142,7 @@ receipt_id = generate_receipt_id(
     gross_amount=37.88,
     cash_register_number="001"
 )
-print(receipt_id)  # EXEF-PAR-8142B3FC69D7778C
+print(receipt_id)  # DOC-PAR-8142B3FC69D7778C
 # Umowa
 contract_id = generate_contract_id(
@@ -151,13 +151,13 @@ contract_id = generate_contract_id(
     contract_date="2025-01-15",
     contract_number="001/2025"
 )
-print(contract_id)  # EXEF-UMO-C54CB968D1342642
+print(contract_id)  # DOC-UMO-C54CB968D1342642
 ```
 ### Uniwersalny generator ID (dowolne dokumenty)
 ```python
-from exef_docid import generate_universal_document_id
+from docid import generate_universal_document_id
 # Dowolny dokument
 doc_id = generate_universal_document_id("dokument.pdf")
@@ -175,20 +175,20 @@ print(doc_id)  # UNIV-IMG-E2E2131A335F0918
 ### Pełne przetwarzanie z OCR
 ```python
-from exef_docid import process_document, get_document_id
+from docid import process_document, get_document_id
 # Pełne przetwarzanie z ekstrakcją danych
 result = process_document("faktura.pdf")
-print(result.document_id)           # EXEF-FV-F0BE35240C77B2DB
+print(result.document_id)           # DOC-FV-F0BE35240C77B2DB
 print(result.extraction.issuer_nip) # 5213017228
 print(result.extraction.invoice_number) # FV/2025/00142
 # Tylko wygeneruj ID
 doc_id = get_document_id("paragon.jpg")
-print(doc_id)  # EXEF-PAR-8142B3FC69D7778C
+print(doc_id)  # DOC-PAR-8142B3FC69D7778C
 # Weryfikacja ID
-is_valid = verify_document_id("skan.png", "EXEF-FV-F0BE35240C77B2DB")
+is_valid = verify_document_id("skan.png", "DOC-FV-F0BE35240C77B2DB")
 print(is_valid)  # True/False
 ```
@@ -250,7 +250,7 @@ curl -X POST -F "file=@faktura.pdf" http://localhost:8000/process
 **2. Weryfikacja ID:**
 ```bash
-curl -X POST -F "file=@skan.jpg" -F "document_id=EXEF-FV-F0BE35240C77B2DB" http://localhost:8000/verify
+curl -X POST -F "file=@skan.jpg" -F "document_id=DOC-FV-F0BE35240C77B2DB" http://localhost:8000/verify
 ```
 **3. Porównywanie plików:**
@@ -303,7 +303,7 @@ make run-web          # Uruchom serwer API
 ### 1. Przetwarzanie faktur
 ```python
-from exef_docid import process_document
+from docid import process_document
 # Przetwarzanie faktury PDF
 result = process_document("faktura.pdf")
@@ -319,7 +319,7 @@ print(f"ID: {result.document_id}")
 ### 2. Porównywanie dokumentów
 ```python
-from exef_docid import compare_universal_documents
+from docid import compare_universal_documents
 # Porównaj dwa dokumenty
 comparison = compare_universal_documents("dokument1.pdf", "dokument2.png")
@@ -331,10 +331,10 @@ print(f"Ten sam rozmiar: {comparison['same_size']}")
 ### 3. Weryfikacja ID
 ```python
-from exef_docid import verify_document_id, verify_universal_document_id
+from docid import verify_document_id, verify_universal_document_id
 # Weryfikacja ID dokumentu biznesowego
-is_valid = verify_document_id("faktura.pdf", "EXEF-FV-F0BE35240C77B2DB")
+is_valid = verify_document_id("faktura.pdf", "DOC-FV-F0BE35240C77B2DB")
 # Weryfikacja uniwersalnego ID
 is_valid = verify_universal_document_id("dowolny_plik.jpg", "UNIV-IMG-4225A473A725978D")
@@ -344,7 +344,7 @@ is_valid = verify_universal_document_id("dowolny_plik.jpg", "UNIV-IMG-4225A473A7
 ```python
 from pathlib import Path
-from exef_docid import generate_universal_document_id
+from docid import generate_universal_document_id
 # Przetwarzaj wszystkie pliki w folderze
 documents_dir = Path("dokumenty")
@@ -372,16 +372,16 @@ for file_path in documents_dir.glob("*"):
 **TAK!** Formaty PNG i JPG są w pełni przetwarzane przez OCR:
 ```python
-from exef_docid import process_document
+from docid import process_document
 # Przetwarzanie skanu PNG z OCR
 result = process_document("skan_faktury.png")
-print(result.document_id)  # EXEF-FV-F0BE35240C77B2DB
+print(result.document_id)  # DOC-FV-F0BE35240C77B2DB
 print(result.extraction.issuer_nip)  # 5213017228
 # Przetwarzanie zdjęcia JPG z OCR
 result = process_document("zdjecie_paragonu.jpg")
-print(result.document_id)  # EXEF-PAR-8142B3FC69D7778C
+print(result.document_id)  # DOC-PAR-8142B3FC69D7778C
 ```
 #### Co jest ekstrahowane z PNG/JPG:
@@ -402,13 +402,13 @@ print(result.document_id)  # EXEF-PAR-8142B3FC69D7778C
 ```python
 # Ten sam dokument w różnych formatach - ten sam ID biznesowy
-generate_invoice_id(...)  # -> EXEF-FV-F0BE35240C77B2DB
+generate_invoice_id(...)  # -> DOC-FV-F0BE35240C77B2DB
 # Przetwarzanie przez OCR daje ten sam wynik
-process_document("faktura.pdf")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.png")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.jpg")    # -> EXEF-FV-F0BE35240C77B2DB
-process_document("faktura.xml")    # -> EXEF-FV-F0BE35240C77B2DB
+process_document("faktura.pdf")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.png")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.jpg")    # -> DOC-FV-F0BE35240C77B2DB
+process_document("faktura.xml")    # -> DOC-FV-F0BE35240C77B2DB
 # Różne ID uniwersalne dla różnych formatów
 generate_universal_document_id("faktura.pdf")  # -> UNIV-PDF-...
@@ -451,25 +451,25 @@ TEST WSZYSTKICH FORMATÓW - PDF, PNG, JPG, HTML, TXT, XML
 ================================================================================
 FOLDER: FAKTURY (invoices/)
-  📄 faktura_full.pdf          (.pdf ) [   2242B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.xml          (.xml ) [   2077B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.html         (.html) [   3334B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.jpg          (.jpg ) [  28182B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.png          (.png ) [  32325B] -> EXEF-FV-F0BE35240C77B2DB
-  📄 faktura_full.txt          (.txt ) [   2839B] -> EXEF-FV-F0BE35240C77B2DB
+  📄 faktura_full.pdf          (.pdf ) [   2242B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.xml          (.xml ) [   2077B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.html         (.html) [   3334B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.jpg          (.jpg ) [  28182B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.png          (.png ) [  32325B] -> DOC-FV-F0BE35240C77B2DB
+  📄 faktura_full.txt          (.txt ) [   2839B] -> DOC-FV-F0BE35240C77B2DB
   📊 Podsumowanie folderu invoices:
      Plików przetworzonych: 6
      Unikalnych ID: 1
      Wszystkie identyczne: True
-     ✅ ID: EXEF-FV-F0BE35240C77B2DB
+     ✅ ID: DOC-FV-F0BE35240C77B2DB
 ```
 ## 📁 Struktura projektu
 ```
 docid/
-├── exef_docid/              # Główny pakiet
+├── docid/              # Główny pakiet
 │   ├── __init__.py         # Eksporty API
 │   ├── document_id.py      # Generator ID biznesowy
 │   ├── document_id_universal.py # Generator ID uniwersalny
@@ -493,7 +493,7 @@ docid/
 ### Silniki OCR
 ```python
-from exef_docid import OCREngine, get_pipeline
+from docid import OCREngine, get_pipeline
 # Użyj PaddleOCR (domyślnie)
 pipeline = get_pipeline(ocr_engine=OCREngine.PADDLE)
@@ -505,7 +505,7 @@ pipeline = get_pipeline(ocr_engine=OCREngine.TESSERACT)
 ### Custom prefix
 ```python
-from exef_docid import UniversalDocumentIDGenerator
+from docid import UniversalDocumentIDGenerator
 generator = UniversalDocumentIDGenerator(prefix="MOJA")
 doc_id = generator.generate_universal_id("plik.pdf")
@@ -549,8 +549,8 @@ MIT License - zobacz [LICENSE](LICENSE) dla szczegółów.
 ## 🆘 Wsparcie
 - 📧 Email: info@softreck.dev
-- 🐛 Issues: [GitHub Issues](https://github.com/softreck/exef-pl/issues)
-- 📖 Dokumentacja: [GitHub Wiki](https://github.com/softreck/exef-pl/wiki)
+- 🐛 Issues: [GitHub Issues](https://github.com/softreck/doc-pl/issues)
+- 📖 Dokumentacja: [GitHub Wiki](https://github.com/softreck/doc-pl/wiki)
 ## 🗺️ Roadmap
@@ -563,4 +563,4 @@ MIT License - zobacz [LICENSE](LICENSE) dla szczegółów.
 ---
-**EXEF Document ID Generator** - Deterministyczne identyfikatory dla każdego dokumentu! 🚀
+**DOC Document ID Generator** - Deterministyczne identyfikatory dla każdego dokumentu! 🚀

{docid-0.1.4 → docid-0.1.5}/docid.egg-info/SOURCES.txt RENAMED Viewed

@@ -1,6 +1,13 @@
 README.md
 pyproject.toml
 setup.py
+docid/__init__.py
+docid/cli.py
+docid/cli_universal.py
+docid/document_id.py
+docid/document_id_universal.py
+docid/ocr_processor.py
+docid/pipeline.py
 docid.egg-info/PKG-INFO
 docid.egg-info/SOURCES.txt
 docid.egg-info/dependency_links.txt
@@ -8,15 +15,8 @@ docid.egg-info/entry_points.txt
 docid.egg-info/not-zip-safe
 docid.egg-info/requires.txt
 docid.egg-info/top_level.txt
-exef_docid/__init__.py
-exef_docid/cli.py
-exef_docid/cli_universal.py
-exef_docid/document_id.py
-exef_docid/document_id_universal.py
-exef_docid/ocr_processor.py
-exef_docid/pipeline.py
-exef_docid/extractors/__init__.py
-exef_docid/extractors/base.py
+docid/extractors/__init__.py
+docid/extractors/base.py
 tests/test_document_id.py
 tests/test_extractors.py
 tests/test_samples_id.py

docid-0.1.5/docid.egg-info/entry_points.txt ADDED Viewed

@@ -0,0 +1,3 @@
+[console_scripts]
+docid = docid.cli:main
+docid-universal = docid.cli_universal:main

docid-0.1.5/docid.egg-info/top_level.txt ADDED Viewed

	@@ -0,0 +1 @@
1	+ docid

{docid-0.1.4 → docid-0.1.5}/pyproject.toml RENAMED Viewed

@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
 [project]
 name = "docid"
-version = "0.1.4"
+version = "0.1.5"
 description = "Deterministyczny generator identyfikatorów dokumentów z OCR"
 readme = "README.md"
 license = {text = "MIT"}
@@ -63,8 +63,8 @@ dev = [
 ]
 [project.scripts]
-docid = "exef_docid.cli:main"
-docid-universal = "exef_docid.cli_universal:main"
+docid = "docid.cli:main"
+docid-universal = "docid.cli_universal:main"
 [project.urls]
 Homepage = "https://github.com/softreck/docid"
@@ -73,7 +73,7 @@ Repository = "https://github.com/softreck/docid"
 Issues = "https://github.com/softreck/docid/issues"
 [tool.setuptools.packages.find]
-include = ["exef_docid*"]
+include = ["docid*"]
 [tool.black]
 line-length = 100

{docid-0.1.4 → docid-0.1.5}/setup.py RENAMED Viewed

@@ -1,5 +1,5 @@
 #!/usr/bin/env python3
-"""Setup dla EXEF Document ID Generator."""
+"""Setup dla DOC Document ID Generator."""
 from setuptools import setup, find_packages
 from pathlib import Path
@@ -57,7 +57,7 @@ setup(
     },
     entry_points={
         "console_scripts": [
-            "docid=exef_docid.cli:main",
+            "docid=docid.cli:main",
         ],
     },
     include_package_data=True,

{docid-0.1.4 → docid-0.1.5}/tests/test_document_id.py RENAMED Viewed

@@ -4,7 +4,7 @@ Testy dla generatora identyfikatorów dokumentów.
 import pytest
-from exef_docid.document_id import (
+from docid.document_id import (
     AmountNormalizer,
     DateNormalizer,
     DocumentIDGenerator,
@@ -109,7 +109,7 @@ class TestDocumentIDGenerator:
     @pytest.fixture
     def generator(self):
-        return DocumentIDGenerator(prefix="EXEF")
+        return DocumentIDGenerator(prefix="DOC")
     def test_generate_invoice_id_deterministic(self, generator):
         """Ten sam input = ten sam output."""
@@ -152,10 +152,10 @@ class TestDocumentIDGenerator:
             gross_amount=1230.50,
         )
-        assert doc_id.startswith("EXEF-FV-")
+        assert doc_id.startswith("DOC-FV-")
         parts = doc_id.split("-")
         assert len(parts) == 3
-        assert parts[0] == "EXEF"
+        assert parts[0] == "DOC"
         assert parts[1] == "FV"
         assert len(parts[2]) == 16
         assert all(c in "0123456789ABCDEF" for c in parts[2])
@@ -168,7 +168,7 @@ class TestDocumentIDGenerator:
             gross_amount=45.99,
         )
-        assert doc_id.startswith("EXEF-PAR-")
+        assert doc_id.startswith("DOC-PAR-")
     def test_generate_receipt_id_with_extras(self, generator):
         """Paragon z numerem kasy daje inny ID."""
@@ -232,10 +232,10 @@ class TestDocumentIDGenerator:
     def test_parse_id(self, generator):
         """Test parsowania ID."""
-        doc_id = "EXEF-FV-A7B3C9D2E1F04856"
+        doc_id = "DOC-FV-A7B3C9D2E1F04856"
         parsed = DocumentIDGenerator.parse_id(doc_id)
-        assert parsed['prefix'] == "EXEF"
+        assert parsed['prefix'] == "DOC"
         assert parsed['type'] == "FV"
         assert parsed['hash'] == "A7B3C9D2E1F04856"
         assert parsed['document_type'] == DocumentType.INVOICE
@@ -263,7 +263,7 @@ class TestDocumentTypes:
             gross_amount=-100.00,
         )
-        assert doc_id.startswith("EXEF-KOR-")
+        assert doc_id.startswith("DOC-KOR-")
     def test_bank_statement(self, generator):
         """Wyciąg bankowy."""
@@ -273,7 +273,7 @@ class TestDocumentTypes:
             statement_number="001/2025",
         )
-        assert doc_id.startswith("EXEF-WB-")
+        assert doc_id.startswith("DOC-WB-")
     def test_generic_document(self, generator):
         """Dokument generyczny."""
@@ -287,4 +287,4 @@ class TestDocumentTypes:
             document_date="2025-01-15",
         )
-        assert doc_id.startswith("EXEF-DOC-")
+        assert doc_id.startswith("DOC-DOC-")

{docid-0.1.4 → docid-0.1.5}/tests/test_extractors.py RENAMED Viewed

@@ -4,14 +4,14 @@ Testy dla ekstraktorów danych z dokumentów.
 import pytest
-from exef_docid.extractors import (
+from docid.extractors import (
     ContractExtractor,
     DocumentCategory,
     DocumentExtractor,
     InvoiceExtractor,
     ReceiptExtractor,
 )
-from exef_docid.ocr_processor import DocumentOCRResult, OCREngine, OCRResult
+from docid.ocr_processor import DocumentOCRResult, OCREngine, OCRResult
 def create_mock_ocr_result(
@@ -271,7 +271,7 @@ class TestNIPDetection:
     """Testy wykrywania NIP w tekście."""
     def test_detect_nip_with_dashes(self):
-        from exef_docid.ocr_processor import BaseOCRProcessor
+        from docid.ocr_processor import BaseOCRProcessor
         class TestProcessor(BaseOCRProcessor):
             def process_image(self, path): pass
@@ -283,7 +283,7 @@ class TestNIPDetection:
         assert "5213017228" in nips
     def test_detect_nip_without_dashes(self):
-        from exef_docid.ocr_processor import BaseOCRProcessor
+        from docid.ocr_processor import BaseOCRProcessor
         class TestProcessor(BaseOCRProcessor):
             def process_image(self, path): pass
@@ -295,7 +295,7 @@ class TestNIPDetection:
         assert "5213017228" in nips
     def test_detect_multiple_nips(self):
-        from exef_docid.ocr_processor import BaseOCRProcessor
+        from docid.ocr_processor import BaseOCRProcessor
         class TestProcessor(BaseOCRProcessor):
             def process_image(self, path): pass
@@ -316,7 +316,7 @@ class TestAmountDetection:
     """Testy wykrywania kwot."""
     def test_detect_amount_with_currency(self):
-        from exef_docid.ocr_processor import BaseOCRProcessor
+        from docid.ocr_processor import BaseOCRProcessor
         class TestProcessor(BaseOCRProcessor):
             def process_image(self, path): pass
@@ -328,7 +328,7 @@ class TestAmountDetection:
         assert "1230.50" in amounts
     def test_detect_amount_brutto(self):
-        from exef_docid.ocr_processor import BaseOCRProcessor
+        from docid.ocr_processor import BaseOCRProcessor
         class TestProcessor(BaseOCRProcessor):
             def process_image(self, path): pass

{docid-0.1.4 → docid-0.1.5}/tests/test_samples_id.py RENAMED Viewed

@@ -10,9 +10,9 @@ from pathlib import Path
 import pytest
-from exef_docid.document_id import DocumentIDGenerator, DocumentType
-from exef_docid.pipeline import DocumentPipeline, process_document
-from exef_docid.ocr_processor import OCREngine
+from docid.document_id import DocumentIDGenerator, DocumentType
+from docid.pipeline import DocumentPipeline, process_document
+from docid.ocr_processor import OCREngine
 SAMPLES_DIR = Path(__file__).parent.parent / "samples"
@@ -55,7 +55,7 @@ class TestSampleIDGeneration:
                 })
                 # Sprawdź czy ID zostało wygenerowane
                 assert result.document_id, f"Brak ID dla {file_path}"
-                assert result.document_id.startswith("EXEF-FV"), f"Nieprawidłowy prefix ID dla faktury: {result.document_id}"
+                assert result.document_id.startswith("DOC-FV"), f"Nieprawidłowy prefix ID dla faktury: {result.document_id}"
             except Exception as e:
                 pytest.fail(f"Błąd przetwarzania {file_path}: {e}")