PyPI - documente_shared - Versions diffs - 0.1.52__py3-none-any.whl → 0.1.53__py3-none-any.whl - Mend

documente_shared 0.1.52py3-none-any.whl → 0.1.53py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of documente_shared might be problematic. Click here for more details.

Files changed (23) hide show

documente_shared/__init__.py +0 -0
documente_shared/application/__init__.py +0 -0
documente_shared/application/digest.py +7 -7
documente_shared/application/exceptions.py +23 -23
documente_shared/application/time_utils.py +9 -9
documente_shared/application/timezone.py +7 -7
documente_shared/domain/__init__.py +0 -0
documente_shared/domain/base_enum.py +53 -53
documente_shared/domain/constants.py +2 -2
documente_shared/domain/entities/__init__.py +0 -0
documente_shared/domain/entities/document.py +278 -268
documente_shared/domain/entities/document_metadata.py +64 -64
documente_shared/domain/enums.py +36 -36
documente_shared/domain/repositories.py +24 -24
documente_shared/infrastructure/__init__.py +0 -0
documente_shared/infrastructure/dynamo_repositories.py +43 -43
documente_shared/infrastructure/dynamo_table.py +75 -75
documente_shared/infrastructure/s3_bucket.py +57 -57
documente_shared/infrastructure/sqs_queue.py +47 -47
{documente_shared-0.1.52.dist-info → documente_shared-0.1.53.dist-info}/METADATA +1 -1
documente_shared-0.1.53.dist-info/RECORD +22 -0
documente_shared-0.1.52.dist-info/RECORD +0 -22
{documente_shared-0.1.52.dist-info → documente_shared-0.1.53.dist-info}/WHEEL +0 -0

documente_shared/domain/entities/document.py CHANGED Viewed

@@ -1,268 +1,278 @@
-from dataclasses import dataclass
-from datetime import datetime, tzinfo
-from decimal import Decimal
-from typing import Optional, List
-from documente_shared.application.time_utils import get_datetime_from_data
-from documente_shared.domain.constants import la_paz_tz
-from documente_shared.domain.entities.document_metadata import DocumentProcessingMetadata
-from documente_shared.domain.enums import (
-    DocumentProcessingStatus,
-    DocumentProcessingSubCategory,
-    DocumentProcessingCategory,
-)
-def remove_slash_from_path(path: str) -> str:
-    if path and path.startswith('/'):
-        return path[1:]
-    return path
-@dataclass
-class DocumentProcessing(object):
-    digest: str
-    status: DocumentProcessingStatus
-    file_path: Optional[str] = None
-    file_bytes: Optional[bytes] = None
-    category: Optional[DocumentProcessingCategory] = None
-    sub_category: Optional[DocumentProcessingSubCategory] = None
-    processed_csv_path: Optional[str] = None
-    processed_csv_bytes: Optional[bytes] = None
-    processed_xlsx_path: Optional[str] = None
-    processed_xlsx_bytes: Optional[bytes] = None
-    processed_json_path: Optional[str] = None
-    processed_json_bytes: Optional[bytes] = None
-    processed_metadata_path: Optional[str] = None
-    processing_time: Optional[Decimal] = None
-    issued_at: Optional[datetime] = None
-    uploaded_at: Optional[datetime] = None
-    enqueued_at: Optional[datetime] = None
-    started_at: Optional[datetime] = None
-    failed_at: Optional[datetime] = None
-    failed_reason: Optional[str] = None
-    completed_at: Optional[datetime] = None
-    metadata_items: Optional[List[DocumentProcessingMetadata]] = None
-    def __post_init__(self):
-        self.metadata_items = self.metadata_items or []
-    @property
-    def is_pending(self) -> bool:
-        return self.status == DocumentProcessingStatus.PENDING
-    @property
-    def is_enqueued(self) -> bool:
-        return self.status == DocumentProcessingStatus.ENQUEUED
-    @property
-    def is_processing(self) -> bool:
-        return self.status == DocumentProcessingStatus.PROCESSING
-    @property
-    def is_completed(self) -> bool:
-        return self.status == DocumentProcessingStatus.COMPLETED
-    @property
-    def is_failed(self) -> bool:
-        return self.status == DocumentProcessingStatus.FAILED
-    @property
-    def is_inreview(self) -> bool:
-        return self.status == DocumentProcessingStatus.IN_REVIEW
-    @property
-    def is_valid(self) -> bool:
-        return all([
-            self.digest,
-            self.status,
-            self.file_path,
-        ])
-    @property
-    def is_finished(self) -> bool:
-        return self.status in [
-            DocumentProcessingStatus.COMPLETED,
-            DocumentProcessingStatus.FAILED,
-        ]
-    def enqueue(self, timezone: tzinfo = la_paz_tz):
-        self.status = DocumentProcessingStatus.ENQUEUED
-        self.enqueued_at = datetime.now(tz=timezone)
-    def processing(self, timezone: tzinfo = la_paz_tz):
-        self.status = DocumentProcessingStatus.PROCESSING
-        self.started_at = datetime.now(tz=timezone)
-    def failed(
-        self,
-        error_message: Optional[str] = None,
-        timezone: tzinfo = la_paz_tz,
-    ):
-        self.failed_reason = error_message
-        self.status = DocumentProcessingStatus.FAILED
-        self.failed_at = datetime.now(tz=timezone)
-    def completed(self, timezone: tzinfo = la_paz_tz):
-        self.status = DocumentProcessingStatus.COMPLETED
-        self.completed_at = datetime.now(tz=timezone)
-    def deleted(self):
-        self.status = DocumentProcessingStatus.DELETED
-    def in_review(self):
-        self.status = DocumentProcessingStatus.IN_REVIEW
-    @property
-    def file_key(self) -> str:
-        return remove_slash_from_path(self.file_path)
-    @property
-    def processed_csv_key(self) -> str:
-        return remove_slash_from_path(self.processed_csv_path)
-    @property
-    def processed_xlsx_key(self) -> str:
-        return remove_slash_from_path(self.processed_xlsx_path)
-    @property
-    def processed_json_key(self) -> str:
-        return remove_slash_from_path(self.processed_json_path)
-    @property
-    def processed_metadata_key(self) -> str:
-        return remove_slash_from_path(self.processed_metadata_path)
-    @property
-    def extended_filename(self) -> str:
-        return self.file_path.split('/')[-1]
-    @property
-    def filename(self) -> str:
-        filename_with_extension = self.extended_filename
-        return filename_with_extension.split('.')[0]
-    def __eq__(self, other: 'DocumentProcessing') -> bool:
-        if not other:
-            return False
-        return (
-            self.digest == other.digest
-            and self.status == other.status
-            and self.file_path == other.file_path
-            and self.issued_at == other.issued_at
-            and self.uploaded_at == other.uploaded_at
-            and self.enqueued_at == other.enqueued_at
-            and self.started_at == other.started_at
-            and self.failed_at == other.failed_at
-            and self.completed_at == other.completed_at
-        )
-    @property
-    def to_dict(self) -> dict:
-        return {
-            'digest': self.digest,
-            'status': str(self.status),
-            'file_path': self.file_path,
-            'category': (
-                str(self.category)
-                if self.category else None
-            ),
-            'sub_category': (
-                str(self.sub_category)
-                if self.sub_category else None
-            ),
-            'processed_csv_path': self.processed_csv_path,
-            'processed_xlsx_path': self.processed_xlsx_path,
-            'processed_json_path': self.processed_json_path,
-            'processed_metadata_path': self.processed_metadata_path,
-            'processing_time': (
-                str(self.processing_time.quantize(Decimal('0.00001')))
-                if self.processing_time else None
-            ),
-            'issued_at': self.issued_at.isoformat() if self.issued_at else None,
-            'uploaded_at': self.uploaded_at.isoformat() if self.uploaded_at else None,
-            'enqueued_at': self.enqueued_at.isoformat() if self.enqueued_at else None,
-            'started_at': self.started_at.isoformat() if self.started_at else None,
-            'failed_at': self.failed_at.isoformat() if self.failed_at else None,
-            'failed_reason': self.failed_reason,
-            'completed_at': self.completed_at.isoformat() if self.completed_at else None,
-            'metadata_items': [metadata.to_dict for metadata in self.metadata_items],
-        }
-    @property
-    def to_simple_dict(self) -> dict:
-        simple_dict = self.to_dict.copy()
-        simple_dict.pop('metadata_items')
-        return simple_dict
-    def overload(
-        self,
-        new_instance: 'DocumentProcessing',
-        properties: List[str] = None,
-    ):
-        instance_properties = properties or [
-            'status',
-            'metadata',
-            'file_path',
-            'file_bytes',
-            'category',
-            'sub_category',
-            'processed_csv_path',
-            'processed_csv_bytes',
-            'processed_xlsx_path',
-            'processed_xlsx_bytes',
-            'processed_json_path',
-            'processed_json_bytes',
-            'processed_metadata_path',
-            'processed_metadata_bytes',
-            'processing_time',
-            'issued_at',
-            'uploaded_at',
-            'enqueued_at',
-            'started_at',
-            'failed_at',
-            'failed_reason',
-            'completed_at',
-        ]
-        for _property in instance_properties:
-            property_value = getattr(new_instance, _property)
-            if not hasattr(self, _property):
-                continue
-            setattr(self, _property, property_value)
-        return self
-    @classmethod
-    def from_dict(cls, data: dict) -> 'DocumentProcessing':
-        return cls(
-            digest=data.get('digest'),
-            status=DocumentProcessingStatus.from_value(data.get('status')),
-            file_path=data.get('file_path'),
-            category=(
-                DocumentProcessingCategory.from_value(data.get('category'))
-                if data.get('category') else None
-            ),
-            sub_category=(
-                DocumentProcessingSubCategory.from_value(data.get('sub_category'))
-                if data.get('sub_category') else None
-            ),
-            processed_csv_path=data.get('processed_csv_path'),
-            processed_xlsx_path=data.get('processed_xlsx_path'),
-            processed_json_path=data.get('processed_json_path'),
-            processed_metadata_path=data.get('processed_metadata_path'),
-            processing_time=(
-                Decimal(data.get('processing_time'))
-                if data.get('processing_time') else None
-            ),
-            issued_at=get_datetime_from_data(input_datetime=data.get('issued_at')),
-            uploaded_at=get_datetime_from_data(input_datetime=data.get('uploaded_at')),
-            enqueued_at=get_datetime_from_data(input_datetime=data.get('enqueued_at')),
-            started_at=get_datetime_from_data(input_datetime=data.get('started_at')),
-            failed_at=get_datetime_from_data(input_datetime=data.get('failed_at')),
-            failed_reason=data.get('failed_reason'),
-            completed_at=get_datetime_from_data(input_datetime=data.get('completed_at')),
-            metadata_items=[
-                DocumentProcessingMetadata.from_dict(metadata)
-                for metadata in data.get('metadata_items', [])
-            ],
-        )
+from dataclasses import dataclass
+from datetime import datetime, tzinfo
+from decimal import Decimal
+from typing import Optional, List
+from documente_shared.application.time_utils import get_datetime_from_data
+from documente_shared.domain.constants import la_paz_tz
+from documente_shared.domain.entities.document_metadata import DocumentProcessingMetadata
+from documente_shared.domain.enums import (
+    DocumentProcessingStatus,
+    DocumentProcessingSubCategory,
+    DocumentProcessingCategory,
+)
+def remove_slash_from_path(path: str) -> str:
+    if path and path.startswith('/'):
+        return path[1:]
+    return path
+@dataclass
+class DocumentProcessing(object):
+    digest: str
+    status: DocumentProcessingStatus
+    file_path: Optional[str] = None
+    file_bytes: Optional[bytes] = None
+    category: Optional[DocumentProcessingCategory] = None
+    sub_category: Optional[DocumentProcessingSubCategory] = None
+    processed_csv_path: Optional[str] = None
+    processed_csv_bytes: Optional[bytes] = None
+    processed_xlsx_path: Optional[str] = None
+    processed_xlsx_bytes: Optional[bytes] = None
+    processed_json_path: Optional[str] = None
+    processed_json_bytes: Optional[bytes] = None
+    processed_metadata_path: Optional[str] = None
+    processing_time: Optional[Decimal] = None
+    processing_accuracy: Optional[Decimal] = None
+    issued_at: Optional[datetime] = None
+    uploaded_at: Optional[datetime] = None
+    enqueued_at: Optional[datetime] = None
+    started_at: Optional[datetime] = None
+    failed_at: Optional[datetime] = None
+    failed_reason: Optional[str] = None
+    completed_at: Optional[datetime] = None
+    metadata_items: Optional[List[DocumentProcessingMetadata]] = None
+    def __post_init__(self):
+        self.metadata_items = self.metadata_items or []
+    @property
+    def is_pending(self) -> bool:
+        return self.status == DocumentProcessingStatus.PENDING
+    @property
+    def is_enqueued(self) -> bool:
+        return self.status == DocumentProcessingStatus.ENQUEUED
+    @property
+    def is_processing(self) -> bool:
+        return self.status == DocumentProcessingStatus.PROCESSING
+    @property
+    def is_completed(self) -> bool:
+        return self.status == DocumentProcessingStatus.COMPLETED
+    @property
+    def is_failed(self) -> bool:
+        return self.status == DocumentProcessingStatus.FAILED
+    @property
+    def is_inreview(self) -> bool:
+        return self.status == DocumentProcessingStatus.IN_REVIEW
+    @property
+    def is_valid(self) -> bool:
+        return all([
+            self.digest,
+            self.status,
+            self.file_path,
+        ])
+    @property
+    def is_finished(self) -> bool:
+        return self.status in [
+            DocumentProcessingStatus.COMPLETED,
+            DocumentProcessingStatus.FAILED,
+        ]
+    def enqueue(self, timezone: tzinfo = la_paz_tz):
+        self.status = DocumentProcessingStatus.ENQUEUED
+        self.enqueued_at = datetime.now(tz=timezone)
+    def processing(self, timezone: tzinfo = la_paz_tz):
+        self.status = DocumentProcessingStatus.PROCESSING
+        self.started_at = datetime.now(tz=timezone)
+    def failed(
+        self,
+        error_message: Optional[str] = None,
+        timezone: tzinfo = la_paz_tz,
+    ):
+        self.failed_reason = error_message
+        self.status = DocumentProcessingStatus.FAILED
+        self.failed_at = datetime.now(tz=timezone)
+    def completed(self, timezone: tzinfo = la_paz_tz):
+        self.status = DocumentProcessingStatus.COMPLETED
+        self.completed_at = datetime.now(tz=timezone)
+    def deleted(self):
+        self.status = DocumentProcessingStatus.DELETED
+    def in_review(self):
+        self.status = DocumentProcessingStatus.IN_REVIEW
+    @property
+    def file_key(self) -> str:
+        return remove_slash_from_path(self.file_path)
+    @property
+    def processed_csv_key(self) -> str:
+        return remove_slash_from_path(self.processed_csv_path)
+    @property
+    def processed_xlsx_key(self) -> str:
+        return remove_slash_from_path(self.processed_xlsx_path)
+    @property
+    def processed_json_key(self) -> str:
+        return remove_slash_from_path(self.processed_json_path)
+    @property
+    def processed_metadata_key(self) -> str:
+        return remove_slash_from_path(self.processed_metadata_path)
+    @property
+    def extended_filename(self) -> str:
+        return self.file_path.split('/')[-1]
+    @property
+    def filename(self) -> str:
+        filename_with_extension = self.extended_filename
+        return filename_with_extension.split('.')[0]
+    def __eq__(self, other: 'DocumentProcessing') -> bool:
+        if not other:
+            return False
+        return (
+            self.digest == other.digest
+            and self.status == other.status
+            and self.file_path == other.file_path
+            and self.issued_at == other.issued_at
+            and self.uploaded_at == other.uploaded_at
+            and self.enqueued_at == other.enqueued_at
+            and self.started_at == other.started_at
+            and self.failed_at == other.failed_at
+            and self.completed_at == other.completed_at
+        )
+    @property
+    def to_dict(self) -> dict:
+        return {
+            'digest': self.digest,
+            'status': str(self.status),
+            'file_path': self.file_path,
+            'category': (
+                str(self.category)
+                if self.category else None
+            ),
+            'sub_category': (
+                str(self.sub_category)
+                if self.sub_category else None
+            ),
+            'processed_csv_path': self.processed_csv_path,
+            'processed_xlsx_path': self.processed_xlsx_path,
+            'processed_json_path': self.processed_json_path,
+            'processed_metadata_path': self.processed_metadata_path,
+            'processing_time': (
+                str(self.processing_time.quantize(Decimal('0.00001')))
+                if self.processing_time else None
+            ),
+            'processing_accuracy': (
+                str(self.processing_accuracy.quantize(Decimal('0.00001')))
+                if self.processing_accuracy else None
+            ),
+            'issued_at': self.issued_at.isoformat() if self.issued_at else None,
+            'uploaded_at': self.uploaded_at.isoformat() if self.uploaded_at else None,
+            'enqueued_at': self.enqueued_at.isoformat() if self.enqueued_at else None,
+            'started_at': self.started_at.isoformat() if self.started_at else None,
+            'failed_at': self.failed_at.isoformat() if self.failed_at else None,
+            'failed_reason': self.failed_reason,
+            'completed_at': self.completed_at.isoformat() if self.completed_at else None,
+            'metadata_items': [metadata.to_dict for metadata in self.metadata_items],
+        }
+    @property
+    def to_simple_dict(self) -> dict:
+        simple_dict = self.to_dict.copy()
+        simple_dict.pop('metadata_items')
+        return simple_dict
+    def overload(
+        self,
+        new_instance: 'DocumentProcessing',
+        properties: List[str] = None,
+    ):
+        instance_properties = properties or [
+            'status',
+            'metadata',
+            'file_path',
+            'file_bytes',
+            'category',
+            'sub_category',
+            'processed_csv_path',
+            'processed_csv_bytes',
+            'processed_xlsx_path',
+            'processed_xlsx_bytes',
+            'processed_json_path',
+            'processed_json_bytes',
+            'processed_metadata_path',
+            'processed_metadata_bytes',
+            'processing_time',
+            'processing_accuracy',
+            'issued_at',
+            'uploaded_at',
+            'enqueued_at',
+            'started_at',
+            'failed_at',
+            'failed_reason',
+            'completed_at',
+        ]
+        for _property in instance_properties:
+            property_value = getattr(new_instance, _property)
+            if not hasattr(self, _property):
+                continue
+            setattr(self, _property, property_value)
+        return self
+    @classmethod
+    def from_dict(cls, data: dict) -> 'DocumentProcessing':
+        return cls(
+            digest=data.get('digest'),
+            status=DocumentProcessingStatus.from_value(data.get('status')),
+            file_path=data.get('file_path'),
+            category=(
+                DocumentProcessingCategory.from_value(data.get('category'))
+                if data.get('category') else None
+            ),
+            sub_category=(
+                DocumentProcessingSubCategory.from_value(data.get('sub_category'))
+                if data.get('sub_category') else None
+            ),
+            processed_csv_path=data.get('processed_csv_path'),
+            processed_xlsx_path=data.get('processed_xlsx_path'),
+            processed_json_path=data.get('processed_json_path'),
+            processed_metadata_path=data.get('processed_metadata_path'),
+            processing_time=(
+                Decimal(data.get('processing_time'))
+                if data.get('processing_time') else None
+            ),
+            processing_accuracy=(
+                Decimal(data.get('processing_accuracy'))
+                if data.get('processing_accuracy') else None
+            ),
+            issued_at=get_datetime_from_data(input_datetime=data.get('issued_at')),
+            uploaded_at=get_datetime_from_data(input_datetime=data.get('uploaded_at')),
+            enqueued_at=get_datetime_from_data(input_datetime=data.get('enqueued_at')),
+            started_at=get_datetime_from_data(input_datetime=data.get('started_at')),
+            failed_at=get_datetime_from_data(input_datetime=data.get('failed_at')),
+            failed_reason=data.get('failed_reason'),
+            completed_at=get_datetime_from_data(input_datetime=data.get('completed_at')),
+            metadata_items=[
+                DocumentProcessingMetadata.from_dict(metadata)
+                for metadata in data.get('metadata_items', [])
+            ],
+        )

documente_shared 0.1.52__py3-none-any.whl → 0.1.53__py3-none-any.whl

Potentially problematic release.

documente_shared 0.1.52py3-none-any.whl → 0.1.53py3-none-any.whl