PyPI - plain.jobs - Versions diffs - 0.43.2__py3-none-any.whl - Mend

plain.jobs 0.43.2__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

plain/jobs/CHANGELOG.md +461 -0
plain/jobs/README.md +300 -0
plain/jobs/__init__.py +6 -0
plain/jobs/admin.py +249 -0
plain/jobs/chores.py +19 -0
plain/jobs/cli.py +204 -0
plain/jobs/config.py +19 -0
plain/jobs/default_settings.py +6 -0
plain/jobs/exceptions.py +34 -0
plain/jobs/jobs.py +368 -0
plain/jobs/locks.py +42 -0
plain/jobs/middleware.py +42 -0
plain/jobs/migrations/0001_initial.py +246 -0
plain/jobs/migrations/0002_job_span_id_job_trace_id_jobrequest_span_id_and_more.py +61 -0
plain/jobs/migrations/0003_rename_job_jobprocess_and_more.py +80 -0
plain/jobs/migrations/0004_rename_tables_to_plainjobs.py +33 -0
plain/jobs/migrations/0005_rename_constraints_and_indexes.py +174 -0
plain/jobs/migrations/0006_alter_jobprocess_table_alter_jobrequest_table_and_more.py +24 -0
plain/jobs/migrations/0007_remove_jobrequest_plainjobs_jobrequest_unique_job_class_key_and_more.py +144 -0
plain/jobs/migrations/__init__.py +0 -0
plain/jobs/models.py +567 -0
plain/jobs/parameters.py +193 -0
plain/jobs/registry.py +60 -0
plain/jobs/scheduling.py +253 -0
plain/jobs/templates/admin/plainqueue/jobresult_detail.html +8 -0
plain/jobs/workers.py +355 -0
plain_jobs-0.43.2.dist-info/METADATA +312 -0
plain_jobs-0.43.2.dist-info/RECORD +30 -0
plain_jobs-0.43.2.dist-info/WHEEL +4 -0
plain_jobs-0.43.2.dist-info/licenses/LICENSE +28 -0

plain/jobs/cli.py ADDED Viewed

@@ -0,0 +1,204 @@
+from __future__ import annotations
+import datetime
+import logging
+import signal
+from typing import Any
+import click
+from plain.cli import register_cli
+from plain.runtime import settings
+from plain.utils import timezone
+from .models import JobProcess, JobRequest, JobResult
+from .registry import jobs_registry
+from .scheduling import load_schedule
+from .workers import Worker
+logger = logging.getLogger("plain.jobs")
+@register_cli("jobs")
+@click.group()
+def cli() -> None:
+    """Background job management"""
+@cli.command()
+@click.option(
+    "queues",
+    "--queue",
+    default=["default"],
+    multiple=True,
+    type=str,
+    help="Queue to process",
+)
+@click.option(
+    "--max-processes",
+    "max_processes",
+    default=None,
+    type=int,
+    envvar="PLAIN_JOBS_WORKER_MAX_PROCESSES",
+)
+@click.option(
+    "--max-jobs-per-process",
+    "max_jobs_per_process",
+    default=None,
+    type=int,
+    envvar="PLAIN_JOBS_WORKER_MAX_JOBS_PER_PROCESS",
+)
+@click.option(
+    "--max-pending-per-process",
+    "max_pending_per_process",
+    default=10,
+    type=int,
+    envvar="PLAIN_JOBS_WORKER_MAX_PENDING_PER_PROCESS",
+)
+@click.option(
+    "--stats-every",
+    "stats_every",
+    default=60,
+    type=int,
+    envvar="PLAIN_JOBS_WORKER_STATS_EVERY",
+)
+@click.option(
+    "--reload",
+    is_flag=True,
+    help="Watch files and auto-reload worker on changes",
+)
+def worker(
+    queues: tuple[str, ...],
+    max_processes: int | None,
+    max_jobs_per_process: int | None,
+    max_pending_per_process: int,
+    stats_every: int,
+    reload: bool,
+) -> None:
+    """Run the job worker"""
+    jobs_schedule = load_schedule(settings.JOBS_SCHEDULE)
+    if reload:
+        from plain.internal.reloader import Reloader
+        # Track whether we should continue restarting
+        should_restart = {"value": True}
+        current_worker = {"instance": None}
+        def file_changed(filename: str) -> None:
+            if current_worker["instance"]:
+                current_worker["instance"].shutdown()
+        def signal_shutdown(signalnum: int, _: Any) -> None:
+            should_restart["value"] = False
+            if current_worker["instance"]:
+                current_worker["instance"].shutdown()
+        # Allow the worker to be stopped gracefully on SIGTERM/SIGINT
+        signal.signal(signal.SIGTERM, signal_shutdown)
+        signal.signal(signal.SIGINT, signal_shutdown)
+        # Start file watcher once, outside the loop
+        reloader = Reloader(callback=file_changed, watch_html=False)
+        reloader.start()
+        while should_restart["value"]:
+            worker = Worker(
+                queues=list(queues),
+                jobs_schedule=jobs_schedule,
+                max_processes=max_processes,
+                max_jobs_per_process=max_jobs_per_process,
+                max_pending_per_process=max_pending_per_process,
+                stats_every=stats_every,
+            )
+            current_worker["instance"] = worker
+            # Start processing jobs (blocks until shutdown)
+            worker.run()
+    else:
+        worker = Worker(
+            queues=list(queues),
+            jobs_schedule=jobs_schedule,
+            max_processes=max_processes,
+            max_jobs_per_process=max_jobs_per_process,
+            max_pending_per_process=max_pending_per_process,
+            stats_every=stats_every,
+        )
+        def _shutdown(signalnum: int, _: Any) -> None:
+            logger.info("Job worker shutdown signal received signalnum=%s", signalnum)
+            worker.shutdown()
+        # Allow the worker to be stopped gracefully on SIGTERM
+        signal.signal(signal.SIGTERM, _shutdown)
+        signal.signal(signal.SIGINT, _shutdown)
+        # Start processing jobs
+        worker.run()
+@cli.command()
+def clear() -> None:
+    """Clear completed job results"""
+    cutoff = timezone.now() - datetime.timedelta(
+        seconds=settings.JOBS_RESULTS_RETENTION
+    )
+    click.echo(f"Clearing job results created before {cutoff}")
+    results = JobResult.query.filter(created_at__lt=cutoff).delete()
+    click.echo(f"Deleted {results[0]} jobs")
+@cli.command()
+def stats() -> None:
+    """Show job queue statistics"""
+    pending = JobRequest.query.count()
+    processing = JobProcess.query.count()
+    successful = JobResult.query.successful().count()
+    errored = JobResult.query.errored().count()
+    lost = JobResult.query.lost().count()
+    click.secho(f"Pending: {pending}", bold=True)
+    click.secho(f"Processing: {processing}", bold=True)
+    click.secho(f"Successful: {successful}", bold=True, fg="green")
+    click.secho(f"Errored: {errored}", bold=True, fg="red")
+    click.secho(f"Lost: {lost}", bold=True, fg="yellow")
+@cli.command()
+def purge() -> None:
+    """Delete all pending and running jobs"""
+    if not click.confirm(
+        "Are you sure you want to clear all running and pending jobs? This will delete all current Jobs and JobRequests"
+    ):
+        return
+    deleted = JobRequest.query.all().delete()[0]
+    click.echo(f"Deleted {deleted} job requests")
+    deleted = JobProcess.query.all().delete()[0]
+    click.echo(f"Deleted {deleted} jobs")
+@cli.command()
+@click.argument("job_class_name", type=str)
+def run(job_class_name: str) -> None:
+    """Run a job directly without a worker"""
+    job = jobs_registry.load_job(job_class_name, {"args": [], "kwargs": {}})
+    click.secho("Loaded job: ", bold=True, nl=False)
+    print(job)
+    job.run()
+@cli.command("list")
+def list_jobs() -> None:
+    """List all registered jobs"""
+    for name, job_class in jobs_registry.jobs.items():
+        click.secho(f"{name}", bold=True, nl=False)
+        # Get description from class docstring
+        description = job_class.__doc__.strip() if job_class.__doc__ else ""
+        if description:
+            click.secho(f": {description}", dim=True)
+        else:
+            click.echo("")

plain/jobs/config.py ADDED Viewed

@@ -0,0 +1,19 @@
+from importlib import import_module
+from plain.packages import PackageConfig, packages_registry, register_config
+from .registry import jobs_registry
+@register_config
+class Config(PackageConfig):
+    package_label = "plainjobs"
+    def ready(self) -> None:
+        # Trigger register calls to fire by importing the modules
+        packages_registry.autodiscover_modules("jobs", include_app=True)
+        # Also need to make sure out internal jobs are registered
+        import_module("plain.jobs.scheduling")
+        jobs_registry.ready = True

plain/jobs/default_settings.py ADDED Viewed

@@ -0,0 +1,6 @@
+JOBS_RESULTS_RETENTION: int = 60 * 60 * 24 * 7  # One week
+JOBS_TIMEOUT: int = 60 * 60 * 24  # One day
+JOBS_MIDDLEWARE: list[str] = [
+    "plain.jobs.middleware.AppLoggerMiddleware",
+]
+JOBS_SCHEDULE: list[tuple[str, str]] = []

plain/jobs/exceptions.py ADDED Viewed

@@ -0,0 +1,34 @@
+class DeferJob(Exception):
+    """Signal that a job should be deferred and re-tried later.
+    Unlike regular exceptions that indicate errors, DeferJob is used for expected
+    delays like:
+    - Waiting for external resources (API rate limits, data not ready)
+    - Polling for status changes
+    - Temporary unavailability
+    Example:
+        # Finite retries - will fail if data never becomes ready
+        if not data.is_ready():
+            raise DeferJob(delay=60, increment_retries=True)
+        # Infinite retries - safe for rate limits
+        if rate_limited():
+            raise DeferJob(delay=300, increment_retries=False)
+    """
+    def __init__(self, *, delay: int, increment_retries: bool = False):
+        self.delay = delay
+        self.increment_retries = increment_retries
+        super().__init__(f"Job deferred for {delay} seconds")
+class DeferError(Exception):
+    """Raised when a deferred job cannot be re-enqueued.
+    This typically happens when concurrency limits prevent the job from being
+    re-queued. The transaction will be rolled back and the job will remain
+    in its current state, then be converted to ERRORED status for retry.
+    """
+    pass

plain/jobs/jobs.py ADDED Viewed

@@ -0,0 +1,368 @@
+from __future__ import annotations
+import datetime
+import inspect
+from abc import ABCMeta, abstractmethod
+from contextlib import AbstractContextManager, nullcontext
+from typing import TYPE_CHECKING, Any
+from opentelemetry import trace
+from opentelemetry.semconv._incubating.attributes.code_attributes import (
+    CODE_FILEPATH,
+    CODE_LINENO,
+)
+from opentelemetry.semconv._incubating.attributes.messaging_attributes import (
+    MESSAGING_DESTINATION_NAME,
+    MESSAGING_MESSAGE_ID,
+    MESSAGING_OPERATION_NAME,
+    MESSAGING_OPERATION_TYPE,
+    MESSAGING_SYSTEM,
+    MessagingOperationTypeValues,
+)
+from opentelemetry.semconv.attributes.error_attributes import ERROR_TYPE
+from opentelemetry.trace import SpanKind, format_span_id, format_trace_id
+from plain import models
+from plain.models import transaction
+from plain.models.db import db_connection
+from plain.utils import timezone
+from .locks import postgres_advisory_lock
+from .registry import JobParameters, jobs_registry
+if TYPE_CHECKING:
+    from .models import JobProcess, JobRequest
+tracer = trace.get_tracer("plain.jobs")
+class JobType(ABCMeta):
+    """
+    Metaclass allows us to capture the original args/kwargs
+    used to instantiate the job, so we can store them in the database
+    when we schedule the job.
+    """
+    def __call__(self, *args: Any, **kwargs: Any) -> Job:
+        instance = super().__call__(*args, **kwargs)
+        instance._init_args = args
+        instance._init_kwargs = kwargs
+        return instance
+class Job(metaclass=JobType):
+    # Set by JobType metaclass when the job is instantiated
+    _init_args: tuple[Any, ...]
+    _init_kwargs: dict[str, Any]
+    # Set by JobProcess when the job is executed
+    # Useful for jobs that need to query and exclude themselves
+    job_process: JobProcess | None = None
+    @abstractmethod
+    def run(self) -> None:
+        pass
+    def run_in_worker(
+        self,
+        *,
+        queue: str | None = None,
+        delay: int | datetime.timedelta | datetime.datetime | None = None,
+        priority: int | None = None,
+        retries: int | None = None,
+        retry_attempt: int = 0,
+        concurrency_key: str | None = None,
+    ) -> JobRequest | None:
+        from .models import JobRequest
+        job_class_name = jobs_registry.get_job_class_name(self.__class__)
+        if queue is None:
+            queue = self.default_queue()
+        with tracer.start_as_current_span(
+            f"run_in_worker {job_class_name}",
+            kind=SpanKind.PRODUCER,
+            attributes={
+                MESSAGING_SYSTEM: "plain.jobs",
+                MESSAGING_OPERATION_TYPE: MessagingOperationTypeValues.SEND.value,
+                MESSAGING_OPERATION_NAME: "run_in_worker",
+                MESSAGING_DESTINATION_NAME: queue,
+            },
+        ) as span:
+            try:
+                # Try to automatically annotate the source of the job
+                caller = inspect.stack()[1]
+                source = f"{caller.filename}:{caller.lineno}"
+                span.set_attributes(
+                    {
+                        CODE_FILEPATH: caller.filename,
+                        CODE_LINENO: caller.lineno,
+                    }
+                )
+            except (IndexError, AttributeError):
+                source = ""
+            parameters = JobParameters.to_json(self._init_args, self._init_kwargs)
+            if priority is None:
+                priority = self.default_priority()
+            if retries is None:
+                retries = self.default_retries()
+            if delay is None:
+                start_at = None
+            elif isinstance(delay, int):
+                start_at = timezone.now() + datetime.timedelta(seconds=delay)
+            elif isinstance(delay, datetime.timedelta):
+                start_at = timezone.now() + delay
+            elif isinstance(delay, datetime.datetime):
+                start_at = delay
+            else:
+                raise ValueError(f"Invalid delay: {delay}")
+            if concurrency_key is None:
+                concurrency_key = self.default_concurrency_key()
+            # Capture current trace context
+            current_span = trace.get_current_span()
+            span_context = current_span.get_span_context()
+            # Only include trace context if the span is being recorded (sampled)
+            # This ensures jobs are only linked to traces that are actually being collected
+            if current_span.is_recording() and span_context.is_valid:
+                trace_id = f"0x{format_trace_id(span_context.trace_id)}"
+                span_id = f"0x{format_span_id(span_context.span_id)}"
+            else:
+                trace_id = None
+                span_id = None
+            # Use transaction with optional locking for race-free enqueue
+            with transaction.atomic():
+                # Acquire lock via context manager (or nullcontext if None)
+                with self.get_enqueue_lock(concurrency_key) or nullcontext():
+                    # Check with lock held (if using locks)
+                    if not self.should_enqueue(concurrency_key):
+                        span.set_attribute(ERROR_TYPE, "ShouldNotEnqueue")
+                        return None
+                    # Create job with lock held
+                    job_request = JobRequest(
+                        job_class=job_class_name,
+                        parameters=parameters,
+                        start_at=start_at,
+                        source=source,
+                        queue=queue,
+                        priority=priority,
+                        retries=retries,
+                        retry_attempt=retry_attempt,
+                        concurrency_key=concurrency_key,
+                        trace_id=trace_id,
+                        span_id=span_id,
+                    )
+                    job_request.save()
+                    span.set_attribute(
+                        MESSAGING_MESSAGE_ID,
+                        str(job_request.uuid),
+                    )
+                    # Add job UUID to current span for bidirectional linking
+                    span.set_attribute("job.uuid", str(job_request.uuid))
+                    span.set_status(trace.StatusCode.OK)
+                    return job_request
+    def get_requested_jobs(
+        self, *, concurrency_key: str | None = None, include_retries: bool = False
+    ) -> models.QuerySet:
+        """
+        Get pending jobs (JobRequest) for this job class.
+        Args:
+            concurrency_key: Optional concurrency_key to filter by. If None, uses self.job_process.concurrency_key (if available) or self.default_concurrency_key()
+            include_retries: If False (default), exclude retry attempts from results
+        """
+        from .models import JobRequest
+        job_class_name = jobs_registry.get_job_class_name(self.__class__)
+        if concurrency_key is None:
+            if self.job_process:
+                concurrency_key = self.job_process.concurrency_key
+            else:
+                concurrency_key = self.default_concurrency_key()
+        filters = {"job_class": job_class_name}
+        if concurrency_key:
+            filters["concurrency_key"] = concurrency_key
+        qs = JobRequest.query.filter(**filters)
+        if not include_retries:
+            qs = qs.filter(retry_attempt=0)
+        return qs
+    def get_processing_jobs(
+        self,
+        *,
+        concurrency_key: str | None = None,
+        include_retries: bool = False,
+        include_self: bool = False,
+    ) -> models.QuerySet:
+        """
+        Get currently processing jobs (JobProcess) for this job class.
+        Args:
+            concurrency_key: Optional concurrency_key to filter by. If None, uses self.job_process.concurrency_key (if available) or self.default_concurrency_key()
+            include_retries: If False (default), exclude retry attempts from results
+        """
+        from .models import JobProcess
+        job_class_name = jobs_registry.get_job_class_name(self.__class__)
+        if concurrency_key is None:
+            if self.job_process:
+                concurrency_key = self.job_process.concurrency_key
+            else:
+                concurrency_key = self.default_concurrency_key()
+        filters = {"job_class": job_class_name}
+        if concurrency_key:
+            filters["concurrency_key"] = concurrency_key
+        qs = JobProcess.query.filter(**filters)
+        if not include_retries:
+            qs = qs.filter(retry_attempt=0)
+        if not include_self and self.job_process:
+            qs = qs.exclude(id=self.job_process.id)
+        return qs
+    def should_enqueue(self, concurrency_key: str) -> bool:
+        """
+        Called before enqueueing job. Return False to skip.
+        Args:
+            concurrency_key: The resolved concurrency_key (from default_concurrency_key() or override)
+        Default behavior:
+        - If concurrency_key is empty: no restrictions (always enqueue)
+        - If concurrency_key is set: enforce uniqueness (only one job with this key can be pending or processing)
+        Override to implement custom concurrency control:
+        - Concurrency limits
+        - Rate limits
+        - Custom business logic
+        Example:
+            def should_enqueue(self, concurrency_key):
+                # Max 3 processing, 1 pending per concurrency_key
+                processing = self.get_processing_jobs(concurrency_key).count()
+                pending = self.get_requested_jobs(concurrency_key).count()
+                return processing < 3 and pending < 1
+        """
+        if not concurrency_key:
+            # No key = no uniqueness check
+            return True
+        # Key set = enforce uniqueness (include retries for strong guarantee)
+        return (
+            self.get_processing_jobs(
+                concurrency_key=concurrency_key, include_retries=True
+            ).count()
+            == 0
+            and self.get_requested_jobs(
+                concurrency_key=concurrency_key, include_retries=True
+            ).count()
+            == 0
+        )
+    def default_concurrency_key(self) -> str:
+        """
+        Default identifier for this job.
+        Use for:
+        - Deduplication
+        - Grouping related jobs
+        - Concurrency control
+        Return empty string (default) for no grouping.
+        Can be overridden per-call via concurrency_key parameter in run_in_worker().
+        """
+        return ""
+    def default_queue(self) -> str:
+        """Default queue for this job. Can be overridden in run_in_worker()."""
+        return "default"
+    def default_priority(self) -> int:
+        """
+        Default priority for this job. Can be overridden in run_in_worker().
+        Higher numbers run first: 10 > 5 > 0 > -5 > -10
+        - Use positive numbers for high priority jobs
+        - Use negative numbers for low priority jobs
+        - Default is 0
+        """
+        return 0
+    def default_retries(self) -> int:
+        """Default number of retry attempts. Can be overridden in run_in_worker()."""
+        return 0
+    def calculate_retry_delay(self, attempt: int) -> int:
+        """
+        Calculate a delay in seconds before the next retry attempt.
+        On the first retry, attempt will be 1.
+        """
+        return 0
+    def get_enqueue_lock(
+        self, concurrency_key: str
+    ) -> AbstractContextManager[None] | None:
+        """
+        Return a context manager for the enqueue lock, or None for no locking.
+        Default: PostgreSQL advisory lock (None on SQLite/MySQL or empty concurrency_key).
+        Override to provide custom locking (Redis, etcd, etc.).
+        The returned context manager is used to wrap the should_enqueue() check
+        and job creation, ensuring atomicity.
+        Example with Redis:
+            def get_enqueue_lock(self, concurrency_key):
+                import redis
+                return redis_client.lock(f"job:{concurrency_key}", timeout=5)
+        Example with custom implementation:
+            from contextlib import contextmanager
+            @contextmanager
+            def get_enqueue_lock(self, concurrency_key):
+                my_lock.acquire(concurrency_key)
+                try:
+                    yield
+                finally:
+                    my_lock.release(concurrency_key)
+        To disable locking:
+            def get_enqueue_lock(self, concurrency_key):
+                return None
+        """
+        # No locking if no concurrency_key
+        if not concurrency_key:
+            return None
+        # PostgreSQL: use advisory locks
+        if db_connection.vendor == "postgresql":
+            return postgres_advisory_lock(self, concurrency_key)
+        # Other databases: no locking
+        return None

plain/jobs/locks.py ADDED Viewed

@@ -0,0 +1,42 @@
+"""Lock implementations for job enqueueing."""
+from __future__ import annotations
+import hashlib
+from collections.abc import Iterator
+from contextlib import contextmanager
+from typing import TYPE_CHECKING
+if TYPE_CHECKING:
+    from .jobs import Job
+@contextmanager
+def postgres_advisory_lock(job: Job, concurrency_key: str) -> Iterator[None]:
+    """
+    PostgreSQL advisory lock context manager.
+    Generates lock key from job class + concurrency_key, acquires advisory lock.
+    Uses pg_advisory_xact_lock which is automatically released when the
+    transaction commits or rolls back. No explicit release needed.
+    Args:
+        job: Job instance (used to get job class name)
+        concurrency_key: Job grouping key
+    """
+    from plain.jobs.registry import jobs_registry
+    from plain.models.db import db_connection
+    # Generate lock key from job class + concurrency_key
+    job_class_name = jobs_registry.get_job_class_name(job.__class__)
+    lock_key = f"{job_class_name}::{concurrency_key}"
+    # Convert lock key to int64 for PostgreSQL advisory lock
+    hash_bytes = hashlib.md5(lock_key.encode()).digest()
+    lock_id = int.from_bytes(hash_bytes[:8], "big", signed=True)
+    # Acquire advisory lock (auto-released on transaction end)
+    with db_connection.cursor() as cursor:
+        cursor.execute("SELECT pg_advisory_xact_lock(%s)", [lock_id])
+    yield  # Lock is held here