PyPI - jettask - Versions diffs - 0.2.23__py3-none-any.whl → 0.2.24__py3-none-any.whl - Mend

jettask 0.2.23py3-none-any.whl → 0.2.24py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (110) hide show

jettask/__init__.py +2 -0
jettask/cli.py +12 -8
jettask/config/lua_scripts.py +37 -0
jettask/config/nacos_config.py +1 -1
jettask/core/app.py +313 -340
jettask/core/container.py +4 -4
jettask/{persistence → core}/namespace.py +93 -27
jettask/core/task.py +16 -9
jettask/core/unified_manager_base.py +136 -26
jettask/db/__init__.py +67 -0
jettask/db/base.py +137 -0
jettask/{utils/db_connector.py → db/connector.py} +130 -26
jettask/db/models/__init__.py +16 -0
jettask/db/models/scheduled_task.py +196 -0
jettask/db/models/task.py +77 -0
jettask/db/models/task_run.py +85 -0
jettask/executor/__init__.py +0 -15
jettask/executor/core.py +76 -31
jettask/executor/process_entry.py +29 -114
jettask/executor/task_executor.py +4 -0
jettask/messaging/event_pool.py +928 -685
jettask/messaging/scanner.py +30 -0
jettask/persistence/__init__.py +28 -103
jettask/persistence/buffer.py +170 -0
jettask/persistence/consumer.py +330 -249
jettask/persistence/manager.py +304 -0
jettask/persistence/persistence.py +391 -0
jettask/scheduler/__init__.py +15 -3
jettask/scheduler/{task_crud.py → database.py} +61 -57
jettask/scheduler/loader.py +2 -2
jettask/scheduler/{scheduler_coordinator.py → manager.py} +23 -6
jettask/scheduler/models.py +14 -10
jettask/scheduler/schedule.py +166 -0
jettask/scheduler/scheduler.py +12 -11
jettask/schemas/__init__.py +50 -1
jettask/schemas/backlog.py +43 -6
jettask/schemas/namespace.py +70 -19
jettask/schemas/queue.py +19 -3
jettask/schemas/responses.py +493 -0
jettask/task/__init__.py +0 -2
jettask/task/router.py +3 -0
jettask/test_connection_monitor.py +1 -1
jettask/utils/__init__.py +7 -5
jettask/utils/db_init.py +8 -4
jettask/utils/namespace_dep.py +167 -0
jettask/utils/queue_matcher.py +186 -0
jettask/utils/rate_limit/concurrency_limiter.py +7 -1
jettask/utils/stream_backlog.py +1 -1
jettask/webui/__init__.py +0 -1
jettask/webui/api/__init__.py +4 -4
jettask/webui/api/alerts.py +806 -71
jettask/webui/api/example_refactored.py +400 -0
jettask/webui/api/namespaces.py +390 -45
jettask/webui/api/overview.py +300 -54
jettask/webui/api/queues.py +971 -267
jettask/webui/api/scheduled.py +1249 -56
jettask/webui/api/settings.py +129 -7
jettask/webui/api/workers.py +442 -0
jettask/webui/app.py +46 -2329
jettask/webui/middleware/__init__.py +6 -0
jettask/webui/middleware/namespace_middleware.py +135 -0
jettask/webui/services/__init__.py +146 -0
jettask/webui/services/heartbeat_service.py +251 -0
jettask/webui/services/overview_service.py +60 -51
jettask/webui/services/queue_monitor_service.py +426 -0
jettask/webui/services/redis_monitor_service.py +87 -0
jettask/webui/services/settings_service.py +174 -111
jettask/webui/services/task_monitor_service.py +222 -0
jettask/webui/services/timeline_pg_service.py +452 -0
jettask/webui/services/timeline_service.py +189 -0
jettask/webui/services/worker_monitor_service.py +467 -0
jettask/webui/utils/__init__.py +11 -0
jettask/webui/utils/time_utils.py +122 -0
jettask/worker/lifecycle.py +8 -2
{jettask-0.2.23.dist-info → jettask-0.2.24.dist-info}/METADATA +1 -1
jettask-0.2.24.dist-info/RECORD +142 -0
jettask/executor/executor.py +0 -338
jettask/persistence/backlog_monitor.py +0 -567
jettask/persistence/base.py +0 -2334
jettask/persistence/db_manager.py +0 -516
jettask/persistence/maintenance.py +0 -81
jettask/persistence/message_consumer.py +0 -259
jettask/persistence/models.py +0 -49
jettask/persistence/offline_recovery.py +0 -196
jettask/persistence/queue_discovery.py +0 -215
jettask/persistence/task_persistence.py +0 -218
jettask/persistence/task_updater.py +0 -583
jettask/scheduler/add_execution_count.sql +0 -11
jettask/scheduler/add_priority_field.sql +0 -26
jettask/scheduler/add_scheduler_id.sql +0 -25
jettask/scheduler/add_scheduler_id_index.sql +0 -10
jettask/scheduler/make_scheduler_id_required.sql +0 -28
jettask/scheduler/migrate_interval_seconds.sql +0 -9
jettask/scheduler/performance_optimization.sql +0 -45
jettask/scheduler/run_scheduler.py +0 -186
jettask/scheduler/schema.sql +0 -84
jettask/task/task_executor.py +0 -318
jettask/webui/api/analytics.py +0 -323
jettask/webui/config.py +0 -90
jettask/webui/models/__init__.py +0 -3
jettask/webui/models/namespace.py +0 -63
jettask/webui/namespace_manager/__init__.py +0 -10
jettask/webui/namespace_manager/multi.py +0 -593
jettask/webui/namespace_manager/unified.py +0 -193
jettask/webui/run.py +0 -46
jettask-0.2.23.dist-info/RECORD +0 -145
{jettask-0.2.23.dist-info → jettask-0.2.24.dist-info}/WHEEL +0 -0
{jettask-0.2.23.dist-info → jettask-0.2.24.dist-info}/entry_points.txt +0 -0
{jettask-0.2.23.dist-info → jettask-0.2.24.dist-info}/licenses/LICENSE +0 -0
{jettask-0.2.23.dist-info → jettask-0.2.24.dist-info}/top_level.txt +0 -0

jettask/persistence/consumer.py CHANGED Viewed

@@ -1,165 +1,317 @@
-"""PostgreSQL消费者主模块
+"""PostgreSQL Consumer - 基于通配符队列的新实现
-协调各个子模块，提供统一的消费者接口。
+完全替换旧的 consumer.py 实现，使用 Jettask 通配符队列功能。
 """
-import asyncio
+import time
 import logging
-import os
-import socket
-import traceback
-from typing import Optional
-import redis.asyncio as redis
-from redis.asyncio import Redis
-from sqlalchemy.ext.asyncio import create_async_engine
-from sqlalchemy.orm import sessionmaker
-from sqlalchemy.ext.asyncio import AsyncSession
-from sqlalchemy import text
-from jettask.webui.config import PostgreSQLConfig, RedisConfig
-from jettask.worker.manager import ConsumerManager
-from .backlog_monitor import BacklogMonitor
-from .task_updater import TaskUpdater
-from .offline_recovery import OfflineRecoveryHandler
-from .task_persistence import TaskPersistence
-from .queue_discovery import QueueDiscovery
-from .message_consumer import MessageConsumer
-from .maintenance import DatabaseMaintenance
+from datetime import datetime, timezone
+from jettask import Jettask
+from jettask.core.context import TaskContext
+from jettask.db.connector import get_pg_engine_and_factory, DBConfig
+from .buffer import BatchBuffer
+from .persistence import TaskPersistence
 logger = logging.getLogger(__name__)
 class PostgreSQLConsumer:
-    """PostgreSQL消费者，从Redis队列消费任务并持久化到PostgreSQL
-    支持多租户（命名空间）隔离
-    架构说明：
-    - BacklogMonitor: 监控Stream积压情况
-    - TaskUpdater: 更新任务状态（从TASK_CHANGES流）
-    - OfflineRecoveryHandler: 恢复离线worker的消息
-    - TaskPersistence: 解析并持久化任务数据
-    - QueueDiscovery: 发现和管理队列
-    - MessageConsumer: 消费队列消息
-    - DatabaseMaintenance: 数据库维护任务
+    """PostgreSQL Consumer - 基于通配符队列
+    核心特性：
+    1. 使用 @app.task(queue='*') 监听所有队列
+    2. 使用 @app.task(queue='TASK_CHANGES') 处理状态更新
+    3. 批量 INSERT 和 UPDATE
+    4. 自动队列发现（Jettask 内置）
     """
     def __init__(
         self,
-        pg_config: PostgreSQLConfig,
-        redis_config: RedisConfig,
+        pg_config,  # 可以是字典或配置对象
+        redis_config,  # 可以是字典或配置对象
         prefix: str = "jettask",
-        node_id: str = None,
-        # consumer_strategy 参数已移除，现在只使用 HEARTBEAT 策略
         namespace_id: str = None,
         namespace_name: str = None,
-        enable_backlog_monitor: bool = True,
-        backlog_monitor_interval: int = 1
+        batch_size: int = 1000,
+        flush_interval: float = 5.0
     ):
-        """初始化PostgreSQL消费者
+        """初始化 PG Consumer
         Args:
-            pg_config: PostgreSQL配置
-            redis_config: Redis配置
+            pg_config: PostgreSQL配置（字典或对象）
+            redis_config: Redis配置（字典或对象）
             prefix: Redis键前缀
-            node_id: 节点ID
-            consumer_strategy: 消费者策略
+            node_id: 节点ID（兼容旧接口，不使用）
             namespace_id: 命名空间ID
             namespace_name: 命名空间名称
-            enable_backlog_monitor: 是否启用积压监控
-            backlog_monitor_interval: 积压监控间隔（秒）
+            enable_backlog_monitor: 是否启用积压监控（兼容旧接口，不使用）
+            backlog_monitor_interval: 积压监控间隔（兼容旧接口，不使用）
+            batch_size: 批量大小
+            flush_interval: 刷新间隔（秒）
         """
         self.pg_config = pg_config
         self.redis_config = redis_config
-        self.prefix = prefix
-        # 命名空间支持
+        self.redis_prefix = prefix
         self.namespace_id = namespace_id
         self.namespace_name = namespace_name or "default"
-        # 节点标识
-        hostname = socket.gethostname()
-        self.node_id = node_id or f"{hostname}_{os.getpid()}"
+        # 构建 Redis URL（兼容字典和对象两种格式）
+        if isinstance(redis_config, dict):
+            # 字典格式 - 优先使用 'url' 字段
+            redis_url = redis_config.get('url') or redis_config.get('redis_url')
+            if not redis_url:
+                # 从独立字段构建
+                password = redis_config.get('password', '')
+                host = redis_config.get('host', 'localhost')
+                port = redis_config.get('port', 6379)
+                db = redis_config.get('db', 0)
+                redis_url = f"redis://"
+                if password:
+                    redis_url += f":{password}@"
+                redis_url += f"{host}:{port}/{db}"
+        else:
+            # 对象格式
+            redis_url = f"redis://"
+            if hasattr(redis_config, 'password') and redis_config.password:
+                redis_url += f":{redis_config.password}@"
+            redis_url += f"{redis_config.host}:{redis_config.port}/{redis_config.db}"
-        # 消费者配置
-        # consumer_strategy 已移除，现在只使用 HEARTBEAT 策略
-        self.consumer_group = f"{prefix}_pg_consumer"
+        self.redis_url = redis_url
+        logger.debug(f"构建 Redis URL: {redis_url}")
-        # Redis和数据库连接（将在start时初始化）
-        self.redis_client: Optional[Redis] = None
+        # 数据库引擎和会话（将在 start 时初始化）
         self.async_engine = None
         self.AsyncSessionLocal = None
+        self.db_manager = None
+        # 创建 Jettask 应用
+        self.app = Jettask(
+            redis_url=redis_url,
+            redis_prefix=prefix
+        )
-        # ConsumerManager（将在start时初始化）
-        self.consumer_manager = None
-        self.consumer_id = None
+        # 创建两个独立的批量缓冲区
+        # 1. INSERT 缓冲区（用于新任务持久化）
+        self.insert_buffer = BatchBuffer(
+            max_size=batch_size,
+            max_delay=flush_interval,
+            operation_type='insert'
+        )
-        # 各个子模块（将在start时初始化）
-        self.backlog_monitor: Optional[BacklogMonitor] = None
-        self.task_updater: Optional[TaskUpdater] = None
-        self.offline_recovery: Optional[OfflineRecoveryHandler] = None
-        self.task_persistence: Optional[TaskPersistence] = None
-        self.queue_discovery: Optional[QueueDiscovery] = None
-        self.message_consumer: Optional[MessageConsumer] = None
-        self.database_maintenance: Optional[DatabaseMaintenance] = None
+        # 2. UPDATE 缓冲区（用于任务状态更新）
+        self.update_buffer = BatchBuffer(
+            max_size=batch_size // 2,  # 状态更新通常更频繁，用较小的批次
+            max_delay=flush_interval,
+            operation_type='update'
+        )
-        # 积压监控配置
-        self.enable_backlog_monitor = enable_backlog_monitor
-        self.backlog_monitor_interval = backlog_monitor_interval
+        # 注册任务
+        self._register_tasks()
+        # 运行控制
         self._running = False
-    async def start(self):
-        """启动消费者"""
-        logger.info(f"Starting PostgreSQL consumer (modular) on node: {self.node_id}")
+    def _register_tasks(self):
+        """注册任务处理器"""
+        # 创建闭包函数来访问实例属性
+        consumer = self  # 捕获 self 引用
-        # 1. 连接Redis（使用全局客户端实例）
-        from jettask.utils.db_connector import get_async_redis_client, get_sync_redis_client
+        @self.app.task(queue='*', auto_ack=False)
+        async def _handle_persist_task(ctx: TaskContext, **kwargs):
+            return await consumer._do_handle_persist_task(ctx, **kwargs)
-        # 构建 Redis URL
-        redis_url = f"redis://"
-        if self.redis_config.password:
-            redis_url += f":{self.redis_config.password}@"
-        redis_url += f"{self.redis_config.host}:{self.redis_config.port}/{self.redis_config.db}"
+        @self.app.task(queue='TASK_CHANGES', auto_ack=False)
+        async def _handle_status_update(ctx: TaskContext, **kwargs):
+            print(f'[PG Consumer] 处理状态更新: {ctx.event_id} {kwargs=}')
+            return await consumer._do_handle_status_update(ctx, **kwargs)
-        self.redis_client = get_async_redis_client(
-            redis_url=redis_url,
-            decode_responses=False  # 保持二进制模式
-        )
+    async def _do_handle_persist_task(self, ctx: TaskContext, **kwargs):
+        """处理任务持久化（INSERT）
-        # 2. 初始化ConsumerManager（需要同步的Redis客户端）
-        sync_redis_client = get_sync_redis_client(
-            redis_url=redis_url,
-            decode_responses=True
-        )
+        使用通配符 queue='*' 监听所有队列
+        Jettask 会自动发现新队列并开始消费
-        # 配置ConsumerManager
-        initial_queues = ['TASK_CHANGES']  # TASK_CHANGES是固定的
-        consumer_config = {
-            'redis_prefix': self.prefix,
-            'queues': initial_queues,
-            'worker_prefix': 'PG_CONSUMER',  # 使用不同的前缀，与task worker区分开
-        }
-        self.consumer_manager = ConsumerManager(
-            redis_client=sync_redis_client,
-            # strategy 参数已移除，现在只使用 HEARTBEAT 策略
-            config=consumer_config
-        )
+        Args:
+            ctx: Jettask 自动注入的任务上下文（包含 queue, event_id 等）
+            **kwargs: 任务的原始数据字段
+        """
+        # 跳过 TASK_CHANGES 队列（由另一个任务处理）
+        if ctx.queue == f'{self.redis_prefix}:QUEUE:TASK_CHANGES':
+            await ctx.ack()
+            return
+        try:
+            # 提取纯队列名（去掉 prefix:QUEUE: 前缀）
+            queue_name = ctx.queue.replace(f'{self.redis_prefix}:QUEUE:', '')
+            # 记录真实的队列名称（用于验证通配符队列功能）
+            logger.info(f"[持久化任务] 完整路径: {ctx.queue}, 队列名: {queue_name}, Stream ID: {ctx.event_id}")
+            # 构建任务记录
+            trigger_time = kwargs.get('trigger_time', time.time())
+            if isinstance(trigger_time, (str, bytes)):
+                trigger_time = float(trigger_time)
+            priority = kwargs.get('priority', 0)
+            if isinstance(priority, (str, bytes)):
+                priority = int(priority)
+            record = {
+                'stream_id': ctx.event_id,
+                'queue': ctx.queue.replace(f'{self.redis_prefix}:QUEUE:', ''),
+                'task_name': kwargs.get('task_name', 'unknown'),
+                'payload': kwargs.get('payload', {}),
+                'priority': priority,
+                'created_at': datetime.fromtimestamp(trigger_time, tz=timezone.utc),
+                'scheduled_task_id': kwargs.get('scheduled_task_id'),
+                'namespace': self.namespace_name,
+                'source': 'scheduler' if kwargs.get('scheduled_task_id') else 'redis_stream',
+            }
+            # 添加到缓冲区（不立即处理，不立即 ACK）
+            self.insert_buffer.add(record, ctx)
+            # 检查是否需要刷新（批量大小或超时）
+            if self.insert_buffer.should_flush():
+                await self.insert_buffer.flush(self.db_manager)
+            # 同时检查 UPDATE 缓冲区是否需要刷新（利用这次机会）
+            if self.update_buffer.should_flush():
+                await self.update_buffer.flush(self.db_manager)
+        except Exception as e:
+            logger.error(f"持久化任务失败: {e}", exc_info=True)
+            # 出错也要 ACK，避免消息堆积
+            await ctx.ack()
+    async def _do_handle_status_update(self, ctx: TaskContext, **kwargs):
+        """处理任务状态更新（UPDATE）
+        消费 TASK_CHANGES 队列，批量更新数据库中的任务状态
-        # 获取稳定的consumer_id
-        self.consumer_id = self.consumer_manager.get_consumer_name('TASK_CHANGES')
-        logger.debug(f"Using consumer_id: {self.consumer_id} with strategy: HEARTBEAT")
+        Args:
+            ctx: Jettask 自动注入的任务上下文
+            **kwargs: 任务的原始数据字段（包含 task_id）
+        """
+        try:
+            # 从消息中获取 task_id
+            task_id = kwargs.get('task_id')
+            if not task_id:
+                logger.warning(f"TASK_CHANGES 消息缺少 task_id: {ctx.event_id}")
+                await ctx.ack()
+                return
+            # 从 Redis Hash 中读取完整的任务状态信息
+            # task_id 格式: test5:TASK:event_id:queue:task_name
+            # 我们需要查询 Redis Hash 获取状态信息
+            redis_client = ctx.app.async_binary_redis
+            # 查询任务状态 Hash
+            task_info = await redis_client.hgetall(task_id)
+            logger.info(f"task_id={task_id!r}")
+            logger.info(f"task_info={task_info!r}")
+            if not task_info:
+                logger.warning(f"无法找到任务状态信息: {task_id}")
+                await ctx.ack()
+                return
+            # 从 task_id 中提取 event_id (stream_id)
+            # task_id 格式: prefix:TASK:event_id:queue:task_name
+            parts = task_id.split(':')
+            if len(parts) >= 3:
+                event_id = parts[2]  # 提取 event_id
+            else:
+                logger.error(f"无效的 task_id 格式: {task_id}")
+                await ctx.ack()
+                return
+            # 解析各个字段（binary redis 返回 bytes）
+            # 1. retries
+            retries = task_info.get(b'retries', 0)
+            if isinstance(retries, bytes):
+                retries = int(retries.decode('utf-8')) if retries else 0
+            elif isinstance(retries, str):
+                retries = int(retries) if retries else 0
+            # 2. started_at
+            started_at = task_info.get(b'started_at')
+            if started_at:
+                if isinstance(started_at, bytes):
+                    started_at = float(started_at.decode('utf-8'))
+                elif isinstance(started_at, str):
+                    started_at = float(started_at)
+            # 3. completed_at
+            completed_at = task_info.get(b'completed_at')
+            if completed_at:
+                if isinstance(completed_at, bytes):
+                    completed_at = float(completed_at.decode('utf-8'))
+                elif isinstance(completed_at, str):
+                    completed_at = float(completed_at)
+            # 4. consumer
+            consumer = task_info.get(b'consumer')
+            if consumer:
+                if isinstance(consumer, bytes):
+                    consumer = consumer.decode('utf-8')
+            # 5. status
+            status = task_info.get(b'status')
+            if status:
+                if isinstance(status, bytes):
+                    status = status.decode('utf-8')
+            # 6. result (保持原始 bytes，在 persistence.py 中解析)
+            result = task_info.get(b'result')
+            # 7. error/exception
+            error = task_info.get(b'exception') or task_info.get(b'error')
+            update_record = {
+                'stream_id': event_id,
+                'status': status,
+                'result': result,  # bytes 格式，稍后解析
+                'error': error,
+                'started_at': started_at,
+                'completed_at': completed_at,
+                'retries': retries,
+                'consumer': consumer,
+            }
+            logger.info(f"update_record={update_record!r}")
+            print(f'{update_record=}')
+            # 添加到状态更新缓冲区
+            self.update_buffer.add(update_record, ctx)
+            # 检查是否需要刷新（批量大小或超时）
+            if self.update_buffer.should_flush():
+                await self.update_buffer.flush(self.db_manager)
+            # 同时检查 INSERT 缓冲区是否需要刷新（利用这次机会）
+            if self.insert_buffer.should_flush():
+                await self.insert_buffer.flush(self.db_manager)
+        except Exception as e:
+            logger.error(f"更新任务状态失败: {e}", exc_info=True)
+            # 出错也要 ACK
+            await ctx.ack()
+    async def start(self, concurrency: int = 4):
+        """启动 Consumer
-        # 3. 创建SQLAlchemy异步引擎
-        if self.pg_config.dsn.startswith('postgresql://'):
-            dsn = self.pg_config.dsn.replace('postgresql://', 'postgresql+asyncpg://', 1)
-        else:
-            dsn = self.pg_config.dsn
+        Args:
+            concurrency: 并发数
+        """
+        logger.info(f"Starting PostgreSQL consumer (wildcard queue mode)")
+        logger.info(f"Namespace: {self.namespace_name} ({self.namespace_id or 'N/A'})")
-        self.async_engine = create_async_engine(
+        # 1. 使用 connector.py 统一管理数据库连接
+        # 解析 PostgreSQL 配置为标准 DSN
+        dsn = DBConfig.parse_pg_config(self.pg_config)
+        # 使用全局单例引擎和会话工厂
+        self.async_engine, self.AsyncSessionLocal = get_pg_engine_and_factory(
             dsn,
             pool_size=50,
             max_overflow=20,
@@ -168,148 +320,77 @@ class PostgreSQLConsumer:
             echo=False
         )
-        # 预热连接池
-        logger.debug("Pre-warming database connection pool...")
-        async with self.async_engine.begin() as conn:
-            await conn.execute(text("SELECT 1"))
-        # 创建异步会话工厂
-        self.AsyncSessionLocal = sessionmaker(
-            self.async_engine,
-            class_=AsyncSession,
-            expire_on_commit=False
-        )
+        logger.debug(f"使用全局 PostgreSQL 连接池: {dsn[:50]}...")
-        # 4. 初始化各个子模块
-        # 任务持久化处理器
-        self.task_persistence = TaskPersistence(
+        # 2. 初始化任务持久化管理器
+        self.db_manager = TaskPersistence(
             async_session_local=self.AsyncSessionLocal,
             namespace_id=self.namespace_id,
             namespace_name=self.namespace_name
         )
-        # 队列发现器
-        self.queue_discovery = QueueDiscovery(
-            redis_client=self.redis_client,
-            redis_prefix=self.prefix,
-            consumer_group=self.consumer_group,
-            consumer_manager=self.consumer_manager
-        )
-        # 先进行一次队列发现，确保ConsumerManager有正确的队列列表
-        await self.queue_discovery.initial_queue_discovery()
-        # 消息消费器
-        self.message_consumer = MessageConsumer(
-            redis_client=self.redis_client,
-            redis_prefix=self.prefix,
-            consumer_group=self.consumer_group,
-            consumer_id=self.consumer_id,
-            task_persistence=self.task_persistence,
-            queue_discovery=self.queue_discovery
-        )
-        # 任务状态更新器
-        self.task_updater = TaskUpdater(
-            redis_client=self.redis_client,
-            async_session_local=self.AsyncSessionLocal,
-            redis_prefix=self.prefix,
-            consumer_id=self.consumer_id
-        )
-        # 离线恢复处理器
-        self.offline_recovery = OfflineRecoveryHandler(
-            redis_client=self.redis_client,
-            redis_prefix=self.prefix,
-            consumer_id=self.consumer_id,
-            task_updater=self.task_updater
-        )
-        # 延迟初始化（需要consumer_manager）
-        self.offline_recovery.set_consumer_manager(self.consumer_manager)
-        # 数据库维护
-        self.database_maintenance = DatabaseMaintenance(
-            async_session_local=self.AsyncSessionLocal
-        )
-        # 积压监控器
-        self.backlog_monitor = BacklogMonitor(
-            redis_client=self.redis_client,
-            async_session_local=self.AsyncSessionLocal,
-            redis_prefix=self.prefix,
-            namespace_name=self.namespace_name,
-            node_id=self.node_id,
-            enable_monitor=self.enable_backlog_monitor,
-            monitor_interval=self.backlog_monitor_interval
-        )
-        # 5. 启动所有子模块
+        # 3. 设置运行状态
         self._running = True
-        # 启动队列发现
-        await self.queue_discovery.start_discovery()
-        # 启动消息消费
-        await self.message_consumer.start()
-        # 启动任务状态更新
-        await self.task_updater.start()
-        # 启动离线恢复
-        await self.offline_recovery.start()
-        # 启动数据库维护
-        await self.database_maintenance.start()
-        # 启动积压监控
-        if self.enable_backlog_monitor:
-            await self.backlog_monitor.start()
-            logger.info(f"Stream backlog monitor enabled with {self.backlog_monitor_interval}s interval")
-        # 如果使用HEARTBEAT策略，ConsumerManager会自动管理心跳
-        if self.consumer_manager:
-            logger.debug("Heartbeat is managed by ConsumerManager")
-        logger.debug("PostgreSQL consumer started successfully")
+        # 注意：不在主进程启动定时刷新任务，因为缓冲区在子进程中
+        # 刷新逻辑已集成到任务处理函数中（每次处理任务时都会检查是否需要刷新）
+        # 启动 Worker（使用通配符队列）
+        logger.info("=" * 60)
+        logger.info(f"启动 PG Consumer (通配符队列模式)")
+        logger.info("=" * 60)
+        logger.info(f"命名空间: {self.namespace_name} ({self.namespace_id or 'N/A'})")
+        logger.info(f"监听队列: * (所有队列) + TASK_CHANGES (状态更新)")
+        logger.info(f"INSERT 批量: {self.insert_buffer.max_size} 条")
+        logger.info(f"UPDATE 批量: {self.update_buffer.max_size} 条")
+        logger.info(f"刷新间隔: {self.insert_buffer.max_delay} 秒")
+        logger.info(f"并发数: {concurrency}")
+        logger.info("=" * 60)
+        try:
+            # 启动 Worker
+            # 需要同时监听两个队列：
+            # 1. '*' - 通配符匹配所有常规任务队列（INSERT）
+            # 2. 'TASK_CHANGES' - 专门的状态更新队列（UPDATE）
+            await self.app.start(
+                queues=['*', 'TASK_CHANGES'],  # 🎯 关键：监听所有队列 + 状态更新队列
+                concurrency=concurrency
+            )
+        finally:
+            await self.stop()
     async def stop(self):
-        """停止消费者"""
-        logger.debug("Stopping PostgreSQL consumer...")
+        """停止 Consumer"""
+        logger.info("停止 PG Consumer...")
         self._running = False
-        # 停止所有子模块
-        if self.backlog_monitor:
-            await self.backlog_monitor.stop()
-        if self.database_maintenance:
-            await self.database_maintenance.stop()
-        if self.offline_recovery:
-            await self.offline_recovery.stop()
-        if self.task_updater:
-            await self.task_updater.stop()
-        if self.message_consumer:
-            await self.message_consumer.stop()
-        if self.queue_discovery:
-            await self.queue_discovery.stop_discovery()
-        # 清理ConsumerManager
-        if self.consumer_manager:
-            try:
-                self.consumer_manager.cleanup()
-                logger.debug(f"Cleaned up ConsumerManager for consumer: {self.consumer_id}")
-            except Exception as e:
-                logger.error(f"Error cleaning up ConsumerManager: {e}")
-                logger.error(traceback.format_exc())
-        # 关闭连接
-        if self.redis_client:
-            await self.redis_client.close()
-        if self.async_engine:
-            await self.async_engine.dispose()
-        logger.debug("PostgreSQL consumer stopped")
+        # 注意：定时刷新任务已移除，刷新逻辑集成在任务处理中
+        # 最后刷新一次缓冲区
+        try:
+            if self.insert_buffer.records:
+                await self.insert_buffer.flush(self.db_manager)
+            if self.update_buffer.records:
+                await self.update_buffer.flush(self.db_manager)
+        except Exception as e:
+            logger.error(f"最终刷新失败: {e}")
+        # 注意：不关闭数据库引擎，因为它是全局单例，由 connector.py 管理
+        # 多个 consumer 实例可能共享同一个引擎
+        # 打印统计信息
+        insert_stats = self.insert_buffer.get_stats()
+        update_stats = self.update_buffer.get_stats()
+        logger.info("=" * 60)
+        logger.info("PG Consumer 统计信息")
+        logger.info("=" * 60)
+        logger.info(f"INSERT: 总计 {insert_stats['total_flushed']} 条, "
+                   f"刷新 {insert_stats['flush_count']} 次, "
+                   f"平均 {insert_stats['avg_per_flush']} 条/次")
+        logger.info(f"UPDATE: 总计 {update_stats['total_flushed']} 条, "
+                   f"刷新 {update_stats['flush_count']} 次, "
+                   f"平均 {update_stats['avg_per_flush']} 条/次")
+        logger.info("=" * 60)
+        logger.info("PG Consumer 已停止")

jettask 0.2.23__py3-none-any.whl → 0.2.24__py3-none-any.whl

jettask 0.2.23py3-none-any.whl → 0.2.24py3-none-any.whl