PyPI - deva - Versions diffs - 1.3.2__tar.gz → 1.4.0__tar.gz - Mend

deva 1.3.2tar.gz → 1.4.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (39) hide show

{deva-1.3.2 → deva-1.4.0}/PKG-INFO +5 -28
deva-1.4.0/deva/__init__.py +123 -0
{deva-1.3.2 → deva-1.4.0}/deva/admin.py +364 -23
{deva-1.3.2 → deva-1.4.0}/deva/browser.py +6 -39
{deva-1.3.2 → deva-1.4.0}/deva/core.py +580 -229
{deva-1.3.2 → deva-1.4.0}/deva/endpoints.py +63 -1
{deva-1.3.2 → deva-1.4.0}/deva/future.py +28 -3
{deva-1.3.2 → deva-1.4.0}/deva/gpt.py +37 -9
deva-1.4.0/deva/graph.py +358 -0
{deva-1.3.2 → deva-1.4.0}/deva/lambdas.py +33 -0
{deva-1.3.2 → deva-1.4.0}/deva/namespace.py +37 -9
deva-1.4.0/deva/new_bus.py +166 -0
{deva-1.3.2 → deva-1.4.0}/deva/page.py +98 -17
{deva-1.3.2 → deva-1.4.0}/deva/pipe.py +29 -2
{deva-1.3.2 → deva-1.4.0}/deva/sources.py +5 -5
deva-1.4.0/deva/store.py +241 -0
{deva-1.3.2 → deva-1.4.0}/deva/when.py +1 -1
{deva-1.3.2 → deva-1.4.0}/deva.egg-info/PKG-INFO +5 -28
{deva-1.3.2 → deva-1.4.0}/deva.egg-info/SOURCES.txt +1 -0
{deva-1.3.2 → deva-1.4.0}/deva.egg-info/requires.txt +3 -0
{deva-1.3.2 → deva-1.4.0}/setup.py +4 -1
deva-1.3.2/deva/__init__.py +0 -24
deva-1.3.2/deva/graph.py +0 -233
deva-1.3.2/deva/store.py +0 -239
{deva-1.3.2 → deva-1.4.0}/README.rst +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/bus.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/compute.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/monitor.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/search.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/topic.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/utils/__init__.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/utils/simhash.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/utils/sqlitedict.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/utils/time.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva/utils/whooshalchemy.py +0 -0
{deva-1.3.2 → deva-1.4.0}/deva.egg-info/dependency_links.txt +0 -0
{deva-1.3.2 → deva-1.4.0}/deva.egg-info/not-zip-safe +0 -0
{deva-1.3.2 → deva-1.4.0}/deva.egg-info/top_level.txt +0 -0
{deva-1.3.2 → deva-1.4.0}/setup.cfg +0 -0

{deva-1.3.2 → deva-1.4.0}/PKG-INFO RENAMED Viewed

@@ -1,39 +1,14 @@
 Metadata-Version: 2.1
 Name: deva
-Version: 1.3.2
+Version: 1.4.0
 Summary: data eval in future
 Home-page: https://github.com/sostc/deva
 Author: spark
 Author-email: zjw0358@gmail.com
 License: http://www.apache.org/licenses/LICENSE-2.0.html
+Platform: UNKNOWN
 Requires-Python: >=3.5
-Requires-Dist: toolz
-Requires-Dist: zict
-Requires-Dist: jieba
-Requires-Dist: six
-Requires-Dist: requests
-Requires-Dist: pandas
-Requires-Dist: pandas-compat
-Requires-Dist: dill
-Requires-Dist: Whoosh
-Requires-Dist: SQLAlchemy
-Requires-Dist: tornado
-Requires-Dist: easyquotation
-Requires-Dist: pampy
-Requires-Dist: pymaybe
-Requires-Dist: requests-html
-Requires-Dist: aioredis>=2.0
-Requires-Dist: apscheduler
-Requires-Dist: werkzeug==1.0.0
-Requires-Dist: networkx==2
-Requires-Dist: graphviz
-Requires-Dist: sockjs-tornado>=1.0.7
-Requires-Dist: expiringdict
-Requires-Dist: aiosmtplib
-Requires-Dist: trafilatura
-Requires-Dist: newspaper3k
-Requires-Dist: boilerpy3
-Requires-Dist: sumy
+Provides-Extra: llm
 .. image:: https://raw.githubusercontent.com/sostc/deva/master/deva.jpeg
    :target: https://github.com/sostc/deva
@@ -273,3 +248,5 @@ workers
     when('open', source=bus).then(lambda: print(f'开盘啦'))
     Deva.run()

deva-1.4.0/deva/__init__.py ADDED Viewed

@@ -0,0 +1,123 @@
+from __future__ import absolute_import, division, print_function
+from .core import *
+from .compute import *
+from .graph import *
+from .sources import *
+from .namespace import *
+from .when import *
+from .endpoints import *
+from .future import *
+from .bus import *
+from .search import IndexStream
+from .pipe import *
+# from .monitor import Monitor
+from .lambdas import _
+from .browser import browser, tab, tabs
+from .core import *
+def sync_gpt(prompts):
+    from .gpt import sync_gpt as _sync_gpt
+    return _sync_gpt(prompts)
+async def async_gpt(prompts):
+    from .gpt import async_gpt as _async_gpt
+    return await _async_gpt(prompts)
+"""
+流式计算框架 Deva - 构建智能数据管道的核心工具
+基于声明式流编程范式，提供高效的数据管道构建与执行能力，特别适用于开发实时监控系统、数据分析系统等事件驱动型应用。核心定位：
+■ 流计算范式 - 数据自动流动与级联计算
+■ 可视化编排 - 支持拖拽式管道设计
+■ 弹性扩展 - 动态添加/移除处理节点
+■ 状态管理 - 带状态计算的自动持久化
+核心能力架构:
+1. 流式编程模型
+- 声明式管道: 通过 >> 操作符构建数据流图，自动建立处理链路
+- 响应式计算: 数据变更自动触发下游计算，支持级联更新
+- 函数式组合: 提供 map/filter/reduce 等操作符链式组合
+2. 计算原语体系
+- 内置流类型:
+  * DBStream: 时序数据库流(自动维护存储/时间窗口查询)
+  * IndexStream: 全文检索流
+  * FileLogStream: 文件日志流(滚动存储/实时追踪)
+3. 事件驱动应用
+- 监控系统构建:
+    sensors >> anomaly_detect >> alert  # 异常检测告警
+    logs >> pattern_analyze >> dashboard  # 日志实时分析
+- 数据分析系统:
+    kafka_source >> realtime_etl >> feature_store >> ml_pipeline
+    db_stream.window(300).aggregate() >> report_generator
+4. 高效开发实践
+- 流式lambda简化:
+    _ * 2 >> log  # 自动展开为 lambda x: x*2
+- 异步处理集成:
+    async_data | async_db_query | async_emit
+- 可视化调试工具:
+    stream.visualize()  # 生成流拓扑图
+    stream.webview()    # Web监控面板
+5. 生产级特性
+- 智能背压管理: 自动缓冲控制与流速调节
+- 持久化保障: 重要状态自动持久化到 DBStream
+- 错误恢复: 支持异常流重试与数据重放
+    DBStream('events').replay(speed=2)  # 2倍速历史回放
+- 资源治理: 连接数/内存/存储的自动管控
+典型应用场景:
+▌智能监控系统
+- 设备指标实时分析:
+    sensors.window(60).mean() >> threshold_check >> alert
+- 日志异常检测:
+    log_stream.map(parse) >> detect_errors >> ops_center
+▌实时分析管道
+- 流式ETL:
+    kafka_source >> clean >> transform >> feature_store
+- 交互式分析:
+    (browser.inputs
+     >> feature_extract
+     >> model.predict
+     >> visualize)
+▌数据采集系统
+- 智能爬虫:
+    BrowserCrawler(urls)
+    >> extract_data
+    >> DBStream('crawled')
+    >> auto_export
+- IoT数据处理:
+    device_streams.merge()
+    >> deduplicate
+    >> time_window_aggregate
+技术体系:
+数据输入 -> 流计算层 -> 输出系统
+    │           │            │
+    ├─事件驱动──┼─流水线处理─┼─实时可视化
+    ├─消息队列  │ 状态计算   │ 时序数据库
+    └─日志文件  └─AI模型集成─┴─API服务
+核心优势:
+• 复杂事件处理(CEP)支持: 内置时间窗口/模式匹配等语义
+• 计算存储一体化: 流处理与DBStream深度集成
+• 多范式统一: 兼容同步/异步/批处理混合编程
+• 生产就绪: 内置背压控制/自动扩容/故障恢复机制
+"""
+__version__ = '1.4.0'

{deva-1.3.2 → deva-1.4.0}/deva/admin.py RENAMED Viewed

@@ -8,6 +8,9 @@ Deva 管理面板 - 基于 PyWebIO 和 Tornado 的 Web 应用程序
 - 数据表展示：支持分页和实时更新的表格数据展示
 - 日志系统：实时日志监控和手动日志写入
 - 用户认证：基于用户名和密码的登录系统
+- 数据库管理：支持 SQLite 数据库的 CRUD 操作和状态监控
+- 流式处理：实时监控和操作 Deva 数据流
+- 对象检查：支持 Python 对象的详细属性检查
 主要模块：
 - 数据流模块：实时监控多个数据流，包括访问日志、新闻、板块数据等
@@ -15,12 +18,32 @@ Deva 管理面板 - 基于 PyWebIO 和 Tornado 的 Web 应用程序
 - 数据表模块：支持分页、过滤和实时更新的表格展示
 - 日志模块：提供日志查看器和手动日志写入功能
 - 用户认证模块：基于 PyWebIO 的 basic_auth 实现
+- 数据库管理模块：提供 SQLite 数据库的 CRUD 操作和状态监控
+- 流式处理模块：支持 Deva 数据流的实时监控和操作
+- 对象检查模块：支持 Python 对象的详细属性检查
 技术栈：
 - 前端：PyWebIO
 - 后端：Tornado
 - 数据流：Deva 流处理框架
+- 数据库：SQLite
 - 缓存：基于 ExpiringDict 的缓存系统
+- 异步处理：Tornado 异步框架
+- 持久化存储：基于 DBStream 的时序数据存储
+核心特性：
+- 实时性：支持毫秒级数据更新和监控
+- 可扩展性：模块化设计，易于功能扩展
+- 安全性：完善的用户认证机制
+- 易用性：简洁的 API 和直观的 Web 界面
+- 高性能：基于异步 IO 的高效处理能力
+- 持久化：支持数据自动持久化和历史数据回放
+典型应用场景：
+- 实时监控系统：设备指标、日志异常等实时监控
+- 数据分析系统：流式 ETL、特征提取、模型预测
+- 数据采集系统：智能爬虫、IoT 数据处理
+- 任务调度系统：定时任务管理和监控
 """
@@ -32,6 +55,7 @@ import os
 import traceback
 import json
 import time
+import requests
 from urllib.parse import urljoin
 from typing import Callable, Union
@@ -54,9 +78,9 @@ from pywebio.output import (
 )
 from pywebio.platform.tornado import webio_handler
 from pywebio_battery import put_logbox, logbox_append, set_localstorage, get_localstorage
-from pywebio.pin import pin, put_input
+from pywebio.pin import pin, put_file_upload, put_input
 from pywebio.session import set_env, run_async, run_js, run_asyncio_coroutine, get_session_implement
-from pywebio.input import input, input_group, PASSWORD, textarea, actions, TEXT
+from pywebio.input import input, input_group, PASSWORD, textarea, actions, TEXT, file_upload
 @timer(5,start=False)
@@ -84,7 +108,7 @@ async def get_gpt_response(prompt, session=None, scope=None, model_type='deepsee
     """
     config = NB(model_type)
     required_configs = ['api_key', 'base_url', 'model']
-    missing_configs = [config for config in required_configs if config not in config]
+    missing_configs = [c for c in required_configs if c not in config]
     if missing_configs:
         message = "警告: 在NB配置中缺少以下必要配置项: " + ', '.join(missing_configs) + ". 请确保在其他地方正确设置这些配置项的值。"
         message >> warn
@@ -105,6 +129,56 @@ async def get_gpt_response(prompt, session=None, scope=None, model_type='deepsee
     api_key = config.get('api_key')
     base_url = config.get('base_url')
     model = config.get('model')
+    async def diagnose_backend_error():
+        """探测后端错误详情，返回可读文本。"""
+        try:
+            url = base_url.rstrip('/') + '/chat/completions'
+            payload = {
+                "model": model,
+                "messages": messages,
+                "stream": False,
+                "max_tokens": 64,
+            }
+            headers = {
+                "Authorization": f"Bearer {api_key}",
+                "Content-Type": "application/json",
+            }
+            resp = await asyncio.to_thread(
+                requests.post,
+                url,
+                headers=headers,
+                data=json.dumps(payload),
+                timeout=15,
+            )
+            text = (resp.text or "").strip()
+            try:
+                data = resp.json()
+            except Exception:
+                data = None
+            if isinstance(data, dict):
+                code = data.get("code")
+                message = data.get("message")
+                if code not in (None, 0):
+                    return f"上游接口错误(code={code}, message={message})"
+                if message and not data.get("choices"):
+                    return f"上游接口返回异常消息(message={message})"
+            return f"上游返回异常响应(status={resp.status_code}, body={text[:300]})"
+        except Exception as probe_error:
+            return f"上游诊断失败({type(probe_error).__name__}: {probe_error})"
+    def safe_toast(message, color='error'):
+        """仅在可用的 PyWebIO 任务上下文中弹出提示，避免后台协程报错。"""
+        if not session:
+            return
+        try:
+            toast(message, color=color)
+        except RuntimeError as e:
+            (f"toast skipped(no task context): {e}") >> log
+        except Exception as e:
+            (f"toast failed: {e}") >> log
     gpt_client = AsyncOpenAI(api_key=api_key, base_url=base_url)
     start_time = time.time()
@@ -127,9 +201,11 @@ async def get_gpt_response(prompt, session=None, scope=None, model_type='deepsee
             max_tokens=8192
         )
     except Exception as e:
-        (f"请求失败: {traceback.format_exc()}")>>log
-        toast("请求失败~")
-        return ""
+        backend_error = await diagnose_backend_error()
+        (f"请求失败: {traceback.format_exc()} | {backend_error}") >> log
+        (f"GPT请求失败(model={model_type}/{model}): {backend_error}") >> warn
+        safe_toast("请求失败: " + backend_error, color='error')
+        return f"[GPT_ERROR] {backend_error}"
     # 初始化文本缓冲区
     buffer = ""
@@ -147,12 +223,17 @@ async def get_gpt_response(prompt, session=None, scope=None, model_type='deepsee
         返回:
             tuple: (更新后的buffer, 更新后的accumulated_text, 更新后的start_time)
         """
-        if chunk.choices[0].delta.content:
+        content = ""
+        if getattr(chunk, "choices", None):
+            delta = getattr(chunk.choices[0], "delta", None)
+            content = getattr(delta, "content", "") or ""
+        if content:
             # 如果内容以"检索"开头，跳过该行
-            if chunk.choices[0].delta.content.startswith("检索"):
+            if content.startswith("检索"):
                 return buffer, accumulated_text, start_time
-            buffer += chunk.choices[0].delta.content
+            buffer += content
             # 判断是否到达段落结尾（以句号、问号、感叹号+换行符为标志）
             paragraph_end_markers = ('.', '?', '!', '。', '？', '！')
@@ -200,20 +281,35 @@ async def get_gpt_response(prompt, session=None, scope=None, model_type='deepsee
                     start_time = time.time()
         # 处理最后一个未显示的块
-        if buffer and not chunk.choices[0].delta.content:
+        if buffer and not content:
             accumulated_text += buffer
             logfunc(buffer)
             start_time = time.time()
             buffer = ""
         return buffer, accumulated_text, start_time
-    async for chunk in response:
-        buffer, accumulated_text, start_time = await process_chunk(
-            chunk, buffer, accumulated_text, start_time
-        )
-    # 返回完整的累计文本
-    return accumulated_text
+    try:
+        async for chunk in response:
+            buffer, accumulated_text, start_time = await process_chunk(
+                chunk, buffer, accumulated_text, start_time
+            )
+        # OpenAI 流结束时不保证一定有空 content 结尾块，兜底 flush 剩余缓存
+        if buffer.strip():
+            accumulated_text += buffer
+            logfunc(buffer)
+            buffer = ""
+        if not accumulated_text.strip():
+            backend_error = await diagnose_backend_error()
+            (f"GPT空响应(model={model_type}/{model}): {backend_error}") >> warn
+            safe_toast("模型返回空内容: " + backend_error, color='error')
+            return f"[GPT_EMPTY] {backend_error}"
+        # 返回完整的累计文本
+        return accumulated_text
+    finally:
+        await gpt_client.close()
 # tab('http://secsay.com')
@@ -1045,6 +1141,7 @@ async def init_admin_ui(title):
         参数:
             title (str): 页面标题
         """
+        cut_foot()
         admin_info = NB('admin')
         if not admin_info.get('username'):
@@ -1059,7 +1156,6 @@ async def init_admin_ui(title):
         create_sidebar()
         set_env(title=title)
-        cut_foot()
         create_nav_menu()
         put_text(f"Hello, {user_name}. 欢迎光临，恭喜发财")
@@ -1497,6 +1593,65 @@ async def document():
             })
     # 显示所有模块的tab
     put_tabs(tabs)
+def show_dtalk_archive():
+    """显示 Dtalk 消息存档"""
+    with use_scope('dtalk_archive_display', clear=True):
+        # 获取 Dtalk 消息存档
+        dtalk_archive = NB('dtalk_archive')
+        if not dtalk_archive:
+            put_text('暂无 Dtalk 消息记录')
+            return
+        # 创建消息表格
+        archive_table = [['时间', '消息内容', '操作']]
+        # 按时间倒序显示（最新的在前面）
+        for timestamp, message in sorted(dtalk_archive.items(), key=lambda x: float(x[0]), reverse=True):
+            from datetime import datetime
+            readable_time = datetime.fromtimestamp(float(timestamp)).strftime('%Y-%m-%d %H:%M:%S')
+            # 截断过长的消息
+            display_message = message[:100] + '...' if len(message) > 100 else message
+            # 添加操作按钮
+            actions = put_buttons([
+                {'label': '查看', 'value': 'view'},
+                {'label': '删除', 'value': 'delete'}
+            ], onclick=lambda v, t=timestamp: view_dtalk_message(t, message) if v == 'view' else delete_dtalk_message(t))
+            archive_table.append([readable_time, display_message, actions])
+        put_table(archive_table)
+        # 添加清空所有消息的按钮
+        put_button('清空所有消息', onclick=clear_all_dtalk_messages, color='danger')
+def view_dtalk_message(timestamp, message):
+    """查看完整的 Dtalk 消息"""
+    from datetime import datetime
+    readable_time = datetime.fromtimestamp(float(timestamp)).strftime('%Y-%m-%d %H:%M:%S')
+    popup(f'Dtalk 消息 - {readable_time}', [
+        put_markdown(f'**发送时间:** {readable_time}'),
+        put_markdown('**消息内容:**'),
+        put_markdown(message)
+    ], size='large')
+def delete_dtalk_message(timestamp):
+    """删除指定的 Dtalk 消息"""
+    del NB('dtalk_archive')[timestamp]
+    toast('消息已删除', color='success')
+    # 刷新显示
+    show_dtalk_archive()
+def clear_all_dtalk_messages():
+    """清空所有 Dtalk 消息"""
+    NB('dtalk_archive').clear()
+    toast('所有消息已清空', color='success')
+    # 刷新显示
+    show_dtalk_archive()
 async def main():
     # await my_timer()
     # 这个将会把会话协程卡在这里不动，采用 run_async则不会堵塞
@@ -1761,6 +1916,11 @@ async def main():
     with put_collapse('其他控件', open=True):
         put_input('write_to_log', type='text', value='', placeholder='手动写入日志')
         put_button('>', onclick=write_to_log)
+    # Dtalk 消息存档展示
+    put_markdown('### 📱 Dtalk 消息存档')
+    set_scope('dtalk_archive_display')
+    show_dtalk_archive()
@@ -1925,9 +2085,71 @@ def table_click(tablename):
     }
     put_button('新增数据', onclick=lambda: edit_data_popup(categorized_data['strings'],tablename=tablename))
+    async def upload_table_data():
+        # 获取用户输入的key值
+        key = await pin['upload_key']
+        # 获取上传的文件
+        file = await pin['upload_file']
+        if not key:
+            toast('请输入key值', color='error')
+            return
+        if not file:
+            toast('请选择要上传的文件', color='error')
+            return
+        try:
+            # 根据文件扩展名读取文件
+            if file['filename'].endswith('.csv'):
+                # 使用StringIO读取文件内容
+                from io import StringIO
+                content = file['content'].decode('utf-8')
+                df = pd.read_csv(StringIO(content))
+            elif file['filename'].endswith(('.xls', '.xlsx')):
+                # 使用BytesIO读取二进制文件内容
+                from io import BytesIO
+                df = pd.read_excel(BytesIO(file['content']))
+            else:
+                toast('仅支持csv或excel文件', color='error')
+                return
+            # 检查是否有列名
+            if df.columns.empty:
+                toast('文件必须包含列名', color='error')
+                return
+            # 检查数据是否为空
+            if df.empty:
+                toast('上传的文件不能为空', color='error')
+                return
+            # 保存到数据库
+            (key, df) >> NB(tablename)
+            toast('上传成功', color='success')
+            close_popup()
+            # 刷新页面
+            table_click(tablename)
+        except pd.errors.EmptyDataError:
+            toast('上传的文件为空或格式不正确', color='error')
+        except pd.errors.ParserError:
+            toast('文件解析失败，请检查文件格式', color='error')
+        except UnicodeDecodeError:
+            toast('文件编码错误，请使用UTF-8编码', color='error')
+        except Exception as e:
+            toast(f'上传失败: {str(e)}', color='error')
+            log(f'上传失败详情: {traceback.format_exc()}')  # 记录详细错误日志
+    put_button('上传表格数据', onclick=lambda:
+               popup('上传表格数据', [
+                    put_input('upload_key', placeholder='请输入key值'),
+                    put_file_upload('upload_file', accept='.csv,.xls,.xlsx', max_size='10M'),
+                    put_buttons(['上传', '取消'], onclick=[
+                        lambda: run_async(upload_table_data()),
+                        close_popup
+                    ])
+               ]))
     # 显示字符串类型数据
     if categorized_data['strings']:
         with put_collapse('strings', open=True):
@@ -1972,9 +2194,118 @@ def table_click(tablename):
     if categorized_data['dataframes']:
         with put_collapse('dataframe', open=True):
             for df_name, df in categorized_data['dataframes']:
+                # 将中文df_name转换为拼音
+                if any('\u4e00' <= char <= '\u9fff' for char in df_name):
+                    from pypinyin import pinyin, Style
+                    scope_name = ''.join([item[0] for item in pinyin(df_name, style=Style.NORMAL)])
+                else:
+                    scope_name = df_name
                 with put_collapse(df_name, open=True):
-                    paginate_dataframe(scope=df_name, df=df, page_size=10)
+                    paginate_dataframe(scope=scope_name, df=df, page_size=10)
+                    # 添加数据分析按钮
+                    with use_scope(f'analysis_{scope_name}'):  # 为每个DataFrame创建独立的作用域
+                        put_buttons([
+                            '描述性统计',
+                            '数据透视表',
+                            '分组聚合',
+                            '缺失值分析'
+                        ], onclick=[
+                            lambda df=df, scope=scope_name: run_async(show_descriptive_stats(df, scope)),
+                            lambda df=df, scope=scope_name: run_async(show_pivot_table(df, scope)),
+                            lambda df=df, scope=scope_name: run_async(show_groupby_analysis(df, scope)),
+                            lambda df=df, scope=scope_name: run_async(show_missing_values(df, scope))
+                        ])
+                    # 添加分析结果显示区域
+                    with use_scope(f'analysis_result_{scope_name}'):
+                        pass
+                    put_button(f'删除 {df_name}', onclick=lambda df_name=df_name: run_async(delete_dataframe(df_name, tablename)))
+        # 定义分析函数
+        async def show_descriptive_stats(df, scope):
+            """显示描述性统计"""
+            with use_scope(f'analysis_result_{scope}'):
+                put_markdown('### 描述性统计')
+                stats = df.describe(include='all').T
+                put_table(stats.reset_index().values.tolist())
+        async def show_pivot_table(df, scope):
+            """显示数据透视表"""
+            with use_scope(f'analysis_result_{scope}'):
+                put_markdown('### 数据透视表')
+                # 获取所有数值列和分类列
+                numeric_cols = df.select_dtypes(include='number').columns.tolist()
+                category_cols = df.select_dtypes(include='object').columns.tolist()
+                if not category_cols or not numeric_cols:
+                    toast('需要至少一个分类列和一个数值列', color='error')
+                    return
+                # 创建交互式输入
+                put_input('pivot_index', placeholder='选择行索引（分类列）')
+                put_input('pivot_columns', placeholder='选择列索引（可选，分类列）')
+                put_input('pivot_values', placeholder='选择聚合值（数值列）')
+                put_buttons(['生成'], onclick=[
+                    lambda: run_async(generate_pivot(df, scope))
+                ])
+        async def generate_pivot(df, scope):
+            """生成数据透视表"""
+            index = await pin['pivot_index']
+            columns = await pin['pivot_columns'] or None
+            values = await pin['pivot_values']
+            try:
+                pivot = df.pivot_table(index=index, columns=columns, values=values, aggfunc='mean')
+                with use_scope(f'analysis_result_{scope}'):
+                    put_table(pivot.reset_index().values.tolist())
+            except Exception as e:
+                toast(f'生成数据透视表失败: {str(e)}', color='error')
+        async def show_groupby_analysis(df, scope):
+            """显示分组聚合分析"""
+            with use_scope(f'analysis_result_{scope}'):
+                put_markdown('### 分组聚合分析')
+                # 获取所有分类列和数值列
+                group_cols = df.select_dtypes(include='object').columns.tolist()
+                agg_cols = df.select_dtypes(include='number').columns.tolist()
+                if not group_cols or not agg_cols:
+                    toast('需要至少一个分类列和一个数值列', color='error')
+                    return
+                # 创建交互式输入
+                put_input('groupby_col', placeholder='选择分组列（分类列）')
+                put_input('agg_col', placeholder='选择聚合列（数值列）')
+                put_buttons(['分析'], onclick=[
+                    lambda: run_async(generate_groupby(df, scope))
+                ])
+        async def generate_groupby(df, scope):
+            """生成分组聚合结果"""
+            group_col = await pin['groupby_col']
+            agg_col = await pin['agg_col']
+            try:
+                grouped = df.groupby(group_col)[agg_col].agg(['mean', 'sum', 'count'])
+                with use_scope(f'analysis_result_{scope}'):
+                    put_table(grouped.reset_index().values.tolist())
+            except Exception as e:
+                toast(f'分组聚合失败: {str(e)}', color='error')
+        async def show_missing_values(df, scope):
+            """显示缺失值分析"""
+            with use_scope(f'analysis_result_{scope}'):
+                put_markdown('### 缺失值分析')
+                missing = df.isnull().sum()
+                missing_pct = (missing / len(df)) * 100
+                missing_df = pd.DataFrame({
+                    '缺失值数量': missing,
+                    '缺失值比例(%)': missing_pct
+                })
+                put_table(missing_df.reset_index().values.tolist())
     # 显示时间序列数据
     if categorized_data['timeseries']:
         with put_collapse('时间序列数据', open=True):
@@ -2010,6 +2341,17 @@ async def save_string(key,data,tablename):
     close_popup()
         # 重新打开编辑popup以刷新内容
     edit_data_popup(data,tablename=tablename)
+# 删除DataFrame的回调函数
+async def delete_dataframe(df_name, tablename):
+    """删除指定的DataFrame"""
+    try:
+        del NB(tablename)[df_name]
+        toast(f'已删除DataFrame: {df_name}', color='success')
+        # 刷新显示
+        table_click(tablename)
+    except Exception as e:
+        toast(f'删除失败: {str(e)}', color='error')
 # 删除键值对的回调函数
 async def delete_string(key,data,tablename):
     # 删除数据
@@ -2201,4 +2543,3 @@ if __name__ == '__main__':
     Deva.run()

deva 1.3.2__tar.gz → 1.4.0__tar.gz

deva 1.3.2tar.gz → 1.4.0tar.gz