PyPI - dtflow - Versions diffs - 0.5.6__py3-none-any.whl → 0.5.7__py3-none-any.whl - Mend

dtflow 0.5.6py3-none-any.whl → 0.5.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (14) hide show

dtflow/SKILL.md +225 -0
dtflow/__init__.py +1 -1
dtflow/__main__.py +31 -51
dtflow/cli/commands.py +16 -10
dtflow/cli/skill.py +72 -0
{dtflow-0.5.6.dist-info → dtflow-0.5.7.dist-info}/METADATA +40 -3
{dtflow-0.5.6.dist-info → dtflow-0.5.7.dist-info}/RECORD +9 -12
dtflow/mcp/__init__.py +0 -29
dtflow/mcp/__main__.py +0 -18
dtflow/mcp/cli.py +0 -388
dtflow/mcp/docs.py +0 -416
dtflow/mcp/server.py +0 -153
{dtflow-0.5.6.dist-info → dtflow-0.5.7.dist-info}/WHEEL +0 -0
{dtflow-0.5.6.dist-info → dtflow-0.5.7.dist-info}/entry_points.txt +0 -0

dtflow/SKILL.md ADDED Viewed

@@ -0,0 +1,225 @@
+---
+name: dtflow
+description: 数据文件处理（JSONL/CSV/Parquet）- 去重/采样/统计/过滤/转换/Schema验证/训练框架导出
+---
+# dtflow - 机器学习训练数据格式转换工具
+## 设计理念
+- **函数式优于类继承**：直接用 lambda/函数做转换，不需要 OOP 抽象
+- **KISS 原则**：一个 `DataTransformer` 类搞定所有操作
+- **链式 API**：`dt.filter(...).to(...).save(...)`
+## Python API
+```python
+from dtflow import DataTransformer
+# 加载数据（支持 JSONL/JSON/CSV/Parquet/Arrow，使用 Polars 引擎）
+dt = DataTransformer.load("data.jsonl")
+# 链式操作
+(dt.filter(lambda x: x.score > 0.8)
+   .to(lambda x: {"q": x.question, "a": x.answer})
+   .dedupe("text")
+   .save("output.jsonl"))
+```
+### 数据过滤
+```python
+dt.filter(lambda x: x.score > 0.8)
+dt.filter(lambda x: x.language == "zh")
+```
+### 数据验证
+```python
+# 简单验证
+errors = dt.validate(lambda x: len(x.messages) >= 2)
+# Schema 验证
+from dtflow import Schema, Field, openai_chat_schema
+result = dt.validate_schema(openai_chat_schema)  # 预设 Schema
+valid_dt = dt.validate_schema(schema, filter_invalid=True)  # 过滤无效数据
+```
+**预设 Schema**：`openai_chat_schema`、`alpaca_schema`、`sharegpt_schema`、`dpo_schema`
+### 数据转换
+```python
+# 自定义转换
+dt.to(lambda x: {"question": x.q, "answer": x.a})
+# 使用预设模板
+dt.to(preset="openai_chat", user_field="q", assistant_field="a")
+```
+**预设模板**：`openai_chat`、`alpaca`、`sharegpt`、`dpo_pair`、`simple_qa`
+### Token 统计
+```python
+from dtflow import count_tokens, token_counter, token_filter, token_stats
+count = count_tokens("Hello world", model="gpt-4")
+dt.transform(token_counter("text")).save("with_tokens.jsonl")
+dt.filter(token_filter("text", max_tokens=2048))
+# Messages Token 统计（多轮对话）
+from dtflow import messages_token_counter, messages_token_filter
+dt.transform(messages_token_counter(model="gpt-4", detailed=True))
+dt.filter(messages_token_filter(min_turns=2, max_turns=10))
+```
+### 格式转换器
+```python
+from dtflow import (
+    to_hf_dataset, from_hf_dataset,      # HuggingFace Dataset
+    to_openai_batch, from_openai_batch,  # OpenAI Batch API
+    to_llama_factory, to_llama_factory_sharegpt,  # LLaMA-Factory
+    to_swift_messages, to_swift_query_response,   # ms-swift
+    messages_to_text,                    # messages 转纯文本
+)
+```
+### 训练框架导出
+```python
+# 检查兼容性
+result = dt.check_compatibility("llama-factory")
+# 一键导出
+files = dt.export_for("llama-factory", "./output/")  # 生成 data.json + dataset_info.json + train_args.yaml
+files = dt.export_for("swift", "./output/")          # 生成 data.jsonl + train_swift.sh
+files = dt.export_for("axolotl", "./output/")        # 生成 data.jsonl + config.yaml
+```
+### 大文件流式处理
+```python
+from dtflow import load_stream, load_sharded
+# O(1) 内存，100GB 文件也能处理
+(load_stream("huge.jsonl")
+    .filter(lambda x: x["score"] > 0.5)
+    .save("output.jsonl"))
+# 分片文件加载
+(load_sharded("data/train_*.parquet")
+    .filter(lambda x: len(x["text"]) > 10)
+    .save("merged.jsonl"))
+# 分片保存
+load_stream("huge.jsonl").save_sharded("output/", shard_size=100000)
+```
+### 其他操作
+```python
+dt.sample(100)                    # 随机采样
+dt.head(10) / dt.tail(10)         # 取前/后 N 条
+train, test = dt.split(ratio=0.8) # 分割
+dt.shuffle(seed=42)               # 打乱
+dt.stats()                        # 统计
+```
+## CLI 命令
+```bash
+# 统计（推荐首先使用）
+dt stats data.jsonl                               # 基本统计（文件大小、条数、字段）
+dt stats data.jsonl --full                        # 完整模式：值分布、唯一值、非空率
+dt stats data.jsonl --full -n 20                  # 显示 Top 20 值分布
+# Token 统计
+dt token-stats data.jsonl                         # 默认统计 messages 字段
+dt token-stats data.jsonl -f text                 # 指定统计字段
+dt token-stats data.jsonl -m qwen2.5              # 指定分词器 (cl100k_base/qwen2.5/llama3)
+dt token-stats data.jsonl --detailed              # 显示详细统计
+# 采样（支持字段路径语法）
+dt sample data.jsonl 100                          # 随机采样 100 条
+dt sample data.jsonl 100 -t head                  # 取前 100 条 (head/tail/random)
+dt sample data.jsonl 1000 --by=category           # 分层采样
+dt sample data.jsonl 1000 --by=category --uniform # 均匀分层采样
+dt sample data.jsonl --where="messages.#>=2"      # 条件筛选
+dt sample data.jsonl 10 -f input,output           # 只显示指定字段
+dt sample data.jsonl 10 --raw                     # 输出原始 JSON（不截断）
+dt sample data.jsonl 100 --seed=42 -o out.jsonl   # 固定随机种子并保存
+# 去重
+dt dedupe data.jsonl --key=text                   # 精确去重
+dt dedupe data.jsonl --key=meta.id                # 按嵌套字段去重
+dt dedupe data.jsonl --key=text --similar=0.8    # 相似度去重
+dt dedupe data.jsonl --key=text -o deduped.jsonl  # 指定输出文件
+# 清洗
+dt clean data.jsonl --drop-empty=text,answer      # 删除空值记录
+dt clean data.jsonl --min-len=text:10             # 最小长度过滤
+dt clean data.jsonl --max-len=text:2000           # 最大长度过滤
+dt clean data.jsonl --min-len=messages.#:2        # 最少 2 条消息
+dt clean data.jsonl --keep=question,answer        # 只保留指定字段
+dt clean data.jsonl --drop=metadata               # 删除指定字段
+dt clean data.jsonl --strip                       # 去除字符串首尾空白
+dt clean data.jsonl --strip --drop-empty=input -o cleaned.jsonl  # 组合使用
+# 验证
+dt validate data.jsonl --preset=openai_chat       # 预设: openai_chat/alpaca/dpo/sharegpt
+dt validate data.jsonl -p alpaca -f -o valid.jsonl  # 过滤无效数据并保存
+dt validate data.jsonl -p openai_chat -v          # 显示详细信息
+dt validate data.jsonl -p openai_chat --max-errors=50  # 最多显示 50 条错误
+# 转换
+dt transform data.jsonl --preset=openai_chat
+dt transform data.jsonl                           # 交互式生成配置文件
+# 合并与对比
+dt concat a.jsonl b.jsonl -o merged.jsonl         # 合并文件
+dt concat a.jsonl b.jsonl -o merged.jsonl --strict  # 严格模式（字段必须一致）
+dt diff a.jsonl b.jsonl --key=id                  # 对比差异
+dt diff a.jsonl b.jsonl --key=id -o report.md     # 输出对比报告
+# 查看数据
+dt head data.jsonl 10                             # 前 10 条
+dt head data.jsonl 10 -f input,output             # 只显示指定字段
+dt head data.jsonl 10 --raw                       # 输出完整 JSON（不截断）
+dt tail data.jsonl 10                             # 后 10 条
+# 其他
+dt run pipeline.yaml                              # Pipeline 执行
+dt history processed.jsonl                        # 数据血缘
+dt install-skill                                  # 安装 Claude Code skill
+```
+## 字段路径语法
+| 语法 | 含义 | 示例 |
+|------|------|------|
+| `a.b.c` | 嵌套字段 | `meta.source` |
+| `a[0].b` | 数组索引 | `messages[0].role` |
+| `a[-1].b` | 负索引 | `messages[-1].content` |
+| `a.#` | 数组长度 | `messages.#` |
+| `a[*].b` | 展开所有元素 | `messages[*].role` |
+## Pipeline 配置
+```yaml
+# pipeline.yaml
+version: "1.0"
+seed: 42
+input: raw_data.jsonl
+output: processed.jsonl
+steps:
+  - type: filter
+    condition: "score > 0.5"
+  - type: transform
+    preset: openai_chat
+  - type: dedupe
+    key: text
+```

dtflow/__init__.py CHANGED Viewed

@@ -60,7 +60,7 @@ from .tokenizers import (
     token_stats,
 )
-__version__ = "0.5.6"
+__version__ = "0.5.7"
 __all__ = [
     # core

dtflow/__main__.py CHANGED Viewed

@@ -6,21 +6,21 @@ Usage:
     dt --install-completion  # 安装 shell 自动补全
 Commands:
-    sample       从数据文件中采样
-    head         显示文件的前 N 条数据
-    tail         显示文件的后 N 条数据
-    transform    转换数据格式（核心命令）
-    stats        显示数据文件的统计信息
-    token-stats  Token 统计
-    diff         数据集对比
-    dedupe       数据去重
-    concat       拼接多个数据文件
-    clean        数据清洗
-    run          执行 Pipeline 配置文件
-    history      显示数据血缘历史
-    validate     使用 Schema 验证数据格式
-    mcp          MCP 服务管理（install/uninstall/status）
-    logs         日志查看工具使用说明
+    sample        从数据文件中采样
+    head          显示文件的前 N 条数据
+    tail          显示文件的后 N 条数据
+    transform     转换数据格式（核心命令）
+    stats         显示数据文件的统计信息
+    token-stats   Token 统计
+    diff          数据集对比
+    dedupe        数据去重
+    concat        拼接多个数据文件
+    clean         数据清洗
+    run           执行 Pipeline 配置文件
+    history       显示数据血缘历史
+    validate      使用 Schema 验证数据格式
+    logs          日志查看工具使用说明
+    install-skill 安装 dtflow skill 到 Claude Code
 """
 import os
@@ -35,12 +35,15 @@ from .cli.commands import dedupe as _dedupe
 from .cli.commands import diff as _diff
 from .cli.commands import head as _head
 from .cli.commands import history as _history
+from .cli.commands import install_skill as _install_skill
 from .cli.commands import run as _run
 from .cli.commands import sample as _sample
+from .cli.commands import skill_status as _skill_status
 from .cli.commands import stats as _stats
 from .cli.commands import tail as _tail
 from .cli.commands import token_stats as _token_stats
 from .cli.commands import transform as _transform
+from .cli.commands import uninstall_skill as _uninstall_skill
 from .cli.commands import validate as _validate
 # 创建主应用
@@ -263,48 +266,25 @@ dtflow 内置了 toolong 日志查看器，安装后可直接使用 tl 命令：
     print(help_text)
-# ============ MCP 子命令 ============
+# ============ Skill 命令 ============
-mcp_app = typer.Typer(help="MCP 服务管理")
-app.add_typer(mcp_app, name="mcp")
+@app.command("install-skill")
+def install_skill():
+    """安装 dtflow skill 到 Claude Code"""
+    _install_skill()
-@mcp_app.command()
-def install(
-    name: str = typer.Option("datatron", "--name", "-n", help="MCP 服务名称"),
-    target: str = typer.Option("code", "--target", "-t", help="安装目标: desktop/code/all"),
-):
-    """安装 Datatron MCP 服务"""
-    from .mcp.cli import MCPCommands
-    MCPCommands().install(name, target)
-@mcp_app.command()
-def uninstall(
-    name: str = typer.Option("datatron", "--name", "-n", help="MCP 服务名称"),
-    target: str = typer.Option("all", "--target", "-t", help="移除目标: desktop/code/all"),
-):
-    """移除 Datatron MCP 服务"""
-    from .mcp.cli import MCPCommands
-    MCPCommands().uninstall(name, target)
-@mcp_app.command()
-def status():
-    """查看 MCP 服务安装状态"""
-    from .mcp.cli import MCPCommands
-    MCPCommands().status()
+@app.command("uninstall-skill")
+def uninstall_skill():
+    """卸载 dtflow skill"""
+    _uninstall_skill()
-@mcp_app.command()
-def test():
-    """测试 MCP 服务是否正常"""
-    from .mcp.cli import MCPCommands
-    MCPCommands().test()
+@app.command("skill-status")
+def skill_status():
+    """查看 skill 安装状态"""
+    _skill_status()
 def _show_completion_hint():

dtflow/cli/commands.py CHANGED Viewed

@@ -13,25 +13,27 @@ CLI 命令统一导出入口
 """
 # 采样命令
-from .sample import head, sample, tail
-# 转换命令
-from .transform import transform
-# 统计命令
-from .stats import stats, token_stats
 # 清洗命令
 from .clean import clean, dedupe
 # IO 操作命令
 from .io_ops import concat, diff
+# 血缘追踪命令
+from .lineage import history
 # Pipeline 命令
 from .pipeline import run
+from .sample import head, sample, tail
-# 血缘追踪命令
-from .lineage import history
+# Skill 命令
+from .skill import install_skill, skill_status, uninstall_skill
+# 统计命令
+from .stats import stats, token_stats
+# 转换命令
+from .transform import transform
 # 验证命令
 from .validate import validate
@@ -58,4 +60,8 @@ __all__ = [
     "history",
     # 验证
     "validate",
+    # Skill
+    "install_skill",
+    "uninstall_skill",
+    "skill_status",
 ]

dtflow/cli/skill.py ADDED Viewed

@@ -0,0 +1,72 @@
+"""
+Claude Code Skill 安装命令
+"""
+import shutil
+from pathlib import Path
+from rich.console import Console
+console = Console()
+def get_skill_source_path() -> Path:
+    """获取 SKILL.md 源文件路径"""
+    return Path(__file__).parent.parent / "SKILL.md"
+def get_skill_target_dir() -> Path:
+    """获取 skill 安装目标目录"""
+    return Path.home() / ".claude" / "skills" / "dtflow"
+def install_skill() -> None:
+    """安装 dtflow skill 到 Claude Code"""
+    source = get_skill_source_path()
+    target_dir = get_skill_target_dir()
+    target = target_dir / "SKILL.md"
+    if not source.exists():
+        console.print("[red]错误: SKILL.md 源文件不存在[/red]")
+        raise SystemExit(1)
+    # 创建目标目录
+    target_dir.mkdir(parents=True, exist_ok=True)
+    # 复制文件
+    shutil.copy2(source, target)
+    console.print("[green]✓[/green] 已安装 dtflow skill 到 Claude Code")
+    console.print(f"  [dim]{target}[/dim]")
+    console.print()
+    console.print("[dim]在 Claude Code 中使用 /dtflow 调用此 skill[/dim]")
+def uninstall_skill() -> None:
+    """卸载 dtflow skill"""
+    target_dir = get_skill_target_dir()
+    target = target_dir / "SKILL.md"
+    if not target.exists():
+        console.print("[yellow]dtflow skill 未安装[/yellow]")
+        return
+    target.unlink()
+    # 如果目录为空，也删除目录
+    if target_dir.exists() and not any(target_dir.iterdir()):
+        target_dir.rmdir()
+    console.print("[green]✓[/green] 已卸载 dtflow skill")
+def skill_status() -> None:
+    """显示 skill 安装状态"""
+    target = get_skill_target_dir() / "SKILL.md"
+    if target.exists():
+        console.print("[green]✓[/green] dtflow skill 已安装")
+        console.print(f"  [dim]{target}[/dim]")
+    else:
+        console.print("[yellow]✗[/yellow] dtflow skill 未安装")
+        console.print("  [dim]运行 dt install-skill 安装[/dim]")

{dtflow-0.5.6.dist-info → dtflow-0.5.7.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: dtflow
-Version: 0.5.6
+Version: 0.5.7
 Summary: A flexible data transformation tool for ML training formats (SFT, RLHF, Pretrain)
 Project-URL: Homepage, https://github.com/yourusername/DataTransformer
 Project-URL: Documentation, https://github.com/yourusername/DataTransformer#readme
@@ -69,8 +69,6 @@ Requires-Dist: tokenizers>=0.15.0; extra == 'full'
 Requires-Dist: toolong>=1.5.0; extra == 'full'
 Provides-Extra: logs
 Requires-Dist: toolong>=1.5.0; extra == 'logs'
-Provides-Extra: mcp
-Requires-Dist: mcp>=1.0.0; extra == 'mcp'
 Provides-Extra: similarity
 Requires-Dist: datasketch>=1.5.0; extra == 'similarity'
 Requires-Dist: scikit-learn>=0.24.0; extra == 'similarity'
@@ -99,6 +97,17 @@ pip install transformers      # Token 统计（HuggingFace 模型）
 pip install datasets          # HuggingFace Dataset 转换
 ```
+## 🤖 Claude Code 集成
+dtflow 内置了 [Claude Code](https://docs.anthropic.com/en/docs/claude-code) skill：
+```bash
+dt install-skill      # 安装 skill
+dt skill-status       # 查看状态
+```
+安装后在 Claude Code 中输入 `/dtflow`，Claude 将掌握 dtflow 的完整用法，可直接协助你完成数据处理任务。
 ## 快速开始
 ```python
@@ -473,6 +482,10 @@ dt concat a.jsonl b.jsonl -o merged.jsonl
 # 数据统计
 dt stats data.jsonl
+# Claude Code Skill 安装
+dt install-skill                              # 安装到 ~/.claude/skills/
+dt skill-status                               # 查看安装状态
 # 数据验证
 dt validate data.jsonl --preset=openai_chat           # 使用预设 schema 验证
 dt validate data.jsonl --preset=alpaca --verbose      # 详细输出
@@ -506,6 +519,18 @@ CLI 命令中的字段参数支持嵌套路径语法，可访问深层嵌套的
 | `token-stats` | `--field=` | `--field=messages[-1].content` |
 | `diff` | `--key=` | `--key=meta.uuid` |
+`--where` 支持的操作符：
+| 操作符 | 含义 | 示例 |
+|--------|------|------|
+| `=` | 等于 | `--where="category=tech"` |
+| `!=` | 不等于 | `--where="source!=wiki"` |
+| `~=` | 包含 | `--where="content~=机器学习"` |
+| `>` | 大于 | `--where="score>0.8"` |
+| `>=` | 大于等于 | `--where="messages.#>=2"` |
+| `<` | 小于 | `--where="length<1000"` |
+| `<=` | 小于等于 | `--where="turns<=10"` |
 示例数据：
 ```json
 {"meta": {"source": "wiki"}, "messages": [{"role": "user", "content": "hi"}, {"role": "assistant", "content": "hello"}]}
@@ -603,6 +628,18 @@ dt history processed.jsonl
 dt history processed.jsonl --json  # JSON 格式输出
 ```
+### 日志查看
+dtflow 内置了 [toolong](https://github.com/Textualize/toolong) 日志查看器：
+```bash
+pip install dtflow[logs]    # 安装日志工具
+tl app.log                  # 交互式 TUI 查看
+tl --tail app.log           # 实时跟踪（类似 tail -f）
+dt logs                     # 查看使用说明
+```
 ### 大文件流式处理
 专为超大文件设计的流式处理接口，内存占用 O(1)，支持 JSONL、CSV、Parquet、Arrow 格式：

{dtflow-0.5.6.dist-info → dtflow-0.5.7.dist-info}/RECORD RENAMED Viewed

@@ -1,5 +1,6 @@
-dtflow/__init__.py,sha256=_KUxZUD08hQhhLugGbjo_jlP5JuMCFAcCs0o0SCCoVM,3031
-dtflow/__main__.py,sha256=OJ60M0PbA0PcsQfA7FP9k9CflJgzexKhIl-yc-CPXkw,12675
+dtflow/SKILL.md,sha256=sHf6i6DKUCca5zvSJ67VHu05tFlST4mYgnoURXVe1g0,7836
+dtflow/__init__.py,sha256=Ee7CDDxzki69MEGeXB5bczuMts5OwZZ-jVsKjH_rD_0,3031
+dtflow/__main__.py,sha256=3LXTku09Fw1dsgTUtX1UJCmE20qKeZpNga3UqmI3UiY,12145
 dtflow/converters.py,sha256=X3qeFD7FCOMnfiP3MicL5MXimOm4XUYBs5pczIkudU0,22331
 dtflow/core.py,sha256=qMo6B3LK--TWRK7ZBKObGcs3pKFnd0NPoaM0T8JC7Jw,38135
 dtflow/framework.py,sha256=jyICi_RWHjX7WfsXdSbWmP1SL7y1OWSPyd5G5Y-lvg4,17578
@@ -11,27 +12,23 @@ dtflow/streaming.py,sha256=dxpNd1-Wz_PTLTdvM5qn06_2TJr5NRlIIuw0LOSS2Iw,24755
 dtflow/tokenizers.py,sha256=7ZAelSmcDxLWH5kICgH9Q1ULH3_BfDZb9suHMjJJRZU,20589
 dtflow/cli/__init__.py,sha256=QhZ-thgx9IBTFII7T_hdoWFUl0CCsdGQHN5ZEZw2XB0,423
 dtflow/cli/clean.py,sha256=y9VCRibgK1j8WIY3h0XZX0m93EdELQC7TdnseMWwS-0,17799
-dtflow/cli/commands.py,sha256=ST65Ox_MKu-CKAtPVaxECAPXYOJiF7BhL32A4nsZZl0,1175
+dtflow/cli/commands.py,sha256=zKUG-B9Az-spqyqM00cR8Sgc2UgeOPQDThJFHWDNO_w,1336
 dtflow/cli/common.py,sha256=gCwnF5Sw2ploqfZJO_z3Ms9mR1HNT7Lj6ydHn0uVaIw,13817
 dtflow/cli/io_ops.py,sha256=BMDisP6dxzzmSjYwmeFwaHmpHHPqirmXAWeNTD-9MQM,13254
 dtflow/cli/lineage.py,sha256=_lNh35nF9AA0Zy6FyZ4g8IzrXH2ZQnp3inF-o2Hs1pw,1383
 dtflow/cli/pipeline.py,sha256=QNEo-BJlaC1CVnVeRZr7TwfuZYloJ4TebIzJ5ALzry0,1426
 dtflow/cli/sample.py,sha256=pubpx4AIzsarBEalD150MC2apYQSt4bal70IZkTfFO0,15475
+dtflow/cli/skill.py,sha256=opiTEBejA7JHKrEMftMOPDQlOgZ4n59rwaHXGU1Nukk,2022
 dtflow/cli/stats.py,sha256=u4ehCfgw1X8WuOyAjrApMRgcIO3BVmINbsTjxEscQro,24086
 dtflow/cli/transform.py,sha256=w6xqMOxPxQvL2u_BPCfpDHuPSC9gmcqMPVN8s-B6bbY,15052
 dtflow/cli/validate.py,sha256=65aGVlMS_Rq0Ch0YQ-TclVJ03RQP4CnG137wthzb8Ao,4384
-dtflow/mcp/__init__.py,sha256=huEJ3rXDbxDRjsLPEvjNT2u3tWs6Poiv6fokPIrByjw,897
-dtflow/mcp/__main__.py,sha256=PoT2ZZmJq9xDZxDACJfqDW9Ld_ukHrGNK-0XUd7WGnY,448
-dtflow/mcp/cli.py,sha256=ck0oOS_642cNktxULaMRE7BJfMxsBCwotmCj3PSPwVk,13110
-dtflow/mcp/docs.py,sha256=DI2Vf-eFo4chRP_bDLsv4Uc3kJt8_1emz8N-NBSVirM,8834
-dtflow/mcp/server.py,sha256=Nf0UlqDGhV55ndGuEglfr7VRjDWAC_9rRsNhdr0-ssM,4275
 dtflow/storage/__init__.py,sha256=C0jpWNQU808Ezz7lWneddABal3wILy8ijFUNiSKbHV4,362
 dtflow/storage/io.py,sha256=ZH2aSE-S89gpy3z4oTqhcqWf4u10OdkDoyul7o_YBDI,23374
 dtflow/utils/__init__.py,sha256=Pn-ltwV04fBQmeZG7FxInDQmzH29LYOi90LgeLMEuQk,506
 dtflow/utils/display.py,sha256=OeOdTh6mbDwSkDWlmkjfpTjy2QG8ZUaYU0NpHUWkpEQ,5881
 dtflow/utils/field_path.py,sha256=K8nU196RxTSJ1OoieTWGcYOWl9KjGq2iSxCAkfjECuM,7621
 dtflow/utils/helpers.py,sha256=JXN176_B2pm53GLVyZ1wj3wrmBJG52Tkw6AMQSdj7M8,791
-dtflow-0.5.6.dist-info/METADATA,sha256=TPSDq-fQDini8uKERCdm_4cZYw-b9t6V8UQ1MlTJ7iA,22698
-dtflow-0.5.6.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
-dtflow-0.5.6.dist-info/entry_points.txt,sha256=dadIDOK7Iu9pMxnMPBfpb4aAPe4hQbBOshpQYjVYpGc,44
-dtflow-0.5.6.dist-info/RECORD,,
+dtflow-0.5.7.dist-info/METADATA,sha256=mlWaRHSM1ZucQrAa8PGcHzjHj2RQPBynnmdA_JoNSNI,23899
+dtflow-0.5.7.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
+dtflow-0.5.7.dist-info/entry_points.txt,sha256=dadIDOK7Iu9pMxnMPBfpb4aAPe4hQbBOshpQYjVYpGc,44
+dtflow-0.5.7.dist-info/RECORD,,

dtflow/mcp/__init__.py DELETED Viewed

@@ -1,29 +0,0 @@
-"""DataTransformer MCP (Model Context Protocol) 服务
-提供 DataTransformer 的用法查询功能，供 AI 模型调用。
-使用方式:
-    # 安装 MCP 服务到 Claude Code
-    dt mcp install
-    # 运行 MCP 服务（通常由 Claude 自动调用）
-    dt-mcp
-注意: MCP 功能需要安装 mcp 依赖: pip install dtflow[mcp]
-"""
-__all__ = ["main", "mcp"]
-def __getattr__(name):
-    """延迟导入 server 模块，避免在未安装 mcp 依赖时报错"""
-    if name in ("main", "mcp"):
-        try:
-            from .server import main, mcp
-            return main if name == "main" else mcp
-        except ImportError as e:
-            raise ImportError(
-                f"MCP 功能需要安装 mcp 依赖: pip install dtflow[mcp]\n原始错误: {e}"
-            ) from e
-    raise AttributeError(f"module {__name__!r} has no attribute {name!r}")

dtflow/mcp/__main__.py DELETED Viewed

@@ -1,18 +0,0 @@
-"""Datatron MCP 服务入口
-使用方式:
-    python -m dtflow.mcp
-"""
-if __name__ == "__main__":
-    try:
-        from .server import main
-        main()
-    except ImportError as e:
-        import sys
-        print(f"错误: MCP 功能需要安装 mcp 依赖", file=sys.stderr)
-        print(f"请运行: pip install dtflow[mcp]", file=sys.stderr)
-        print(f"\n原始错误: {e}", file=sys.stderr)
-        sys.exit(1)

dtflow 0.5.6__py3-none-any.whl → 0.5.7__py3-none-any.whl

dtflow 0.5.6py3-none-any.whl → 0.5.7py3-none-any.whl