PyPI - python-slack-agents - Versions diffs - 0.5.0__py3-none-any.whl - Mend

python-slack-agents 0.5.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (54) hide show

python_slack_agents-0.5.0.dist-info/METADATA +318 -0
python_slack_agents-0.5.0.dist-info/RECORD +54 -0
python_slack_agents-0.5.0.dist-info/WHEEL +4 -0
python_slack_agents-0.5.0.dist-info/entry_points.txt +2 -0
python_slack_agents-0.5.0.dist-info/licenses/LICENSE +202 -0
slack_agents/Dockerfile +25 -0
slack_agents/__init__.py +25 -0
slack_agents/access/__init__.py +0 -0
slack_agents/access/allow_all.py +9 -0
slack_agents/access/allow_list.py +19 -0
slack_agents/access/base.py +20 -0
slack_agents/agent_loop.py +208 -0
slack_agents/cli/__init__.py +48 -0
slack_agents/cli/build_docker.py +94 -0
slack_agents/cli/export_conversations.py +84 -0
slack_agents/cli/export_conversations_html.py +605 -0
slack_agents/cli/export_usage.py +81 -0
slack_agents/cli/export_usage_csv.py +151 -0
slack_agents/cli/healthcheck.py +67 -0
slack_agents/cli/run.py +16 -0
slack_agents/config.py +113 -0
slack_agents/conversations.py +273 -0
slack_agents/files.py +59 -0
slack_agents/llm/__init__.py +1 -0
slack_agents/llm/anthropic.py +207 -0
slack_agents/llm/base.py +82 -0
slack_agents/llm/openai.py +283 -0
slack_agents/main.py +55 -0
slack_agents/observability.py +175 -0
slack_agents/py.typed +0 -0
slack_agents/scripts/__init__.py +0 -0
slack_agents/scripts/download_fonts.py +39 -0
slack_agents/slack/__init__.py +0 -0
slack_agents/slack/actions.py +119 -0
slack_agents/slack/agent.py +688 -0
slack_agents/slack/canvases.py +225 -0
slack_agents/slack/files.py +102 -0
slack_agents/slack/format.py +55 -0
slack_agents/slack/streaming.py +70 -0
slack_agents/slack/streaming_formatter.py +182 -0
slack_agents/slack/tool_blocks.py +97 -0
slack_agents/storage/__init__.py +0 -0
slack_agents/storage/base.py +304 -0
slack_agents/storage/postgres.py +612 -0
slack_agents/storage/postgres.sql +120 -0
slack_agents/storage/sqlite.py +473 -0
slack_agents/storage/sqlite.sql +73 -0
slack_agents/tools/__init__.py +0 -0
slack_agents/tools/base.py +140 -0
slack_agents/tools/canvas.py +401 -0
slack_agents/tools/file_exporter.py +582 -0
slack_agents/tools/file_importer.py +363 -0
slack_agents/tools/mcp_http.py +203 -0
slack_agents/tools/user_context.py +239 -0

slack_agents/tools/file_importer.py ADDED Viewed

@@ -0,0 +1,363 @@
+"""Built-in file input provider: document import (PDF, DOCX, XLSX, PPTX, text, images).
+Exports a Provider class that subclasses BaseFileImporterProvider.
+"""
+import base64
+import io
+import logging
+from slack_agents import InputFile, UserConversationContext
+from slack_agents.storage.base import BaseStorageProvider
+from slack_agents.tools.base import BaseFileImporterProvider, ContentBlock, FileImportToolException
+logger = logging.getLogger(__name__)
+MIME_DOCX = "application/vnd.openxmlformats-officedocument.wordprocessingml.document"
+MIME_XLSX = "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet"
+MIME_PPTX = "application/vnd.openxmlformats-officedocument.presentationml.presentation"
+_TEXT_ONLY_NOTE = (
+    "(Note: only text was extracted; images are shown as [IMAGE] placeholders"
+    " with alt text when available. Charts and visual formatting are not included.)"
+)
+_CELLS_ONLY_NOTE = (
+    "(Note: only cell values were extracted — formulas appear as their"
+    " last-calculated values (may be blank if never opened in Excel),"
+    " and pivot tables appear as their cached display values."
+    " Images, charts, and formatting are not included.)"
+)
+def _table_to_md(rows: list[list[str]]) -> str:
+    if not rows:
+        return "(empty)"
+    max_cols = max(len(r) for r in rows)
+    norm = [r + [""] * (max_cols - len(r)) for r in rows]
+    for r in norm:
+        for i, cell in enumerate(r):
+            r[i] = cell.replace("|", "\\|").replace("\n", " ")
+    header = "| " + " | ".join(norm[0]) + " |"
+    sep = "| " + " | ".join("---" for _ in norm[0]) + " |"
+    body_lines = ["| " + " | ".join(row) + " |" for row in norm[1:]]
+    return "\n".join([header, sep] + body_lines)
+def _extract_pdf(file_bytes: bytes) -> str:
+    import pymupdf
+    import pymupdf4llm
+    doc = pymupdf.open(stream=file_bytes, filetype="pdf")
+    md_text = pymupdf4llm.to_markdown(doc)
+    doc.close()
+    return f"{_TEXT_ONLY_NOTE}\n\n{md_text}"
+def _get_docx_image_alt(shape) -> str:
+    try:
+        el = shape._element
+        for child in el:
+            if child.tag.endswith("}docPr") or child.tag == "docPr":
+                return child.get("descr", "")
+    except Exception:
+        pass
+    return ""
+def _docx_runs_to_md(runs) -> str:
+    parts = []
+    for run in runs:
+        text = run.text
+        if not text:
+            continue
+        bold = run.bold
+        italic = run.italic
+        if bold and italic:
+            text = f"***{text}***"
+        elif bold:
+            text = f"**{text}**"
+        elif italic:
+            text = f"*{text}*"
+        parts.append(text)
+    return "".join(parts)
+def _docx_paragraph_to_md(p) -> str:
+    style_name = (p.style.name or "").lower() if p.style else ""
+    prefix = ""
+    if style_name.startswith("heading"):
+        try:
+            level = int(style_name.split()[-1])
+            prefix = "#" * min(level, 6) + " "
+        except (ValueError, IndexError):
+            prefix = "# "
+    elif style_name == "title":
+        prefix = "# "
+    elif style_name == "subtitle":
+        prefix = "## "
+    elif style_name.startswith("list bullet"):
+        prefix = "- "
+    elif style_name.startswith("list number"):
+        prefix = "1. "
+    text = _docx_runs_to_md(p.runs)
+    if not text.strip():
+        return ""
+    return prefix + text
+def _extract_docx(file_bytes: bytes) -> str:
+    from docx import Document
+    from docx.oxml.ns import qn
+    from docx.table import Table
+    from docx.text.paragraph import Paragraph
+    doc = Document(io.BytesIO(file_bytes))
+    parts = []
+    for child in doc.element.body:
+        if child.tag == qn("w:p"):
+            p = Paragraph(child, doc)
+            md = _docx_paragraph_to_md(p)
+            if md:
+                parts.append(md)
+        elif child.tag == qn("w:tbl"):
+            tbl = Table(child, doc)
+            rows = []
+            for row in tbl.rows:
+                rows.append([cell.text for cell in row.cells])
+            md = _table_to_md(rows)
+            parts.append(md)
+    image_placeholders = []
+    for shape in doc.inline_shapes:
+        alt = _get_docx_image_alt(shape)
+        image_placeholders.append(f"[IMAGE: {alt}]" if alt else "[IMAGE]")
+    text = "\n\n".join(parts)
+    if image_placeholders:
+        text += "\n\n(Images found — original positions in document not preserved):\n" + "\n".join(
+            image_placeholders
+        )
+    return f"{_TEXT_ONLY_NOTE}\n\n" + text
+def _extract_xlsx(file_bytes: bytes) -> str:
+    from openpyxl import load_workbook
+    wb = load_workbook(io.BytesIO(file_bytes), read_only=True, data_only=True)
+    sheets = []
+    for sheet_name in wb.sheetnames:
+        ws = wb[sheet_name]
+        rows = []
+        for row in ws.iter_rows(values_only=True):
+            cells = [str(c) if c is not None else "" for c in row]
+            rows.append(cells)
+        if rows:
+            table_md = _table_to_md(rows)
+        else:
+            table_md = "(empty)"
+        sheets.append(f"## Sheet: {sheet_name}\n{table_md}")
+    wb.close()
+    return f"{_CELLS_ONLY_NOTE}\n\n" + "\n\n".join(sheets)
+def _get_pptx_shape_alt(shape) -> str:
+    try:
+        return shape._element.nvPicPr.cNvPr.get("descr", "")
+    except (AttributeError, KeyError):
+        return ""
+def _pptx_text_frame_to_md(text_frame) -> str:
+    lines = []
+    for para in text_frame.paragraphs:
+        parts = []
+        for run in para.runs:
+            text = run.text
+            if not text:
+                continue
+            bold = run.font.bold
+            italic = run.font.italic
+            if bold and italic:
+                text = f"***{text}***"
+            elif bold:
+                text = f"**{text}**"
+            elif italic:
+                text = f"*{text}*"
+            parts.append(text)
+        line = "".join(parts)
+        if not line.strip():
+            continue
+        level = para.level or 0
+        if level > 0:
+            line = "  " * level + "- " + line
+        lines.append(line)
+    return "\n".join(lines)
+def _extract_pptx(file_bytes: bytes) -> str:
+    from pptx import Presentation
+    from pptx.enum.shapes import MSO_SHAPE_TYPE
+    prs = Presentation(io.BytesIO(file_bytes))
+    slides = []
+    for i, slide in enumerate(prs.slides, 1):
+        title = ""
+        if slide.shapes.title and slide.shapes.title.text.strip():
+            title = slide.shapes.title.text.strip()
+        body_parts = []
+        for shape in slide.shapes:
+            if shape == slide.shapes.title:
+                continue
+            if shape.shape_type == MSO_SHAPE_TYPE.PICTURE:
+                alt = _get_pptx_shape_alt(shape)
+                body_parts.append(f"[IMAGE: {alt}]" if alt else "[IMAGE]")
+            elif shape.has_table:
+                rows = []
+                for row in shape.table.rows:
+                    rows.append([cell.text for cell in row.cells])
+                body_parts.append(_table_to_md(rows))
+            elif shape.has_text_frame:
+                text = _pptx_text_frame_to_md(shape.text_frame)
+                if text:
+                    body_parts.append(text)
+        notes = ""
+        if slide.has_notes_slide and slide.notes_slide.notes_text_frame:
+            notes = slide.notes_slide.notes_text_frame.text.strip()
+        header = f"## Slide {i}: {title}" if title else f"## Slide {i}"
+        parts = [header]
+        if body_parts:
+            parts.append("\n".join(body_parts))
+        if notes:
+            parts.append(f"Notes: {notes}")
+        slides.append("\n".join(parts))
+    return f"{_TEXT_ONLY_NOTE}\n\n" + "\n\n".join(slides)
+# ---------------------------------------------------------------------------
+# Handler wrappers — return content block dicts
+# ---------------------------------------------------------------------------
+def _import_pdf(f: InputFile) -> ContentBlock:
+    try:
+        text = _extract_pdf(f["file_bytes"])
+        return {"type": "text", "text": f"[File: {f['filename']}]\n\n{text}"}
+    except Exception as exc:
+        raise FileImportToolException(f"Failed to extract text from {f['filename']}") from exc
+def _import_docx(f: InputFile) -> ContentBlock:
+    try:
+        text = _extract_docx(f["file_bytes"])
+        return {"type": "text", "text": f"[File: {f['filename']}]\n\n{text}"}
+    except Exception as exc:
+        raise FileImportToolException(f"Failed to extract text from {f['filename']}") from exc
+def _import_xlsx(f: InputFile) -> ContentBlock:
+    try:
+        text = _extract_xlsx(f["file_bytes"])
+        return {"type": "text", "text": f"[File: {f['filename']}]\n\n{text}"}
+    except Exception as exc:
+        raise FileImportToolException(f"Failed to extract text from {f['filename']}") from exc
+def _import_pptx(f: InputFile) -> ContentBlock:
+    try:
+        text = _extract_pptx(f["file_bytes"])
+        return {"type": "text", "text": f"[File: {f['filename']}]\n\n{text}"}
+    except Exception as exc:
+        raise FileImportToolException(f"Failed to extract text from {f['filename']}") from exc
+def _import_text(f: InputFile) -> ContentBlock:
+    try:
+        text = f["file_bytes"].decode("utf-8", errors="replace")
+        return {"type": "text", "text": f"[File: {f['filename']}]\n\n{text}"}
+    except Exception as exc:
+        raise FileImportToolException(f"Failed to extract text from {f['filename']}") from exc
+def _import_image(f: InputFile) -> ContentBlock:
+    try:
+        b64 = base64.standard_b64encode(f["file_bytes"]).decode("utf-8")
+        return {
+            "type": "image",
+            "source": {
+                "type": "base64",
+                "media_type": f["mimetype"],
+                "data": b64,
+            },
+        }
+    except Exception as exc:
+        raise FileImportToolException(f"Failed to process image {f['filename']}") from exc
+_HANDLER_MANIFEST = [
+    {
+        "name": "import_pdf",
+        "mimes": {"application/pdf"},
+        "max_size": 10_000_000,
+        "handler": _import_pdf,
+    },
+    {
+        "name": "import_docx",
+        "mimes": {MIME_DOCX},
+        "max_size": 10_000_000,
+        "handler": _import_docx,
+    },
+    {
+        "name": "import_xlsx",
+        "mimes": {MIME_XLSX},
+        "max_size": 10_000_000,
+        "handler": _import_xlsx,
+    },
+    {
+        "name": "import_pptx",
+        "mimes": {MIME_PPTX},
+        "max_size": 10_000_000,
+        "handler": _import_pptx,
+    },
+    {
+        "name": "import_text",
+        "mimes": {"text/plain", "text/csv", "text/markdown"},
+        "max_size": 10_000_000,
+        "handler": _import_text,
+    },
+    {
+        "name": "import_image",
+        "mimes": {"image/png", "image/jpeg", "image/gif", "image/webp"},
+        "max_size": 10_000_000,
+        "handler": _import_image,
+    },
+]
+class Provider(BaseFileImporterProvider):
+    """Built-in document import handlers (PDF, DOCX, XLSX, PPTX, text, images)."""
+    def __init__(self, allowed_functions: list[str], **kwargs):
+        super().__init__(allowed_functions, **kwargs)
+        self._handler_map = {h["name"]: h["handler"] for h in _HANDLER_MANIFEST}
+    def _get_all_tools(self) -> list[dict]:
+        return _HANDLER_MANIFEST
+    async def call_tool(
+        self,
+        name: str,
+        arguments: dict,
+        user_conversation_context: UserConversationContext,
+        storage: BaseStorageProvider,
+    ) -> ContentBlock:
+        handler = self._handler_map.get(name)
+        if not handler:
+            raise FileImportToolException(f"Unknown import handler: {name}")
+        return handler(arguments)

slack_agents/tools/mcp_http.py ADDED Viewed

@@ -0,0 +1,203 @@
+"""MCP over HTTP/SSE tool provider."""
+import asyncio
+import base64
+import contextlib
+import json
+import logging
+from urllib.parse import unquote, urlparse
+import httpx
+import mcp
+from mcp.client.streamable_http import streamable_http_client
+from mcp.types import BlobResourceContents, EmbeddedResource, ImageContent
+from slack_agents import UserConversationContext
+from slack_agents.llm import CHARS_PER_TOKEN
+from slack_agents.storage.base import BaseStorageProvider
+from slack_agents.tools.base import BaseToolProvider, ToolResult
+logger = logging.getLogger(__name__)
+def _uri_to_filename(uri: str) -> str:
+    """Extract a filename from an MCP resource URI."""
+    parsed = urlparse(str(uri))
+    path = unquote(parsed.path)
+    name = path.rsplit("/", 1)[-1] if "/" in path else path
+    return name or "file"
+class Provider(BaseToolProvider):
+    """MCP over HTTP tool provider. Connects to a single MCP server."""
+    DEFAULT_INIT_RETRIES = [5, 10, 30]
+    def __init__(
+        self,
+        url: str,
+        allowed_functions: list[str],
+        headers: dict | None = None,
+        init_retries: list[int | float] | None = None,
+    ):
+        super().__init__(allowed_functions)
+        self._url = url
+        self._headers = headers or {}
+        self._init_retries = init_retries if init_retries is not None else self.DEFAULT_INIT_RETRIES
+        self._tool_map: dict[str, mcp.ClientSession] = {}
+        self._all_tools: list[dict] = []
+        self._session: mcp.ClientSession | None = None
+        self._exit_stack: contextlib.AsyncExitStack | None = None
+    def _get_all_tools(self) -> list[dict]:
+        return self._all_tools
+    async def _connect(self) -> None:
+        """Establish connection to the MCP server."""
+        http_client = httpx.AsyncClient(
+            headers=self._headers,
+            timeout=httpx.Timeout(30.0, read=300.0),
+            follow_redirects=True,
+        )
+        stack = contextlib.AsyncExitStack()
+        self._exit_stack = stack
+        await stack.enter_async_context(http_client)
+        read_stream, write_stream, _get_session_id = await stack.enter_async_context(
+            streamable_http_client(url=self._url, http_client=http_client)
+        )
+        session = mcp.ClientSession(read_stream, write_stream)
+        await stack.enter_async_context(session)
+        await session.initialize()
+        self._session = session
+    async def initialize(self) -> None:
+        """Connect to the MCP server and discover tools, retrying on connection errors."""
+        max_attempts = 1 + len(self._init_retries)
+        for attempt in range(1, max_attempts + 1):
+            try:
+                await self._connect()
+                break
+            except (
+                httpx.ConnectError,
+                httpx.ConnectTimeout,
+                OSError,
+                asyncio.CancelledError,
+            ) as exc:
+                if attempt == max_attempts:
+                    logger.error(
+                        "MCP %s: failed after %d attempts: %s", self._url, max_attempts, exc
+                    )
+                    raise
+                backoff = self._init_retries[attempt - 1]
+                logger.warning(
+                    "MCP %s: connection attempt %d/%d failed (%s), retrying in %gs",
+                    self._url,
+                    attempt,
+                    max_attempts,
+                    exc,
+                    backoff,
+                )
+                # Clean up partial state before retrying
+                if self._exit_stack:
+                    with contextlib.suppress(BaseException):
+                        await self._exit_stack.aclose()
+                    self._exit_stack = None
+                await asyncio.sleep(backoff)
+        tools_result = await self._session.list_tools()
+        server_tokens = 0
+        for tool in tools_result.tools:
+            tool_def = {
+                "name": tool.name,
+                "description": tool.description or "",
+                "input_schema": tool.inputSchema or {"type": "object", "properties": {}},
+            }
+            tool_tokens = len(json.dumps(tool_def)) // CHARS_PER_TOKEN
+            server_tokens += tool_tokens
+            self._tool_map[tool.name] = self._session
+            self._all_tools.append(tool_def)
+        # Log filtered tools
+        allowed = self.tools
+        filtered_count = len(self._all_tools) - len(allowed)
+        if filtered_count:
+            logger.info(
+                "MCP %s: %d tools loaded, %d filtered out, ~%d tokens",
+                self._url,
+                len(allowed),
+                filtered_count,
+                server_tokens,
+            )
+        else:
+            logger.info(
+                "MCP %s: %d tools loaded, ~%d tokens",
+                self._url,
+                len(allowed),
+                server_tokens,
+            )
+    async def call_tool(
+        self,
+        tool_name: str,
+        arguments: dict,
+        user_conversation_context: UserConversationContext,
+        storage: BaseStorageProvider,
+    ) -> ToolResult:
+        """Execute a tool call and return the result."""
+        session = self._tool_map.get(tool_name)
+        if not session:
+            return {"content": f"Unknown tool: {tool_name}", "is_error": True, "files": []}
+        logger.info("Calling MCP tool %s", tool_name)
+        try:
+            result = await session.call_tool(name=tool_name, arguments=arguments)
+            text_parts = []
+            files = []
+            for content in result.content:
+                if isinstance(content, EmbeddedResource) and isinstance(
+                    content.resource, BlobResourceContents
+                ):
+                    data = base64.b64decode(content.resource.blob)
+                    filename = _uri_to_filename(content.resource.uri)
+                    mime = content.resource.mimeType or "application/octet-stream"
+                    files.append({"data": data, "filename": filename, "mimeType": mime})
+                elif isinstance(content, ImageContent):
+                    data = base64.b64decode(content.data)
+                    ext = content.mimeType.split("/")[-1] if content.mimeType else "png"
+                    files.append(
+                        {
+                            "data": data,
+                            "filename": f"image.{ext}",
+                            "mimeType": content.mimeType,
+                        }
+                    )
+                elif hasattr(content, "text"):
+                    text_parts.append(content.text)
+                else:
+                    text_parts.append(str(content))
+            return {
+                "content": "\n".join(text_parts) if text_parts else "(empty result)",
+                "is_error": bool(result.isError),
+                "files": files,
+            }
+        except Exception as e:
+            logger.exception("MCP tool call failed: %s", tool_name)
+            return {"content": f"Tool execution error: {e}", "is_error": True, "files": []}
+    async def close(self) -> None:
+        if self._exit_stack:
+            try:
+                await self._exit_stack.aclose()
+            except Exception:
+                logger.exception("Error closing MCP connection")
+            self._exit_stack = None
+            self._session = None
+            self._tool_map.clear()
+            self._all_tools.clear()