PyPI - symbolicai - Versions diffs - 0.21.0__py3-none-any.whl → 1.1.0__py3-none-any.whl - Mend

symbolicai 0.21.0py3-none-any.whl → 1.1.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (134) hide show

symai/__init__.py +269 -173
symai/backend/base.py +123 -110
symai/backend/engines/drawing/engine_bfl.py +45 -44
symai/backend/engines/drawing/engine_gpt_image.py +112 -97
symai/backend/engines/embedding/engine_llama_cpp.py +63 -52
symai/backend/engines/embedding/engine_openai.py +25 -21
symai/backend/engines/execute/engine_python.py +19 -18
symai/backend/engines/files/engine_io.py +104 -95
symai/backend/engines/imagecaptioning/engine_blip2.py +28 -24
symai/backend/engines/imagecaptioning/engine_llavacpp_client.py +102 -79
symai/backend/engines/index/engine_pinecone.py +124 -97
symai/backend/engines/index/engine_qdrant.py +1011 -0
symai/backend/engines/index/engine_vectordb.py +84 -56
symai/backend/engines/lean/engine_lean4.py +96 -52
symai/backend/engines/neurosymbolic/__init__.py +41 -13
symai/backend/engines/neurosymbolic/engine_anthropic_claudeX_chat.py +330 -248
symai/backend/engines/neurosymbolic/engine_anthropic_claudeX_reasoning.py +329 -264
symai/backend/engines/neurosymbolic/engine_cerebras.py +328 -0
symai/backend/engines/neurosymbolic/engine_deepseekX_reasoning.py +118 -88
symai/backend/engines/neurosymbolic/engine_google_geminiX_reasoning.py +344 -299
symai/backend/engines/neurosymbolic/engine_groq.py +173 -115
symai/backend/engines/neurosymbolic/engine_huggingface.py +114 -84
symai/backend/engines/neurosymbolic/engine_llama_cpp.py +144 -118
symai/backend/engines/neurosymbolic/engine_openai_gptX_chat.py +415 -307
symai/backend/engines/neurosymbolic/engine_openai_gptX_reasoning.py +394 -231
symai/backend/engines/ocr/engine_apilayer.py +23 -27
symai/backend/engines/output/engine_stdout.py +10 -13
symai/backend/engines/{webscraping → scrape}/engine_requests.py +101 -54
symai/backend/engines/search/engine_openai.py +100 -88
symai/backend/engines/search/engine_parallel.py +665 -0
symai/backend/engines/search/engine_perplexity.py +44 -45
symai/backend/engines/search/engine_serpapi.py +37 -34
symai/backend/engines/speech_to_text/engine_local_whisper.py +54 -51
symai/backend/engines/symbolic/engine_wolframalpha.py +15 -9
symai/backend/engines/text_to_speech/engine_openai.py +20 -26
symai/backend/engines/text_vision/engine_clip.py +39 -37
symai/backend/engines/userinput/engine_console.py +5 -6
symai/backend/mixin/__init__.py +13 -0
symai/backend/mixin/anthropic.py +48 -38
symai/backend/mixin/deepseek.py +6 -5
symai/backend/mixin/google.py +7 -4
symai/backend/mixin/groq.py +2 -4
symai/backend/mixin/openai.py +140 -110
symai/backend/settings.py +87 -20
symai/chat.py +216 -123
symai/collect/__init__.py +7 -1
symai/collect/dynamic.py +80 -70
symai/collect/pipeline.py +67 -51
symai/collect/stats.py +161 -109
symai/components.py +707 -360
symai/constraints.py +24 -12
symai/core.py +1857 -1233
symai/core_ext.py +83 -80
symai/endpoints/api.py +166 -104
symai/extended/.DS_Store +0 -0
symai/extended/__init__.py +46 -12
symai/extended/api_builder.py +29 -21
symai/extended/arxiv_pdf_parser.py +23 -14
symai/extended/bibtex_parser.py +9 -6
symai/extended/conversation.py +156 -126
symai/extended/document.py +50 -30
symai/extended/file_merger.py +57 -14
symai/extended/graph.py +51 -32
symai/extended/html_style_template.py +18 -14
symai/extended/interfaces/blip_2.py +2 -3
symai/extended/interfaces/clip.py +4 -3
symai/extended/interfaces/console.py +9 -1
symai/extended/interfaces/dall_e.py +4 -2
symai/extended/interfaces/file.py +2 -0
symai/extended/interfaces/flux.py +4 -2
symai/extended/interfaces/gpt_image.py +16 -7
symai/extended/interfaces/input.py +2 -1
symai/extended/interfaces/llava.py +1 -2
symai/extended/interfaces/{naive_webscraping.py → naive_scrape.py} +4 -3
symai/extended/interfaces/naive_vectordb.py +9 -10
symai/extended/interfaces/ocr.py +5 -3
symai/extended/interfaces/openai_search.py +2 -0
symai/extended/interfaces/parallel.py +30 -0
symai/extended/interfaces/perplexity.py +2 -0
symai/extended/interfaces/pinecone.py +12 -9
symai/extended/interfaces/python.py +2 -0
symai/extended/interfaces/serpapi.py +3 -1
symai/extended/interfaces/terminal.py +2 -4
symai/extended/interfaces/tts.py +3 -2
symai/extended/interfaces/whisper.py +3 -2
symai/extended/interfaces/wolframalpha.py +2 -1
symai/extended/metrics/__init__.py +11 -1
symai/extended/metrics/similarity.py +14 -13
symai/extended/os_command.py +39 -29
symai/extended/packages/__init__.py +29 -3
symai/extended/packages/symdev.py +51 -43
symai/extended/packages/sympkg.py +41 -35
symai/extended/packages/symrun.py +63 -50
symai/extended/repo_cloner.py +14 -12
symai/extended/seo_query_optimizer.py +15 -13
symai/extended/solver.py +116 -91
symai/extended/summarizer.py +12 -10
symai/extended/taypan_interpreter.py +17 -18
symai/extended/vectordb.py +122 -92
symai/formatter/__init__.py +9 -1
symai/formatter/formatter.py +51 -47
symai/formatter/regex.py +70 -69
symai/functional.py +325 -176
symai/imports.py +190 -147
symai/interfaces.py +57 -28
symai/memory.py +45 -35
symai/menu/screen.py +28 -19
symai/misc/console.py +66 -56
symai/misc/loader.py +8 -5
symai/models/__init__.py +17 -1
symai/models/base.py +395 -236
symai/models/errors.py +1 -2
symai/ops/__init__.py +32 -22
symai/ops/measures.py +24 -25
symai/ops/primitives.py +1149 -731
symai/post_processors.py +58 -50
symai/pre_processors.py +86 -82
symai/processor.py +21 -13
symai/prompts.py +764 -685
symai/server/huggingface_server.py +135 -49
symai/server/llama_cpp_server.py +21 -11
symai/server/qdrant_server.py +206 -0
symai/shell.py +100 -42
symai/shellsv.py +700 -492
symai/strategy.py +630 -346
symai/symbol.py +368 -322
symai/utils.py +100 -78
{symbolicai-0.21.0.dist-info → symbolicai-1.1.0.dist-info}/METADATA +22 -10
symbolicai-1.1.0.dist-info/RECORD +168 -0
symbolicai-0.21.0.dist-info/RECORD +0 -162
{symbolicai-0.21.0.dist-info → symbolicai-1.1.0.dist-info}/WHEEL +0 -0
{symbolicai-0.21.0.dist-info → symbolicai-1.1.0.dist-info}/entry_points.txt +0 -0
{symbolicai-0.21.0.dist-info → symbolicai-1.1.0.dist-info}/licenses/LICENSE +0 -0
{symbolicai-0.21.0.dist-info → symbolicai-1.1.0.dist-info}/top_level.txt +0 -0

symai/backend/engines/ocr/engine_apilayer.py CHANGED Viewed

@@ -1,11 +1,10 @@
-import requests
 from pathlib import Path
-from typing import Optional
+import requests
+from ....symbol import Result
 from ...base import Engine
 from ...settings import SYMAI_CONFIG
-from ....symbol import Result
 class ApiLayerResult(Result):
@@ -14,56 +13,53 @@ class ApiLayerResult(Result):
         self.raw = text
         try:
             dict_ = self._to_symbol(text).ast()
-            self._value = dict_['all_text'] if 'all_text' in dict_ else f'OCR Engine Error: {text} - status code {status_code}'
-        except:
-            self._value = f'OCR Engine Error: {text} - status code {status_code}'
+            self._value = dict_.get(
+                "all_text", f"OCR Engine Error: {text} - status code {status_code}"
+            )
+        except Exception:
+            self._value = f"OCR Engine Error: {text} - status code {status_code}"
 class OCREngine(Engine):
-    def __init__(self, api_key: Optional[str] = None):
+    def __init__(self, api_key: str | None = None):
         super().__init__()
         # Opening JSON file
         self.config = SYMAI_CONFIG
-        self.headers = {
-            "apikey": self.config['OCR_ENGINE_API_KEY'] if api_key is None else api_key
-        }
+        self.headers = {"apikey": self.config["OCR_ENGINE_API_KEY"] if api_key is None else api_key}
         self.name = self.__class__.__name__
     def id(self) -> str:
-        if self.config['OCR_ENGINE_API_KEY']:
-            return 'ocr'
-        return super().id() # default to unregistered
+        if self.config["OCR_ENGINE_API_KEY"]:
+            return "ocr"
+        return super().id()  # default to unregistered
     def command(self, *args, **kwargs):
         super().command(*args, **kwargs)
-        if 'OCR_ENGINE_API_KEY' in kwargs:
-            self.headers = {
-                "apikey": kwargs['OCR_ENGINE_API_KEY']
-            }
+        if "OCR_ENGINE_API_KEY" in kwargs:
+            self.headers = {"apikey": kwargs["OCR_ENGINE_API_KEY"]}
     def forward(self, argument):
-        kwargs    = argument.kwargs
         image_url = argument.prop.image
         if image_url.startswith("file://"):
             file_path = Path(image_url[7:]).resolve()
-            with open(file_path, "rb") as file:
+            with file_path.open("rb") as file:
                 payload = file.read()
-            url      = "https://api.apilayer.com/image_to_text/upload"
+            url = "https://api.apilayer.com/image_to_text/upload"
             response = requests.request("POST", url, headers=self.headers, data=payload)
         else:
-            payload   = {}
-            url      = f"https://api.apilayer.com/image_to_text/url?url={image_url}"
-            response = requests.request("GET", url, headers=self.headers, data = payload)
+            payload = {}
+            url = f"https://api.apilayer.com/image_to_text/url?url={image_url}"
+            response = requests.request("GET", url, headers=self.headers, data=payload)
         status_code = response.status_code
-        rsp         = response.text
-        rsp       = ApiLayerResult(response.text, status_code)
-        metadata  = {}
+        rsp = response.text
+        rsp = ApiLayerResult(response.text, status_code)
+        metadata = {}
         return [rsp], metadata
     def prepare(self, argument):
         assert not argument.prop.processed_input, "OCREngine does not support processed_input."
-        image  = str(argument.prop.image)
+        image = str(argument.prop.image)
         argument.prop.prepared_input = image

symai/backend/engines/output/engine_stdout.py CHANGED Viewed

@@ -7,28 +7,25 @@ class OutputEngine(Engine):
         self.name = self.__class__.__name__
     def id(self) -> str:
-        return 'output'
+        return "output"
     def forward(self, argument):
-        expr, processed, args, kwargs  = argument.prop.prepared_input
+        expr, processed, args, kwargs = argument.prop.prepared_input
         res = None
         args = [] if args is None else args
         kwargs = {} if kwargs is None else kwargs
         if expr:
-            if processed:
-                res = expr(processed, *args, **kwargs)
-            else:
-                res = expr(*args, **kwargs)
+            res = expr(processed, *args, **kwargs) if processed else expr(*args, **kwargs)
         metadata = {}
-        result   = {
-            'result': res,
-            'processed': processed,
-            'args': args,
-            'kwargs': kwargs
-        }
+        result = {"result": res, "processed": processed, "args": args, "kwargs": kwargs}
         return [result], metadata
     def prepare(self, argument):
-        argument.prop.prepared_input = argument.prop.expr, argument.prop.processed_input, argument.prop.args, argument.prop.kwargs
+        argument.prop.prepared_input = (
+            argument.prop.expr,
+            argument.prop.processed_input,
+            argument.prop.args,
+            argument.prop.kwargs,
+        )

symai/backend/engines/{webscraping → scrape}/engine_requests.py RENAMED Viewed

@@ -10,6 +10,7 @@ service disruption.
 import io
 import logging
 import re
+from typing import Any, ClassVar
 from urllib.parse import parse_qsl, urlencode, urljoin, urlparse, urlunparse
 import requests
@@ -19,6 +20,7 @@ from pdfminer.high_level import extract_text
 from requests.structures import CaseInsensitiveDict
 from ....symbol import Result
+from ....utils import UserMessage
 from ...base import Engine
 logging.getLogger("pdfminer").setLevel(logging.WARNING)
@@ -56,23 +58,23 @@ class RequestsEngine(Engine):
     the requests session stay aligned.
     """
-    COMMON_BYPASS_COOKIES = {
+    COMMON_BYPASS_COOKIES: ClassVar[dict[str, str]] = {
         # Some forums display consent or age gates once if a friendly cookie is set.
         "cookieconsent_status": "allow",
         "accepted_cookies": "yes",
         "age_verified": "1",
     }
-    DEFAULT_HEADERS = {
+    DEFAULT_HEADERS: ClassVar[dict[str, str]] = {
         "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) "
-                      "AppleWebKit/537.36 (KHTML, like Gecko) "
-                      "Chrome/120.0.0.0 Safari/537.36",
+        "AppleWebKit/537.36 (KHTML, like Gecko) "
+        "Chrome/120.0.0.0 Safari/537.36",
         "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
         "Accept-Language": "en-US,en;q=0.9",
         "DNT": "1",
     }
-    _SAMESITE_CANONICAL = {
+    _SAMESITE_CANONICAL: ClassVar[dict[str, str]] = {
         "strict": "Strict",
         "lax": "Lax",
         "none": "None",
@@ -156,6 +158,58 @@ class RequestsEngine(Engine):
             payload["sameSite"] = same_site
         return payload
+    def _collect_playwright_cookies(self, hostname: str) -> list[dict[str, Any]]:
+        if not hostname:
+            return []
+        cookie_payload = []
+        for cookie in self.session.cookies:
+            payload = self._playwright_cookie_payload(cookie, hostname)
+            if payload:
+                cookie_payload.append(payload)
+        return cookie_payload
+    @staticmethod
+    def _add_cookies_to_context(context, cookie_payload: list[dict[str, Any]]) -> None:
+        if cookie_payload:
+            context.add_cookies(cookie_payload)
+    @staticmethod
+    def _navigate_playwright_page(
+        page, url: str, wait_selector: str | None, wait_until: str, timeout_ms: int, timeout_error
+    ):
+        try:
+            response = page.goto(url, wait_until=wait_until, timeout=timeout_ms)
+            if wait_selector:
+                page.wait_for_selector(wait_selector, timeout=timeout_ms)
+            return response, None
+        except timeout_error as exc:
+            return None, exc
+    @staticmethod
+    def _safe_page_content(page) -> str:
+        try:
+            return page.content()
+        except Exception:
+            return ""
+    def _sync_cookies_from_context(self, context) -> None:
+        for cookie in context.cookies():
+            self.session.cookies.set(
+                cookie["name"],
+                cookie["value"],
+                domain=cookie.get("domain"),
+                path=cookie.get("path", "/"),
+            )
+    @staticmethod
+    def _rendered_response_metadata(page, response):
+        final_url = page.url
+        status = response.status if response is not None else 200
+        headers = CaseInsensitiveDict(response.headers if response is not None else {})
+        if "content-type" not in headers:
+            headers["Content-Type"] = "text/html; charset=utf-8"
+        return final_url, status, headers
     def _follow_meta_refresh(self, resp, timeout=15):
         """
         Some old forums use <meta http-equiv="refresh" content="0;url=...">
@@ -180,19 +234,28 @@ class RequestsEngine(Engine):
             return resp
         return self.session.get(target, timeout=timeout, allow_redirects=True)
-    def _fetch_with_playwright(self, url: str, wait_selector: str = None, wait_until: str = "networkidle", timeout: float = None):
+    def _fetch_with_playwright(
+        self,
+        url: str,
+        wait_selector: str | None = None,
+        wait_until: str = "networkidle",
+        timeout: float | None = None,
+    ):
         """
         Render the target URL in a headless browser to execute JavaScript and
         return a synthetic ``requests.Response`` object to keep downstream
         processing consistent with the non-JS path.
         """
         try:
-            from playwright.sync_api import sync_playwright, TimeoutError as PlaywrightTimeoutError
+            # Playwright is optional; import only when JS rendering is requested.
+            from playwright.sync_api import TimeoutError as PlaywrightTimeoutError  # noqa
+            from playwright.sync_api import sync_playwright  # noqa
             logging.getLogger("playwright").setLevel(logging.WARNING)
         except ImportError as exc:
-            raise RuntimeError(
-                "Playwright is not installed. Install symbolicai[webscraping] with Playwright extras to enable render_js."
-            ) from exc
+            msg = "Playwright is not installed. Install symbolicai[scrape] with Playwright extras to enable render_js."
+            UserMessage(msg)
+            raise RuntimeError(msg) from exc
         timeout_seconds = timeout if timeout is not None else self.timeout
         timeout_ms = max(int(timeout_seconds * 1000), 0)
@@ -200,12 +263,7 @@ class RequestsEngine(Engine):
         parsed = urlparse(url)
         hostname = parsed.hostname or ""
-        cookie_payload = []
-        if hostname:
-            for cookie in self.session.cookies:
-                payload = self._playwright_cookie_payload(cookie, hostname)
-                if payload:
-                    cookie_payload.append(payload)
+        cookie_payload = self._collect_playwright_cookies(hostname)
         content = ""
         final_url = url
@@ -219,42 +277,26 @@ class RequestsEngine(Engine):
                 java_script_enabled=True,
                 ignore_https_errors=not self.verify_ssl,
             )
-            if cookie_payload:
-                context.add_cookies(cookie_payload)
-            page = context.new_page()
-            navigation_error = None
-            response = None
             try:
-                try:
-                    response = page.goto(url, wait_until=wait_until, timeout=timeout_ms)
-                    if wait_selector:
-                        page.wait_for_selector(wait_selector, timeout=timeout_ms)
-                except PlaywrightTimeoutError as exc:
-                    navigation_error = exc
-                try:
-                    content = page.content()
-                except Exception:
-                    content = ""
-                # Always persist Playwright cookies back into the requests session.
-                for cookie in context.cookies():
-                    self.session.cookies.set(
-                        cookie["name"],
-                        cookie["value"],
-                        domain=cookie.get("domain"),
-                        path=cookie.get("path", "/"),
-                    )
-                final_url = page.url
-                status = response.status if response is not None else 200
-                headers = CaseInsensitiveDict(response.headers if response is not None else {})
-                if "content-type" not in headers:
-                    headers["Content-Type"] = "text/html; charset=utf-8"
+                self._add_cookies_to_context(context, cookie_payload)
+                page = context.new_page()
+                response, navigation_error = self._navigate_playwright_page(
+                    page,
+                    url,
+                    wait_selector,
+                    wait_until,
+                    timeout_ms,
+                    PlaywrightTimeoutError,
+                )
+                content = self._safe_page_content(page)
+                self._sync_cookies_from_context(context)
+                final_url, status, headers = self._rendered_response_metadata(page, response)
                 if navigation_error and not content:
-                    raise requests.exceptions.Timeout(f"Playwright timed out while rendering {url}") from navigation_error
+                    msg = f"Playwright timed out while rendering {url}"
+                    UserMessage(msg)
+                    raise requests.exceptions.Timeout(msg) from navigation_error
             finally:
                 context.close()
                 browser.close()
@@ -268,7 +310,7 @@ class RequestsEngine(Engine):
         return rendered_response
     def id(self) -> str:
-        return 'webscraping'
+        return "scrape"
     def forward(self, argument):
         """
@@ -284,8 +326,11 @@ class RequestsEngine(Engine):
         self._maybe_set_bypass_cookies(url)
         parsed = urlparse(url)
-        qs = [(k, v) for k, v in parse_qsl(parsed.query, keep_blank_values=True)
-              if k.lower() not in {"utm_source", "utm_medium", "utm_campaign"}]
+        qs = [
+            (k, v)
+            for k, v in parse_qsl(parsed.query, keep_blank_values=True)
+            if k.lower() not in {"utm_source", "utm_medium", "utm_campaign"}
+        ]
         clean_url = urlunparse(parsed._replace(query=urlencode(qs)))
         render_js = kwargs.get("render_js")
@@ -302,7 +347,9 @@ class RequestsEngine(Engine):
                 timeout=render_timeout,
             )
         else:
-            resp = self.session.get(clean_url, timeout=self.timeout, allow_redirects=True, verify=self.verify_ssl)
+            resp = self.session.get(
+                clean_url, timeout=self.timeout, allow_redirects=True, verify=self.verify_ssl
+            )
         resp.raise_for_status()
         # Follow a legacy meta refresh once (do AFTER normal HTTP redirects)

symbolicai 0.21.0__py3-none-any.whl → 1.1.0__py3-none-any.whl

symbolicai 0.21.0py3-none-any.whl → 1.1.0py3-none-any.whl