PyPI - camel-ai - Versions diffs - 0.2.67__py3-none-any.whl → 0.2.80a2__py3-none-any.whl - Mend

camel-ai 0.2.67py3-none-any.whl → 0.2.80a2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (224) hide show

camel/__init__.py +1 -1
camel/agents/_types.py +6 -2
camel/agents/_utils.py +38 -0
camel/agents/chat_agent.py +4014 -410
camel/agents/mcp_agent.py +30 -27
camel/agents/repo_agent.py +2 -1
camel/benchmarks/browsecomp.py +6 -6
camel/configs/__init__.py +15 -0
camel/configs/aihubmix_config.py +88 -0
camel/configs/amd_config.py +70 -0
camel/configs/cometapi_config.py +104 -0
camel/configs/minimax_config.py +93 -0
camel/configs/nebius_config.py +103 -0
camel/configs/vllm_config.py +2 -0
camel/data_collectors/alpaca_collector.py +15 -6
camel/datagen/self_improving_cot.py +1 -1
camel/datasets/base_generator.py +39 -10
camel/environments/__init__.py +12 -0
camel/environments/rlcards_env.py +860 -0
camel/environments/single_step.py +28 -3
camel/environments/tic_tac_toe.py +1 -1
camel/interpreters/__init__.py +2 -0
camel/interpreters/docker/Dockerfile +4 -16
camel/interpreters/docker_interpreter.py +3 -2
camel/interpreters/e2b_interpreter.py +34 -1
camel/interpreters/internal_python_interpreter.py +51 -2
camel/interpreters/microsandbox_interpreter.py +395 -0
camel/loaders/__init__.py +11 -2
camel/loaders/base_loader.py +85 -0
camel/loaders/chunkr_reader.py +9 -0
camel/loaders/firecrawl_reader.py +4 -4
camel/logger.py +1 -1
camel/memories/agent_memories.py +84 -1
camel/memories/base.py +34 -0
camel/memories/blocks/chat_history_block.py +122 -4
camel/memories/blocks/vectordb_block.py +8 -1
camel/memories/context_creators/score_based.py +29 -237
camel/memories/records.py +88 -8
camel/messages/base.py +166 -40
camel/messages/func_message.py +32 -5
camel/models/__init__.py +10 -0
camel/models/aihubmix_model.py +83 -0
camel/models/aiml_model.py +1 -16
camel/models/amd_model.py +101 -0
camel/models/anthropic_model.py +117 -18
camel/models/aws_bedrock_model.py +2 -33
camel/models/azure_openai_model.py +205 -91
camel/models/base_audio_model.py +3 -1
camel/models/base_model.py +189 -24
camel/models/cohere_model.py +5 -17
camel/models/cometapi_model.py +83 -0
camel/models/crynux_model.py +1 -16
camel/models/deepseek_model.py +6 -16
camel/models/fish_audio_model.py +6 -0
camel/models/gemini_model.py +71 -20
camel/models/groq_model.py +1 -17
camel/models/internlm_model.py +1 -16
camel/models/litellm_model.py +49 -32
camel/models/lmstudio_model.py +1 -17
camel/models/minimax_model.py +83 -0
camel/models/mistral_model.py +1 -16
camel/models/model_factory.py +27 -1
camel/models/model_manager.py +24 -6
camel/models/modelscope_model.py +1 -16
camel/models/moonshot_model.py +185 -19
camel/models/nebius_model.py +83 -0
camel/models/nemotron_model.py +0 -5
camel/models/netmind_model.py +1 -16
camel/models/novita_model.py +1 -16
camel/models/nvidia_model.py +1 -16
camel/models/ollama_model.py +4 -19
camel/models/openai_compatible_model.py +171 -46
camel/models/openai_model.py +205 -77
camel/models/openrouter_model.py +1 -17
camel/models/ppio_model.py +1 -16
camel/models/qianfan_model.py +1 -16
camel/models/qwen_model.py +1 -16
camel/models/reka_model.py +1 -16
camel/models/samba_model.py +34 -47
camel/models/sglang_model.py +64 -31
camel/models/siliconflow_model.py +1 -16
camel/models/stub_model.py +0 -4
camel/models/togetherai_model.py +1 -16
camel/models/vllm_model.py +1 -16
camel/models/volcano_model.py +0 -17
camel/models/watsonx_model.py +1 -16
camel/models/yi_model.py +1 -16
camel/models/zhipuai_model.py +60 -16
camel/parsers/__init__.py +18 -0
camel/parsers/mcp_tool_call_parser.py +176 -0
camel/retrievers/auto_retriever.py +1 -0
camel/runtimes/configs.py +11 -11
camel/runtimes/daytona_runtime.py +15 -16
camel/runtimes/docker_runtime.py +6 -6
camel/runtimes/remote_http_runtime.py +5 -5
camel/services/agent_openapi_server.py +380 -0
camel/societies/__init__.py +2 -0
camel/societies/role_playing.py +26 -28
camel/societies/workforce/__init__.py +2 -0
camel/societies/workforce/events.py +122 -0
camel/societies/workforce/prompts.py +249 -38
camel/societies/workforce/role_playing_worker.py +82 -20
camel/societies/workforce/single_agent_worker.py +634 -34
camel/societies/workforce/structured_output_handler.py +512 -0
camel/societies/workforce/task_channel.py +169 -23
camel/societies/workforce/utils.py +176 -9
camel/societies/workforce/worker.py +77 -23
camel/societies/workforce/workflow_memory_manager.py +772 -0
camel/societies/workforce/workforce.py +3168 -478
camel/societies/workforce/workforce_callback.py +74 -0
camel/societies/workforce/workforce_logger.py +203 -175
camel/societies/workforce/workforce_metrics.py +33 -0
camel/storages/__init__.py +4 -0
camel/storages/key_value_storages/json.py +15 -2
camel/storages/key_value_storages/mem0_cloud.py +48 -47
camel/storages/object_storages/google_cloud.py +1 -1
camel/storages/vectordb_storages/__init__.py +6 -0
camel/storages/vectordb_storages/chroma.py +731 -0
camel/storages/vectordb_storages/oceanbase.py +13 -13
camel/storages/vectordb_storages/pgvector.py +349 -0
camel/storages/vectordb_storages/qdrant.py +3 -3
camel/storages/vectordb_storages/surreal.py +365 -0
camel/storages/vectordb_storages/tidb.py +8 -6
camel/tasks/task.py +244 -27
camel/toolkits/__init__.py +46 -8
camel/toolkits/aci_toolkit.py +64 -19
camel/toolkits/arxiv_toolkit.py +6 -6
camel/toolkits/base.py +63 -5
camel/toolkits/code_execution.py +28 -1
camel/toolkits/context_summarizer_toolkit.py +684 -0
camel/toolkits/craw4ai_toolkit.py +93 -0
camel/toolkits/dappier_toolkit.py +10 -6
camel/toolkits/dingtalk.py +1135 -0
camel/toolkits/edgeone_pages_mcp_toolkit.py +49 -0
camel/toolkits/excel_toolkit.py +901 -67
camel/toolkits/file_toolkit.py +1402 -0
camel/toolkits/function_tool.py +30 -6
camel/toolkits/github_toolkit.py +107 -20
camel/toolkits/gmail_toolkit.py +1839 -0
camel/toolkits/google_calendar_toolkit.py +38 -4
camel/toolkits/google_drive_mcp_toolkit.py +54 -0
camel/toolkits/human_toolkit.py +34 -10
camel/toolkits/hybrid_browser_toolkit/__init__.py +18 -0
camel/toolkits/hybrid_browser_toolkit/config_loader.py +185 -0
camel/toolkits/hybrid_browser_toolkit/hybrid_browser_toolkit.py +246 -0
camel/toolkits/hybrid_browser_toolkit/hybrid_browser_toolkit_ts.py +1973 -0
camel/toolkits/hybrid_browser_toolkit/installer.py +203 -0
camel/toolkits/hybrid_browser_toolkit/ts/package-lock.json +3749 -0
camel/toolkits/hybrid_browser_toolkit/ts/package.json +32 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/browser-scripts.js +125 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/browser-session.ts +1815 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/config-loader.ts +233 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/hybrid-browser-toolkit.ts +590 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/index.ts +7 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/parent-child-filter.ts +226 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/snapshot-parser.ts +219 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/som-screenshot-injected.ts +543 -0
camel/toolkits/hybrid_browser_toolkit/ts/src/types.ts +130 -0
camel/toolkits/hybrid_browser_toolkit/ts/tsconfig.json +26 -0
camel/toolkits/hybrid_browser_toolkit/ts/websocket-server.js +319 -0
camel/toolkits/hybrid_browser_toolkit/ws_wrapper.py +1032 -0
camel/toolkits/hybrid_browser_toolkit_py/__init__.py +17 -0
camel/toolkits/hybrid_browser_toolkit_py/actions.py +575 -0
camel/toolkits/hybrid_browser_toolkit_py/agent.py +311 -0
camel/toolkits/hybrid_browser_toolkit_py/browser_session.py +787 -0
camel/toolkits/hybrid_browser_toolkit_py/config_loader.py +490 -0
camel/toolkits/hybrid_browser_toolkit_py/hybrid_browser_toolkit.py +2390 -0
camel/toolkits/hybrid_browser_toolkit_py/snapshot.py +233 -0
camel/toolkits/hybrid_browser_toolkit_py/stealth_script.js +0 -0
camel/toolkits/hybrid_browser_toolkit_py/unified_analyzer.js +1043 -0
camel/toolkits/image_generation_toolkit.py +390 -0
camel/toolkits/jina_reranker_toolkit.py +3 -4
camel/toolkits/klavis_toolkit.py +5 -1
camel/toolkits/markitdown_toolkit.py +104 -0
camel/toolkits/math_toolkit.py +64 -10
camel/toolkits/mcp_toolkit.py +370 -45
camel/toolkits/memory_toolkit.py +5 -1
camel/toolkits/message_agent_toolkit.py +608 -0
camel/toolkits/message_integration.py +724 -0
camel/toolkits/minimax_mcp_toolkit.py +195 -0
camel/toolkits/note_taking_toolkit.py +277 -0
camel/toolkits/notion_mcp_toolkit.py +224 -0
camel/toolkits/openbb_toolkit.py +5 -1
camel/toolkits/origene_mcp_toolkit.py +56 -0
camel/toolkits/playwright_mcp_toolkit.py +12 -31
camel/toolkits/pptx_toolkit.py +25 -12
camel/toolkits/resend_toolkit.py +168 -0
camel/toolkits/screenshot_toolkit.py +213 -0
camel/toolkits/search_toolkit.py +437 -142
camel/toolkits/slack_toolkit.py +104 -50
camel/toolkits/sympy_toolkit.py +1 -1
camel/toolkits/task_planning_toolkit.py +3 -3
camel/toolkits/terminal_toolkit/__init__.py +18 -0
camel/toolkits/terminal_toolkit/terminal_toolkit.py +957 -0
camel/toolkits/terminal_toolkit/utils.py +532 -0
camel/toolkits/thinking_toolkit.py +1 -1
camel/toolkits/vertex_ai_veo_toolkit.py +590 -0
camel/toolkits/video_analysis_toolkit.py +106 -26
camel/toolkits/video_download_toolkit.py +17 -14
camel/toolkits/web_deploy_toolkit.py +1219 -0
camel/toolkits/wechat_official_toolkit.py +483 -0
camel/toolkits/zapier_toolkit.py +5 -1
camel/types/__init__.py +2 -2
camel/types/agents/tool_calling_record.py +4 -1
camel/types/enums.py +316 -40
camel/types/openai_types.py +2 -2
camel/types/unified_model_type.py +31 -4
camel/utils/commons.py +36 -5
camel/utils/constants.py +3 -0
camel/utils/context_utils.py +1003 -0
camel/utils/mcp.py +138 -4
camel/utils/mcp_client.py +45 -1
camel/utils/message_summarizer.py +148 -0
camel/utils/token_counting.py +43 -20
camel/utils/tool_result.py +44 -0
{camel_ai-0.2.67.dist-info → camel_ai-0.2.80a2.dist-info}/METADATA +296 -85
{camel_ai-0.2.67.dist-info → camel_ai-0.2.80a2.dist-info}/RECORD +219 -146
camel/loaders/pandas_reader.py +0 -368
camel/toolkits/dalle_toolkit.py +0 -175
camel/toolkits/file_write_toolkit.py +0 -444
camel/toolkits/openai_agent_toolkit.py +0 -135
camel/toolkits/terminal_toolkit.py +0 -1037
{camel_ai-0.2.67.dist-info → camel_ai-0.2.80a2.dist-info}/WHEEL +0 -0
{camel_ai-0.2.67.dist-info → camel_ai-0.2.80a2.dist-info}/licenses/LICENSE +0 -0

camel/toolkits/hybrid_browser_toolkit_py/agent.py ADDED Viewed

@@ -0,0 +1,311 @@
+# ========= Copyright 2023-2024 @ CAMEL-AI.org. All Rights Reserved. =========
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ========= Copyright 2023-2024 @ CAMEL-AI.org. All Rights Reserved. =========
+import json
+import re
+from typing import TYPE_CHECKING, Any, Dict, List, Optional, Union
+from camel.logger import get_logger
+from camel.models import BaseModelBackend, ModelFactory
+from camel.types import ModelPlatformType, ModelType
+from .actions import ActionExecutor
+from .browser_session import HybridBrowserSession
+if TYPE_CHECKING:
+    from camel.agents import ChatAgent
+logger = get_logger(__name__)
+class PlaywrightLLMAgent:
+    r"""High-level orchestration: snapshot ↔ LLM ↔ action executor."""
+    # System prompt as class constant to avoid recreation
+    SYSTEM_PROMPT = """
+You are a web automation assistant.
+" Analyse the page snapshot and create a short high-level plan, "
+"then output the FIRST action to start with.\n\n"
+"Return a JSON object in *exactly* this shape:\n"
+"Action format json_object examples:\n"
+"{\n  \"plan\": [\"Step 1\", \"Step 2\"],\n  \"action\": {\n    \"type\":
+\"click\",\n    \"ref\": \"e1\"\n  }\n}\n\n"
+"If task is already complete:\n"
+"{\n  \"plan\": [],\n  \"action\": {\n    \"type\": \"finish\",
+\n    \"ref\": null,\n    \"summary\": \"Task was already completed. Summary
+of what was found...\"\n  }\n}"
+Available action types:
+- 'click': {"type": "click", "ref": "e1"} or {"type": "click", "text":
+"Button Text"} or {"type": "click", "selector": "button"}
+- 'type': {"type": "type", "ref": "e1", "text": "search text"} or {"type":
+"type", "selector": "input", "text": "search text"}
+- 'select': {"type": "select", "ref": "e1", "value": "option"} or {"type":
+"select", "selector": "select", "value": "option"}
+- 'wait': {"type": "wait", "timeout": 2000} or {"type": "wait", "selector":
+"#element"}
+- 'scroll': {"type": "scroll", "direction": "down", "amount": 300}
+- 'enter': {"type": "enter", "ref": "e1"} or {"type": "enter", "selector":
+"input[name=q]"} or {"type": "enter"}
+- 'navigate': {"type": "navigate", "url": "https://example.com"}
+- 'finish': {"type": "finish", "ref": null, "summary": "task completion
+summary"}
+IMPORTANT:
+- For 'click': Use 'ref' from snapshot, or 'text' for visible text,
+or 'selector' for CSS selectors
+- For 'type'/'select': Use 'ref' from snapshot or 'selector' for CSS selectors
+- Only use 'ref' values that exist in the snapshot (e.g., ref=e1, ref=e2, etc.)
+- Use 'finish' when the task is completed successfully with a summary of
+what was accomplished
+- Use 'enter' to press the Enter key (optionally focus an element first)
+- Use 'navigate' to open a new URL before interacting further
+- click can choose radio, checkbox...
+        """
+    def __init__(
+        self,
+        *,
+        user_data_dir: Optional[str] = None,
+        headless: bool = False,
+        stealth: bool = False,
+        model_backend: Optional[BaseModelBackend] = None,
+        default_timeout: Optional[int] = None,
+        short_timeout: Optional[int] = None,
+    ):
+        self._session = HybridBrowserSession(
+            headless=headless,
+            user_data_dir=user_data_dir,
+            stealth=stealth,
+            default_timeout=default_timeout,
+            short_timeout=short_timeout,
+        )
+        from camel.agents import ChatAgent
+        # Populated lazily after first page load
+        self.action_history: List[Dict[str, Any]] = []
+        if model_backend is None:
+            model_backend = ModelFactory.create(
+                model_platform=ModelPlatformType.DEFAULT,
+                model_type=ModelType.DEFAULT,
+                model_config_dict={"temperature": 0, "top_p": 1},
+            )
+        self.model_backend = model_backend
+        # Reuse ChatAgent instance to avoid recreation overhead
+        self._chat_agent: Optional[ChatAgent] = None
+    async def navigate(self, url: str) -> str:
+        r"""Navigate to a URL and return the snapshot."""
+        try:
+            # HybridBrowserSession handles waits internally
+            logger.debug("Navigated to URL: %s", url)
+            await self._session.visit(url)
+            return await self._session.get_snapshot(force_refresh=True)
+        except Exception as exc:
+            error_msg = f"Error: could not navigate to {url} - {exc}"
+            logger.error(error_msg)
+            return error_msg
+    def _get_chat_agent(self) -> "ChatAgent":
+        r"""Get or create the ChatAgent instance."""
+        from camel.agents import ChatAgent
+        if self._chat_agent is None:
+            self._chat_agent = ChatAgent(
+                system_message=self.SYSTEM_PROMPT, model=self.model_backend
+            )
+        return self._chat_agent
+    def _safe_parse_json(self, content: str) -> Dict[str, Any]:
+        r"""Safely parse JSON from LLM response with multiple fallback
+        strategies.
+        """
+        # First attempt: direct parsing
+        try:
+            return json.loads(content)
+        except json.JSONDecodeError:
+            pass
+        # Second attempt: extract JSON-like block using regex
+        # Look for content between outermost braces
+        json_pattern = re.compile(
+            r'\{[^{}]*(?:\{[^{}]*\}[^{}]*)*\}', re.DOTALL
+        )
+        json_matches = json_pattern.findall(content)
+        for match in json_matches:
+            try:
+                return json.loads(match)
+            except json.JSONDecodeError:
+                continue
+        # Third attempt: try to find and parse line by line
+        lines = content.split('\n')
+        json_lines = []
+        in_json = False
+        for line in lines:
+            line = line.strip()
+            if line.startswith('{'):
+                in_json = True
+                json_lines = [line]
+            elif in_json:
+                json_lines.append(line)
+                if line.endswith('}'):
+                    try:
+                        json_text = '\n'.join(json_lines)
+                        return json.loads(json_text)
+                    except json.JSONDecodeError:
+                        pass
+                    in_json = False
+                    json_lines = []
+        # Fallback: return default structure
+        logger.warning(
+            "Could not parse JSON from LLM response: %s", content[:200]
+        )
+        return self._get_fallback_response("Parsing error")
+    def _get_fallback_response(self, error_msg: str) -> Dict[str, Any]:
+        r"""Generate a fallback response structure."""
+        return {
+            "plan": [f"Could not parse response: {error_msg}"],
+            "action": {
+                "type": "finish",
+                "ref": None,
+                "summary": f"Parsing error: {error_msg}",
+            },
+        }
+    def _llm_call(
+        self,
+        prompt: str,
+        snapshot: str,
+        is_initial: bool,
+        history: Optional[List[Dict[str, Any]]] = None,
+    ) -> Dict[str, Any]:
+        r"""Call the LLM (via CAMEL ChatAgent) to get plan & next action."""
+        # Build user message
+        if is_initial:
+            user_content = f"Snapshot:\n{snapshot}\n\nTask: {prompt}"
+        else:
+            hist_lines = [
+                (
+                    f"{i + 1}. {'✅' if h['success'] else '❌'} "
+                    f"{h['action']['type']} -> {h['result']}"
+                )
+                for i, h in enumerate(history or [])
+            ]
+            user_content = (
+                f"Snapshot:\n{snapshot}\n\nHistory:\n"
+                + "\n".join(hist_lines)
+                + f"\n\nTask: {prompt}"
+            )
+        # Run ChatAgent
+        chat_agent = self._get_chat_agent()
+        response = chat_agent.step(user_content)
+        content = response.msgs[0].content if response.msgs else "{}"
+        # Safely parse JSON response
+        return self._safe_parse_json(content)
+    async def process_command(self, prompt: str, max_steps: int = 15):
+        r"""Process a command using LLM-guided browser automation."""
+        # initial full snapshot
+        full_snapshot = await self._session.get_snapshot()
+        assert self._session.snapshot is not None
+        meta = self._session.snapshot.last_info
+        logger.info("Initial snapshot priorities=%s", meta["priorities"])
+        logger.debug("Full snapshot:\n%s", full_snapshot)
+        plan_resp = self._llm_call(
+            prompt, full_snapshot or "", is_initial=True
+        )
+        plan = plan_resp.get("plan", [])
+        action = plan_resp.get("action")
+        logger.info("Plan generated: %s", json.dumps(plan, ensure_ascii=False))
+        steps = 0
+        while action and steps < max_steps:
+            if action.get("type") == "finish":
+                logger.info("Task finished: %s", action.get("summary", "Done"))
+                break
+            result = await self._run_action(action)
+            logger.debug("Executed action: %s | Result: %s", action, result)
+            success = False
+            result_for_history = ""
+            if isinstance(result, str):
+                success = "Error" not in result
+                result_for_history = result
+            elif isinstance(result, dict):
+                success = result.get('success', False)
+                result_for_history = result.get('message', str(result))
+            else:
+                # Fallback case
+                success = False
+                result_for_history = str(result)
+            self.action_history.append(
+                {
+                    "action": action,
+                    "result": result_for_history,
+                    "success": success,
+                }
+            )
+            diff_snapshot = await self._session.get_snapshot(
+                force_refresh=ActionExecutor.should_update_snapshot(action),
+                diff_only=True,
+            )
+            assert self._session.snapshot is not None
+            meta = self._session.snapshot.last_info
+            logger.debug(
+                "Snapshot after action (diff=%s):\n%s",
+                meta["is_diff"],
+                diff_snapshot,
+            )
+            # Update full snapshot if page changed
+            if meta["is_diff"] and not diff_snapshot.startswith(
+                "- Page Snapshot (no structural changes)"
+            ):
+                assert self._session.snapshot is not None
+                full_snapshot = self._session.snapshot.snapshot_data or ""
+            action = self._llm_call(
+                prompt,
+                full_snapshot or "",
+                is_initial=False,
+                history=self.action_history,
+            ).get("action")
+            steps += 1
+        logger.info("Process completed with %d steps", steps)
+    async def _run_action(
+        self, action: Dict[str, Any]
+    ) -> Union[str, Dict[str, Any]]:
+        r"""Execute a single action and return the result."""
+        if action.get("type") == "navigate":
+            return await self.navigate(action.get("url", ""))
+        return await self._session.exec_action(action)
+    async def close(self):
+        r"""Clean up browser session and resources."""
+        await self._session.close()

camel-ai 0.2.67__py3-none-any.whl → 0.2.80a2__py3-none-any.whl

camel-ai 0.2.67py3-none-any.whl → 0.2.80a2py3-none-any.whl