PyPI - chatterer - Versions diffs - 0.1.26__py3-none-any.whl → 0.1.27__py3-none-any.whl - Mend

chatterer 0.1.26py3-none-any.whl → 0.1.27py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (42) hide show

chatterer/__init__.py +87 -87
chatterer/common_types/__init__.py +21 -21
chatterer/common_types/io.py +19 -19
chatterer/constants.py +5 -0
chatterer/examples/__main__.py +75 -75
chatterer/examples/any2md.py +83 -85
chatterer/examples/pdf2md.py +231 -338
chatterer/examples/pdf2txt.py +52 -54
chatterer/examples/ppt.py +487 -486
chatterer/examples/pw.py +141 -143
chatterer/examples/snippet.py +54 -56
chatterer/examples/transcribe.py +192 -192
chatterer/examples/upstage.py +87 -89
chatterer/examples/web2md.py +80 -80
chatterer/interactive.py +422 -354
chatterer/language_model.py +530 -536
chatterer/messages.py +21 -21
chatterer/tools/__init__.py +46 -46
chatterer/tools/caption_markdown_images.py +388 -384
chatterer/tools/citation_chunking/__init__.py +3 -3
chatterer/tools/citation_chunking/chunks.py +51 -53
chatterer/tools/citation_chunking/citation_chunker.py +117 -118
chatterer/tools/citation_chunking/citations.py +284 -285
chatterer/tools/citation_chunking/prompt.py +157 -157
chatterer/tools/citation_chunking/reference.py +26 -26
chatterer/tools/citation_chunking/utils.py +138 -138
chatterer/tools/convert_pdf_to_markdown.py +636 -645
chatterer/tools/convert_to_text.py +446 -446
chatterer/tools/upstage_document_parser.py +704 -705
chatterer/tools/webpage_to_markdown.py +739 -739
chatterer/tools/youtube.py +146 -147
chatterer/utils/__init__.py +15 -15
chatterer/utils/base64_image.py +349 -350
chatterer/utils/bytesio.py +59 -59
chatterer/utils/code_agent.py +237 -237
chatterer/utils/imghdr.py +145 -145
{chatterer-0.1.26.dist-info → chatterer-0.1.27.dist-info}/METADATA +377 -390
chatterer-0.1.27.dist-info/RECORD +43 -0
chatterer-0.1.26.dist-info/RECORD +0 -42
{chatterer-0.1.26.dist-info → chatterer-0.1.27.dist-info}/WHEEL +0 -0
{chatterer-0.1.26.dist-info → chatterer-0.1.27.dist-info}/entry_points.txt +0 -0
{chatterer-0.1.26.dist-info → chatterer-0.1.27.dist-info}/top_level.txt +0 -0

chatterer/language_model.py CHANGED Viewed

@@ -1,536 +1,530 @@
-import re
-from typing import (
-    TYPE_CHECKING,
-    Any,
-    AsyncIterator,
-    Callable,
-    Iterable,
-    Iterator,
-    Literal,
-    Optional,
-    Self,
-    Sequence,
-    Type,
-    TypeAlias,
-    TypeVar,
-    overload,
-)
-from langchain_core.language_models.base import LanguageModelInput
-from langchain_core.language_models.chat_models import BaseChatModel
-from langchain_core.runnables.base import Runnable
-from langchain_core.runnables.config import RunnableConfig
-from langchain_core.utils.utils import secret_from_env
-from pydantic import BaseModel, Field, SecretStr
-from .messages import AIMessage, BaseMessage, HumanMessage, UsageMetadata
-from .utils.code_agent import CodeExecutionResult, FunctionSignature, augment_prompt_for_toolcall
-if TYPE_CHECKING:
-    from instructor import Partial  # pyright: ignore[reportMissingTypeStubs]
-    from langchain_experimental.tools.python.tool import PythonAstREPLTool
-PydanticModelT = TypeVar("PydanticModelT", bound=BaseModel)
-StructuredOutputType: TypeAlias = dict[object, object] | BaseModel
-DEFAULT_IMAGE_DESCRIPTION_INSTRUCTION = "Provide a detailed description of all visible elements in the image, summarizing key details in a few clear sentences."
-DEFAULT_CODE_GENERATION_PROMPT = (
-    "You are utilizing a Python code execution tool now.\n"
-    "Your goal is to generate Python code that solves the task efficiently and appends both the code and its output to your context memory.\n"
-    "\n"
-    "To optimize tool efficiency, follow these guidelines:\n"
-    "- Write concise, efficient code that directly serves the intended purpose.\n"
-    "- Avoid unnecessary operations (e.g., excessive loops, recursion, or heavy computations).\n"
-    "- Handle potential errors gracefully (e.g., using try-except blocks).\n"
-    "\n"
-    "Return your response strictly in the following JSON format:\n"
-    '{\n  "code": "<your_python_code_here>"\n}\n\n'
-)
-DEFAULT_FUNCTION_REFERENCE_PREFIX_PROMPT = (
-    "Below functions are included in global scope and can be used in your code.\n"
-    "Do not try to redefine the function(s).\n"
-    "You don't have to force yourself to use these tools - use them only when you need to.\n"
-)
-DEFAULT_FUNCTION_REFERENCE_SEPARATOR = "\n---\n"  # Separator to distinguish different function references
-PYTHON_CODE_PATTERN: re.Pattern[str] = re.compile(r"```(?:python\s*\n)?(.*?)```", re.DOTALL)
-class Chatterer(BaseModel):
-    """Language model for generating text from a given input."""
-    client: BaseChatModel
-    structured_output_kwargs: dict[str, Any] = Field(default_factory=dict)
-    @classmethod
-    def from_provider(
-        cls,
-        provider_and_model: str,
-        structured_output_kwargs: Optional[dict[str, object]] = {"strict": True},
-        **kwargs: object,
-    ) -> Self:
-        backend, model = provider_and_model.split(":", 1)
-        backends = cls.get_backends()
-        if func := backends.get(backend):
-            return func(model, structured_output_kwargs, **kwargs)
-        else:
-            raise ValueError(f"Unsupported provider: {backend}. Supported providers are: {', '.join(backends.keys())}.")
-    @classmethod
-    def get_backends(cls) -> dict[str, Callable[[str, Optional[dict[str, object]]], Self]]:
-        return {
-            "openai": cls.openai,
-            "anthropic": cls.anthropic,
-            "google": cls.google,
-            "ollama": cls.ollama,
-            "openrouter": cls.open_router,
-            "xai": cls.xai,
-        }
-    @classmethod
-    def openai(
-        cls,
-        model: str = "gpt-4.1",
-        structured_output_kwargs: Optional[dict[str, object]] = {"strict": True},
-        api_key: Optional[str] = None,
-        **kwargs: Any,
-    ) -> Self:
-        from langchain_openai import ChatOpenAI
-        return cls(
-            client=ChatOpenAI(
-                model=model,
-                api_key=_get_api_key(api_key=api_key, env_key="OPENAI_API_KEY", raise_if_none=False),
-                **kwargs,
-            ),
-            structured_output_kwargs=structured_output_kwargs or {},
-        )
-    @classmethod
-    def anthropic(
-        cls,
-        model_name: str = "claude-3-7-sonnet-20250219",
-        structured_output_kwargs: Optional[dict[str, object]] = None,
-        api_key: Optional[str] = None,
-        **kwargs: Any,
-    ) -> Self:
-        from langchain_anthropic import ChatAnthropic
-        return cls(
-            client=ChatAnthropic(
-                model_name=model_name,
-                api_key=_get_api_key(api_key=api_key, env_key="ANTHROPIC_API_KEY", raise_if_none=True),
-                **kwargs,
-            ),
-            structured_output_kwargs=structured_output_kwargs or {},
-        )
-    @classmethod
-    def google(
-        cls,
-        model: str = "gemini-2.5-flash-preview-04-17",
-        structured_output_kwargs: Optional[dict[str, object]] = None,
-        api_key: Optional[str] = None,
-        **kwargs: Any,
-    ) -> Self:
-        from langchain_google_genai import ChatGoogleGenerativeAI
-        return cls(
-            client=ChatGoogleGenerativeAI(
-                model=model,
-                api_key=_get_api_key(api_key=api_key, env_key="GOOGLE_API_KEY", raise_if_none=False),
-                **kwargs,
-            ),
-            structured_output_kwargs=structured_output_kwargs or {},
-        )
-    @classmethod
-    def ollama(
-        cls,
-        model: str = "deepseek-r1:1.5b",
-        structured_output_kwargs: Optional[dict[str, object]] = None,
-        **kwargs: Any,
-    ) -> Self:
-        from langchain_ollama import ChatOllama
-        return cls(
-            client=ChatOllama(model=model, **kwargs),
-            structured_output_kwargs=structured_output_kwargs or {},
-        )
-    @classmethod
-    def open_router(
-        cls,
-        model: str = "openrouter/quasar-alpha",
-        structured_output_kwargs: Optional[dict[str, object]] = None,
-        api_key: Optional[str] = None,
-        **kwargs: Any,
-    ) -> Self:
-        from langchain_openai import ChatOpenAI
-        return cls(
-            client=ChatOpenAI(
-                model=model,
-                base_url="https://openrouter.ai/api/v1",
-                api_key=_get_api_key(api_key=api_key, env_key="OPENROUTER_API_KEY", raise_if_none=False),
-                **kwargs,
-            ),
-            structured_output_kwargs=structured_output_kwargs or {},
-        )
-    @classmethod
-    def xai(
-        cls,
-        model: str = "grok-3-mini",
-        structured_output_kwargs: Optional[dict[str, object]] = None,
-        base_url: str = "https://api.x.ai/v1",
-        api_key: Optional[str] = None,
-        **kwargs: Any,
-    ) -> Self:
-        from langchain_openai import ChatOpenAI
-        return cls(
-            client=ChatOpenAI(
-                model=model,
-                base_url=base_url,
-                api_key=_get_api_key(api_key=api_key, env_key="XAI_API_KEY", raise_if_none=False),
-                **kwargs,
-            ),
-            structured_output_kwargs=structured_output_kwargs or {},
-        )
-    @property
-    def invoke(self):
-        return self.client.invoke
-    @property
-    def ainvoke(self):
-        return self.client.ainvoke
-    @property
-    def stream(self):
-        return self.client.stream
-    @property
-    def astream(self):
-        return self.client.astream
-    @property
-    def bind_tools(self):  # pyright: ignore[reportUnknownParameterType]
-        return self.client.bind_tools  # pyright: ignore[reportUnknownParameterType, reportUnknownVariableType, reportUnknownMemberType]
-    def __getattr__(self, name: str) -> Any:
-        return getattr(self.client, name)
-    @overload
-    def __call__(
-        self,
-        messages: LanguageModelInput,
-        response_model: Type[PydanticModelT],
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> PydanticModelT: ...
-    @overload
-    def __call__(
-        self,
-        messages: LanguageModelInput,
-        response_model: None = None,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> str: ...
-    def __call__(
-        self,
-        messages: LanguageModelInput,
-        response_model: Optional[Type[PydanticModelT]] = None,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> str | PydanticModelT:
-        if response_model:
-            return self.generate_pydantic(response_model, messages, config, stop, **kwargs)
-        return self.client.invoke(input=messages, config=config, stop=stop, **kwargs).text()
-    def generate(
-        self,
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> str:
-        return self.client.invoke(input=messages, config=config, stop=stop, **kwargs).text()
-    async def agenerate(
-        self,
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> str:
-        return (await self.client.ainvoke(input=messages, config=config, stop=stop, **kwargs)).text()
-    def generate_stream(
-        self,
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> Iterator[str]:
-        for chunk in self.client.stream(input=messages, config=config, stop=stop, **kwargs):
-            yield chunk.text()
-    async def agenerate_stream(
-        self,
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> AsyncIterator[str]:
-        async for chunk in self.client.astream(input=messages, config=config, stop=stop, **kwargs):
-            yield chunk.text()
-    def generate_pydantic(
-        self,
-        response_model: Type[PydanticModelT],
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> PydanticModelT:
-        result: StructuredOutputType = _with_structured_output(
-            client=self.client,
-            response_model=response_model,
-            structured_output_kwargs=self.structured_output_kwargs,
-        ).invoke(input=messages, config=config, stop=stop, **kwargs)
-        if isinstance(result, response_model):
-            return result
-        else:
-            return response_model.model_validate(result)
-    async def agenerate_pydantic(
-        self,
-        response_model: Type[PydanticModelT],
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> PydanticModelT:
-        result: StructuredOutputType = await _with_structured_output(
-            client=self.client,
-            response_model=response_model,
-            structured_output_kwargs=self.structured_output_kwargs,
-        ).ainvoke(input=messages, config=config, stop=stop, **kwargs)
-        if isinstance(result, response_model):
-            return result
-        else:
-            return response_model.model_validate(result)
-    def generate_pydantic_stream(
-        self,
-        response_model: Type[PydanticModelT],
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> Iterator[PydanticModelT]:
-        try:
-            import instructor  # pyright: ignore[reportMissingTypeStubs]
-        except ImportError:
-            raise ImportError("Please install `instructor` with `pip install instructor` to use this feature.")
-        partial_response_model = instructor.Partial[response_model]
-        for chunk in _with_structured_output(
-            client=self.client,
-            response_model=partial_response_model,
-            structured_output_kwargs=self.structured_output_kwargs,
-        ).stream(input=messages, config=config, stop=stop, **kwargs):
-            yield response_model.model_validate(chunk)
-    async def agenerate_pydantic_stream(
-        self,
-        response_model: Type[PydanticModelT],
-        messages: LanguageModelInput,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> AsyncIterator[PydanticModelT]:
-        try:
-            import instructor  # pyright: ignore[reportMissingTypeStubs]
-        except ImportError:
-            raise ImportError("Please install `instructor` with `pip install instructor` to use this feature.")
-        partial_response_model = instructor.Partial[response_model]
-        async for chunk in _with_structured_output(
-            client=self.client,
-            response_model=partial_response_model,
-            structured_output_kwargs=self.structured_output_kwargs,
-        ).astream(input=messages, config=config, stop=stop, **kwargs):
-            yield response_model.model_validate(chunk)
-    def describe_image(self, image_url: str, instruction: str = DEFAULT_IMAGE_DESCRIPTION_INSTRUCTION) -> str:
-        """
-        Create a detailed description of an image using the Vision Language Model.
-        - image_url: Image URL to describe
-        """
-        return self.generate([
-            HumanMessage(
-                content=[{"type": "text", "text": instruction}, {"type": "image_url", "image_url": {"url": image_url}}],
-            )
-        ])
-    async def adescribe_image(self, image_url: str, instruction: str = DEFAULT_IMAGE_DESCRIPTION_INSTRUCTION) -> str:
-        """
-        Create a detailed description of an image using the Vision Language Model asynchronously.
-        - image_url: Image URL to describe
-        """
-        return await self.agenerate([
-            HumanMessage(
-                content=[{"type": "text", "text": instruction}, {"type": "image_url", "image_url": {"url": image_url}}],
-            )
-        ])
-    def get_approximate_token_count(self, message: BaseMessage) -> int:
-        return self.client.get_num_tokens_from_messages([message])  # pyright: ignore[reportUnknownMemberType]
-    def get_usage_metadata(self, message: BaseMessage) -> UsageMetadata:
-        if isinstance(message, AIMessage):
-            usage_metadata = message.usage_metadata
-            if usage_metadata is not None:
-                input_tokens = usage_metadata["input_tokens"]
-                output_tokens = usage_metadata["output_tokens"]
-                return {
-                    "input_tokens": input_tokens,
-                    "output_tokens": output_tokens,
-                    "total_tokens": input_tokens + output_tokens,
-                }
-            else:
-                approx_tokens = self.get_approximate_token_count(message)
-                return {"input_tokens": 0, "output_tokens": approx_tokens, "total_tokens": approx_tokens}
-        else:
-            approx_tokens = self.get_approximate_token_count(message)
-            return {
-                "input_tokens": approx_tokens,
-                "output_tokens": 0,
-                "total_tokens": approx_tokens,
-            }
-    def exec(
-        self,
-        messages: LanguageModelInput,
-        repl_tool: Optional["PythonAstREPLTool"] = None,
-        prompt_for_code_invoke: Optional[str] = DEFAULT_CODE_GENERATION_PROMPT,
-        function_signatures: Optional[FunctionSignature | Iterable[FunctionSignature]] = None,
-        function_reference_prefix: Optional[str] = DEFAULT_FUNCTION_REFERENCE_PREFIX_PROMPT,
-        function_reference_seperator: str = DEFAULT_FUNCTION_REFERENCE_SEPARATOR,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> CodeExecutionResult:
-        if not function_signatures:
-            function_signatures = []
-        elif isinstance(function_signatures, FunctionSignature):
-            function_signatures = [function_signatures]
-        messages = augment_prompt_for_toolcall(
-            function_signatures=function_signatures,
-            messages=messages,
-            prompt_for_code_invoke=prompt_for_code_invoke,
-            function_reference_prefix=function_reference_prefix,
-            function_reference_seperator=function_reference_seperator,
-        )
-        code_obj: PythonCodeToExecute = self.generate_pydantic(
-            response_model=PythonCodeToExecute, messages=messages, config=config, stop=stop, **kwargs
-        )
-        return CodeExecutionResult.from_code(
-            code=code_obj.code,
-            config=config,
-            repl_tool=repl_tool,
-            function_signatures=function_signatures,
-            **kwargs,
-        )
-    @property
-    def invoke_code_execution(self) -> Callable[..., CodeExecutionResult]:
-        """Alias for exec method for backward compatibility."""
-        return self.exec
-    async def aexec(
-        self,
-        messages: LanguageModelInput,
-        repl_tool: Optional["PythonAstREPLTool"] = None,
-        prompt_for_code_invoke: Optional[str] = DEFAULT_CODE_GENERATION_PROMPT,
-        additional_callables: Optional[Callable[..., object] | Sequence[Callable[..., object]]] = None,
-        function_reference_prefix: Optional[str] = DEFAULT_FUNCTION_REFERENCE_PREFIX_PROMPT,
-        function_reference_seperator: str = DEFAULT_FUNCTION_REFERENCE_SEPARATOR,
-        config: Optional[RunnableConfig] = None,
-        stop: Optional[list[str]] = None,
-        **kwargs: Any,
-    ) -> CodeExecutionResult:
-        function_signatures: list[FunctionSignature] = FunctionSignature.from_callable(additional_callables)
-        messages = augment_prompt_for_toolcall(
-            function_signatures=function_signatures,
-            messages=messages,
-            prompt_for_code_invoke=prompt_for_code_invoke,
-            function_reference_prefix=function_reference_prefix,
-            function_reference_seperator=function_reference_seperator,
-        )
-        code_obj: PythonCodeToExecute = await self.agenerate_pydantic(
-            response_model=PythonCodeToExecute, messages=messages, config=config, stop=stop, **kwargs
-        )
-        return await CodeExecutionResult.afrom_code(
-            code=code_obj.code,
-            config=config,
-            repl_tool=repl_tool,
-            function_signatures=function_signatures,
-            **kwargs,
-        )
-    @property
-    def ainvoke_code_execution(self):
-        """Alias for aexec method for backward compatibility."""
-        return self.aexec
-class PythonCodeToExecute(BaseModel):
-    code: str = Field(description="Python code to execute")
-    def model_post_init(self, context: object) -> None:
-        super().model_post_init(context)
-        codes: list[str] = []
-        for match in PYTHON_CODE_PATTERN.finditer(self.code):
-            codes.append(match.group(1))
-        if codes:
-            self.code = "\n".join(codes)
-def _with_structured_output(
-    client: BaseChatModel,
-    response_model: Type["PydanticModelT | Partial[PydanticModelT]"],
-    structured_output_kwargs: dict[str, Any],
-) -> Runnable[LanguageModelInput, dict[object, object] | BaseModel]:
-    return client.with_structured_output(schema=response_model, **structured_output_kwargs)  # pyright: ignore[reportUnknownVariableType, reportUnknownMemberType]
-@overload
-def _get_api_key(api_key: Optional[str], env_key: str, raise_if_none: Literal[True]) -> SecretStr: ...
-@overload
-def _get_api_key(api_key: Optional[str], env_key: str, raise_if_none: Literal[False]) -> Optional[SecretStr]: ...
-def _get_api_key(api_key: Optional[str], env_key: str, raise_if_none: bool) -> Optional[SecretStr]:
-    if api_key is None:
-        api_key_found: SecretStr | None = secret_from_env(env_key, default=None)()
-        if raise_if_none and api_key_found is None:
-            raise ValueError(
-                (
-                    f"Did not find API key, please add an environment variable"
-                    f" `{env_key}` which contains it, or pass"
-                    f" api_key as a named parameter."
-                )
-            )
-        return api_key_found
-    else:
-        return SecretStr(api_key)
+import re
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    AsyncIterator,
+    Callable,
+    Concatenate,
+    Iterable,
+    Iterator,
+    Literal,
+    Optional,
+    ParamSpec,
+    Self,
+    Sequence,
+    Type,
+    TypeAlias,
+    TypedDict,
+    TypeVar,
+    overload,
+)
+from langchain_core.language_models.base import LanguageModelInput
+from langchain_core.language_models.chat_models import BaseChatModel
+from langchain_core.runnables.base import Runnable
+from langchain_core.runnables.config import RunnableConfig
+from langchain_core.utils.utils import secret_from_env
+from pydantic import BaseModel, Field, SecretStr
+from .constants import (
+    DEFAULT_ANTHROPIC_MODEL,
+    DEFAULT_GOOGLE_MODEL,
+    DEFAULT_OPENAI_MODEL,
+    DEFAULT_OPENROUTER_MODEL,
+    DEFAULT_XAI_MODEL,
+)
+from .messages import AIMessage, BaseMessage, HumanMessage, UsageMetadata
+from .utils.code_agent import CodeExecutionResult, FunctionSignature, augment_prompt_for_toolcall
+if TYPE_CHECKING:
+    from instructor import Partial  # pyright: ignore[reportMissingTypeStubs]
+    from langchain_experimental.tools.python.tool import PythonAstREPLTool
+P = ParamSpec("P")
+PydanticModelT = TypeVar("PydanticModelT", bound=BaseModel)
+StructuredOutputType: TypeAlias = dict[object, object] | BaseModel
+DEFAULT_IMAGE_DESCRIPTION_INSTRUCTION = "Provide a detailed description of all visible elements in the image, summarizing key details in a few clear sentences."
+DEFAULT_CODE_GENERATION_PROMPT = (
+    "You are utilizing a Python code execution tool now.\n"
+    "Your goal is to generate Python code that solves the task efficiently and appends both the code and its output to your context memory.\n"
+    "\n"
+    "To optimize tool efficiency, follow these guidelines:\n"
+    "- Write concise, efficient code that directly serves the intended purpose.\n"
+    "- Avoid unnecessary operations (e.g., excessive loops, recursion, or heavy computations).\n"
+    "- Handle potential errors gracefully (e.g., using try-except blocks).\n"
+    "\n"
+    "Return your response strictly in the following JSON format:\n"
+    '{\n  "code": "<your_python_code_here>"\n}\n\n'
+)
+DEFAULT_FUNCTION_REFERENCE_PREFIX_PROMPT = (
+    "Below functions are included in global scope and can be used in your code.\n"
+    "Do not try to redefine the function(s).\n"
+    "You don't have to force yourself to use these tools - use them only when you need to.\n"
+)
+DEFAULT_FUNCTION_REFERENCE_SEPARATOR = "\n---\n"  # Separator to distinguish different function references
+PYTHON_CODE_PATTERN: re.Pattern[str] = re.compile(r"```(?:python\s*\n)?(.*?)```", re.DOTALL)
+class FactoryOption(TypedDict, total=False):
+    structured_output_kwargs: dict[str, object]
+    api_key: str
+    kwargs: dict[str, Any]
+Factory: TypeAlias = Callable[Concatenate[Type[PydanticModelT], P], PydanticModelT]
+FACTORY_REGISTRY: dict[str, Factory[..., ...]] = {}
+def register_factory(impl: Factory[PydanticModelT, P]):
+    def wrapper(cls: Type[PydanticModelT], *args: P.args, **kwargs: P.kwargs) -> PydanticModelT:
+        return impl(cls, *args, **kwargs)
+    FACTORY_REGISTRY[impl.__name__] = wrapper
+    return wrapper
+class Chatterer(BaseModel):
+    """Language model for generating text from a given input."""
+    client: BaseChatModel
+    structured_output_kwargs: dict[str, Any] = Field(default_factory=dict)
+    @classmethod
+    def from_provider(
+        cls, provider_and_model: str, option: Optional[FactoryOption] = {"structured_output_kwargs": {"strict": True}}
+    ) -> Self:
+        backend, model = provider_and_model.split(":", 1)
+        if func := FACTORY_REGISTRY.get(backend):
+            return func(cls, model, option)
+        else:
+            raise ValueError(
+                f"Unsupported provider: {backend}. Supported providers are: {', '.join(FACTORY_REGISTRY.keys())}."
+            )
+    @classmethod
+    @register_factory
+    def openai(
+        cls, model: str = DEFAULT_OPENAI_MODEL, option: FactoryOption = {"structured_output_kwargs": {"strict": True}}
+    ) -> Self:
+        from langchain_openai import ChatOpenAI
+        return cls(
+            client=ChatOpenAI(
+                model=model,
+                api_key=_get_api_key(api_key=option.get("api_key"), env_key="OPENAI_API_KEY", raise_if_none=False),
+                **option.get("kwargs", {}),
+            ),
+            structured_output_kwargs=option.get("structured_output_kwargs", {}),
+        )
+    @classmethod
+    @register_factory
+    def anthropic(cls, model: str = DEFAULT_ANTHROPIC_MODEL, option: FactoryOption = {}) -> Self:
+        from langchain_anthropic import ChatAnthropic
+        return cls(
+            client=ChatAnthropic(
+                model_name=model,
+                api_key=_get_api_key(api_key=option.get("api_key"), env_key="ANTHROPIC_API_KEY", raise_if_none=True),
+                **option.get("kwargs", {}),
+            ),
+            structured_output_kwargs=option.get("structured_output_kwargs", {}),
+        )
+    @classmethod
+    @register_factory
+    def google(cls, model: str = DEFAULT_GOOGLE_MODEL, option: FactoryOption = {}) -> Self:
+        from langchain_google_genai import ChatGoogleGenerativeAI
+        return cls(
+            client=ChatGoogleGenerativeAI(
+                model=model,
+                api_key=_get_api_key(api_key=option.get("api_key"), env_key="GOOGLE_API_KEY", raise_if_none=False),
+                **option.get("kwargs", {}),
+            ),
+            structured_output_kwargs=option.get("structured_output_kwargs", {}),
+        )
+    @classmethod
+    @register_factory
+    def ollama(cls, model: str, option: FactoryOption = {}) -> Self:
+        from langchain_ollama import ChatOllama
+        return cls(
+            client=ChatOllama(
+                model=model,
+                **option.get("kwargs", {}),
+            ),
+            structured_output_kwargs=option.get("structured_output_kwargs", {}),
+        )
+    @classmethod
+    @register_factory
+    def open_router(cls, model: str = DEFAULT_OPENROUTER_MODEL, option: FactoryOption = {}) -> Self:
+        from langchain_openai import ChatOpenAI
+        return cls(
+            client=ChatOpenAI(
+                model=model,
+                base_url="https://openrouter.ai/api/v1",
+                api_key=_get_api_key(api_key=option.get("api_key"), env_key="OPENROUTER_API_KEY", raise_if_none=False),
+                **option.get("kwargs", {}),
+            ),
+            structured_output_kwargs=option.get("structured_output_kwargs", {}),
+        )
+    @classmethod
+    @register_factory
+    def xai(cls, model: str = DEFAULT_XAI_MODEL, option: FactoryOption = {}) -> Self:
+        from langchain_openai import ChatOpenAI
+        return cls(
+            client=ChatOpenAI(
+                model=model,
+                base_url="https://api.x.ai/v1",
+                api_key=_get_api_key(api_key=option.get("api_key"), env_key="XAI_API_KEY", raise_if_none=False),
+                **option.get("kwargs", {}),
+            ),
+            structured_output_kwargs=option.get("structured_output_kwargs", {}),
+        )
+    @property
+    def invoke(self):
+        return self.client.invoke
+    @property
+    def ainvoke(self):
+        return self.client.ainvoke
+    @property
+    def stream(self):
+        return self.client.stream
+    @property
+    def astream(self):
+        return self.client.astream
+    @property
+    def bind_tools(self):  # pyright: ignore[reportUnknownParameterType]
+        return self.client.bind_tools  # pyright: ignore[reportUnknownParameterType, reportUnknownVariableType, reportUnknownMemberType]
+    def __getattr__(self, name: str) -> Any:
+        return getattr(self.client, name)
+    @overload
+    def __call__(
+        self,
+        messages: LanguageModelInput,
+        response_model: Type[PydanticModelT],
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> PydanticModelT: ...
+    @overload
+    def __call__(
+        self,
+        messages: LanguageModelInput,
+        response_model: None = None,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> str: ...
+    def __call__(
+        self,
+        messages: LanguageModelInput,
+        response_model: Optional[Type[PydanticModelT]] = None,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> str | PydanticModelT:
+        if response_model:
+            return self.generate_pydantic(response_model, messages, config, stop, **kwargs)
+        return self.client.invoke(input=messages, config=config, stop=stop, **kwargs).text()
+    def generate(
+        self,
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> str:
+        return self.client.invoke(input=messages, config=config, stop=stop, **kwargs).text()
+    async def agenerate(
+        self,
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> str:
+        return (await self.client.ainvoke(input=messages, config=config, stop=stop, **kwargs)).text()
+    def generate_stream(
+        self,
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> Iterator[str]:
+        for chunk in self.client.stream(input=messages, config=config, stop=stop, **kwargs):
+            yield chunk.text()
+    async def agenerate_stream(
+        self,
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> AsyncIterator[str]:
+        async for chunk in self.client.astream(input=messages, config=config, stop=stop, **kwargs):
+            yield chunk.text()
+    def generate_pydantic(
+        self,
+        response_model: Type[PydanticModelT],
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> PydanticModelT:
+        result: StructuredOutputType = _with_structured_output(
+            client=self.client,
+            response_model=response_model,
+            structured_output_kwargs=self.structured_output_kwargs,
+        ).invoke(input=messages, config=config, stop=stop, **kwargs)
+        if isinstance(result, response_model):
+            return result
+        else:
+            return response_model.model_validate(result)
+    async def agenerate_pydantic(
+        self,
+        response_model: Type[PydanticModelT],
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> PydanticModelT:
+        result: StructuredOutputType = await _with_structured_output(
+            client=self.client,
+            response_model=response_model,
+            structured_output_kwargs=self.structured_output_kwargs,
+        ).ainvoke(input=messages, config=config, stop=stop, **kwargs)
+        if isinstance(result, response_model):
+            return result
+        else:
+            return response_model.model_validate(result)
+    def generate_pydantic_stream(
+        self,
+        response_model: Type[PydanticModelT],
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> Iterator[PydanticModelT]:
+        try:
+            import instructor  # pyright: ignore[reportMissingTypeStubs]
+        except ImportError:
+            raise ImportError("Please install `instructor` with `pip install instructor` to use this feature.")
+        partial_response_model = instructor.Partial[response_model]
+        for chunk in _with_structured_output(
+            client=self.client,
+            response_model=partial_response_model,
+            structured_output_kwargs=self.structured_output_kwargs,
+        ).stream(input=messages, config=config, stop=stop, **kwargs):
+            yield response_model.model_validate(chunk)
+    async def agenerate_pydantic_stream(
+        self,
+        response_model: Type[PydanticModelT],
+        messages: LanguageModelInput,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> AsyncIterator[PydanticModelT]:
+        try:
+            import instructor  # pyright: ignore[reportMissingTypeStubs]
+        except ImportError:
+            raise ImportError("Please install `instructor` with `pip install instructor` to use this feature.")
+        partial_response_model = instructor.Partial[response_model]
+        async for chunk in _with_structured_output(
+            client=self.client,
+            response_model=partial_response_model,
+            structured_output_kwargs=self.structured_output_kwargs,
+        ).astream(input=messages, config=config, stop=stop, **kwargs):
+            yield response_model.model_validate(chunk)
+    def describe_image(self, image_url: str, instruction: str = DEFAULT_IMAGE_DESCRIPTION_INSTRUCTION) -> str:
+        """
+        Create a detailed description of an image using the Vision Language Model.
+        - image_url: Image URL to describe
+        """
+        return self.generate([
+            HumanMessage(
+                content=[
+                    {"type": "text", "text": instruction},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                ],
+            )
+        ])
+    async def adescribe_image(self, image_url: str, instruction: str = DEFAULT_IMAGE_DESCRIPTION_INSTRUCTION) -> str:
+        """
+        Create a detailed description of an image using the Vision Language Model asynchronously.
+        - image_url: Image URL to describe
+        """
+        return await self.agenerate([
+            HumanMessage(
+                content=[
+                    {"type": "text", "text": instruction},
+                    {"type": "image_url", "image_url": {"url": image_url}},
+                ],
+            )
+        ])
+    def get_approximate_token_count(self, message: BaseMessage) -> int:
+        return self.client.get_num_tokens_from_messages([message])  # pyright: ignore[reportUnknownMemberType]
+    def get_usage_metadata(self, message: BaseMessage) -> UsageMetadata:
+        if isinstance(message, AIMessage):
+            usage_metadata = message.usage_metadata
+            if usage_metadata is not None:
+                input_tokens = usage_metadata["input_tokens"]
+                output_tokens = usage_metadata["output_tokens"]
+                return {
+                    "input_tokens": input_tokens,
+                    "output_tokens": output_tokens,
+                    "total_tokens": input_tokens + output_tokens,
+                }
+            else:
+                approx_tokens = self.get_approximate_token_count(message)
+                return {"input_tokens": 0, "output_tokens": approx_tokens, "total_tokens": approx_tokens}
+        else:
+            approx_tokens = self.get_approximate_token_count(message)
+            return {
+                "input_tokens": approx_tokens,
+                "output_tokens": 0,
+                "total_tokens": approx_tokens,
+            }
+    def exec(
+        self,
+        messages: LanguageModelInput,
+        repl_tool: Optional["PythonAstREPLTool"] = None,
+        prompt_for_code_invoke: Optional[str] = DEFAULT_CODE_GENERATION_PROMPT,
+        function_signatures: Optional[FunctionSignature | Iterable[FunctionSignature]] = None,
+        function_reference_prefix: Optional[str] = DEFAULT_FUNCTION_REFERENCE_PREFIX_PROMPT,
+        function_reference_seperator: str = DEFAULT_FUNCTION_REFERENCE_SEPARATOR,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> CodeExecutionResult:
+        if not function_signatures:
+            function_signatures = []
+        elif isinstance(function_signatures, FunctionSignature):
+            function_signatures = [function_signatures]
+        messages = augment_prompt_for_toolcall(
+            function_signatures=function_signatures,
+            messages=messages,
+            prompt_for_code_invoke=prompt_for_code_invoke,
+            function_reference_prefix=function_reference_prefix,
+            function_reference_seperator=function_reference_seperator,
+        )
+        code_obj: PythonCodeToExecute = self.generate_pydantic(
+            response_model=PythonCodeToExecute, messages=messages, config=config, stop=stop, **kwargs
+        )
+        return CodeExecutionResult.from_code(
+            code=code_obj.code,
+            config=config,
+            repl_tool=repl_tool,
+            function_signatures=function_signatures,
+            **kwargs,
+        )
+    @property
+    def invoke_code_execution(self) -> Callable[..., CodeExecutionResult]:
+        """Alias for exec method for backward compatibility."""
+        return self.exec
+    async def aexec(
+        self,
+        messages: LanguageModelInput,
+        repl_tool: Optional["PythonAstREPLTool"] = None,
+        prompt_for_code_invoke: Optional[str] = DEFAULT_CODE_GENERATION_PROMPT,
+        additional_callables: Optional[Callable[..., object] | Sequence[Callable[..., object]]] = None,
+        function_reference_prefix: Optional[str] = DEFAULT_FUNCTION_REFERENCE_PREFIX_PROMPT,
+        function_reference_seperator: str = DEFAULT_FUNCTION_REFERENCE_SEPARATOR,
+        config: Optional[RunnableConfig] = None,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> CodeExecutionResult:
+        function_signatures: list[FunctionSignature] = FunctionSignature.from_callable(additional_callables)
+        messages = augment_prompt_for_toolcall(
+            function_signatures=function_signatures,
+            messages=messages,
+            prompt_for_code_invoke=prompt_for_code_invoke,
+            function_reference_prefix=function_reference_prefix,
+            function_reference_seperator=function_reference_seperator,
+        )
+        code_obj: PythonCodeToExecute = await self.agenerate_pydantic(
+            response_model=PythonCodeToExecute, messages=messages, config=config, stop=stop, **kwargs
+        )
+        return await CodeExecutionResult.afrom_code(
+            code=code_obj.code,
+            config=config,
+            repl_tool=repl_tool,
+            function_signatures=function_signatures,
+            **kwargs,
+        )
+    @property
+    def ainvoke_code_execution(self):
+        """Alias for aexec method for backward compatibility."""
+        return self.aexec
+class PythonCodeToExecute(BaseModel):
+    code: str = Field(description="Python code to execute")
+    def model_post_init(self, context: object) -> None:
+        super().model_post_init(context)
+        codes: list[str] = []
+        for match in PYTHON_CODE_PATTERN.finditer(self.code):
+            codes.append(match.group(1))
+        if codes:
+            self.code = "\n".join(codes)
+def _with_structured_output(
+    client: BaseChatModel,
+    response_model: Type["PydanticModelT | Partial[PydanticModelT]"],
+    structured_output_kwargs: dict[str, Any],
+) -> Runnable[LanguageModelInput, dict[object, object] | BaseModel]:
+    return client.with_structured_output(schema=response_model, **structured_output_kwargs)  # pyright: ignore[reportUnknownVariableType, reportUnknownMemberType]
+@overload
+def _get_api_key(api_key: Optional[str], env_key: str, raise_if_none: Literal[True]) -> SecretStr: ...
+@overload
+def _get_api_key(api_key: Optional[str], env_key: str, raise_if_none: Literal[False]) -> Optional[SecretStr]: ...
+def _get_api_key(api_key: Optional[str], env_key: str, raise_if_none: bool) -> Optional[SecretStr]:
+    if api_key is None:
+        api_key_found: SecretStr | None = secret_from_env(env_key, default=None)()
+        if raise_if_none and api_key_found is None:
+            raise ValueError(
+                (
+                    f"Did not find API key, please add an environment variable"
+                    f" `{env_key}` which contains it, or pass"
+                    f" api_key as a named parameter."
+                )
+            )
+        return api_key_found
+    else:
+        return SecretStr(api_key)

chatterer 0.1.26__py3-none-any.whl → 0.1.27__py3-none-any.whl

chatterer 0.1.26py3-none-any.whl → 0.1.27py3-none-any.whl