PyPI - langroid - Versions diffs - 0.16.5__py3-none-any.whl → 0.16.7__py3-none-any.whl - Mend

langroid 0.16.5py3-none-any.whl → 0.16.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (80) hide show

langroid/agent/md_tool_message_grammar.py +455 -0
langroid/agent/tools/code_file_tool_parse.py +150 -0
langroid/agent/tools/code_file_tool_pyparsing.py +194 -0
langroid/agent/tools/code_file_tool_pyparsing2.py +199 -0
langroid/agent/tools/formatted_model_custom.py +150 -0
langroid/agent/tools/formatted_model_custom2.py +168 -0
langroid/agent/tools/formatted_model_custom3.py +279 -0
langroid/agent/tools/formatted_model_custom4.py +395 -0
langroid/agent/tools/formatted_model_jinja.py +133 -0
langroid/agent/tools/formatted_model_jinja.py-e +122 -0
langroid/agent/tools/formatted_model_jinja2.py +145 -0
langroid/agent/tools/formatted_model_jinja2.py-e +135 -0
langroid/agent/tools/formatted_model_lark.py +0 -0
langroid/agent/tools/formatted_model_lark2.py +168 -0
langroid/agent/tools/formatted_model_parse.py +105 -0
langroid/agent/tools/formatted_model_parse.py-e +98 -0
langroid/agent/tools/formatted_model_parse2.py +113 -0
langroid/agent/tools/formatted_model_parse2.py-e +109 -0
langroid/agent/tools/formatted_model_parse3.py +114 -0
langroid/agent/tools/formatted_model_parse3.py-e +110 -0
langroid/agent/tools/formatted_model_parsimon.py +194 -0
langroid/agent/tools/formatted_model_parsimon.py-e +186 -0
langroid/agent/tools/formatted_model_pyparsing.py +169 -0
langroid/agent/tools/formatted_model_pyparsing.py-e +149 -0
langroid/agent/tools/formatted_model_pyparsing2.py +159 -0
langroid/agent/tools/formatted_model_pyparsing2.py-e +143 -0
langroid/agent/tools/formatted_model_pyparsing3.py +133 -0
langroid/agent/tools/formatted_model_pyparsing3.py-e +121 -0
langroid/agent/tools/formatted_model_pyparsing4.py +213 -0
langroid/agent/tools/formatted_model_pyparsing4.py-e +176 -0
langroid/agent/tools/formatted_model_pyparsing5.py +173 -0
langroid/agent/tools/formatted_model_pyparsing5.py-e +142 -0
langroid/agent/tools/formatted_model_regex.py +246 -0
langroid/agent/tools/formatted_model_regex.py-e +248 -0
langroid/agent/tools/formatted_model_regex2.py +250 -0
langroid/agent/tools/formatted_model_regex2.py-e +253 -0
langroid/agent/tools/formatted_model_tatsu.py +172 -0
langroid/agent/tools/formatted_model_tatsu.py-e +160 -0
langroid/agent/tools/formatted_model_template.py +217 -0
langroid/agent/tools/formatted_model_template.py-e +200 -0
langroid/agent/tools/formatted_model_xml.py +178 -0
langroid/agent/tools/formatted_model_xml2.py +178 -0
langroid/agent/tools/formatted_model_xml3.py +132 -0
langroid/agent/tools/formatted_model_xml4.py +130 -0
langroid/agent/tools/formatted_model_xml5.py +130 -0
langroid/agent/tools/formatted_model_xml6.py +113 -0
langroid/agent/tools/formatted_model_xml7.py +117 -0
langroid/agent/tools/formatted_model_xml8.py +164 -0
langroid/agent/tools/generic_tool.py +165 -0
langroid/agent/tools/generic_tool_tatsu.py +275 -0
langroid/agent/tools/grammar_based_model.py +132 -0
langroid/agent/tools/grammar_based_model.py-e +128 -0
langroid/agent/tools/grammar_based_model_lark.py +156 -0
langroid/agent/tools/grammar_based_model_lark.py-e +153 -0
langroid/agent/tools/grammar_based_model_parse.py +86 -0
langroid/agent/tools/grammar_based_model_parse.py-e +80 -0
langroid/agent/tools/grammar_based_model_parsimonious.py +129 -0
langroid/agent/tools/grammar_based_model_parsimonious.py-e +120 -0
langroid/agent/tools/grammar_based_model_pyparsing.py +105 -0
langroid/agent/tools/grammar_based_model_pyparsing.py-e +103 -0
langroid/agent/tools/grammar_based_model_regex.py +139 -0
langroid/agent/tools/grammar_based_model_regex.py-e +130 -0
langroid/agent/tools/grammar_based_model_regex2.py +124 -0
langroid/agent/tools/grammar_based_model_regex2.py-e +116 -0
langroid/agent/tools/grammar_based_model_tatsu.py +80 -0
langroid/agent/tools/grammar_based_model_tatsu.py-e +77 -0
langroid/agent/tools/lark_earley_example.py +135 -0
langroid/agent/tools/lark_earley_example.py-e +117 -0
langroid/agent/tools/lark_example.py +72 -0
langroid/agent/tools/parse_example.py +76 -0
langroid/agent/tools/parse_example2.py +87 -0
langroid/agent/tools/parse_example3.py +42 -0
langroid/agent/tools/parse_test.py +791 -0
langroid/agent/xml_tool_message.py +106 -0
langroid/language_models/openai_gpt.py +6 -1
{langroid-0.16.5.dist-info → langroid-0.16.7.dist-info}/METADATA +1 -1
{langroid-0.16.5.dist-info → langroid-0.16.7.dist-info}/RECORD +80 -6
pyproject.toml +1 -1
{langroid-0.16.5.dist-info → langroid-0.16.7.dist-info}/LICENSE +0 -0
{langroid-0.16.5.dist-info → langroid-0.16.7.dist-info}/WHEEL +0 -0

langroid/agent/tools/formatted_model_regex.py ADDED Viewed

@@ -0,0 +1,246 @@
+import re
+from abc import ABC, abstractmethod
+from typing import Dict, Type, TypeVar
+from langroid.pydantic_v1 import BaseModel
+T = TypeVar("T", bound="FormattingModel")
+class FormattingModel(BaseModel, ABC):
+    @classmethod
+    @abstractmethod
+    def format_spec(cls) -> str:
+        pass
+    @classmethod
+    @abstractmethod
+    def start_token(cls) -> str:
+        pass
+    @classmethod
+    @abstractmethod
+    def end_token(cls) -> str:
+        pass
+    @classmethod
+    @abstractmethod
+    def field_mappings(cls) -> Dict[str, str]:
+        pass
+    @classmethod
+    def parse(cls: Type[T], text: str) -> T:
+        # Remove start and end tokens
+        content = text.strip()[len(cls.start_token()) : -len(cls.end_token())].strip()
+        # Create regex pattern from format_spec
+        pattern = cls.format_spec()
+        for field, token in cls.field_mappings().items():
+            pattern = pattern.replace(token, f"(?P<{field}>.*?)")
+        # Extract data using regex
+        match = re.match(pattern, content, re.DOTALL)
+        if not match:
+            raise ValueError("Invalid format")
+        # Create instance with extracted data
+        data = {field: match.group(field).strip() for field in cls.field_mappings()}
+        return cls(**data)
+    def generate(self) -> str:
+        # Start with the format spec
+        result = self.format_spec()
+        # Replace tokens with actual values
+        for field, token in self.field_mappings().items():
+            value = getattr(self, field)
+            result = result.replace(token, str(value))
+        # Wrap with start and end tokens
+        return f"{self.start_token()}\n{result}\n{self.end_token()}"
+class MyFormattedModel(FormattingModel):
+    name: str
+    age: int
+    city: str
+    @classmethod
+    def format_spec(cls) -> str:
+        return "name: {NAME}\n{AGE} is the age\nlives in {CITY}"
+    @classmethod
+    def start_token(cls) -> str:
+        return "<format>"
+    @classmethod
+    def end_token(cls) -> str:
+        return "</format>"
+    @classmethod
+    def field_mappings(cls) -> Dict[str, str]:
+        return {"name": "{NAME}", "age": "{AGE}", "city": "{CITY}"}
+if __name__ == "__main__":
+    # Test object to string
+    model = MyFormattedModel(name="John", age=30, city="Tokyo")
+    generated = model.generate()
+    print("Generated string:")
+    print(generated)
+    print()
+    # Test string to object
+    parsed = MyFormattedModel.parse(generated)
+    print("Parsed object:")
+    print(parsed)
+    print()
+    # Test round-trip
+    print("Round-trip test:")
+    print("Original == Parsed:", model == parsed)
+    # Test with different values
+    another_model = MyFormattedModel(name="Alice", age=25, city="New York")
+    another_generated = another_model.generate()
+    print("\nAnother generated string:")
+    print(another_generated)
+    print()
+    another_parsed = MyFormattedModel.parse(another_generated)
+    print("Another parsed object:")
+    print(another_parsed)
+    print("Another Original == Another Parsed:", another_model == another_parsed)
+    # code file model
+    class CodeFileModel(FormattingModel):
+        language: str
+        file_path: str
+        code: str
+        @classmethod
+        def format_spec(cls) -> str:
+            return "code_file_model\nfile_path: {FILE_PATH}\n```{LANGUAGE}\n{CODE}\n```"
+        @classmethod
+        def start_token(cls) -> str:
+            return "<format>"
+        @classmethod
+        def end_token(cls) -> str:
+            return "</format>"
+        @classmethod
+        def field_mappings(cls) -> Dict[str, str]:
+            return {
+                "file_path": "{FILE_PATH}",
+                "language": "{LANGUAGE}",
+                "code": "{CODE}",
+            }
+    print("\nTesting CodeFileModel:")
+    code_model = CodeFileModel(
+        language="python",
+        file_path="src/main.py",
+        code='def hello():\n    print("Hello, World!")',
+    )
+    code_generated = code_model.generate()
+    print("Generated CodeFileModel string:")
+    print(code_generated)
+    print()
+    code_parsed = CodeFileModel.parse(code_generated)
+    print("Parsed CodeFileModel object:")
+    print(code_parsed)
+    print()
+    print("CodeFileModel Round-trip test:")
+    print("Original == Parsed:", code_model == code_parsed)
+    # tolerant format
+    #
+    class CodeFileModel(FormattingModel):
+        language: str
+        file_path: str
+        code: str
+        @classmethod
+        def format_spec(cls) -> str:
+            return (
+                r"code_file_model\s*\n"
+                r"file_path:\s*{FILE_PATH}\s*\n"
+                r"```\s*{LANGUAGE}\s*\n"
+                r"{CODE}\s*"
+                r"```"
+            )
+        @classmethod
+        def start_token(cls) -> str:
+            return "<format>"
+        @classmethod
+        def end_token(cls) -> str:
+            return "</format>"
+        @classmethod
+        def field_mappings(cls) -> Dict[str, str]:
+            return {
+                "file_path": "{FILE_PATH}",
+                "language": "{LANGUAGE}",
+                "code": "{CODE}",
+            }
+    print("\nTesting CodeFileModel with various whitespace variations:")
+    test_strings = [
+        # Standard format
+        """<format>
+code_file_model
+file_path: src/main.py
+```python
+def hello():
+    print("Hello, World!")
+```
+</format>""",
+        # Extra whitespace
+        """<format>
+code_file_model
+file_path:     src/main.py
+```   python
+def hello():
+    print("Hello, World!")
+```
+</format>""",
+        # Extra newlines
+        """<format>
+code_file_model
+file_path: src/main.py
+```python
+def hello():
+    print("Hello, World!")
+```
+</format>""",
+    ]
+    for i, test_string in enumerate(test_strings, 1):
+        print(f"\nTest {i}:")
+        print("Input string:")
+        print(test_string)
+        parsed = CodeFileModel.parse(test_string)
+        print("\nParsed object:")
+        print(parsed)
+        regenerated = parsed.generate()
+        print("\nRegenerated string:")
+        print(regenerated)
+        reparsed = CodeFileModel.parse(regenerated)
+        print("\nRound-trip test:")
+        print("Original parsed == Reparsed:", parsed == reparsed)
+        print("-" * 50)

langroid/agent/tools/formatted_model_regex.py-e ADDED Viewed

@@ -0,0 +1,248 @@
+from pydantic import BaseModel
+from abc import ABC, abstractmethod
+import re
+from typing import Dict, Type, TypeVar
+T = TypeVar('T', bound='FormattingModel')
+class FormattingModel(BaseModel, ABC):
+    @classmethod
+    @abstractmethod
+    def format_spec(cls) -> str:
+        pass
+    @classmethod
+    @abstractmethod
+    def start_token(cls) -> str:
+        pass
+    @classmethod
+    @abstractmethod
+    def end_token(cls) -> str:
+        pass
+    @classmethod
+    @abstractmethod
+    def field_mappings(cls) -> Dict[str, str]:
+        pass
+    @classmethod
+    def parse(cls: Type[T], text: str) -> T:
+        # Remove start and end tokens
+        content = text.strip()[len(cls.start_token()):-len(cls.end_token())].strip()
+        # Create regex pattern from format_spec
+        pattern = cls.format_spec()
+        for field, token in cls.field_mappings().items():
+            pattern = pattern.replace(token, f"(?P<{field}>.*?)")
+        # Extract data using regex
+        match = re.match(pattern, content, re.DOTALL)
+        if not match:
+            raise ValueError("Invalid format")
+        # Create instance with extracted data
+        data = {field: match.group(field).strip() for field in cls.field_mappings()}
+        return cls(**data)
+    def generate(self) -> str:
+        # Start with the format spec
+        result = self.format_spec()
+        # Replace tokens with actual values
+        for field, token in self.field_mappings().items():
+            value = getattr(self, field)
+            result = result.replace(token, str(value))
+        # Wrap with start and end tokens
+        return f"{self.start_token()}\n{result}\n{self.end_token()}"
+class MyFormattedModel(FormattingModel):
+    name: str
+    age: int
+    city: str
+    @classmethod
+    def format_spec(cls) -> str:
+        return "name: {NAME}\n{AGE} is the age\nlives in {CITY}"
+    @classmethod
+    def start_token(cls) -> str:
+        return "<format>"
+    @classmethod
+    def end_token(cls) -> str:
+        return "</format>"
+    @classmethod
+    def field_mappings(cls) -> Dict[str, str]:
+        return {
+            "name": "{NAME}",
+            "age": "{AGE}",
+            "city": "{CITY}"
+        }
+if __name__ == "__main__":
+    # Test object to string
+    model = MyFormattedModel(name="John", age=30, city="Tokyo")
+    generated = model.generate()
+    print("Generated string:")
+    print(generated)
+    print()
+    # Test string to object
+    parsed = MyFormattedModel.parse(generated)
+    print("Parsed object:")
+    print(parsed)
+    print()
+    # Test round-trip
+    print("Round-trip test:")
+    print("Original == Parsed:", model == parsed)
+    # Test with different values
+    another_model = MyFormattedModel(name="Alice", age=25, city="New York")
+    another_generated = another_model.generate()
+    print("\nAnother generated string:")
+    print(another_generated)
+    print()
+    another_parsed = MyFormattedModel.parse(another_generated)
+    print("Another parsed object:")
+    print(another_parsed)
+    print("Another Original == Another Parsed:", another_model == another_parsed)
+    # code file model
+    class CodeFileModel(FormattingModel):
+        language: str
+        file_path: str
+        code: str
+        @classmethod
+        def format_spec(cls) -> str:
+            return "code_file_model\nfile_path: {FILE_PATH}\n```{LANGUAGE}\n{CODE}\n```"
+        @classmethod
+        def start_token(cls) -> str:
+            return "<format>"
+        @classmethod
+        def end_token(cls) -> str:
+            return "</format>"
+        @classmethod
+        def field_mappings(cls) -> Dict[str, str]:
+            return {
+                "file_path": "{FILE_PATH}",
+                "language": "{LANGUAGE}",
+                "code": "{CODE}"
+            }
+    print("\nTesting CodeFileModel:")
+    code_model = CodeFileModel(
+        language="python",
+        file_path="src/main.py",
+        code="def hello():\n    print(\"Hello, World!\")"
+    )
+    code_generated = code_model.generate()
+    print("Generated CodeFileModel string:")
+    print(code_generated)
+    print()
+    code_parsed = CodeFileModel.parse(code_generated)
+    print("Parsed CodeFileModel object:")
+    print(code_parsed)
+    print()
+    print("CodeFileModel Round-trip test:")
+    print("Original == Parsed:", code_model == code_parsed)
+    # tolerant format
+    #
+    class CodeFileModel(FormattingModel):
+        language: str
+        file_path: str
+        code: str
+        @classmethod
+        def format_spec(cls) -> str:
+            return (
+                r"code_file_model\s*\n"
+                r"file_path:\s*{FILE_PATH}\s*\n"
+                r"```\s*{LANGUAGE}\s*\n"
+                r"{CODE}\s*"
+                r"```"
+            )
+        @classmethod
+        def start_token(cls) -> str:
+            return "<format>"
+        @classmethod
+        def end_token(cls) -> str:
+            return "</format>"
+        @classmethod
+        def field_mappings(cls) -> Dict[str, str]:
+            return {
+                "file_path": "{FILE_PATH}",
+                "language": "{LANGUAGE}",
+                "code": "{CODE}"
+            }
+    print("\nTesting CodeFileModel with various whitespace variations:")
+    test_strings = [
+        # Standard format
+        """<format>
+code_file_model
+file_path: src/main.py
+```python
+def hello():
+    print("Hello, World!")
+```
+</format>""",
+        # Extra whitespace
+        """<format>
+code_file_model
+file_path:     src/main.py
+```   python
+def hello():
+    print("Hello, World!")
+```
+</format>""",
+        # Extra newlines
+        """<format>
+code_file_model
+file_path: src/main.py
+```python
+def hello():
+    print("Hello, World!")
+```
+</format>"""
+    ]
+    for i, test_string in enumerate(test_strings, 1):
+        print(f"\nTest {i}:")
+        print("Input string:")
+        print(test_string)
+        parsed = CodeFileModel.parse(test_string)
+        print("\nParsed object:")
+        print(parsed)
+        regenerated = parsed.generate()
+        print("\nRegenerated string:")
+        print(regenerated)
+        reparsed = CodeFileModel.parse(regenerated)
+        print("\nRound-trip test:")
+        print("Original parsed == Reparsed:", parsed == reparsed)
+        print("-" * 50)

langroid 0.16.5__py3-none-any.whl → 0.16.7__py3-none-any.whl

langroid 0.16.5py3-none-any.whl → 0.16.7py3-none-any.whl