PyPI - graphiti-core - Versions diffs - 0.4.3__tar.gz → 0.5.0__tar.gz - Mend

graphiti-core 0.4.3tar.gz → 0.5.0tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of graphiti-core might be problematic. Click here for more details.

Files changed (61) hide show

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/PKG-INFO RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: graphiti-core
-Version: 0.4.3
+Version: 0.5.0
 Summary: A temporal graph building library
 License: Apache-2.0
 Author: Paul Paliychuk

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/cross_encoder/client.py RENAMED Viewed

@@ -34,7 +34,7 @@ class CrossEncoderClient(ABC):
             passages (list[str]): A list of passages to rank.
         Returns:
-            List[tuple[str, float]]: A list of tuples containing the passage and its score,
+            list[tuple[str, float]]: A list of tuples containing the passage and its score,
                                      sorted in descending order of relevance.
         """
         pass

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/cross_encoder/openai_reranker_client.py RENAMED Viewed

@@ -14,7 +14,6 @@ See the License for the specific language governing permissions and
 limitations under the License.
 """
-import asyncio
 import logging
 from typing import Any
@@ -22,6 +21,7 @@ import openai
 from openai import AsyncOpenAI
 from pydantic import BaseModel
+from ..helpers import semaphore_gather
 from ..llm_client import LLMConfig, RateLimitError
 from ..prompts import Message
 from .client import CrossEncoderClient
@@ -75,7 +75,7 @@ class OpenAIRerankerClient(CrossEncoderClient):
             for passage in passages
         ]
         try:
-            responses = await asyncio.gather(
+            responses = await semaphore_gather(
                 *[
                     self.client.chat.completions.create(
                         model=DEFAULT_MODEL,

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/edges.py RENAMED Viewed

@@ -27,7 +27,7 @@ from typing_extensions import LiteralString
 from graphiti_core.embedder import EmbedderClient
 from graphiti_core.errors import EdgeNotFoundError, GroupsEdgesNotFoundError
-from graphiti_core.helpers import DEFAULT_DATABASE, DEFAULT_PAGE_LIMIT, parse_db_date
+from graphiti_core.helpers import DEFAULT_DATABASE, parse_db_date
 from graphiti_core.models.edges.edge_db_queries import (
     COMMUNITY_EDGE_SAVE,
     ENTITY_EDGE_SAVE,
@@ -142,10 +142,11 @@ class EpisodicEdge(Edge):
         cls,
         driver: AsyncDriver,
         group_ids: list[str],
-        limit: int = DEFAULT_PAGE_LIMIT,
+        limit: int | None = None,
         created_at: datetime | None = None,
     ):
         cursor_query: LiteralString = 'AND e.created_at < $created_at' if created_at else ''
+        limit_query: LiteralString = 'LIMIT $limit' if limit is not None else ''
         records, _, _ = await driver.execute_query(
             """
@@ -161,8 +162,8 @@ class EpisodicEdge(Edge):
             m.uuid AS target_node_uuid,
             e.created_at AS created_at
         ORDER BY e.uuid DESC
-        LIMIT $limit
-        """,
+        """
+            + limit_query,
             group_ids=group_ids,
             created_at=created_at,
             limit=limit,
@@ -294,10 +295,11 @@ class EntityEdge(Edge):
         cls,
         driver: AsyncDriver,
         group_ids: list[str],
-        limit: int = DEFAULT_PAGE_LIMIT,
+        limit: int | None = None,
         created_at: datetime | None = None,
     ):
         cursor_query: LiteralString = 'AND e.created_at < $created_at' if created_at else ''
+        limit_query: LiteralString = 'LIMIT $limit' if limit is not None else ''
         records, _, _ = await driver.execute_query(
             """
@@ -320,8 +322,8 @@ class EntityEdge(Edge):
             e.valid_at AS valid_at,
             e.invalid_at AS invalid_at
         ORDER BY e.uuid DESC
-        LIMIT $limit
-        """,
+        """
+            + limit_query,
             group_ids=group_ids,
             created_at=created_at,
             limit=limit,
@@ -400,10 +402,11 @@ class CommunityEdge(Edge):
         cls,
         driver: AsyncDriver,
         group_ids: list[str],
-        limit: int = DEFAULT_PAGE_LIMIT,
+        limit: int | None = None,
         created_at: datetime | None = None,
     ):
         cursor_query: LiteralString = 'AND e.created_at < $created_at' if created_at else ''
+        limit_query: LiteralString = 'LIMIT $limit' if limit is not None else ''
         records, _, _ = await driver.execute_query(
             """
@@ -419,8 +422,8 @@ class CommunityEdge(Edge):
             m.uuid AS target_node_uuid,
             e.created_at AS created_at
         ORDER BY e.uuid DESC
-        LIMIT $limit
-        """,
+        """
+            + limit_query,
             group_ids=group_ids,
             created_at=created_at,
             limit=limit,

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/graphiti.py RENAMED Viewed

@@ -14,9 +14,8 @@ See the License for the specific language governing permissions and
 limitations under the License.
 """
-import asyncio
 import logging
-from datetime import datetime, timezone
+from datetime import datetime
 from time import time
 from dotenv import load_dotenv
@@ -27,7 +26,7 @@ from graphiti_core.cross_encoder.client import CrossEncoderClient
 from graphiti_core.cross_encoder.openai_reranker_client import OpenAIRerankerClient
 from graphiti_core.edges import EntityEdge, EpisodicEdge
 from graphiti_core.embedder import EmbedderClient, OpenAIEmbedder
-from graphiti_core.helpers import DEFAULT_DATABASE
+from graphiti_core.helpers import DEFAULT_DATABASE, semaphore_gather
 from graphiti_core.llm_client import LLMClient, OpenAIClient
 from graphiti_core.nodes import CommunityNode, EntityNode, EpisodeType, EpisodicNode
 from graphiti_core.search.search import SearchConfig, search
@@ -43,10 +42,6 @@ from graphiti_core.search.search_utils import (
     get_relevant_edges,
     get_relevant_nodes,
 )
-from graphiti_core.utils import (
-    build_episodic_edges,
-    retrieve_episodes,
-)
 from graphiti_core.utils.bulk_utils import (
     RawEpisode,
     add_nodes_and_edges_bulk,
@@ -57,12 +52,14 @@ from graphiti_core.utils.bulk_utils import (
     resolve_edge_pointers,
     retrieve_previous_episodes_bulk,
 )
+from graphiti_core.utils.datetime_utils import utc_now
 from graphiti_core.utils.maintenance.community_operations import (
     build_communities,
     remove_communities,
     update_community,
 )
 from graphiti_core.utils.maintenance.edge_operations import (
+    build_episodic_edges,
     dedupe_extracted_edge,
     extract_edges,
     resolve_edge_contradictions,
@@ -71,6 +68,7 @@ from graphiti_core.utils.maintenance.edge_operations import (
 from graphiti_core.utils.maintenance.graph_data_operations import (
     EPISODE_WINDOW_LEN,
     build_indices_and_constraints,
+    retrieve_episodes,
 )
 from graphiti_core.utils.maintenance.node_operations import (
     extract_nodes,
@@ -313,7 +311,7 @@ class Graphiti:
             start = time()
             entity_edges: list[EntityEdge] = []
-            now = datetime.now(timezone.utc)
+            now = utc_now()
             previous_episodes = await self.retrieve_episodes(
                 reference_time, last_n=RELEVANT_SCHEMA_LIMIT, group_ids=[group_id]
@@ -341,13 +339,13 @@ class Graphiti:
             # Calculate Embeddings
-            await asyncio.gather(
+            await semaphore_gather(
                 *[node.generate_name_embedding(self.embedder) for node in extracted_nodes]
             )
             # Find relevant nodes already in the graph
             existing_nodes_lists: list[list[EntityNode]] = list(
-                await asyncio.gather(
+                await semaphore_gather(
                     *[get_relevant_nodes(self.driver, [node]) for node in extracted_nodes]
                 )
             )
@@ -355,7 +353,7 @@ class Graphiti:
             # Resolve extracted nodes with nodes already in the graph and extract facts
             logger.debug(f'Extracted nodes: {[(n.name, n.uuid) for n in extracted_nodes]}')
-            (mentioned_nodes, uuid_map), extracted_edges = await asyncio.gather(
+            (mentioned_nodes, uuid_map), extracted_edges = await semaphore_gather(
                 resolve_extracted_nodes(
                     self.llm_client,
                     extracted_nodes,
@@ -375,7 +373,7 @@ class Graphiti:
             )
             # calculate embeddings
-            await asyncio.gather(
+            await semaphore_gather(
                 *[
                     edge.generate_embedding(self.embedder)
                     for edge in extracted_edges_with_resolved_pointers
@@ -384,7 +382,7 @@ class Graphiti:
             # Resolve extracted edges with related edges already in the graph
             related_edges_list: list[list[EntityEdge]] = list(
-                await asyncio.gather(
+                await semaphore_gather(
                     *[
                         get_relevant_edges(
                             self.driver,
@@ -405,7 +403,7 @@ class Graphiti:
             )
             existing_source_edges_list: list[list[EntityEdge]] = list(
-                await asyncio.gather(
+                await semaphore_gather(
                     *[
                         get_relevant_edges(
                             self.driver,
@@ -420,7 +418,7 @@ class Graphiti:
             )
             existing_target_edges_list: list[list[EntityEdge]] = list(
-                await asyncio.gather(
+                await semaphore_gather(
                     *[
                         get_relevant_edges(
                             self.driver,
@@ -469,7 +467,7 @@ class Graphiti:
             # Update any communities
             if update_communities:
-                await asyncio.gather(
+                await semaphore_gather(
                     *[
                         update_community(self.driver, self.llm_client, self.embedder, node)
                         for node in nodes
@@ -522,7 +520,7 @@ class Graphiti:
         """
         try:
             start = time()
-            now = datetime.now(timezone.utc)
+            now = utc_now()
             episodes = [
                 EpisodicNode(
@@ -539,7 +537,7 @@ class Graphiti:
             ]
             # Save all the episodes
-            await asyncio.gather(*[episode.save(self.driver) for episode in episodes])
+            await semaphore_gather(*[episode.save(self.driver) for episode in episodes])
             # Get previous episode context for each episode
             episode_pairs = await retrieve_previous_episodes_bulk(self.driver, episodes)
@@ -552,19 +550,19 @@ class Graphiti:
             ) = await extract_nodes_and_edges_bulk(self.llm_client, episode_pairs)
             # Generate embeddings
-            await asyncio.gather(
+            await semaphore_gather(
                 *[node.generate_name_embedding(self.embedder) for node in extracted_nodes],
                 *[edge.generate_embedding(self.embedder) for edge in extracted_edges],
             )
             # Dedupe extracted nodes, compress extracted edges
-            (nodes, uuid_map), extracted_edges_timestamped = await asyncio.gather(
+            (nodes, uuid_map), extracted_edges_timestamped = await semaphore_gather(
                 dedupe_nodes_bulk(self.driver, self.llm_client, extracted_nodes),
                 extract_edge_dates_bulk(self.llm_client, extracted_edges, episode_pairs),
             )
             # save nodes to KG
-            await asyncio.gather(*[node.save(self.driver) for node in nodes])
+            await semaphore_gather(*[node.save(self.driver) for node in nodes])
             # re-map edge pointers so that they don't point to discard dupe nodes
             extracted_edges_with_resolved_pointers: list[EntityEdge] = resolve_edge_pointers(
@@ -575,7 +573,7 @@ class Graphiti:
             )
             # save episodic edges to KG
-            await asyncio.gather(
+            await semaphore_gather(
                 *[edge.save(self.driver) for edge in episodic_edges_with_resolved_pointers]
             )
@@ -588,7 +586,7 @@ class Graphiti:
             # invalidate edges
             # save edges to KG
-            await asyncio.gather(*[edge.save(self.driver) for edge in edges])
+            await semaphore_gather(*[edge.save(self.driver) for edge in edges])
             end = time()
             logger.info(f'Completed add_episode_bulk in {(end - start) * 1000} ms')
@@ -611,12 +609,12 @@ class Graphiti:
             self.driver, self.llm_client, group_ids
         )
-        await asyncio.gather(
+        await semaphore_gather(
             *[node.generate_name_embedding(self.embedder) for node in community_nodes]
         )
-        await asyncio.gather(*[node.save(self.driver) for node in community_nodes])
-        await asyncio.gather(*[edge.save(self.driver) for edge in community_edges])
+        await semaphore_gather(*[node.save(self.driver) for node in community_nodes])
+        await semaphore_gather(*[edge.save(self.driver) for edge in community_edges])
         return community_nodes
@@ -699,7 +697,7 @@ class Graphiti:
     async def get_episode_mentions(self, episode_uuids: list[str]) -> SearchResults:
         episodes = await EpisodicNode.get_by_uuids(self.driver, episode_uuids)
-        edges_list = await asyncio.gather(
+        edges_list = await semaphore_gather(
             *[EntityEdge.get_by_uuids(self.driver, episode.entity_edges) for episode in episodes]
         )

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/helpers.py RENAMED Viewed

@@ -14,7 +14,9 @@ See the License for the specific language governing permissions and
 limitations under the License.
 """
+import asyncio
 import os
+from collections.abc import Coroutine
 from datetime import datetime
 import numpy as np
@@ -25,6 +27,7 @@ load_dotenv()
 DEFAULT_DATABASE = os.getenv('DEFAULT_DATABASE', None)
 USE_PARALLEL_RUNTIME = bool(os.getenv('USE_PARALLEL_RUNTIME', False))
+SEMAPHORE_LIMIT = int(os.getenv('SEMAPHORE_LIMIT', 20))
 MAX_REFLEXION_ITERATIONS = 2
 DEFAULT_PAGE_LIMIT = 20
@@ -57,6 +60,12 @@ def lucene_sanitize(query: str) -> str:
             ':': r'\:',
             '\\': r'\\',
             '/': r'\/',
+            'O': r'\O',
+            'R': r'\R',
+            'N': r'\N',
+            'T': r'\T',
+            'A': r'\A',
+            'D': r'\D',
         }
     )
@@ -74,3 +83,19 @@ def normalize_l2(embedding: list[float]) -> list[float]:
     else:
         norm = np.linalg.norm(embedding_array, 2, axis=1, keepdims=True)
         return (np.where(norm == 0, embedding_array, embedding_array / norm)).tolist()
+# Use this instead of asyncio.gather() to bound coroutines
+async def semaphore_gather(
+    *coroutines: Coroutine, max_coroutines: int = SEMAPHORE_LIMIT, return_exceptions=True
+):
+    semaphore = asyncio.Semaphore(max_coroutines)
+    async def _wrap_coroutine(coroutine):
+        async with semaphore:
+            return await coroutine
+    return await asyncio.gather(
+        *(_wrap_coroutine(coroutine) for coroutine in coroutines),
+        return_exceptions=return_exceptions,
+    )

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/llm_client/anthropic_client.py RENAMED Viewed

@@ -20,6 +20,7 @@ import typing
 import anthropic
 from anthropic import AsyncAnthropic
+from pydantic import BaseModel
 from ..prompts.models import Message
 from .client import LLMClient
@@ -46,7 +47,9 @@ class AnthropicClient(LLMClient):
             max_retries=1,
         )
-    async def _generate_response(self, messages: list[Message]) -> dict[str, typing.Any]:
+    async def _generate_response(
+        self, messages: list[Message], response_model: type[BaseModel] | None = None
+    ) -> dict[str, typing.Any]:
         system_message = messages[0]
         user_messages = [{'role': m.role, 'content': m.content} for m in messages[1:]] + [
             {'role': 'assistant', 'content': '{'}

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/llm_client/client.py RENAMED Viewed

@@ -22,6 +22,7 @@ from abc import ABC, abstractmethod
 import httpx
 from diskcache import Cache
+from pydantic import BaseModel
 from tenacity import retry, retry_if_exception, stop_after_attempt, wait_random_exponential
 from ..prompts.models import Message
@@ -55,6 +56,28 @@ class LLMClient(ABC):
         self.cache_enabled = cache
         self.cache_dir = Cache(DEFAULT_CACHE_DIR)  # Create a cache directory
+    def _clean_input(self, input: str) -> str:
+        """Clean input string of invalid unicode and control characters.
+        Args:
+            input: Raw input string to be cleaned
+        Returns:
+            Cleaned string safe for LLM processing
+        """
+        # Clean any invalid Unicode
+        cleaned = input.encode('utf-8', errors='ignore').decode('utf-8')
+        # Remove zero-width characters and other invisible unicode
+        zero_width = '\u200b\u200c\u200d\ufeff\u2060'
+        for char in zero_width:
+            cleaned = cleaned.replace(char, '')
+        # Remove control characters except newlines, returns, and tabs
+        cleaned = ''.join(char for char in cleaned if ord(char) >= 32 or char in '\n\r\t')
+        return cleaned
     @retry(
         stop=stop_after_attempt(4),
         wait=wait_random_exponential(multiplier=10, min=5, max=120),
@@ -66,14 +89,18 @@ class LLMClient(ABC):
         else None,
         reraise=True,
     )
-    async def _generate_response_with_retry(self, messages: list[Message]) -> dict[str, typing.Any]:
+    async def _generate_response_with_retry(
+        self, messages: list[Message], response_model: type[BaseModel] | None = None
+    ) -> dict[str, typing.Any]:
         try:
-            return await self._generate_response(messages)
+            return await self._generate_response(messages, response_model)
         except (httpx.HTTPStatusError, RateLimitError) as e:
             raise e
     @abstractmethod
-    async def _generate_response(self, messages: list[Message]) -> dict[str, typing.Any]:
+    async def _generate_response(
+        self, messages: list[Message], response_model: type[BaseModel] | None = None
+    ) -> dict[str, typing.Any]:
         pass
     def _get_cache_key(self, messages: list[Message]) -> str:
@@ -82,7 +109,17 @@ class LLMClient(ABC):
         key_str = f'{self.model}:{message_str}'
         return hashlib.md5(key_str.encode()).hexdigest()
-    async def generate_response(self, messages: list[Message]) -> dict[str, typing.Any]:
+    async def generate_response(
+        self, messages: list[Message], response_model: type[BaseModel] | None = None
+    ) -> dict[str, typing.Any]:
+        if response_model is not None:
+            serialized_model = json.dumps(response_model.model_json_schema())
+            messages[
+                -1
+            ].content += (
+                f'\n\nRespond with a JSON object in the following format:\n\n{serialized_model}'
+            )
         if self.cache_enabled:
             cache_key = self._get_cache_key(messages)
@@ -91,7 +128,10 @@ class LLMClient(ABC):
                 logger.debug(f'Cache hit for {cache_key}')
                 return cached_response
-        response = await self._generate_response_with_retry(messages)
+        for message in messages:
+            message.content = self._clean_input(message.content)
+        response = await self._generate_response_with_retry(messages, response_model)
         if self.cache_enabled:
             self.cache_dir.set(cache_key, response)

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/llm_client/errors.py RENAMED Viewed

@@ -21,3 +21,11 @@ class RateLimitError(Exception):
     def __init__(self, message='Rate limit exceeded. Please try again later.'):
         self.message = message
         super().__init__(self.message)
+class RefusalError(Exception):
+    """Exception raised when the LLM refuses to generate a response."""
+    def __init__(self, message: str):
+        self.message = message
+        super().__init__(self.message)

{graphiti_core-0.4.3 → graphiti_core-0.5.0}/graphiti_core/llm_client/groq_client.py RENAMED Viewed

@@ -21,6 +21,7 @@ import typing
 import groq
 from groq import AsyncGroq
 from groq.types.chat import ChatCompletionMessageParam
+from pydantic import BaseModel
 from ..prompts.models import Message
 from .client import LLMClient
@@ -43,7 +44,9 @@ class GroqClient(LLMClient):
         self.client = AsyncGroq(api_key=config.api_key)
-    async def _generate_response(self, messages: list[Message]) -> dict[str, typing.Any]:
+    async def _generate_response(
+        self, messages: list[Message], response_model: type[BaseModel] | None = None
+    ) -> dict[str, typing.Any]:
         msgs: list[ChatCompletionMessageParam] = []
         for m in messages:
             if m.role == 'user':

graphiti-core 0.4.3__tar.gz → 0.5.0__tar.gz

Potentially problematic release.

graphiti-core 0.4.3tar.gz → 0.5.0tar.gz