PyPI - bisheng-langchain - Versions diffs - 0.3.6.dev1__py3-none-any.whl → 0.3.7__py3-none-any.whl - Mend

bisheng-langchain 0.3.6.dev1py3-none-any.whl → 0.3.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (7) hide show

bisheng_langchain/chains/qa_generation/base_v2.py CHANGED Viewed

@@ -134,6 +134,8 @@ class TrainsetGenerator:
             chunk_size: int = 1024,
             seed: int = 42,
             prompt: Optional[ChatPromptTemplate] = SEED_QUESTION_CHAT_PROMPT,
+            filter_lowquality_context: bool = False,
+            filter_lowquality_question: bool = False,
             answer_prompt: Optional[HumanMessagePromptTemplate] = ANSWER_FORMULATE,
     ) -> None:
         self.generator_llm = generator_llm
@@ -152,6 +154,8 @@ class TrainsetGenerator:
         self.threshold = 5.0
         self.rng = default_rng(seed)
         self.prompt = prompt
+        self.filter_lowquality_context = filter_lowquality_context
+        self.filter_lowquality_question = filter_lowquality_question
         if answer_prompt is None:
             answer_prompt = ANSWER_FORMULATE
         self.answer_prompt = answer_prompt
@@ -163,6 +167,8 @@ class TrainsetGenerator:
             chunk_size: int = 512,
             trainset_distribution: dict = DEFAULT_TRAIN_DISTRIBUTION,
             prompt: Optional[ChatPromptTemplate] = SEED_QUESTION_CHAT_PROMPT,
+            filter_lowquality_context: bool = False,
+            filter_lowquality_question: bool = False,
             answer_prompt: Optional[PromptTemplate] = ANSWER_FORMULATE,
     ):
         generator_llm = llm
@@ -173,6 +179,8 @@ class TrainsetGenerator:
             chunk_size=chunk_size,
             trainset_distribution=trainset_distribution,
             prompt=prompt,
+            filter_lowquality_context=filter_lowquality_context,
+            filter_lowquality_question=filter_lowquality_question,
             answer_prompt=answer_prompt,
         )
@@ -316,14 +324,17 @@ class TrainsetGenerator:
             )
             text_chunk = " ".join([node.get_content() for node in nodes])
-            score = self._filter_context(text_chunk)
-            if not score:
-                continue
+            if self.filter_lowquality_context:
+                score = self._filter_context(text_chunk)
+                if not score:
+                    continue
             seed_question = self._seed_question(text_chunk)
             question = seed_question
-            # is_valid_question = self._filter_question(question)
-            is_valid_question = True
+            if self.filter_lowquality_question:
+                is_valid_question = self._filter_question(question)
+            else:
+                is_valid_question = True
             if is_valid_question:
                 context = [text_chunk] * len(question.split("\n"))
                 is_conv = len(context) > 1
@@ -361,6 +372,8 @@ class QAGenerationChainV2(Chain):
             llm: BaseLanguageModel,
             k: Optional[int] = None,
             chunk_size: int = 512,
+            filter_lowquality_context: bool = False,
+            filter_lowquality_question: bool = False,
             question_prompt: Optional[ChatPromptTemplate] = SEED_QUESTION_CHAT_PROMPT,
             answer_prompt: Optional[HumanMessagePromptTemplate] = ANSWER_FORMULATE,
             **kwargs: Any,
@@ -377,8 +390,14 @@ class QAGenerationChainV2(Chain):
         Returns:
             a QAGenerationChain class
         """
-        generator = TrainsetGenerator.from_default(llm, chunk_size=chunk_size, prompt=question_prompt,
-                                                   answer_prompt=answer_prompt)
+        generator = TrainsetGenerator.from_default(
+            llm,
+            chunk_size=chunk_size,
+            prompt=question_prompt,
+            answer_prompt=answer_prompt,
+            filter_lowquality_context=filter_lowquality_context,
+            filter_lowquality_question=filter_lowquality_question
+        )
         return cls(documents=documents, generator=generator, k=k, **kwargs)
     @property
@@ -405,14 +424,14 @@ class QAGenerationChainV2(Chain):
         dataset = self.generator.generate(documents=self.documents, train_size=self.k)
         df = dataset.to_pandas()
         qa_pairs = df.to_dict("records")
-        qa = ''
+        qa = []
         for pair in qa_pairs:
-            qa += json.dumps(
-                {
-                    "question": pair["question"],
-                    "answer": pair["ground_truth"][0],
-                    "context": pair["ground_truth_context"][0],
-                }, ensure_ascii=False)
+            qa.append({
+                "question": pair["question"],
+                "answer": pair["ground_truth"][0],
+                "context": pair["ground_truth_context"][0],
+            })
+        qa = f'```json\n{json.dumps(qa, ensure_ascii=False, indent=4)}\n```'
         return {self.output_key: qa}
     async def _acall(

bisheng_langchain/memory/__init__.py ADDED Viewed

@@ -0,0 +1,3 @@
+from .redis import ConversationRedisMemory
+__all__ = ['ConversationRedisMemory']

bisheng_langchain/memory/redis.py ADDED Viewed

@@ -0,0 +1,104 @@
+import json
+from typing import Any, Dict, List, Optional
+import redis
+from langchain.memory.chat_memory import BaseChatMemory
+from langchain_core.messages import (AIMessage, BaseMessage, HumanMessage, get_buffer_string,
+                                     message_to_dict, messages_from_dict)
+from langchain_core.pydantic_v1 import root_validator
+from pydantic import Field
+class ConversationRedisMemory(BaseChatMemory):
+    """Using redis for storing conversation memory."""
+    redis_client: redis.Redis = Field(default=None, exclude=True)
+    human_prefix: str = 'Human'
+    ai_prefix: str = 'AI'
+    session_id: str = 'session'
+    memory_key: str = 'history'  #: :meta private:
+    redis_url: str
+    redis_prefix: str = 'redis_buffer_'
+    ttl: Optional[int] = None
+    @root_validator()
+    def validate_environment(cls, values: Dict) -> Dict:
+        redis_url = values.get('redis_url')
+        if not redis_url:
+            raise ValueError('Redis URL must be set')
+        pool = redis.ConnectionPool.from_url(redis_url, max_connections=1)
+        values['redis_client'] = redis.StrictRedis(connection_pool=pool)
+        return values
+    @property
+    def buffer(self) -> Any:
+        """String buffer of memory."""
+        return self.buffer_as_messages if self.return_messages else self.buffer_as_str
+    async def abuffer(self) -> Any:
+        """String buffer of memory."""
+        return (await self.abuffer_as_messages()
+                if self.return_messages else await self.abuffer_as_str())
+    def _buffer_as_str(self, messages: List[BaseMessage]) -> str:
+        return get_buffer_string(
+            messages,
+            human_prefix=self.human_prefix,
+            ai_prefix=self.ai_prefix,
+        )
+    @property
+    def buffer_as_str(self) -> str:
+        """Exposes the buffer as a string in case return_messages is True."""
+        messages = self.buffer_as_messages
+        return self._buffer_as_str(messages)
+        # return self._buffer_as_str(self.chat_memory.messages)
+    async def abuffer_as_str(self) -> str:
+        """Exposes the buffer as a string in case return_messages is True."""
+        # messages = await self.chat_memory.aget_messages()
+        messages = self.buffer_as_messages
+        return self._buffer_as_str(messages)
+    @property
+    def buffer_as_messages(self) -> List[BaseMessage]:
+        """Exposes the buffer as a list of messages in case return_messages is False."""
+        # return self.chat_memory.messages
+        redis_value = self.redis_client.lrange(self.redis_prefix + self.session_id, 0, -1)
+        items = [json.loads(m.decode('utf-8')) for m in redis_value[::-1]]
+        messages = messages_from_dict(items)
+        return messages
+    async def abuffer_as_messages(self) -> List[BaseMessage]:
+        """Exposes the buffer as a list of messages in case return_messages is False."""
+        self.buffer_as_messages
+    @property
+    def memory_variables(self) -> List[str]:
+        """Will always return list of memory variables.
+        :meta private:
+        """
+        return [self.memory_key]
+    def load_memory_variables(self, inputs: Dict[str, Any]) -> Dict[str, Any]:
+        """Return history buffer."""
+        return {self.memory_key: self.buffer}
+    async def aload_memory_variables(self, inputs: Dict[str, Any]) -> Dict[str, Any]:
+        """Return key-value pairs given the text input to the chain."""
+        buffer = await self.abuffer()
+        return {self.memory_key: buffer}
+    def save_context(self, inputs: Dict[str, Any], outputs: Dict[str, str]) -> None:
+        """Save context from this conversation to buffer."""
+        input_str, output_str = self._get_input_output(inputs, outputs)
+        input_message_str = json.dumps(message_to_dict(HumanMessage(content=input_str)),
+                                       ensure_ascii=False)
+        output_message_str = json.dumps(message_to_dict(AIMessage(content=output_str)),
+                                        ensure_ascii=False)
+        self.redis_client.lpush(self.redis_prefix + self.session_id, input_message_str)
+        self.redis_client.lpush(self.redis_prefix + self.session_id, output_message_str)
+        if self.ttl:
+            self.redis_client.expire(self.redis_prefix + self.session_id, self.ttl)

{bisheng_langchain-0.3.6.dev1.dist-info → bisheng_langchain-0.3.7.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: bisheng-langchain
-Version: 0.3.6.dev1
+Version: 0.3.7
 Summary: bisheng langchain modules
 Home-page: https://github.com/dataelement/bisheng
 Author: DataElem

{bisheng_langchain-0.3.6.dev1.dist-info → bisheng_langchain-0.3.7.dist-info}/RECORD RENAMED Viewed

@@ -23,7 +23,7 @@ bisheng_langchain/chains/conversational_retrieval/__init__.py,sha256=47DEQpj8HBS
 bisheng_langchain/chains/conversational_retrieval/base.py,sha256=XiqBqov6No-wTVCou6qyMT5p2JQgoQI7OLQOYH8XUos,5313
 bisheng_langchain/chains/qa_generation/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 bisheng_langchain/chains/qa_generation/base.py,sha256=VYGmLDB0bnlDQ6T8ivLP55wwFbMo9HOzlPEDUuRx5fU,4148
-bisheng_langchain/chains/qa_generation/base_v2.py,sha256=ZtHEuNFwbE9txCGR3wx0oDAoj9V6bAxi3GXF8Z78cqQ,14580
+bisheng_langchain/chains/qa_generation/base_v2.py,sha256=2F2kGe3ermJraQu4oC-m8vm_ENBy_Zi4uHrJDcSOeJw,15460
 bisheng_langchain/chains/qa_generation/prompt.py,sha256=4eJk9aDUYDN1qaaYRPy9EobCIncnwS8BbQaDFzzePtM,1944
 bisheng_langchain/chains/qa_generation/prompt_v2.py,sha256=sQLanA_iOnLqrUIwzfTOTANt-1vJ44CM54HFDU8Jo1Q,8938
 bisheng_langchain/chains/question_answering/__init__.py,sha256=_gOZMc-SWprK6xc-Jj64jcr9nc-G4YkZbEYwfJNq_bY,8795
@@ -108,6 +108,8 @@ bisheng_langchain/gpts/tools/get_current_time/tool.py,sha256=3uvk7Yu07qhZy1sBrFM
 bisheng_langchain/input_output/__init__.py,sha256=sW_GB7MlrHYsqY1Meb_LeimQqNsMz1gH-00Tqb2BUyM,153
 bisheng_langchain/input_output/input.py,sha256=I5YDmgbvvj1o2lO9wi8LE37wM0wP5jkhUREU32YrZMQ,1094
 bisheng_langchain/input_output/output.py,sha256=6U-az6-Cwz665C2YmcH3SYctWVjPFjmW8s70CA_qphk,11585
+bisheng_langchain/memory/__init__.py,sha256=TNqe5l5BqUv4wh3_UH28fYPWQXGLBUYn6QJHsr7vanI,82
+bisheng_langchain/memory/redis.py,sha256=paz72ic5BfLXY6lj2cEbCxrTb8KVMnKMZmG9q7uh_9s,4291
 bisheng_langchain/rag/__init__.py,sha256=Rm_cDxOJINt0H4bOeUo3JctPxaI6xKKXZcS-R_wkoGs,198
 bisheng_langchain/rag/bisheng_rag_chain.py,sha256=2GMDUPJaW-D7tpOQ9qPt2vGZwmcXBS0UrcibO7J2S1g,5999
 bisheng_langchain/rag/bisheng_rag_pipeline.py,sha256=neoBK3TtuQ07_WeuJCzYlvtsDQNepUa_68NT8VCgytw,13749
@@ -153,7 +155,7 @@ bisheng_langchain/vectorstores/__init__.py,sha256=zCZgDe7LyQ0iDkfcm5UJ5NxwKQSRHn
 bisheng_langchain/vectorstores/elastic_keywords_search.py,sha256=inZarhahRaesrvLqyeRCMQvHGAASY53opEVA0_o8S14,14901
 bisheng_langchain/vectorstores/milvus.py,sha256=xh7NokraKg_Xc9ofz0RVfJ_I36ftnprLJtV-1NfaeyQ,37162
 bisheng_langchain/vectorstores/retriever.py,sha256=hj4nAAl352EV_ANnU2OHJn7omCH3nBK82ydo14KqMH4,4353
-bisheng_langchain-0.3.6.dev1.dist-info/METADATA,sha256=KG32YRknnVoAxFzVKE_qMMQBjbhZen046fXQYyhXQvs,2476
-bisheng_langchain-0.3.6.dev1.dist-info/WHEEL,sha256=eOLhNAGa2EW3wWl_TU484h7q1UNgy0JXjjoqKoxAAQc,92
-bisheng_langchain-0.3.6.dev1.dist-info/top_level.txt,sha256=Z6pPNyCo4ihyr9iqGQbH8sJiC4dAUwA_mAyGRQB5_Fs,18
-bisheng_langchain-0.3.6.dev1.dist-info/RECORD,,
+bisheng_langchain-0.3.7.dist-info/METADATA,sha256=QmKT4P-W7klb8-YIRFq1Kqh8uHfq0454b9sOMgATjy4,2471
+bisheng_langchain-0.3.7.dist-info/WHEEL,sha256=bFJAMchF8aTQGUgMZzHJyDDMPTO3ToJ7x23SLJa1SVo,92
+bisheng_langchain-0.3.7.dist-info/top_level.txt,sha256=Z6pPNyCo4ihyr9iqGQbH8sJiC4dAUwA_mAyGRQB5_Fs,18
+bisheng_langchain-0.3.7.dist-info/RECORD,,

{bisheng_langchain-0.3.6.dev1.dist-info → bisheng_langchain-0.3.7.dist-info}/WHEEL RENAMED Viewed

@@ -1,5 +1,5 @@
 Wheel-Version: 1.0
-Generator: bdist_wheel (0.44.0)
+Generator: bdist_wheel (0.45.0)
 Root-Is-Purelib: true
 Tag: py3-none-any

{bisheng_langchain-0.3.6.dev1.dist-info → bisheng_langchain-0.3.7.dist-info}/top_level.txt RENAMED Viewed

File without changes

bisheng-langchain 0.3.6.dev1__py3-none-any.whl → 0.3.7__py3-none-any.whl

bisheng-langchain 0.3.6.dev1py3-none-any.whl → 0.3.7py3-none-any.whl