PyPI - isage-middleware - Versions diffs - 0.2.4.3__cp311-none-any.whl - Mend

isage-middleware 0.2.4.3__cp311-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (94) hide show

isage_middleware-0.2.4.3.dist-info/METADATA +266 -0
isage_middleware-0.2.4.3.dist-info/RECORD +94 -0
isage_middleware-0.2.4.3.dist-info/WHEEL +5 -0
isage_middleware-0.2.4.3.dist-info/top_level.txt +1 -0
sage/middleware/__init__.py +59 -0
sage/middleware/_version.py +6 -0
sage/middleware/components/__init__.py +30 -0
sage/middleware/components/extensions_compat.py +141 -0
sage/middleware/components/sage_db/__init__.py +116 -0
sage/middleware/components/sage_db/backend.py +136 -0
sage/middleware/components/sage_db/service.py +15 -0
sage/middleware/components/sage_flow/__init__.py +76 -0
sage/middleware/components/sage_flow/python/__init__.py +14 -0
sage/middleware/components/sage_flow/python/micro_service/__init__.py +4 -0
sage/middleware/components/sage_flow/python/micro_service/sage_flow_service.py +88 -0
sage/middleware/components/sage_flow/python/sage_flow.py +30 -0
sage/middleware/components/sage_flow/service.py +14 -0
sage/middleware/components/sage_mem/__init__.py +83 -0
sage/middleware/components/sage_sias/__init__.py +59 -0
sage/middleware/components/sage_sias/continual_learner.py +184 -0
sage/middleware/components/sage_sias/coreset_selector.py +302 -0
sage/middleware/components/sage_sias/types.py +94 -0
sage/middleware/components/sage_tsdb/__init__.py +81 -0
sage/middleware/components/sage_tsdb/python/__init__.py +21 -0
sage/middleware/components/sage_tsdb/python/_sage_tsdb.pyi +17 -0
sage/middleware/components/sage_tsdb/python/algorithms/__init__.py +17 -0
sage/middleware/components/sage_tsdb/python/algorithms/base.py +51 -0
sage/middleware/components/sage_tsdb/python/algorithms/out_of_order_join.py +248 -0
sage/middleware/components/sage_tsdb/python/algorithms/window_aggregator.py +296 -0
sage/middleware/components/sage_tsdb/python/micro_service/__init__.py +7 -0
sage/middleware/components/sage_tsdb/python/micro_service/sage_tsdb_service.py +365 -0
sage/middleware/components/sage_tsdb/python/sage_tsdb.py +523 -0
sage/middleware/components/sage_tsdb/service.py +17 -0
sage/middleware/components/vector_stores/__init__.py +25 -0
sage/middleware/components/vector_stores/chroma.py +483 -0
sage/middleware/components/vector_stores/chroma_adapter.py +185 -0
sage/middleware/components/vector_stores/milvus.py +677 -0
sage/middleware/operators/__init__.py +56 -0
sage/middleware/operators/agent/__init__.py +24 -0
sage/middleware/operators/agent/planning/__init__.py +5 -0
sage/middleware/operators/agent/planning/llm_adapter.py +41 -0
sage/middleware/operators/agent/planning/planner_adapter.py +98 -0
sage/middleware/operators/agent/planning/router.py +107 -0
sage/middleware/operators/agent/runtime.py +296 -0
sage/middleware/operators/agentic/__init__.py +41 -0
sage/middleware/operators/agentic/config.py +254 -0
sage/middleware/operators/agentic/planning_operator.py +125 -0
sage/middleware/operators/agentic/refined_searcher.py +132 -0
sage/middleware/operators/agentic/runtime.py +241 -0
sage/middleware/operators/agentic/timing_operator.py +125 -0
sage/middleware/operators/agentic/tool_selection_operator.py +127 -0
sage/middleware/operators/context/__init__.py +17 -0
sage/middleware/operators/context/critic_evaluation.py +16 -0
sage/middleware/operators/context/model_context.py +565 -0
sage/middleware/operators/context/quality_label.py +12 -0
sage/middleware/operators/context/search_query_results.py +61 -0
sage/middleware/operators/context/search_result.py +42 -0
sage/middleware/operators/context/search_session.py +79 -0
sage/middleware/operators/filters/__init__.py +26 -0
sage/middleware/operators/filters/context_sink.py +387 -0
sage/middleware/operators/filters/context_source.py +376 -0
sage/middleware/operators/filters/evaluate_filter.py +83 -0
sage/middleware/operators/filters/tool_filter.py +74 -0
sage/middleware/operators/llm/__init__.py +18 -0
sage/middleware/operators/llm/sagellm_generator.py +432 -0
sage/middleware/operators/rag/__init__.py +147 -0
sage/middleware/operators/rag/arxiv.py +331 -0
sage/middleware/operators/rag/chunk.py +13 -0
sage/middleware/operators/rag/document_loaders.py +23 -0
sage/middleware/operators/rag/evaluate.py +658 -0
sage/middleware/operators/rag/generator.py +340 -0
sage/middleware/operators/rag/index_builder/__init__.py +48 -0
sage/middleware/operators/rag/index_builder/builder.py +363 -0
sage/middleware/operators/rag/index_builder/manifest.py +101 -0
sage/middleware/operators/rag/index_builder/storage.py +131 -0
sage/middleware/operators/rag/pipeline.py +46 -0
sage/middleware/operators/rag/profiler.py +59 -0
sage/middleware/operators/rag/promptor.py +400 -0
sage/middleware/operators/rag/refiner.py +231 -0
sage/middleware/operators/rag/reranker.py +364 -0
sage/middleware/operators/rag/retriever.py +1308 -0
sage/middleware/operators/rag/searcher.py +37 -0
sage/middleware/operators/rag/types.py +28 -0
sage/middleware/operators/rag/writer.py +80 -0
sage/middleware/operators/tools/__init__.py +71 -0
sage/middleware/operators/tools/arxiv_paper_searcher.py +175 -0
sage/middleware/operators/tools/arxiv_searcher.py +102 -0
sage/middleware/operators/tools/duckduckgo_searcher.py +105 -0
sage/middleware/operators/tools/image_captioner.py +104 -0
sage/middleware/operators/tools/nature_news_fetcher.py +224 -0
sage/middleware/operators/tools/searcher_tool.py +514 -0
sage/middleware/operators/tools/text_detector.py +185 -0
sage/middleware/operators/tools/url_text_extractor.py +104 -0
sage/middleware/py.typed +2 -0

sage/middleware/operators/rag/reranker.py ADDED Viewed

@@ -0,0 +1,364 @@
+import torch
+from transformers import (
+    AutoModelForCausalLM,
+    AutoModelForSequenceClassification,
+    AutoTokenizer,
+)
+from sage.common.core.functions import MapFunction as MapOperator
+from sage.libs.rag.types import (
+    RAGInput,
+    RAGResponse,
+    create_rag_response,
+    extract_query,
+    extract_results,
+)
+class BGEReranker(MapOperator):
+    """
+    A reranker that uses the BAAI/bge-reranker-v2-m3 model to reorder a list of retrieved documents.
+    The model assigns relevance scores to the documents and ranks them accordingly.
+    Input: A tuple of (query, List[retrieved_documents])
+    Output: A tuple of (query, List[reranked_documents_with_scores])
+    Attributes:
+        logger: Logger for logging error and information messages.
+        config: Configuration dictionary containing reranker settings (model name, top_k, etc.).
+        device: Device ('cuda' or 'cpu') where the model will be loaded.
+        tokenizer: Tokenizer used to preprocess input queries and documents.
+        model: The pre-trained reranking model.
+    """
+    def __init__(self, config, **kwargs):
+        super().__init__(**kwargs)
+        """
+        Initializes the BGEReranker with configuration settings and loads the model.
+        :param config: Dictionary containing configuration options, including model name and device settings.
+        """
+        self.config = config
+        self.device = (
+            "cuda" if torch.cuda.is_available() else "cpu"
+        )  # Set device to GPU if available, otherwise CPU
+        # Load tokenizer and model using the provided model name
+        self.tokenizer, self.model = self._load_model(self.config["model_name"])
+        self.model = self.model.to(self.device)
+        self.model.eval()  # Set the model to evaluation mode
+    def _load_model(self, model_name: str):
+        """
+        Loads the tokenizer and model for the reranker.
+        :param model_name: Name of the pre-trained model to load.
+        :return: Tuple containing the tokenizer and the model.
+        """
+        try:
+            self.logger.info(f"Loading reranker: {model_name}")
+            tokenizer = AutoTokenizer.from_pretrained(model_name)  # Load the tokenizer
+            model = AutoModelForSequenceClassification.from_pretrained(model_name)  # Load the model
+            return tokenizer, model
+        except Exception as e:
+            self.logger.error(f"Failed to load model {model_name}: {str(e)}")
+            raise RuntimeError(f"Model loading failed: {str(e)}")
+    def execute(self, data: RAGInput) -> RAGResponse:
+        """
+        Executes the reranking process:
+        1. Unpacks the input data (query and list of documents).
+        2. Generates query-document pairs.
+        3. Calculates relevance scores using the model.
+        4. Sorts documents based on their relevance scores.
+        :param data: RAGInput - standardized input format
+        :return: RAGResponse containing {"query": str, "results": List[str]}
+        """
+        try:
+            # 使用标准化函数提取数据
+            query = extract_query(data)
+            doc_set = extract_results(data)
+            if not query:
+                self.logger.error("Missing 'query' field in input")
+                return create_rag_response("", [])
+                return {"query": "", "results": []}
+            top_k = self.config.get("topk") or self.config.get(
+                "top_k", 3
+            )  # Get the top-k parameter for reranking
+            # Handle empty document set case
+            if not doc_set:
+                print("BGEReranker received empty document set, returning empty results")
+                # 统一返回 dict 格式
+                return create_rag_response(query, [])
+            # Generate query-document pairs for scoring
+            pairs = [(query, doc) for doc in doc_set]
+            # Tokenize the pairs and move inputs to the appropriate device
+            raw_inputs = self.tokenizer(
+                pairs,
+                padding=True,
+                truncation=True,
+                max_length=512,
+                return_tensors="pt",
+            )
+            inputs = {
+                k: v.to(self.device) if isinstance(v, torch.Tensor) else v
+                for k, v in raw_inputs.items()
+            }
+            # Perform inference and calculate scores
+            scores = self.model(**inputs).logits.view(-1).float()
+            # Create a list of scored documents
+            scored_docs = [
+                {"text": doc, "relevance_score": score}
+                for doc, score in zip(doc_set, scores, strict=False)
+            ]
+            # Sort the documents by relevance score in descending order
+            reranked_docs = sorted(scored_docs, key=lambda x: x["relevance_score"], reverse=True)[
+                :top_k
+            ]
+            reranked_docs_list = [doc["text"] for doc in reranked_docs]
+            self.logger.info(
+                f"\033[32m[ {self.__class__.__name__}]: Rerank Results: {reranked_docs_list}\033[0m "
+            )
+            self.logger.debug(
+                f"Top score: {reranked_docs[0]['relevance_score'] if reranked_docs else 'N/A'}"
+            )
+            print(f"Rerank Results: {reranked_docs_list}")
+        except Exception as e:
+            raise RuntimeError(f"BGEReranker error: {str(e)}")
+        # 统一返回标准格式
+        return create_rag_response(query, reranked_docs_list)
+class LLMbased_Reranker(MapOperator):
+    """
+    A reranker that uses the BAAI/bge-reranker-v2-gemma model to determine if a retrieved document contains an answer to a given query.
+    It scores the documents with 'Yes' or 'No' predictions based on whether the document answers the query.
+    Input: A tuple of (query, List[retrieved_documents])
+    Output: A tuple of (query, List[reranked_documents_with_scores])
+    Attributes:
+        logger: Logger for logging error and information messages.
+        config: Configuration dictionary containing reranker settings (model name, top_k, etc.).
+        device: Device ('cuda' or 'cpu') where the model will be loaded.
+        tokenizer: Tokenizer used to preprocess input queries and documents.
+        model: The pre-trained reranking model.
+        yes_loc: Token ID representing 'Yes' (used for scoring).
+    """
+    def __init__(self, config, model_name: str = "BAAI/bge-reranker-v2-gemma"):
+        """
+        Initializes the LLMbased_Reranker with configuration settings and loads the model.
+        :param config: Dictionary containing configuration options, including model name and device settings.
+        :param model_name: Name of the pre-trained model to load (default is "BAAI/bge-reranker-v2-gemma").
+        """
+        super().__init__()
+        self.config = config
+        self.device = (
+            "cuda" if torch.cuda.is_available() else "cpu"
+        )  # Set device to GPU if available, otherwise CPU
+        # Load tokenizer and model using the provided model name
+        self.tokenizer, self.model = self._load_model(model_name)
+        self.model = self.model.to(self.device)  # type: ignore[arg-type]
+        # Get the token ID for the 'Yes' token (used for classification)
+        self.yes_loc = self.tokenizer("Yes", add_special_tokens=False)["input_ids"][0]
+    def _load_model(self, model_name: str):
+        """
+        Loads the tokenizer and model for the reranker.
+        :param model_name: Name of the pre-trained model to load.
+        :return: Tuple containing the tokenizer and the model.
+        """
+        try:
+            self.logger.info(f"Loading reranker: {model_name}")
+            tokenizer = AutoTokenizer.from_pretrained(model_name)  # Load the tokenizer
+            model = AutoModelForCausalLM.from_pretrained(model_name)  # Load the model
+            return tokenizer, model
+        except Exception as e:
+            self.logger.error(f"Failed to load model {model_name}: {str(e)}")
+            raise RuntimeError(f"Model loading failed: {str(e)}")
+    def get_inputs(self, pairs, tokenizer, prompt=None, max_length=1024):
+        """
+        Prepares the input for the model, including the prompt and the query-document pairs.
+        :param pairs: List of query-document pairs.
+        :param tokenizer: The tokenizer used to process the input data.
+        :param prompt: Optional prompt to guide the model (defaults to a generic query-passage prompt).
+        :param max_length: Maximum length of the tokenized input sequences.
+        :return: A tensor of tokenized inputs, ready for model inference.
+        """
+        if prompt is None:
+            prompt = "Given a query A and a passage B, determine whether the passage contains an answer to the query by providing a prediction of either 'Yes' or 'No'."
+        sep = "\n"
+        prompt_inputs = tokenizer(prompt, return_tensors=None, add_special_tokens=False)[
+            "input_ids"
+        ]
+        sep_inputs = tokenizer(sep, return_tensors=None, add_special_tokens=False)["input_ids"]
+        inputs = []
+        for query, passage in pairs:
+            query_inputs = tokenizer(
+                f"A: {query}",
+                return_tensors=None,
+                add_special_tokens=False,
+                max_length=max_length * 3 // 4,
+                truncation=True,
+            )
+            passage_inputs = tokenizer(
+                f"B: {passage}",
+                return_tensors=None,
+                add_special_tokens=False,
+                max_length=max_length,
+                truncation=True,
+            )
+            item = tokenizer.prepare_for_model(
+                [tokenizer.bos_token_id] + query_inputs["input_ids"],
+                sep_inputs + passage_inputs["input_ids"],
+                truncation="only_second",
+                max_length=max_length,
+                padding=False,
+                return_attention_mask=False,
+                return_token_type_ids=False,
+                add_special_tokens=False,
+            )
+            item["input_ids"] = item["input_ids"] + sep_inputs + prompt_inputs
+            item["attention_mask"] = [1] * len(item["input_ids"])
+            inputs.append(item)
+        return tokenizer.pad(
+            inputs,
+            padding=True,
+            max_length=max_length + len(sep_inputs) + len(prompt_inputs),
+            pad_to_multiple_of=8,
+            return_tensors="pt",
+        )
+    # @torch.inference_mode()
+    def execute(self, data: RAGInput) -> RAGResponse:
+        """
+        Executes the reranking process:
+        1. Unpacks the input data (query and list of documents).
+        2. Generates query-document pairs for classification.
+        3. Calculates relevance scores based on 'Yes'/'No' predictions.
+        4. Sorts documents based on their relevance scores.
+        :param data: RAGInput - standardized input format
+        :return: RAGResponse containing {"query": str, "results": List[str]}
+        """
+        try:
+            # 使用标准化函数提取数据
+            query = extract_query(data)
+            doc_set = extract_results(data)
+            if not query:
+                self.logger.error("Missing 'query' field in input")
+                return create_rag_response("", [])
+            doc_set = [doc_set]  # Wrap doc_set in a list for processing
+            top_k = self.config["topk"]  # Get the top-k parameter for reranking
+            emit_docs = []  # Initialize the list to store reranked documents
+            for retrieved_docs in doc_set:
+                # Generate query-document pairs for classification
+                pairs = [[query, doc] for doc in retrieved_docs]
+                # Tokenize the pairs and move inputs to the appropriate device
+                with torch.no_grad():
+                    raw_inputs = self.get_inputs(pairs, self.tokenizer)
+                    inputs = {k: v.to(self.device) for k, v in raw_inputs.items()}
+                    scores = (
+                        self.model(**inputs, return_dict=True)
+                        .logits[:, -1, self.yes_loc]
+                        .view(-1)
+                        .float()
+                    )
+                # Create a list of scored documents
+                scored_docs = [
+                    {"text": doc, "relevance_score": score}
+                    for doc, score in zip(retrieved_docs, scores, strict=False)
+                ]
+                # Sort the documents by relevance score in descending order
+                reranked_docs = sorted(
+                    scored_docs, key=lambda x: x["relevance_score"], reverse=True
+                )[:top_k]
+                reranked_docs_list = [doc["text"] for doc in reranked_docs]
+                emit_docs.append(reranked_docs_list)
+                self.logger.info(
+                    f"\033[32m[ {self.__class__.__name__}]: Rerank Results: {reranked_docs_list}\033[0m "
+                )
+                self.logger.debug(
+                    f"Top score: {reranked_docs[0]['relevance_score'] if reranked_docs else 'N/A'}"
+                )
+        except Exception as e:
+            self.logger.error(f"{str(e)} when RerankerFuncton")
+            raise RuntimeError(f"Reranker error: {str(e)}")
+        emit_docs = emit_docs[0]  # Only return the first set of reranked documents
+        # 统一返回标准格式
+        return create_rag_response(query, emit_docs)
+# if __name__ == '__main__':
+#    # 设置配置
+#     config1 = {
+#         "reranker": {
+#             "model_name":"BAAI/bge-reranker-v2-m3",
+#             "top_k": 3
+#         }
+#     }
+#     config2 = {
+#         "reranker": {
+#             "model_name":"BAAI/bge-reranker-v2-gemma",
+#             "top_k": 3
+#         }
+#     }
+#     # 创建实例
+#     # reranker = BGEReranker(config)
+#     reranker = LLMbased_Reranker(config2)
+#     # 测试数据
+#     query = "What is the capital of France?"
+#     docs = [
+#         "Paris is the capital of France.",
+#         "Berlin is a city in Germany.",
+#         "The Eiffel Tower is located in Paris.",
+#         "France is a country in Western Europe.",
+#         "Madrid is the capital of Spain."
+#     ]
+#     # 执行重排
+#     input_data = (query, docs)
+#     output = reranker.execute(input_data)
+#     # 输出结果
+#     result_query, result_docs = output
+#     print("Query:", result_query)
+#     print("Top-k Re-ranked Documents:")
+#     for i, doc in enumerate(result_docs, 1):
+#         print(f"{i}. {doc}")