PyPI - qtype - Versions diffs - 0.0.12__py3-none-any.whl → 0.1.3__py3-none-any.whl - Mend

qtype 0.0.12py3-none-any.whl → 0.1.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (137) hide show

qtype/application/commons/tools.py +1 -1
qtype/application/converters/tools_from_api.py +476 -11
qtype/application/converters/tools_from_module.py +38 -14
qtype/application/converters/types.py +15 -30
qtype/application/documentation.py +1 -1
qtype/application/facade.py +102 -85
qtype/base/types.py +227 -7
qtype/cli.py +5 -1
qtype/commands/convert.py +52 -6
qtype/commands/generate.py +44 -4
qtype/commands/run.py +78 -36
qtype/commands/serve.py +74 -44
qtype/commands/validate.py +37 -14
qtype/commands/visualize.py +46 -25
qtype/dsl/__init__.py +6 -5
qtype/dsl/custom_types.py +1 -1
qtype/dsl/domain_types.py +86 -5
qtype/dsl/linker.py +384 -0
qtype/dsl/loader.py +315 -0
qtype/dsl/model.py +751 -263
qtype/dsl/parser.py +200 -0
qtype/dsl/types.py +50 -0
qtype/interpreter/api.py +63 -136
qtype/interpreter/auth/aws.py +19 -9
qtype/interpreter/auth/generic.py +93 -16
qtype/interpreter/base/base_step_executor.py +436 -0
qtype/interpreter/base/batch_step_executor.py +171 -0
qtype/interpreter/base/exceptions.py +50 -0
qtype/interpreter/base/executor_context.py +91 -0
qtype/interpreter/base/factory.py +84 -0
qtype/interpreter/base/progress_tracker.py +110 -0
qtype/interpreter/base/secrets.py +339 -0
qtype/interpreter/base/step_cache.py +74 -0
qtype/interpreter/base/stream_emitter.py +469 -0
qtype/interpreter/conversions.py +471 -22
qtype/interpreter/converters.py +79 -0
qtype/interpreter/endpoints.py +355 -0
qtype/interpreter/executors/agent_executor.py +242 -0
qtype/interpreter/executors/aggregate_executor.py +93 -0
qtype/interpreter/executors/bedrock_reranker_executor.py +195 -0
qtype/interpreter/executors/decoder_executor.py +163 -0
qtype/interpreter/executors/doc_to_text_executor.py +112 -0
qtype/interpreter/executors/document_embedder_executor.py +107 -0
qtype/interpreter/executors/document_search_executor.py +113 -0
qtype/interpreter/executors/document_source_executor.py +118 -0
qtype/interpreter/executors/document_splitter_executor.py +105 -0
qtype/interpreter/executors/echo_executor.py +63 -0
qtype/interpreter/executors/field_extractor_executor.py +165 -0
qtype/interpreter/executors/file_source_executor.py +101 -0
qtype/interpreter/executors/file_writer_executor.py +110 -0
qtype/interpreter/executors/index_upsert_executor.py +232 -0
qtype/interpreter/executors/invoke_embedding_executor.py +92 -0
qtype/interpreter/executors/invoke_flow_executor.py +51 -0
qtype/interpreter/executors/invoke_tool_executor.py +358 -0
qtype/interpreter/executors/llm_inference_executor.py +272 -0
qtype/interpreter/executors/prompt_template_executor.py +78 -0
qtype/interpreter/executors/sql_source_executor.py +106 -0
qtype/interpreter/executors/vector_search_executor.py +91 -0
qtype/interpreter/flow.py +173 -22
qtype/interpreter/logging_progress.py +61 -0
qtype/interpreter/metadata_api.py +115 -0
qtype/interpreter/resource_cache.py +5 -4
qtype/interpreter/rich_progress.py +225 -0
qtype/interpreter/stream/chat/__init__.py +15 -0
qtype/interpreter/stream/chat/converter.py +391 -0
qtype/interpreter/{chat → stream/chat}/file_conversions.py +2 -2
qtype/interpreter/stream/chat/ui_request_to_domain_type.py +140 -0
qtype/interpreter/stream/chat/vercel.py +609 -0
qtype/interpreter/stream/utils/__init__.py +15 -0
qtype/interpreter/stream/utils/build_vercel_ai_formatter.py +74 -0
qtype/interpreter/stream/utils/callback_to_stream.py +66 -0
qtype/interpreter/stream/utils/create_streaming_response.py +18 -0
qtype/interpreter/stream/utils/default_chat_extract_text.py +20 -0
qtype/interpreter/stream/utils/error_streaming_response.py +20 -0
qtype/interpreter/telemetry.py +135 -8
qtype/interpreter/tools/__init__.py +5 -0
qtype/interpreter/tools/function_tool_helper.py +265 -0
qtype/interpreter/types.py +330 -0
qtype/interpreter/typing.py +83 -89
qtype/interpreter/ui/404/index.html +1 -1
qtype/interpreter/ui/404.html +1 -1
qtype/interpreter/ui/_next/static/{OT8QJQW3J70VbDWWfrEMT → 20HoJN6otZ_LyHLHpCPE6}/_buildManifest.js +1 -1
qtype/interpreter/ui/_next/static/chunks/434-b2112d19f25c44ff.js +36 -0
qtype/interpreter/ui/_next/static/chunks/{964-ed4ab073db645007.js → 964-2b041321a01cbf56.js} +1 -1
qtype/interpreter/ui/_next/static/chunks/app/{layout-5ccbc44fd528d089.js → layout-a05273ead5de2c41.js} +1 -1
qtype/interpreter/ui/_next/static/chunks/app/page-8c67d16ac90d23cb.js +1 -0
qtype/interpreter/ui/_next/static/chunks/ba12c10f-546f2714ff8abc66.js +1 -0
qtype/interpreter/ui/_next/static/chunks/{main-6d261b6c5d6fb6c2.js → main-e26b9cb206da2cac.js} +1 -1
qtype/interpreter/ui/_next/static/chunks/webpack-08642e441b39b6c2.js +1 -0
qtype/interpreter/ui/_next/static/css/8a8d1269e362fef7.css +3 -0
qtype/interpreter/ui/_next/static/media/4cf2300e9c8272f7-s.p.woff2 +0 -0
qtype/interpreter/ui/icon.png +0 -0
qtype/interpreter/ui/index.html +1 -1
qtype/interpreter/ui/index.txt +5 -5
qtype/semantic/checker.py +643 -0
qtype/semantic/generate.py +268 -85
qtype/semantic/loader.py +95 -0
qtype/semantic/model.py +535 -163
qtype/semantic/resolver.py +63 -19
qtype/semantic/visualize.py +50 -35
{qtype-0.0.12.dist-info → qtype-0.1.3.dist-info}/METADATA +21 -4
qtype-0.1.3.dist-info/RECORD +137 -0
qtype/dsl/base_types.py +0 -38
qtype/dsl/validator.py +0 -464
qtype/interpreter/batch/__init__.py +0 -0
qtype/interpreter/batch/flow.py +0 -95
qtype/interpreter/batch/sql_source.py +0 -95
qtype/interpreter/batch/step.py +0 -63
qtype/interpreter/batch/types.py +0 -41
qtype/interpreter/batch/utils.py +0 -179
qtype/interpreter/chat/chat_api.py +0 -237
qtype/interpreter/chat/vercel.py +0 -314
qtype/interpreter/exceptions.py +0 -10
qtype/interpreter/step.py +0 -67
qtype/interpreter/steps/__init__.py +0 -0
qtype/interpreter/steps/agent.py +0 -114
qtype/interpreter/steps/condition.py +0 -36
qtype/interpreter/steps/decoder.py +0 -88
qtype/interpreter/steps/llm_inference.py +0 -150
qtype/interpreter/steps/prompt_template.py +0 -54
qtype/interpreter/steps/search.py +0 -24
qtype/interpreter/steps/tool.py +0 -53
qtype/interpreter/streaming_helpers.py +0 -123
qtype/interpreter/ui/_next/static/chunks/736-7fc606e244fedcb1.js +0 -36
qtype/interpreter/ui/_next/static/chunks/app/page-c72e847e888e549d.js +0 -1
qtype/interpreter/ui/_next/static/chunks/ba12c10f-22556063851a6df2.js +0 -1
qtype/interpreter/ui/_next/static/chunks/webpack-8289c17c67827f22.js +0 -1
qtype/interpreter/ui/_next/static/css/a262c53826df929b.css +0 -3
qtype/interpreter/ui/_next/static/media/569ce4b8f30dc480-s.p.woff2 +0 -0
qtype/interpreter/ui/favicon.ico +0 -0
qtype/loader.py +0 -389
qtype-0.0.12.dist-info/RECORD +0 -105
/qtype/interpreter/ui/_next/static/{OT8QJQW3J70VbDWWfrEMT → 20HoJN6otZ_LyHLHpCPE6}/_ssgManifest.js +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.3.dist-info}/WHEEL +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.3.dist-info}/entry_points.txt +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.3.dist-info}/licenses/LICENSE +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.3.dist-info}/top_level.txt +0 -0

qtype/interpreter/executors/index_upsert_executor.py ADDED Viewed

@@ -0,0 +1,232 @@
+"""Index upsert executor for inserting documents/chunks into indexes."""
+from __future__ import annotations
+import logging
+import uuid
+from typing import AsyncIterator
+from llama_index.core.schema import TextNode
+from opensearchpy import AsyncOpenSearch
+from pydantic import BaseModel
+from qtype.dsl.domain_types import RAGChunk, RAGDocument
+from qtype.interpreter.base.batch_step_executor import BatchedStepExecutor
+from qtype.interpreter.base.executor_context import ExecutorContext
+from qtype.interpreter.conversions import (
+    to_llama_vector_store_and_retriever,
+    to_opensearch_client,
+)
+from qtype.interpreter.types import FlowMessage
+from qtype.semantic.model import DocumentIndex, IndexUpsert, VectorIndex
+logger = logging.getLogger(__name__)
+class IndexUpsertExecutor(BatchedStepExecutor):
+    """Executor for IndexUpsert steps supporting both vector and document indexes."""
+    def __init__(
+        self, step: IndexUpsert, context: ExecutorContext, **dependencies
+    ):
+        super().__init__(step, context, **dependencies)
+        if not isinstance(step, IndexUpsert):
+            raise ValueError(
+                "IndexUpsertExecutor can only execute IndexUpsert steps."
+            )
+        self.step: IndexUpsert = step
+        # Determine index type and initialize appropriate client
+        if isinstance(self.step.index, VectorIndex):
+            # Vector index for RAGChunk embeddings
+            self._vector_store, _ = to_llama_vector_store_and_retriever(
+                self.step.index, self.context.secret_manager
+            )
+            self.index_type = "vector"
+        elif isinstance(self.step.index, DocumentIndex):
+            # Document index for text-based search
+            self._opensearch_client: AsyncOpenSearch = to_opensearch_client(
+                self.step.index, self.context.secret_manager
+            )
+            self._vector_store = None
+            self.index_type = "document"
+            self.index_name = self.step.index.name
+            self._document_index: DocumentIndex = self.step.index
+        else:
+            raise ValueError(
+                f"Unsupported index type: {type(self.step.index)}"
+            )
+    async def finalize(self) -> AsyncIterator[FlowMessage]:
+        """Clean up resources after all messages are processed."""
+        if hasattr(self, "_opensearch_client") and self._opensearch_client:
+            try:
+                await self._opensearch_client.close()
+            except Exception:
+                pass
+        # Make this an async generator
+        return
+        yield  # type: ignore[unreachable]
+    async def process_batch(
+        self, batch: list[FlowMessage]
+    ) -> AsyncIterator[FlowMessage]:
+        """Process a batch of FlowMessages for the IndexUpsert step.
+        Args:
+            batch: A list of FlowMessages to process.
+        Yields:
+            FlowMessages: Success messages after upserting to the index
+        """
+        logger.debug(
+            f"Executing IndexUpsert step: {self.step.id} with batch size: {len(batch)}"
+        )
+        if len(batch) == 0:
+            return
+        try:
+            if self.index_type == "vector":
+                result_iter = self._upsert_to_vector_store(batch)
+            else:
+                result_iter = self._upsert_to_document_index(batch)
+            async for message in result_iter:
+                yield message
+        except Exception as e:
+            logger.error(f"Error in IndexUpsert step {self.step.id}: {e}")
+            # Emit error event to stream so frontend can display it
+            await self.stream_emitter.error(str(e))
+            # Mark all messages with the error and yield them
+            for message in batch:
+                message.set_error(self.step.id, e)
+                yield message
+    async def _upsert_to_vector_store(
+        self, batch: list[FlowMessage]
+    ) -> AsyncIterator[FlowMessage]:
+        """Upsert items to vector store.
+        Args:
+            items: List of RAGChunk or RAGDocument objects
+        """
+        # safe since semantic validation checks input length
+        input_var = self.step.inputs[0]
+        # Collect all RAGChunks or RAGDocuments from the batch inputs
+        items = []
+        for message in batch:
+            input_data = message.variables.get(input_var.id)
+            if not isinstance(input_data, (RAGChunk, RAGDocument)):
+                raise ValueError(
+                    f"IndexUpsert only supports RAGChunk or RAGDocument "
+                    f"inputs. Got: {type(input_data)}"
+                )
+            items.append(input_data)
+        # Convert to LlamaIndex TextNode objects
+        nodes = []
+        for item in items:
+            if isinstance(item, RAGChunk):
+                node = TextNode(
+                    id_=item.chunk_id,
+                    text=str(item.content),
+                    metadata=item.metadata,
+                    embedding=item.vector,
+                )
+            else:  # RAGDocument
+                # For documents, use file_id and convert content to string
+                node = TextNode(
+                    id_=item.file_id,
+                    text=str(item.content),
+                    metadata=item.metadata,
+                    embedding=None,  # Documents don't have embeddings
+                )
+            nodes.append(node)
+        # Batch upsert all nodes to the vector store
+        await self._vector_store.async_add(nodes)
+        num_inserted = len(items)
+        # Emit status update
+        await self.stream_emitter.status(
+            f"Upserted {num_inserted} items to index {self.step.index.name}"
+        )
+        for message in batch:
+            yield message
+    async def _upsert_to_document_index(
+        self, batch: list[FlowMessage]
+    ) -> AsyncIterator[FlowMessage]:
+        """Upsert items to document index using bulk API.
+        Args:
+            batch: List of FlowMessages containing documents to upsert
+        """
+        bulk_body = []
+        message_by_id: dict[str, FlowMessage] = {}
+        for message in batch:
+            # Collect all input variables into a single document dict
+            doc_dict = {}
+            for input_var in self.step.inputs:
+                value = message.variables.get(input_var.id)
+                # Convert to dict if it's a Pydantic model
+                if isinstance(value, BaseModel):
+                    value = value.model_dump()
+                # Merge into document dict
+                if isinstance(value, dict):
+                    doc_dict.update(value)
+                else:
+                    # Primitive types - use variable name as field name
+                    doc_dict[input_var.id] = value
+            # Determine the document id field
+            id_field = None
+            if self._document_index.id_field is not None:
+                id_field = self._document_index.id_field
+                if id_field not in doc_dict:
+                    raise ValueError(
+                        f"Specified id_field '{id_field}' not found in inputs"
+                    )
+            else:
+                # Auto-detect with fallback
+                for field in ["_id", "id", "doc_id", "document_id"]:
+                    if field in doc_dict:
+                        id_field = field
+                        break
+            if id_field is not None:
+                doc_id = str(doc_dict[id_field])
+            else:
+                # Generate a UUID if no id field found
+                doc_id = str(uuid.uuid4())
+            # Add bulk action and document
+            bulk_body.append(
+                {"index": {"_index": self.index_name, "_id": doc_id}}
+            )
+            bulk_body.append(doc_dict)
+            message_by_id[doc_id] = message
+        # Execute bulk request asynchronously
+        response = await self._opensearch_client.bulk(body=bulk_body)
+        num_inserted = 0
+        for item in response["items"]:
+            doc_id = item["index"]["_id"]
+            message = message_by_id[doc_id]
+            if "error" in item.get("index", {}):
+                message.set_error(
+                    self.step.id,
+                    Exception(item["index"]["error"]),
+                )
+            else:
+                num_inserted += 1
+            yield message
+        await self.stream_emitter.status(
+            f"Upserted {num_inserted} items to index {self.step.index.name}, {len(batch) - num_inserted} errors occurred."
+        )

qtype/interpreter/executors/invoke_embedding_executor.py ADDED Viewed

@@ -0,0 +1,92 @@
+from typing import AsyncIterator
+from openinference.semconv.trace import OpenInferenceSpanKindValues
+from qtype.base.types import PrimitiveTypeEnum
+from qtype.dsl.domain_types import Embedding
+from qtype.interpreter.base.base_step_executor import StepExecutor
+from qtype.interpreter.base.executor_context import ExecutorContext
+from qtype.interpreter.conversions import to_embedding_model
+from qtype.interpreter.types import FlowMessage
+from qtype.semantic.model import InvokeEmbedding
+class InvokeEmbeddingExecutor(StepExecutor):
+    """Executor for InvokeEmbedding steps."""
+    # Embedding operations should be marked as EMBEDDING type
+    span_kind = OpenInferenceSpanKindValues.EMBEDDING
+    def __init__(
+        self, step: InvokeEmbedding, context: ExecutorContext, **dependencies
+    ):
+        super().__init__(step, context, **dependencies)
+        if not isinstance(step, InvokeEmbedding):
+            raise ValueError(
+                (
+                    "InvokeEmbeddingExecutor can only execute "
+                    "InvokeEmbedding steps."
+                )
+            )
+        self.step: InvokeEmbedding = step
+        # Initialize the embedding model once for the executor
+        self.embedding_model = to_embedding_model(self.step.model)
+    async def process_message(
+        self,
+        message: FlowMessage,
+    ) -> AsyncIterator[FlowMessage]:
+        """Process a single FlowMessage for the InvokeEmbedding step.
+        Args:
+            message: The FlowMessage to process.
+        Yields:
+            FlowMessage with embedding.
+        """
+        input_id = self.step.inputs[0].id
+        input_type = self.step.inputs[0].type
+        output_id = self.step.outputs[0].id
+        try:
+            # Get the input value
+            input_value = message.variables.get(input_id)
+            if input_value is None:
+                raise ValueError(f"Input variable '{input_id}' is missing")
+            # Generate embedding based on input type
+            if input_type == PrimitiveTypeEnum.text:
+                if not isinstance(input_value, str):
+                    input_value = str(input_value)
+                vector = await self.embedding_model.aget_text_embedding(
+                    text=input_value
+                )
+                content = input_value
+            elif input_type == PrimitiveTypeEnum.image:
+                # For image embeddings
+                vector = await self.embedding_model.aget_image_embedding(
+                    image_path=input_value
+                )
+                content = input_value
+            else:
+                raise ValueError(
+                    (
+                        f"Unsupported input type for embedding: "
+                        f"{input_type}. Must be 'text' or 'image'."
+                    )
+                )
+            # Create the Embedding object
+            embedding = Embedding(
+                vector=vector,
+                content=content,
+            )
+            # Yield the result
+            yield message.copy_with_variables({output_id: embedding})
+        except Exception as e:
+            # Emit error event to stream so frontend can display it
+            await self.stream_emitter.error(str(e))
+            message.set_error(self.step.id, e)
+            yield message

qtype/interpreter/executors/invoke_flow_executor.py ADDED Viewed

@@ -0,0 +1,51 @@
+from typing import AsyncIterator
+from qtype.interpreter.base.base_step_executor import StepExecutor
+from qtype.interpreter.base.executor_context import ExecutorContext
+from qtype.interpreter.types import FlowMessage
+from qtype.semantic.model import InvokeFlow
+class InvokeFlowExecutor(StepExecutor):
+    """Executor for InvokeFlow steps."""
+    def __init__(
+        self, step: InvokeFlow, context: ExecutorContext, **dependencies
+    ):
+        super().__init__(step, context, **dependencies)
+        if not isinstance(step, InvokeFlow):
+            raise ValueError(
+                ("InvokeFlowExecutor can only execute InvokeFlow steps.")
+            )
+        self.step: InvokeFlow = step
+    async def process_message(
+        self, message: FlowMessage
+    ) -> AsyncIterator[FlowMessage]:
+        """Process a single FlowMessage for the InvokeFlow step.
+        Args:
+            message: The FlowMessage to process.
+        Yields:
+            FlowMessage with results from the invoked flow.
+        """
+        from qtype.interpreter.flow import run_flow
+        initial = message.copy_with_variables(
+            {
+                id: message.variables.get(var.id)
+                for var, id in self.step.input_bindings.items()
+            }
+        )
+        # Pass through context (already available as self.context)
+        result = await run_flow(
+            self.step.flow, [initial], context=self.context
+        )
+        for msg in result:
+            yield msg.copy_with_variables(
+                {
+                    var.id: msg.variables.get(id)
+                    for var, id in self.step.output_bindings.items()
+                }
+            )

qtype 0.0.12__py3-none-any.whl → 0.1.3__py3-none-any.whl

qtype 0.0.12py3-none-any.whl → 0.1.3py3-none-any.whl