PyPI - qtype - Versions diffs - 0.0.12__py3-none-any.whl → 0.1.7__py3-none-any.whl - Mend

qtype 0.0.12py3-none-any.whl → 0.1.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (137) hide show

qtype/application/commons/tools.py +1 -1
qtype/application/converters/tools_from_api.py +476 -11
qtype/application/converters/tools_from_module.py +38 -14
qtype/application/converters/types.py +15 -30
qtype/application/documentation.py +1 -1
qtype/application/facade.py +102 -85
qtype/base/types.py +227 -7
qtype/cli.py +5 -1
qtype/commands/convert.py +52 -6
qtype/commands/generate.py +44 -4
qtype/commands/run.py +78 -36
qtype/commands/serve.py +74 -44
qtype/commands/validate.py +37 -14
qtype/commands/visualize.py +46 -25
qtype/dsl/__init__.py +6 -5
qtype/dsl/custom_types.py +1 -1
qtype/dsl/domain_types.py +86 -5
qtype/dsl/linker.py +384 -0
qtype/dsl/loader.py +315 -0
qtype/dsl/model.py +753 -264
qtype/dsl/parser.py +200 -0
qtype/dsl/types.py +50 -0
qtype/interpreter/api.py +63 -136
qtype/interpreter/auth/aws.py +19 -9
qtype/interpreter/auth/generic.py +93 -16
qtype/interpreter/base/base_step_executor.py +436 -0
qtype/interpreter/base/batch_step_executor.py +171 -0
qtype/interpreter/base/exceptions.py +50 -0
qtype/interpreter/base/executor_context.py +91 -0
qtype/interpreter/base/factory.py +84 -0
qtype/interpreter/base/progress_tracker.py +110 -0
qtype/interpreter/base/secrets.py +339 -0
qtype/interpreter/base/step_cache.py +74 -0
qtype/interpreter/base/stream_emitter.py +469 -0
qtype/interpreter/conversions.py +495 -24
qtype/interpreter/converters.py +79 -0
qtype/interpreter/endpoints.py +355 -0
qtype/interpreter/executors/agent_executor.py +242 -0
qtype/interpreter/executors/aggregate_executor.py +93 -0
qtype/interpreter/executors/bedrock_reranker_executor.py +195 -0
qtype/interpreter/executors/decoder_executor.py +163 -0
qtype/interpreter/executors/doc_to_text_executor.py +112 -0
qtype/interpreter/executors/document_embedder_executor.py +123 -0
qtype/interpreter/executors/document_search_executor.py +113 -0
qtype/interpreter/executors/document_source_executor.py +118 -0
qtype/interpreter/executors/document_splitter_executor.py +105 -0
qtype/interpreter/executors/echo_executor.py +63 -0
qtype/interpreter/executors/field_extractor_executor.py +165 -0
qtype/interpreter/executors/file_source_executor.py +101 -0
qtype/interpreter/executors/file_writer_executor.py +110 -0
qtype/interpreter/executors/index_upsert_executor.py +232 -0
qtype/interpreter/executors/invoke_embedding_executor.py +104 -0
qtype/interpreter/executors/invoke_flow_executor.py +51 -0
qtype/interpreter/executors/invoke_tool_executor.py +358 -0
qtype/interpreter/executors/llm_inference_executor.py +272 -0
qtype/interpreter/executors/prompt_template_executor.py +78 -0
qtype/interpreter/executors/sql_source_executor.py +106 -0
qtype/interpreter/executors/vector_search_executor.py +91 -0
qtype/interpreter/flow.py +172 -22
qtype/interpreter/logging_progress.py +61 -0
qtype/interpreter/metadata_api.py +115 -0
qtype/interpreter/resource_cache.py +5 -4
qtype/interpreter/rich_progress.py +225 -0
qtype/interpreter/stream/chat/__init__.py +15 -0
qtype/interpreter/stream/chat/converter.py +391 -0
qtype/interpreter/{chat → stream/chat}/file_conversions.py +2 -2
qtype/interpreter/stream/chat/ui_request_to_domain_type.py +140 -0
qtype/interpreter/stream/chat/vercel.py +609 -0
qtype/interpreter/stream/utils/__init__.py +15 -0
qtype/interpreter/stream/utils/build_vercel_ai_formatter.py +74 -0
qtype/interpreter/stream/utils/callback_to_stream.py +66 -0
qtype/interpreter/stream/utils/create_streaming_response.py +18 -0
qtype/interpreter/stream/utils/default_chat_extract_text.py +20 -0
qtype/interpreter/stream/utils/error_streaming_response.py +20 -0
qtype/interpreter/telemetry.py +135 -8
qtype/interpreter/tools/__init__.py +5 -0
qtype/interpreter/tools/function_tool_helper.py +265 -0
qtype/interpreter/types.py +330 -0
qtype/interpreter/typing.py +83 -89
qtype/interpreter/ui/404/index.html +1 -1
qtype/interpreter/ui/404.html +1 -1
qtype/interpreter/ui/_next/static/{OT8QJQW3J70VbDWWfrEMT → 20HoJN6otZ_LyHLHpCPE6}/_buildManifest.js +1 -1
qtype/interpreter/ui/_next/static/chunks/434-b2112d19f25c44ff.js +36 -0
qtype/interpreter/ui/_next/static/chunks/{964-ed4ab073db645007.js → 964-2b041321a01cbf56.js} +1 -1
qtype/interpreter/ui/_next/static/chunks/app/{layout-5ccbc44fd528d089.js → layout-a05273ead5de2c41.js} +1 -1
qtype/interpreter/ui/_next/static/chunks/app/page-8c67d16ac90d23cb.js +1 -0
qtype/interpreter/ui/_next/static/chunks/ba12c10f-546f2714ff8abc66.js +1 -0
qtype/interpreter/ui/_next/static/chunks/{main-6d261b6c5d6fb6c2.js → main-e26b9cb206da2cac.js} +1 -1
qtype/interpreter/ui/_next/static/chunks/webpack-08642e441b39b6c2.js +1 -0
qtype/interpreter/ui/_next/static/css/8a8d1269e362fef7.css +3 -0
qtype/interpreter/ui/_next/static/media/4cf2300e9c8272f7-s.p.woff2 +0 -0
qtype/interpreter/ui/icon.png +0 -0
qtype/interpreter/ui/index.html +1 -1
qtype/interpreter/ui/index.txt +5 -5
qtype/semantic/checker.py +643 -0
qtype/semantic/generate.py +268 -85
qtype/semantic/loader.py +95 -0
qtype/semantic/model.py +535 -163
qtype/semantic/resolver.py +63 -19
qtype/semantic/visualize.py +50 -35
{qtype-0.0.12.dist-info → qtype-0.1.7.dist-info}/METADATA +22 -5
qtype-0.1.7.dist-info/RECORD +137 -0
qtype/dsl/base_types.py +0 -38
qtype/dsl/validator.py +0 -464
qtype/interpreter/batch/__init__.py +0 -0
qtype/interpreter/batch/flow.py +0 -95
qtype/interpreter/batch/sql_source.py +0 -95
qtype/interpreter/batch/step.py +0 -63
qtype/interpreter/batch/types.py +0 -41
qtype/interpreter/batch/utils.py +0 -179
qtype/interpreter/chat/chat_api.py +0 -237
qtype/interpreter/chat/vercel.py +0 -314
qtype/interpreter/exceptions.py +0 -10
qtype/interpreter/step.py +0 -67
qtype/interpreter/steps/__init__.py +0 -0
qtype/interpreter/steps/agent.py +0 -114
qtype/interpreter/steps/condition.py +0 -36
qtype/interpreter/steps/decoder.py +0 -88
qtype/interpreter/steps/llm_inference.py +0 -150
qtype/interpreter/steps/prompt_template.py +0 -54
qtype/interpreter/steps/search.py +0 -24
qtype/interpreter/steps/tool.py +0 -53
qtype/interpreter/streaming_helpers.py +0 -123
qtype/interpreter/ui/_next/static/chunks/736-7fc606e244fedcb1.js +0 -36
qtype/interpreter/ui/_next/static/chunks/app/page-c72e847e888e549d.js +0 -1
qtype/interpreter/ui/_next/static/chunks/ba12c10f-22556063851a6df2.js +0 -1
qtype/interpreter/ui/_next/static/chunks/webpack-8289c17c67827f22.js +0 -1
qtype/interpreter/ui/_next/static/css/a262c53826df929b.css +0 -3
qtype/interpreter/ui/_next/static/media/569ce4b8f30dc480-s.p.woff2 +0 -0
qtype/interpreter/ui/favicon.ico +0 -0
qtype/loader.py +0 -389
qtype-0.0.12.dist-info/RECORD +0 -105
/qtype/interpreter/ui/_next/static/{OT8QJQW3J70VbDWWfrEMT → 20HoJN6otZ_LyHLHpCPE6}/_ssgManifest.js +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.7.dist-info}/WHEEL +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.7.dist-info}/entry_points.txt +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.7.dist-info}/licenses/LICENSE +0 -0
{qtype-0.0.12.dist-info → qtype-0.1.7.dist-info}/top_level.txt +0 -0

qtype/interpreter/conversions.py CHANGED Viewed

@@ -1,5 +1,9 @@
 from __future__ import annotations
+import importlib
+import uuid
+from typing import Any
 from llama_index.core.base.embeddings.base import BaseEmbedding
 from llama_index.core.base.llms.base import BaseLLM
 from llama_index.core.base.llms.types import AudioBlock
@@ -9,18 +13,153 @@ from llama_index.core.base.llms.types import (
     DocumentBlock,
     ImageBlock,
     TextBlock,
+    ThinkingBlock,
 )
 from llama_index.core.memory import Memory as LlamaMemory
+from llama_index.core.schema import Document as LlamaDocument
+from llama_index.core.vector_stores.types import BasePydanticVectorStore
+from opensearchpy import AsyncOpenSearch, AWSV4SignerAuth
-from qtype.dsl.base_types import PrimitiveTypeEnum
-from qtype.dsl.domain_types import ChatContent, ChatMessage
+from qtype.base.types import PrimitiveTypeEnum
+from qtype.dsl.domain_types import (
+    ChatContent,
+    ChatMessage,
+    RAGDocument,
+    RAGSearchResult,
+)
 from qtype.dsl.model import Memory
-from qtype.interpreter.exceptions import InterpreterError
-from qtype.semantic.model import Model
+from qtype.interpreter.auth.aws import aws
+from qtype.interpreter.auth.generic import auth
+from qtype.interpreter.base.secrets import SecretManagerBase
+from qtype.interpreter.types import InterpreterError
+from qtype.semantic.model import (
+    APIKeyAuthProvider,
+    AWSAuthProvider,
+    DocumentIndex,
+    DocumentSplitter,
+    Model,
+    VectorIndex,
+)
 from .resource_cache import cached_resource
+def to_llama_document(doc: RAGDocument) -> LlamaDocument:
+    """Convert a RAGDocument to a LlamaDocument."""
+    from llama_index.core.schema import MediaResource
+    # Prepare metadata, adding file_name and uri if available
+    metadata = doc.metadata.copy() if doc.metadata else {}
+    if doc.file_name:
+        metadata["file_name"] = doc.file_name
+    if doc.uri:
+        metadata["url"] = (
+            doc.uri
+        )  # url is more commonly used in LlamaIndex metadata
+    # Default text content
+    text = ""
+    if isinstance(doc.content, str):
+        text = doc.content
+    # Handle different content types
+    if doc.type == PrimitiveTypeEnum.text:
+        # Text content - store as text field
+        return LlamaDocument(text=text, doc_id=doc.file_id, metadata=metadata)
+    elif doc.type == PrimitiveTypeEnum.image and isinstance(
+        doc.content, bytes
+    ):
+        # Image content - store in image_resource
+        return LlamaDocument(
+            text=text,  # Keep text empty or use as description
+            doc_id=doc.file_id,
+            metadata=metadata,
+            image_resource=MediaResource(data=doc.content),
+        )
+    elif doc.type == PrimitiveTypeEnum.audio and isinstance(
+        doc.content, bytes
+    ):
+        # Audio content - store in audio_resource
+        return LlamaDocument(
+            text=text,
+            doc_id=doc.file_id,
+            metadata=metadata,
+            audio_resource=MediaResource(data=doc.content),
+        )
+    elif doc.type == PrimitiveTypeEnum.video and isinstance(
+        doc.content, bytes
+    ):
+        # Video content - store in video_resource
+        return LlamaDocument(
+            text=text,
+            doc_id=doc.file_id,
+            metadata=metadata,
+            video_resource=MediaResource(data=doc.content),
+        )
+    else:
+        # Fallback for other types - store as text
+        return LlamaDocument(
+            text=str(doc.content) if doc.content else "",
+            doc_id=doc.file_id,
+            metadata=metadata,
+        )
+def from_llama_document(doc: LlamaDocument) -> RAGDocument:
+    """Convert a LlamaDocument to a RAGDocument."""
+    # Extract file_id from doc_id or id_
+    file_id = doc.doc_id
+    # Extract file_name from metadata or use file_id as fallback
+    file_name = (
+        doc.metadata.get("file_name", file_id) if doc.metadata else file_id
+    )
+    # Extract URI from metadata if available
+    uri = (
+        doc.metadata.get("url") or doc.metadata.get("uri")
+        if doc.metadata
+        else None
+    )
+    # Determine content type and extract content based on resource fields
+    content_type = PrimitiveTypeEnum.text
+    content: str | bytes = doc.text  # default to text
+    # Check for media resources in priority order
+    if hasattr(doc, "image_resource") and doc.image_resource is not None:
+        content_type = PrimitiveTypeEnum.image
+        # MediaResource has a 'data' field containing the bytes
+        content = (
+            doc.image_resource.data
+            if hasattr(doc.image_resource, "data")
+            else doc.text
+        )  # type: ignore
+    elif hasattr(doc, "audio_resource") and doc.audio_resource is not None:
+        content_type = PrimitiveTypeEnum.audio
+        content = (
+            doc.audio_resource.data
+            if hasattr(doc.audio_resource, "data")
+            else doc.text
+        )  # type: ignore
+    elif hasattr(doc, "video_resource") and doc.video_resource is not None:
+        content_type = PrimitiveTypeEnum.video
+        content = (
+            doc.video_resource.data
+            if hasattr(doc.video_resource, "data")
+            else doc.text
+        )  # type: ignore
+    return RAGDocument(
+        content=content,
+        file_id=file_id,
+        file_name=file_name,
+        uri=uri,
+        metadata=doc.metadata.copy() if doc.metadata else {},
+        type=content_type,
+    )
 @cached_resource
 def to_memory(session_id: str | None, memory: Memory) -> LlamaMemory:
     return LlamaMemory.from_defaults(
@@ -32,17 +171,38 @@ def to_memory(session_id: str | None, memory: Memory) -> LlamaMemory:
 @cached_resource
-def to_llm(model: Model, system_prompt: str | None) -> BaseLLM:
-    """Convert a qtype Model to a LlamaIndex Model."""
+def to_llm(
+    model: Model,
+    system_prompt: str | None,
+    secret_manager: SecretManagerBase,
+) -> BaseLLM:
+    """
+    Convert a qtype Model to a LlamaIndex Model.
-    if model.provider in "aws-bedrock":
-        # BedrockConverse requires a model_id and system_prompt
-        # Inference params can be passed as additional kwargs
-        from llama_index.llms.bedrock_converse import (  # type: ignore[import]
-            BedrockConverse,
-        )
+    Args:
+        model: The semantic model configuration
+        system_prompt: Optional system prompt for the model
+        secret_manager: Optional secret manager for resolving SecretReferences
+    Returns:
+        A LlamaIndex LLM instance
+    """
+    if model.provider == "aws-bedrock":
+        from llama_index.llms.bedrock_converse import BedrockConverse
+        from qtype.semantic.model import AWSAuthProvider
+        if model.auth:
+            # Type hint for mypy - we know it's AWSAuthProvider for aws-bedrock
+            assert isinstance(model.auth, AWSAuthProvider)
+            with aws(model.auth, secret_manager) as session:
+                session = session._session
+        else:
+            session = None
         brv: BaseLLM = BedrockConverse(
+            botocore_session=session,
             model=model.model_id if model.model_id else model.id,
             system_prompt=system_prompt,
             **(model.inference_params if model.inference_params else {}),
@@ -51,28 +211,67 @@ def to_llm(model: Model, system_prompt: str | None) -> BaseLLM:
     elif model.provider == "openai":
         from llama_index.llms.openai import OpenAI
+        from qtype.interpreter.auth.generic import auth
+        from qtype.semantic.model import APIKeyAuthProvider
+        api_key: str | None = None
+        if model.auth:
+            with auth(model.auth, secret_manager) as provider:
+                if not isinstance(provider, APIKeyAuthProvider):
+                    raise InterpreterError(
+                        f"OpenAI provider requires APIKeyAuthProvider, "
+                        f"got {type(provider).__name__}"
+                    )
+                # api_key is guaranteed to be str after auth() resolves it
+                api_key = provider.api_key  # type: ignore[assignment]
         return OpenAI(
             model=model.model_id if model.model_id else model.id,
             system_prompt=system_prompt,
             **(model.inference_params if model.inference_params else {}),
-            api_key=getattr(model.auth, "api_key", None)
-            if model.auth
-            else None,
+            api_key=api_key,
         )
     elif model.provider == "anthropic":
         from llama_index.llms.anthropic import (  # type: ignore[import-untyped]
             Anthropic,
         )
+        from qtype.interpreter.auth.generic import auth
+        from qtype.semantic.model import APIKeyAuthProvider
+        api_key: str | None = None
+        if model.auth:
+            with auth(model.auth, secret_manager) as provider:
+                if not isinstance(provider, APIKeyAuthProvider):
+                    raise InterpreterError(
+                        f"Anthropic provider requires APIKeyAuthProvider, "
+                        f"got {type(provider).__name__}"
+                    )
+                # api_key is guaranteed to be str after auth() resolves it
+                api_key = provider.api_key  # type: ignore[assignment]
         arv: BaseLLM = Anthropic(
             model=model.model_id if model.model_id else model.id,
             system_prompt=system_prompt,
             **(model.inference_params if model.inference_params else {}),
-            api_key=getattr(model.auth, "api_key", None)
-            if model.auth
-            else None,
+            api_key=api_key,
         )
         return arv
+    elif model.provider == "gcp-vertex":
+        from llama_index.llms.vertex import Vertex
+        project_name = getattr(
+            getattr(model, "auth", None), "profile_name", None
+        )
+        vgv: BaseLLM = Vertex(
+            model=model.model_id if model.model_id else model.id,
+            project=project_name,
+            system_prompt=system_prompt,
+            **(model.inference_params if model.inference_params else {}),
+        )
+        return vgv
     else:
         raise InterpreterError(
             f"Unsupported model provider: {model.provider}."
@@ -80,16 +279,50 @@ def to_llm(model: Model, system_prompt: str | None) -> BaseLLM:
 @cached_resource
-def to_embedding_model(model: Model) -> BaseEmbedding:
+def to_vector_store(
+    index: VectorIndex, secret_manager: SecretManagerBase
+) -> BasePydanticVectorStore:
+    """Convert a qtype Index to a LlamaIndex vector store."""
+    module_path = ".".join(index.module.split(".")[:-1])
+    class_name = index.module.split(".")[-1]
+    # Dynamically import the reader module
+    try:
+        reader_module = importlib.import_module(module_path)
+        reader_class = getattr(reader_module, class_name)
+    except (ImportError, AttributeError) as e:
+        raise ImportError(
+            f"Failed to import reader class '{class_name}' from '{module_path}': {e}"
+        ) from e
+    # Resolve any SecretReferences in args
+    context = f"index '{index.id}'"
+    resolved_args = secret_manager.resolve_secrets_in_dict(index.args, context)
+    index_instance = reader_class(**resolved_args)
+    return index_instance
+@cached_resource
+def to_embedding_model(
+    model: Model, secret_manager: SecretManagerBase
+) -> BaseEmbedding:
     """Convert a qtype Model to a LlamaIndex embedding model."""
-    if model.provider in {"bedrock", "aws", "aws-bedrock"}:
+    if model.provider == "aws-bedrock":
         from llama_index.embeddings.bedrock import (  # type: ignore[import-untyped]
             BedrockEmbedding,
         )
+        session = None
+        if model.auth is not None:
+            assert isinstance(model.auth, AWSAuthProvider)
+            with aws(model.auth, secret_manager) as session:
+                session = session._session
         bedrock_embedding: BaseEmbedding = BedrockEmbedding(
-            model_name=model.model_id if model.model_id else model.id
+            botocore_session=session,
+            model_name=model.model_id if model.model_id else model.id,
+            max_retries=100,
         )
         return bedrock_embedding
     elif model.provider == "openai":
@@ -97,8 +330,20 @@ def to_embedding_model(model: Model) -> BaseEmbedding:
             OpenAIEmbedding,
         )
+        api_key = None
+        if model.auth:
+            with auth(model.auth, secret_manager) as provider:
+                if not isinstance(provider, APIKeyAuthProvider):
+                    raise InterpreterError(
+                        f"OpenAI provider requires APIKeyAuthProvider, "
+                        f"got {type(provider).__name__}"
+                    )
+                # api_key is guaranteed to be str after auth() resolves it
+                api_key = provider.api_key  # type: ignore[assignment]
         openai_embedding: BaseEmbedding = OpenAIEmbedding(
-            model_name=model.model_id if model.model_id else model.id
+            api_key=api_key,
+            model_name=model.model_id if model.model_id else model.id,
         )
         return openai_embedding
     else:
@@ -107,6 +352,61 @@ def to_embedding_model(model: Model) -> BaseEmbedding:
         )
+@cached_resource
+def to_opensearch_client(
+    index: DocumentIndex, secret_manager: SecretManagerBase
+) -> AsyncOpenSearch:
+    """
+    Convert a DocumentIndex to an OpenSearch/Elasticsearch client.
+    Args:
+        index: DocumentIndex configuration with endpoint, auth, etc.
+    Returns:
+        OpenSearch client instance configured with authentication
+    Raises:
+        InterpreterError: If authentication fails or configuration is invalid
+    """
+    client_kwargs: dict[str, Any] = {
+        "hosts": [index.endpoint],
+        **index.args,
+    }
+    # Handle authentication if provided
+    if index.auth:
+        if isinstance(index.auth, APIKeyAuthProvider):
+            # Use API key authentication
+            client_kwargs["api_key"] = index.auth.api_key
+        elif hasattr(index.auth, "type") and index.auth.type == "aws":
+            # Use AWS authentication with boto3 session
+            # Get AWS credentials from auth provider using context manager
+            with auth(index.auth, secret_manager) as auth_session:
+                # Type checker doesn't know this is a boto3.Session
+                # but runtime validation ensures it for AWS auth
+                credentials = auth_session.get_credentials()  # type: ignore
+                if credentials is None:
+                    raise InterpreterError(
+                        f"Failed to obtain AWS credentials for DocumentIndex '{index.id}'"
+                    )
+                # Use opensearch-py's built-in AWS auth
+                aws_auth = AWSV4SignerAuth(
+                    credentials,
+                    auth_session.region_name or "us-east-1",  # type: ignore
+                )
+                client_kwargs["http_auth"] = aws_auth
+                client_kwargs["use_ssl"] = True
+                client_kwargs["verify_certs"] = True
+        else:
+            raise InterpreterError(
+                f"Unsupported authentication type for DocumentIndex: {type(index.auth)}"
+            )
+    return AsyncOpenSearch(**client_kwargs)
 def to_content_block(content: ChatContent) -> ContentBlock:
     if content.type == PrimitiveTypeEnum.text:
         if isinstance(content.content, str):
@@ -132,6 +432,61 @@ def to_content_block(content: ChatContent) -> ContentBlock:
     )
+def variable_to_chat_message(
+    value: Any, variable: Any, default_role: str = "user"
+) -> ChatMessage:
+    """Convert any variable value to a ChatMessage based on the variable's type.
+    Args:
+        value: The value to convert (can be any primitive type or ChatMessage)
+        variable: The Variable definition with type information
+        default_role: The default message role to use (default: "user")
+    Returns:
+        ChatMessage with appropriate content blocks
+    Raises:
+        InterpreterError: If the value type cannot be converted
+    """
+    # If already a ChatMessage, return as-is
+    if isinstance(value, ChatMessage):
+        return value
+    # Convert based on the variable's declared type
+    var_type = variable.type
+    # Handle primitive types based on variable declaration
+    if isinstance(var_type, PrimitiveTypeEnum):
+        # Numeric/boolean types get converted to text
+        if var_type in (
+            PrimitiveTypeEnum.int,
+            PrimitiveTypeEnum.float,
+            PrimitiveTypeEnum.boolean,
+        ):
+            content = ChatContent(
+                type=PrimitiveTypeEnum.text, content=str(value)
+            )
+        # All other primitive types pass through as-is
+        else:
+            content = ChatContent(type=var_type, content=value)
+    elif isinstance(var_type, str) and (
+        var_type.startswith("list[") or var_type.startswith("dict[")
+    ):
+        # Handle list and dict types - convert to JSON string
+        import json
+        content = ChatContent(
+            type=PrimitiveTypeEnum.text, content=json.dumps(value)
+        )
+    else:
+        # Unsupported type - raise an error
+        raise InterpreterError(
+            f"Cannot convert variable '{variable.id}' of unsupported type "
+            f"'{var_type}' to ChatMessage"
+        )
+    return ChatMessage(role=default_role, blocks=[content])  # type: ignore
 def to_chat_message(message: ChatMessage) -> LlamaChatMessage:
     """Convert a ChatMessage to a LlamaChatMessage."""
     blocks = [to_content_block(content) for content in message.blocks]
@@ -140,7 +495,7 @@ def to_chat_message(message: ChatMessage) -> LlamaChatMessage:
 def from_chat_message(message: LlamaChatMessage) -> ChatMessage:
     """Convert a LlamaChatMessage to a ChatMessage."""
-    blocks = []
+    blocks: list[ChatContent] = []
     for block in message.blocks:
         if isinstance(block, TextBlock):
             blocks.append(
@@ -158,9 +513,125 @@ def from_chat_message(message: LlamaChatMessage) -> ChatMessage:
             blocks.append(
                 ChatContent(type=PrimitiveTypeEnum.file, content=block.data)
             )
+        elif isinstance(block, ThinkingBlock):
+            continue
         else:
             raise InterpreterError(
                 f"Unsupported content block type: {type(block)}"
             )
-    return ChatMessage(role=message.role, blocks=blocks)  # type: ignore
+    return ChatMessage(role=message.role, blocks=blocks)
+def to_text_splitter(splitter: DocumentSplitter) -> Any:
+    """Convert a DocumentSplitter to a LlamaIndex text splitter.
+    Args:
+        splitter: The DocumentSplitter configuration.
+    Returns:
+        An instance of the appropriate LlamaIndex text splitter class.
+    Raises:
+        InterpreterError: If the splitter class cannot be found or instantiated.
+    """
+    module_path = "llama_index.core.node_parser"
+    class_name = splitter.splitter_name
+    try:
+        reader_module = importlib.import_module(module_path)
+        splitter_class = getattr(reader_module, class_name)
+    except (ImportError, AttributeError) as e:
+        raise ImportError(
+            f"Failed to import reader class '{class_name}' from '{module_path}': {e}"
+        ) from e
+    from llama_index.core.schema import BaseNode
+    # TODO: let the user specify a custom ID namespace
+    namespace = uuid.UUID("12345678-1234-5678-1234-567812345678")
+    def id_func(i: int, doc: BaseNode) -> str:
+        u = uuid.uuid5(namespace, f"{doc.node_id}_{i}")
+        return str(u)
+    # Prepare arguments for the splitter
+    splitter_args = {
+        "chunk_size": splitter.chunk_size,
+        "chunk_overlap": splitter.chunk_overlap,
+        "id_func": id_func,
+        **splitter.args,
+    }
+    # Instantiate and return the splitter
+    try:
+        return splitter_class(**splitter_args)
+    except Exception as e:
+        raise InterpreterError(
+            f"Failed to instantiate {splitter.splitter_name}: {e}"
+        ) from e
+def to_llama_vector_store_and_retriever(
+    index: VectorIndex, secret_manager: SecretManagerBase
+) -> tuple[BasePydanticVectorStore, Any]:
+    """Create a LlamaIndex vector store and retriever from a VectorIndex.
+    Args:
+        index: VectorIndex configuration
+    Returns:
+        Tuple of (vector_store, retriever)
+    """
+    from llama_index.core import VectorStoreIndex
+    # Get the vector store using existing function
+    vector_store = to_vector_store(index, secret_manager)
+    # Get the embedding model
+    embedding_model = to_embedding_model(index.embedding_model, secret_manager)
+    # Create a VectorStoreIndex with the vector store and embedding model
+    vector_index = VectorStoreIndex.from_vector_store(
+        vector_store=vector_store,
+        embed_model=embedding_model,
+    )
+    # Create retriever with optional top_k configuration
+    retriever = vector_index.as_retriever()
+    return vector_store, retriever
+def from_node_with_score(node_with_score) -> RAGSearchResult:
+    """Convert a LlamaIndex NodeWithScore to a RAGSearchResult.
+    Args:
+        node_with_score: LlamaIndex NodeWithScore object
+    Returns:
+        RAGSearchResult with chunk and score
+    """
+    from qtype.dsl.domain_types import RAGChunk, RAGSearchResult
+    node = node_with_score.node
+    # Extract vector if available
+    vector = None
+    if hasattr(node, "embedding") and node.embedding is not None:
+        vector = node.embedding
+    # Create RAGChunk from node
+    chunk = RAGChunk(
+        content=node.text or "",
+        chunk_id=node.node_id,
+        document_id=node.metadata.get("document_id", node.node_id),
+        vector=vector,
+        metadata=node.metadata or {},
+    )
+    # Wrap in RAGSearchResult with score
+    return RAGSearchResult(
+        content=chunk,
+        doc_id=chunk.document_id,
+        score=node_with_score.score or 0.0,
+    )

qtype/interpreter/converters.py ADDED Viewed

@@ -0,0 +1,79 @@
+"""Converters between DataFrames and FlowMessages."""
+from __future__ import annotations
+from collections.abc import AsyncIterator
+from typing import Any, cast
+import pandas as pd
+from pydantic import BaseModel
+from qtype.interpreter.types import FlowMessage, Session
+from qtype.semantic.model import Flow
+async def dataframe_to_flow_messages(
+    df: pd.DataFrame, session: Session
+) -> AsyncIterator[FlowMessage]:
+    """
+    Convert a DataFrame to an async generator of FlowMessages.
+    Each row in the DataFrame becomes a FlowMessage with the same session.
+    Args:
+        df: DataFrame where each row represents one set of inputs
+        session: Session object to use for all messages
+    Yields:
+        FlowMessages, one per DataFrame row
+    """
+    # Use to_dict with orient='records' - much faster than iterrows
+    # This returns a list of dicts directly without Series overhead
+    records = cast(list[dict[str, Any]], df.to_dict(orient="records"))
+    for record in records:
+        yield FlowMessage(session=session, variables=record)
+def flow_messages_to_dataframe(
+    messages: list[FlowMessage], flow: Flow
+) -> pd.DataFrame:
+    """
+    Convert a list of FlowMessages to a DataFrame.
+    Extracts output variables from each message based on the flow's outputs.
+    Args:
+        messages: List of FlowMessages with results
+        flow: Flow definition containing output variable specifications
+    Returns:
+        DataFrame with one row per message, columns for each output variable
+    """
+    results = []
+    for idx, message in enumerate(messages):
+        row_data: dict[str, Any] = {"row": idx}
+        # Extract output variables
+        for var in flow.outputs:
+            if var.id in message.variables:
+                value = message.variables[var.id]
+                if isinstance(value, BaseModel):
+                    value = value.model_dump()
+                row_data[var.id] = value
+            else:
+                row_data[var.id] = None
+        # Include error if present
+        if message.is_failed():
+            row_data["error"] = (
+                message.error.error_message
+                if message.error
+                else "Unknown error"
+            )
+        else:
+            row_data["error"] = None
+        results.append(row_data)
+    return pd.DataFrame(results)

qtype 0.0.12__py3-none-any.whl → 0.1.7__py3-none-any.whl

qtype 0.0.12py3-none-any.whl → 0.1.7py3-none-any.whl