PyPI - vellum-ai - Versions diffs - 1.1.1__py3-none-any.whl → 1.1.3__py3-none-any.whl - Mend

vellum-ai 1.1.1py3-none-any.whl → 1.1.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (85) hide show

vellum/__init__.py +16 -0
vellum/client/README.md +55 -0
vellum/client/__init__.py +66 -507
vellum/client/core/client_wrapper.py +2 -2
vellum/client/core/pydantic_utilities.py +10 -3
vellum/client/raw_client.py +844 -0
vellum/client/reference.md +692 -19
vellum/client/resources/ad_hoc/client.py +23 -180
vellum/client/resources/ad_hoc/raw_client.py +276 -0
vellum/client/resources/container_images/client.py +10 -36
vellum/client/resources/deployments/client.py +16 -62
vellum/client/resources/document_indexes/client.py +16 -72
vellum/client/resources/documents/client.py +8 -30
vellum/client/resources/folder_entities/client.py +4 -8
vellum/client/resources/metric_definitions/client.py +4 -14
vellum/client/resources/ml_models/client.py +2 -8
vellum/client/resources/organizations/client.py +2 -6
vellum/client/resources/prompts/client.py +2 -10
vellum/client/resources/sandboxes/client.py +4 -20
vellum/client/resources/test_suite_runs/client.py +4 -18
vellum/client/resources/test_suites/client.py +11 -86
vellum/client/resources/test_suites/raw_client.py +136 -0
vellum/client/resources/workflow_deployments/client.py +20 -78
vellum/client/resources/workflow_executions/client.py +2 -6
vellum/client/resources/workflow_sandboxes/client.py +2 -10
vellum/client/resources/workflows/client.py +7 -6
vellum/client/resources/workflows/raw_client.py +58 -47
vellum/client/resources/workspace_secrets/client.py +4 -20
vellum/client/resources/workspaces/client.py +2 -6
vellum/client/types/__init__.py +16 -0
vellum/client/types/array_chat_message_content_item.py +4 -2
vellum/client/types/array_chat_message_content_item_request.py +4 -2
vellum/client/types/chat_message_content.py +4 -2
vellum/client/types/chat_message_content_request.py +4 -2
vellum/client/types/node_execution_span.py +2 -0
vellum/client/types/prompt_block.py +4 -2
vellum/client/types/vellum_value.py +4 -2
vellum/client/types/vellum_value_request.py +4 -2
vellum/client/types/vellum_variable_type.py +2 -1
vellum/client/types/vellum_video.py +24 -0
vellum/client/types/vellum_video_request.py +24 -0
vellum/client/types/video_chat_message_content.py +25 -0
vellum/client/types/video_chat_message_content_request.py +25 -0
vellum/client/types/video_prompt_block.py +29 -0
vellum/client/types/video_vellum_value.py +25 -0
vellum/client/types/video_vellum_value_request.py +25 -0
vellum/client/types/workflow_execution_span.py +2 -0
vellum/client/types/workflow_execution_usage_calculation_fulfilled_body.py +22 -0
vellum/prompts/blocks/compilation.py +22 -10
vellum/types/vellum_video.py +3 -0
vellum/types/vellum_video_request.py +3 -0
vellum/types/video_chat_message_content.py +3 -0
vellum/types/video_chat_message_content_request.py +3 -0
vellum/types/video_prompt_block.py +3 -0
vellum/types/video_vellum_value.py +3 -0
vellum/types/video_vellum_value_request.py +3 -0
vellum/types/workflow_execution_usage_calculation_fulfilled_body.py +3 -0
vellum/workflows/events/workflow.py +11 -0
vellum/workflows/graph/graph.py +103 -1
vellum/workflows/graph/tests/test_graph.py +99 -0
vellum/workflows/nodes/bases/base.py +9 -1
vellum/workflows/nodes/displayable/bases/utils.py +4 -2
vellum/workflows/nodes/displayable/tool_calling_node/node.py +19 -18
vellum/workflows/nodes/displayable/tool_calling_node/tests/test_node.py +17 -7
vellum/workflows/nodes/displayable/tool_calling_node/tests/test_utils.py +7 -7
vellum/workflows/nodes/displayable/tool_calling_node/utils.py +47 -80
vellum/workflows/references/environment_variable.py +10 -0
vellum/workflows/runner/runner.py +18 -2
vellum/workflows/state/context.py +101 -12
vellum/workflows/types/definition.py +11 -1
vellum/workflows/types/tests/test_definition.py +19 -0
vellum/workflows/utils/vellum_variables.py +9 -5
vellum/workflows/workflows/base.py +12 -5
{vellum_ai-1.1.1.dist-info → vellum_ai-1.1.3.dist-info}/METADATA +1 -1
{vellum_ai-1.1.1.dist-info → vellum_ai-1.1.3.dist-info}/RECORD +85 -69
vellum_ee/workflows/display/nodes/vellum/code_execution_node.py +1 -1
vellum_ee/workflows/display/nodes/vellum/tests/test_code_execution_node.py +55 -1
vellum_ee/workflows/display/nodes/vellum/tests/test_tool_calling_node.py +15 -52
vellum_ee/workflows/display/tests/workflow_serialization/test_basic_tool_calling_node_mcp_serialization.py +15 -49
vellum_ee/workflows/display/types.py +14 -1
vellum_ee/workflows/display/utils/expressions.py +13 -4
vellum_ee/workflows/display/workflows/base_workflow_display.py +6 -19
{vellum_ai-1.1.1.dist-info → vellum_ai-1.1.3.dist-info}/LICENSE +0 -0
{vellum_ai-1.1.1.dist-info → vellum_ai-1.1.3.dist-info}/WHEEL +0 -0
{vellum_ai-1.1.1.dist-info → vellum_ai-1.1.3.dist-info}/entry_points.txt +0 -0

vellum/client/__init__.py CHANGED Viewed

@@ -5,6 +5,7 @@ from .environment import VellumEnvironment
 from .types.api_version_enum import ApiVersionEnum
 import os
 import httpx
+from .core.api_error import ApiError
 from .core.client_wrapper import SyncClientWrapper
 from .raw_client import RawVellum
 from .resources.ad_hoc.client import AdHocClient
@@ -42,15 +43,6 @@ from .types.prompt_deployment_expand_meta_request import PromptDeploymentExpandM
 from .types.raw_prompt_execution_overrides_request import RawPromptExecutionOverridesRequest
 from .types.execute_prompt_response import ExecutePromptResponse
 from .types.execute_prompt_event import ExecutePromptEvent
-from .core.serialization import convert_and_respect_annotation_metadata
-from .core.pydantic_utilities import parse_obj_as
-import json
-from .errors.bad_request_error import BadRequestError
-from .errors.forbidden_error import ForbiddenError
-from .errors.not_found_error import NotFoundError
-from .errors.internal_server_error import InternalServerError
-from json.decoder import JSONDecodeError
-from .core.api_error import ApiError
 from .types.workflow_request_input_request import WorkflowRequestInputRequest
 from .types.workflow_expand_meta_request import WorkflowExpandMetaRequest
 from .types.execute_workflow_response import ExecuteWorkflowResponse
@@ -476,98 +468,19 @@ class Vellum:
         for chunk in response:
             yield chunk
         """
-        with self._raw_client._client_wrapper.httpx_client.stream(
-            "v1/execute-prompt-stream",
-            base_url=self._raw_client._client_wrapper.get_environment().predict,
-            method="POST",
-            json={
-                "inputs": convert_and_respect_annotation_metadata(
-                    object_=inputs, annotation=typing.Sequence[PromptDeploymentInputRequest], direction="write"
-                ),
-                "prompt_deployment_id": prompt_deployment_id,
-                "prompt_deployment_name": prompt_deployment_name,
-                "release_tag": release_tag,
-                "external_id": external_id,
-                "expand_meta": convert_and_respect_annotation_metadata(
-                    object_=expand_meta,
-                    annotation=typing.Optional[PromptDeploymentExpandMetaRequest],
-                    direction="write",
-                ),
-                "raw_overrides": convert_and_respect_annotation_metadata(
-                    object_=raw_overrides,
-                    annotation=typing.Optional[RawPromptExecutionOverridesRequest],
-                    direction="write",
-                ),
-                "expand_raw": expand_raw,
-                "metadata": metadata,
-            },
-            headers={
-                "content-type": "application/json",
-            },
+        with self._raw_client.execute_prompt_stream(
+            inputs=inputs,
+            prompt_deployment_id=prompt_deployment_id,
+            prompt_deployment_name=prompt_deployment_name,
+            release_tag=release_tag,
+            external_id=external_id,
+            expand_meta=expand_meta,
+            raw_overrides=raw_overrides,
+            expand_raw=expand_raw,
+            metadata=metadata,
             request_options=request_options,
-            omit=OMIT,
-        ) as _response:
-            try:
-                if 200 <= _response.status_code < 300:
-                    for _text in _response.iter_lines():
-                        try:
-                            if len(_text) == 0:
-                                continue
-                            yield typing.cast(
-                                ExecutePromptEvent,
-                                parse_obj_as(
-                                    type_=ExecutePromptEvent,  # type: ignore
-                                    object_=json.loads(_text),
-                                ),
-                            )
-                        except Exception:
-                            pass
-                    return
-                _response.read()
-                if _response.status_code == 400:
-                    raise BadRequestError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 403:
-                    raise ForbiddenError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 404:
-                    raise NotFoundError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 500:
-                    raise InternalServerError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                _response_json = _response.json()
-            except JSONDecodeError:
-                raise ApiError(status_code=_response.status_code, body=_response.text)
-            raise ApiError(status_code=_response.status_code, body=_response_json)
+        ) as r:
+            yield from r.data
     def execute_workflow(
         self,
@@ -721,81 +634,18 @@ class Vellum:
         for chunk in response:
             yield chunk
         """
-        with self._raw_client._client_wrapper.httpx_client.stream(
-            "v1/execute-workflow-stream",
-            base_url=self._raw_client._client_wrapper.get_environment().predict,
-            method="POST",
-            json={
-                "inputs": convert_and_respect_annotation_metadata(
-                    object_=inputs, annotation=typing.Sequence[WorkflowRequestInputRequest], direction="write"
-                ),
-                "expand_meta": convert_and_respect_annotation_metadata(
-                    object_=expand_meta, annotation=typing.Optional[WorkflowExpandMetaRequest], direction="write"
-                ),
-                "workflow_deployment_id": workflow_deployment_id,
-                "workflow_deployment_name": workflow_deployment_name,
-                "release_tag": release_tag,
-                "external_id": external_id,
-                "event_types": event_types,
-                "metadata": metadata,
-            },
-            headers={
-                "content-type": "application/json",
-            },
+        with self._raw_client.execute_workflow_stream(
+            inputs=inputs,
+            expand_meta=expand_meta,
+            workflow_deployment_id=workflow_deployment_id,
+            workflow_deployment_name=workflow_deployment_name,
+            release_tag=release_tag,
+            external_id=external_id,
+            event_types=event_types,
+            metadata=metadata,
             request_options=request_options,
-            omit=OMIT,
-        ) as _response:
-            try:
-                if 200 <= _response.status_code < 300:
-                    for _text in _response.iter_lines():
-                        try:
-                            if len(_text) == 0:
-                                continue
-                            yield typing.cast(
-                                WorkflowStreamEvent,
-                                parse_obj_as(
-                                    type_=WorkflowStreamEvent,  # type: ignore
-                                    object_=json.loads(_text),
-                                ),
-                            )
-                        except Exception:
-                            pass
-                    return
-                _response.read()
-                if _response.status_code == 400:
-                    raise BadRequestError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 404:
-                    raise NotFoundError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 500:
-                    raise InternalServerError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                _response_json = _response.json()
-            except JSONDecodeError:
-                raise ApiError(status_code=_response.status_code, body=_response.text)
-            raise ApiError(status_code=_response.status_code, body=_response_json)
+        ) as r:
+            yield from r.data
     def generate(
         self,
@@ -920,87 +770,14 @@ class Vellum:
         for chunk in response:
             yield chunk
         """
-        with self._raw_client._client_wrapper.httpx_client.stream(
-            "v1/generate-stream",
-            base_url=self._raw_client._client_wrapper.get_environment().predict,
-            method="POST",
-            json={
-                "deployment_id": deployment_id,
-                "deployment_name": deployment_name,
-                "requests": convert_and_respect_annotation_metadata(
-                    object_=requests, annotation=typing.Sequence[GenerateRequest], direction="write"
-                ),
-                "options": convert_and_respect_annotation_metadata(
-                    object_=options, annotation=typing.Optional[GenerateOptionsRequest], direction="write"
-                ),
-            },
-            headers={
-                "content-type": "application/json",
-            },
+        with self._raw_client.generate_stream(
+            requests=requests,
+            deployment_id=deployment_id,
+            deployment_name=deployment_name,
+            options=options,
             request_options=request_options,
-            omit=OMIT,
-        ) as _response:
-            try:
-                if 200 <= _response.status_code < 300:
-                    for _text in _response.iter_lines():
-                        try:
-                            if len(_text) == 0:
-                                continue
-                            yield typing.cast(
-                                GenerateStreamResponse,
-                                parse_obj_as(
-                                    type_=GenerateStreamResponse,  # type: ignore
-                                    object_=json.loads(_text),
-                                ),
-                            )
-                        except Exception:
-                            pass
-                    return
-                _response.read()
-                if _response.status_code == 400:
-                    raise BadRequestError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 403:
-                    raise ForbiddenError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 404:
-                    raise NotFoundError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 500:
-                    raise InternalServerError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                _response_json = _response.json()
-            except JSONDecodeError:
-                raise ApiError(status_code=_response.status_code, body=_response.text)
-            raise ApiError(status_code=_response.status_code, body=_response_json)
+        ) as r:
+            yield from r.data
     def search(
         self,
@@ -1158,10 +935,7 @@ class Vellum:
         )
         """
         response = self._raw_client.submit_workflow_execution_actuals(
-            actuals=actuals,
-            execution_id=execution_id,
-            external_id=external_id,
-            request_options=request_options,
+            actuals=actuals, execution_id=execution_id, external_id=external_id, request_options=request_options
         )
         return response.data
@@ -1584,98 +1358,20 @@ class AsyncVellum:
         asyncio.run(main())
         """
-        async with self._raw_client._client_wrapper.httpx_client.stream(
-            "v1/execute-prompt-stream",
-            base_url=self._raw_client._client_wrapper.get_environment().predict,
-            method="POST",
-            json={
-                "inputs": convert_and_respect_annotation_metadata(
-                    object_=inputs, annotation=typing.Sequence[PromptDeploymentInputRequest], direction="write"
-                ),
-                "prompt_deployment_id": prompt_deployment_id,
-                "prompt_deployment_name": prompt_deployment_name,
-                "release_tag": release_tag,
-                "external_id": external_id,
-                "expand_meta": convert_and_respect_annotation_metadata(
-                    object_=expand_meta,
-                    annotation=typing.Optional[PromptDeploymentExpandMetaRequest],
-                    direction="write",
-                ),
-                "raw_overrides": convert_and_respect_annotation_metadata(
-                    object_=raw_overrides,
-                    annotation=typing.Optional[RawPromptExecutionOverridesRequest],
-                    direction="write",
-                ),
-                "expand_raw": expand_raw,
-                "metadata": metadata,
-            },
-            headers={
-                "content-type": "application/json",
-            },
+        async with self._raw_client.execute_prompt_stream(
+            inputs=inputs,
+            prompt_deployment_id=prompt_deployment_id,
+            prompt_deployment_name=prompt_deployment_name,
+            release_tag=release_tag,
+            external_id=external_id,
+            expand_meta=expand_meta,
+            raw_overrides=raw_overrides,
+            expand_raw=expand_raw,
+            metadata=metadata,
             request_options=request_options,
-            omit=OMIT,
-        ) as _response:
-            try:
-                if 200 <= _response.status_code < 300:
-                    async for _text in _response.aiter_lines():
-                        try:
-                            if len(_text) == 0:
-                                continue
-                            yield typing.cast(
-                                ExecutePromptEvent,
-                                parse_obj_as(
-                                    type_=ExecutePromptEvent,  # type: ignore
-                                    object_=json.loads(_text),
-                                ),
-                            )
-                        except Exception:
-                            pass
-                    return
-                await _response.aread()
-                if _response.status_code == 400:
-                    raise BadRequestError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 403:
-                    raise ForbiddenError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 404:
-                    raise NotFoundError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 500:
-                    raise InternalServerError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                _response_json = _response.json()
-            except JSONDecodeError:
-                raise ApiError(status_code=_response.status_code, body=_response.text)
-            raise ApiError(status_code=_response.status_code, body=_response_json)
+        ) as r:
+            async for data in r.data:
+                yield data
     async def execute_workflow(
         self,
@@ -1845,81 +1541,19 @@ class AsyncVellum:
         asyncio.run(main())
         """
-        async with self._raw_client._client_wrapper.httpx_client.stream(
-            "v1/execute-workflow-stream",
-            base_url=self._raw_client._client_wrapper.get_environment().predict,
-            method="POST",
-            json={
-                "inputs": convert_and_respect_annotation_metadata(
-                    object_=inputs, annotation=typing.Sequence[WorkflowRequestInputRequest], direction="write"
-                ),
-                "expand_meta": convert_and_respect_annotation_metadata(
-                    object_=expand_meta, annotation=typing.Optional[WorkflowExpandMetaRequest], direction="write"
-                ),
-                "workflow_deployment_id": workflow_deployment_id,
-                "workflow_deployment_name": workflow_deployment_name,
-                "release_tag": release_tag,
-                "external_id": external_id,
-                "event_types": event_types,
-                "metadata": metadata,
-            },
-            headers={
-                "content-type": "application/json",
-            },
+        async with self._raw_client.execute_workflow_stream(
+            inputs=inputs,
+            expand_meta=expand_meta,
+            workflow_deployment_id=workflow_deployment_id,
+            workflow_deployment_name=workflow_deployment_name,
+            release_tag=release_tag,
+            external_id=external_id,
+            event_types=event_types,
+            metadata=metadata,
             request_options=request_options,
-            omit=OMIT,
-        ) as _response:
-            try:
-                if 200 <= _response.status_code < 300:
-                    async for _text in _response.aiter_lines():
-                        try:
-                            if len(_text) == 0:
-                                continue
-                            yield typing.cast(
-                                WorkflowStreamEvent,
-                                parse_obj_as(
-                                    type_=WorkflowStreamEvent,  # type: ignore
-                                    object_=json.loads(_text),
-                                ),
-                            )
-                        except Exception:
-                            pass
-                    return
-                await _response.aread()
-                if _response.status_code == 400:
-                    raise BadRequestError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 404:
-                    raise NotFoundError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 500:
-                    raise InternalServerError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                _response_json = _response.json()
-            except JSONDecodeError:
-                raise ApiError(status_code=_response.status_code, body=_response.text)
-            raise ApiError(status_code=_response.status_code, body=_response_json)
+        ) as r:
+            async for data in r.data:
+                yield data
     async def generate(
         self,
@@ -2060,87 +1694,15 @@ class AsyncVellum:
         asyncio.run(main())
         """
-        async with self._raw_client._client_wrapper.httpx_client.stream(
-            "v1/generate-stream",
-            base_url=self._raw_client._client_wrapper.get_environment().predict,
-            method="POST",
-            json={
-                "deployment_id": deployment_id,
-                "deployment_name": deployment_name,
-                "requests": convert_and_respect_annotation_metadata(
-                    object_=requests, annotation=typing.Sequence[GenerateRequest], direction="write"
-                ),
-                "options": convert_and_respect_annotation_metadata(
-                    object_=options, annotation=typing.Optional[GenerateOptionsRequest], direction="write"
-                ),
-            },
-            headers={
-                "content-type": "application/json",
-            },
+        async with self._raw_client.generate_stream(
+            requests=requests,
+            deployment_id=deployment_id,
+            deployment_name=deployment_name,
+            options=options,
             request_options=request_options,
-            omit=OMIT,
-        ) as _response:
-            try:
-                if 200 <= _response.status_code < 300:
-                    async for _text in _response.aiter_lines():
-                        try:
-                            if len(_text) == 0:
-                                continue
-                            yield typing.cast(
-                                GenerateStreamResponse,
-                                parse_obj_as(
-                                    type_=GenerateStreamResponse,  # type: ignore
-                                    object_=json.loads(_text),
-                                ),
-                            )
-                        except Exception:
-                            pass
-                    return
-                await _response.aread()
-                if _response.status_code == 400:
-                    raise BadRequestError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 403:
-                    raise ForbiddenError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 404:
-                    raise NotFoundError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                if _response.status_code == 500:
-                    raise InternalServerError(
-                        typing.cast(
-                            typing.Optional[typing.Any],
-                            parse_obj_as(
-                                type_=typing.Optional[typing.Any],  # type: ignore
-                                object_=_response.json(),
-                            ),
-                        )
-                    )
-                _response_json = _response.json()
-            except JSONDecodeError:
-                raise ApiError(status_code=_response.status_code, body=_response.text)
-            raise ApiError(status_code=_response.status_code, body=_response_json)
+        ) as r:
+            async for data in r.data:
+                yield data
     async def search(
         self,
@@ -2325,9 +1887,6 @@ class AsyncVellum:
         asyncio.run(main())
         """
         response = await self._raw_client.submit_workflow_execution_actuals(
-            actuals=actuals,
-            execution_id=execution_id,
-            external_id=external_id,
-            request_options=request_options,
+            actuals=actuals, execution_id=execution_id, external_id=external_id, request_options=request_options
         )
         return response.data

vellum/client/core/client_wrapper.py CHANGED Viewed

@@ -25,10 +25,10 @@ class BaseClientWrapper:
     def get_headers(self) -> typing.Dict[str, str]:
         headers: typing.Dict[str, str] = {
-            "User-Agent": "vellum-ai/1.1.1",
+            "User-Agent": "vellum-ai/1.1.3",
             "X-Fern-Language": "Python",
             "X-Fern-SDK-Name": "vellum-ai",
-            "X-Fern-SDK-Version": "1.1.1",
+            "X-Fern-SDK-Version": "1.1.3",
         }
         if self._api_version is not None:
             headers["X-API-Version"] = self._api_version

vellum/client/core/pydantic_utilities.py CHANGED Viewed

@@ -55,12 +55,19 @@ else:
 T = typing.TypeVar("T")
 Model = typing.TypeVar("Model", bound=pydantic.BaseModel)
+type_adapter_cache: typing.Dict[typing.Type, pydantic.TypeAdapter] = {}
+annotated_types = {"ExecuteApiResponse"}
-def parse_obj_as(type_: typing.Type[T], object_: typing.Any) -> T:
-    dealiased_object = convert_and_respect_annotation_metadata(object_=object_, annotation=type_, direction="read")
+def parse_obj_as(type_: typing.Type[T], object_: typing.Any, convert_metadata: bool = False) -> T:
+    if hasattr(type_, "__name__") and type_.__name__ in annotated_types:
+        dealiased_object = convert_and_respect_annotation_metadata(object_=object_, annotation=type_, direction="read")
+    else:
+        dealiased_object = object_
     if IS_PYDANTIC_V2:
-        adapter = pydantic.TypeAdapter(type_)  # type: ignore # Pydantic v2
+        adapter = pydantic.TypeAdapter(type_) if type_ not in type_adapter_cache else type_adapter_cache[type_]  # type: ignore # Pydantic v2
+        if type_ not in type_adapter_cache:
+            type_adapter_cache[type_] = adapter
         return adapter.validate_python(dealiased_object)
     else:
         return pydantic.parse_obj_as(type_, dealiased_object)

vellum-ai 1.1.1__py3-none-any.whl → 1.1.3__py3-none-any.whl

vellum-ai 1.1.1py3-none-any.whl → 1.1.3py3-none-any.whl