PyPI - sarvamai - Versions diffs - 0.1.22a4__py3-none-any.whl → 0.1.23a2__py3-none-any.whl - Mend

sarvamai 0.1.22a4py3-none-any.whl → 0.1.23a2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (56) hide show

sarvamai/__init__.py +405 -200
sarvamai/chat/raw_client.py +20 -20
sarvamai/client.py +186 -34
sarvamai/core/__init__.py +76 -21
sarvamai/core/client_wrapper.py +19 -3
sarvamai/core/force_multipart.py +4 -2
sarvamai/core/http_client.py +217 -97
sarvamai/core/http_response.py +1 -1
sarvamai/core/http_sse/__init__.py +42 -0
sarvamai/core/http_sse/_api.py +112 -0
sarvamai/core/http_sse/_decoders.py +61 -0
sarvamai/core/http_sse/_exceptions.py +7 -0
sarvamai/core/http_sse/_models.py +17 -0
sarvamai/core/jsonable_encoder.py +8 -0
sarvamai/core/pydantic_utilities.py +110 -4
sarvamai/errors/__init__.py +40 -6
sarvamai/errors/bad_request_error.py +1 -1
sarvamai/errors/forbidden_error.py +1 -1
sarvamai/errors/internal_server_error.py +1 -1
sarvamai/errors/service_unavailable_error.py +1 -1
sarvamai/errors/too_many_requests_error.py +1 -1
sarvamai/errors/unprocessable_entity_error.py +1 -1
sarvamai/requests/__init__.py +150 -62
sarvamai/requests/audio_data.py +0 -6
sarvamai/requests/error_response_data.py +1 -1
sarvamai/requests/file_signed_url_details.py +1 -1
sarvamai/requests/speech_to_text_transcription_data.py +2 -2
sarvamai/speech_to_text/raw_client.py +54 -52
sarvamai/speech_to_text_job/raw_client.py +120 -120
sarvamai/speech_to_text_streaming/__init__.py +38 -8
sarvamai/speech_to_text_streaming/client.py +0 -13
sarvamai/speech_to_text_streaming/raw_client.py +0 -13
sarvamai/speech_to_text_streaming/types/__init__.py +36 -6
sarvamai/speech_to_text_translate_job/raw_client.py +120 -120
sarvamai/speech_to_text_translate_streaming/__init__.py +36 -7
sarvamai/speech_to_text_translate_streaming/client.py +0 -13
sarvamai/speech_to_text_translate_streaming/raw_client.py +0 -13
sarvamai/speech_to_text_translate_streaming/types/__init__.py +36 -5
sarvamai/text/client.py +0 -12
sarvamai/text/raw_client.py +60 -72
sarvamai/text_to_speech/client.py +18 -0
sarvamai/text_to_speech/raw_client.py +38 -20
sarvamai/text_to_speech_streaming/__init__.py +28 -1
sarvamai/text_to_speech_streaming/types/__init__.py +30 -1
sarvamai/types/__init__.py +222 -100
sarvamai/types/audio_data.py +0 -6
sarvamai/types/chat_completion_request_message.py +6 -2
sarvamai/types/error_response_data.py +1 -1
sarvamai/types/file_signed_url_details.py +1 -1
sarvamai/types/speech_to_text_transcription_data.py +2 -2
{sarvamai-0.1.22a4.dist-info → sarvamai-0.1.23a2.dist-info}/METADATA +2 -1
{sarvamai-0.1.22a4.dist-info → sarvamai-0.1.23a2.dist-info}/RECORD +53 -51
sarvamai/speech_to_text_streaming/types/speech_to_text_streaming_input_audio_codec.py +0 -33
sarvamai/speech_to_text_translate_streaming/types/speech_to_text_translate_streaming_input_audio_codec.py +0 -33
sarvamai/types/audio_data_input_audio_codec.py +0 -33
{sarvamai-0.1.22a4.dist-info → sarvamai-0.1.23a2.dist-info}/WHEEL +0 -0

sarvamai/speech_to_text_translate_streaming/__init__.py CHANGED Viewed

@@ -2,16 +2,45 @@
 # isort: skip_file
-from .types import (
-    SpeechToTextTranslateStreamingFlushSignal,
-    SpeechToTextTranslateStreamingHighVadSensitivity,
-    SpeechToTextTranslateStreamingInputAudioCodec,
-    SpeechToTextTranslateStreamingVadSignals,
-)
+import typing
+from importlib import import_module
+if typing.TYPE_CHECKING:
+    from .types import (
+        SpeechToTextTranslateStreamingFlushSignal,
+        SpeechToTextTranslateStreamingHighVadSensitivity,
+        SpeechToTextTranslateStreamingVadSignals,
+    )
+_dynamic_imports: typing.Dict[str, str] = {
+    "SpeechToTextTranslateStreamingFlushSignal": ".types",
+    "SpeechToTextTranslateStreamingHighVadSensitivity": ".types",
+    "SpeechToTextTranslateStreamingVadSignals": ".types",
+}
+def __getattr__(attr_name: str) -> typing.Any:
+    module_name = _dynamic_imports.get(attr_name)
+    if module_name is None:
+        raise AttributeError(f"No {attr_name} found in _dynamic_imports for module name -> {__name__}")
+    try:
+        module = import_module(module_name, __package__)
+        if module_name == f".{attr_name}":
+            return module
+        else:
+            return getattr(module, attr_name)
+    except ImportError as e:
+        raise ImportError(f"Failed to import {attr_name} from {module_name}: {e}") from e
+    except AttributeError as e:
+        raise AttributeError(f"Failed to get {attr_name} from {module_name}: {e}") from e
+def __dir__():
+    lazy_attrs = list(_dynamic_imports.keys())
+    return sorted(lazy_attrs)
 __all__ = [
     "SpeechToTextTranslateStreamingFlushSignal",
     "SpeechToTextTranslateStreamingHighVadSensitivity",
-    "SpeechToTextTranslateStreamingInputAudioCodec",
     "SpeechToTextTranslateStreamingVadSignals",
 ]

sarvamai/speech_to_text_translate_streaming/client.py CHANGED Viewed

@@ -15,7 +15,6 @@ from .types.speech_to_text_translate_streaming_flush_signal import SpeechToTextT
 from .types.speech_to_text_translate_streaming_high_vad_sensitivity import (
     SpeechToTextTranslateStreamingHighVadSensitivity,
 )
-from .types.speech_to_text_translate_streaming_input_audio_codec import SpeechToTextTranslateStreamingInputAudioCodec
 from .types.speech_to_text_translate_streaming_vad_signals import SpeechToTextTranslateStreamingVadSignals
 try:
@@ -44,7 +43,6 @@ class SpeechToTextTranslateStreamingClient:
         self,
         *,
         model: typing.Optional[typing.Literal["saaras:v2.5"]] = None,
-        input_audio_codec: typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec] = None,
         sample_rate: typing.Optional[str] = None,
         high_vad_sensitivity: typing.Optional[SpeechToTextTranslateStreamingHighVadSensitivity] = None,
         vad_signals: typing.Optional[SpeechToTextTranslateStreamingVadSignals] = None,
@@ -64,9 +62,6 @@ class SpeechToTextTranslateStreamingClient:
         model : typing.Optional[typing.Literal["saaras:v2.5"]]
             Speech to text model to use (defaults to "saaras:v2.5" if not specified)
-        input_audio_codec : typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec]
-            Audio codec/format of the input file. Our API automatically detects all codec formats, but for PCM files specifically (pcm_s16le, pcm_l16, pcm_raw), you must pass this parameter. PCM files supports sample rate 16000 and 8000.
         sample_rate : typing.Optional[str]
             Audio sample rate for the WebSocket connection. When specified as a connection parameter, only 16kHz and 8kHz are supported. 8kHz is only available via this connection parameter. If not specified, defaults to 16kHz.
@@ -93,8 +88,6 @@ class SpeechToTextTranslateStreamingClient:
         query_params = httpx.QueryParams()
         if model is not None:
             query_params = query_params.add("model", model)
-        if input_audio_codec is not None:
-            query_params = query_params.add("input_audio_codec", input_audio_codec)
         if sample_rate is not None:
             query_params = query_params.add("sample_rate", sample_rate)
         if high_vad_sensitivity is not None:
@@ -147,7 +140,6 @@ class AsyncSpeechToTextTranslateStreamingClient:
         self,
         *,
         model: typing.Optional[typing.Literal["saaras:v2.5"]] = None,
-        input_audio_codec: typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec] = None,
         sample_rate: typing.Optional[str] = None,
         high_vad_sensitivity: typing.Optional[SpeechToTextTranslateStreamingHighVadSensitivity] = None,
         vad_signals: typing.Optional[SpeechToTextTranslateStreamingVadSignals] = None,
@@ -167,9 +159,6 @@ class AsyncSpeechToTextTranslateStreamingClient:
         model : typing.Optional[typing.Literal["saaras:v2.5"]]
             Speech to text model to use (defaults to "saaras:v2.5" if not specified)
-        input_audio_codec : typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec]
-            Audio codec/format of the input file. Our API automatically detects all codec formats, but for PCM files specifically (pcm_s16le, pcm_l16, pcm_raw), you must pass this parameter. PCM files supports sample rate 16000 and 8000.
         sample_rate : typing.Optional[str]
             Audio sample rate for the WebSocket connection. When specified as a connection parameter, only 16kHz and 8kHz are supported. 8kHz is only available via this connection parameter. If not specified, defaults to 16kHz.
@@ -196,8 +185,6 @@ class AsyncSpeechToTextTranslateStreamingClient:
         query_params = httpx.QueryParams()
         if model is not None:
             query_params = query_params.add("model", model)
-        if input_audio_codec is not None:
-            query_params = query_params.add("input_audio_codec", input_audio_codec)
         if sample_rate is not None:
             query_params = query_params.add("sample_rate", sample_rate)
         if high_vad_sensitivity is not None:

sarvamai/speech_to_text_translate_streaming/raw_client.py CHANGED Viewed

@@ -14,7 +14,6 @@ from .types.speech_to_text_translate_streaming_flush_signal import SpeechToTextT
 from .types.speech_to_text_translate_streaming_high_vad_sensitivity import (
     SpeechToTextTranslateStreamingHighVadSensitivity,
 )
-from .types.speech_to_text_translate_streaming_input_audio_codec import SpeechToTextTranslateStreamingInputAudioCodec
 from .types.speech_to_text_translate_streaming_vad_signals import SpeechToTextTranslateStreamingVadSignals
 try:
@@ -32,7 +31,6 @@ class RawSpeechToTextTranslateStreamingClient:
         self,
         *,
         model: typing.Optional[typing.Literal["saaras:v2.5"]] = None,
-        input_audio_codec: typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec] = None,
         sample_rate: typing.Optional[str] = None,
         high_vad_sensitivity: typing.Optional[SpeechToTextTranslateStreamingHighVadSensitivity] = None,
         vad_signals: typing.Optional[SpeechToTextTranslateStreamingVadSignals] = None,
@@ -52,9 +50,6 @@ class RawSpeechToTextTranslateStreamingClient:
         model : typing.Optional[typing.Literal["saaras:v2.5"]]
             Speech to text model to use (defaults to "saaras:v2.5" if not specified)
-        input_audio_codec : typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec]
-            Audio codec/format of the input file. Our API automatically detects all codec formats, but for PCM files specifically (pcm_s16le, pcm_l16, pcm_raw), you must pass this parameter. PCM files supports sample rate 16000 and 8000.
         sample_rate : typing.Optional[str]
             Audio sample rate for the WebSocket connection. When specified as a connection parameter, only 16kHz and 8kHz are supported. 8kHz is only available via this connection parameter. If not specified, defaults to 16kHz.
@@ -81,8 +76,6 @@ class RawSpeechToTextTranslateStreamingClient:
         query_params = httpx.QueryParams()
         if model is not None:
             query_params = query_params.add("model", model)
-        if input_audio_codec is not None:
-            query_params = query_params.add("input_audio_codec", input_audio_codec)
         if sample_rate is not None:
             query_params = query_params.add("sample_rate", sample_rate)
         if high_vad_sensitivity is not None:
@@ -124,7 +117,6 @@ class AsyncRawSpeechToTextTranslateStreamingClient:
         self,
         *,
         model: typing.Optional[typing.Literal["saaras:v2.5"]] = None,
-        input_audio_codec: typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec] = None,
         sample_rate: typing.Optional[str] = None,
         high_vad_sensitivity: typing.Optional[SpeechToTextTranslateStreamingHighVadSensitivity] = None,
         vad_signals: typing.Optional[SpeechToTextTranslateStreamingVadSignals] = None,
@@ -144,9 +136,6 @@ class AsyncRawSpeechToTextTranslateStreamingClient:
         model : typing.Optional[typing.Literal["saaras:v2.5"]]
             Speech to text model to use (defaults to "saaras:v2.5" if not specified)
-        input_audio_codec : typing.Optional[SpeechToTextTranslateStreamingInputAudioCodec]
-            Audio codec/format of the input file. Our API automatically detects all codec formats, but for PCM files specifically (pcm_s16le, pcm_l16, pcm_raw), you must pass this parameter. PCM files supports sample rate 16000 and 8000.
         sample_rate : typing.Optional[str]
             Audio sample rate for the WebSocket connection. When specified as a connection parameter, only 16kHz and 8kHz are supported. 8kHz is only available via this connection parameter. If not specified, defaults to 16kHz.
@@ -173,8 +162,6 @@ class AsyncRawSpeechToTextTranslateStreamingClient:
         query_params = httpx.QueryParams()
         if model is not None:
             query_params = query_params.add("model", model)
-        if input_audio_codec is not None:
-            query_params = query_params.add("input_audio_codec", input_audio_codec)
         if sample_rate is not None:
             query_params = query_params.add("sample_rate", sample_rate)
         if high_vad_sensitivity is not None:

sarvamai/speech_to_text_translate_streaming/types/__init__.py CHANGED Viewed

@@ -2,14 +2,45 @@
 # isort: skip_file
-from .speech_to_text_translate_streaming_flush_signal import SpeechToTextTranslateStreamingFlushSignal
-from .speech_to_text_translate_streaming_high_vad_sensitivity import SpeechToTextTranslateStreamingHighVadSensitivity
-from .speech_to_text_translate_streaming_input_audio_codec import SpeechToTextTranslateStreamingInputAudioCodec
-from .speech_to_text_translate_streaming_vad_signals import SpeechToTextTranslateStreamingVadSignals
+import typing
+from importlib import import_module
+if typing.TYPE_CHECKING:
+    from .speech_to_text_translate_streaming_flush_signal import SpeechToTextTranslateStreamingFlushSignal
+    from .speech_to_text_translate_streaming_high_vad_sensitivity import (
+        SpeechToTextTranslateStreamingHighVadSensitivity,
+    )
+    from .speech_to_text_translate_streaming_vad_signals import SpeechToTextTranslateStreamingVadSignals
+_dynamic_imports: typing.Dict[str, str] = {
+    "SpeechToTextTranslateStreamingFlushSignal": ".speech_to_text_translate_streaming_flush_signal",
+    "SpeechToTextTranslateStreamingHighVadSensitivity": ".speech_to_text_translate_streaming_high_vad_sensitivity",
+    "SpeechToTextTranslateStreamingVadSignals": ".speech_to_text_translate_streaming_vad_signals",
+}
+def __getattr__(attr_name: str) -> typing.Any:
+    module_name = _dynamic_imports.get(attr_name)
+    if module_name is None:
+        raise AttributeError(f"No {attr_name} found in _dynamic_imports for module name -> {__name__}")
+    try:
+        module = import_module(module_name, __package__)
+        if module_name == f".{attr_name}":
+            return module
+        else:
+            return getattr(module, attr_name)
+    except ImportError as e:
+        raise ImportError(f"Failed to import {attr_name} from {module_name}: {e}") from e
+    except AttributeError as e:
+        raise AttributeError(f"Failed to get {attr_name} from {module_name}: {e}") from e
+def __dir__():
+    lazy_attrs = list(_dynamic_imports.keys())
+    return sorted(lazy_attrs)
 __all__ = [
     "SpeechToTextTranslateStreamingFlushSignal",
     "SpeechToTextTranslateStreamingHighVadSensitivity",
-    "SpeechToTextTranslateStreamingInputAudioCodec",
     "SpeechToTextTranslateStreamingVadSignals",
 ]

sarvamai/text/client.py CHANGED Viewed

@@ -47,7 +47,6 @@ class TextClient:
         speaker_gender: typing.Optional[TranslateSpeakerGender] = OMIT,
         mode: typing.Optional[TranslateMode] = OMIT,
         model: typing.Optional[TranslateModel] = OMIT,
-        enable_preprocessing: typing.Optional[bool] = OMIT,
         output_script: typing.Optional[TransliterateMode] = OMIT,
         numerals_format: typing.Optional[NumeralsFormat] = OMIT,
         request_options: typing.Optional[RequestOptions] = None,
@@ -125,10 +124,6 @@ class TextClient:
             - mayura:v1: Supports 12 languages with all modes, output scripts, and automatic language detection.
             - sarvam-translate:v1: Supports all 22 scheduled languages of India, formal mode only.
-        enable_preprocessing : typing.Optional[bool]
-            This will enable custom preprocessing of the input text which can result in better translations.
-             Recommendation- You can switch on whenever there is some complex text with difficult vocabulary and sentences, for which you want simple translations that people can understand.
         output_script : typing.Optional[TransliterateMode]
             **output_script**: This is an optional parameter which controls the transliteration style applied to the output text.
@@ -186,7 +181,6 @@ class TextClient:
             speaker_gender=speaker_gender,
             mode=mode,
             model=model,
-            enable_preprocessing=enable_preprocessing,
             output_script=output_script,
             numerals_format=numerals_format,
             request_options=request_options,
@@ -371,7 +365,6 @@ class AsyncTextClient:
         speaker_gender: typing.Optional[TranslateSpeakerGender] = OMIT,
         mode: typing.Optional[TranslateMode] = OMIT,
         model: typing.Optional[TranslateModel] = OMIT,
-        enable_preprocessing: typing.Optional[bool] = OMIT,
         output_script: typing.Optional[TransliterateMode] = OMIT,
         numerals_format: typing.Optional[NumeralsFormat] = OMIT,
         request_options: typing.Optional[RequestOptions] = None,
@@ -449,10 +442,6 @@ class AsyncTextClient:
             - mayura:v1: Supports 12 languages with all modes, output scripts, and automatic language detection.
             - sarvam-translate:v1: Supports all 22 scheduled languages of India, formal mode only.
-        enable_preprocessing : typing.Optional[bool]
-            This will enable custom preprocessing of the input text which can result in better translations.
-             Recommendation- You can switch on whenever there is some complex text with difficult vocabulary and sentences, for which you want simple translations that people can understand.
         output_script : typing.Optional[TransliterateMode]
             **output_script**: This is an optional parameter which controls the transliteration style applied to the output text.
@@ -518,7 +507,6 @@ class AsyncTextClient:
             speaker_gender=speaker_gender,
             mode=mode,
             model=model,
-            enable_preprocessing=enable_preprocessing,
             output_script=output_script,
             numerals_format=numerals_format,
             request_options=request_options,

sarvamai 0.1.22a4__py3-none-any.whl → 0.1.23a2__py3-none-any.whl

sarvamai 0.1.22a4py3-none-any.whl → 0.1.23a2py3-none-any.whl