PyPI - ommlds - Versions diffs - 0.0.0.dev456__py3-none-any.whl → 0.0.0.dev485__py3-none-any.whl - Mend

ommlds 0.0.0.dev456py3-none-any.whl → 0.0.0.dev485py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (212) hide show

ommlds/.omlish-manifests.json +314 -33
ommlds/__about__.py +15 -9
ommlds/_hacks/__init__.py +4 -0
ommlds/_hacks/funcs.py +110 -0
ommlds/_hacks/names.py +158 -0
ommlds/_hacks/params.py +73 -0
ommlds/_hacks/patches.py +0 -3
ommlds/backends/anthropic/protocol/__init__.py +13 -1
ommlds/backends/anthropic/protocol/_dataclasses.py +1625 -0
ommlds/backends/anthropic/protocol/sse/assemble.py +22 -6
ommlds/backends/anthropic/protocol/sse/events.py +13 -0
ommlds/backends/google/protocol/__init__.py +13 -0
ommlds/backends/google/protocol/_dataclasses.py +5997 -0
ommlds/backends/google/protocol/types.py +5 -1
ommlds/backends/groq/__init__.py +7 -0
ommlds/backends/groq/_dataclasses.py +3901 -0
ommlds/backends/groq/_marshal.py +23 -0
ommlds/backends/groq/protocol.py +249 -0
ommlds/backends/llamacpp/logging.py +4 -1
ommlds/backends/mlx/caching.py +7 -3
ommlds/backends/mlx/cli.py +10 -7
ommlds/backends/mlx/generation.py +18 -16
ommlds/backends/mlx/limits.py +10 -6
ommlds/backends/mlx/loading.py +65 -5
ommlds/backends/ollama/__init__.py +7 -0
ommlds/backends/ollama/_dataclasses.py +3458 -0
ommlds/backends/ollama/protocol.py +170 -0
ommlds/backends/openai/protocol/__init__.py +15 -1
ommlds/backends/openai/protocol/_dataclasses.py +7708 -0
ommlds/backends/tavily/__init__.py +7 -0
ommlds/backends/tavily/_dataclasses.py +1734 -0
ommlds/backends/tavily/protocol.py +301 -0
ommlds/backends/tinygrad/models/llama3/__init__.py +22 -14
ommlds/backends/transformers/__init__.py +14 -0
ommlds/backends/transformers/filecache.py +109 -0
ommlds/backends/transformers/streamers.py +73 -0
ommlds/cli/__init__.py +7 -0
ommlds/cli/_dataclasses.py +2562 -0
ommlds/cli/asyncs.py +30 -0
ommlds/cli/backends/catalog.py +93 -0
ommlds/cli/backends/configs.py +9 -0
ommlds/cli/backends/inject.py +31 -36
ommlds/cli/backends/injection.py +16 -0
ommlds/cli/backends/types.py +46 -0
ommlds/cli/content/messages.py +34 -0
ommlds/cli/content/strings.py +42 -0
ommlds/cli/inject.py +15 -32
ommlds/cli/inputs/__init__.py +0 -0
ommlds/cli/inputs/asyncs.py +32 -0
ommlds/cli/inputs/sync.py +75 -0
ommlds/cli/main.py +267 -128
ommlds/cli/rendering/__init__.py +0 -0
ommlds/cli/rendering/configs.py +9 -0
ommlds/cli/rendering/inject.py +31 -0
ommlds/cli/rendering/markdown.py +52 -0
ommlds/cli/rendering/raw.py +73 -0
ommlds/cli/rendering/types.py +21 -0
ommlds/cli/secrets.py +21 -0
ommlds/cli/sessions/base.py +1 -1
ommlds/cli/sessions/chat/chat/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/ai/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/ai/configs.py +11 -0
ommlds/cli/sessions/chat/chat/ai/inject.py +74 -0
ommlds/cli/sessions/chat/chat/ai/injection.py +14 -0
ommlds/cli/sessions/chat/chat/ai/rendering.py +70 -0
ommlds/cli/sessions/chat/chat/ai/services.py +79 -0
ommlds/cli/sessions/chat/chat/ai/tools.py +44 -0
ommlds/cli/sessions/chat/chat/ai/types.py +28 -0
ommlds/cli/sessions/chat/chat/state/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/state/configs.py +11 -0
ommlds/cli/sessions/chat/chat/state/inject.py +36 -0
ommlds/cli/sessions/chat/chat/state/inmemory.py +33 -0
ommlds/cli/sessions/chat/chat/state/storage.py +52 -0
ommlds/cli/sessions/chat/chat/state/types.py +38 -0
ommlds/cli/sessions/chat/chat/user/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/user/configs.py +17 -0
ommlds/cli/sessions/chat/chat/user/inject.py +62 -0
ommlds/cli/sessions/chat/chat/user/interactive.py +31 -0
ommlds/cli/sessions/chat/chat/user/oneshot.py +25 -0
ommlds/cli/sessions/chat/chat/user/types.py +15 -0
ommlds/cli/sessions/chat/configs.py +27 -0
ommlds/cli/sessions/chat/driver.py +43 -0
ommlds/cli/sessions/chat/inject.py +33 -65
ommlds/cli/sessions/chat/phases/__init__.py +0 -0
ommlds/cli/sessions/chat/phases/inject.py +27 -0
ommlds/cli/sessions/chat/phases/injection.py +14 -0
ommlds/cli/sessions/chat/phases/manager.py +29 -0
ommlds/cli/sessions/chat/phases/types.py +29 -0
ommlds/cli/sessions/chat/session.py +27 -0
ommlds/cli/sessions/chat/tools/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/configs.py +22 -0
ommlds/cli/sessions/chat/tools/confirmation.py +46 -0
ommlds/cli/sessions/chat/tools/execution.py +66 -0
ommlds/cli/sessions/chat/tools/fs/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/fs/configs.py +12 -0
ommlds/cli/sessions/chat/tools/fs/inject.py +35 -0
ommlds/cli/sessions/chat/tools/inject.py +88 -0
ommlds/cli/sessions/chat/tools/injection.py +44 -0
ommlds/cli/sessions/chat/tools/rendering.py +58 -0
ommlds/cli/sessions/chat/tools/todo/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/todo/configs.py +12 -0
ommlds/cli/sessions/chat/tools/todo/inject.py +31 -0
ommlds/cli/sessions/chat/tools/weather/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/weather/configs.py +12 -0
ommlds/cli/sessions/chat/tools/weather/inject.py +22 -0
ommlds/cli/{tools/weather.py → sessions/chat/tools/weather/tools.py} +1 -1
ommlds/cli/sessions/completion/configs.py +21 -0
ommlds/cli/sessions/completion/inject.py +42 -0
ommlds/cli/sessions/completion/session.py +35 -0
ommlds/cli/sessions/embedding/configs.py +21 -0
ommlds/cli/sessions/embedding/inject.py +42 -0
ommlds/cli/sessions/embedding/session.py +33 -0
ommlds/cli/sessions/inject.py +28 -11
ommlds/cli/state/__init__.py +0 -0
ommlds/cli/state/inject.py +28 -0
ommlds/cli/{state.py → state/storage.py} +41 -24
ommlds/minichain/__init__.py +46 -17
ommlds/minichain/_dataclasses.py +15401 -0
ommlds/minichain/backends/catalogs/base.py +20 -1
ommlds/minichain/backends/catalogs/simple.py +2 -2
ommlds/minichain/backends/catalogs/strings.py +10 -8
ommlds/minichain/backends/impls/anthropic/chat.py +31 -65
ommlds/minichain/backends/impls/anthropic/names.py +3 -4
ommlds/minichain/backends/impls/anthropic/protocol.py +109 -0
ommlds/minichain/backends/impls/anthropic/stream.py +53 -31
ommlds/minichain/backends/impls/duckduckgo/search.py +5 -1
ommlds/minichain/backends/impls/dummy/__init__.py +0 -0
ommlds/minichain/backends/impls/dummy/chat.py +69 -0
ommlds/minichain/backends/impls/google/chat.py +9 -2
ommlds/minichain/backends/impls/google/search.py +6 -1
ommlds/minichain/backends/impls/google/stream.py +122 -32
ommlds/minichain/backends/impls/groq/__init__.py +0 -0
ommlds/minichain/backends/impls/groq/chat.py +75 -0
ommlds/minichain/backends/impls/groq/names.py +48 -0
ommlds/minichain/backends/impls/groq/protocol.py +143 -0
ommlds/minichain/backends/impls/groq/stream.py +125 -0
ommlds/minichain/backends/impls/huggingface/repos.py +1 -5
ommlds/minichain/backends/impls/llamacpp/chat.py +15 -3
ommlds/minichain/backends/impls/llamacpp/completion.py +7 -3
ommlds/minichain/backends/impls/llamacpp/stream.py +38 -19
ommlds/minichain/backends/impls/mistral.py +9 -2
ommlds/minichain/backends/impls/mlx/chat.py +100 -23
ommlds/minichain/backends/impls/ollama/__init__.py +0 -0
ommlds/minichain/backends/impls/ollama/chat.py +199 -0
ommlds/minichain/backends/impls/openai/chat.py +14 -7
ommlds/minichain/backends/impls/openai/completion.py +9 -2
ommlds/minichain/backends/impls/openai/embedding.py +9 -2
ommlds/minichain/backends/impls/openai/format.py +115 -109
ommlds/minichain/backends/impls/openai/names.py +31 -5
ommlds/minichain/backends/impls/openai/stream.py +33 -27
ommlds/minichain/backends/impls/sentencepiece/tokens.py +9 -6
ommlds/minichain/backends/impls/tavily.py +66 -0
ommlds/minichain/backends/impls/tinygrad/chat.py +17 -14
ommlds/minichain/backends/impls/tokenizers/tokens.py +9 -6
ommlds/minichain/backends/impls/transformers/sentence.py +5 -2
ommlds/minichain/backends/impls/transformers/tokens.py +10 -7
ommlds/minichain/backends/impls/transformers/transformers.py +139 -20
ommlds/minichain/backends/strings/parsing.py +1 -1
ommlds/minichain/backends/strings/resolving.py +4 -1
ommlds/minichain/chat/choices/stream/__init__.py +0 -0
ommlds/minichain/chat/choices/stream/adapters.py +35 -0
ommlds/minichain/chat/choices/stream/joining.py +31 -0
ommlds/minichain/chat/choices/stream/services.py +45 -0
ommlds/minichain/chat/choices/stream/types.py +43 -0
ommlds/minichain/chat/stream/_marshal.py +4 -4
ommlds/minichain/chat/stream/joining.py +85 -0
ommlds/minichain/chat/stream/services.py +15 -15
ommlds/minichain/chat/stream/types.py +24 -18
ommlds/minichain/llms/types.py +4 -0
ommlds/minichain/registries/globals.py +18 -4
ommlds/minichain/resources.py +28 -3
ommlds/minichain/search.py +1 -1
ommlds/minichain/standard.py +8 -0
ommlds/minichain/stream/services.py +19 -16
ommlds/minichain/tools/reflect.py +5 -1
ommlds/nanochat/LICENSE +21 -0
ommlds/nanochat/__init__.py +0 -0
ommlds/nanochat/rustbpe/LICENSE +21 -0
ommlds/nanochat/tokenizers.py +406 -0
ommlds/specs/__init__.py +0 -0
ommlds/specs/mcp/__init__.py +0 -0
ommlds/specs/mcp/_marshal.py +23 -0
ommlds/specs/mcp/clients.py +146 -0
ommlds/specs/mcp/protocol.py +371 -0
ommlds/tools/git.py +13 -6
ommlds/tools/ocr.py +1 -8
ommlds/wiki/analyze.py +2 -2
ommlds/wiki/text/mfh.py +1 -5
ommlds/wiki/text/wtp.py +1 -3
ommlds/wiki/utils/xml.py +5 -5
{ommlds-0.0.0.dev456.dist-info → ommlds-0.0.0.dev485.dist-info}/METADATA +22 -19
{ommlds-0.0.0.dev456.dist-info → ommlds-0.0.0.dev485.dist-info}/RECORD +198 -95
ommlds/cli/backends/standard.py +0 -20
ommlds/cli/sessions/chat/base.py +0 -42
ommlds/cli/sessions/chat/code.py +0 -129
ommlds/cli/sessions/chat/interactive.py +0 -71
ommlds/cli/sessions/chat/printing.py +0 -97
ommlds/cli/sessions/chat/prompt.py +0 -151
ommlds/cli/sessions/chat/state.py +0 -110
ommlds/cli/sessions/chat/tools.py +0 -100
ommlds/cli/sessions/completion/completion.py +0 -44
ommlds/cli/sessions/embedding/embedding.py +0 -42
ommlds/cli/tools/config.py +0 -14
ommlds/cli/tools/inject.py +0 -75
ommlds/minichain/backends/impls/openai/format2.py +0 -210
ommlds/minichain/chat/stream/adapters.py +0 -80
/ommlds/{huggingface.py → backends/huggingface.py} +0 -0
/ommlds/cli/{tools → content}/__init__.py +0 -0
{ommlds-0.0.0.dev456.dist-info → ommlds-0.0.0.dev485.dist-info}/WHEEL +0 -0
{ommlds-0.0.0.dev456.dist-info → ommlds-0.0.0.dev485.dist-info}/entry_points.txt +0 -0
{ommlds-0.0.0.dev456.dist-info → ommlds-0.0.0.dev485.dist-info}/licenses/LICENSE +0 -0
{ommlds-0.0.0.dev456.dist-info → ommlds-0.0.0.dev485.dist-info}/top_level.txt +0 -0

ommlds/minichain/backends/impls/tinygrad/chat.py CHANGED Viewed

@@ -4,23 +4,22 @@ import typing as ta
 from omlish import check
 from omlish import lang
-from .....backends.tinygrad.models import llama3 as tgl3
 from ....chat.choices.services import ChatChoicesOptions
 from ....chat.choices.services import ChatChoicesRequest
 from ....chat.choices.services import ChatChoicesResponse
 from ....chat.choices.services import static_check_is_chat_choices_service
+from ....chat.choices.stream.services import ChatChoicesStreamRequest
+from ....chat.choices.stream.services import ChatChoicesStreamResponse
+from ....chat.choices.stream.services import static_check_is_chat_choices_stream_service
+from ....chat.choices.stream.types import AiChoiceDeltas
+from ....chat.choices.stream.types import AiChoicesDeltas
 from ....chat.choices.types import AiChoice
 from ....chat.choices.types import ChatChoicesOutputs
 from ....chat.messages import AiMessage
 from ....chat.messages import Chat
 from ....chat.messages import SystemMessage
 from ....chat.messages import UserMessage
-from ....chat.stream.services import ChatChoicesStreamRequest
-from ....chat.stream.services import ChatChoicesStreamResponse
-from ....chat.stream.services import static_check_is_chat_choices_stream_service
-from ....chat.stream.types import AiChoiceDeltas
-from ....chat.stream.types import AiChoicesDeltas
-from ....chat.stream.types import ContentAiChoiceDelta
+from ....chat.stream.types import ContentAiDelta
 from ....chat.types import ChatOption
 from ....llms.types import LlmOption
 from ....resources import UseResources
@@ -28,6 +27,10 @@ from ....stream.services import StreamResponseSink
 from ....stream.services import new_stream_response
+with lang.auto_proxy_import(globals()):
+    from .....backends.tinygrad.models import llama3 as tgl3
 ##
@@ -39,7 +42,7 @@ def _load_model(
         *,
         size: str | None = None,
         temperature: float | None = None,
-) -> tgl3.Llama3Llm:
+) -> 'tgl3.Llama3Llm':
     if size is None:
         size = DEFAULT_SIZE
     if temperature is None:
@@ -58,7 +61,7 @@ def _load_model(
 def _prepare_toks(
-        llm: tgl3.Llama3Llm,
+        llm: 'tgl3.Llama3Llm',
         chat: Chat,
         options: ta.Sequence[ChatChoicesOptions],
 ) -> list[int]:
@@ -100,7 +103,7 @@ class BaseTinygradLlama3ChatService(lang.ExitStacked, lang.Abstract):
         self._temperature = temperature
     @lang.cached_function(transient=True)
-    def _load_model(self) -> tgl3.Llama3Llm:
+    def _load_model(self) -> 'tgl3.Llama3Llm':
         check.not_none(self._exit_stack)
         return _load_model(
@@ -113,7 +116,7 @@ class BaseTinygradLlama3ChatService(lang.ExitStacked, lang.Abstract):
 # @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
-#     name='tinygrad_llama3',
+#     name='tinygrad-llama3',
 #     type='ChatChoicesService',
 # )
 @static_check_is_chat_choices_service
@@ -133,7 +136,7 @@ class TinygradLlama3ChatChoicesService(BaseTinygradLlama3ChatService):
 # @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
-#     name='tinygrad_llama3',
+#     name='tinygrad-llama3',
 #     type='ChatChoicesStreamService',
 # )
 @static_check_is_chat_choices_stream_service
@@ -151,7 +154,7 @@ class TinygradLlama3ChatChoicesStreamService(BaseTinygradLlama3ChatService):
                 for s in tgl3.run_llm(llm, toks):
                     await sink.emit(AiChoicesDeltas([
                         AiChoiceDeltas([
-                            ContentAiChoiceDelta(s),
+                            ContentAiDelta(s),
                         ]),
                     ]))
@@ -168,5 +171,5 @@ class TinygradLlama3ChatChoicesStreamService(BaseTinygradLlama3ChatService):
 #         'ChatChoicesService',
 #         'ChatChoicesStreamService',
 #     ],
-#     'tinygrad_llama3',
+#     'tinygrad-llama3',
 # )

ommlds/minichain/backends/impls/tokenizers/tokens.py CHANGED Viewed

@@ -1,23 +1,26 @@
 import typing as ta
-import tokenizers as tos
 from omlish import check
+from omlish import lang
 from .... import tokens as tks
+with lang.auto_proxy_import(globals()):
+    import tokenizers as tos
 ##
-def build_vocab(tos_tokenizer: tos.Tokenizer) -> tks.Vocab:
+def build_vocab(tos_tokenizer: 'tos.Tokenizer') -> tks.Vocab:
     return tks.Vocab([
         (ta.cast(tks.Token, i), tks.TokenStr(s))
         for s, i in tos_tokenizer.get_vocab().items()
     ])
-def build_specials(tos_tokenizer: tos.Tokenizer) -> tks.SpecialTokens:
+def build_specials(tos_tokenizer: 'tos.Tokenizer') -> tks.SpecialTokens:
     # FIXME
     return tks.SpecialTokens([])
@@ -28,7 +31,7 @@ def build_specials(tos_tokenizer: tos.Tokenizer) -> tks.SpecialTokens:
 class TokenizersTokenizer(tks.BaseTokenizer):
     def __init__(
             self,
-            tos_tokenizer: tos.Tokenizer,
+            tos_tokenizer: 'tos.Tokenizer',
     ) -> None:
         self._tos_tokenizer = check.isinstance(tos_tokenizer, tos.Tokenizer)
@@ -38,7 +41,7 @@ class TokenizersTokenizer(tks.BaseTokenizer):
         )
     @property
-    def tos_tokenizer(self) -> tos.Tokenizer:
+    def tos_tokenizer(self) -> 'tos.Tokenizer':
         return self._tos_tokenizer
     #

ommlds/minichain/backends/impls/transformers/sentence.py CHANGED Viewed

@@ -1,7 +1,6 @@
 import typing as ta
-import sentence_transformers as stfm
+from omlish import lang
 from omlish import typedvalues as tv
 from ....configs import Config
@@ -13,6 +12,10 @@ from ....vectors.embeddings import static_check_is_embedding_service
 from ....vectors.types import Vector
+with lang.auto_proxy_import(globals()):
+    import sentence_transformers as stfm
 ##

ommlds/minichain/backends/impls/transformers/tokens.py CHANGED Viewed

@@ -1,17 +1,20 @@
 import typing as ta
-import transformers as tfm
 from omlish import check
 from omlish import collections as col
+from omlish import lang
 from .... import tokens as tks
+with lang.auto_proxy_import(globals()):
+    import transformers as tfm
 ##
-def build_vocab(tfm_tokenizer: tfm.PreTrainedTokenizerBase) -> tks.Vocab:
+def build_vocab(tfm_tokenizer: 'tfm.PreTrainedTokenizerBase') -> tks.Vocab:
     return tks.Vocab([
         (ta.cast(tks.Token, i), tks.TokenStr(s))
         for s, i in tfm_tokenizer.get_vocab().items()
@@ -32,7 +35,7 @@ SPECIAL_TOKEN_ATTR_MAP: col.BiMap[type[tks.SpecialToken], str] = col.make_bi_map
 })
-def build_specials(tfm_tokenizer: tfm.PreTrainedTokenizerBase) -> tks.SpecialTokens:
+def build_specials(tfm_tokenizer: 'tfm.PreTrainedTokenizerBase') -> tks.SpecialTokens:
     return tks.SpecialTokens.from_dict({
         st: getattr(tfm_tokenizer, a)
         for st, a in SPECIAL_TOKEN_ATTR_MAP.items()
@@ -45,7 +48,7 @@ def build_specials(tfm_tokenizer: tfm.PreTrainedTokenizerBase) -> tks.SpecialTok
 class TransformersTokenizer(tks.BaseTokenizer):
     def __init__(
             self,
-            tfm_tokenizer: tfm.PreTrainedTokenizerBase,
+            tfm_tokenizer: 'tfm.PreTrainedTokenizerBase',
     ) -> None:
         self._tfm_tokenizer = check.isinstance(tfm_tokenizer, tfm.PreTrainedTokenizerBase)
@@ -55,7 +58,7 @@ class TransformersTokenizer(tks.BaseTokenizer):
         )
     @property
-    def tfm_tokenizer(self) -> tfm.PreTrainedTokenizerBase:
+    def tfm_tokenizer(self) -> 'tfm.PreTrainedTokenizerBase':
         return self._tfm_tokenizer
     #
@@ -72,7 +75,7 @@ class TransformersTokenizer(tks.BaseTokenizer):
             self,
             tokens: ta.Iterable[tks.Token],
     ) -> str:
-        return self._tfm_tokenizer.decode(tokens)
+        return self._tfm_tokenizer.decode(tokens)  # type: ignore[arg-type]
 ##

ommlds/minichain/backends/impls/transformers/transformers.py CHANGED Viewed

@@ -4,32 +4,57 @@ TODO:
  - https://huggingface.co/blog/aifeifei798/transformers-streaming-output
 """
 import sys
+import threading
 import typing as ta
-import transformers as tfm
 from omlish import check
 from omlish import lang
 from omlish import typedvalues as tv
+from omlish.asyncs.asyncio.sync import AsyncioBufferRelay
 from ....chat.choices.services import ChatChoicesRequest
 from ....chat.choices.services import ChatChoicesResponse
 from ....chat.choices.services import static_check_is_chat_choices_service
+from ....chat.choices.stream.services import ChatChoicesStreamRequest
+from ....chat.choices.stream.services import ChatChoicesStreamResponse
+from ....chat.choices.stream.services import static_check_is_chat_choices_stream_service
+from ....chat.choices.stream.types import AiChoiceDeltas  # noqa
+from ....chat.choices.stream.types import AiChoicesDeltas  # noqa
 from ....chat.choices.types import AiChoice
+from ....chat.choices.types import ChatChoicesOutputs
 from ....chat.messages import AiMessage
 from ....chat.messages import Message
 from ....chat.messages import SystemMessage
 from ....chat.messages import ToolUseMessage
 from ....chat.messages import ToolUseResultMessage
 from ....chat.messages import UserMessage
+from ....chat.stream.types import ContentAiDelta  # noqa
 from ....completion import CompletionRequest
 from ....completion import CompletionResponse
 from ....completion import static_check_is_completion_service
 from ....configs import Config
 from ....models.configs import ModelPath
+from ....resources import UseResources
+from ....stream.services import StreamResponseSink
+from ....stream.services import new_stream_response
 from ...impls.huggingface.configs import HuggingfaceHubToken
+with lang.auto_proxy_import(globals()):
+    import transformers as tfm
+    from .....backends import transformers as tfm_u
+##
+# @omlish-manifest $.minichain.backends.strings.manifests.BackendStringsManifest(
+#     ['ChatChoicesService', 'ChatChoicesStreamService'],
+#     'transformers',
+# )
 ##
@@ -128,13 +153,10 @@ def build_chat_message(m: Message) -> ta.Mapping[str, ta.Any]:
         raise TypeError(m)
-# @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
-#     name='transformers',
-#     aliases=['tfm'],
-#     type='ChatChoicesService',
-# )
-@static_check_is_chat_choices_service
-class TransformersChatChoicesService(lang.ExitStacked):
+##
+class BaseTransformersChatChoicesService(lang.ExitStacked):
     DEFAULT_MODEL: ta.ClassVar[str] = (
         'meta-llama/Llama-3.2-1B-Instruct'
     )
@@ -148,7 +170,7 @@ class TransformersChatChoicesService(lang.ExitStacked):
             self._huggingface_hub_token = HuggingfaceHubToken.pop_secret(cc, env='HUGGINGFACE_HUB_TOKEN')
     @lang.cached_function(transient=True)
-    def _load_pipeline(self) -> tfm.Pipeline:
+    def _load_pipeline(self) -> 'tfm.Pipeline':
         # FIXME: unload
         check.not_none(self._exit_stack)
@@ -161,21 +183,118 @@ class TransformersChatChoicesService(lang.ExitStacked):
         for pkw_cfg in self._pipeline_kwargs:
             pkw.update(pkw_cfg.v)
-        return tfm.pipeline(
-            'text-generation',
-            **pkw,
-        )
+        with tfm_u.file_cache_patch_context(
+                local_first=True,
+                local_config_present_is_authoritative=True,
+        ):
+            return tfm.pipeline(
+                'text-generation',
+                **pkw,
+            )
+##
+# @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
+#     name='transformers',
+#     aliases=['tfm'],
+#     type='ChatChoicesService',
+# )
+@static_check_is_chat_choices_service
+class TransformersChatChoicesService(BaseTransformersChatChoicesService):
     async def invoke(self, request: ChatChoicesRequest) -> ChatChoicesResponse:
         check.empty(request.options)
         pipeline = self._load_pipeline()
-        output = pipeline(
-            [
-                build_chat_message(m)
-                for m in request.v
-            ],
+        inputs = [
+            build_chat_message(m)
+            for m in request.v
+        ]
+        outputs = pipeline(inputs)
+        gts = check.single(outputs)['generated_text']
+        ugt, agt = gts
+        check.state(ugt['role'] == 'user')
+        check.state(agt['role'] == 'assistant')
+        return ChatChoicesResponse([AiChoice([AiMessage(agt['content'])])])
+##
+# @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
+#     name='transformers',
+#     type='ChatChoicesStreamService',
+# )
+@static_check_is_chat_choices_stream_service
+class TransformersChatChoicesStreamService(BaseTransformersChatChoicesService):
+    async def invoke(self, request: ChatChoicesStreamRequest) -> ChatChoicesStreamResponse:
+        check.empty(request.options)
+        pipeline = self._load_pipeline()  # noqa
+        inputs = [  # noqa
+            build_chat_message(m)
+            for m in request.v
+        ]
+        relay: AsyncioBufferRelay = AsyncioBufferRelay()
+        def streamer_callback(text: str, *, stream_end: bool) -> None:
+            if text or stream_end:
+                relay.push(text, *([None] if stream_end else []))
+        streamer = tfm_u.CancellableTextStreamer(
+            check.not_none(pipeline.tokenizer),  # type: ignore[arg-type]
+            streamer_callback,  # noqa
+            skip_prompt=True,
+            skip_special_tokens=True,
         )
-        return ChatChoicesResponse([AiChoice([output])])
+        async with UseResources.or_new(request.options) as rs:
+            thread = threading.Thread(
+                target=tfm_u.CancellableTextStreamer.ignoring_cancelled(pipeline),
+                args=(
+                    inputs,
+                ),
+                kwargs=dict(
+                    streamer=streamer,
+                ),
+            )
+            def stop_thread() -> None:
+                streamer.cancel()
+                # thread.join()
+            rs.enter_context(lang.defer(stop_thread))
+            thread.start()
+            async def inner(sink: StreamResponseSink[AiChoicesDeltas]) -> ta.Sequence[ChatChoicesOutputs] | None:
+                while True:
+                    await relay.wait()
+                    got = relay.swap()
+                    if not got:
+                        raise RuntimeError
+                    if got[-1] is None:
+                        out = ''.join(got[:-1])
+                        end = True
+                    else:
+                        out = ''.join(got)
+                        end = False
+                    if out:
+                        await sink.emit(AiChoicesDeltas([AiChoiceDeltas([ContentAiDelta(out)])]))
+                    if end:
+                        break
+                return []
+            return await new_stream_response(rs, inner)

ommlds/minichain/backends/strings/parsing.py CHANGED Viewed

@@ -56,7 +56,7 @@ _REPO_MODEL_PAT = re.compile(
 def parse_backend_string(s: str) -> ParsedBackendString:
     backend: str | None
     if ':' in s:
-        backend, s = s.split(':')
+        backend, _, s = s.partition(':')
     else:
         backend = None

ommlds/minichain/backends/strings/resolving.py CHANGED Viewed

@@ -108,7 +108,10 @@ class ManifestBackendStringResolver(BackendStringResolver):
         mn: str | None = mdl.name
-        if mn == m.backend_name:
+        if args.parsed.backend == m.backend_name and mn is not None:
+            pass
+        elif mn == m.backend_name:
             if m.model_names is not None:
                 mn = m.model_names.resolved_default
             else:

ommlds/minichain/chat/choices/stream/__init__.py ADDED Viewed

File without changes

ommlds/minichain/chat/choices/stream/adapters.py ADDED Viewed

@@ -0,0 +1,35 @@
+from omlish import dataclasses as dc
+from ....services import Response
+from ..services import ChatChoicesRequest
+from ..services import static_check_is_chat_choices_service
+from ..types import AiChoice
+from ..types import AiChoices
+from .joining import AiChoicesDeltaJoiner
+from .services import ChatChoicesOutputs
+from .services import ChatChoicesStreamOutputs
+from .services import ChatChoicesStreamService
+##
+@static_check_is_chat_choices_service
+@dc.dataclass(frozen=True)
+class ChatChoicesStreamServiceChatChoicesService:
+    service: ChatChoicesStreamService
+    async def invoke(self, request: ChatChoicesRequest) -> Response[
+        AiChoices,
+        ChatChoicesOutputs | ChatChoicesStreamOutputs,
+    ]:
+        joiner = AiChoicesDeltaJoiner()
+        async with (resp := await self.service.invoke(request)).v as it:  # noqa
+            async for cs in it:
+                joiner.add(cs.choices)
+        # check.state(resp_v.is_done)
+        # FIXME: outputs lol
+        return Response([AiChoice(ms) for ms in joiner.build()])

ommlds/minichain/chat/choices/stream/joining.py ADDED Viewed

@@ -0,0 +1,31 @@
+import typing as ta
+from omlish import check
+from ...messages import AiChat
+from ...stream.joining import AiDeltaJoiner
+from .types import AiChoiceDeltas
+##
+class AiChoicesDeltaJoiner:
+    def __init__(self) -> None:
+        super().__init__()
+        self._seq = 0
+        self._channels: list[AiDeltaJoiner] = []
+    def add(self, choices: ta.Sequence[AiChoiceDeltas]) -> None:
+        if not self._seq:
+            check.empty(self._channels)
+            self._channels.extend(AiDeltaJoiner() for _ in range(len(choices)))
+        for chan, c in zip(self._channels, choices, strict=True):
+            chan.add(c.deltas)
+        self._seq += 1
+    def build(self) -> list[AiChat]:
+        return [list(chan.build()) for chan in self._channels]

ommlds/minichain/chat/choices/stream/services.py ADDED Viewed

@@ -0,0 +1,45 @@
+import abc
+import typing as ta
+from omlish import lang
+from ....registries.globals import register_type
+from ....services import Request
+from ....services import Service
+from ....stream.services import StreamResponse
+from ...messages import Chat
+from ..types import ChatChoicesOutputs
+from .types import AiChoicesDeltas
+from .types import ChatChoicesStreamOptions
+from .types import ChatChoicesStreamOutputs
+##
+ChatChoicesStreamRequest: ta.TypeAlias = Request[Chat, ChatChoicesStreamOptions]
+ChatChoicesStreamResponse: ta.TypeAlias = StreamResponse[
+    AiChoicesDeltas,
+    ChatChoicesOutputs,
+    ChatChoicesStreamOutputs,
+]
+# @omlish-manifest $.minichain.registries.manifests.RegistryTypeManifest
+ChatChoicesStreamService: ta.TypeAlias = Service[ChatChoicesStreamRequest, ChatChoicesStreamResponse]
+register_type(ChatChoicesStreamService, module=__name__)
+def static_check_is_chat_choices_stream_service[T: ChatChoicesStreamService](t: type[T]) -> type[T]:
+    return t
+##
+@static_check_is_chat_choices_stream_service
+class AbstractChatChoicesStreamService(lang.Abstract):
+    @abc.abstractmethod
+    def invoke(self, request: ChatChoicesStreamRequest) -> ta.Awaitable[ChatChoicesStreamResponse]:
+        raise NotImplementedError

ommlds/minichain/chat/choices/stream/types.py ADDED Viewed

@@ -0,0 +1,43 @@
+import typing as ta
+from omlish import dataclasses as dc
+from omlish import lang
+from ....stream.services import StreamOptions
+from ....types import Option
+from ....types import Output
+from ...stream.types import AiDeltas
+from ..types import ChatChoicesOptions
+##
+class ChatChoicesStreamOption(Option, lang.Abstract, lang.PackageSealed):
+    pass
+ChatChoicesStreamOptions: ta.TypeAlias = ChatChoicesStreamOption | StreamOptions | ChatChoicesOptions
+##
+class ChatChoicesStreamOutput(Output, lang.Abstract, lang.PackageSealed):
+    pass
+ChatChoicesStreamOutputs: ta.TypeAlias = ChatChoicesStreamOutput
+##
+@dc.dataclass(frozen=True)
+class AiChoiceDeltas(lang.Final):
+    deltas: AiDeltas
+@dc.dataclass(frozen=True)
+class AiChoicesDeltas(lang.Final):
+    choices: ta.Sequence[AiChoiceDeltas]

ommlds/minichain/chat/stream/_marshal.py CHANGED Viewed

@@ -1,7 +1,7 @@
 from omlish import lang
 from omlish import marshal as msh
-from .types import AiChoiceDelta
+from .types import AiDelta
 ##
@@ -9,8 +9,8 @@ from .types import AiChoiceDelta
 @lang.static_init
 def _install_standard_marshaling() -> None:
-    acd_poly = msh.polymorphism_from_subclasses(AiChoiceDelta, naming=msh.Naming.SNAKE)
+    ad_poly = msh.polymorphism_from_subclasses(AiDelta, naming=msh.Naming.SNAKE)
     msh.install_standard_factories(
-        msh.PolymorphismMarshalerFactory(acd_poly),
-        msh.PolymorphismUnmarshalerFactory(acd_poly),
+        msh.PolymorphismMarshalerFactory(ad_poly),
+        msh.PolymorphismUnmarshalerFactory(ad_poly),
     )

ommlds 0.0.0.dev456__py3-none-any.whl → 0.0.0.dev485__py3-none-any.whl

ommlds 0.0.0.dev456py3-none-any.whl → 0.0.0.dev485py3-none-any.whl