PyPI - ommlds - Versions diffs - 0.0.0.dev436__py3-none-any.whl → 0.0.0.dev480__py3-none-any.whl - Mend

ommlds 0.0.0.dev436py3-none-any.whl → 0.0.0.dev480py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (271) hide show

ommlds/.omlish-manifests.json +332 -35
ommlds/__about__.py +15 -9
ommlds/_hacks/__init__.py +4 -0
ommlds/_hacks/funcs.py +110 -0
ommlds/_hacks/names.py +158 -0
ommlds/_hacks/params.py +73 -0
ommlds/_hacks/patches.py +0 -3
ommlds/backends/anthropic/protocol/_marshal.py +2 -2
ommlds/backends/anthropic/protocol/sse/_marshal.py +1 -1
ommlds/backends/anthropic/protocol/sse/assemble.py +23 -7
ommlds/backends/anthropic/protocol/sse/events.py +13 -0
ommlds/backends/anthropic/protocol/types.py +30 -9
ommlds/backends/google/protocol/__init__.py +3 -0
ommlds/backends/google/protocol/_marshal.py +16 -0
ommlds/backends/google/protocol/types.py +626 -0
ommlds/backends/groq/_marshal.py +23 -0
ommlds/backends/groq/protocol.py +249 -0
ommlds/backends/mlx/generation.py +1 -1
ommlds/backends/mlx/loading.py +58 -1
ommlds/backends/ollama/__init__.py +0 -0
ommlds/backends/ollama/protocol.py +170 -0
ommlds/backends/openai/protocol/__init__.py +9 -28
ommlds/backends/openai/protocol/_common.py +18 -0
ommlds/backends/openai/protocol/_marshal.py +27 -0
ommlds/backends/openai/protocol/chatcompletion/chunk.py +58 -31
ommlds/backends/openai/protocol/chatcompletion/contentpart.py +49 -44
ommlds/backends/openai/protocol/chatcompletion/message.py +55 -43
ommlds/backends/openai/protocol/chatcompletion/request.py +114 -66
ommlds/backends/openai/protocol/chatcompletion/response.py +71 -45
ommlds/backends/openai/protocol/chatcompletion/responseformat.py +27 -20
ommlds/backends/openai/protocol/chatcompletion/tokenlogprob.py +16 -7
ommlds/backends/openai/protocol/completionusage.py +24 -15
ommlds/backends/tavily/__init__.py +0 -0
ommlds/backends/tavily/protocol.py +301 -0
ommlds/backends/tinygrad/models/llama3/__init__.py +22 -14
ommlds/backends/transformers/__init__.py +0 -0
ommlds/backends/transformers/filecache.py +109 -0
ommlds/backends/transformers/streamers.py +73 -0
ommlds/cli/asyncs.py +30 -0
ommlds/cli/backends/catalog.py +93 -0
ommlds/cli/backends/configs.py +9 -0
ommlds/cli/backends/inject.py +31 -36
ommlds/cli/backends/injection.py +16 -0
ommlds/cli/backends/types.py +46 -0
ommlds/cli/content/__init__.py +0 -0
ommlds/cli/content/messages.py +34 -0
ommlds/cli/content/strings.py +42 -0
ommlds/cli/inject.py +15 -32
ommlds/cli/inputs/__init__.py +0 -0
ommlds/cli/inputs/asyncs.py +32 -0
ommlds/cli/inputs/sync.py +75 -0
ommlds/cli/main.py +270 -110
ommlds/cli/rendering/__init__.py +0 -0
ommlds/cli/rendering/configs.py +9 -0
ommlds/cli/rendering/inject.py +31 -0
ommlds/cli/rendering/markdown.py +52 -0
ommlds/cli/rendering/raw.py +73 -0
ommlds/cli/rendering/types.py +21 -0
ommlds/cli/secrets.py +21 -0
ommlds/cli/sessions/base.py +1 -1
ommlds/cli/sessions/chat/chat/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/ai/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/ai/configs.py +11 -0
ommlds/cli/sessions/chat/chat/ai/inject.py +74 -0
ommlds/cli/sessions/chat/chat/ai/injection.py +14 -0
ommlds/cli/sessions/chat/chat/ai/rendering.py +70 -0
ommlds/cli/sessions/chat/chat/ai/services.py +79 -0
ommlds/cli/sessions/chat/chat/ai/tools.py +44 -0
ommlds/cli/sessions/chat/chat/ai/types.py +28 -0
ommlds/cli/sessions/chat/chat/state/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/state/configs.py +11 -0
ommlds/cli/sessions/chat/chat/state/inject.py +36 -0
ommlds/cli/sessions/chat/chat/state/inmemory.py +33 -0
ommlds/cli/sessions/chat/chat/state/storage.py +52 -0
ommlds/cli/sessions/chat/chat/state/types.py +38 -0
ommlds/cli/sessions/chat/chat/user/__init__.py +0 -0
ommlds/cli/sessions/chat/chat/user/configs.py +17 -0
ommlds/cli/sessions/chat/chat/user/inject.py +62 -0
ommlds/cli/sessions/chat/chat/user/interactive.py +31 -0
ommlds/cli/sessions/chat/chat/user/oneshot.py +25 -0
ommlds/cli/sessions/chat/chat/user/types.py +15 -0
ommlds/cli/sessions/chat/configs.py +27 -0
ommlds/cli/sessions/chat/driver.py +43 -0
ommlds/cli/sessions/chat/inject.py +33 -65
ommlds/cli/sessions/chat/phases/__init__.py +0 -0
ommlds/cli/sessions/chat/phases/inject.py +27 -0
ommlds/cli/sessions/chat/phases/injection.py +14 -0
ommlds/cli/sessions/chat/phases/manager.py +29 -0
ommlds/cli/sessions/chat/phases/types.py +29 -0
ommlds/cli/sessions/chat/session.py +27 -0
ommlds/cli/sessions/chat/tools/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/configs.py +22 -0
ommlds/cli/sessions/chat/tools/confirmation.py +46 -0
ommlds/cli/sessions/chat/tools/execution.py +66 -0
ommlds/cli/sessions/chat/tools/fs/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/fs/configs.py +12 -0
ommlds/cli/sessions/chat/tools/fs/inject.py +35 -0
ommlds/cli/sessions/chat/tools/inject.py +88 -0
ommlds/cli/sessions/chat/tools/injection.py +44 -0
ommlds/cli/sessions/chat/tools/rendering.py +58 -0
ommlds/cli/sessions/chat/tools/todo/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/todo/configs.py +12 -0
ommlds/cli/sessions/chat/tools/todo/inject.py +31 -0
ommlds/cli/sessions/chat/tools/weather/__init__.py +0 -0
ommlds/cli/sessions/chat/tools/weather/configs.py +12 -0
ommlds/cli/sessions/chat/tools/weather/inject.py +22 -0
ommlds/cli/{tools/weather.py → sessions/chat/tools/weather/tools.py} +1 -1
ommlds/cli/sessions/completion/configs.py +21 -0
ommlds/cli/sessions/completion/inject.py +42 -0
ommlds/cli/sessions/completion/session.py +35 -0
ommlds/cli/sessions/embedding/configs.py +21 -0
ommlds/cli/sessions/embedding/inject.py +42 -0
ommlds/cli/sessions/embedding/session.py +33 -0
ommlds/cli/sessions/inject.py +28 -11
ommlds/cli/state/__init__.py +0 -0
ommlds/cli/state/inject.py +28 -0
ommlds/cli/{state.py → state/storage.py} +41 -24
ommlds/minichain/__init__.py +84 -24
ommlds/minichain/_marshal.py +49 -9
ommlds/minichain/_typedvalues.py +2 -4
ommlds/minichain/backends/catalogs/base.py +20 -1
ommlds/minichain/backends/catalogs/simple.py +2 -2
ommlds/minichain/backends/catalogs/strings.py +10 -8
ommlds/minichain/backends/impls/anthropic/chat.py +65 -27
ommlds/minichain/backends/impls/anthropic/names.py +10 -8
ommlds/minichain/backends/impls/anthropic/protocol.py +109 -0
ommlds/minichain/backends/impls/anthropic/stream.py +111 -43
ommlds/minichain/backends/impls/duckduckgo/search.py +1 -1
ommlds/minichain/backends/impls/dummy/__init__.py +0 -0
ommlds/minichain/backends/impls/dummy/chat.py +69 -0
ommlds/minichain/backends/impls/google/chat.py +114 -22
ommlds/minichain/backends/impls/google/search.py +7 -2
ommlds/minichain/backends/impls/google/stream.py +219 -0
ommlds/minichain/backends/impls/google/tools.py +149 -0
ommlds/minichain/backends/impls/groq/__init__.py +0 -0
ommlds/minichain/backends/impls/groq/chat.py +75 -0
ommlds/minichain/backends/impls/groq/names.py +48 -0
ommlds/minichain/backends/impls/groq/protocol.py +143 -0
ommlds/minichain/backends/impls/groq/stream.py +125 -0
ommlds/minichain/backends/impls/llamacpp/chat.py +33 -18
ommlds/minichain/backends/impls/llamacpp/completion.py +1 -1
ommlds/minichain/backends/impls/llamacpp/format.py +4 -2
ommlds/minichain/backends/impls/llamacpp/stream.py +37 -20
ommlds/minichain/backends/impls/mistral.py +20 -5
ommlds/minichain/backends/impls/mlx/chat.py +96 -22
ommlds/minichain/backends/impls/ollama/__init__.py +0 -0
ommlds/minichain/backends/impls/ollama/chat.py +199 -0
ommlds/minichain/backends/impls/openai/chat.py +18 -8
ommlds/minichain/backends/impls/openai/completion.py +10 -3
ommlds/minichain/backends/impls/openai/embedding.py +10 -3
ommlds/minichain/backends/impls/openai/format.py +131 -106
ommlds/minichain/backends/impls/openai/names.py +31 -5
ommlds/minichain/backends/impls/openai/stream.py +43 -25
ommlds/minichain/backends/impls/tavily.py +66 -0
ommlds/minichain/backends/impls/tinygrad/chat.py +23 -16
ommlds/minichain/backends/impls/transformers/sentence.py +1 -1
ommlds/minichain/backends/impls/transformers/tokens.py +1 -1
ommlds/minichain/backends/impls/transformers/transformers.py +155 -34
ommlds/minichain/backends/strings/parsing.py +1 -1
ommlds/minichain/backends/strings/resolving.py +4 -1
ommlds/minichain/chat/_marshal.py +16 -9
ommlds/minichain/chat/choices/adapters.py +4 -4
ommlds/minichain/chat/choices/services.py +1 -1
ommlds/minichain/chat/choices/stream/__init__.py +0 -0
ommlds/minichain/chat/choices/stream/adapters.py +35 -0
ommlds/minichain/chat/choices/stream/joining.py +31 -0
ommlds/minichain/chat/choices/stream/services.py +45 -0
ommlds/minichain/chat/choices/stream/types.py +43 -0
ommlds/minichain/chat/choices/types.py +2 -2
ommlds/minichain/chat/history.py +3 -3
ommlds/minichain/chat/messages.py +55 -19
ommlds/minichain/chat/services.py +3 -3
ommlds/minichain/chat/stream/_marshal.py +16 -0
ommlds/minichain/chat/stream/joining.py +85 -0
ommlds/minichain/chat/stream/services.py +15 -21
ommlds/minichain/chat/stream/types.py +32 -19
ommlds/minichain/chat/tools/execution.py +8 -7
ommlds/minichain/chat/tools/ids.py +9 -15
ommlds/minichain/chat/tools/parsing.py +17 -26
ommlds/minichain/chat/transforms/base.py +29 -38
ommlds/minichain/chat/transforms/metadata.py +30 -4
ommlds/minichain/chat/transforms/services.py +9 -11
ommlds/minichain/content/_marshal.py +44 -20
ommlds/minichain/content/json.py +13 -0
ommlds/minichain/content/materialize.py +14 -21
ommlds/minichain/content/prepare.py +4 -0
ommlds/minichain/content/transforms/interleave.py +1 -1
ommlds/minichain/content/transforms/squeeze.py +1 -1
ommlds/minichain/content/transforms/stringify.py +1 -1
ommlds/minichain/json.py +20 -0
ommlds/minichain/lib/code/__init__.py +0 -0
ommlds/minichain/lib/code/prompts.py +6 -0
ommlds/minichain/lib/fs/binfiles.py +108 -0
ommlds/minichain/lib/fs/context.py +126 -0
ommlds/minichain/lib/fs/errors.py +101 -0
ommlds/minichain/lib/fs/suggestions.py +36 -0
ommlds/minichain/lib/fs/tools/__init__.py +0 -0
ommlds/minichain/lib/fs/tools/edit.py +104 -0
ommlds/minichain/lib/fs/tools/ls.py +38 -0
ommlds/minichain/lib/fs/tools/read.py +115 -0
ommlds/minichain/lib/fs/tools/recursivels/__init__.py +0 -0
ommlds/minichain/lib/fs/tools/recursivels/execution.py +40 -0
ommlds/minichain/lib/todo/__init__.py +0 -0
ommlds/minichain/lib/todo/context.py +54 -0
ommlds/minichain/lib/todo/tools/__init__.py +0 -0
ommlds/minichain/lib/todo/tools/read.py +44 -0
ommlds/minichain/lib/todo/tools/write.py +335 -0
ommlds/minichain/lib/todo/types.py +60 -0
ommlds/minichain/llms/_marshal.py +25 -17
ommlds/minichain/llms/types.py +4 -0
ommlds/minichain/registries/globals.py +18 -4
ommlds/minichain/resources.py +66 -43
ommlds/minichain/search.py +1 -1
ommlds/minichain/services/_marshal.py +46 -39
ommlds/minichain/services/facades.py +3 -3
ommlds/minichain/services/services.py +1 -1
ommlds/minichain/standard.py +8 -0
ommlds/minichain/stream/services.py +152 -38
ommlds/minichain/stream/wrap.py +22 -24
ommlds/minichain/tools/_marshal.py +1 -1
ommlds/minichain/tools/execution/catalog.py +2 -1
ommlds/minichain/tools/execution/context.py +34 -14
ommlds/minichain/tools/execution/errors.py +15 -0
ommlds/minichain/tools/execution/executors.py +8 -3
ommlds/minichain/tools/execution/reflect.py +40 -5
ommlds/minichain/tools/fns.py +46 -9
ommlds/minichain/tools/jsonschema.py +14 -5
ommlds/minichain/tools/reflect.py +54 -18
ommlds/minichain/tools/types.py +33 -1
ommlds/minichain/utils.py +27 -0
ommlds/minichain/vectors/_marshal.py +11 -10
ommlds/nanochat/LICENSE +21 -0
ommlds/nanochat/__init__.py +0 -0
ommlds/nanochat/rustbpe/LICENSE +21 -0
ommlds/nanochat/tokenizers.py +406 -0
ommlds/server/server.py +3 -3
ommlds/specs/__init__.py +0 -0
ommlds/specs/mcp/__init__.py +0 -0
ommlds/specs/mcp/_marshal.py +23 -0
ommlds/specs/mcp/protocol.py +266 -0
ommlds/tools/git.py +27 -10
ommlds/tools/ocr.py +8 -9
ommlds/wiki/analyze.py +2 -2
ommlds/wiki/text/mfh.py +1 -5
ommlds/wiki/text/wtp.py +1 -3
ommlds/wiki/utils/xml.py +5 -5
{ommlds-0.0.0.dev436.dist-info → ommlds-0.0.0.dev480.dist-info}/METADATA +24 -21
ommlds-0.0.0.dev480.dist-info/RECORD +427 -0
ommlds/cli/backends/standard.py +0 -20
ommlds/cli/sessions/chat/base.py +0 -42
ommlds/cli/sessions/chat/interactive.py +0 -73
ommlds/cli/sessions/chat/printing.py +0 -96
ommlds/cli/sessions/chat/prompt.py +0 -143
ommlds/cli/sessions/chat/state.py +0 -109
ommlds/cli/sessions/chat/tools.py +0 -91
ommlds/cli/sessions/completion/completion.py +0 -44
ommlds/cli/sessions/embedding/embedding.py +0 -42
ommlds/cli/tools/config.py +0 -13
ommlds/cli/tools/inject.py +0 -64
ommlds/minichain/chat/stream/adapters.py +0 -69
ommlds/minichain/lib/fs/ls/execution.py +0 -32
ommlds-0.0.0.dev436.dist-info/RECORD +0 -303
/ommlds/{cli/tools → backends/google}/__init__.py +0 -0
/ommlds/{minichain/lib/fs/ls → backends/groq}/__init__.py +0 -0
/ommlds/{huggingface.py → backends/huggingface.py} +0 -0
/ommlds/minichain/lib/fs/{ls → tools/recursivels}/rendering.py +0 -0
/ommlds/minichain/lib/fs/{ls → tools/recursivels}/running.py +0 -0
{ommlds-0.0.0.dev436.dist-info → ommlds-0.0.0.dev480.dist-info}/WHEEL +0 -0
{ommlds-0.0.0.dev436.dist-info → ommlds-0.0.0.dev480.dist-info}/entry_points.txt +0 -0
{ommlds-0.0.0.dev436.dist-info → ommlds-0.0.0.dev480.dist-info}/licenses/LICENSE +0 -0
{ommlds-0.0.0.dev436.dist-info → ommlds-0.0.0.dev480.dist-info}/top_level.txt +0 -0

ommlds/minichain/backends/impls/groq/stream.py ADDED Viewed

@@ -0,0 +1,125 @@
+import typing as ta
+from omlish import check
+from omlish import marshal as msh
+from omlish import typedvalues as tv
+from omlish.formats import json
+from omlish.http import all as http
+from omlish.http import sse
+from omlish.io.buffers import DelimitingBuffer
+from .....backends.groq import protocol as pt
+from ....chat.choices.services import ChatChoicesOutputs
+from ....chat.choices.stream.services import ChatChoicesStreamRequest
+from ....chat.choices.stream.services import ChatChoicesStreamResponse
+from ....chat.choices.stream.services import static_check_is_chat_choices_stream_service
+from ....chat.choices.stream.types import AiChoicesDeltas
+from ....chat.tools.types import Tool
+from ....configs import Config
+from ....resources import UseResources
+from ....standard import ApiKey
+from ....stream.services import StreamResponseSink
+from ....stream.services import new_stream_response
+from .chat import GroqChatChoicesService
+from .names import MODEL_NAMES
+from .protocol import build_gq_request_messages
+from .protocol import build_gq_request_tool
+from .protocol import build_mc_ai_choice_deltas
+##
+# @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
+#     name='groq',
+#     type='ChatChoicesStreamService',
+# )
+@static_check_is_chat_choices_stream_service
+class GroqChatChoicesStreamService:
+    def __init__(
+            self,
+            *configs: Config,
+            http_client: http.AsyncHttpClient | None = None,
+    ) -> None:
+        super().__init__()
+        self._http_client = http_client
+        with tv.consume(*configs) as cc:
+            self._model_name = cc.pop(GroqChatChoicesService.DEFAULT_MODEL_NAME)
+            self._api_key = ApiKey.pop_secret(cc, env='GROQ_API_KEY')
+    READ_CHUNK_SIZE: ta.ClassVar[int] = -1
+    async def invoke(self, request: ChatChoicesStreamRequest) -> ChatChoicesStreamResponse:
+        tools: list[pt.ChatCompletionRequest.Tool] = []
+        with tv.TypedValues(*request.options).consume() as oc:
+            t: Tool
+            for t in oc.pop(Tool, []):
+                tools.append(build_gq_request_tool(t))
+        gq_request = pt.ChatCompletionRequest(
+            messages=build_gq_request_messages(request.v),
+            model=MODEL_NAMES.resolve(self._model_name.v),
+            tools=tools or None,
+            stream=True,
+        )
+        raw_request = msh.marshal(gq_request)
+        http_request = http.HttpRequest(
+            'https://api.groq.com/openai/v1/chat/completions',
+            headers={
+                http.consts.HEADER_CONTENT_TYPE: http.consts.CONTENT_TYPE_JSON,
+                http.consts.HEADER_AUTH: http.consts.format_bearer_auth_header(check.not_none(self._api_key).reveal()),
+            },
+            data=json.dumps(raw_request).encode('utf-8'),
+        )
+        async with UseResources.or_new(request.options) as rs:
+            http_client = await rs.enter_async_context(http.manage_async_client(self._http_client))
+            http_response = await rs.enter_async_context(await http_client.stream_request(http_request))
+            async def inner(sink: StreamResponseSink[AiChoicesDeltas]) -> ta.Sequence[ChatChoicesOutputs]:
+                db = DelimitingBuffer([b'\r', b'\n', b'\r\n'])
+                sd = sse.SseDecoder()
+                while True:
+                    b = await http_response.stream.read1(self.READ_CHUNK_SIZE)
+                    for l in db.feed(b):
+                        if isinstance(l, DelimitingBuffer.Incomplete):
+                            # FIXME: handle
+                            return []
+                        # FIXME: https://platform.openai.com/docs/guides/function-calling?api-mode=responses#streaming
+                        for so in sd.process_line(l):
+                            if isinstance(so, sse.SseEvent) and so.type == b'message':
+                                ss = so.data.decode('utf-8')
+                                if ss == '[DONE]':
+                                    return []
+                                sj = json.loads(ss)  # ChatCompletionChunk
+                                check.state(sj['object'] == 'chat.completion.chunk')
+                                ccc = msh.unmarshal(sj, pt.ChatCompletionChunk)
+                                # FIXME: stop reason
+                                if not ccc.choices:
+                                    continue
+                                if any(choice.finish_reason for choice in ccc.choices):
+                                    check.state(all(choice.finish_reason for choice in ccc.choices))
+                                    break
+                                await sink.emit(AiChoicesDeltas([
+                                    build_mc_ai_choice_deltas(choice.delta)
+                                    for choice in ccc.choices
+                                ]))
+                    if not b:
+                        return []
+            # raw_response = json.loads(check.not_none(http_response.data).decode('utf-8'))
+            # return rh.build_response(raw_response)
+            return await new_stream_response(rs, inner)

ommlds/minichain/backends/impls/llamacpp/chat.py CHANGED Viewed

@@ -15,7 +15,8 @@ from ....chat.choices.services import static_check_is_chat_choices_service
 from ....chat.choices.types import AiChoice
 from ....chat.choices.types import ChatChoicesOptions
 from ....chat.messages import AiMessage
-from ....chat.messages import ToolExecResultMessage
+from ....chat.messages import ToolUseMessage
+from ....chat.messages import ToolUseResultMessage
 from ....chat.tools.types import Tool
 from ....configs import Config
 from ....llms.types import MaxTokens
@@ -29,6 +30,15 @@ from .format import get_msg_content
 ##
+# @omlish-manifest $.minichain.backends.strings.manifests.BackendStringsManifest(
+#     ['ChatChoicesService'],
+#     'llamacpp',
+# )
+##
 # @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
 #     name='llamacpp',
 #     type='ChatChoicesService',
@@ -54,7 +64,7 @@ class LlamacppChatChoicesService:
         temperatur=Temperature,
     )
-    def invoke(self, request: ChatChoicesRequest) -> ChatChoicesResponse:
+    async def invoke(self, request: ChatChoicesRequest) -> ChatChoicesResponse:
         kwargs: dict = dict(
             # temperature=0,
             max_tokens=1024,
@@ -100,29 +110,34 @@ class LlamacppChatChoicesService:
             ims: list = []
             for rm in request.v:
-                if isinstance(rm, ToolExecResultMessage):
+                if isinstance(rm, ToolUseResultMessage):
                     ims.append(dict(
                         role='tool',
-                        **(dict(id=rm.id) if rm.id is not None else {}),
-                        name=rm.name,
-                        content=check.isinstance(rm.c, str),
+                        **(dict(id=rm.tur.id) if rm.tur.id is not None else {}),
+                        name=rm.tur.name,
+                        content=check.isinstance(rm.tur.c, str),
                     ))
                 elif isinstance(rm, AiMessage):
-                    tcs: list[dict] = []
-                    for ter in rm.tool_exec_requests or []:
-                        tcs.append(dict(
-                            id=check.not_none(ter.id),
-                            type='function',
-                            function=dict(
-                                name=ter.name,
-                                arguments=check.isinstance(ter.raw_args, str),
-                            ),
-                        ))
                     ims.append(dict(
                         role=ROLES_MAP[type(rm)],
                         **(dict(content=mc) if (mc := get_msg_content(rm)) is not None else {}),
-                        **(dict(tool_calls=tcs) if tcs else {}),
                     ))
+                elif isinstance(rm, ToolUseMessage):
+                    ims.append(dict(
+                        role=ROLES_MAP[type(rm)],
+                        content='',
+                        tool_calls=[dict(
+                            id=check.not_none(rm.tu.id),
+                            type='function',
+                            function=dict(
+                                name=rm.tu.name,
+                                arguments=check.isinstance(rm.tu.raw_args, str),
+                            ),
+                        )],
+                    ))
                 else:
                     ims.append(dict(
                         role=ROLES_MAP[type(rm)],
@@ -137,6 +152,6 @@ class LlamacppChatChoicesService:
             out: list[AiChoice] = []
             for c in ta.cast(ta.Any, output)['choices']:
                 m = c['message']
-                out.append(AiChoice(AiMessage(m['content'])))
+                out.append(AiChoice([AiMessage(m['content'])]))
             return ChatChoicesResponse(out)

ommlds/minichain/backends/impls/llamacpp/completion.py CHANGED Viewed

@@ -51,7 +51,7 @@ class LlamacppCompletionService:
         temperatur=Temperature,
     )
-    def invoke(self, request: CompletionRequest) -> CompletionResponse:
+    async def invoke(self, request: CompletionRequest) -> CompletionResponse:
         kwargs: dict = dict(
             # temperature=0,
             max_tokens=1024,

ommlds/minichain/backends/impls/llamacpp/format.py CHANGED Viewed

@@ -5,7 +5,8 @@ from omlish import check
 from ....chat.messages import AiMessage
 from ....chat.messages import Message
 from ....chat.messages import SystemMessage
-from ....chat.messages import ToolExecResultMessage
+from ....chat.messages import ToolUseMessage
+from ....chat.messages import ToolUseResultMessage
 from ....chat.messages import UserMessage
@@ -16,7 +17,8 @@ ROLES_MAP: ta.Mapping[type[Message], str] = {
     SystemMessage: 'system',
     UserMessage: 'user',
     AiMessage: 'assistant',
-    ToolExecResultMessage: 'tool',
+    ToolUseMessage: 'assistant',
+    ToolUseResultMessage: 'tool',
 }

ommlds/minichain/backends/impls/llamacpp/stream.py CHANGED Viewed

@@ -10,15 +10,16 @@ from omlish import typedvalues as tv
 from .....backends import llamacpp as lcu
 from ....chat.choices.services import ChatChoicesOutputs
-from ....chat.stream.services import ChatChoicesStreamRequest
-from ....chat.stream.services import ChatChoicesStreamResponse
-from ....chat.stream.services import static_check_is_chat_choices_stream_service
-from ....chat.stream.types import AiChoiceDelta
-from ....chat.stream.types import AiChoiceDeltas
-from ....chat.stream.types import AiMessageDelta
+from ....chat.choices.stream.services import ChatChoicesStreamRequest
+from ....chat.choices.stream.services import ChatChoicesStreamResponse
+from ....chat.choices.stream.services import static_check_is_chat_choices_stream_service
+from ....chat.choices.stream.types import AiChoiceDeltas
+from ....chat.choices.stream.types import AiChoicesDeltas
+from ....chat.stream.types import ContentAiDelta
 from ....configs import Config
 from ....models.configs import ModelPath
 from ....resources import UseResources
+from ....stream.services import StreamResponseSink
 from ....stream.services import new_stream_response
 from .chat import LlamacppChatChoicesService
 from .format import ROLES_MAP
@@ -28,6 +29,15 @@ from .format import get_msg_content
 ##
+# @omlish-manifest $.minichain.backends.strings.manifests.BackendStringsManifest(
+#     ['ChatChoicesStreamService'],
+#     'llamacpp',
+# )
+##
 # @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
 #     name='llamacpp',
 #     type='ChatChoicesStreamService',
@@ -49,10 +59,10 @@ class LlamacppChatChoicesStreamService(lang.ExitStacked):
             verbose=False,
         )))
-    def invoke(self, request: ChatChoicesStreamRequest) -> ChatChoicesStreamResponse:
+    async def invoke(self, request: ChatChoicesStreamRequest) -> ChatChoicesStreamResponse:
         lcu.install_logging_hook()
-        with UseResources.or_new(request.options) as rs:
+        async with UseResources.or_new(request.options) as rs:
             rs.enter_context(self._lock)
             model: ta.Any = self._load_model()  # FIXME: the types are awful lol
@@ -74,19 +84,26 @@ class LlamacppChatChoicesStreamService(lang.ExitStacked):
             rs.enter_context(lang.defer(close_output))
-            def yield_choices() -> ta.Generator[AiChoiceDeltas, None, ta.Sequence[ChatChoicesOutputs] | None]:
+            async def inner(sink: StreamResponseSink[AiChoicesDeltas]) -> ta.Sequence[ChatChoicesOutputs] | None:
+                last_role: ta.Any = None
                 for chunk in output:
                     check.state(chunk['object'] == 'chat.completion.chunk')
-                    l: list[AiChoiceDelta] = []
-                    for choice in chunk['choices']:
-                        # FIXME: check role is assistant
-                        # FIXME: stop reason
-                        if not (delta := choice.get('delta', {})):
-                            continue
-                        if not (content := delta.get('content', '')):
-                            continue
-                        l.append(AiChoiceDelta(AiMessageDelta(content)))
-                    yield l
+                    choice = check.single(chunk['choices'])
+                    if not (delta := choice.get('delta', {})):
+                        continue
+                    # FIXME: check role is assistant
+                    if (role := delta.get('role')) != last_role:
+                        last_role = role
+                    # FIXME: stop reason
+                    if (content := delta.get('content', '')):
+                        await sink.emit(AiChoicesDeltas([AiChoiceDeltas([ContentAiDelta(content)])]))
                 return None
-            return new_stream_response(rs, yield_choices())
+            return await new_stream_response(rs, inner)

ommlds/minichain/backends/impls/mistral.py CHANGED Viewed

@@ -21,13 +21,18 @@ from ...chat.messages import UserMessage
 ##
+# TODO: generalize lol
+class TooManyRequestsMistralError(Exception):
+    pass
 # @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
 #     name='mistral',
 #     type='ChatChoicesService',
 # )
 @static_check_is_chat_choices_service
 class MistralChatChoicesService:
-    model: ta.ClassVar[str] = 'mistral-large-latest'
+    model: ta.ClassVar[str] = 'mistral-medium-2508'
     ROLES_MAP: ta.ClassVar[ta.Mapping[type[Message], str]] = {
         SystemMessage: 'system',
@@ -35,10 +40,16 @@ class MistralChatChoicesService:
         AiMessage: 'assistant',
     }
-    def __init__(self, *, api_key: str | None = None) -> None:
+    def __init__(
+            self,
+            *,
+            api_key: str | None = None,
+            http_client: http.AsyncHttpClient | None = None,
+    ) -> None:
         super().__init__()
         self._api_key = api_key
+        self._http_client = http_client
     def _get_msg_content(self, m: Message) -> str | None:
         if isinstance(m, AiMessage):
@@ -50,7 +61,7 @@ class MistralChatChoicesService:
         else:
             raise TypeError(m)
-    def invoke(
+    async def invoke(
             self,
             request: ChatChoicesRequest,
     ) -> ChatChoicesResponse:
@@ -68,7 +79,7 @@ class MistralChatChoicesService:
             ],
         }
-        resp = http.request(
+        resp = await http.async_request(
             'https://api.mistral.ai/v1/chat/completions',
             method='POST',
             data=json.dumps_compact(req_dct).encode('utf-8'),
@@ -77,11 +88,15 @@ class MistralChatChoicesService:
                 'Accept': 'application/json',
                 'Authorization': f'Bearer {key}',
             },
+            client=self._http_client,
         )
+        if resp.status == 429:
+            raise TooManyRequestsMistralError
         resp_dct = json.loads(check.not_none(resp.data).decode('utf-8'))
         return ChatChoicesResponse([
-            AiChoice(AiMessage(c['message']['content']))
+            AiChoice([AiMessage(c['message']['content'])])
             for c in resp_dct['choices']
         ])

ommlds/minichain/backends/impls/mlx/chat.py CHANGED Viewed

@@ -1,3 +1,4 @@
+import contextlib
 import typing as ta
 from omlish import check
@@ -5,28 +6,38 @@ from omlish import lang
 from omlish import typedvalues as tv
 from .....backends import mlx as mlxu
+from ....chat.choices.services import ChatChoicesOutputs
 from ....chat.choices.services import ChatChoicesRequest
 from ....chat.choices.services import ChatChoicesResponse
 from ....chat.choices.services import static_check_is_chat_choices_service
+from ....chat.choices.stream.services import ChatChoicesStreamRequest
+from ....chat.choices.stream.services import ChatChoicesStreamResponse
+from ....chat.choices.stream.services import static_check_is_chat_choices_stream_service
+from ....chat.choices.stream.types import AiChoiceDeltas
+from ....chat.choices.stream.types import AiChoicesDeltas
 from ....chat.choices.types import AiChoice
 from ....chat.choices.types import ChatChoicesOptions
 from ....chat.messages import AiMessage
 from ....chat.messages import Message
 from ....chat.messages import SystemMessage
 from ....chat.messages import UserMessage
+from ....chat.stream.types import ContentAiDelta
 from ....configs import Config
 from ....llms.types import MaxTokens
 from ....models.configs import ModelPath
 from ....models.configs import ModelRepo
 from ....models.configs import ModelSpecifier
+from ....resources import UseResources
 from ....standard import DefaultOptions
+from ....stream.services import StreamResponseSink
+from ....stream.services import new_stream_response
 ##
 # @omlish-manifest $.minichain.backends.strings.manifests.BackendStringsManifest(
-#     ['ChatChoicesService'],
+#     ['ChatChoicesService', 'ChatChoicesStreamService'],
 #     'mlx',
 # )
@@ -34,12 +45,7 @@ from ....standard import DefaultOptions
 ##
-# @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
-#     name='mlx',
-#     type='ChatChoicesService',
-# )
-@static_check_is_chat_choices_service
-class MlxChatChoicesService(lang.ExitStacked):
+class BaseMlxChatChoicesService(lang.ExitStacked):
     DEFAULT_MODEL: ta.ClassVar[ModelSpecifier] = (
         # 'mlx-community/DeepSeek-Coder-V2-Lite-Instruct-8bit'
         # 'mlx-community/Llama-3.3-70B-Instruct-4bit'
@@ -52,8 +58,8 @@ class MlxChatChoicesService(lang.ExitStacked):
         # 'mlx-community/Qwen2.5-0.5B-4bit'
         # 'mlx-community/Qwen2.5-32B-Instruct-8bit'
         # 'mlx-community/Qwen2.5-Coder-32B-Instruct-8bit'
-        # 'mlx-community/mamba-2.8b-hf-f16'
         # 'mlx-community/Qwen3-30B-A3B-6bit'
+        # 'mlx-community/mamba-2.8b-hf-f16'
     )
     def __init__(self, *configs: Config) -> None:
@@ -70,10 +76,7 @@ class MlxChatChoicesService(lang.ExitStacked):
     }
     def _get_msg_content(self, m: Message) -> str | None:
-        if isinstance(m, AiMessage):
-            return check.isinstance(m.c, str)
-        elif isinstance(m, (SystemMessage, UserMessage)):
+        if isinstance(m, (AiMessage, SystemMessage, UserMessage)):
             return check.isinstance(m.c, str)
         else:
@@ -96,10 +99,9 @@ class MlxChatChoicesService(lang.ExitStacked):
         max_tokens=MaxTokens,
     )
-    def invoke(self, request: ChatChoicesRequest) -> ChatChoicesResponse:
-        loaded_model = self._load_model()
-        tokenizer = loaded_model.tokenization.tokenizer
+    @lang.cached_function(transient=True)
+    def _get_tokenizer(self) -> mlxu.tokenization.Tokenizer:
+        tokenizer = self._load_model().tokenization.tokenizer
         if not (
                 hasattr(tokenizer, 'apply_chat_template') and
@@ -107,26 +109,44 @@ class MlxChatChoicesService(lang.ExitStacked):
         ):
             raise RuntimeError(tokenizer)
-        prompt = tokenizer.apply_chat_template(
+        return tokenizer
+    def _build_prompt(self, messages: ta.Sequence[Message]) -> str:
+        return check.isinstance(self._get_tokenizer().apply_chat_template(
             [  # type: ignore[arg-type]
                 dict(
                     role=self.ROLES_MAP[type(m)],
                     content=self._get_msg_content(m),
                 )
-                for m in request.v
+                for m in messages
             ],
             tokenize=False,
             add_generation_prompt=True,
-        )
+        ), str)
-        kwargs = dict()
+    def _build_kwargs(self, oc: tv.TypedValuesConsumer) -> dict[str, ta.Any]:
+        kwargs: dict[str, ta.Any] = {}
+        kwargs.update(oc.pop_scalar_kwargs(**self._OPTION_KWARG_NAMES_MAP))
+        return kwargs
+# @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
+#     name='mlx',
+#     type='ChatChoicesService',
+# )
+@static_check_is_chat_choices_service
+class MlxChatChoicesService(BaseMlxChatChoicesService):
+    async def invoke(self, request: ChatChoicesRequest) -> ChatChoicesResponse:
+        loaded_model = self._load_model()
+        prompt = self._build_prompt(request.v)
         with tv.consume(
                 *self._default_options,
                 *request.options,
                 override=True,
         ) as oc:
-            kwargs.update(oc.pop_scalar_kwargs(**self._OPTION_KWARG_NAMES_MAP))
+            kwargs = self._build_kwargs(oc)
         response = mlxu.generate(
             loaded_model.model,
@@ -137,5 +157,59 @@ class MlxChatChoicesService(lang.ExitStacked):
         )
         return ChatChoicesResponse([
-            AiChoice(AiMessage(response))  # noqa
+            AiChoice([AiMessage(response)])  # noqa
         ])
+# @omlish-manifest $.minichain.registries.manifests.RegistryManifest(
+#     name='mlx',
+#     type='ChatChoicesStreamService',
+# )
+@static_check_is_chat_choices_stream_service
+class MlxChatChoicesStreamService(BaseMlxChatChoicesService):
+    def __init__(self, *configs: Config) -> None:
+        super().__init__()
+        with tv.consume(*configs) as cc:
+            self._model = cc.pop(MlxChatChoicesService.DEFAULT_MODEL)
+            self._default_options: tv.TypedValues = DefaultOptions.pop(cc)
+    READ_CHUNK_SIZE = 64 * 1024
+    async def invoke(
+            self,
+            request: ChatChoicesStreamRequest,
+            *,
+            max_tokens: int = 4096,  # FIXME: ChatOption
+    ) -> ChatChoicesStreamResponse:
+        loaded_model = self._load_model()
+        prompt = self._build_prompt(request.v)
+        with tv.consume(
+                *self._default_options,
+                *request.options,
+                override=True,
+        ) as oc:
+            oc.pop(UseResources, None)
+            kwargs = self._build_kwargs(oc)
+        async with UseResources.or_new(request.options) as rs:
+            gen: ta.Iterator[mlxu.GenerationOutput] = rs.enter_context(contextlib.closing(mlxu.stream_generate(
+                loaded_model.model,
+                loaded_model.tokenization,
+                check.isinstance(prompt, str),
+                mlxu.GenerationParams(**kwargs),
+                # verbose=True,
+            )))
+            async def inner(sink: StreamResponseSink[AiChoicesDeltas]) -> ta.Sequence[ChatChoicesOutputs]:
+                for go in gen:
+                    if go.text:
+                        await sink.emit(AiChoicesDeltas([AiChoiceDeltas([
+                            ContentAiDelta(go.text),
+                        ])]))
+                return []
+            return await new_stream_response(rs, inner)

ommlds/minichain/backends/impls/ollama/__init__.py ADDED Viewed

File without changes

ommlds 0.0.0.dev436__py3-none-any.whl → 0.0.0.dev480__py3-none-any.whl

ommlds 0.0.0.dev436py3-none-any.whl → 0.0.0.dev480py3-none-any.whl