PyPI - aiqtoolkit - Versions diffs - 1.1.0a20250515__py3-none-any.whl → 1.1.0a20251020__py3-none-any.whl - Mend

aiqtoolkit 1.1.0a20250515py3-none-any.whl → 1.1.0a20251020py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of aiqtoolkit might be problematic. Click here for more details.

Files changed (319) hide show

aiqtoolkit-1.1.0a20251020.dist-info/METADATA +37 -0
aiqtoolkit-1.1.0a20251020.dist-info/RECORD +4 -0
{aiqtoolkit-1.1.0a20250515.dist-info → aiqtoolkit-1.1.0a20251020.dist-info}/WHEEL +1 -1
aiqtoolkit-1.1.0a20251020.dist-info/top_level.txt +1 -0
aiq/agent/__init__.py +0 -0
aiq/agent/base.py +0 -76
aiq/agent/dual_node.py +0 -67
aiq/agent/react_agent/__init__.py +0 -0
aiq/agent/react_agent/agent.py +0 -322
aiq/agent/react_agent/output_parser.py +0 -104
aiq/agent/react_agent/prompt.py +0 -46
aiq/agent/react_agent/register.py +0 -148
aiq/agent/reasoning_agent/__init__.py +0 -0
aiq/agent/reasoning_agent/reasoning_agent.py +0 -224
aiq/agent/register.py +0 -23
aiq/agent/rewoo_agent/__init__.py +0 -0
aiq/agent/rewoo_agent/agent.py +0 -410
aiq/agent/rewoo_agent/prompt.py +0 -108
aiq/agent/rewoo_agent/register.py +0 -158
aiq/agent/tool_calling_agent/__init__.py +0 -0
aiq/agent/tool_calling_agent/agent.py +0 -123
aiq/agent/tool_calling_agent/register.py +0 -105
aiq/builder/__init__.py +0 -0
aiq/builder/builder.py +0 -223
aiq/builder/component_utils.py +0 -303
aiq/builder/context.py +0 -227
aiq/builder/embedder.py +0 -24
aiq/builder/eval_builder.py +0 -120
aiq/builder/evaluator.py +0 -29
aiq/builder/framework_enum.py +0 -24
aiq/builder/front_end.py +0 -73
aiq/builder/function.py +0 -297
aiq/builder/function_base.py +0 -376
aiq/builder/function_info.py +0 -627
aiq/builder/intermediate_step_manager.py +0 -135
aiq/builder/llm.py +0 -25
aiq/builder/retriever.py +0 -25
aiq/builder/user_interaction_manager.py +0 -71
aiq/builder/workflow.py +0 -143
aiq/builder/workflow_builder.py +0 -757
aiq/cli/__init__.py +0 -14
aiq/cli/cli_utils/__init__.py +0 -0
aiq/cli/cli_utils/config_override.py +0 -231
aiq/cli/cli_utils/validation.py +0 -37
aiq/cli/commands/__init__.py +0 -0
aiq/cli/commands/configure/__init__.py +0 -0
aiq/cli/commands/configure/channel/__init__.py +0 -0
aiq/cli/commands/configure/channel/add.py +0 -28
aiq/cli/commands/configure/channel/channel.py +0 -36
aiq/cli/commands/configure/channel/remove.py +0 -30
aiq/cli/commands/configure/channel/update.py +0 -30
aiq/cli/commands/configure/configure.py +0 -33
aiq/cli/commands/evaluate.py +0 -139
aiq/cli/commands/info/__init__.py +0 -14
aiq/cli/commands/info/info.py +0 -39
aiq/cli/commands/info/list_channels.py +0 -32
aiq/cli/commands/info/list_components.py +0 -129
aiq/cli/commands/info/list_mcp.py +0 -126
aiq/cli/commands/registry/__init__.py +0 -14
aiq/cli/commands/registry/publish.py +0 -88
aiq/cli/commands/registry/pull.py +0 -118
aiq/cli/commands/registry/registry.py +0 -38
aiq/cli/commands/registry/remove.py +0 -108
aiq/cli/commands/registry/search.py +0 -155
aiq/cli/commands/start.py +0 -250
aiq/cli/commands/uninstall.py +0 -83
aiq/cli/commands/validate.py +0 -47
aiq/cli/commands/workflow/__init__.py +0 -14
aiq/cli/commands/workflow/templates/__init__.py.j2 +0 -0
aiq/cli/commands/workflow/templates/config.yml.j2 +0 -16
aiq/cli/commands/workflow/templates/pyproject.toml.j2 +0 -22
aiq/cli/commands/workflow/templates/register.py.j2 +0 -5
aiq/cli/commands/workflow/templates/workflow.py.j2 +0 -36
aiq/cli/commands/workflow/workflow.py +0 -37
aiq/cli/commands/workflow/workflow_commands.py +0 -313
aiq/cli/entrypoint.py +0 -133
aiq/cli/main.py +0 -44
aiq/cli/register_workflow.py +0 -408
aiq/cli/type_registry.py +0 -879
aiq/data_models/__init__.py +0 -14
aiq/data_models/api_server.py +0 -588
aiq/data_models/common.py +0 -143
aiq/data_models/component.py +0 -46
aiq/data_models/component_ref.py +0 -135
aiq/data_models/config.py +0 -349
aiq/data_models/dataset_handler.py +0 -122
aiq/data_models/discovery_metadata.py +0 -286
aiq/data_models/embedder.py +0 -26
aiq/data_models/evaluate.py +0 -104
aiq/data_models/evaluator.py +0 -26
aiq/data_models/front_end.py +0 -26
aiq/data_models/function.py +0 -30
aiq/data_models/function_dependencies.py +0 -64
aiq/data_models/interactive.py +0 -237
aiq/data_models/intermediate_step.py +0 -269
aiq/data_models/invocation_node.py +0 -38
aiq/data_models/llm.py +0 -26
aiq/data_models/logging.py +0 -26
aiq/data_models/memory.py +0 -26
aiq/data_models/profiler.py +0 -53
aiq/data_models/registry_handler.py +0 -26
aiq/data_models/retriever.py +0 -30
aiq/data_models/step_adaptor.py +0 -64
aiq/data_models/streaming.py +0 -33
aiq/data_models/swe_bench_model.py +0 -54
aiq/data_models/telemetry_exporter.py +0 -26
aiq/embedder/__init__.py +0 -0
aiq/embedder/langchain_client.py +0 -41
aiq/embedder/nim_embedder.py +0 -58
aiq/embedder/openai_embedder.py +0 -42
aiq/embedder/register.py +0 -24
aiq/eval/__init__.py +0 -14
aiq/eval/config.py +0 -42
aiq/eval/dataset_handler/__init__.py +0 -0
aiq/eval/dataset_handler/dataset_downloader.py +0 -106
aiq/eval/dataset_handler/dataset_filter.py +0 -52
aiq/eval/dataset_handler/dataset_handler.py +0 -169
aiq/eval/evaluate.py +0 -325
aiq/eval/evaluator/__init__.py +0 -14
aiq/eval/evaluator/evaluator_model.py +0 -44
aiq/eval/intermediate_step_adapter.py +0 -93
aiq/eval/rag_evaluator/__init__.py +0 -0
aiq/eval/rag_evaluator/evaluate.py +0 -138
aiq/eval/rag_evaluator/register.py +0 -138
aiq/eval/register.py +0 -23
aiq/eval/remote_workflow.py +0 -128
aiq/eval/runtime_event_subscriber.py +0 -52
aiq/eval/swe_bench_evaluator/__init__.py +0 -0
aiq/eval/swe_bench_evaluator/evaluate.py +0 -215
aiq/eval/swe_bench_evaluator/register.py +0 -36
aiq/eval/trajectory_evaluator/__init__.py +0 -0
aiq/eval/trajectory_evaluator/evaluate.py +0 -118
aiq/eval/trajectory_evaluator/register.py +0 -40
aiq/eval/tunable_rag_evaluator/__init__.py +0 -0
aiq/eval/tunable_rag_evaluator/evaluate.py +0 -263
aiq/eval/tunable_rag_evaluator/register.py +0 -50
aiq/eval/utils/__init__.py +0 -0
aiq/eval/utils/output_uploader.py +0 -131
aiq/eval/utils/tqdm_position_registry.py +0 -40
aiq/front_ends/__init__.py +0 -14
aiq/front_ends/console/__init__.py +0 -14
aiq/front_ends/console/console_front_end_config.py +0 -32
aiq/front_ends/console/console_front_end_plugin.py +0 -107
aiq/front_ends/console/register.py +0 -25
aiq/front_ends/cron/__init__.py +0 -14
aiq/front_ends/fastapi/__init__.py +0 -14
aiq/front_ends/fastapi/fastapi_front_end_config.py +0 -150
aiq/front_ends/fastapi/fastapi_front_end_plugin.py +0 -103
aiq/front_ends/fastapi/fastapi_front_end_plugin_worker.py +0 -607
aiq/front_ends/fastapi/intermediate_steps_subscriber.py +0 -80
aiq/front_ends/fastapi/job_store.py +0 -161
aiq/front_ends/fastapi/main.py +0 -70
aiq/front_ends/fastapi/message_handler.py +0 -279
aiq/front_ends/fastapi/message_validator.py +0 -345
aiq/front_ends/fastapi/register.py +0 -25
aiq/front_ends/fastapi/response_helpers.py +0 -195
aiq/front_ends/fastapi/step_adaptor.py +0 -320
aiq/front_ends/fastapi/websocket.py +0 -148
aiq/front_ends/mcp/__init__.py +0 -14
aiq/front_ends/mcp/mcp_front_end_config.py +0 -32
aiq/front_ends/mcp/mcp_front_end_plugin.py +0 -93
aiq/front_ends/mcp/register.py +0 -27
aiq/front_ends/mcp/tool_converter.py +0 -242
aiq/front_ends/register.py +0 -22
aiq/front_ends/simple_base/__init__.py +0 -14
aiq/front_ends/simple_base/simple_front_end_plugin_base.py +0 -52
aiq/llm/__init__.py +0 -0
aiq/llm/nim_llm.py +0 -45
aiq/llm/openai_llm.py +0 -45
aiq/llm/register.py +0 -22
aiq/llm/utils/__init__.py +0 -14
aiq/llm/utils/env_config_value.py +0 -94
aiq/llm/utils/error.py +0 -17
aiq/memory/__init__.py +0 -20
aiq/memory/interfaces.py +0 -183
aiq/memory/models.py +0 -112
aiq/meta/module_to_distro.json +0 -3
aiq/meta/pypi.md +0 -58
aiq/observability/__init__.py +0 -0
aiq/observability/async_otel_listener.py +0 -429
aiq/observability/register.py +0 -99
aiq/plugins/.namespace +0 -1
aiq/profiler/__init__.py +0 -0
aiq/profiler/callbacks/__init__.py +0 -0
aiq/profiler/callbacks/agno_callback_handler.py +0 -295
aiq/profiler/callbacks/base_callback_class.py +0 -20
aiq/profiler/callbacks/langchain_callback_handler.py +0 -278
aiq/profiler/callbacks/llama_index_callback_handler.py +0 -205
aiq/profiler/callbacks/semantic_kernel_callback_handler.py +0 -238
aiq/profiler/callbacks/token_usage_base_model.py +0 -27
aiq/profiler/data_frame_row.py +0 -51
aiq/profiler/decorators/__init__.py +0 -0
aiq/profiler/decorators/framework_wrapper.py +0 -131
aiq/profiler/decorators/function_tracking.py +0 -254
aiq/profiler/forecasting/__init__.py +0 -0
aiq/profiler/forecasting/config.py +0 -18
aiq/profiler/forecasting/model_trainer.py +0 -75
aiq/profiler/forecasting/models/__init__.py +0 -22
aiq/profiler/forecasting/models/forecasting_base_model.py +0 -40
aiq/profiler/forecasting/models/linear_model.py +0 -196
aiq/profiler/forecasting/models/random_forest_regressor.py +0 -268
aiq/profiler/inference_metrics_model.py +0 -25
aiq/profiler/inference_optimization/__init__.py +0 -0
aiq/profiler/inference_optimization/bottleneck_analysis/__init__.py +0 -0
aiq/profiler/inference_optimization/bottleneck_analysis/nested_stack_analysis.py +0 -452
aiq/profiler/inference_optimization/bottleneck_analysis/simple_stack_analysis.py +0 -258
aiq/profiler/inference_optimization/data_models.py +0 -386
aiq/profiler/inference_optimization/experimental/__init__.py +0 -0
aiq/profiler/inference_optimization/experimental/concurrency_spike_analysis.py +0 -468
aiq/profiler/inference_optimization/experimental/prefix_span_analysis.py +0 -405
aiq/profiler/inference_optimization/llm_metrics.py +0 -212
aiq/profiler/inference_optimization/prompt_caching.py +0 -163
aiq/profiler/inference_optimization/token_uniqueness.py +0 -107
aiq/profiler/inference_optimization/workflow_runtimes.py +0 -72
aiq/profiler/intermediate_property_adapter.py +0 -102
aiq/profiler/profile_runner.py +0 -433
aiq/profiler/utils.py +0 -184
aiq/registry_handlers/__init__.py +0 -0
aiq/registry_handlers/local/__init__.py +0 -0
aiq/registry_handlers/local/local_handler.py +0 -176
aiq/registry_handlers/local/register_local.py +0 -37
aiq/registry_handlers/metadata_factory.py +0 -60
aiq/registry_handlers/package_utils.py +0 -198
aiq/registry_handlers/pypi/__init__.py +0 -0
aiq/registry_handlers/pypi/pypi_handler.py +0 -251
aiq/registry_handlers/pypi/register_pypi.py +0 -40
aiq/registry_handlers/register.py +0 -21
aiq/registry_handlers/registry_handler_base.py +0 -157
aiq/registry_handlers/rest/__init__.py +0 -0
aiq/registry_handlers/rest/register_rest.py +0 -56
aiq/registry_handlers/rest/rest_handler.py +0 -237
aiq/registry_handlers/schemas/__init__.py +0 -0
aiq/registry_handlers/schemas/headers.py +0 -42
aiq/registry_handlers/schemas/package.py +0 -68
aiq/registry_handlers/schemas/publish.py +0 -63
aiq/registry_handlers/schemas/pull.py +0 -82
aiq/registry_handlers/schemas/remove.py +0 -36
aiq/registry_handlers/schemas/search.py +0 -91
aiq/registry_handlers/schemas/status.py +0 -47
aiq/retriever/__init__.py +0 -0
aiq/retriever/interface.py +0 -37
aiq/retriever/milvus/__init__.py +0 -14
aiq/retriever/milvus/register.py +0 -81
aiq/retriever/milvus/retriever.py +0 -228
aiq/retriever/models.py +0 -74
aiq/retriever/nemo_retriever/__init__.py +0 -14
aiq/retriever/nemo_retriever/register.py +0 -60
aiq/retriever/nemo_retriever/retriever.py +0 -190
aiq/retriever/register.py +0 -22
aiq/runtime/__init__.py +0 -14
aiq/runtime/loader.py +0 -188
aiq/runtime/runner.py +0 -176
aiq/runtime/session.py +0 -140
aiq/runtime/user_metadata.py +0 -131
aiq/settings/__init__.py +0 -0
aiq/settings/global_settings.py +0 -318
aiq/test/.namespace +0 -1
aiq/tool/__init__.py +0 -0
aiq/tool/code_execution/__init__.py +0 -0
aiq/tool/code_execution/code_sandbox.py +0 -188
aiq/tool/code_execution/local_sandbox/Dockerfile.sandbox +0 -60
aiq/tool/code_execution/local_sandbox/__init__.py +0 -13
aiq/tool/code_execution/local_sandbox/local_sandbox_server.py +0 -83
aiq/tool/code_execution/local_sandbox/sandbox.requirements.txt +0 -4
aiq/tool/code_execution/local_sandbox/start_local_sandbox.sh +0 -25
aiq/tool/code_execution/register.py +0 -70
aiq/tool/code_execution/utils.py +0 -100
aiq/tool/datetime_tools.py +0 -42
aiq/tool/document_search.py +0 -141
aiq/tool/github_tools/__init__.py +0 -0
aiq/tool/github_tools/create_github_commit.py +0 -133
aiq/tool/github_tools/create_github_issue.py +0 -87
aiq/tool/github_tools/create_github_pr.py +0 -106
aiq/tool/github_tools/get_github_file.py +0 -106
aiq/tool/github_tools/get_github_issue.py +0 -166
aiq/tool/github_tools/get_github_pr.py +0 -256
aiq/tool/github_tools/update_github_issue.py +0 -100
aiq/tool/mcp/__init__.py +0 -14
aiq/tool/mcp/mcp_client.py +0 -220
aiq/tool/mcp/mcp_tool.py +0 -95
aiq/tool/memory_tools/__init__.py +0 -0
aiq/tool/memory_tools/add_memory_tool.py +0 -79
aiq/tool/memory_tools/delete_memory_tool.py +0 -67
aiq/tool/memory_tools/get_memory_tool.py +0 -72
aiq/tool/nvidia_rag.py +0 -95
aiq/tool/register.py +0 -37
aiq/tool/retriever.py +0 -89
aiq/tool/server_tools.py +0 -63
aiq/utils/__init__.py +0 -0
aiq/utils/data_models/__init__.py +0 -0
aiq/utils/data_models/schema_validator.py +0 -58
aiq/utils/debugging_utils.py +0 -43
aiq/utils/exception_handlers/__init__.py +0 -0
aiq/utils/exception_handlers/schemas.py +0 -114
aiq/utils/io/__init__.py +0 -0
aiq/utils/io/yaml_tools.py +0 -119
aiq/utils/metadata_utils.py +0 -74
aiq/utils/optional_imports.py +0 -142
aiq/utils/producer_consumer_queue.py +0 -178
aiq/utils/reactive/__init__.py +0 -0
aiq/utils/reactive/base/__init__.py +0 -0
aiq/utils/reactive/base/observable_base.py +0 -65
aiq/utils/reactive/base/observer_base.py +0 -55
aiq/utils/reactive/base/subject_base.py +0 -79
aiq/utils/reactive/observable.py +0 -59
aiq/utils/reactive/observer.py +0 -76
aiq/utils/reactive/subject.py +0 -131
aiq/utils/reactive/subscription.py +0 -49
aiq/utils/settings/__init__.py +0 -0
aiq/utils/settings/global_settings.py +0 -197
aiq/utils/type_converter.py +0 -232
aiq/utils/type_utils.py +0 -397
aiq/utils/url_utils.py +0 -27
aiqtoolkit-1.1.0a20250515.dist-info/METADATA +0 -331
aiqtoolkit-1.1.0a20250515.dist-info/RECORD +0 -316
aiqtoolkit-1.1.0a20250515.dist-info/entry_points.txt +0 -17
aiqtoolkit-1.1.0a20250515.dist-info/licenses/LICENSE-3rd-party.txt +0 -3686
aiqtoolkit-1.1.0a20250515.dist-info/licenses/LICENSE.md +0 -201
aiqtoolkit-1.1.0a20250515.dist-info/top_level.txt +0 -1

aiq/profiler/inference_optimization/experimental/concurrency_spike_analysis.py DELETED Viewed

@@ -1,468 +0,0 @@
-# SPDX-FileCopyrightText: Copyright (c) 2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
-# SPDX-License-Identifier: Apache-2.0
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-# http://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
-"""
-An enhanced script that:
-1. Groups workflow events by example_number to build a per-example call tree (no cross-example nesting).
-2. Tracks concurrency globally across *all* examples.
-3. Identifies concurrency "spikes" (concurrency >= a threshold).
-4. Correlates concurrency spikes with token usage and call metadata.
-5. Computes average call latency by concurrency level, using midpoint concurrency as an approximation.
-6. Returns a Pydantic result containing concurrency distribution, spike intervals, correlation stats, etc.,
-   along with a textual report containing the real call count, active calls in spikes, etc.
-Changes from previous version:
-- Now shows the actual total calls in the dataset.
-- Displays the real number of active calls for each spike interval.
-- Computes and reports average latency by concurrency (no visualization).
-"""
-import numpy as np
-import pandas as pd
-from aiq.data_models.intermediate_step import IntermediateStep
-from aiq.profiler.inference_optimization.data_models import ConcurrencyAnalysisResult
-from aiq.profiler.inference_optimization.data_models import ConcurrencyCallNode
-from aiq.profiler.inference_optimization.data_models import ConcurrencyCorrelationStats
-from aiq.profiler.inference_optimization.data_models import ConcurrencySpikeInfo
-from aiq.profiler.utils import create_standardized_dataframe
-# --------------------------------------------------------------------------------
-# 1) Building the Per-Example Call Trees
-# --------------------------------------------------------------------------------
-def build_call_tree_for_example(example_df: pd.DataFrame) -> list[ConcurrencyCallNode]:
-    """
-    Sort events by time, push on `*_START`, pop on `*_END`, build stack-based calls for a single example.
-    """
-    stack: list[ConcurrencyCallNode] = []
-    top_level: dict[str, ConcurrencyCallNode] = {}
-    partial_map: dict[str, ConcurrencyCallNode] = {}
-    def parse_op_type(et: str) -> str | None:
-        et = et.upper()
-        if et.startswith("LLM_"):
-            return "LLM"
-        if et.startswith("TOOL_"):
-            return "TOOL"
-        return None
-    def get_op_name(row: pd.Series, op_type: str) -> str:
-        if op_type == "LLM":
-            return row.get("llm_name") or "unknown_llm"
-        if op_type == "TOOL":
-            return row.get("tool_name") or "unknown_tool"
-        return "unknown_op"
-    example_num = int(example_df["example_number"].iloc[0])
-    for _, row in example_df.iterrows():
-        et = row["event_type"].value.upper()
-        uuid = str(row["UUID"])
-        ts = float(row["event_timestamp"])
-        op_type = parse_op_type(et)
-        if not op_type:
-            continue
-        if et.endswith("_START"):
-            op_name = get_op_name(row, op_type)
-            node = ConcurrencyCallNode(
-                uuid=uuid,
-                example_number=example_num,
-                operation_type=op_type,
-                operation_name=op_name,
-                start_time=ts,
-                end_time=ts,  # updated on END
-                duration=0.0)
-            if stack:
-                parent = stack[-1]
-                node.parent = parent
-                parent.children.append(node)
-            else:
-                top_level[uuid] = node
-            stack.append(node)
-            partial_map[uuid] = node
-        elif et.endswith("_END"):
-            if uuid not in partial_map:
-                continue
-            node = partial_map[uuid]
-            node.end_time = ts
-            node.duration = max(0.0, node.end_time - node.start_time)
-            node.prompt_tokens = row.get("prompt_tokens")
-            node.completion_tokens = row.get("completion_tokens")
-            node.total_tokens = row.get("total_tokens")
-            node.tool_outputs = row.get("metadata").get("tool_outputs") if (
-                row.get("metadata") and row.get("metadata").get("tool_outputs")) else None
-            node.llm_text_output = row.get("llm_text_output")
-            if stack and stack[-1].uuid == uuid:
-                stack.pop()
-            del partial_map[uuid]
-    # gather top-level
-    roots = []
-    for _, nd in top_level.items():
-        if nd.parent is None:
-            roots.append(nd)
-    return roots
-def build_call_tree_per_example(df: pd.DataFrame) -> list[ConcurrencyCallNode]:
-    """
-    Groups by example_number, builds separate call trees, returns combined list of top-level calls.
-    """
-    req_cols = {"example_number", "event_type", "UUID", "event_timestamp"}
-    missing = req_cols - set(df.columns)
-    if missing:
-        raise ValueError(f"DataFrame missing required columns: {missing}")
-    dfc = df.copy()
-    dfc.sort_values(["example_number", "event_timestamp"], inplace=True)
-    all_roots: list[ConcurrencyCallNode] = []
-    for _, grp in dfc.groupby("example_number"):
-        r = build_call_tree_for_example(grp)
-        all_roots.extend(r)
-    return all_roots
-def flatten_calls(roots: list[ConcurrencyCallNode]) -> list[ConcurrencyCallNode]:
-    """
-    DFS to produce a flat list of all calls (including nested).
-    """
-    all_nodes = []
-    def dfs(n: ConcurrencyCallNode):
-        all_nodes.append(n)
-        for c in n.children:
-            dfs(c)
-    for rt in roots:
-        dfs(rt)
-    return all_nodes
-# --------------------------------------------------------------------------------
-# 2) Global Concurrency Distribution & Segments
-# --------------------------------------------------------------------------------
-def compute_concurrency_distribution(roots: list[ConcurrencyCallNode]) -> dict[int, float]:
-    """
-    Flatten calls, produce (start, +1)/(end, -1), accumulate total time at each concurrency level.
-    """
-    all_nodes = flatten_calls(roots)
-    if not all_nodes:
-        return {}
-    events = []
-    for n in all_nodes:
-        if n.start_time <= n.end_time:
-            events.append((n.start_time, +1))
-            events.append((n.end_time, -1))
-    events.sort(key=lambda x: x[0])
-    dist_map: dict[int, float] = {}
-    curr_conc = 0
-    prev_time = events[0][0]
-    for (time_val, delta) in events:
-        if time_val > prev_time:
-            length = time_val - prev_time
-            dist_map[curr_conc] = dist_map.get(curr_conc, 0.0) + length
-        curr_conc += delta
-        prev_time = time_val
-    return dist_map
-def build_concurrency_segments(roots: list[ConcurrencyCallNode]) -> list[tuple[float, float, int]]:
-    """
-    Return piecewise segments of (start, end, concurrency) across all calls.
-    """
-    all_nodes = flatten_calls(roots)
-    if not all_nodes:
-        return []
-    events = []
-    for n in all_nodes:
-        if n.start_time <= n.end_time:
-            events.append((n.start_time, +1))
-            events.append((n.end_time, -1))
-    events.sort(key=lambda x: x[0])
-    segments: list[tuple[float, float, int]] = []
-    curr_conc = 0
-    prev_time = events[0][0]
-    for (t, delta) in events:
-        if t > prev_time:
-            segments.append((prev_time, t, curr_conc))
-        curr_conc += delta
-        prev_time = t
-    return segments
-def find_percentile_concurrency(dist_map: dict[int, float], percentile: float) -> float:
-    """
-    concurrency => total_time -> find concurrency level at given percentile of total time.
-    """
-    total_time = sum(dist_map.values())
-    if total_time <= 0:
-        return 0.0
-    items = sorted(dist_map.items(), key=lambda x: x[0])  # ascending concurrency
-    threshold = percentile * 0.01 * total_time
-    accum = 0.0
-    last_c = 0
-    for c_val, dur in items:
-        accum += dur
-        if accum >= threshold:
-            return float(c_val)
-        last_c = c_val
-    return float(last_c)
-# --------------------------------------------------------------------------------
-# 3) Spike Detection & Active Calls
-# --------------------------------------------------------------------------------
-def detect_concurrency_spikes(segments: list[tuple[float, float, int]], threshold: int) -> list[ConcurrencySpikeInfo]:
-    """
-    If concurrency >= threshold, label that segment a 'spike'.
-    """
-    spikes = []
-    for (s, e, c_val) in segments:
-        if c_val >= threshold and e > s:
-            sp = ConcurrencySpikeInfo(start_time=s, end_time=e, concurrency=c_val)
-            spikes.append(sp)
-    return spikes
-def find_calls_active_in_interval(roots: list[ConcurrencyCallNode], start_t: float,
-                                  end_t: float) -> list[ConcurrencyCallNode]:
-    """
-    Return all calls overlapping [start_t, end_t).
-    Overlap => not (call.end_time <= start_t or call.start_time >= end_t).
-    """
-    results = []
-    all_nodes = flatten_calls(roots)
-    for n in all_nodes:
-        if not (n.end_time <= start_t or n.start_time >= end_t):
-            results.append(n)
-    return results
-# --------------------------------------------------------------------------------
-# 4) Correlations & Average Latency by Concurrency
-# --------------------------------------------------------------------------------
-def correlate_spike_calls(spikes: list[ConcurrencySpikeInfo], roots: list[ConcurrencyCallNode]) \
-        -> ConcurrencyCorrelationStats:
-    """
-    For each spike, gather calls that overlap, compute average prompt_tokens, total_tokens across them.
-    """
-    p_tokens = []
-    t_tokens = []
-    for sp in spikes:
-        active = find_calls_active_in_interval(roots, sp.start_time, sp.end_time)
-        # record the active call uuids for each spike
-        sp.active_uuids = list({c.uuid for c in active})
-        for c in active:
-            if c.prompt_tokens and c.prompt_tokens > 0:
-                p_tokens.append(c.prompt_tokens)
-            if c.total_tokens and c.total_tokens > 0:
-                t_tokens.append(c.total_tokens)
-    def safe_avg(lst):
-        return float(np.mean(lst)) if lst else 0.0
-    return ConcurrencyCorrelationStats(
-        avg_prompt_tokens=safe_avg(p_tokens),
-        avg_total_tokens=safe_avg(t_tokens),
-    )
-def compute_midpoint_concurrency(n: ConcurrencyCallNode, segments: list[tuple[float, float, int]]) -> float:
-    """
-    Approx concurrency at the midpoint of this call.
-    """
-    if n.start_time >= n.end_time:
-        return 0.0
-    mid = 0.5 * (n.start_time + n.end_time)
-    # binary or linear search
-    left, right = 0, len(segments) - 1
-    while left <= right:
-        mid_idx = (left + right) // 2
-        seg_start, seg_end, seg_conc = segments[mid_idx]
-        if seg_start <= mid < seg_end:
-            return float(seg_conc)
-        if mid < seg_start:
-            right = mid_idx - 1
-        else:
-            left = mid_idx + 1
-    return 0.0
-def average_latency_by_midpoint_concurrency(roots: list[ConcurrencyCallNode]) -> dict[int, float]:
-    """
-    For each call, find concurrency at midpoint, then bucket durations by concurrency, compute avg.
-    """
-    segs = build_concurrency_segments(roots)
-    all_nodes = flatten_calls(roots)
-    # concurrency => list of durations
-    from collections import defaultdict
-    calls_by_conc = defaultdict(list)
-    for c in all_nodes:
-        mc = compute_midpoint_concurrency(c, segs)
-        # round or cast to int
-        c_level = int(mc)
-        calls_by_conc[c_level].append(c.duration)
-    result = {}
-    for c_level, durations in calls_by_conc.items():
-        if durations:
-            result[c_level] = float(np.mean(durations))
-        else:
-            result[c_level] = 0.0
-    return result
-# --------------------------------------------------------------------------------
-# 5) Main Analysis Function
-# --------------------------------------------------------------------------------
-def concurrency_spike_analysis(
-    all_steps: list[list[IntermediateStep]],
-    concurrency_spike_threshold: int | None = None,
-) -> ConcurrencyAnalysisResult:
-    """
-    1) Build per-example call trees (no cross-example nesting).
-    2) Compute concurrency distribution & concurrency segments across *all* calls.
-    3) Derive concurrency percentiles (p50, p90, p95, p99).
-    4) If threshold not provided, pick e.g. ceil of p90 concurrency.
-    5) Detect spikes, gather calls in those intervals => correlation stats.
-    6) Also compute average latency by concurrency and add to report.
-    7) Return a Pydantic object with everything, plus a textual report.
-    """
-    df = create_standardized_dataframe(all_steps)
-    required_cols = {
-        "framework",
-        "llm_name",
-        "llm_text_input",
-        "llm_text_output",
-        "event_timestamp",
-        "event_type",
-        "UUID",
-        "example_number",
-        "prompt_tokens",
-        "completion_tokens",
-        "total_tokens"
-    }
-    missing = required_cols - set(df.columns)
-    if missing:
-        raise ValueError(f"DataFrame missing required columns: {missing}")
-    # Build global forest
-    roots = build_call_tree_per_example(df)
-    all_calls = flatten_calls(roots)
-    num_calls = len(all_calls)
-    # Concurrency distribution
-    dist_map = compute_concurrency_distribution(roots)
-    total_time = sum(dist_map.values())
-    p50_c = find_percentile_concurrency(dist_map, 50)
-    p90_c = find_percentile_concurrency(dist_map, 90)
-    p95_c = find_percentile_concurrency(dist_map, 95)
-    p99_c = find_percentile_concurrency(dist_map, 99)
-    # Threshold
-    if concurrency_spike_threshold is None:
-        concurrency_spike_threshold = max(1, int(np.ceil(p90_c)))
-    # Build concurrency segments, detect spikes
-    segments = build_concurrency_segments(roots)
-    spike_intervals = detect_concurrency_spikes(segments, concurrency_spike_threshold)
-    # Correlate
-    corr_stats = correlate_spike_calls(spike_intervals, roots)
-    # Average latency by concurrency
-    avg_lat_by_conc = average_latency_by_midpoint_concurrency(roots)
-    # Build textual report
-    lines = []
-    lines.append("=== Concurrency Spike Analysis ===")
-    lines.append(f"Total calls in dataset: {num_calls}")
-    lines.append(f"Total time observed: {total_time:.2f} units (sum of concurrency timeline)")
-    lines.append("\n-- Concurrency Distribution --")
-    for c_val in sorted(dist_map.keys()):
-        dur = dist_map[c_val]
-        lines.append(f"  concurrency={c_val}: {dur:.2f} time")
-    lines.append(f"\nPercentiles => p50={p50_c:.1f}, p90={p90_c:.1f}, p95={p95_c:.1f}, p99={p99_c:.1f}")
-    lines.append(f"Spike threshold chosen: {concurrency_spike_threshold}")
-    lines.append("\n-- Detected Spike Intervals --")
-    if not spike_intervals:
-        lines.append("No intervals exceed concurrency spike threshold.")
-    else:
-        for i, sp in enumerate(spike_intervals, start=1):
-            length = sp.end_time - sp.start_time
-            active_count = len(sp.active_uuids)
-            lines.append(f"{i}) {sp.start_time:.2f}-{sp.end_time:.2f}, concurrency={sp.concurrency}, "
-                         f"length={length:.2f}, #active_calls={active_count}")
-    lines.append("\n-- Correlation Stats for Spiked Calls --")
-    lines.append(f"Avg prompt_tokens in spike calls: {corr_stats.avg_prompt_tokens:.1f}")
-    lines.append(f"Avg total_tokens in spike calls : {corr_stats.avg_total_tokens:.1f}")
-    lines.append("\n-- Average Latency by Midpoint Concurrency --")
-    if not avg_lat_by_conc:
-        lines.append("No calls or no concurrency data.")
-    else:
-        for c_level in sorted(avg_lat_by_conc.keys()):
-            lat = avg_lat_by_conc[c_level]
-            lines.append(f"  concurrency={c_level} => avg_latency={lat:.2f}")
-    final_report = "\n".join(lines)
-    # Build result object
-    return ConcurrencyAnalysisResult(concurrency_distribution=dist_map,
-                                     p50_concurrency=p50_c,
-                                     p90_concurrency=p90_c,
-                                     p95_concurrency=p95_c,
-                                     p99_concurrency=p99_c,
-                                     spike_threshold=concurrency_spike_threshold,
-                                     spike_intervals=spike_intervals,
-                                     correlation_stats=corr_stats,
-                                     textual_report=final_report,
-                                     average_latency_by_concurrency=avg_lat_by_conc)

aiqtoolkit 1.1.0a20250515__py3-none-any.whl → 1.1.0a20251020__py3-none-any.whl

Potentially problematic release.

aiqtoolkit 1.1.0a20250515py3-none-any.whl → 1.1.0a20251020py3-none-any.whl