PyPI - opik - Versions diffs - 1.8.39__py3-none-any.whl → 1.9.71__py3-none-any.whl - Mend

opik 1.8.39py3-none-any.whl → 1.9.71py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (592) hide show

opik/__init__.py +19 -3
opik/anonymizer/__init__.py +5 -0
opik/anonymizer/anonymizer.py +12 -0
opik/anonymizer/factory.py +80 -0
opik/anonymizer/recursive_anonymizer.py +64 -0
opik/anonymizer/rules.py +56 -0
opik/anonymizer/rules_anonymizer.py +35 -0
opik/api_objects/attachment/attachment_context.py +36 -0
opik/api_objects/attachment/attachments_extractor.py +153 -0
opik/api_objects/attachment/client.py +1 -0
opik/api_objects/attachment/converters.py +2 -0
opik/api_objects/attachment/decoder.py +18 -0
opik/api_objects/attachment/decoder_base64.py +83 -0
opik/api_objects/attachment/decoder_helpers.py +137 -0
opik/api_objects/data_helpers.py +79 -0
opik/api_objects/dataset/dataset.py +64 -4
opik/api_objects/dataset/rest_operations.py +11 -2
opik/api_objects/experiment/experiment.py +57 -57
opik/api_objects/experiment/experiment_item.py +2 -1
opik/api_objects/experiment/experiments_client.py +64 -0
opik/api_objects/experiment/helpers.py +35 -11
opik/api_objects/experiment/rest_operations.py +65 -5
opik/api_objects/helpers.py +8 -5
opik/api_objects/local_recording.py +81 -0
opik/api_objects/opik_client.py +600 -108
opik/api_objects/opik_query_language.py +39 -5
opik/api_objects/prompt/__init__.py +12 -2
opik/api_objects/prompt/base_prompt.py +69 -0
opik/api_objects/prompt/base_prompt_template.py +29 -0
opik/api_objects/prompt/chat/__init__.py +1 -0
opik/api_objects/prompt/chat/chat_prompt.py +210 -0
opik/api_objects/prompt/chat/chat_prompt_template.py +350 -0
opik/api_objects/prompt/chat/content_renderer_registry.py +203 -0
opik/api_objects/prompt/client.py +189 -47
opik/api_objects/prompt/text/__init__.py +1 -0
opik/api_objects/prompt/text/prompt.py +174 -0
opik/api_objects/prompt/{prompt_template.py → text/prompt_template.py} +10 -6
opik/api_objects/prompt/types.py +23 -0
opik/api_objects/search_helpers.py +89 -0
opik/api_objects/span/span_data.py +35 -25
opik/api_objects/threads/threads_client.py +39 -5
opik/api_objects/trace/trace_client.py +52 -2
opik/api_objects/trace/trace_data.py +15 -24
opik/api_objects/validation_helpers.py +3 -3
opik/cli/__init__.py +5 -0
opik/cli/__main__.py +6 -0
opik/cli/configure.py +66 -0
opik/cli/exports/__init__.py +131 -0
opik/cli/exports/dataset.py +278 -0
opik/cli/exports/experiment.py +784 -0
opik/cli/exports/project.py +685 -0
opik/cli/exports/prompt.py +578 -0
opik/cli/exports/utils.py +406 -0
opik/cli/harbor.py +39 -0
opik/cli/healthcheck.py +21 -0
opik/cli/imports/__init__.py +439 -0
opik/cli/imports/dataset.py +143 -0
opik/cli/imports/experiment.py +1192 -0
opik/cli/imports/project.py +262 -0
opik/cli/imports/prompt.py +177 -0
opik/cli/imports/utils.py +280 -0
opik/cli/main.py +49 -0
opik/cli/proxy.py +93 -0
opik/cli/usage_report/__init__.py +16 -0
opik/cli/usage_report/charts.py +783 -0
opik/cli/usage_report/cli.py +274 -0
opik/cli/usage_report/constants.py +9 -0
opik/cli/usage_report/extraction.py +749 -0
opik/cli/usage_report/pdf.py +244 -0
opik/cli/usage_report/statistics.py +78 -0
opik/cli/usage_report/utils.py +235 -0
opik/config.py +13 -7
opik/configurator/configure.py +17 -0
opik/datetime_helpers.py +12 -0
opik/decorator/arguments_helpers.py +9 -1
opik/decorator/base_track_decorator.py +205 -133
opik/decorator/context_manager/span_context_manager.py +123 -0
opik/decorator/context_manager/trace_context_manager.py +84 -0
opik/decorator/opik_args/__init__.py +13 -0
opik/decorator/opik_args/api_classes.py +71 -0
opik/decorator/opik_args/helpers.py +120 -0
opik/decorator/span_creation_handler.py +25 -6
opik/dict_utils.py +3 -3
opik/evaluation/__init__.py +13 -2
opik/evaluation/engine/engine.py +272 -75
opik/evaluation/engine/evaluation_tasks_executor.py +6 -3
opik/evaluation/engine/helpers.py +31 -6
opik/evaluation/engine/metrics_evaluator.py +237 -0
opik/evaluation/evaluation_result.py +168 -2
opik/evaluation/evaluator.py +533 -62
opik/evaluation/metrics/__init__.py +103 -4
opik/evaluation/metrics/aggregated_metric.py +35 -6
opik/evaluation/metrics/base_metric.py +1 -1
opik/evaluation/metrics/conversation/__init__.py +48 -0
opik/evaluation/metrics/conversation/conversation_thread_metric.py +56 -2
opik/evaluation/metrics/conversation/g_eval_wrappers.py +19 -0
opik/evaluation/metrics/conversation/helpers.py +14 -15
opik/evaluation/metrics/conversation/heuristics/__init__.py +14 -0
opik/evaluation/metrics/conversation/heuristics/degeneration/__init__.py +3 -0
opik/evaluation/metrics/conversation/heuristics/degeneration/metric.py +189 -0
opik/evaluation/metrics/conversation/heuristics/degeneration/phrases.py +12 -0
opik/evaluation/metrics/conversation/heuristics/knowledge_retention/__init__.py +3 -0
opik/evaluation/metrics/conversation/heuristics/knowledge_retention/metric.py +172 -0
opik/evaluation/metrics/conversation/llm_judges/__init__.py +32 -0
opik/evaluation/metrics/conversation/{conversational_coherence → llm_judges/conversational_coherence}/metric.py +22 -17
opik/evaluation/metrics/conversation/{conversational_coherence → llm_judges/conversational_coherence}/templates.py +1 -1
opik/evaluation/metrics/conversation/llm_judges/g_eval_wrappers.py +442 -0
opik/evaluation/metrics/conversation/{session_completeness → llm_judges/session_completeness}/metric.py +13 -7
opik/evaluation/metrics/conversation/{session_completeness → llm_judges/session_completeness}/templates.py +1 -1
opik/evaluation/metrics/conversation/llm_judges/user_frustration/__init__.py +0 -0
opik/evaluation/metrics/conversation/{user_frustration → llm_judges/user_frustration}/metric.py +21 -14
opik/evaluation/metrics/conversation/{user_frustration → llm_judges/user_frustration}/templates.py +1 -1
opik/evaluation/metrics/conversation/types.py +4 -5
opik/evaluation/metrics/conversation_types.py +9 -0
opik/evaluation/metrics/heuristics/bertscore.py +107 -0
opik/evaluation/metrics/heuristics/bleu.py +35 -15
opik/evaluation/metrics/heuristics/chrf.py +127 -0
opik/evaluation/metrics/heuristics/contains.py +47 -11
opik/evaluation/metrics/heuristics/distribution_metrics.py +331 -0
opik/evaluation/metrics/heuristics/gleu.py +113 -0
opik/evaluation/metrics/heuristics/language_adherence.py +123 -0
opik/evaluation/metrics/heuristics/meteor.py +119 -0
opik/evaluation/metrics/heuristics/prompt_injection.py +150 -0
opik/evaluation/metrics/heuristics/readability.py +129 -0
opik/evaluation/metrics/heuristics/rouge.py +26 -9
opik/evaluation/metrics/heuristics/spearman.py +88 -0
opik/evaluation/metrics/heuristics/tone.py +155 -0
opik/evaluation/metrics/heuristics/vader_sentiment.py +77 -0
opik/evaluation/metrics/llm_judges/answer_relevance/metric.py +20 -5
opik/evaluation/metrics/llm_judges/context_precision/metric.py +20 -6
opik/evaluation/metrics/llm_judges/context_recall/metric.py +20 -6
opik/evaluation/metrics/llm_judges/g_eval/__init__.py +5 -0
opik/evaluation/metrics/llm_judges/g_eval/metric.py +219 -68
opik/evaluation/metrics/llm_judges/g_eval/parser.py +102 -52
opik/evaluation/metrics/llm_judges/g_eval/presets.py +209 -0
opik/evaluation/metrics/llm_judges/g_eval_presets/__init__.py +36 -0
opik/evaluation/metrics/llm_judges/g_eval_presets/agent_assessment.py +77 -0
opik/evaluation/metrics/llm_judges/g_eval_presets/bias_classifier.py +181 -0
opik/evaluation/metrics/llm_judges/g_eval_presets/compliance_risk.py +41 -0
opik/evaluation/metrics/llm_judges/g_eval_presets/prompt_uncertainty.py +41 -0
opik/evaluation/metrics/llm_judges/g_eval_presets/qa_suite.py +146 -0
opik/evaluation/metrics/llm_judges/hallucination/metric.py +16 -3
opik/evaluation/metrics/llm_judges/llm_juries/__init__.py +3 -0
opik/evaluation/metrics/llm_judges/llm_juries/metric.py +76 -0
opik/evaluation/metrics/llm_judges/moderation/metric.py +16 -4
opik/evaluation/metrics/llm_judges/structure_output_compliance/__init__.py +0 -0
opik/evaluation/metrics/llm_judges/structure_output_compliance/metric.py +144 -0
opik/evaluation/metrics/llm_judges/structure_output_compliance/parser.py +79 -0
opik/evaluation/metrics/llm_judges/structure_output_compliance/schema.py +15 -0
opik/evaluation/metrics/llm_judges/structure_output_compliance/template.py +50 -0
opik/evaluation/metrics/llm_judges/syc_eval/__init__.py +0 -0
opik/evaluation/metrics/llm_judges/syc_eval/metric.py +252 -0
opik/evaluation/metrics/llm_judges/syc_eval/parser.py +82 -0
opik/evaluation/metrics/llm_judges/syc_eval/template.py +155 -0
opik/evaluation/metrics/llm_judges/trajectory_accuracy/metric.py +20 -5
opik/evaluation/metrics/llm_judges/usefulness/metric.py +16 -4
opik/evaluation/metrics/ragas_metric.py +43 -23
opik/evaluation/models/__init__.py +8 -0
opik/evaluation/models/base_model.py +107 -1
opik/evaluation/models/langchain/langchain_chat_model.py +15 -7
opik/evaluation/models/langchain/message_converters.py +97 -15
opik/evaluation/models/litellm/litellm_chat_model.py +156 -29
opik/evaluation/models/litellm/util.py +125 -0
opik/evaluation/models/litellm/warning_filters.py +16 -4
opik/evaluation/models/model_capabilities.py +187 -0
opik/evaluation/models/models_factory.py +25 -3
opik/evaluation/preprocessing.py +92 -0
opik/evaluation/report.py +70 -12
opik/evaluation/rest_operations.py +49 -45
opik/evaluation/samplers/__init__.py +4 -0
opik/evaluation/samplers/base_dataset_sampler.py +40 -0
opik/evaluation/samplers/random_dataset_sampler.py +48 -0
opik/evaluation/score_statistics.py +66 -0
opik/evaluation/scorers/__init__.py +4 -0
opik/evaluation/scorers/scorer_function.py +55 -0
opik/evaluation/scorers/scorer_wrapper_metric.py +130 -0
opik/evaluation/test_case.py +3 -2
opik/evaluation/test_result.py +1 -0
opik/evaluation/threads/evaluator.py +31 -3
opik/evaluation/threads/helpers.py +3 -2
opik/evaluation/types.py +9 -1
opik/exceptions.py +33 -0
opik/file_upload/file_uploader.py +13 -0
opik/file_upload/upload_options.py +2 -0
opik/hooks/__init__.py +23 -0
opik/hooks/anonymizer_hook.py +36 -0
opik/hooks/httpx_client_hook.py +112 -0
opik/httpx_client.py +12 -9
opik/id_helpers.py +18 -0
opik/integrations/adk/graph/subgraph_edges_builders.py +1 -2
opik/integrations/adk/helpers.py +16 -7
opik/integrations/adk/legacy_opik_tracer.py +7 -4
opik/integrations/adk/opik_tracer.py +14 -1
opik/integrations/adk/patchers/adk_otel_tracer/opik_adk_otel_tracer.py +7 -3
opik/integrations/adk/recursive_callback_injector.py +4 -7
opik/integrations/bedrock/converse/__init__.py +0 -0
opik/integrations/bedrock/converse/chunks_aggregator.py +188 -0
opik/integrations/bedrock/{converse_decorator.py → converse/converse_decorator.py} +4 -3
opik/integrations/bedrock/invoke_agent_decorator.py +5 -4
opik/integrations/bedrock/invoke_model/__init__.py +0 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/__init__.py +78 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/api.py +45 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/base.py +23 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/claude.py +121 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/format_detector.py +107 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/llama.py +108 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/mistral.py +118 -0
opik/integrations/bedrock/invoke_model/chunks_aggregator/nova.py +99 -0
opik/integrations/bedrock/invoke_model/invoke_model_decorator.py +178 -0
opik/integrations/bedrock/invoke_model/response_types.py +34 -0
opik/integrations/bedrock/invoke_model/stream_wrappers.py +122 -0
opik/integrations/bedrock/invoke_model/usage_converters.py +87 -0
opik/integrations/bedrock/invoke_model/usage_extraction.py +108 -0
opik/integrations/bedrock/opik_tracker.py +42 -4
opik/integrations/bedrock/types.py +19 -0
opik/integrations/crewai/crewai_decorator.py +8 -51
opik/integrations/crewai/opik_tracker.py +31 -10
opik/integrations/crewai/patchers/__init__.py +5 -0
opik/integrations/crewai/patchers/flow.py +118 -0
opik/integrations/crewai/patchers/litellm_completion.py +30 -0
opik/integrations/crewai/patchers/llm_client.py +207 -0
opik/integrations/dspy/callback.py +80 -17
opik/integrations/dspy/parsers.py +168 -0
opik/integrations/harbor/__init__.py +17 -0
opik/integrations/harbor/experiment_service.py +269 -0
opik/integrations/harbor/opik_tracker.py +528 -0
opik/integrations/haystack/opik_connector.py +2 -2
opik/integrations/haystack/opik_tracer.py +3 -7
opik/integrations/langchain/__init__.py +3 -1
opik/integrations/langchain/helpers.py +96 -0
opik/integrations/langchain/langgraph_async_context_bridge.py +131 -0
opik/integrations/langchain/langgraph_tracer_injector.py +88 -0
opik/integrations/langchain/opik_encoder_extension.py +1 -1
opik/integrations/langchain/opik_tracer.py +474 -229
opik/integrations/litellm/__init__.py +5 -0
opik/integrations/litellm/completion_chunks_aggregator.py +115 -0
opik/integrations/litellm/litellm_completion_decorator.py +242 -0
opik/integrations/litellm/opik_tracker.py +43 -0
opik/integrations/litellm/stream_patchers.py +151 -0
opik/integrations/llama_index/callback.py +146 -107
opik/integrations/openai/agents/opik_tracing_processor.py +1 -2
opik/integrations/openai/openai_chat_completions_decorator.py +2 -16
opik/integrations/openai/opik_tracker.py +1 -1
opik/integrations/sagemaker/auth.py +5 -1
opik/llm_usage/google_usage.py +3 -1
opik/llm_usage/opik_usage.py +7 -8
opik/llm_usage/opik_usage_factory.py +4 -2
opik/logging_messages.py +6 -0
opik/message_processing/batching/base_batcher.py +14 -21
opik/message_processing/batching/batch_manager.py +22 -10
opik/message_processing/batching/batch_manager_constuctors.py +10 -0
opik/message_processing/batching/batchers.py +59 -27
opik/message_processing/batching/flushing_thread.py +0 -3
opik/message_processing/emulation/__init__.py +0 -0
opik/message_processing/emulation/emulator_message_processor.py +578 -0
opik/message_processing/emulation/local_emulator_message_processor.py +140 -0
opik/message_processing/emulation/models.py +162 -0
opik/message_processing/encoder_helpers.py +79 -0
opik/message_processing/messages.py +56 -1
opik/message_processing/preprocessing/__init__.py +0 -0
opik/message_processing/preprocessing/attachments_preprocessor.py +70 -0
opik/message_processing/preprocessing/batching_preprocessor.py +53 -0
opik/message_processing/preprocessing/constants.py +1 -0
opik/message_processing/preprocessing/file_upload_preprocessor.py +38 -0
opik/message_processing/preprocessing/preprocessor.py +36 -0
opik/message_processing/processors/__init__.py +0 -0
opik/message_processing/processors/attachments_extraction_processor.py +146 -0
opik/message_processing/processors/message_processors.py +92 -0
opik/message_processing/processors/message_processors_chain.py +96 -0
opik/message_processing/{message_processors.py → processors/online_message_processor.py} +85 -29
opik/message_processing/queue_consumer.py +9 -3
opik/message_processing/streamer.py +71 -33
opik/message_processing/streamer_constructors.py +43 -10
opik/opik_context.py +16 -4
opik/plugins/pytest/hooks.py +5 -3
opik/rest_api/__init__.py +346 -15
opik/rest_api/alerts/__init__.py +7 -0
opik/rest_api/alerts/client.py +667 -0
opik/rest_api/alerts/raw_client.py +1015 -0
opik/rest_api/alerts/types/__init__.py +7 -0
opik/rest_api/alerts/types/get_webhook_examples_request_alert_type.py +5 -0
opik/rest_api/annotation_queues/__init__.py +4 -0
opik/rest_api/annotation_queues/client.py +668 -0
opik/rest_api/annotation_queues/raw_client.py +1019 -0
opik/rest_api/automation_rule_evaluators/client.py +34 -2
opik/rest_api/automation_rule_evaluators/raw_client.py +24 -0
opik/rest_api/client.py +15 -0
opik/rest_api/dashboards/__init__.py +4 -0
opik/rest_api/dashboards/client.py +462 -0
opik/rest_api/dashboards/raw_client.py +648 -0
opik/rest_api/datasets/client.py +1310 -44
opik/rest_api/datasets/raw_client.py +2269 -358
opik/rest_api/experiments/__init__.py +2 -2
opik/rest_api/experiments/client.py +191 -5
opik/rest_api/experiments/raw_client.py +301 -7
opik/rest_api/experiments/types/__init__.py +4 -1
opik/rest_api/experiments/types/experiment_update_status.py +5 -0
opik/rest_api/experiments/types/experiment_update_type.py +5 -0
opik/rest_api/experiments/types/experiment_write_status.py +5 -0
opik/rest_api/feedback_definitions/types/find_feedback_definitions_request_type.py +1 -1
opik/rest_api/llm_provider_key/client.py +20 -0
opik/rest_api/llm_provider_key/raw_client.py +20 -0
opik/rest_api/llm_provider_key/types/provider_api_key_write_provider.py +1 -1
opik/rest_api/manual_evaluation/__init__.py +4 -0
opik/rest_api/manual_evaluation/client.py +347 -0
opik/rest_api/manual_evaluation/raw_client.py +543 -0
opik/rest_api/optimizations/client.py +145 -9
opik/rest_api/optimizations/raw_client.py +237 -13
opik/rest_api/optimizations/types/optimization_update_status.py +3 -1
opik/rest_api/prompts/__init__.py +2 -2
opik/rest_api/prompts/client.py +227 -6
opik/rest_api/prompts/raw_client.py +331 -2
opik/rest_api/prompts/types/__init__.py +3 -1
opik/rest_api/prompts/types/create_prompt_version_detail_template_structure.py +5 -0
opik/rest_api/prompts/types/prompt_write_template_structure.py +5 -0
opik/rest_api/spans/__init__.py +0 -2
opik/rest_api/spans/client.py +238 -76
opik/rest_api/spans/raw_client.py +307 -95
opik/rest_api/spans/types/__init__.py +0 -2
opik/rest_api/traces/client.py +572 -161
opik/rest_api/traces/raw_client.py +736 -229
opik/rest_api/types/__init__.py +352 -17
opik/rest_api/types/aggregation_data.py +1 -0
opik/rest_api/types/alert.py +33 -0
opik/rest_api/types/alert_alert_type.py +5 -0
opik/rest_api/types/alert_page_public.py +24 -0
opik/rest_api/types/alert_public.py +33 -0
opik/rest_api/types/alert_public_alert_type.py +5 -0
opik/rest_api/types/alert_trigger.py +27 -0
opik/rest_api/types/alert_trigger_config.py +28 -0
opik/rest_api/types/alert_trigger_config_public.py +28 -0
opik/rest_api/types/alert_trigger_config_public_type.py +10 -0
opik/rest_api/types/alert_trigger_config_type.py +10 -0
opik/rest_api/types/alert_trigger_config_write.py +22 -0
opik/rest_api/types/alert_trigger_config_write_type.py +10 -0
opik/rest_api/types/alert_trigger_event_type.py +19 -0
opik/rest_api/types/alert_trigger_public.py +27 -0
opik/rest_api/types/alert_trigger_public_event_type.py +19 -0
opik/rest_api/types/alert_trigger_write.py +23 -0
opik/rest_api/types/alert_trigger_write_event_type.py +19 -0
opik/rest_api/types/alert_write.py +28 -0
opik/rest_api/types/alert_write_alert_type.py +5 -0
opik/rest_api/types/annotation_queue.py +42 -0
opik/rest_api/types/annotation_queue_batch.py +27 -0
opik/rest_api/types/annotation_queue_item_ids.py +19 -0
opik/rest_api/types/annotation_queue_page_public.py +28 -0
opik/rest_api/types/annotation_queue_public.py +38 -0
opik/rest_api/types/annotation_queue_public_scope.py +5 -0
opik/rest_api/types/annotation_queue_reviewer.py +20 -0
opik/rest_api/types/annotation_queue_reviewer_public.py +20 -0
opik/rest_api/types/annotation_queue_scope.py +5 -0
opik/rest_api/types/annotation_queue_write.py +31 -0
opik/rest_api/types/annotation_queue_write_scope.py +5 -0
opik/rest_api/types/audio_url.py +19 -0
opik/rest_api/types/audio_url_public.py +19 -0
opik/rest_api/types/audio_url_write.py +19 -0
opik/rest_api/types/automation_rule_evaluator.py +62 -2
opik/rest_api/types/automation_rule_evaluator_llm_as_judge.py +2 -0
opik/rest_api/types/automation_rule_evaluator_llm_as_judge_public.py +2 -0
opik/rest_api/types/automation_rule_evaluator_llm_as_judge_write.py +2 -0
opik/rest_api/types/automation_rule_evaluator_object_object_public.py +155 -0
opik/rest_api/types/automation_rule_evaluator_page_public.py +3 -2
opik/rest_api/types/automation_rule_evaluator_public.py +57 -2
opik/rest_api/types/automation_rule_evaluator_span_llm_as_judge.py +22 -0
opik/rest_api/types/automation_rule_evaluator_span_llm_as_judge_public.py +22 -0
opik/rest_api/types/automation_rule_evaluator_span_llm_as_judge_write.py +22 -0
opik/rest_api/types/automation_rule_evaluator_span_user_defined_metric_python.py +22 -0
opik/rest_api/types/automation_rule_evaluator_span_user_defined_metric_python_public.py +22 -0
opik/rest_api/types/automation_rule_evaluator_span_user_defined_metric_python_write.py +22 -0
opik/rest_api/types/automation_rule_evaluator_trace_thread_llm_as_judge.py +2 -0
opik/rest_api/types/automation_rule_evaluator_trace_thread_llm_as_judge_public.py +2 -0
opik/rest_api/types/automation_rule_evaluator_trace_thread_llm_as_judge_write.py +2 -0
opik/rest_api/types/automation_rule_evaluator_trace_thread_user_defined_metric_python.py +2 -0
opik/rest_api/types/automation_rule_evaluator_trace_thread_user_defined_metric_python_public.py +2 -0
opik/rest_api/types/automation_rule_evaluator_trace_thread_user_defined_metric_python_write.py +2 -0
opik/rest_api/types/automation_rule_evaluator_update.py +51 -1
opik/rest_api/types/automation_rule_evaluator_update_llm_as_judge.py +2 -0
opik/rest_api/types/automation_rule_evaluator_update_span_llm_as_judge.py +22 -0
opik/rest_api/types/automation_rule_evaluator_update_span_user_defined_metric_python.py +22 -0
opik/rest_api/types/automation_rule_evaluator_update_trace_thread_llm_as_judge.py +2 -0
opik/rest_api/types/automation_rule_evaluator_update_trace_thread_user_defined_metric_python.py +2 -0
opik/rest_api/types/automation_rule_evaluator_update_user_defined_metric_python.py +2 -0
opik/rest_api/types/automation_rule_evaluator_user_defined_metric_python.py +2 -0
opik/rest_api/types/automation_rule_evaluator_user_defined_metric_python_public.py +2 -0
opik/rest_api/types/automation_rule_evaluator_user_defined_metric_python_write.py +2 -0
opik/rest_api/types/automation_rule_evaluator_write.py +51 -1
opik/rest_api/types/boolean_feedback_definition.py +25 -0
opik/rest_api/types/boolean_feedback_definition_create.py +20 -0
opik/rest_api/types/boolean_feedback_definition_public.py +25 -0
opik/rest_api/types/boolean_feedback_definition_update.py +20 -0
opik/rest_api/types/boolean_feedback_detail.py +29 -0
opik/rest_api/types/boolean_feedback_detail_create.py +29 -0
opik/rest_api/types/boolean_feedback_detail_public.py +29 -0
opik/rest_api/types/boolean_feedback_detail_update.py +29 -0
opik/rest_api/types/dashboard_page_public.py +24 -0
opik/rest_api/types/dashboard_public.py +30 -0
opik/rest_api/types/dataset.py +4 -0
opik/rest_api/types/dataset_expansion.py +42 -0
opik/rest_api/types/dataset_expansion_response.py +39 -0
opik/rest_api/types/dataset_item.py +2 -0
opik/rest_api/types/dataset_item_changes_public.py +5 -0
opik/rest_api/types/dataset_item_compare.py +2 -0
opik/rest_api/types/dataset_item_filter.py +27 -0
opik/rest_api/types/dataset_item_filter_operator.py +21 -0
opik/rest_api/types/dataset_item_page_compare.py +5 -0
opik/rest_api/types/dataset_item_page_public.py +5 -0
opik/rest_api/types/dataset_item_public.py +2 -0
opik/rest_api/types/dataset_item_update.py +39 -0
opik/rest_api/types/dataset_item_write.py +1 -0
opik/rest_api/types/dataset_public.py +4 -0
opik/rest_api/types/dataset_public_status.py +5 -0
opik/rest_api/types/dataset_status.py +5 -0
opik/rest_api/types/dataset_version_diff.py +22 -0
opik/rest_api/types/dataset_version_diff_stats.py +24 -0
opik/rest_api/types/dataset_version_page_public.py +23 -0
opik/rest_api/types/dataset_version_public.py +59 -0
opik/rest_api/types/dataset_version_summary.py +46 -0
opik/rest_api/types/dataset_version_summary_public.py +46 -0
opik/rest_api/types/experiment.py +7 -2
opik/rest_api/types/experiment_group_response.py +2 -0
opik/rest_api/types/experiment_public.py +7 -2
opik/rest_api/types/experiment_public_status.py +5 -0
opik/rest_api/types/experiment_score.py +20 -0
opik/rest_api/types/experiment_score_public.py +20 -0
opik/rest_api/types/experiment_score_write.py +20 -0
opik/rest_api/types/experiment_status.py +5 -0
opik/rest_api/types/feedback.py +25 -1
opik/rest_api/types/feedback_create.py +20 -1
opik/rest_api/types/feedback_object_public.py +27 -1
opik/rest_api/types/feedback_public.py +25 -1
opik/rest_api/types/feedback_score_batch_item.py +2 -1
opik/rest_api/types/feedback_score_batch_item_thread.py +2 -1
opik/rest_api/types/feedback_score_public.py +4 -0
opik/rest_api/types/feedback_update.py +20 -1
opik/rest_api/types/group_content_with_aggregations.py +1 -0
opik/rest_api/types/group_detail.py +19 -0
opik/rest_api/types/group_details.py +20 -0
opik/rest_api/types/guardrail.py +1 -0
opik/rest_api/types/guardrail_write.py +1 -0
opik/rest_api/types/ids_holder.py +19 -0
opik/rest_api/types/image_url.py +20 -0
opik/rest_api/types/image_url_public.py +20 -0
opik/rest_api/types/image_url_write.py +20 -0
opik/rest_api/types/llm_as_judge_message.py +5 -1
opik/rest_api/types/llm_as_judge_message_content.py +26 -0
opik/rest_api/types/llm_as_judge_message_content_public.py +26 -0
opik/rest_api/types/llm_as_judge_message_content_write.py +26 -0
opik/rest_api/types/llm_as_judge_message_public.py +5 -1
opik/rest_api/types/llm_as_judge_message_write.py +5 -1
opik/rest_api/types/llm_as_judge_model_parameters.py +3 -0
opik/rest_api/types/llm_as_judge_model_parameters_public.py +3 -0
opik/rest_api/types/llm_as_judge_model_parameters_write.py +3 -0
opik/rest_api/types/manual_evaluation_request.py +38 -0
opik/rest_api/types/manual_evaluation_request_entity_type.py +5 -0
opik/rest_api/types/manual_evaluation_response.py +27 -0
opik/rest_api/types/optimization.py +4 -2
opik/rest_api/types/optimization_public.py +4 -2
opik/rest_api/types/optimization_public_status.py +3 -1
opik/rest_api/types/optimization_status.py +3 -1
opik/rest_api/types/optimization_studio_config.py +27 -0
opik/rest_api/types/optimization_studio_config_public.py +27 -0
opik/rest_api/types/optimization_studio_config_write.py +27 -0
opik/rest_api/types/optimization_studio_log.py +22 -0
opik/rest_api/types/optimization_write.py +4 -2
opik/rest_api/types/optimization_write_status.py +3 -1
opik/rest_api/types/project.py +1 -0
opik/rest_api/types/project_detailed.py +1 -0
opik/rest_api/types/project_reference.py +31 -0
opik/rest_api/types/project_reference_public.py +31 -0
opik/rest_api/types/project_stats_summary_item.py +1 -0
opik/rest_api/types/prompt.py +6 -0
opik/rest_api/types/prompt_detail.py +6 -0
opik/rest_api/types/prompt_detail_template_structure.py +5 -0
opik/rest_api/types/prompt_public.py +6 -0
opik/rest_api/types/prompt_public_template_structure.py +5 -0
opik/rest_api/types/prompt_template_structure.py +5 -0
opik/rest_api/types/prompt_version.py +3 -0
opik/rest_api/types/prompt_version_detail.py +3 -0
opik/rest_api/types/prompt_version_detail_template_structure.py +5 -0
opik/rest_api/types/prompt_version_link.py +1 -0
opik/rest_api/types/prompt_version_link_public.py +1 -0
opik/rest_api/types/prompt_version_page_public.py +5 -0
opik/rest_api/types/prompt_version_public.py +3 -0
opik/rest_api/types/prompt_version_public_template_structure.py +5 -0
opik/rest_api/types/prompt_version_template_structure.py +5 -0
opik/rest_api/types/prompt_version_update.py +33 -0
opik/rest_api/types/provider_api_key.py +9 -0
opik/rest_api/types/provider_api_key_provider.py +1 -1
opik/rest_api/types/provider_api_key_public.py +9 -0
opik/rest_api/types/provider_api_key_public_provider.py +1 -1
opik/rest_api/types/score_name.py +1 -0
opik/rest_api/types/service_toggles_config.py +18 -0
opik/rest_api/types/span.py +1 -2
opik/rest_api/types/span_enrichment_options.py +31 -0
opik/rest_api/types/span_experiment_item_bulk_write_view.py +1 -2
opik/rest_api/types/span_filter.py +23 -0
opik/rest_api/types/span_filter_operator.py +21 -0
opik/rest_api/types/span_filter_write.py +23 -0
opik/rest_api/types/span_filter_write_operator.py +21 -0
opik/rest_api/types/span_llm_as_judge_code.py +27 -0
opik/rest_api/types/span_llm_as_judge_code_public.py +27 -0
opik/rest_api/types/span_llm_as_judge_code_write.py +27 -0
opik/rest_api/types/span_public.py +1 -2
opik/rest_api/types/span_update.py +46 -0
opik/rest_api/types/span_user_defined_metric_python_code.py +20 -0
opik/rest_api/types/span_user_defined_metric_python_code_public.py +20 -0
opik/rest_api/types/span_user_defined_metric_python_code_write.py +20 -0
opik/rest_api/types/span_write.py +1 -2
opik/rest_api/types/studio_evaluation.py +20 -0
opik/rest_api/types/studio_evaluation_public.py +20 -0
opik/rest_api/types/studio_evaluation_write.py +20 -0
opik/rest_api/types/studio_llm_model.py +21 -0
opik/rest_api/types/studio_llm_model_public.py +21 -0
opik/rest_api/types/studio_llm_model_write.py +21 -0
opik/rest_api/types/studio_message.py +20 -0
opik/rest_api/types/studio_message_public.py +20 -0
opik/rest_api/types/studio_message_write.py +20 -0
opik/rest_api/types/studio_metric.py +21 -0
opik/rest_api/types/studio_metric_public.py +21 -0
opik/rest_api/types/studio_metric_write.py +21 -0
opik/rest_api/types/studio_optimizer.py +21 -0
opik/rest_api/types/studio_optimizer_public.py +21 -0
opik/rest_api/types/studio_optimizer_write.py +21 -0
opik/rest_api/types/studio_prompt.py +20 -0
opik/rest_api/types/studio_prompt_public.py +20 -0
opik/rest_api/types/studio_prompt_write.py +20 -0
opik/rest_api/types/trace.py +11 -2
opik/rest_api/types/trace_enrichment_options.py +32 -0
opik/rest_api/types/trace_experiment_item_bulk_write_view.py +1 -2
opik/rest_api/types/trace_filter.py +23 -0
opik/rest_api/types/trace_filter_operator.py +21 -0
opik/rest_api/types/trace_filter_write.py +23 -0
opik/rest_api/types/trace_filter_write_operator.py +21 -0
opik/rest_api/types/trace_public.py +11 -2
opik/rest_api/types/trace_thread_filter_write.py +23 -0
opik/rest_api/types/trace_thread_filter_write_operator.py +21 -0
opik/rest_api/types/trace_thread_identifier.py +1 -0
opik/rest_api/types/trace_update.py +39 -0
opik/rest_api/types/trace_write.py +1 -2
opik/rest_api/types/value_entry.py +2 -0
opik/rest_api/types/value_entry_compare.py +2 -0
opik/rest_api/types/value_entry_experiment_item_bulk_write_view.py +2 -0
opik/rest_api/types/value_entry_public.py +2 -0
opik/rest_api/types/video_url.py +19 -0
opik/rest_api/types/video_url_public.py +19 -0
opik/rest_api/types/video_url_write.py +19 -0
opik/rest_api/types/webhook.py +28 -0
opik/rest_api/types/webhook_examples.py +19 -0
opik/rest_api/types/webhook_public.py +28 -0
opik/rest_api/types/webhook_test_result.py +23 -0
opik/rest_api/types/webhook_test_result_status.py +5 -0
opik/rest_api/types/webhook_write.py +23 -0
opik/rest_api/types/welcome_wizard_tracking.py +22 -0
opik/rest_api/types/workspace_configuration.py +5 -0
opik/rest_api/welcome_wizard/__init__.py +4 -0
opik/rest_api/welcome_wizard/client.py +195 -0
opik/rest_api/welcome_wizard/raw_client.py +208 -0
opik/rest_api/workspaces/client.py +14 -2
opik/rest_api/workspaces/raw_client.py +10 -0
opik/s3_httpx_client.py +14 -1
opik/simulation/__init__.py +6 -0
opik/simulation/simulated_user.py +99 -0
opik/simulation/simulator.py +108 -0
opik/synchronization.py +5 -6
opik/{decorator/tracing_runtime_config.py → tracing_runtime_config.py} +6 -7
opik/types.py +36 -0
opik/validation/chat_prompt_messages.py +241 -0
opik/validation/feedback_score.py +3 -3
opik/validation/validator.py +28 -0
opik-1.9.71.dist-info/METADATA +370 -0
opik-1.9.71.dist-info/RECORD +1110 -0
opik/api_objects/prompt/prompt.py +0 -112
opik/cli.py +0 -193
opik/hooks.py +0 -13
opik/integrations/bedrock/chunks_aggregator.py +0 -55
opik/integrations/bedrock/helpers.py +0 -8
opik/rest_api/types/automation_rule_evaluator_object_public.py +0 -100
opik/rest_api/types/json_node_experiment_item_bulk_write_view.py +0 -5
opik-1.8.39.dist-info/METADATA +0 -339
opik-1.8.39.dist-info/RECORD +0 -790
/opik/{evaluation/metrics/conversation/conversational_coherence → decorator/context_manager}/__init__.py +0 -0
/opik/evaluation/metrics/conversation/{session_completeness → llm_judges/conversational_coherence}/__init__.py +0 -0
/opik/evaluation/metrics/conversation/{conversational_coherence → llm_judges/conversational_coherence}/schema.py +0 -0
/opik/evaluation/metrics/conversation/{user_frustration → llm_judges/session_completeness}/__init__.py +0 -0
/opik/evaluation/metrics/conversation/{session_completeness → llm_judges/session_completeness}/schema.py +0 -0
/opik/evaluation/metrics/conversation/{user_frustration → llm_judges/user_frustration}/schema.py +0 -0
/opik/integrations/bedrock/{stream_wrappers.py → converse/stream_wrappers.py} +0 -0
/opik/rest_api/{spans/types → types}/span_update_type.py +0 -0
{opik-1.8.39.dist-info → opik-1.9.71.dist-info}/WHEEL +0 -0
{opik-1.8.39.dist-info → opik-1.9.71.dist-info}/entry_points.txt +0 -0
{opik-1.8.39.dist-info → opik-1.9.71.dist-info}/licenses/LICENSE +0 -0
{opik-1.8.39.dist-info → opik-1.9.71.dist-info}/top_level.txt +0 -0

opik/cli/usage_report/extraction.py ADDED Viewed

@@ -0,0 +1,749 @@
+"""Data extraction functions for usage report module."""
+import datetime
+import json
+import os
+import traceback
+from collections import defaultdict
+from datetime import timezone
+from typing import Any, Dict, List, Optional
+import opik
+from rich.console import Console
+from tqdm import tqdm
+from .constants import MAX_PAGINATION_PAGES, MAX_TRACE_RESULTS
+from .utils import (
+    aggregate_by_unit,
+    format_datetime_key,
+    normalize_timezone_for_comparison,
+    process_experiment_for_stats,
+)
+console = Console()
+def extract_project_data(
+    workspace: str,
+    api_key: Optional[str] = None,
+    start_date: Optional[datetime.datetime] = None,
+    end_date: Optional[datetime.datetime] = None,
+    unit: str = "month",
+) -> Dict[str, Any]:
+    """
+    Extract project data from Opik for a specific workspace.
+    Args:
+        workspace: Workspace name
+        api_key: Opik API key (optional, will use environment/config if not provided)
+        start_date: Start date for data extraction (None to auto-detect from data)
+        end_date: End date for data extraction (None to auto-detect from data)
+        unit: Time unit for aggregation - "month", "week", "day", or "hour". Defaults to "month".
+    Returns:
+        Dictionary containing all extracted data
+    """
+    # If dates are None, we'll collect all data and determine the range afterwards
+    auto_detect_start = start_date is None
+    auto_detect_end = end_date is None
+    # Use wide date ranges to capture all data when auto-detecting
+    query_start_date = start_date
+    if query_start_date is None:
+        # Use environment variable OPIK_DEFAULT_START_DATE if set, else use start of current year
+        env_start_date = os.environ.get("OPIK_DEFAULT_START_DATE")
+        if env_start_date:
+            try:
+                query_start_date = datetime.datetime.strptime(
+                    env_start_date, "%Y-%m-%d"
+                )
+            except ValueError:
+                console.print(
+                    "[yellow]Warning: Invalid OPIK_DEFAULT_START_DATE format. Using start of current year.[/yellow]"
+                )
+                query_start_date = datetime.datetime(datetime.datetime.now().year, 1, 1)
+        else:
+            query_start_date = datetime.datetime(datetime.datetime.now().year, 1, 1)
+    query_end_date = end_date
+    if query_end_date is None:
+        # Use a future date to ensure we get all data
+        query_end_date = datetime.datetime.now() + datetime.timedelta(days=1)
+    console.print(f"[blue]Workspace: {workspace}[/blue]")
+    if auto_detect_start or auto_detect_end:
+        date_msg = "Date range will be auto-detected from collected data"
+        if auto_detect_start and not auto_detect_end and end_date:
+            date_msg += f" (end date: {end_date.strftime('%Y-%m-%d')})"
+        elif not auto_detect_start and auto_detect_end and start_date:
+            date_msg += f" (start date: {start_date.strftime('%Y-%m-%d')})"
+        console.print(f"[blue]{date_msg}[/blue]")
+    else:
+        if start_date and end_date:
+            console.print(
+                f"[blue]Extracting data from {start_date.strftime('%Y-%m-%d')} to {end_date.strftime('%Y-%m-%d')}[/blue]"
+            )
+    console.print(f"[blue]Aggregating by: {unit}[/blue]\n")
+    # Initialize client for the workspace
+    if api_key:
+        client = opik.Opik(api_key=api_key, workspace=workspace)
+    else:
+        client = opik.Opik(workspace=workspace)
+    # Get projects for this workspace
+    console.print("[blue]Getting projects...[/blue]")
+    with tqdm(total=1, desc="Fetching projects", unit="page", leave=False) as pbar:
+        projects_page = client.rest_client.projects.find_projects(size=1000)
+        projects = projects_page.content or []
+        pbar.update(1)
+    console.print(f"[blue]Found {len(projects)} project(s)[/blue]\n")
+    # Track all dates collected for auto-detection
+    all_dates: List[datetime.datetime] = []
+    all_data: Dict[str, Any] = {
+        "workspace": workspace,
+        "extraction_date": datetime.datetime.now().isoformat(),
+        "date_range": {"start": None, "end": None},
+        "unit": unit,
+        "experiments_by_unit": {},
+        "datasets_by_unit": {},
+        "total_datasets": 0,
+        "projects": [],
+    }
+    # Get experiment counts by unit (workspace-level)
+    experiment_by_unit: Dict[str, int] = defaultdict(int)
+    total_experiments_processed = 0
+    total_experiments_in_range = 0
+    experiments_without_date = 0
+    experiments_outside_range = 0
+    # Get dataset counts (workspace-level)
+    dataset_by_unit: Dict[str, int] = defaultdict(int)
+    total_datasets_processed = 0
+    total_datasets_in_range = 0
+    datasets_without_date = 0
+    datasets_outside_range = 0
+    try:
+        page = 1  # API uses 1-indexed pagination
+        total_datasets = None
+        # First, get total count to set up progress bar
+        datasets_page = client.rest_client.datasets.find_datasets(page=1, size=1000)
+        total_datasets = datasets_page.total or 0
+        # Reset page to 1 for the main loop
+        page = 1
+        with tqdm(
+            total=total_datasets,
+            desc="Processing datasets",
+            unit="dataset",
+            leave=False,
+        ) as pbar:
+            while True:
+                datasets_page = client.rest_client.datasets.find_datasets(
+                    page=page, size=1000
+                )
+                datasets_list = datasets_page.content or []
+                if not datasets_list or len(datasets_list) == 0:
+                    break
+                # Count datasets by month based on created_at
+                for dataset in datasets_list:
+                    total_datasets_processed += 1
+                    if dataset.created_at:
+                        dataset_date = dataset.created_at
+                        # Normalize timezones for comparison
+                        dataset_date, start_date_aware, end_date_aware = (
+                            normalize_timezone_for_comparison(
+                                dataset_date, query_start_date, query_end_date
+                            )
+                        )
+                        # Check if within date range
+                        if dataset_date.tzinfo is not None:
+                            date_check = (
+                                start_date_aware <= dataset_date <= end_date_aware
+                            )
+                        else:
+                            date_check = (
+                                query_start_date <= dataset_date <= query_end_date
+                            )
+                        if date_check:
+                            total_datasets_in_range += 1
+                            all_dates.append(dataset_date)
+                            unit_key = format_datetime_key(dataset_date, unit)
+                            dataset_by_unit[unit_key] += 1
+                        else:
+                            datasets_outside_range += 1
+                    else:
+                        datasets_without_date += 1
+                    # Update progress bar
+                    pbar.update(1)
+                # Check if there are more pages
+                if total_datasets and page * 1000 >= total_datasets:
+                    break
+                if len(datasets_list) == 0:
+                    break
+                page += 1
+                # Safety check to avoid infinite loops
+                if page > MAX_PAGINATION_PAGES:
+                    console.print(
+                        f"[yellow]    Warning: Stopped pagination after {MAX_PAGINATION_PAGES} pages to avoid infinite loop[/yellow]"
+                    )
+                    break
+    except Exception as e:
+        console.print(f"[yellow]Warning: Could not get dataset counts: {e}[/yellow]")
+        traceback.print_exc()
+    all_data["datasets_by_unit"] = dict(dataset_by_unit)
+    all_data["total_datasets"] = total_datasets_processed
+    # Get all existing (non-deleted) dataset names for filtering experiments
+    # The UI only shows experiments whose datasets still exist
+    console.print("[blue]Getting existing datasets for filtering...[/blue]")
+    existing_dataset_names = set()
+    try:
+        datasets_page = client.rest_client.datasets.find_datasets(page=1, size=1000)
+        existing_dataset_names = {ds.name for ds in (datasets_page.content or [])}
+        page = 2
+        while datasets_page.content and len(datasets_page.content) > 0:
+            datasets_page = client.rest_client.datasets.find_datasets(
+                page=page, size=1000
+            )
+            if datasets_page.content:
+                existing_dataset_names.update({ds.name for ds in datasets_page.content})
+            if not datasets_page.content or len(datasets_page.content) < 1000:
+                break
+            page += 1
+        console.print(
+            f"[blue]Found {len(existing_dataset_names)} existing dataset(s)[/blue]\n"
+        )
+    except Exception as e:
+        console.print(
+            f"[yellow]Warning: Could not get datasets for filtering: {e}[/yellow]"
+        )
+        console.print(
+            "[yellow]Will count all experiments (may include those with deleted datasets)[/yellow]\n"
+        )
+    # Get experiment counts by unit (workspace-level)
+    try:
+        # Use REST client method (handles parameters correctly)
+        # Filter by type="regular" to match UI behavior (UI only shows regular experiments)
+        # Note: types parameter needs to be JSON-encoded array string
+        try:
+            test_page = client.rest_client.experiments.find_experiments(
+                page=1,
+                size=1000,
+                types=json.dumps(
+                    ["regular"]
+                ),  # Filter to only regular experiments (matches UI)
+                dataset_deleted=False,  # Filter out experiments with deleted datasets
+            )
+            total_experiments = test_page.total or 0
+        except Exception as api_error:
+            # Handle Pydantic validation errors from malformed API responses
+            error_str = str(api_error)
+            if "dataset_name" in error_str and (
+                "Field required" in error_str or "missing" in error_str.lower()
+            ):
+                # Try to get raw response to get total count
+                try:
+                    httpx_client = client.rest_client._client_wrapper.httpx_client
+                    response = httpx_client.request(
+                        "v1/private/experiments",
+                        method="GET",
+                        params={
+                            "page": 1,
+                            "size": 1000,
+                            "types": json.dumps(["regular"]),
+                            "dataset_deleted": False,
+                        },
+                    )
+                    if response.status_code >= 200 and response.status_code < 300:
+                        response_data = response.json()
+                        total_experiments = response_data.get("total", 0)
+                    else:
+                        total_experiments = 0
+                except Exception:
+                    total_experiments = 0
+            else:
+                # Re-raise other errors
+                raise api_error
+        page = 1  # API uses 1-indexed pagination
+        # Note: total_experiments should now match UI count since we filter by type="regular"
+        # We also filter client-side for deleted datasets as a safety measure
+        with tqdm(
+            total=total_experiments,
+            desc="Processing experiments (regular type, filtering deleted datasets)",
+            unit="experiment",
+            leave=False,
+        ) as pbar:
+            while True:
+                # Use REST client method (handles parameters correctly)
+                try:
+                    experiments_page = client.rest_client.experiments.find_experiments(
+                        page=page,
+                        size=1000,
+                        types=json.dumps(
+                            ["regular"]
+                        ),  # Filter to only regular experiments (matches UI)
+                        dataset_deleted=False,  # Filter out experiments with deleted datasets
+                    )
+                    experiments_list = experiments_page.content or []
+                except Exception as api_error:
+                    # Handle Pydantic validation errors from malformed API responses
+                    # Some experiments may be missing required fields like dataset_name
+                    error_str = str(api_error)
+                    if "dataset_name" in error_str and (
+                        "Field required" in error_str or "missing" in error_str.lower()
+                    ):
+                        # Try to get raw response and manually filter out invalid experiments
+                        try:
+                            httpx_client = (
+                                client.rest_client._client_wrapper.httpx_client
+                            )
+                            response = httpx_client.request(
+                                "v1/private/experiments",
+                                method="GET",
+                                params={
+                                    "page": page,
+                                    "size": 1000,
+                                    "types": json.dumps(["regular"]),
+                                    "dataset_deleted": False,
+                                },
+                            )
+                            if (
+                                response.status_code >= 200
+                                and response.status_code < 300
+                            ):
+                                response_data = response.json()
+                                experiments_list = response_data.get("content", [])
+                                # Note: We process experiments even if they're missing dataset_name
+                                # since process_experiment_for_stats only needs created_at
+                            else:
+                                # If raw request also fails, try with smaller page size as fallback
+                                console.print(
+                                    f"[yellow]    Warning: Could not fetch page {page} (HTTP {response.status_code}). Trying smaller page size...[/yellow]"
+                                )
+                                try:
+                                    # Try with smaller page size to potentially avoid the problematic experiment
+                                    small_response = httpx_client.request(
+                                        "v1/private/experiments",
+                                        method="GET",
+                                        params={
+                                            "page": page,
+                                            "size": 100,  # Smaller page size
+                                            "types": json.dumps(["regular"]),
+                                            "dataset_deleted": False,
+                                        },
+                                    )
+                                    if (
+                                        small_response.status_code >= 200
+                                        and small_response.status_code < 300
+                                    ):
+                                        small_response_data = small_response.json()
+                                        experiments_list = small_response_data.get(
+                                            "content", []
+                                        )
+                                        console.print(
+                                            f"[yellow]    Successfully fetched page {page} with smaller page size. Got {len(experiments_list)} experiment(s).[/yellow]"
+                                        )
+                                    else:
+                                        # If smaller page size also fails, skip this page
+                                        console.print(
+                                            f"[yellow]    Warning: Could not fetch page {page} even with smaller page size. Skipping page (may lose some experiments).[/yellow]"
+                                        )
+                                        experiments_list = []
+                                        page += 1
+                                        continue
+                                except Exception:
+                                    # If smaller page size request fails, skip this page
+                                    console.print(
+                                        f"[yellow]    Warning: Could not fetch page {page} even with smaller page size. Skipping page (may lose some experiments).[/yellow]"
+                                    )
+                                    experiments_list = []
+                                    page += 1
+                                    continue
+                        except Exception as raw_error:
+                            # If raw request fails, try smaller page size as last resort
+                            console.print(
+                                f"[yellow]    Warning: Could not fetch page {page} due to error: {raw_error}. Trying smaller page size...[/yellow]"
+                            )
+                            try:
+                                httpx_client = (
+                                    client.rest_client._client_wrapper.httpx_client
+                                )
+                                small_response = httpx_client.request(
+                                    "v1/private/experiments",
+                                    method="GET",
+                                    params={
+                                        "page": page,
+                                        "size": 100,  # Smaller page size
+                                        "types": json.dumps(["regular"]),
+                                        "dataset_deleted": False,
+                                    },
+                                )
+                                if (
+                                    small_response.status_code >= 200
+                                    and small_response.status_code < 300
+                                ):
+                                    small_response_data = small_response.json()
+                                    experiments_list = small_response_data.get(
+                                        "content", []
+                                    )
+                                    console.print(
+                                        f"[yellow]    Successfully fetched page {page} with smaller page size. Got {len(experiments_list)} experiment(s).[/yellow]"
+                                    )
+                                else:
+                                    # If smaller page size also fails, skip this page
+                                    console.print(
+                                        f"[yellow]    Warning: Could not fetch page {page} even with smaller page size. Skipping page (may lose some experiments).[/yellow]"
+                                    )
+                                    experiments_list = []
+                                    page += 1
+                                    continue
+                            except Exception:
+                                # If smaller page size request also fails, skip this page
+                                console.print(
+                                    f"[yellow]    Warning: Could not fetch page {page} even with smaller page size. Skipping page (may lose some experiments).[/yellow]"
+                                )
+                                experiments_list = []
+                                page += 1
+                                continue
+                    else:
+                        # Re-raise other errors
+                        raise api_error
+                # Convert to dict format for processing
+                experiments_dict_list = []
+                for exp in experiments_list:
+                    try:
+                        if hasattr(exp, "model_dump"):
+                            # Use mode='python' to get native Python types and exclude_unset to avoid validation issues
+                            exp_dict = exp.model_dump(mode="python", exclude_unset=True)
+                        elif hasattr(exp, "dict"):
+                            exp_dict = exp.dict(exclude_unset=True)
+                        else:
+                            # Already a dict
+                            exp_dict = exp  # type: ignore[assignment]
+                        experiments_dict_list.append(exp_dict)
+                    except Exception as e:
+                        # Skip experiments that can't be converted (e.g., missing required fields)
+                        console.print(
+                            f"[yellow]    Warning: Skipping experiment due to conversion error: {e}[/yellow]"
+                        )
+                        continue
+                experiments_list = experiments_dict_list
+                if not experiments_list or len(experiments_list) == 0:
+                    break
+                # Filter experiments to only include those with existing (non-deleted) datasets
+                # This matches the UI behavior - UI only shows experiments whose datasets still exist
+                # Note: We still process experiments without dataset_name since process_experiment_for_stats
+                # only needs created_at, but we filter out experiments whose datasets don't exist
+                filtered_experiments = []
+                skipped_count = 0
+                for experiment_dict in experiments_list:
+                    dataset_name = experiment_dict.get("dataset_name")
+                    # Skip experiments that have a dataset_name but the dataset doesn't exist
+                    # (experiments without dataset_name are still processed)
+                    if (
+                        dataset_name
+                        and existing_dataset_names
+                        and dataset_name not in existing_dataset_names
+                    ):
+                        # Dataset doesn't exist (was deleted)
+                        skipped_count += 1
+                        continue
+                    filtered_experiments.append(experiment_dict)
+                # Count experiments by month based on created_at
+                # Process all experiments (including those without dataset_name)
+                for experiment_dict in filtered_experiments:
+                    total_experiments_processed += 1
+                    in_range, without_date, outside_range = (
+                        process_experiment_for_stats(
+                            experiment_dict,
+                            experiment_by_unit,
+                            all_dates,
+                            query_start_date,
+                            query_end_date,
+                            unit,
+                            start_date,
+                        )
+                    )
+                    total_experiments_in_range += in_range
+                    experiments_without_date += without_date
+                    experiments_outside_range += outside_range
+                    pbar.update(1)
+                # Check if there are more pages
+                # Note: page is 1-indexed, so page 1 = items 0-999, page 2 = items 1000-1999, etc.
+                if total_experiments and page * 1000 >= total_experiments:
+                    break
+                if len(experiments_list) == 0:
+                    break
+                page += 1
+                # Safety check to avoid infinite loops
+                if page > MAX_PAGINATION_PAGES:
+                    console.print(
+                        f"[yellow]    Warning: Stopped pagination after {MAX_PAGINATION_PAGES} pages to avoid infinite loop[/yellow]"
+                    )
+                    break
+    except Exception as e:
+        console.print(f"[yellow]Warning: Could not get experiment counts: {e}[/yellow]")
+        traceback.print_exc()
+    all_data["experiments_by_unit"] = dict(experiment_by_unit)
+    # Process each project
+    with tqdm(total=len(projects), desc="Processing projects", unit="project") as pbar:
+        for project in projects:
+            project_id = project.id
+            project_name = project.name
+            # Pad project name to fixed width to prevent progress bar from jumping
+            # Truncate to 30 chars and pad to 30 chars for consistent width
+            display_name = (project_name[:30] + " " * 30)[:30]
+            pbar.set_description(f"Processing {display_name}")
+            project_data = {
+                "project_id": project_id,
+                "project_name": project_name,
+                "metrics_by_unit": {},
+            }
+            try:
+                # Get trace counts
+                trace_response = client.rest_client.projects.get_project_metrics(
+                    id=project_id,
+                    metric_type="TRACE_COUNT",
+                    interval="DAILY",
+                    interval_start=query_start_date,
+                    interval_end=query_end_date,
+                )
+                trace_by_unit = aggregate_by_unit(trace_response, unit)
+                # Track dates from metrics
+                if trace_response.results:
+                    for result in trace_response.results:
+                        if result.data:
+                            for data_point in result.data:
+                                if data_point.value is not None:
+                                    all_dates.append(data_point.time)
+                # Get token counts
+                token_response = client.rest_client.projects.get_project_metrics(
+                    id=project_id,
+                    metric_type="TOKEN_USAGE",
+                    interval="DAILY",
+                    interval_start=query_start_date,
+                    interval_end=query_end_date,
+                )
+                # Token usage has multiple result types (total_tokens, prompt_tokens, etc.)
+                # We'll aggregate all of them
+                token_by_unit: Dict[str, Dict[str, float]] = defaultdict(
+                    lambda: defaultdict(float)
+                )
+                if token_response.results:
+                    for result in token_response.results:
+                        token_type = result.name or "unknown"
+                        for data_point in result.data or []:
+                            if data_point.value is not None:
+                                all_dates.append(data_point.time)
+                                unit_key = format_datetime_key(data_point.time, unit)
+                                token_by_unit[unit_key][token_type] += data_point.value
+                # Get cost
+                cost_response = client.rest_client.projects.get_project_metrics(
+                    id=project_id,
+                    metric_type="COST",
+                    interval="DAILY",
+                    interval_start=query_start_date,
+                    interval_end=query_end_date,
+                )
+                cost_by_unit = aggregate_by_unit(cost_response, unit)
+                # Track dates from metrics
+                if cost_response.results:
+                    for result in cost_response.results:
+                        if result.data:
+                            for data_point in result.data:
+                                if data_point.value is not None:
+                                    all_dates.append(data_point.time)
+                # Get span counts by getting all traces and using their span_count field
+                span_by_unit: Dict[str, int] = defaultdict(int)
+                try:
+                    # Get all traces for this project within the date range
+                    # Use a filter string to limit by date range
+                    filter_string = None
+                    if query_start_date and query_end_date:
+                        # Format dates for filter (ISO 8601 format with timezone)
+                        # API expects format like "2024-01-01T00:00:00Z"
+                        def format_date_for_filter(dt: datetime.datetime) -> str:
+                            """Format datetime for filter string with timezone."""
+                            if dt.tzinfo is None:
+                                # Naive datetime - assume UTC and add Z
+                                return dt.strftime("%Y-%m-%dT%H:%M:%SZ")
+                            else:
+                                # Timezone-aware - convert to UTC and format
+                                utc_dt = dt.astimezone(timezone.utc)
+                                return utc_dt.strftime("%Y-%m-%dT%H:%M:%SZ")
+                        start_str = format_date_for_filter(query_start_date)
+                        end_str = format_date_for_filter(query_end_date)
+                        filter_string = (
+                            f'start_time >= "{start_str}" AND start_time <= "{end_str}"'
+                        )
+                    traces = client.search_traces(
+                        project_name=project_name,
+                        filter_string=filter_string,
+                        max_results=MAX_TRACE_RESULTS,
+                    )
+                    # For each trace, get span count
+                    for trace in tqdm(
+                        traces,
+                        desc=f"  Getting span counts for {project_name[:20]}",
+                        leave=False,
+                        unit="trace",
+                    ):
+                        # Try to get span count from trace object first
+                        span_count = trace.span_count
+                        # If span_count is not available, count spans directly
+                        if span_count is None:
+                            try:
+                                spans = client.search_spans(
+                                    trace_id=trace.id,
+                                    project_name=project_name,
+                                    max_results=10000,
+                                )
+                                span_count = len(spans)
+                            except Exception:
+                                # If counting fails, default to 0
+                                span_count = 0
+                        span_count = span_count or 0
+                        # Aggregate by unit based on trace start_time
+                        if trace.start_time:
+                            trace_date = trace.start_time
+                            # Normalize timezones for comparison
+                            trace_date, start_date_aware, end_date_aware = (
+                                normalize_timezone_for_comparison(
+                                    trace_date, query_start_date, query_end_date
+                                )
+                            )
+                            # Check if within date range
+                            if trace_date.tzinfo is not None:
+                                date_check = (
+                                    start_date_aware <= trace_date <= end_date_aware
+                                )
+                            else:
+                                date_check = (
+                                    query_start_date <= trace_date <= query_end_date
+                                )
+                            if date_check:
+                                unit_key = format_datetime_key(trace_date, unit)
+                                span_by_unit[unit_key] += span_count
+                                all_dates.append(trace_date)
+                except Exception as e:
+                    console.print(
+                        f"[yellow]  Warning: Could not get span counts for project {project_name}: {e}[/yellow]"
+                    )
+                # Combine all metrics by unit
+                all_units = set(
+                    list(trace_by_unit.keys())
+                    + list(token_by_unit.keys())
+                    + list(cost_by_unit.keys())
+                    + list(span_by_unit.keys())
+                )
+                for unit_key in sorted(all_units):
+                    project_data["metrics_by_unit"][unit_key] = {
+                        "trace_count": trace_by_unit.get(unit_key, 0),
+                        "token_count": dict(token_by_unit.get(unit_key, {})),
+                        "cost": cost_by_unit.get(unit_key, 0.0),
+                        "span_count": span_by_unit.get(unit_key, 0),
+                    }
+            except Exception as e:
+                console.print(
+                    f"[red]  Error processing project {project_name}: {e}[/red]\n"
+                )
+                project_data["error"] = str(e)
+            all_data["projects"].append(project_data)
+            pbar.update(1)
+    # Determine actual date range from collected data if auto-detection was requested
+    if all_dates:
+        actual_start = min(all_dates)
+        actual_end = max(all_dates)
+        # Use provided dates where available, otherwise use detected dates
+        if auto_detect_start:
+            all_data["date_range"]["start"] = actual_start.isoformat()
+        else:
+            if start_date:
+                all_data["date_range"]["start"] = start_date.isoformat()
+        if auto_detect_end:
+            all_data["date_range"]["end"] = actual_end.isoformat()
+        else:
+            if end_date:
+                all_data["date_range"]["end"] = end_date.isoformat()
+        if auto_detect_start or auto_detect_end:
+            # Format dates nicely for display
+            start_str = all_data["date_range"]["start"]
+            end_str = all_data["date_range"]["end"]
+            try:
+                start_dt = datetime.datetime.fromisoformat(
+                    start_str.replace("Z", "+00:00")
+                )
+                end_dt = datetime.datetime.fromisoformat(end_str.replace("Z", "+00:00"))
+                start_formatted = start_dt.strftime("%Y-%m-%d")
+                end_formatted = end_dt.strftime("%Y-%m-%d")
+                console.print(
+                    f"[blue]Auto-detected date range: {start_formatted} to {end_formatted}[/blue]\n"
+                )
+            except (ValueError, AttributeError):
+                console.print(
+                    f"[blue]Auto-detected date range: {start_str} to {end_str}[/blue]\n"
+                )
+    else:
+        # No data collected, use provided dates or None
+        if start_date:
+            all_data["date_range"]["start"] = start_date.isoformat()
+        if end_date:
+            all_data["date_range"]["end"] = end_date.isoformat()
+    return all_data

opik 1.8.39__py3-none-any.whl → 1.9.71__py3-none-any.whl

opik 1.8.39py3-none-any.whl → 1.9.71py3-none-any.whl