PyPI - judgeval - Versions diffs - 0.0.44__py3-none-any.whl → 0.0.46__py3-none-any.whl - Mend

judgeval 0.0.44py3-none-any.whl → 0.0.46py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (64) hide show

judgeval/__init__.py +5 -4
judgeval/clients.py +6 -6
judgeval/common/__init__.py +7 -2
judgeval/common/exceptions.py +2 -3
judgeval/common/logger.py +74 -49
judgeval/common/s3_storage.py +30 -23
judgeval/common/tracer.py +1273 -939
judgeval/common/utils.py +416 -244
judgeval/constants.py +73 -61
judgeval/data/__init__.py +1 -1
judgeval/data/custom_example.py +3 -2
judgeval/data/datasets/dataset.py +80 -54
judgeval/data/datasets/eval_dataset_client.py +131 -181
judgeval/data/example.py +67 -43
judgeval/data/result.py +11 -9
judgeval/data/scorer_data.py +4 -2
judgeval/data/tool.py +25 -16
judgeval/data/trace.py +57 -29
judgeval/data/trace_run.py +5 -11
judgeval/evaluation_run.py +22 -82
judgeval/integrations/langgraph.py +546 -184
judgeval/judges/base_judge.py +1 -2
judgeval/judges/litellm_judge.py +33 -11
judgeval/judges/mixture_of_judges.py +128 -78
judgeval/judges/together_judge.py +22 -9
judgeval/judges/utils.py +14 -5
judgeval/judgment_client.py +259 -271
judgeval/rules.py +169 -142
judgeval/run_evaluation.py +462 -305
judgeval/scorers/api_scorer.py +20 -11
judgeval/scorers/exceptions.py +1 -0
judgeval/scorers/judgeval_scorer.py +77 -58
judgeval/scorers/judgeval_scorers/api_scorers/__init__.py +46 -15
judgeval/scorers/judgeval_scorers/api_scorers/answer_correctness.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/answer_relevancy.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/classifier_scorer.py +12 -11
judgeval/scorers/judgeval_scorers/api_scorers/comparison.py +7 -5
judgeval/scorers/judgeval_scorers/api_scorers/contextual_precision.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/contextual_recall.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/contextual_relevancy.py +5 -2
judgeval/scorers/judgeval_scorers/api_scorers/derailment_scorer.py +2 -1
judgeval/scorers/judgeval_scorers/api_scorers/execution_order.py +17 -8
judgeval/scorers/judgeval_scorers/api_scorers/faithfulness.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/groundedness.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/hallucination.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/instruction_adherence.py +3 -2
judgeval/scorers/judgeval_scorers/api_scorers/json_correctness.py +8 -9
judgeval/scorers/judgeval_scorers/api_scorers/summarization.py +4 -4
judgeval/scorers/judgeval_scorers/api_scorers/tool_dependency.py +5 -5
judgeval/scorers/judgeval_scorers/api_scorers/tool_order.py +5 -2
judgeval/scorers/judgeval_scorers/classifiers/text2sql/text2sql_scorer.py +9 -10
judgeval/scorers/prompt_scorer.py +48 -37
judgeval/scorers/score.py +86 -53
judgeval/scorers/utils.py +11 -7
judgeval/tracer/__init__.py +1 -1
judgeval/utils/alerts.py +23 -12
judgeval/utils/{data_utils.py → file_utils.py} +5 -9
judgeval/utils/requests.py +29 -0
judgeval/version_check.py +5 -2
{judgeval-0.0.44.dist-info → judgeval-0.0.46.dist-info}/METADATA +79 -135
judgeval-0.0.46.dist-info/RECORD +69 -0
judgeval-0.0.44.dist-info/RECORD +0 -68
{judgeval-0.0.44.dist-info → judgeval-0.0.46.dist-info}/WHEEL +0 -0
{judgeval-0.0.44.dist-info → judgeval-0.0.46.dist-info}/licenses/LICENSE.md +0 -0

{judgeval-0.0.44.dist-info → judgeval-0.0.46.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: judgeval
-Version: 0.0.44
+Version: 0.0.46
 Summary: Judgeval Package
 Project-URL: Homepage, https://github.com/JudgmentLabs/judgeval
 Project-URL: Issues, https://github.com/JudgmentLabs/judgeval/issues
@@ -34,57 +34,60 @@ Description-Content-Type: text/markdown
 <br>
 <div style="font-size: 1.5em;">
-  Open source tracing, evals, and metrics to debug, test, and monitor LLM agents.
+    Enable self-learning agents with traces, evals, and environment data.
 </div>
-## [Judgment Cloud](https://app.judgmentlabs.ai/register)  • [Self-Host](https://docs.judgmentlabs.ai/self-hosting/get_started) • [Demo](https://www.youtube.com/watch?v=1S4LixpVbcc)
+## [Docs](https://docs.judgmentlabs.ai/)  •  [Judgment Cloud](https://app.judgmentlabs.ai/register)  • [Self-Host](https://docs.judgmentlabs.ai/self-hosting/get_started)
-[Docs](https://docs.judgmentlabs.ai/introduction) • [Bug Reports](https://github.com/JudgmentLabs/judgeval/issues) • [Changelog](https://docs.judgmentlabs.ai/changelog/2025-04-21)
+ [Demo](https://www.youtube.com/watch?v=1S4LixpVbcc) • [Bug Reports](https://github.com/JudgmentLabs/judgeval/issues) • [Changelog](https://docs.judgmentlabs.ai/changelog/2025-04-21)
-We're hiring! Join us in our mission to unleash optimized agents.
+We're hiring! Join us in our mission to enable self-learning agents by providing the data and signals needed for continuous improvement.
 [![X](https://img.shields.io/badge/-X/Twitter-000?logo=x&logoColor=white)](https://x.com/JudgmentLabs)
 [![LinkedIn](https://custom-icon-badges.demolab.com/badge/LinkedIn%20-0A66C2?logo=linkedin-white&logoColor=fff)](https://www.linkedin.com/company/judgmentlabs)
-[![Discord](https://img.shields.io/badge/-Discord-5865F2?logo=discord&logoColor=white)](https://discord.gg/ZCnSXYug)
+[![Discord](https://img.shields.io/badge/-Discord-5865F2?logo=discord&logoColor=white)](https://discord.gg/tGVFf8UBUY)
-<img src="assets/experiments_pagev2.png" alt="Judgment Platform Experiments Page" width="800" />
+<img src="assets/product_shot.png" alt="Judgment Platform" width="800" />
 </div>
-Judgeval offers **robust open-source tooling** for tracing, evaluating, and monitoring LLM agents. It helps AI teams effectively **test and monitor** agents in development and production, **closing the agent feedback loop**.
-Judgeval can be set up **(cloud-hosted or self-hosted) in 5 minutes**!
-> 🎁 Generous monthly [free tier](https://judgmentlabs.ai/pricing) (10k traces, 1k evals) - No credit card required!
-Judgeval is created and maintained by [Judgment Labs](https://judgmentlabs.ai/).
+Judgeval offers **open-source tooling** for tracing, evaluating, and monitoring LLM agents. **Provides comprehensive data from agent-environment interactions** for continuous learning and self-improvement—**enabling the future of autonomous agents**.
+## 🎬 See Judgeval in Action
+**[Multi-Agent System](https://github.com/JudgmentLabs/judgment-cookbook/tree/main/cookbooks/agents/multi-agent) with complete observability:** (1) A multi-agent system spawns agents to research topics on the internet. (2) With just **3 lines of code**, Judgeval traces every input/output + environment response across all agent tool calls for debugging. (3) After completion, (4) export all interaction data to enable further environment-specific learning and optimization.
+<table style="width: 100%; max-width: 800px; table-layout: fixed;">
+<tr>
+<td align="center" style="padding: 8px; width: 50%;">
+  <img src="assets/agent.gif" alt="Agent Demo" style="width: 100%; max-width: 350px; height: auto;" />
+  <br><strong>🤖 Agents Running</strong>
+</td>
+<td align="center" style="padding: 8px; width: 50%;">
+  <img src="assets/trace.gif" alt="Trace Demo" style="width: 100%; max-width: 350px; height: auto;" />
+  <br><strong>📊 Real-time Tracing</strong>
+</td>
+</tr>
+<tr>
+<td align="center" style="padding: 8px; width: 50%;">
+  <img src="assets/document.gif" alt="Agent Completed Demo" style="width: 100%; max-width: 350px; height: auto;" />
+  <br><strong>✅ Agents Completed Running</strong>
+</td>
+<td align="center" style="padding: 8px; width: 50%;">
+  <img src="assets/data.gif" alt="Data Export Demo" style="width: 100%; max-width: 350px; height: auto;" />
+  <br><strong>📤 Exporting Agent Environment Data</strong>
+</td>
+</tr>
+</table>
 ## 📋 Table of Contents
-- [✨ Features](#-features)
 - [🛠️ Installation](#️-installation)
 - [🏁 Quickstarts](#-quickstarts)
-  - [🛰️ Tracing](#️-tracing)
-  - [📝 Offline Evaluations](#-offline-evaluations)
-  - [📡 Online Evaluations](#-online-evaluations)
+- [✨ Features](#-features)
 - [🏢 Self-Hosting](#-self-hosting)
-  - [Key Features](#key-features)
-  - [Getting Started](#getting-started)
 - [📚 Cookbooks](#-cookbooks)
 - [💻 Development with Cursor](#-development-with-cursor)
-- [⭐ Star Us on GitHub](#-star-us-on-github)
-- [❤️ Contributors](#️-contributors)
-<!-- Created by https://github.com/ekalinin/github-markdown-toc -->
-## ✨ Features
-|  |  |
-|:---|:---:|
-| <h3>🔍 Tracing</h3>Automatic agent tracing integrated with common frameworks (LangGraph, OpenAI, Anthropic): **tracking inputs/outputs, agent tool calls, latency, and cost** at every step.<br><br>Online evals can be applied to traces to measure quality on production data in real-time.<br><br>Export trace data to the Judgment Platform or your own S3 buckets, {Parquet, JSON, YAML} files, or data warehouse.<br><br>**Useful for:**<br>• 🐛 Debugging agent runs <br>• 👤 Tracking user activity <br>• 🔬 Pinpointing performance bottlenecks| <p align="center"><img src="assets/trace_screenshot.png" alt="Tracing visualization" width="1200"/></p> |
-| <h3>🧪 Evals</h3>Evals are the key to regression testing for agents. Judgeval provides 15+ research-backed metrics including tool call accuracy, hallucinations, instruction adherence, and retrieval context recall.<br><br>Judgeval supports LLM-as-a-judge, manual labeling, and custom evaluators that connect with our metric-tracking infrastructure. <br><br>**Useful for:**<br>• ⚠️ Unit-testing <br>• 🔬 Experimental prompt testing<br>• 🛡️ Online guardrails | <p align="center"><img src="assets/experiments_page.png" alt="Evaluation metrics" width="800"/></p> |
-| <h3>📡 Monitoring</h3>Track all your agent metrics in production. **Catch production regressions early.**<br><br>Configure alerts to trigger automated actions when metric thresholds are exceeded (add agent trace to review queue/dataset, Slack notification, etc.).<br><br> **Useful for:** <br>• 📉 Identifying degradation early <br>• 📈 Visualizing performance trends across agent versions and time | <p align="center"><img src="assets/monitoring_screenshot.png" alt="Monitoring Dashboard" width="1200"/></p> |
-| <h3>📊 Datasets</h3>Export trace data or import external testcases to datasets for scaled unit testing and structured experiments. Move datasets to/from Parquet, S3, etc. <br><br>Run evals on datasets as unit tests or to A/B test different agent configurations. <br><br> **Useful for:**<br>• 🗃️ Filtered agent runtime data for fine tuning<br>• 🔄 Scaled analysis for A/B tests | <p align="center"><img src="assets/datasets_preview_screenshot.png" alt="Dataset management" width="1200"/></p> |
 ## 🛠️ Installation
@@ -94,7 +97,7 @@ Get started with Judgeval by installing our SDK using pip:
 pip install judgeval
 ```
-Ensure you have your `JUDGMENT_API_KEY` and `JUDGMENT_ORG_ID` environment variables set to connect to the [Judgment platform](https://app.judgmentlabs.ai/).
+Ensure you have your `JUDGMENT_API_KEY` and `JUDGMENT_ORG_ID` environment variables set to connect to the [Judgment Platform](https://app.judgmentlabs.ai/).
 ```bash
 export JUDGMENT_API_KEY=...
@@ -107,106 +110,50 @@ export JUDGMENT_ORG_ID=...
 ### 🛰️ Tracing
-Create a file named `traces.py` with the following code:
+Create a file named `agent.py` with the following code:
 ```python
-from judgeval.common.tracer import Tracer, wrap
+from judgeval.tracer import Tracer, wrap
 from openai import OpenAI
-client = wrap(OpenAI())
+client = wrap(OpenAI())  # tracks all LLM calls
 judgment = Tracer(project_name="my_project")
 @judgment.observe(span_type="tool")
-def my_tool():
-    return "What's the capital of the U.S.?"
+def format_question(question: str) -> str:
+    # dummy tool
+    return f"Question : {question}"
 @judgment.observe(span_type="function")
-def main():
-    task_input = my_tool()
-    res = client.chat.completions.create(
+def run_agent(prompt: str) -> str:
+    task = format_question(prompt)
+    response = client.chat.completions.create(
         model="gpt-4.1",
-        messages=[{"role": "user", "content": f"{task_input}"}]
+        messages=[{"role": "user", "content": task}]
     )
-    return res.choices[0].message.content
-main()
+    return response.choices[0].message.content
+run_agent("What is the capital of the United States?")
 ```
 You'll see your trace exported to the Judgment Platform:
 <p align="center"><img src="assets/trace_demo.png" alt="Judgment Platform Trace Example" width="800" /></p>
-[Click here](https://docs.judgmentlabs.ai/getting-started#create-your-first-trace) for a more detailed explanation.
+[Click here](https://docs.judgmentlabs.ai/tracing/introduction) for a more detailed explanation.
-### 📝 Offline Evaluations
-Create a file named `evaluate.py` with the following code:
-```python evaluate.py
-from judgeval import JudgmentClient
-from judgeval.data import Example
-from judgeval.scorers import FaithfulnessScorer
-client = JudgmentClient()
-example = Example(
-    input="What if these shoes don't fit?",
-    actual_output="We offer a 30-day full refund at no extra cost.",
-    retrieval_context=["All customers are eligible for a 30 day full refund at no extra cost."],
-)
-scorer = FaithfulnessScorer(threshold=0.5)  # Hallucination detector
-results = client.run_evaluation(
-    examples=[example],
-    scorers=[scorer],
-    model="gpt-4.1",
-)
-print(results)
-```
-[Click here](https://docs.judgmentlabs.ai/getting-started#create-your-first-experiment) for a more detailed explanation.
-### 📡 Online Evaluations
-Attach performance monitoring on traces to measure the quality of your systems in production.
-Using the same `traces.py` file we created earlier, modify `main` function:
-```python
-from judgeval.common.tracer import Tracer, wrap
-from judgeval.scorers import AnswerRelevancyScorer
-from openai import OpenAI
-client = wrap(OpenAI())
-judgment = Tracer(project_name="my_project")
-@judgment.observe(span_type="tool")
-def my_tool():
-    return "Hello world!"
-@judgment.observe(span_type="function")
-def main():
-    task_input = my_tool()
-    res = client.chat.completions.create(
-        model="gpt-4.1",
-        messages=[{"role": "user", "content": f"{task_input}"}]
-    ).choices[0].message.content
-    judgment.async_evaluate(
-        scorers=[AnswerRelevancyScorer(threshold=0.5)],
-        input=task_input,
-        actual_output=res,
-        model="gpt-4.1"
-    )
-    print("Online evaluation submitted.")
-    return res
+<!-- Created by https://github.com/ekalinin/github-markdown-toc -->
-main()
-```
-You should see an evaluation attached to your trace on the Judgment Platform.
+## ✨ Features
-[Click here](https://docs.judgmentlabs.ai/getting-started#create-your-first-online-evaluation) for a more detailed explanation.
+|  |  |
+|:---|:---:|
+| <h3>🔍 Tracing</h3>Automatic agent tracing integrated with common frameworks (LangGraph, OpenAI, Anthropic): **tracking inputs/outputs, agent tool calls, latency, and cost** at every step.<br><br>Online evals can be applied to traces to measure quality on production data in real-time. Export data per individual trace for detailed analysis.<br><br>**Useful for:**<br>• 🐛 Debugging agent runs <br>• 📋 Collecting agent environment data <br>• 🔬 Pinpointing performance bottlenecks| <p align="center"><img src="assets/trace_screenshot.png" alt="Tracing visualization" width="1200"/></p> |
+| <h3>🧪 Evals</h3>Evals are the key to regression testing for agents. Judgeval provides 15+ research-backed metrics including tool call accuracy, hallucinations, instruction adherence, and retrieval context recall.<br><br>Judgeval supports LLM-as-a-judge, manual labeling, and custom evaluators that connect with our metric-tracking infrastructure. <br><br>**Useful for:**<br>• ⚠️ Unit-testing <br>• 🔬 Experimental prompt testing<br>• 🛡️ Online guardrails | <p align="center"><img src="assets/experiments_page.png" alt="Evaluation metrics" width="800"/></p> |
+| <h3>📡 Monitoring</h3>Track all your agent metrics in production. **Catch production regressions early.**<br><br>Configure alerts to trigger automated actions when metric thresholds are exceeded (add agent trace to review queue/dataset, Slack notification, etc.).<br><br> **Useful for:** <br>• 📉 Identifying degradation early <br>• 📈 Visualizing performance trends across agent versions and time | <p align="center"><img src="assets/error_analysis_dashboard.png" alt="Monitoring Dashboard" width="1200"/></p> |
+| <h3>📊 Datasets</h3>Export comprehensive agent-environment interaction data or import external testcases to datasets for scaled analysis and optimization. Move datasets to/from Parquet, S3, etc. <br><br>Run evals on datasets as unit tests or to A/B test different agent configurations, enabling continuous learning from production interactions. <br><br> **Useful for:**<br>• 🗃️ Agent environment interaction data for optimization<br>• 🔄 Scaled analysis for A/B tests | <p align="center"><img src="assets/datasets_preview_screenshot.png" alt="Dataset management" width="1200"/></p> |
 ## 🏢 Self-Hosting
@@ -224,14 +171,9 @@ Run Judgment on your own infrastructure: we provide comprehensive self-hosting c
 ## 📚 Cookbooks
-Have your own? We're happy to feature it if you create a PR or message us on [Discord](https://discord.gg/taAufyhf).
+Have your own? We're happy to feature it if you create a PR or message us on [Discord](https://discord.gg/tGVFf8UBUY).
-You can access our repo of cookbooks [here](https://github.com/JudgmentLabs/judgment-cookbook). Here are some highlights:
-### Sample Agents
-#### [Multi-Agent System](https://github.com/JudgmentLabs/judgment-cookbook/tree/main/cookbooks/agents/multi-agent)
-A multi-agent system augmented with tool calls designed for general purpose tasks like financial research and math. Traced and evaluated on Faithfulness (factual adherence to retrieval context).
+You can access our repo of cookbooks [here](https://github.com/JudgmentLabs/judgment-cookbook).
 ## 💻 Development with Cursor
 When building agents and LLM workflows in Cursor, providing proper context to your coding assistant helps ensure seamless integration with Judgment. This rule file supplies the essential context your coding assistant needs for successful implementation.
@@ -1243,10 +1185,10 @@ Judgeval is created and maintained by @Judgment Labs.
 |  |  |
 |:---|:---:|
-| <h3>🔍 Tracing</h3>Automatic agent tracing integrated with common frameworks (LangGraph, OpenAI, Anthropic): **tracking inputs/outputs, latency, and cost** at every step.<br><br>Online evals can be applied to traces to measure quality on production data in real-time.<br><br>Export trace data to the Judgment Platform or your own S3 buckets, {Parquet, JSON, YAML} files, or data warehouse.<br><br>**Useful for:**<br>• 🐛 Debugging agent runs <br>• 👤 Tracking user activity <br>• 🔬 Pinpointing performance bottlenecks| <p align="center"><img src="assets/trace_screenshot.png" alt="Tracing visualization" width="1200"/></p> |
+| <h3>🔍 Tracing</h3>Automatic agent tracing integrated with common frameworks (LangGraph, OpenAI, Anthropic): **tracking inputs/outputs, agent tool calls, latency, and cost** at every step.<br><br>Online evals can be applied to traces to measure quality on production data in real-time.<br><br>**Useful for:**<br>• 🐛 Debugging agent runs <br>• 📋 Collecting agent environment data <br>• 🔬 Pinpointing performance bottlenecks| <p align="center"><img src="assets/trace_screenshot.png" alt="Tracing visualization" width="1200"/></p> |
 | <h3>🧪 Evals</h3>15+ research-backed metrics including tool call accuracy, hallucinations, instruction adherence, and retrieval context recall.<br><br>Build custom evaluators that connect with our metric-tracking infrastructure. <br><br>**Useful for:**<br>• ⚠️ Unit-testing <br>• 🔬 Experimental prompt testing<br>• 🛡️ Online guardrails <br><br> | <p align="center"><img src="assets/experiments_page.png" alt="Evaluation metrics" width="800"/></p> |
 | <h3>📡 Monitoring</h3>Real-time performance tracking of your agents in production environments. **Track all your metrics in one place.**<br><br>Set up **Slack/email alerts** for critical metrics and receive notifications when thresholds are exceeded.<br><br> **Useful for:** <br>•📉 Identifying degradation early <br>•📈 Visualizing performance trends across versions and time | <p align="center"><img src="assets/monitoring_screenshot.png" alt="Monitoring Dashboard" width="1200"/></p> |
-| <h3>📊 Datasets</h3>Export trace data or import external testcases to datasets hosted on Judgment's Platform. Move datasets to/from Parquet, S3, etc. <br><br>Run evals on datasets as unit tests or to A/B test different agent configurations. <br><br> **Useful for:**<br>• 🔄 Scaled analysis for A/B tests <br>• 🗃️ Filtered collections of agent runtime data| <p align="center"><img src="assets/datasets_preview_screenshot.png" alt="Dataset management" width="1200"/></p> |
+| <h3>📊 Datasets</h3>Export trace data or import external testcases to datasets for scaled unit testing and structured experiments. Move datasets to/from Parquet, S3, etc. <br><br>Run evals on datasets as unit tests or to A/B test different agent configurations. <br><br> **Useful for:**<br>• 🗃️ Filtered agent runtime data for fine tuning<br>• 🔄 Scaled analysis for A/B tests | <p align="center"><img src="assets/datasets_preview_screenshot.png" alt="Dataset management" width="1200"/></p> |
 | <h3>💡 Insights</h3>Cluster on your data to reveal common use cases and failure modes.<br><br>Trace failures to their exact source with Judgment's Osiris agent, which localizes errors to specific components for precise fixes.<br><br> **Useful for:**<br>•🔮 Surfacing common inputs that lead to error<br>•🤖 Investigating agent/user behavior for optimization <br>| <p align="center"><img src="assets/dataset_clustering_screenshot_dm.png" alt="Insights dashboard" width="1200"/></p> |
 ## 🛠️ Installation
@@ -1271,26 +1213,27 @@ Track your agent execution with full observability with just a few lines of code
 Create a file named `traces.py` with the following code:
 ```python
-from judgeval.common.tracer import Tracer, wrap
+from judgeval.tracer import Tracer, wrap
 from openai import OpenAI
-client = wrap(OpenAI())
+client = wrap(OpenAI())  # tracks all LLM calls
 judgment = Tracer(project_name="my_project")
 @judgment.observe(span_type="tool")
-def my_tool():
-    return "What's the capital of the U.S.?"
+def format_question(question: str) -> str:
+    # dummy tool
+    return f"Question : {question}"
 @judgment.observe(span_type="function")
-def main():
-    task_input = my_tool()
-    res = client.chat.completions.create(
+def run_agent(prompt: str) -> str:
+    task = format_question(prompt)
+    response = client.chat.completions.create(
         model="gpt-4.1",
-        messages=[{"role": "user", "content": f"{task_input}"}]
+        messages=[{"role": "user", "content": task}]
     )
-    return res.choices[0].message.content
+    return response.choices[0].message.content
-main()
+run_agent("What is the capital of the United States?")
 ```
 @Click here for a more detailed explanation.
@@ -1418,13 +1361,11 @@ There are many ways to contribute to Judgeval:
 @![Contributors](https://github.com/JudgmentLabs/judgeval/graphs/contributors)
 ````
 </details>
 ## ⭐ Star Us on GitHub
-If you find Judgeval useful, please consider giving us a star on GitHub! Your support helps us grow our community and continue improving the product.
+If you find Judgeval useful, please consider giving us a star on GitHub! Your support helps us grow our community and continue improving the repository.
 ## ❤️ Contributors
@@ -1437,3 +1378,6 @@ There are many ways to contribute to Judgeval:
 <!-- Contributors collage -->
 [![Contributors](https://contributors-img.web.app/image?repo=JudgmentLabs/judgeval)](https://github.com/JudgmentLabs/judgeval/graphs/contributors)
+---
+Judgeval is created and maintained by [Judgment Labs](https://judgmentlabs.ai/).

judgeval-0.0.46.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,69 @@
+judgeval/__init__.py,sha256=HM1M8hmqRum6G554QKkXhB4DF4f5eh_xtYo0Kf-t3kw,332
+judgeval/clients.py,sha256=JnB8n90GyXiYaGmSEYaA67mdJSnr3SIrzArao7NGebw,980
+judgeval/constants.py,sha256=IwW428u2VxThczHiL6ZnRwrIzb6QwOE4kdKonktVFYA,6032
+judgeval/evaluation_run.py,sha256=9fYFWJ2ZXtnNcRqxLjzKkZHAba2xi_f1uzOXDJ37Pgw,3233
+judgeval/judgment_client.py,sha256=RGqjw6Q50DOaTPa5SfCzSSGjsm7zlkZ6N7LOvewCxVU,21510
+judgeval/rules.py,sha256=TKI1K_Wlo3GDoSCztGcDoTioVKpvfG6zVkONyou8v5c,20465
+judgeval/run_evaluation.py,sha256=JohxsU5EajwPgBhBGt_wTrNSGdVIbSJmMAR5ffCSg7c,51478
+judgeval/version_check.py,sha256=FlKE8AQGwu50d3kdWSiBZYVW9sicnFInCZjakKt37w4,1003
+judgeval/common/__init__.py,sha256=KH-QJyWtQ60R6yFIBDYS3WGRiNpEu1guynpxivZvpBQ,309
+judgeval/common/exceptions.py,sha256=OkgDznu2wpBQZMXiZarLJYNk1HIcC8qYW7VypDC3Ook,556
+judgeval/common/logger.py,sha256=_nNV4waaMB4NkjwAG0kYZ3cfBe19BY6b2vsCdKd2YR4,6112
+judgeval/common/s3_storage.py,sha256=ukylTrBZ2QuT8BGbOY7D738RvHFAzVaPwmuWQ4R5xkE,3986
+judgeval/common/tracer.py,sha256=7vvPY632z4ExsqIuNRjfpJfa6CpJKohz8kvBiSwbjFE,129624
+judgeval/common/utils.py,sha256=p8C_BM0nNcIiVHTBH4BqsR106RNUlZ9wM0SxWY4IozE,35543
+judgeval/data/__init__.py,sha256=Nuy_F6oll5c5qLOF2gGFWFYyXeOgXSh7R4Vm2kMiXDM,531
+judgeval/data/custom_example.py,sha256=o4baSEeyNhS-k9PiOJdN4NfBFBGJMvhnU5RBvVRFRd8,734
+judgeval/data/example.py,sha256=8wsqBJ98Nw7IaVNXZmUoz3UuQUWkBbnHI6t4_1pqmr8,7234
+judgeval/data/result.py,sha256=4TfBPukRpF2iaF14zEU1RP-wHxsPWrX8PaXYnhxN8MM,3132
+judgeval/data/scorer_data.py,sha256=FnePIXS-4oNqrM2Eo97-hL3g3ZKFIvEKLdkl0CnpHEI,3283
+judgeval/data/tool.py,sha256=QMYJO8kyhGum8iiXxZZ_9pGcxcqp7Fjp0R0sh6i_9rU,1915
+judgeval/data/trace.py,sha256=tn1ctv99UI_vG_1UmFlzvt2L20mviUSwbvVs8ow8X-o,5797
+judgeval/data/trace_run.py,sha256=NMUkf5bxMW_jWXxZ-JI8-gOKSASldS7oAMH4MH4oSYE,1841
+judgeval/data/datasets/__init__.py,sha256=IdNKhQv9yYZ_op0rdBacrFaFVmiiYQ3JTzXzxOTsEVQ,176
+judgeval/data/datasets/dataset.py,sha256=VDHQpOUoWUfaPmCeolKP-hhSzQcCHq1muRg3EtLRpf0,12933
+judgeval/data/datasets/eval_dataset_client.py,sha256=93Pxb3aCgDwvi263N0CgugApIwKbHbPSfuz7j0IhHSY,12880
+judgeval/integrations/langgraph.py,sha256=3fKMOhAjuDdH_q3F9OlW2T_fx_vzBg2Sz4WP4WFvBuw,35909
+judgeval/judges/__init__.py,sha256=6X7VSwrwsdxGBNxCyapVRWGghhKOy3MVxFNMQ62kCXM,308
+judgeval/judges/base_judge.py,sha256=_dz0qWsKRxzXxpRY9l6mrxTRYPSF2FE4ZXkrzhZ4gbY,986
+judgeval/judges/litellm_judge.py,sha256=pHKdNkhdBMlrok3ZMTWaomGX6DKFXYV9zHqvCL7_2jo,2653
+judgeval/judges/mixture_of_judges.py,sha256=jcE3H47bVMdqzYRuxa0LD8wudF1kxkRujEpbVV-rkcM,15913
+judgeval/judges/together_judge.py,sha256=DZKlsij2ikmDiYbLZKWm8oqDRNNuvCBiGM0JcycwqWM,2424
+judgeval/judges/utils.py,sha256=0CF9qtIUQUL3-W-qTGpmTjZbkUUBAM6TslDsrCHnTBU,2725
+judgeval/scorers/__init__.py,sha256=VKPveyGCv5Rc0YtuT7iAxSv-M5EuikqAVeaGNnYMuWE,1340
+judgeval/scorers/api_scorer.py,sha256=2LNqcwIMerb37WooGD-hw5WIVLcTXnxWxzwZ0h9CXq0,2795
+judgeval/scorers/exceptions.py,sha256=ACDHK5-TWiF3NTk-wycaedpbrdobm-CvvC1JA_iP-Mk,179
+judgeval/scorers/judgeval_scorer.py,sha256=VoiAQdJzgoiVyFYS9gLEGtQwfQY6tUBoWBBDyGBfo-Q,7321
+judgeval/scorers/prompt_scorer.py,sha256=w0tW76J956smL4D8PsOHswjwYFb8W08E_0E9ad5_aQ8,12124
+judgeval/scorers/score.py,sha256=_mKQuoZHEqrF9PaydPtzWN3zjE6PeKYETw_1UryzJ3s,19399
+judgeval/scorers/utils.py,sha256=UKssYyqsJ_hckeqa1aGcXLLxiScRDzYilyuT1RqkVyo,6853
+judgeval/scorers/judgeval_scorers/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
+judgeval/scorers/judgeval_scorers/api_scorers/__init__.py,sha256=mmGIBCWN2WByjSUn9o5-xmHV2W-fDNyRofNsEpSuqyQ,2248
+judgeval/scorers/judgeval_scorers/api_scorers/answer_correctness.py,sha256=xY7vY4uIfncEiCksGu5SFT8dUjzkY9suNgyvipQ1avU,712
+judgeval/scorers/judgeval_scorers/api_scorers/answer_relevancy.py,sha256=t2ClO5nL6rM_atKV9YFgOCrQEPI_KjNqs1tyF3WqQig,659
+judgeval/scorers/judgeval_scorers/api_scorers/classifier_scorer.py,sha256=USeIQ1nozvQhMIrRLpST3nqNOekOFW5XJG4NSP7w0RI,4430
+judgeval/scorers/judgeval_scorers/api_scorers/comparison.py,sha256=H4K_NIMabYd_OPlMz3CNNMIM3vYk7PunTXygMnyp6sc,1240
+judgeval/scorers/judgeval_scorers/api_scorers/contextual_precision.py,sha256=QldMhW7k16jPPiHQAeLH-2VilPTuNHVi6OMsWvWnycE,771
+judgeval/scorers/judgeval_scorers/api_scorers/contextual_recall.py,sha256=GDxEljGD4E-8j6t9DpV2cve0gcKZiUYHn2bfyXChbu0,759
+judgeval/scorers/judgeval_scorers/api_scorers/contextual_relevancy.py,sha256=4E6Sa1aaI1k9PvA8afzNwIdrBCxv4UOqMtmfnLlWeWs,826
+judgeval/scorers/judgeval_scorers/api_scorers/derailment_scorer.py,sha256=jiKi8EfwP_yuOwHhYStbIUQIn2LPwJEbkh8PQeOoDTs,475
+judgeval/scorers/judgeval_scorers/api_scorers/execution_order.py,sha256=guG37tQm8m4Gs1bwYS1eaNau-RJYwteb1hwYQ0YMIbk,1357
+judgeval/scorers/judgeval_scorers/api_scorers/faithfulness.py,sha256=6iK6Da0FWoyDe_OH7UMnc4gpnByNqfIx6BW8nUbvlC0,693
+judgeval/scorers/judgeval_scorers/api_scorers/groundedness.py,sha256=RrGgBMgwVPpxb9cHm-yXQBgoh6CHUm_GkFYGSp-KcUc,693
+judgeval/scorers/judgeval_scorers/api_scorers/hallucination.py,sha256=VbvEEawOZ1XA3SWS986cbR2m3Clyliv21nzHe9GrQxo,687
+judgeval/scorers/judgeval_scorers/api_scorers/instruction_adherence.py,sha256=nk4_lpq2eIe6v8GtBm2g6O1CLCg5sP7-wspye6qNuXE,679
+judgeval/scorers/judgeval_scorers/api_scorers/json_correctness.py,sha256=9gKX32g9dAvFdHXzQmR-CFabBPLIZHu8aCnICK3t7j8,1066
+judgeval/scorers/judgeval_scorers/api_scorers/summarization.py,sha256=Wz5wtpqeXMdK8oRXRKnWqow4s1mmqGFQqHK42wo6cNQ,648
+judgeval/scorers/judgeval_scorers/api_scorers/tool_dependency.py,sha256=wzgprwQ3hcsc9itHG0DkcXyNnvVVd-s1UpNyZxw49Sw,590
+judgeval/scorers/judgeval_scorers/api_scorers/tool_order.py,sha256=462fR2m-67FR2TdHu6cCNZLRkIT_yTAOrMeb-1AuQe8,576
+judgeval/scorers/judgeval_scorers/classifiers/__init__.py,sha256=Qt81W5ZCwMvBAne0LfQDb8xvg5iOG1vEYP7WizgwAZo,67
+judgeval/scorers/judgeval_scorers/classifiers/text2sql/__init__.py,sha256=8iTzMvou1Dr8pybul6lZHKjc9Ye2-0_racRGYkhEdTY,74
+judgeval/scorers/judgeval_scorers/classifiers/text2sql/text2sql_scorer.py,sha256=gloLzThkFsr8sHQargDAH8XaDrlF6OCuc_69hyNslFU,2589
+judgeval/tracer/__init__.py,sha256=wkuXtOGDCrwgPPXlh_sSJmvGuWaAMHyNzk1TzB5f9aI,148
+judgeval/utils/alerts.py,sha256=3w_AjQrgfmOZvfqCridW8WAnHVxHHXokX9jNzVFyGjA,3297
+judgeval/utils/file_utils.py,sha256=M6a_BPRGMwEFBPdF_Tbcbbk4YldHcOhuoU9oRlmninE,1858
+judgeval/utils/requests.py,sha256=rbmZTaiyWI8t2YUkhk11SIe3dF7j2j25L1BuFp_1PII,770
+judgeval-0.0.46.dist-info/METADATA,sha256=VZl8DWjZYO8FEejrrk9wSY-k0BbO4AyCgFHJCq5VC3M,54676
+judgeval-0.0.46.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+judgeval-0.0.46.dist-info/licenses/LICENSE.md,sha256=tKmCg7k5QOmxPK19XMfzim04QiQJPmgIm0pAn55IJwk,11352
+judgeval-0.0.46.dist-info/RECORD,,

judgeval-0.0.44.dist-info/RECORD DELETED Viewed

@@ -1,68 +0,0 @@
-judgeval/__init__.py,sha256=x9HWt4waJwJMAqTuJSg2MezF9Zg-macEjeU-ajbly-8,330
-judgeval/clients.py,sha256=EiTmvvWksTPyWIuMC9jz06SPY2vFzokIJUIGoScpisA,989
-judgeval/constants.py,sha256=MmkgNXdwQOyYSVJc_I8EjX12OWZdFEzjaqXduRowuU4,6033
-judgeval/evaluation_run.py,sha256=KNGtaGAwD18pDNOKF7PCMlLnQe9SpRLTs0XWFMrCiLc,6684
-judgeval/judgment_client.py,sha256=JO3AkU-disPHQVK5g1SM-bs_EUSy8QZ3AaAj_Q2ag6s,24968
-judgeval/rules.py,sha256=LLojqmiKzQ90jAczccfaOoc3b9LBJCWX0hZ7p439no8,21110
-judgeval/run_evaluation.py,sha256=JI-BCyEVKW61JJ4qxFMk1ww4tams-1g_0aaCE4cHrU8,50252
-judgeval/version_check.py,sha256=bvJEidB7rAeXozoUbN9Yb97QOR_s2hgvpvj74jJ5HlY,943
-judgeval/common/__init__.py,sha256=7d24BRxtncpMj3AAJCj8RS7TqgjXmW777HVZH6-3sBs,289
-judgeval/common/exceptions.py,sha256=U-TxHLn7oVMezsMuoYouNDb2XuS8RCggfntYf5_6u4E,565
-judgeval/common/logger.py,sha256=KO75wWXCxhUHUMvLaTU31ZzOk6tkZBa7heQ7y0f-zFE,6062
-judgeval/common/s3_storage.py,sha256=UZZzQ8CP9_42SKDoKpPncJx8CL5Dchh4jFlKxDKi-cs,3938
-judgeval/common/tracer.py,sha256=I8qR6YYcjHDS5BVp9rEfGi_EOMnmcSVYk4ykHwuTBuA,127885
-judgeval/common/utils.py,sha256=l2nvm3-LeeScZ02H9TB2AcJh1gJSK1lNdi1Tu0p_fNQ,34276
-judgeval/data/__init__.py,sha256=GX_GloDtBB35mv3INWbSTP2r9cwCU2IeIYjzRT0SAd8,530
-judgeval/data/custom_example.py,sha256=QRBqiRiZS8UgVeTRHY0r1Jzm6yAYsyg6zmHxQGxdiQs,739
-judgeval/data/example.py,sha256=jcK78ff-TKNl9Qtxvbd1g61crpo-s4fWHaqyMIbQNq0,6877
-judgeval/data/result.py,sha256=KfU9lhAKG_Xo2eGDm2uKVVRZpf177IDASg1cIwedJwE,3184
-judgeval/data/scorer_data.py,sha256=JVlaTx1EP2jw2gh3Vgx1CSEsvIFABAN26IquKyxwiJQ,3273
-judgeval/data/tool.py,sha256=eEEvGDNNYWhcQiI6cjDv3rO1VoOJJS5LWGS76Gb_gtY,1813
-judgeval/data/trace.py,sha256=5HSJbCMvNTF4O8D_364dGv2cs-0oa4rCQcYR_hS5FG4,4881
-judgeval/data/trace_run.py,sha256=fiB5Z5il9U9XqvksdA2DbLNd96U_Wrz8K00RuFJBy38,2324
-judgeval/data/datasets/__init__.py,sha256=IdNKhQv9yYZ_op0rdBacrFaFVmiiYQ3JTzXzxOTsEVQ,176
-judgeval/data/datasets/dataset.py,sha256=pq9-A1mg2Brpjg1TufDU_eLo9sQhX0nw-UTGaf3jCXA,12952
-judgeval/data/datasets/eval_dataset_client.py,sha256=LJ1bf1sZAC4ZBCRTQ1Y4VrJuNSslYBQ1y9YKuhYxwqY,15176
-judgeval/integrations/langgraph.py,sha256=Ogk3MFE116WfRV4w_2c6mp3d27Uea7vmLstltML8VBM,31963
-judgeval/judges/__init__.py,sha256=6X7VSwrwsdxGBNxCyapVRWGghhKOy3MVxFNMQ62kCXM,308
-judgeval/judges/base_judge.py,sha256=ch_S7uBB7lyv44Lf1d7mIGFpveOO58zOkkpImKgd9_4,994
-judgeval/judges/litellm_judge.py,sha256=DhB6px9ELZL3gbMb2w4FkBliuTlaCVIcjE8v149G6NM,2425
-judgeval/judges/mixture_of_judges.py,sha256=D97h8L-6saPwwppVwitrIdlMAjizzxGWeVOfNyVnXZA,15550
-judgeval/judges/together_judge.py,sha256=l00hhPerAZXg3oYBd8cyMtWsOTNt_0FIqoxhKJKQe3k,2302
-judgeval/judges/utils.py,sha256=vL-15_udU94JHUAiyrAvHAKMj6Fqypg01ek4YH5zVCM,2687
-judgeval/scorers/__init__.py,sha256=VKPveyGCv5Rc0YtuT7iAxSv-M5EuikqAVeaGNnYMuWE,1340
-judgeval/scorers/api_scorer.py,sha256=NQ_CrrUPhSUk1k2Q8rKpCG_TU2FT32sFEqvb-Yi54B0,2688
-judgeval/scorers/exceptions.py,sha256=eGW5CuJgZ5YJBFrE4FHDSF651PO1dKAZ379mJ8gOsfo,178
-judgeval/scorers/judgeval_scorer.py,sha256=_qtXzl5aa1FH_50kVPnRfiwyCtuXPKyrGU71_3pOrBw,7288
-judgeval/scorers/prompt_scorer.py,sha256=Uf_QZhytd78cInKZv8wr66Angz5sxLklP5hEEcoabq4,12001
-judgeval/scorers/score.py,sha256=h4eVlbItqG8R0nQgSgeyicYSIraZV9MvV-RRaFu46mg,18762
-judgeval/scorers/utils.py,sha256=iHQVTlIANbmCTXz9kTeSdOytgUZ_T74Re61ajqsk_WQ,6827
-judgeval/scorers/judgeval_scorers/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-judgeval/scorers/judgeval_scorers/api_scorers/__init__.py,sha256=knJr1fMqdisS2dt1caMyiMmVkP9QMZBTBTRgjoIRKdQ,2112
-judgeval/scorers/judgeval_scorers/api_scorers/answer_correctness.py,sha256=Fnd9CVIOZ73sWEWymsU5eBrrZqPFjMZ0BKpeW-PDyTg,711
-judgeval/scorers/judgeval_scorers/api_scorers/answer_relevancy.py,sha256=oETeN9K0HSIRdL2SDqn82Vskpwh5SlKnZvs5VDm2OBU,658
-judgeval/scorers/judgeval_scorers/api_scorers/classifier_scorer.py,sha256=s5DKbvLgWN5kV00isu56A5U4R7w1ahlGVN1yxscqHHc,4515
-judgeval/scorers/judgeval_scorers/api_scorers/comparison.py,sha256=kuzf9OWvpY38yYSwlBgneLkUZwJNM4FQqvbS66keA90,1249
-judgeval/scorers/judgeval_scorers/api_scorers/contextual_precision.py,sha256=tpSuzFAaW8X9xqA0aLLKwh7qmBK0Pc_bJZMIe_q412U,770
-judgeval/scorers/judgeval_scorers/api_scorers/contextual_recall.py,sha256=pFVhk4pLtQ-FnNlbI-dFF-SIh69Jza7erHqiPkFWoBo,758
-judgeval/scorers/judgeval_scorers/api_scorers/contextual_relevancy.py,sha256=RQ6DZwEhChfecd89Ey-T7ke--7qTaXZlRsNxwH8gaME,823
-judgeval/scorers/judgeval_scorers/api_scorers/derailment_scorer.py,sha256=V9WPuwNMm097V7IknKs8UkmAk0yjnBXTcJha_BHXxTA,475
-judgeval/scorers/judgeval_scorers/api_scorers/execution_order.py,sha256=Pb3CiNF2Ca826B92wJCVAi_68lJjLhqqCKwQKaflSUg,1294
-judgeval/scorers/judgeval_scorers/api_scorers/faithfulness.py,sha256=-BwOapqjryYNKNydtdkUiKIij76dY0O1jBmdc6dKazQ,692
-judgeval/scorers/judgeval_scorers/api_scorers/groundedness.py,sha256=ntEEeTANEOsGlcbiTAF_3r6BeSJEaVDns8po8T0L6Vg,692
-judgeval/scorers/judgeval_scorers/api_scorers/hallucination.py,sha256=k5gDOki-8KXrZXydvdSqDt3NZqQ28hXoOCHQf6jNxr4,686
-judgeval/scorers/judgeval_scorers/api_scorers/instruction_adherence.py,sha256=XnSGEkQfwVqaqnHEGMCsxNiHVzrsrej48uDbLoWc8CQ,678
-judgeval/scorers/judgeval_scorers/api_scorers/json_correctness.py,sha256=mMKEuR87_yanEuZJ5YSGFMHDD_oLVZ6-rQuciFaDOMA,1095
-judgeval/scorers/judgeval_scorers/api_scorers/summarization.py,sha256=QmWB8bVbDYHY5FcF0rYZE_3c2XXgMLRmR6aXJWfdMC4,655
-judgeval/scorers/judgeval_scorers/api_scorers/tool_dependency.py,sha256=xHt4NsPCOyQkI5mUnN35D-vBLLFu6ZCMaiIVc4RTlj8,620
-judgeval/scorers/judgeval_scorers/api_scorers/tool_order.py,sha256=urm8LgkeZA7e-ePWo6AToKGheQYSp6MOpKon5NF5EJw,570
-judgeval/scorers/judgeval_scorers/classifiers/__init__.py,sha256=Qt81W5ZCwMvBAne0LfQDb8xvg5iOG1vEYP7WizgwAZo,67
-judgeval/scorers/judgeval_scorers/classifiers/text2sql/__init__.py,sha256=8iTzMvou1Dr8pybul6lZHKjc9Ye2-0_racRGYkhEdTY,74
-judgeval/scorers/judgeval_scorers/classifiers/text2sql/text2sql_scorer.py,sha256=O9xq2Cxcg16pFNZwHTb_MDJ5ehFab6oDiiNtC47AnY4,2584
-judgeval/tracer/__init__.py,sha256=wy3DYpH8U_z0GO_K_gOSkK0tTTD-u5eLDo0T5xIBoAc,147
-judgeval/utils/alerts.py,sha256=7HO42fEskQpwocUU-lq6EX4LGPzpxbIhaiJ5pkH31-I,3278
-judgeval/utils/data_utils.py,sha256=pB4GBWi8XoM2zSR2NlLXH5kqcQ029BVhDxaVKkdmiBY,1860
-judgeval-0.0.44.dist-info/METADATA,sha256=qDopKywsOERUmD2Rjy8lxSEU1C9xrRhRfiTIwN5Vi40,55748
-judgeval-0.0.44.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-judgeval-0.0.44.dist-info/licenses/LICENSE.md,sha256=tKmCg7k5QOmxPK19XMfzim04QiQJPmgIm0pAn55IJwk,11352
-judgeval-0.0.44.dist-info/RECORD,,

{judgeval-0.0.44.dist-info → judgeval-0.0.46.dist-info}/WHEEL RENAMED Viewed

File without changes

{judgeval-0.0.44.dist-info → judgeval-0.0.46.dist-info}/licenses/LICENSE.md RENAMED Viewed

File without changes

judgeval 0.0.44__py3-none-any.whl → 0.0.46__py3-none-any.whl

judgeval 0.0.44py3-none-any.whl → 0.0.46py3-none-any.whl