PyPI - judgeval - Versions diffs - 0.0.1__tar.gz → 0.0.2__tar.gz - Mend

{judgeval-0.0.1 → judgeval-0.0.2}/PKG-INFO +2 -8

judgeval-0.0.2/README.md +3 -0

{judgeval-0.0.1 → judgeval-0.0.2}/pyproject.toml +1 -1

judgeval-0.0.1/README.md +0 -9

{judgeval-0.0.1 → judgeval-0.0.2}/.github/workflows/ci.yaml +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/.gitignore +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/LICENSE.md +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/Pipfile +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/README.md +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/development.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/essentials/code.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/essentials/images.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/essentials/markdown.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/essentials/navigation.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/essentials/reusable-snippets.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/essentials/settings.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/data_datasets.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/data_examples.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/introduction.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/judges.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/answer_relevancy.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/classifier_scorer.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/contextual_precision.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/contextual_recall.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/contextual_relevancy.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/custom_scorers.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/faithfulness.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/hallucination.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/introduction.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/json_correctness.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/summarization.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/evaluation/scorers/tool_correctness.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/favicon.svg +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/getting_started.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/images/checks-passed.png +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/images/create_aggressive_scorer.png +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/images/create_scorer.png +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/images/evaluation_diagram.png +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/images/hero-dark.svg +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/images/hero-light.svg +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/introduction.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/judgment/introduction.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/logo/dark.svg +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/logo/light.svg +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/mint.json +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/notebooks/create_dataset.ipynb +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/notebooks/create_scorer.ipynb +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/notebooks/demo.ipynb +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/notebooks/prompt_scorer.ipynb +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/notebooks/quickstart.ipynb +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/quickstart.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/docs/snippets/snippet-intro.mdx +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/e2etests/judgment_client_test.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/e2etests/playground.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/e2etests/test_prompt_scoring.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/e2etests/test_tracer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/pytest.ini +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/__init__.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/clients.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/common/__init__.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/common/exceptions.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/common/logger.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/common/tracer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/common/utils.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/constants.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/__init__.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/api_example.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/datasets/__init__.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/datasets/dataset.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/datasets/ground_truth.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/datasets/utils.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/example.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/result.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/data/scorer_data.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/evaluation_run.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/judges/__init__.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/judges/base_judge.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/judges/litellm_judge.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/judges/mixture_of_judges.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/judges/together_judge.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/judges/utils.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/judgment_client.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/run_evaluation.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/__init__.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/base_scorer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/custom_scorer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/__init__.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/answer_relevancy.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/contextual_precision.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/contextual_recall.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/contextual_relevancy.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/faithfulness.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/hallucination.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/json_correctness.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/summarization.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/judgeval_scorers/tool_correctness.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/prompt_scorer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/score.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/src/judgeval/scorers/utils.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/common/test_exceptions.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/common/test_logger.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/common/test_tracer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/common/test_utils.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/datasets/sample_data/dataset.csv +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/datasets/sample_data/dataset.json +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/datasets/test_dataset.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/datasets/test_dataset_utils.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/datasets/test_ground_truth.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/test_api_example.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/test_example.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/test_result.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/data/test_scorer_data.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/judges/test_judge_utils.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/judges/test_litellm_judge.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/judges/test_mixture_of_judges.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/judges/test_together_judge.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_answer_relevancy.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_contextual_precision.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_contextual_recall.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_contextual_relevancy.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_faithfulness.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_hallucination.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_json_correctness.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_summarization.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/judgeval_scorers/test_tool_correctness.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/test_base_scorer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/test_custom_scorer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/test_prompt_scorer.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/test_score.py +0 -0

{judgeval-0.0.1 → judgeval-0.0.2}/tests/scorers/test_scorer_utils.py +0 -0

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: judgeval
-Version: 0.0.1
+Version: 0.0.2
 Summary: Judgeval Package
 Project-URL: Homepage, https://github.com/JudgmentLabs/judgeval
 Project-URL: Issues, https://github.com/JudgmentLabs/judgeval/issues
@@ -31,10 +31,4 @@ Description-Content-Type: text/markdown
 # judgeval
-TODOS
-1. public interface for Example and Measurement objects
-2. call to backend
-3. datasets and logging
-4. exporting to platform
+Judgeval is a open-source evaluation framework for multi-agent LLM workflows, for both real-time and offline evaluations.

@@ -1,6 +1,6 @@
 [project]
 name = "judgeval"
-version = "0.0.1"
+version = "0.0.2"
 authors = [
     { name="Andrew Li", email="andrew@judgmentlabs.ai" },
     { name="Alex Shan", email="alex@judgmentlabs.ai" },

@@ -1,9 +0,0 @@
-# judgeval
-TODOS
-1. public interface for Example and Measurement objects
-2. call to backend
-3. datasets and logging
-4. exporting to platform

judgeval 0.0.1__tar.gz → 0.0.2__tar.gz

judgeval 0.0.1tar.gz → 0.0.2tar.gz