PyPI - evalvault - Versions diffs - 1.70.1__py3-none-any.whl → 1.72.0__py3-none-any.whl - Mend

evalvault 1.70.1py3-none-any.whl → 1.72.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (47) hide show

evalvault/adapters/inbound/api/adapter.py +367 -3
evalvault/adapters/inbound/api/main.py +17 -1
evalvault/adapters/inbound/api/routers/calibration.py +133 -0
evalvault/adapters/inbound/api/routers/runs.py +71 -1
evalvault/adapters/inbound/cli/commands/__init__.py +2 -0
evalvault/adapters/inbound/cli/commands/analyze.py +1 -0
evalvault/adapters/inbound/cli/commands/compare.py +1 -1
evalvault/adapters/inbound/cli/commands/experiment.py +27 -1
evalvault/adapters/inbound/cli/commands/graph_rag.py +303 -0
evalvault/adapters/inbound/cli/commands/history.py +1 -1
evalvault/adapters/inbound/cli/commands/regress.py +169 -1
evalvault/adapters/inbound/cli/commands/run.py +225 -1
evalvault/adapters/inbound/cli/commands/run_helpers.py +57 -0
evalvault/adapters/outbound/analysis/network_analyzer_module.py +17 -4
evalvault/adapters/outbound/dataset/__init__.py +6 -0
evalvault/adapters/outbound/dataset/multiturn_json_loader.py +111 -0
evalvault/adapters/outbound/report/__init__.py +6 -0
evalvault/adapters/outbound/report/ci_report_formatter.py +43 -0
evalvault/adapters/outbound/report/dashboard_generator.py +24 -9
evalvault/adapters/outbound/report/pr_comment_formatter.py +50 -0
evalvault/adapters/outbound/retriever/__init__.py +8 -0
evalvault/adapters/outbound/retriever/graph_rag_adapter.py +326 -0
evalvault/adapters/outbound/storage/base_sql.py +291 -0
evalvault/adapters/outbound/storage/postgres_adapter.py +130 -0
evalvault/adapters/outbound/storage/postgres_schema.sql +60 -0
evalvault/adapters/outbound/storage/schema.sql +63 -0
evalvault/adapters/outbound/storage/sqlite_adapter.py +107 -0
evalvault/domain/entities/__init__.py +20 -0
evalvault/domain/entities/graph_rag.py +30 -0
evalvault/domain/entities/multiturn.py +78 -0
evalvault/domain/metrics/__init__.py +10 -0
evalvault/domain/metrics/multiturn_metrics.py +113 -0
evalvault/domain/metrics/registry.py +36 -0
evalvault/domain/services/__init__.py +8 -0
evalvault/domain/services/evaluator.py +5 -2
evalvault/domain/services/graph_rag_experiment.py +155 -0
evalvault/domain/services/multiturn_evaluator.py +187 -0
evalvault/ports/inbound/__init__.py +2 -0
evalvault/ports/inbound/multiturn_port.py +23 -0
evalvault/ports/inbound/web_port.py +4 -0
evalvault/ports/outbound/graph_retriever_port.py +24 -0
evalvault/ports/outbound/storage_port.py +25 -0
{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/METADATA +1 -1
{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/RECORD +47 -33
{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/WHEEL +0 -0
{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/entry_points.txt +0 -0
{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/licenses/LICENSE.md +0 -0

evalvault/domain/services/multiturn_evaluator.py ADDED Viewed

@@ -0,0 +1,187 @@
+from __future__ import annotations
+import asyncio
+from dataclasses import dataclass
+from evalvault.domain.entities.dataset import Dataset, TestCase
+from evalvault.domain.entities.multiturn import (
+    ConversationTurn,
+    DriftAnalysis,
+    MultiTurnEvaluationResult,
+    MultiTurnTestCase,
+    MultiTurnTurnResult,
+)
+from evalvault.domain.metrics.multiturn_metrics import (
+    calculate_context_coherence,
+    calculate_drift_rate,
+    calculate_turn_faithfulness,
+    calculate_turn_latency_p95,
+)
+from evalvault.domain.services.evaluator import RagasEvaluator
+from evalvault.ports.inbound.multiturn_port import MultiTurnEvaluatorPort
+from evalvault.ports.outbound.llm_port import LLMPort
+@dataclass(frozen=True)
+class _TurnMapping:
+    test_case_id: str
+    turn: ConversationTurn
+    turn_index: int
+class MultiTurnEvaluator(MultiTurnEvaluatorPort):
+    MULTITURN_METRICS = {"turn_faithfulness", "context_coherence", "drift_rate", "turn_latency"}
+    def __init__(
+        self, *, evaluator: RagasEvaluator | None = None, llm: LLMPort | None = None
+    ) -> None:
+        self._evaluator = evaluator
+        self._llm = llm
+    def evaluate_conversation(
+        self,
+        conversation: MultiTurnTestCase,
+        metrics: list[str],
+    ) -> MultiTurnEvaluationResult:
+        dataset, mappings = self._build_turn_dataset(conversation)
+        base_metrics = [metric for metric in metrics if self._is_base_metric(metric)]
+        if "turn_faithfulness" in metrics and "faithfulness" not in base_metrics:
+            base_metrics.append("faithfulness")
+        turn_results: list[MultiTurnTurnResult] = []
+        scores_by_case: dict[str, dict[str, float]] = {}
+        metadata_by_case: dict[str, dict[str, object]] = {
+            mapping.test_case_id: {
+                "conversation_id": conversation.conversation_id,
+                "turn_index": mapping.turn_index,
+                "turn_id": mapping.turn.turn_id,
+                "role": mapping.turn.role,
+            }
+            for mapping in mappings
+        }
+        if base_metrics:
+            if not self._evaluator or not self._llm:
+                raise ValueError("MultiTurnEvaluator requires evaluator and llm for base metrics")
+            evaluation = self._run_base_metrics(dataset, base_metrics)
+            scores_by_case = {
+                result.test_case_id: {metric.name: metric.score for metric in result.metrics}
+                for result in evaluation.results
+            }
+            for result in evaluation.results:
+                mapping = next((m for m in mappings if m.test_case_id == result.test_case_id), None)
+                if not mapping:
+                    continue
+                turn_results.append(
+                    MultiTurnTurnResult(
+                        conversation_id=conversation.conversation_id,
+                        turn_id=mapping.turn.turn_id,
+                        turn_index=mapping.turn_index,
+                        role=mapping.turn.role,
+                        metrics=scores_by_case.get(result.test_case_id, {}),
+                        passed=result.all_passed,
+                        latency_ms=result.latency_ms,
+                        metadata=dict(metadata_by_case.get(result.test_case_id, {})),
+                    )
+                )
+        else:
+            for mapping in mappings:
+                turn_results.append(
+                    MultiTurnTurnResult(
+                        conversation_id=conversation.conversation_id,
+                        turn_id=mapping.turn.turn_id,
+                        turn_index=mapping.turn_index,
+                        role=mapping.turn.role,
+                        metrics={},
+                        passed=False,
+                        latency_ms=None,
+                        metadata=dict(metadata_by_case.get(mapping.test_case_id, {})),
+                    )
+                )
+        summary: dict[str, object] = {}
+        if "turn_faithfulness" in metrics:
+            summary["turn_faithfulness"] = calculate_turn_faithfulness(turn_results)
+        if "context_coherence" in metrics:
+            summary["context_coherence"] = calculate_context_coherence(conversation.turns)
+        if "drift_rate" in metrics:
+            summary["drift_rate"] = calculate_drift_rate(conversation.turns)
+        if "turn_latency" in metrics:
+            summary["turn_latency"] = calculate_turn_latency_p95(
+                [result.latency_ms for result in turn_results]
+            )
+        summary["turn_count"] = len(turn_results)
+        summary["conversation_id"] = conversation.conversation_id
+        return MultiTurnEvaluationResult(
+            conversation_id=conversation.conversation_id,
+            turn_results=turn_results,
+            summary=summary,
+        )
+    def detect_drift(
+        self,
+        conversation: MultiTurnTestCase,
+        threshold: float = 0.1,
+    ) -> DriftAnalysis:
+        drift_score = calculate_drift_rate(conversation.turns)
+        return DriftAnalysis(
+            conversation_id=conversation.conversation_id,
+            drift_score=drift_score,
+            drift_threshold=threshold,
+            drift_detected=drift_score >= threshold,
+            notes=[],
+        )
+    def _run_base_metrics(self, dataset: Dataset, metrics: list[str]):
+        return asyncio.run(
+            self._evaluator.evaluate(
+                dataset=dataset,
+                metrics=metrics,
+                llm=self._llm,
+            )
+        )
+    def _is_base_metric(self, metric: str) -> bool:
+        if metric in self.MULTITURN_METRICS:
+            return False
+        if metric in RagasEvaluator.METRIC_MAP:
+            return True
+        return metric in RagasEvaluator.CUSTOM_METRIC_MAP
+    @staticmethod
+    def _build_turn_dataset(conversation: MultiTurnTestCase) -> tuple[Dataset, list[_TurnMapping]]:
+        test_cases: list[TestCase] = []
+        mappings: list[_TurnMapping] = []
+        last_user_content: str | None = None
+        for index, turn in enumerate(conversation.turns, start=1):
+            if turn.role == "user":
+                last_user_content = turn.content
+                continue
+            question = last_user_content or ""
+            test_case_id = f"{conversation.conversation_id}:{index}:{turn.turn_id}"
+            test_case = TestCase(
+                id=test_case_id,
+                question=question,
+                answer=turn.content,
+                contexts=turn.contexts or [],
+                ground_truth=turn.ground_truth,
+                metadata={
+                    "conversation_id": conversation.conversation_id,
+                    "turn_index": index,
+                    "turn_id": turn.turn_id,
+                    "role": turn.role,
+                },
+            )
+            test_cases.append(test_case)
+            mappings.append(_TurnMapping(test_case_id=test_case_id, turn=turn, turn_index=index))
+        dataset = Dataset(
+            name=f"multiturn:{conversation.conversation_id}",
+            version="1.0.0",
+            test_cases=test_cases,
+            metadata={"conversation_id": conversation.conversation_id},
+        )
+        return dataset, mappings

evalvault/ports/inbound/__init__.py CHANGED Viewed

@@ -3,6 +3,7 @@
 from evalvault.ports.inbound.analysis_pipeline_port import AnalysisPipelinePort
 from evalvault.ports.inbound.evaluator_port import EvaluatorPort
 from evalvault.ports.inbound.learning_hook_port import DomainLearningHookPort
+from evalvault.ports.inbound.multiturn_port import MultiTurnEvaluatorPort
 from evalvault.ports.inbound.web_port import (
     EvalProgress,
     EvalRequest,
@@ -15,6 +16,7 @@ __all__ = [
     "EvaluatorPort",
     "DomainLearningHookPort",
     "AnalysisPipelinePort",
+    "MultiTurnEvaluatorPort",
     "WebUIPort",
     "EvalRequest",
     "EvalProgress",

evalvault/ports/inbound/multiturn_port.py ADDED Viewed

@@ -0,0 +1,23 @@
+from __future__ import annotations
+from typing import Protocol
+from evalvault.domain.entities.multiturn import (
+    DriftAnalysis,
+    MultiTurnEvaluationResult,
+    MultiTurnTestCase,
+)
+class MultiTurnEvaluatorPort(Protocol):
+    def evaluate_conversation(
+        self,
+        conversation: MultiTurnTestCase,
+        metrics: list[str],
+    ) -> MultiTurnEvaluationResult: ...
+    def detect_drift(
+        self,
+        conversation: MultiTurnTestCase,
+        threshold: float = 0.1,
+    ) -> DriftAnalysis: ...

evalvault/ports/inbound/web_port.py CHANGED Viewed

@@ -166,6 +166,8 @@ class WebUIPort(Protocol):
         *,
         include_nlp: bool = True,
         include_causal: bool = True,
+        use_cache: bool = True,
+        save: bool = False,
     ) -> str:
         """보고서 생성.
@@ -174,6 +176,8 @@ class WebUIPort(Protocol):
             output_format: 출력 포맷 (markdown, html)
             include_nlp: NLP 분석 포함 여부
             include_causal: 인과 분석 포함 여부
+            use_cache: 캐시된 보고서 사용 여부
+            save: DB 저장 여부
         Returns:
             생성된 보고서 문자열

evalvault/ports/outbound/graph_retriever_port.py ADDED Viewed

@@ -0,0 +1,24 @@
+from __future__ import annotations
+from typing import Protocol
+from evalvault.domain.entities.graph_rag import EntityNode, KnowledgeSubgraph
+class GraphRetrieverPort(Protocol):
+    def extract_entities(self, text: str) -> list[EntityNode]:
+        """텍스트에서 엔티티 추출"""
+    def build_subgraph(
+        self,
+        query: str,
+        max_hops: int = 2,
+        max_nodes: int = 20,
+    ) -> KnowledgeSubgraph:
+        """질의 관련 서브그래프 구축"""
+    def generate_context(
+        self,
+        subgraph: KnowledgeSubgraph,
+    ) -> str:
+        """서브그래프를 LLM 컨텍스트로 변환"""

evalvault/ports/outbound/storage_port.py CHANGED Viewed

@@ -6,6 +6,9 @@ from typing import Any, Protocol
 from evalvault.domain.entities import (
     EvaluationRun,
     FeedbackSummary,
+    MultiTurnConversationRecord,
+    MultiTurnRunRecord,
+    MultiTurnTurnResult,
     PromptSetBundle,
     RunClusterMap,
     RunClusterMapInfo,
@@ -32,12 +35,25 @@ class StoragePort(Protocol):
         """
         ...
+    def save_multiturn_run(
+        self,
+        run: MultiTurnRunRecord,
+        conversations: list[MultiTurnConversationRecord],
+        turn_results: list[MultiTurnTurnResult],
+        *,
+        metric_thresholds: dict[str, float] | None = None,
+    ) -> str:
+        """멀티턴 평가 실행 결과를 저장합니다."""
+        ...
     def save_prompt_set(self, bundle: PromptSetBundle) -> None:
         """Persist prompt set and prompt items."""
         ...
     def export_run_to_excel(self, run_id: str, output_path: str | Path) -> Path: ...
+    def export_multiturn_run_to_excel(self, run_id: str, output_path: str | Path) -> Path: ...
     def link_prompt_set_to_run(self, run_id: str, prompt_set_id: str) -> None:
         """Attach a prompt set to an evaluation run."""
         ...
@@ -204,6 +220,15 @@ class StoragePort(Protocol):
         created_at: str | None = None,
     ) -> str: ...
+    def list_analysis_reports(
+        self,
+        *,
+        run_id: str,
+        report_type: str | None = None,
+        format: str | None = None,
+        limit: int = 20,
+    ) -> list[dict[str, Any]]: ...
     def list_pipeline_results(self, limit: int = 50) -> list[dict[str, Any]]:
         """파이프라인 분석 결과 목록을 조회합니다."""
         ...

{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: evalvault
-Version: 1.70.1
+Version: 1.72.0
 Summary: RAG evaluation system using Ragas with Phoenix/Langfuse tracing
 Project-URL: Homepage, https://github.com/ntts9990/EvalVault
 Project-URL: Documentation, https://github.com/ntts9990/EvalVault#readme

{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/RECORD RENAMED Viewed

@@ -5,35 +5,37 @@ evalvault/mkdocs_helpers.py,sha256=1AKVQ1W2_VO4qclhfyefyU9Dz1Hzkh1DWDwsFMe24jc,3
 evalvault/adapters/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 evalvault/adapters/inbound/__init__.py,sha256=SG1svel1PwqetnqVpKFLSv612_WwGwLTbFpYgwk6FMw,166
 evalvault/adapters/inbound/api/__init__.py,sha256=LeVVttCA3tLKoHA2PO4z3y8VkfVcf3Bq8CZSzo91lf4,34
-evalvault/adapters/inbound/api/adapter.py,sha256=HgWSYyUxvJPlaSG158WVzpPckpPCYV9Ec3CWN8rLFdI,69118
-evalvault/adapters/inbound/api/main.py,sha256=RPcstctf_mFH9TPUhld6plA0104Kb6Iccb6Cu26oFR8,7271
+evalvault/adapters/inbound/api/adapter.py,sha256=Igg2grCUxQzMuvDOAhBK08wY0nxjmnvnaGS5rLVF3i4,83388
+evalvault/adapters/inbound/api/main.py,sha256=QgLxzHEy7aycGKIFLtN12tWTjnpWLtQ2XDXKV_2FDvg,7531
 evalvault/adapters/inbound/api/routers/__init__.py,sha256=q07_YF9TnBl68bqcRCvhPU4-zRTyvmPoHVehwO6W7QM,19
 evalvault/adapters/inbound/api/routers/benchmark.py,sha256=yevntbZcNtMvbVODsITUBgR1Ka4pdFQrXBJJ4K4Jyr4,4477
+evalvault/adapters/inbound/api/routers/calibration.py,sha256=ZnJSEW8hV-94S95lU_nDmzcLyaUoH1suM3sFUpJ3w5k,4130
 evalvault/adapters/inbound/api/routers/chat.py,sha256=hCA6rWr5GT_gCqu75uCqYwy2gOEUd85mlcc5y-ruFTY,20661
 evalvault/adapters/inbound/api/routers/config.py,sha256=LygN0fVMr8NFtj5zuQXnVFhoafx56Txa98vpwtPa4Jc,4104
 evalvault/adapters/inbound/api/routers/domain.py,sha256=RsR7GIFMjccDN7vpG1uDyk9n1DnCTH18JDGAX7o4Qqc,3648
 evalvault/adapters/inbound/api/routers/knowledge.py,sha256=yb_e7OEPtwldOAzHTGiWe7jShHw2JdpOFnzGPMceRsg,7109
 evalvault/adapters/inbound/api/routers/mcp.py,sha256=yHANV7qIXig-7YSiQgXzSTuabqFStH5yT3URyQGY2W4,4764
 evalvault/adapters/inbound/api/routers/pipeline.py,sha256=8UgQzNFHcuqS61s69mOrPee4OMwfxVdvRWHJ2_qYBF0,17175
-evalvault/adapters/inbound/api/routers/runs.py,sha256=rydOvwWk24QIYafu3XYS3oL_VVCE_jHDmjADhA19T1s,40059
+evalvault/adapters/inbound/api/routers/runs.py,sha256=eIJ4xkFu-Bn2gRUVBajWZBi-QD2Spl6_wDuaRMeEI84,42744
 evalvault/adapters/inbound/cli/__init__.py,sha256=a42flC5NK-VfbdbBrE49IrUL5zAyKdXZYJVM6E3NTE0,675
 evalvault/adapters/inbound/cli/app.py,sha256=ytNgHRg9ZTAl33AkB1wIL8RKfQ_Cf8fsy0gSsLTs7Ew,1603
-evalvault/adapters/inbound/cli/commands/__init__.py,sha256=kw0SAEwOce1v92Pd6YpQjSYsdwLU95TQqbKGM44fNhY,3995
+evalvault/adapters/inbound/cli/commands/__init__.py,sha256=TB3evGuv3_AQoudWiR2bH5EH_AY9f9E7lQcSOWH6TO8,4091
 evalvault/adapters/inbound/cli/commands/agent.py,sha256=YlOYMEzzS1aSKDKD_a7UK3St18X6GXGkdTatrzyd8Zc,7555
-evalvault/adapters/inbound/cli/commands/analyze.py,sha256=aMi1BEDOX3yhN-ppBftDssPQLB5TdzIfpx9U7CZEgWo,48932
+evalvault/adapters/inbound/cli/commands/analyze.py,sha256=sffmFRbHyxBd0yy10OwxkBSfzIIEhcshW6TOydQcmY0,48974
 evalvault/adapters/inbound/cli/commands/api.py,sha256=YdbJ_-QEajnFcjTa7P2heLMjFKpeQ4nWP_p-HvfYkEo,1943
 evalvault/adapters/inbound/cli/commands/artifacts.py,sha256=bE8FQxmnU0mMIAPx5en8aKrtfNNkrbWoLxIX4ZT9D5c,3776
 evalvault/adapters/inbound/cli/commands/benchmark.py,sha256=RZ4nRTF7d6hDZug-Pw8dGcFEyWdOKclwqkvS-gN4VWo,41097
 evalvault/adapters/inbound/cli/commands/calibrate.py,sha256=-UnT0LQH40U5lzMLqMJ7DOTLa3mt5P_fJL2XzqIkvu4,4223
 evalvault/adapters/inbound/cli/commands/calibrate_judge.py,sha256=hJBlNl9Rt-ZtoIu-HKfudhZb2j2HOoEnRbiG4n5TOTE,10348
-evalvault/adapters/inbound/cli/commands/compare.py,sha256=X_uyJoT_yQP43RTWMLCwMuHwhOb8wCqFShjy477V-2c,10384
+evalvault/adapters/inbound/cli/commands/compare.py,sha256=qqgBN9noE9kiYJs-EZWiU_yA1mW4mnKFavlFTS63OzU,10385
 evalvault/adapters/inbound/cli/commands/config.py,sha256=Mv9IQHBFHZ3I2stUzHDgLDn-Znt_Awdy3j-sk5ruUmw,6069
 evalvault/adapters/inbound/cli/commands/debug.py,sha256=KU-hL1gLhpjV2ZybDQgGMwRfm-hCynkrqY4UzETfL9k,2234
 evalvault/adapters/inbound/cli/commands/domain.py,sha256=dL9iqBlnr5mDeS1unXW6uxE0qp6yfnxj-ls6k3EenwI,27279
-evalvault/adapters/inbound/cli/commands/experiment.py,sha256=jficaFOsZ9EMHrPHCOZjq6jpFrgmqCwmIo--wA_OcvQ,10389
+evalvault/adapters/inbound/cli/commands/experiment.py,sha256=Jtz-jp7URy8HYWf15pje8Ecrctx_Q5kYw-QccT0vMDA,11400
 evalvault/adapters/inbound/cli/commands/gate.py,sha256=SxBSHALhekw9OVuJcuk64tkS8YMDDsgmhMALTE38wwY,9956
 evalvault/adapters/inbound/cli/commands/generate.py,sha256=7IPvd0WAwPxt9uaxmzqWCwt0b2VC_wXiVxyJ3lP-xys,8562
-evalvault/adapters/inbound/cli/commands/history.py,sha256=3xf1l-I8IW-1Vtne9ypepDMDRRbwOpEvAjh4Qf9tV2w,8420
+evalvault/adapters/inbound/cli/commands/graph_rag.py,sha256=UWaTgWuBE9B6KJJnfN9PBYl6gMOKaa641KjXw8Xwqho,11047
+evalvault/adapters/inbound/cli/commands/history.py,sha256=bo7mtHgSCniI7WfeewKQIJzI_HNUTrDiAkOXLFxabVc,8434
 evalvault/adapters/inbound/cli/commands/init.py,sha256=7q86fUeBVA08fU_N0lAV6Lakxirq4val2jIyALlDy3E,8822
 evalvault/adapters/inbound/cli/commands/kg.py,sha256=ycV9Xj6SUUJLTyTfLZcjXDVLcZqwo7Gw878ZhZAeDoc,19155
 evalvault/adapters/inbound/cli/commands/langfuse.py,sha256=aExhZ5WYT0FzJI4v1sF-a1jqy9b1BF46_HBtfiQjVGI,4085
@@ -43,9 +45,9 @@ evalvault/adapters/inbound/cli/commands/phoenix.py,sha256=LQi3KTLq1ybjjBuz92oQ6l
 evalvault/adapters/inbound/cli/commands/pipeline.py,sha256=NeqWLzO9kRDuZd0pHAIHglP3F7VzoNOU4JI0QcSZ120,7788
 evalvault/adapters/inbound/cli/commands/profile_difficulty.py,sha256=nOJH3iqgLAlXq4keLBj5oqpiRCg0jjGgT-7Q57HxEh8,6665
 evalvault/adapters/inbound/cli/commands/prompts.py,sha256=lddde5VbjYaqN_9gHPLNu6DWpg5fE-KqZzjN-XYwvJw,27153
-evalvault/adapters/inbound/cli/commands/regress.py,sha256=Dy8hUOdjapxOW9Hoov0DHHblkMaExiqWfYS14CaC9Kk,8806
-evalvault/adapters/inbound/cli/commands/run.py,sha256=aKoZcQbOJ1KB_4zPk4L-AWw3u9vGWg3SaooR7A3Xd_Y,119910
-evalvault/adapters/inbound/cli/commands/run_helpers.py,sha256=93jFUg8QLrD38QU2JhOhFMoHDWUphSEKRdJ5KcUvrkQ,40806
+evalvault/adapters/inbound/cli/commands/regress.py,sha256=rugJiX4Qujx9JlAwMUlCIEc2eMa-6mZscmb79pYNWfI,15527
+evalvault/adapters/inbound/cli/commands/run.py,sha256=DMobs36HxZ0AnG3DWYuJuiq9x7M4qQu7GbMz02Yf-rM,130361
+evalvault/adapters/inbound/cli/commands/run_helpers.py,sha256=WCKSaZ2vdBwvYgS0gb3Z_O0eNEAjtWEqH0-8KS1c3gI,43211
 evalvault/adapters/inbound/cli/commands/stage.py,sha256=oRC9c5CysLX90Iy5Ba1pc_00DaOBS78lcBvzkbdrGRM,17123
 evalvault/adapters/inbound/cli/utils/__init__.py,sha256=QPNKneZS-Z-tTnYYxtgJXgcJWY6puUlRQcKrn7Mlv1M,685
 evalvault/adapters/inbound/cli/utils/analysis_io.py,sha256=RHkKEq4e-PtbtRDlXAJWU80RYHNPw-O5V9_GujdaGfc,13393
@@ -87,7 +89,7 @@ evalvault/adapters/outbound/analysis/model_analyzer_module.py,sha256=28rHdXBXYIF
 evalvault/adapters/outbound/analysis/morpheme_analyzer_module.py,sha256=Hrh4mluMsOhQHPrliD2w0FVKokJpfikXOFKT6sNwk74,4158
 evalvault/adapters/outbound/analysis/morpheme_quality_checker_module.py,sha256=_uRKDXdwGbfYduf_3XT77vF8X3-_zW3stHYc3HKYQTE,2216
 evalvault/adapters/outbound/analysis/multiturn_analyzer_module.py,sha256=6R_lcbJyQr5CEEI_zpDJDdw6G4n3ZnkUI0ovfUPGrtU,7557
-evalvault/adapters/outbound/analysis/network_analyzer_module.py,sha256=ITUVnt_CI5pHy5SAESBSi004yMtiAhGFsbhC61VTezk,8475
+evalvault/adapters/outbound/analysis/network_analyzer_module.py,sha256=RTCeIEfEpe5cjhnSJkYMCmQRGxZiw2ZO6sSMFwLXEN4,8961
 evalvault/adapters/outbound/analysis/nlp_adapter.py,sha256=aLtF_fns-7IEtitwON2EYS_lweq_IdldFsRm47alN0Q,29561
 evalvault/adapters/outbound/analysis/nlp_analyzer_module.py,sha256=kVuG9pVMQO6OYY5zxj_w9nNQZ1-qIO0y6XcXo6lG-n0,8221
 evalvault/adapters/outbound/analysis/pattern_detector_module.py,sha256=SyCDO_VS-r-tjGh8WrW-t1GCSC9ouxirdVk4NizFPXo,1882
@@ -118,13 +120,14 @@ evalvault/adapters/outbound/benchmark/lm_eval_adapter.py,sha256=xFj_Cgny3JN_COA1
 evalvault/adapters/outbound/cache/__init__.py,sha256=LcsKzxnx1AnAwS07iSCdws11CfEYuxkUjRkogN0SviI,317
 evalvault/adapters/outbound/cache/hybrid_cache.py,sha256=AVhctQVOIbQWwvn_K0kxSq3lkhucuM7tezmSkPDbCrA,12711
 evalvault/adapters/outbound/cache/memory_cache.py,sha256=jvjIgXp7YRj08_AzBFaJ58jjXNzUlYbG_zX6fQJP4C0,3533
-evalvault/adapters/outbound/dataset/__init__.py,sha256=SDFnjmieEgz0uH5MpdXx8pmjnIMjRLkMFmFioMxCju0,1183
+evalvault/adapters/outbound/dataset/__init__.py,sha256=hijY1l0uPvO9no-RB4XyYi9g653U-4_VqVSVN5P_5XA,1361
 evalvault/adapters/outbound/dataset/base.py,sha256=4rxpQgxpFty0G5XRv1SP-XJ9mpZ9YO6PAMDgp71JiJQ,5547
 evalvault/adapters/outbound/dataset/csv_loader.py,sha256=xHg2QadMvLfHTHzeex6WxXmagLJog3LN-ui6dFxD8HY,5595
 evalvault/adapters/outbound/dataset/excel_loader.py,sha256=MUl-63r1s1GjVVmDgdag1DpMJvIVX_agGx20NQzEZN8,4494
 evalvault/adapters/outbound/dataset/json_loader.py,sha256=4wG7APg1LLADPxJ-wQZo2zBcvVX12sqo9VUIb-0Kww4,4923
 evalvault/adapters/outbound/dataset/loader_factory.py,sha256=32sjGuW2Yta12lpKy4DLH4I5B4Pi-YuHTvGG1Pr4VAk,1361
 evalvault/adapters/outbound/dataset/method_input_loader.py,sha256=d7pB4OPvvr-q-Y5DlvjX3X719jCCQ2vRDfT_ov0dUFU,3833
+evalvault/adapters/outbound/dataset/multiturn_json_loader.py,sha256=XJDDYgabFlLMqwTAa-aelptirhq07xJDkaB0kbrxPmU,4194
 evalvault/adapters/outbound/dataset/streaming_loader.py,sha256=pLSJDG3zkaX-KyKebEtNdIVJhpIXDCJpzNBglWlU9tw,17995
 evalvault/adapters/outbound/dataset/templates.py,sha256=5gfae7kqs66SRAP-OyWX6N2cKhr3wy7qAzfhWO_5zXY,3316
 evalvault/adapters/outbound/dataset/thresholds.py,sha256=5Vodqar6QrCL7R_Pq0gTxv1pJh_OiH_3pNimvJaUQA4,2199
@@ -178,17 +181,21 @@ evalvault/adapters/outbound/nlp/korean/korean_stopwords.py,sha256=UemEFCJudg2Eps
 evalvault/adapters/outbound/nlp/korean/toolkit.py,sha256=EYGpd89ilpn4Wg5t8pALYt4Qi0aDHYOfXGuYbQx7do0,4246
 evalvault/adapters/outbound/nlp/korean/toolkit_factory.py,sha256=x3v-AAkVInOabC4PtOtStsZrFnHun0IOqZDyQGaQVm8,586
 evalvault/adapters/outbound/phoenix/sync_service.py,sha256=i6gHpNiZXKQ5yzV9B2TPb-P1N45k_Ck5ruzh3oqp4d8,9122
-evalvault/adapters/outbound/report/__init__.py,sha256=8OUduTHnWkBLHYrc7mBg45DnAwz0RgvSJmz1HqxVjLY,477
-evalvault/adapters/outbound/report/dashboard_generator.py,sha256=Dcu18NTK4lS8XNKnnnquagpZkd-4TSf5Mb2isFNW5Pk,7800
+evalvault/adapters/outbound/report/__init__.py,sha256=8VeMrfj63mDR-xUHct-drNNBA5M-m-B7sgC1qUJF7g4,660
+evalvault/adapters/outbound/report/ci_report_formatter.py,sha256=5YD8BwtOjLnHcNbbG0HJziOifD9BDhBtZT1oItd6zJE,1233
+evalvault/adapters/outbound/report/dashboard_generator.py,sha256=g0SANOrOS_mSfLfKbfbxflxZmCNbZGrGzA0g03_Yb48,8356
 evalvault/adapters/outbound/report/llm_report_generator.py,sha256=i_iXfY8qutIb8TsvLKyMLnijsA0yiNJ3rBEFg4zVqcE,26858
 evalvault/adapters/outbound/report/markdown_adapter.py,sha256=5PS72h_qe4ZtYs-umhX5TqQL2k5SuDaCUc6rRw9AKRw,16761
+evalvault/adapters/outbound/report/pr_comment_formatter.py,sha256=FxWWfZQU5ErejVqE_F8rKoUxoBTbbmw_ok9xbEYiA4E,1661
+evalvault/adapters/outbound/retriever/__init__.py,sha256=o5qK4pIrlXm0mIs_fo0aLPQHuHkrmrXKc6ZSg8a0t4g,201
+evalvault/adapters/outbound/retriever/graph_rag_adapter.py,sha256=xTI7uMFp4WKstg1s2zY9R_QsWPA-Rz_KUnzekwso8z0,11790
 evalvault/adapters/outbound/storage/__init__.py,sha256=n5R6thAPTx1leSwv6od6nBWcLWFa-UYD6cOLzN89T8I,614
-evalvault/adapters/outbound/storage/base_sql.py,sha256=bNjJr941wqeLgv4E772JlOer1Q8OpJWxyotsNNn_R98,42536
+evalvault/adapters/outbound/storage/base_sql.py,sha256=sNCkUD9YfCBUTUXeLCyScXPwcgmfn6wX15j8WcjZm7w,52550
 evalvault/adapters/outbound/storage/benchmark_storage_adapter.py,sha256=Qgf9xSSIkYQRpG4uLzcUdoYO9LTQDQ4tFRkkMYer-WA,9803
-evalvault/adapters/outbound/storage/postgres_adapter.py,sha256=HLaoQ3YJDFwOxeY0S92oPIqb-7EgWSasgt89RM86vr0,47148
-evalvault/adapters/outbound/storage/postgres_schema.sql,sha256=A9MfO0pjf4kjxoRj2KPI0Gg1cbX13I2YE3oieT-PGiI,8906
-evalvault/adapters/outbound/storage/schema.sql,sha256=LknvBvNVLvkW7c_hHTLHrxSf4TZApzbRyAk1ctuROUc,10608
-evalvault/adapters/outbound/storage/sqlite_adapter.py,sha256=nimaXvqhJf-90r4Qjd8tBZWU5_NUIvBlQ6Vox-xrQ_c,51223
+evalvault/adapters/outbound/storage/postgres_adapter.py,sha256=fLg_0JA3iBKQh8nRI_Njf4564H4evcnWGTjX183IrFA,52194
+evalvault/adapters/outbound/storage/postgres_schema.sql,sha256=xaN4rSkhtBNfKw5gOYqqhYP0xIN2Sn3drOnFpkBo1_Q,11255
+evalvault/adapters/outbound/storage/schema.sql,sha256=GXelsMmthV6ugC1tv9oVwr1x-Ni-N3BpBom7iLDLlZA,13015
+evalvault/adapters/outbound/storage/sqlite_adapter.py,sha256=qX4SHaDi8U0kY-rAksQ_GJX58bg9EwXkXQ2hffcoWDQ,56090
 evalvault/adapters/outbound/tracer/__init__.py,sha256=xrvQQuAvF_UI02mKLMV7GTrG3zn836n5zwCRrrmhq_U,1054
 evalvault/adapters/outbound/tracer/open_rag_log_handler.py,sha256=aq96FIWD-bBaSkq-bygWhQArC9LWghSwi-S03Mga0mI,2827
 evalvault/adapters/outbound/tracer/open_rag_trace_adapter.py,sha256=P-4PN1UweITXu5uN3LJVCEL3wRwiExzhgs3y2GN78xM,4784
@@ -211,7 +218,7 @@ evalvault/config/secret_manager.py,sha256=YjPMuNqeBrAR2BzCJvsBNUExaU4TBSFyZ8kVYZ
 evalvault/config/settings.py,sha256=DY170XUoMo8yQx8_CJjPt96QsGg7tyTx5wJ-ptcfdY0,18766
 evalvault/config/playbooks/improvement_playbook.yaml,sha256=9F9WVVCydFfz6zUuGYzZ4PKdW1LLtcBKVF36T7xT764,26965
 evalvault/domain/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-evalvault/domain/entities/__init__.py,sha256=wszRJ1Imdc5NJ1bQPC2udk-mAgFdlw4uZV5IPNjLpHQ,3669
+evalvault/domain/entities/__init__.py,sha256=7adWG4vwr67fC_ysT1rSvYG5U7qVc2CfWfUf7gDhx-k,4244
 evalvault/domain/entities/analysis.py,sha256=gcMtumC66g-AIqb2LgfMpm5BMzwJhJkjg-zuybNoJCM,15208
 evalvault/domain/entities/analysis_pipeline.py,sha256=hD9rFHMa4rUq0InRkSKhh6HQ9ZeNYAHKADzs-kWRP04,16845
 evalvault/domain/entities/benchmark.py,sha256=CVbz_eW7Y9eM7wG7xA_xmldTIs72csdoTmu3E0NKoMU,18475
@@ -220,24 +227,27 @@ evalvault/domain/entities/dataset.py,sha256=WsC_5ivGluy-o2nXxLGmoC8DYl5UafVSo2hS
 evalvault/domain/entities/debug.py,sha256=r92lgvOpq2svw70syJIo78muRAvrSn5h1JByH_Hvz-s,1493
 evalvault/domain/entities/experiment.py,sha256=oWjbu0IJZ6oIRcnA-8ppeJDgp57Tv8ZjQ3UOZ0X9KJ8,2576
 evalvault/domain/entities/feedback.py,sha256=xiaZaUQhyuxyW_i2scXt8eKZshMC6tXe3981e-uukw8,1604
+evalvault/domain/entities/graph_rag.py,sha256=LvCJRyrXihJOFQSH2xB7O124_GG_lrsqfIVCgwJDu_0,610
 evalvault/domain/entities/improvement.py,sha256=WHI7q1jXRxkuHhBWOrpk8UdLaH0UwjZVjRIDsqVDyZo,19322
 evalvault/domain/entities/judge_calibration.py,sha256=fhQEI7g2nZuG1OliikhxgefcFAJldDqEmfTs9Mp-FPk,1234
 evalvault/domain/entities/kg.py,sha256=8awN1M4vxAGQZk_ZG8i2CXKTizQ8FA1VCLhUWHZq0U8,3001
 evalvault/domain/entities/memory.py,sha256=bfS75q8K8_jNrB7IYh4mjP8Lkyj-I0TVsmHCP0FuICw,8423
 evalvault/domain/entities/method.py,sha256=a3jZi7SjcpK3HeVyVwQkUMwpnmg2RbxCnH4NqYPLCOI,1157
+evalvault/domain/entities/multiturn.py,sha256=V9ay30rix6zxNcDRXeLudMgikC1b4f3kt01Hj2ZH7wE,2012
 evalvault/domain/entities/prompt.py,sha256=lQlRnHEKY69GWTC-cUIu0DMuPfJ9UWm6Sm4KTNjVwfY,2920
 evalvault/domain/entities/prompt_suggestion.py,sha256=Ep_XSjdYUj7pFSCMyeeZKs8yTnp74AVx05Zqr7829PE,1243
 evalvault/domain/entities/rag_trace.py,sha256=sZgnkG4fK6KOe3Np6TYAZ_tPnsRbOmucDSQns35U1n4,11868
 evalvault/domain/entities/result.py,sha256=OaGHMDLWMW2O4fNVuVTUvWFVBQ1iu93OD_oI3NumrCQ,10697
 evalvault/domain/entities/stage.py,sha256=KyR-v3tyusPJ7pfTXtHE2_23tVvNSRU9Q1RT-R5akXg,7914
-evalvault/domain/metrics/__init__.py,sha256=Ros3CWg5in1xlEdMa0WUSG602SBVkxw2Zbro-XUlmxU,1214
+evalvault/domain/metrics/__init__.py,sha256=RKHfCRKPHfKh7HmlZd4bazZi9V4jvRtAOZd15J4rMDk,1529
 evalvault/domain/metrics/analysis_registry.py,sha256=JZpBrBs7-JExHKYuEML6Vg_uYLm-WniBE3BfiU5OtJg,7641
 evalvault/domain/metrics/confidence.py,sha256=AX4oeN28OvmMkwD0pT-jskkOlXh87C1pe2W9P1sF69g,17224
 evalvault/domain/metrics/contextual_relevancy.py,sha256=xAPYUv_0TM4j4WOutOSGftNln_l-2Ev6qpANeu4REv8,11057
 evalvault/domain/metrics/entity_preservation.py,sha256=uSCbaETceE5PbGn-230Rm8pryOA8jDkkeOwAkWxA65g,6500
 evalvault/domain/metrics/insurance.py,sha256=5NPeAi_86rpuZRgV4KhzomGrq3Uw2jjglN6FfA_AO8o,4040
+evalvault/domain/metrics/multiturn_metrics.py,sha256=lGBN91VAQaa02bsvDOuUggRCQEB_dSORH31A4N72n2c,3385
 evalvault/domain/metrics/no_answer.py,sha256=x6vRyOa1jw-qsnw9kOYT8YMPdLElaDRu7zjNCpyJfqM,8237
-evalvault/domain/metrics/registry.py,sha256=1CKPxSjdXK739zhzwodukGDL-dIhlJJH30cuP-czQWc,6926
+evalvault/domain/metrics/registry.py,sha256=6mMCN1kVQZlLrxGOPClOkaDed0IAc3L0rT1MERF4Ruk,8086
 evalvault/domain/metrics/retrieval_rank.py,sha256=F55ByadJBowyKHKBmKAZ0T0qN_R1_7UNu-MiLnT4Ypg,14675
 evalvault/domain/metrics/summary_accuracy.py,sha256=Hr4QS1e4Rxt1MgcTj5rElKuPw9rWS-zGkI0d8wB5dwA,5988
 evalvault/domain/metrics/summary_needs_followup.py,sha256=5kExtZxxankP7csAAIZe_1uRFeBD7NQK-N15b5d0awM,1357
@@ -245,7 +255,7 @@ evalvault/domain/metrics/summary_non_definitive.py,sha256=1EE-z0Ib66gpjc0MGZHmZJ
 evalvault/domain/metrics/summary_risk_coverage.py,sha256=Fo-dMg_jU4MCr0YqOZzBZymwEbG9y2H6eLX-jmuS8IU,1777
 evalvault/domain/metrics/terms_dictionary.json,sha256=-ZQmpx6yMOYoAOpcLj-xK2LkAeCbAw0EUb6-syIOKS0,3801
 evalvault/domain/metrics/text_match.py,sha256=P-YTZs9ekDqEmxLNBP8eXnMRymPdC8V4dJPtwG2ajVM,10219
-evalvault/domain/services/__init__.py,sha256=X5Af1kf_vSt3S3mFwOV6OQdro-lFxwbVdNd7nJznkC8,1024
+evalvault/domain/services/__init__.py,sha256=gpkco8bZGjuy7xAgSPMPCVTrw5xxHVvdILF8opTOS6c,1302
 evalvault/domain/services/analysis_service.py,sha256=oUEtfJHB3bNJ_Ksygx-pjnLm4CTk7_rDvDbqfkAfFD4,10838
 evalvault/domain/services/artifact_lint_service.py,sha256=80P46weoj9lBxOqg_ViHZEQ6Cfo69XV4cniZlmMsti0,8434
 evalvault/domain/services/async_batch_executor.py,sha256=qYFRl7CGmv56XppeRhInde7Fw0GESCoZh8V-Iv_1hQQ,11140
@@ -265,12 +275,13 @@ evalvault/domain/services/document_versioning.py,sha256=M1qZaMpQ2exVT1wkVAmvEPPu
 evalvault/domain/services/domain_learning_hook.py,sha256=rhKBmdnrJyfGzFNsNxzyv8jZO26-WOosHSmBV_9qdJg,7176
 evalvault/domain/services/embedding_overlay.py,sha256=ZTNxUPXpHGbQ3Uri5DD3feTUFn7qrhuNshhyCQEvRuM,3559
 evalvault/domain/services/entity_extractor.py,sha256=f3Rf5saK8QsgetLNK1Hbxzt8PtttJZCicSR63S8DJ5k,14141
-evalvault/domain/services/evaluator.py,sha256=Fvth2VdckDJvGuwxbXPnvPfQU59WZSJHV63H4qji4lM,78815
+evalvault/domain/services/evaluator.py,sha256=Iud5KWompKyMm59qsaH0jWkNL4nl_A7UI3pES-rCjcA,78921
 evalvault/domain/services/experiment_comparator.py,sha256=IBrxIwux-8GucwlLx6e5lUqB9miSPvBLGJK9ctoW7Y0,3299
 evalvault/domain/services/experiment_manager.py,sha256=2k-qGiAUyZuqqmcp4P-M3Z9HTXwwcqW5HQYKNkcIHuI,4863
 evalvault/domain/services/experiment_reporter.py,sha256=QYlVmCFSx8hKTPMezc7QjJE07b3MSQ82Q4QVucSHLVY,1420
 evalvault/domain/services/experiment_repository.py,sha256=1OQSvBmM7llNJFWgGHBL3XvJvn_OIQsKo7zophYtV1g,2423
 evalvault/domain/services/experiment_statistics.py,sha256=aOrqbBjB1swHPaFRziID1mrAowoV-pBS4XdLFhAhMLE,1115
+evalvault/domain/services/graph_rag_experiment.py,sha256=guSMw8OvfQ-Fz8PLygepDr4Pt-xKyWxwJPdQNRgWU-0,5027
 evalvault/domain/services/holdout_splitter.py,sha256=Sos61Zy_bBjStt8LPHJ3KxDNda-OmX7AVUsT24K1n6Q,1910
 evalvault/domain/services/improvement_guide_service.py,sha256=gMoVFlDsprOEEfRGKmdbk9_Due62J63Q-rL2zr65Q0s,17881
 evalvault/domain/services/intent_classifier.py,sha256=hsWivDXqXJjCJEE-OI7eUGeYrewpYxlz67Z0TI3oskU,11707
@@ -279,6 +290,7 @@ evalvault/domain/services/kg_generator.py,sha256=oEugjPdn8Pb2Q3r5yAZl0dZJibNUkEh
 evalvault/domain/services/memory_aware_evaluator.py,sha256=vTiYoxiMfZ_CMjSBjqwkBRdpiXRwQ2zXnQ2pXzVHYts,5249
 evalvault/domain/services/memory_based_analysis.py,sha256=oh2irCy3le7fWiTtL31SMEhPyu7fyBVz-giO2hlNifE,4499
 evalvault/domain/services/method_runner.py,sha256=pABqKZeaALpWZYDfzAbd-VOZt2djQggRNIPuuPQeUSw,3571
+evalvault/domain/services/multiturn_evaluator.py,sha256=fipi5hEyidq_cnGGr0GpvoprLtjm6dHLuAkSotbT3YA,7202
 evalvault/domain/services/ops_snapshot_service.py,sha256=1CqJN2p3tM6SgzLCZKcVEM213fd1cDGexTRPG_3e59w,5138
 evalvault/domain/services/pipeline_orchestrator.py,sha256=yriVlEVZYDtt0Vwt4Ae6xyW1H6Dj4Hxdn8XQSvQNSoQ,19436
 evalvault/domain/services/pipeline_template_registry.py,sha256=k5Ce1BC3NgcYqCLiUZpXsl_6WwDHOXONoYDH7KzX2L4,28809
@@ -304,11 +316,12 @@ evalvault/domain/services/threshold_profiles.py,sha256=yYJ7o8SIRufI7kUN8edh8am-d
 evalvault/domain/services/unified_report_service.py,sha256=lG3VpMLC1MTYUlcGl-MUEE4PUopkyrhcgj4_ye9c_vM,11829
 evalvault/domain/services/visual_space_service.py,sha256=3_qyBsThr5lzP1le6qkXf9ByX3JjoYGX15iMIHe8gQs,34958
 evalvault/ports/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-evalvault/ports/inbound/__init__.py,sha256=2Wsc0vNzH8_ZaErk4OHxP93hRonLUkMbn3W28DtTDO0,562
+evalvault/ports/inbound/__init__.py,sha256=a0BA3oy21besJsf0m1_zNBAt0eFo8UDL4XKOTHtpmdc,666
 evalvault/ports/inbound/analysis_pipeline_port.py,sha256=RJfKtp22AYEqnmRk6RDawAK52rEmyAhuk0FUPJQUwQU,1758
 evalvault/ports/inbound/evaluator_port.py,sha256=rDvouIRUjBD7uICgrpeo11vNPvo27_0CdylRHPodPSE,1323
 evalvault/ports/inbound/learning_hook_port.py,sha256=EeJeMl3chcPHlj5mkLOj6tm8s_qdDRvoCwK1-0l70tI,3297
-evalvault/ports/inbound/web_port.py,sha256=b4uMhwOMLXy3LeILc7ZK3RR-XtoW4p4NzoTpj4syptg,5578
+evalvault/ports/inbound/multiturn_port.py,sha256=qZNV6h9Qvw77FE_9hZdyYUOvj_7cXSBHVkj6B9HztJI,524
+evalvault/ports/inbound/web_port.py,sha256=6MJuPQy9CKvuQKiRGyDaDgeqBYj1T_Q9wCjHPbd5GYE,5730
 evalvault/ports/outbound/__init__.py,sha256=x3LseXtwX0NONM1mnhT3fMchz7U6gEDRUX0TDswpg5E,3591
 evalvault/ports/outbound/analysis_cache_port.py,sha256=zPSdUVK_yw3PMWPII2YvS1WLmCGlg5bDScSuYINW9yc,1386
 evalvault/ports/outbound/analysis_module_port.py,sha256=QYzkvie9-BbONj8ZgiQUjm8I-bn8mgzlXTzIXMhehmQ,1881
@@ -321,6 +334,7 @@ evalvault/ports/outbound/dataset_port.py,sha256=OpEBlkvFwpSRbmi-Lt3wK7n0wljmQ6m9
 evalvault/ports/outbound/difficulty_profile_port.py,sha256=hQY-TR64WyUNnCxD9Mw-QraO3ZBw0VUP8KoCmVsQYBE,347
 evalvault/ports/outbound/domain_memory_port.py,sha256=SZFurqsoBmTw1Kt_pej-YpMbooVeyV35jekhaDRojus,23320
 evalvault/ports/outbound/embedding_port.py,sha256=ZHeKRMRBNjpZKWxsLKrD8jJz0M66JTwNcrJbkRaklK4,2034
+evalvault/ports/outbound/graph_retriever_port.py,sha256=2jaaXYRfG4Gi7UE38_NmFBaQcqAGb5svizcWl1PVScs,637
 evalvault/ports/outbound/improvement_port.py,sha256=fIXhcG4n6OJ1hdvWeqEoLBrVsCNdHZRgtEZjR8lf3qA,2325
 evalvault/ports/outbound/intent_classifier_port.py,sha256=gqMIk0rH6Z43ceuMMRX4vqXurgHZz-CJX2bR5PVAkjQ,2253
 evalvault/ports/outbound/judge_calibration_port.py,sha256=kShZ2MZGvgQZaY7XxwkmLXtquK_RFKcwuWRBfJOrILA,602
@@ -333,15 +347,15 @@ evalvault/ports/outbound/ops_snapshot_port.py,sha256=6v72W41tlnxjkJfbfHhFiJMPlRS
 evalvault/ports/outbound/relation_augmenter_port.py,sha256=cMcHQnmK111WzZr50vYr7affeHhOtpFZxPARwkg9xbk,651
 evalvault/ports/outbound/report_port.py,sha256=wgReSYL4SupXIoALFh0QFWfX2kzPftXpWTvGLCMd2B8,1315
 evalvault/ports/outbound/stage_storage_port.py,sha256=Nlf9upsXxgCABQB5cJdpLQYsoZNiGRAU5zE5D-Ptp2I,1201
-evalvault/ports/outbound/storage_port.py,sha256=mexWwP3wvIVigS_ZZP5wWAzGAozByNVMwnW9ziWv3eA,5897
+evalvault/ports/outbound/storage_port.py,sha256=F6k-c0Yz7IWvLRrTdQAmpHjDYVz-Zo9eL6Qj0HNBJ4Y,6632
 evalvault/ports/outbound/tracer_port.py,sha256=kTqJCUIJHnvvDzMxxGhHSfiz8_Q4CZ0WSPvIUVVOcyw,623
 evalvault/ports/outbound/tracker_port.py,sha256=05LA3AWnuE1XmGQC16Zle9i2sEV3q69Nt8ZUye_w1_Y,2532
 evalvault/reports/__init__.py,sha256=Bb1X4871msAN8I6PM6nKGED3psPwZt88hXZBAOdH06Y,113
 evalvault/reports/release_notes.py,sha256=pZj0PBFT-4F_Ty-Kv5P69BuoOnmTCn4kznDcORFJd0w,4011
 evalvault/scripts/__init__.py,sha256=NwEeIFQbkX4ml2R_PhtIoNtArDSX_suuoymgG_7Kwso,89
 evalvault/scripts/regression_runner.py,sha256=SxZori5BZ8jVQ057Mf5V5FPgIVDccrV5oRONmnhuk8w,8438
-evalvault-1.70.1.dist-info/METADATA,sha256=z6fA3GeAft1sqwQMSYn518obpYydQiDOjpeTqm211Wc,26159
-evalvault-1.70.1.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
-evalvault-1.70.1.dist-info/entry_points.txt,sha256=Oj9Xc5gYcyUYYNmQfWI8NYGw7nN-3M-h2ipHIMlVn6o,65
-evalvault-1.70.1.dist-info/licenses/LICENSE.md,sha256=3RNWY4jjtrQ_yYa-D-7I3XO12Ti7YzxsLV_dpykujvo,11358
-evalvault-1.70.1.dist-info/RECORD,,
+evalvault-1.72.0.dist-info/METADATA,sha256=-h7WdCBxLkrvGWBAMifdpc9BpoBfUqpEEAz8GLM6fgU,26159
+evalvault-1.72.0.dist-info/WHEEL,sha256=WLgqFyCfm_KASv4WHyYy0P3pM_m7J5L9k2skdKLirC8,87
+evalvault-1.72.0.dist-info/entry_points.txt,sha256=Oj9Xc5gYcyUYYNmQfWI8NYGw7nN-3M-h2ipHIMlVn6o,65
+evalvault-1.72.0.dist-info/licenses/LICENSE.md,sha256=3RNWY4jjtrQ_yYa-D-7I3XO12Ti7YzxsLV_dpykujvo,11358
+evalvault-1.72.0.dist-info/RECORD,,

{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/WHEEL RENAMED Viewed

File without changes

{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{evalvault-1.70.1.dist-info → evalvault-1.72.0.dist-info}/licenses/LICENSE.md RENAMED Viewed

File without changes

evalvault 1.70.1__py3-none-any.whl → 1.72.0__py3-none-any.whl

evalvault 1.70.1py3-none-any.whl → 1.72.0py3-none-any.whl