RubyGems - lex-eval - Versions diffs - 0.2.3 → 0.2.4 - Mend

lex-eval 0.2.3 → 0.2.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

checksums.yaml +4 -4
data/lib/legion/extensions/eval/evaluators/llm_judge.rb +4 -2
data/lib/legion/extensions/eval/runners/agentic_review.rb +2 -1
data/lib/legion/extensions/eval/version.rb +1 -1
metadata +1 -1

checksums.yaml CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 SHA256:
-  metadata.gz: 42e93ebdc972bbb947ca388705947747e0dc4050e7cb5483efc57471adfbca29
-  data.tar.gz: f3a45e7d94bd7c4670f92f11a6e838e9a0913fd8823726436efa889c017afea3
+  metadata.gz: e519977bbdf83bbb365455d368008b572ec68a46b756e9e33aed4376122549fd
+  data.tar.gz: c91130345e012f2b585fa86b26f3578b0b111a2d95a76e21ec3c1316065a830c
 SHA512:
-  metadata.gz: 9597e0c4cf93d703c40d83a80107a1c2271022710dadfc666ea3ce510d327eefceb33005e456b0af1064d77c5d7d88502d3476cf7554382fc0b7d18e07421539
-  data.tar.gz: b8e858dbd043dfd71fe5d964c608d438ad34f56ba3da487fd3a58f8fd76ffd244f01266a0c72c892c1257ac87f0041a1a7e7aaf1fb09f6ff2ef48e53ab0c13f7
+  metadata.gz: 749867fd2b8004bbc96cf29192ad9d33302677e31019eb4c2b8c315320544b0b407b4272edd4a159effeec77c505f3e8fd7d94f4088b6b86695a2bf35d410f86
+  data.tar.gz: d0579690cba79a88f1b88bee339a571933cc4aa053ca6222ef9f7285ca7cf3b871e9d40c5dec2e56e48b46ef5a04edf4fb412cddc59405f6fb8cf06759065b49

data/lib/legion/extensions/eval/evaluators/llm_judge.rb CHANGED Viewed

@@ -45,7 +45,8 @@ module Legion
             return evaluate_regex_fallback(prompt) unless structured_available?
             result = Legion::LLM.structured(message: prompt, schema: JUDGE_SCHEMA,
-                                            intent: { capability: :reasoning })
+                                            intent: { capability: :reasoning },
+                                            caller: { extension: 'lex-eval', operation: 'judge' })
             { score: result[:score], passed: result[:passed],
               explanation: result[:explanation], evidence: result[:evidence] || [] }
           rescue StandardError
@@ -53,7 +54,8 @@ module Legion
           end
           def evaluate_regex_fallback(prompt)
-            response = Legion::LLM.chat(message: prompt, intent: { capability: :reasoning })
+            response = Legion::LLM.chat(message: prompt, intent: { capability: :reasoning },
+                                        caller: { extension: 'lex-eval', operation: 'judge' })
             score = extract_score(response.content)
             { score: score, explanation: response.content, passed: score >= threshold, evidence: [] }
           rescue StandardError => e

data/lib/legion/extensions/eval/runners/agentic_review.rb CHANGED Viewed

@@ -26,7 +26,8 @@ module Legion
           def review_output(input:, output:, review_prompt: nil, **)
             prompt = build_review_message(review_prompt || default_review_prompt, input, output)
             Legion::LLM.structured(message: prompt, schema: REVIEW_SCHEMA,
-                                   intent: { capability: :reasoning })
+                                   intent: { capability: :reasoning },
+                                   caller: { extension: 'lex-eval', operation: 'agentic_review' })
           rescue StandardError => e
             { confidence: 0.0, recommendation: 'reject',
               issues: [], explanation: "review error: #{e.message}" }

data/lib/legion/extensions/eval/version.rb CHANGED Viewed

@@ -3,7 +3,7 @@
 module Legion
   module Extensions
     module Eval
-      VERSION = '0.2.3'
+      VERSION = '0.2.4'
     end
   end
 end

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: lex-eval
 version: !ruby/object:Gem::Version
-  version: 0.2.3
+  version: 0.2.4
 platform: ruby
 authors:
 - Matthew Iverson