RubyGems - retreval - Versions diffs - 0.1 → 0.1.1 - Mend

retreval 0.1 → 0.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (32) hide show

data/TODO +1 -1
data/doc/CHANGELOG.html +124 -0
data/doc/Retreval.html +212 -0
data/doc/Retreval/Document.html +297 -0
data/doc/Retreval/GoldStandard.html +1013 -0
data/doc/Retreval/Judgement.html +353 -0
data/doc/Retreval/Options.html +406 -0
data/doc/Retreval/Query.html +296 -0
data/doc/Retreval/QueryResult.html +746 -0
data/doc/Retreval/QueryResultSet.html +429 -0
data/doc/Retreval/RankedQueryResult.html +556 -0
data/doc/Retreval/ResultDocument.html +253 -0
data/doc/Retreval/Runner.html +506 -0
data/doc/Retreval/UnrankedQueryResult.html +278 -0
data/doc/Retreval/User.html +354 -0
data/doc/TODO.html +124 -0
data/doc/TestGoldStandard.html +551 -0
data/doc/TestQueryResult.html +606 -0
data/doc/bin/retreval.html +54 -0
data/doc/created.rid +10 -0
data/doc/index.html +218 -0
data/doc/lib/retreval/gold_standard_rb.html +52 -0
data/doc/lib/retreval/options_rb.html +56 -0
data/doc/lib/retreval/query_result_rb.html +54 -0
data/doc/lib/retreval/runner_rb.html +56 -0
data/doc/rdoc.css +706 -0
data/doc/test/test_gold_standard_rb.html +56 -0
data/doc/test/test_query_result_rb.html +58 -0
data/lib/retreval/gold_standard.rb +6 -9
data/lib/retreval/query_result.rb +5 -2
data/retreval.gemspec +1 -1
metadata +29 -2

data/doc/test/test_gold_standard_rb.html ADDED

@@ -0,0 +1,56 @@
+<?xml version="1.0" encoding="utf-8"?>
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
+	"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
+<head>
+	<meta content="text/html; charset=utf-8" http-equiv="Content-Type" />
+	<title>File: test_gold_standard.rb [RDoc Documentation]</title>
+	<link type="text/css" media="screen" href="../rdoc.css" rel="stylesheet" />
+	<script src="../js/jquery.js" type="text/javascript"
+		charset="utf-8"></script>
+	<script src="../js/thickbox-compressed.js" type="text/javascript"
+		charset="utf-8"></script>
+	<script src="../js/quicksearch.js" type="text/javascript"
+		charset="utf-8"></script>
+	<script src="../js/darkfish.js" type="text/javascript"
+		charset="utf-8"></script>
+</head>
+<body class="file file-popup">
+	<div id="metadata">
+		<dl>
+			<dt class="modified-date">Last Modified</dt>
+			<dd class="modified-date">2011-04-05 15:32:54 +0200</dd>
+			<dt class="requires">Requires</dt>
+			<dd class="requires">
+				<ul>
+					<li>test/unit</li>
+					<li>retreval/gold_standard</li>
+				</ul>
+			</dd>
+		</dl>
+	</div>
+	<div id="documentation">
+		<div class="description">
+			<h2>Description</h2>
+		</div>
+	</div>
+</body>
+</html>

data/doc/test/test_query_result_rb.html ADDED

@@ -0,0 +1,58 @@
+<?xml version="1.0" encoding="utf-8"?>
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
+	"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
+<head>
+	<meta content="text/html; charset=utf-8" http-equiv="Content-Type" />
+	<title>File: test_query_result.rb [RDoc Documentation]</title>
+	<link type="text/css" media="screen" href="../rdoc.css" rel="stylesheet" />
+	<script src="../js/jquery.js" type="text/javascript"
+		charset="utf-8"></script>
+	<script src="../js/thickbox-compressed.js" type="text/javascript"
+		charset="utf-8"></script>
+	<script src="../js/quicksearch.js" type="text/javascript"
+		charset="utf-8"></script>
+	<script src="../js/darkfish.js" type="text/javascript"
+		charset="utf-8"></script>
+</head>
+<body class="file file-popup">
+	<div id="metadata">
+		<dl>
+			<dt class="modified-date">Last Modified</dt>
+			<dd class="modified-date">2011-04-05 15:32:58 +0200</dd>
+			<dt class="requires">Requires</dt>
+			<dd class="requires">
+				<ul>
+					<li>test/unit</li>
+					<li>retreval/gold_standard</li>
+					<li>retreval/query_result</li>
+				</ul>
+			</dd>
+		</dl>
+	</div>
+	<div id="documentation">
+		<div class="description">
+			<h2>Description</h2>
+		</div>
+	</div>
+</body>
+</html>

data/lib/retreval/gold_standard.rb CHANGED

@@ -1,7 +1,7 @@
 module Retreval
-  # A gold standard is composed of several judgements for the
-  # cartesian product of documents and queries
+  # A Gold Standard is composed of several Judgements for the
+  # cartesian product of Documents and Queries
   class GoldStandard
     attr_reader :documents, :judgements, :queries, :users
@@ -110,8 +110,8 @@ module Retreval
     end
-    # Adds a judgement (document, query, relevancy) to the gold standard.
-    # All of those are strings in the public interface.
+    # Adds a judgement (Document, Query, relevancy) to the GoldStandard.
+    # All of those are represented as strings in the public interface.
     # The user ID is an optional parameter that can be used to measure kappa later.
     # Call this with:
     #     add_judgement :document => doc_id, :query => query_string, :relevant => boolean, :user => John
@@ -136,7 +136,6 @@ module Retreval
         # If there is no judgement for this combination, just add the document/query pair
         if relevant.nil?
-          # TODO: improve efficiency by introducing hashes !
           @documents[document_id] = document
           @queries << query unless @queries.include?(query)
           return
@@ -155,8 +154,7 @@ module Retreval
         @queries << query unless @queries.include?(query)
         @judgements << judgement
       else
-        #TOOD I think there is somethink like an ArgumentExcpetion in Ruby; use that if applicable
-        raise "Need at least a Document, and a Query for creating the new entry."
+        raise ArgumentError.new("Need at least a Document, and a Query for creating the new entry.")
       end
     end
@@ -200,7 +198,6 @@ module Retreval
       document = Document.new :id => args[:document]
       #TODO: a hash could improve performance here as well
       @judgements.each { |judgement| return true if judgement.document == document and judgement.query == query }
       false
@@ -240,7 +237,7 @@ module Retreval
     # See: http://nlp.stanford.edu/IR-book/html/htmledition/assessing-relevance-1.html
     def kappa
-      # FIXME: This isn't very pretty, maybe there's a more ruby-esque way to do this?
+      # TODO This isn't very pretty, maybe there's a more ruby-esque way to do this?
       sum = 0
       count = 0

data/lib/retreval/query_result.rb CHANGED

@@ -230,9 +230,10 @@ module Retreval
       # Use the gold standard we initially received
       standard = @gold_standard
-      # If there is an unranked result to be calculated, we will
+      # If there is an unranked result to be calculated ..
       if resultset.nil?
         unranked = true
+        # ... we'll just take the array of documents for this result
         resultset = OpenStruct.new
         resultset.documents = @documents.values
         resultset.query = @query
@@ -250,7 +251,9 @@ module Retreval
         # Get the document sets we are working on
         retrieved_documents = resultset.documents           # => This is an Array all the time
-        not_retrieved_documents = standard.documents.reject { |key, doc| retrieved_documents.include? doc } # => This is a Hash
+        # This means that we will filter out all retreived documents from the Gold Standard
+        # TODO: This can definitely be improved, but how?
+        not_retrieved_documents = standard.documents.reject { |key, doc| retrieved_documents.include? doc } # => This is a Hash as it refers to the Gold Standard
         # Check whether each of the retrieved documents is relevant or not ...
         retrieved_documents.each do |doc|

data/retreval.gemspec CHANGED

@@ -3,7 +3,7 @@ Gem::Specification.new do |s|
   s.summary	= "A Ruby API for Evaluating Retrieval Results"
   s.description = File.read(File.join(File.dirname(__FILE__), 'README.md'))
   # s.requirements = [ 'Nothing special' ]
-  s.version = "0.1"
+  s.version = "0.1.1"
   s.author = "Werner Robitza"
   s.email = "werner.robitza@univie.ac.at"
   s.homepage = "http://github.com/slhck/retreval"

metadata CHANGED

@@ -2,7 +2,7 @@
 name: retreval
 version: !ruby/object:Gem::Version
   prerelease:
-  version: "0.1"
+  version: 0.1.1
 platform: ruby
 authors:
 - Werner Robitza
@@ -10,7 +10,7 @@ autorequire:
 bindir: bin
 cert_chain: []
-date: 2011-04-05 00:00:00 Z
+date: 2011-04-06 00:00:00 Z
 dependencies: []
 description: |-
@@ -345,6 +345,33 @@ extra_rdoc_files: []
 files:
 - bin/retreval
 - CHANGELOG
+- doc/bin/retreval.html
+- doc/CHANGELOG.html
+- doc/created.rid
+- doc/index.html
+- doc/lib/retreval/gold_standard_rb.html
+- doc/lib/retreval/options_rb.html
+- doc/lib/retreval/query_result_rb.html
+- doc/lib/retreval/runner_rb.html
+- doc/rdoc.css
+- doc/Retreval/Document.html
+- doc/Retreval/GoldStandard.html
+- doc/Retreval/Judgement.html
+- doc/Retreval/Options.html
+- doc/Retreval/Query.html
+- doc/Retreval/QueryResult.html
+- doc/Retreval/QueryResultSet.html
+- doc/Retreval/RankedQueryResult.html
+- doc/Retreval/ResultDocument.html
+- doc/Retreval/Runner.html
+- doc/Retreval/UnrankedQueryResult.html
+- doc/Retreval/User.html
+- doc/Retreval.html
+- doc/test/test_gold_standard_rb.html
+- doc/test/test_query_result_rb.html
+- doc/TestGoldStandard.html
+- doc/TestQueryResult.html
+- doc/TODO.html
 - example/gold_standard.yml
 - example/query_results.yml
 - lib/retreval/gold_standard.rb