RubyGems - umlaut - Versions diffs - 3.0.0alpha1 - Mend

umlaut 3.0.0alpha1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (293) hide show

data/LICENSE +7 -0
data/README.md +49 -0
data/Rakefile +37 -0
data/app/assets/images/error.gif +0 -0
data/app/assets/images/export_bg_bot.gif +0 -0
data/app/assets/images/export_bg_mid.gif +0 -0
data/app/assets/images/export_bg_top.gif +0 -0
data/app/assets/images/famfamfam/book_open.png +0 -0
data/app/assets/images/famfamfam/cross.png +0 -0
data/app/assets/images/famfamfam/page_sound.gif +0 -0
data/app/assets/images/famfamfam/page_text.gif +0 -0
data/app/assets/images/famfamfam/page_up.gif +0 -0
data/app/assets/images/famfamfam/page_white.png +0 -0
data/app/assets/images/famfamfam/readme.html +1495 -0
data/app/assets/images/famfamfam/tiny_cross.png +0 -0
data/app/assets/images/frame_remove.gif +0 -0
data/app/assets/images/ico_go.gif +0 -0
data/app/assets/images/jhu_findit.gif +0 -0
data/app/assets/images/list_closed.png +0 -0
data/app/assets/images/list_open.png +0 -0
data/app/assets/images/more_info.gif +0 -0
data/app/assets/images/rails.png +0 -0
data/app/assets/images/request.gif +0 -0
data/app/assets/images/spinner.gif +0 -0
data/app/assets/javascripts/umlaut/ajax_windows.js +35 -0
data/app/assets/javascripts/umlaut/ensure_window_size.js.erb +34 -0
data/app/assets/javascripts/umlaut/expand_contract_toggle.js +25 -0
data/app/assets/javascripts/umlaut/search_autocomplete.js +46 -0
data/app/assets/javascripts/umlaut/simple_visible_toggle.js +8 -0
data/app/assets/javascripts/umlaut/update_html.js +152 -0
data/app/assets/javascripts/umlaut.js +17 -0
data/app/assets/stylesheets/umlaut.css +857 -0
data/app/controllers/application_controller.rb +14 -0
data/app/controllers/export_email_controller.rb +123 -0
data/app/controllers/js_helper_controller.rb +10 -0
data/app/controllers/link_router_controller.rb +87 -0
data/app/controllers/open_search_controller.rb +9 -0
data/app/controllers/resolve_controller.rb +288 -0
data/app/controllers/resource_controller.rb +83 -0
data/app/controllers/search_controller.rb +328 -0
data/app/controllers/search_methods/sfx3.rb +148 -0
data/app/controllers/search_methods/sfx4.rb +257 -0
data/app/controllers/search_methods/sfx_api.rb +47 -0
data/app/controllers/store_controller.rb +64 -0
data/app/controllers/umlaut/controller_behavior.rb +20 -0
data/app/controllers/umlaut/controller_logic.rb +96 -0
data/app/controllers/umlaut/error_handling.rb +48 -0
data/app/controllers/umlaut_controller.rb +112 -0
data/app/helpers/application_helper.rb +4 -0
data/app/helpers/emailer_helper.rb +43 -0
data/app/helpers/export_email_helper.rb +34 -0
data/app/helpers/open_search_helper.rb +7 -0
data/app/helpers/resolve_helper.rb +225 -0
data/app/helpers/search_helper.rb +50 -0
data/app/helpers/umlaut/footer_helper.rb +64 -0
data/app/helpers/umlaut/helper.rb +62 -0
data/app/helpers/umlaut/html_head_helper.rb +37 -0
data/app/helpers/umlaut/url_generation.rb +77 -0
data/app/mailers/emailer.rb +48 -0
data/app/models/clickthrough.rb +2 -0
data/app/models/collection.rb +259 -0
data/app/models/crossref_lookup.rb +2 -0
data/app/models/dispatched_service.rb +58 -0
data/app/models/permalink.rb +29 -0
data/app/models/referent.rb +473 -0
data/app/models/referent_value.rb +14 -0
data/app/models/request.rb +449 -0
data/app/models/service_response.rb +179 -0
data/app/models/service_store.rb +59 -0
data/app/models/service_type_value.rb +58 -0
data/app/models/service_wave.rb +150 -0
data/app/models/sfx_db/az_additional_title.rb +11 -0
data/app/models/sfx_db/az_letter_group.rb +11 -0
data/app/models/sfx_db/az_title.rb +38 -0
data/app/models/sfx_db/az_title_v2.rb +34 -0
data/app/models/sfx_db/isbn.rb +12 -0
data/app/models/sfx_db/issn.rb +12 -0
data/app/models/sfx_db/object.rb +35 -0
data/app/models/sfx_db/object_portfolio.rb +6 -0
data/app/models/sfx_db/publisher.rb +10 -0
data/app/models/sfx_db/sfx_db_base.rb +54 -0
data/app/models/sfx_db/target.rb +9 -0
data/app/models/sfx_db/target_service.rb +10 -0
data/app/models/sfx_db/title.rb +10 -0
data/app/models/sfx_db.rb +10 -0
data/app/models/sfx_url.rb +35 -0
data/app/views/emailer/citation.text.erb +28 -0
data/app/views/emailer/short_citation.text.erb +8 -0
data/app/views/export_email/_email.html.erb +25 -0
data/app/views/export_email/_send_email.html.erb +3 -0
data/app/views/export_email/_send_txt.html.erb +3 -0
data/app/views/export_email/_txt.html.erb +62 -0
data/app/views/export_email/email.html.erb +3 -0
data/app/views/export_email/send_email.html.erb +1 -0
data/app/views/export_email/send_txt.html.erb +1 -0
data/app/views/export_email/txt.html.erb +3 -0
data/app/views/js_helper/loader.erb.js +13 -0
data/app/views/layouts/umlaut.html.erb +52 -0
data/app/views/open_search/index.html.erb +9 -0
data/app/views/resolve/_api_in_progress.xml.erb +21 -0
data/app/views/resolve/_background_progress.html.erb +51 -0
data/app/views/resolve/_background_updater.html.erb +38 -0
data/app/views/resolve/_citation.html.erb +87 -0
data/app/views/resolve/_coins.html.erb +1 -0
data/app/views/resolve/_compact_citation.html.erb +33 -0
data/app/views/resolve/_cover_image.html.erb +35 -0
data/app/views/resolve/_fulltext.html.erb +55 -0
data/app/views/resolve/_help.html.erb +17 -0
data/app/views/resolve/_holding.html.erb +91 -0
data/app/views/resolve/_related_items.html.erb +35 -0
data/app/views/resolve/_search_inside.html.erb +62 -0
data/app/views/resolve/_section_display.html.erb +49 -0
data/app/views/resolve/_service_errors.html.erb +29 -0
data/app/views/resolve/_standard_response_item.html.erb +89 -0
data/app/views/resolve/api.xml.builder +72 -0
data/app/views/resolve/background_status.html.erb +26 -0
data/app/views/resolve/index.html.erb +73 -0
data/app/views/resolve/partial_html_sections.xml.erb +30 -0
data/app/views/search/_a_to_z.html.erb +6 -0
data/app/views/search/_citation.html.erb +94 -0
data/app/views/search/_pager.html.erb +60 -0
data/app/views/search/books.html.erb +103 -0
data/app/views/search/journal_search.html.erb +90 -0
data/app/views/search/journals.html.erb +167 -0
data/app/views/search/opensearch_description.rxml +10 -0
data/app/views/testing/index.html.erb +1 -0
data/app/views/umlaut/README +5 -0
data/app/views/umlaut/error.html.erb +45 -0
data/db/migrate/01_umlaut_init.rb +113 -0
data/db/orig_fixed_data/service_type_values.yml +120 -0
data/db/seeds.rb +7 -0
data/lib/CronTab.rb +192 -0
data/lib/aws_product_sign.rb +146 -0
data/lib/exlibris/aleph/patron.rb +64 -0
data/lib/exlibris/aleph/record.rb +54 -0
data/lib/exlibris/aleph/rest_api.rb +29 -0
data/lib/exlibris/primo/holding.rb +192 -0
data/lib/exlibris/primo/rsrc.rb +17 -0
data/lib/exlibris/primo/searcher.rb +276 -0
data/lib/exlibris/primo/source/aleph.rb +46 -0
data/lib/exlibris/primo/source/distribution/nyu_aleph.rb +323 -0
data/lib/exlibris/primo/toc.rb +17 -0
data/lib/exlibris/primo_ws.rb +140 -0
data/lib/generators/templates/umlaut_services.yml +237 -0
data/lib/generators/umlaut/asset_hooks_generator.rb +44 -0
data/lib/generators/umlaut/install_generator.rb +110 -0
data/lib/hip3/bib.rb +291 -0
data/lib/hip3/bib_searcher.rb +302 -0
data/lib/hip3/custom_field_lookup.rb +44 -0
data/lib/hip3/holding.rb +50 -0
data/lib/hip3/item.rb +65 -0
data/lib/hip3/receipt.rb +7 -0
data/lib/hip3/serial_copy.rb +82 -0
data/lib/holding.rb +32 -0
data/lib/marc_helper.rb +254 -0
data/lib/metadata_helper.rb +312 -0
data/lib/opensearch_feed.rb +398 -0
data/lib/opensearch_query.rb +98 -0
data/lib/referent_filter.rb +16 -0
data/lib/referent_filters/dissertation_catch.rb +45 -0
data/lib/section_renderer.rb +503 -0
data/lib/service.rb +336 -0
data/lib/service_adaptors/ajax_export.rb +37 -0
data/lib/service_adaptors/amazon.rb +412 -0
data/lib/service_adaptors/blacklight.rb +327 -0
data/lib/service_adaptors/book_finder.rb +40 -0
data/lib/service_adaptors/bx.rb +51 -0
data/lib/service_adaptors/cover_thing.rb +73 -0
data/lib/service_adaptors/elsevier_cover.rb +57 -0
data/lib/service_adaptors/email_export.rb +10 -0
data/lib/service_adaptors/ezproxy.rb +171 -0
data/lib/service_adaptors/google_book_search.rb +442 -0
data/lib/service_adaptors/gpo.rb +124 -0
data/lib/service_adaptors/hathi_trust.rb +308 -0
data/lib/service_adaptors/hip3_service.rb +150 -0
data/lib/service_adaptors/hip_holding_search.rb +237 -0
data/lib/service_adaptors/internet_archive.rb +488 -0
data/lib/service_adaptors/isbn_db.rb +86 -0
data/lib/service_adaptors/isi.rb +258 -0
data/lib/service_adaptors/jcr.rb +146 -0
data/lib/service_adaptors/opac.rb +351 -0
data/lib/service_adaptors/open_library.rb +316 -0
data/lib/service_adaptors/open_library_cover.rb +73 -0
data/lib/service_adaptors/primo_service.rb +392 -0
data/lib/service_adaptors/primo_source.rb +78 -0
data/lib/service_adaptors/pubmed.rb +133 -0
data/lib/service_adaptors/request_to_fixture.rb +68 -0
data/lib/service_adaptors/scopus.rb +295 -0
data/lib/service_adaptors/sfx-new.rb +557 -0
data/lib/service_adaptors/sfx.rb +566 -0
data/lib/service_adaptors/sfx_backchannel_record.rb +69 -0
data/lib/service_adaptors/txt_holding_export.rb +32 -0
data/lib/service_adaptors/ulrichs_cover.rb +57 -0
data/lib/service_adaptors/ulrichs_link.rb +47 -0
data/lib/service_adaptors/worldcat.rb +116 -0
data/lib/service_adaptors/worldcat_identities.rb +591 -0
data/lib/tasks/umlaut.rake +134 -0
data/lib/umlaut/default_configuration.rb +5 -0
data/lib/umlaut/routes.rb +136 -0
data/lib/umlaut/version.rb +3 -0
data/lib/umlaut.rb +37 -0
data/lib/umlaut_configurable.rb +343 -0
data/lib/umlaut_http.rb +100 -0
data/lib/xml_schema_helper.rb +109 -0
data/test/dummy/Rakefile +7 -0
data/test/dummy/app/assets/javascripts/application.js +13 -0
data/test/dummy/app/assets/stylesheets/application.css +15 -0
data/test/dummy/app/controllers/application_controller.rb +3 -0
data/test/dummy/app/controllers/umlaut_controller.rb +112 -0
data/test/dummy/app/helpers/application_helper.rb +2 -0
data/test/dummy/app/views/layouts/application.html.erb +14 -0
data/test/dummy/config/application.rb +45 -0
data/test/dummy/config/boot.rb +10 -0
data/test/dummy/config/database-jhu.yml +44 -0
data/test/dummy/config/database.yml +25 -0
data/test/dummy/config/environment.rb +5 -0
data/test/dummy/config/environments/development.rb +34 -0
data/test/dummy/config/environments/production.rb +60 -0
data/test/dummy/config/environments/test.rb +39 -0
data/test/dummy/config/initializers/backtrace_silencers.rb +7 -0
data/test/dummy/config/initializers/inflections.rb +10 -0
data/test/dummy/config/initializers/mime_types.rb +5 -0
data/test/dummy/config/initializers/secret_token.rb +7 -0
data/test/dummy/config/initializers/session_store.rb +8 -0
data/test/dummy/config/initializers/wrap_parameters.rb +14 -0
data/test/dummy/config/locales/en.yml +5 -0
data/test/dummy/config/routes.rb +61 -0
data/test/dummy/config/umlaut_services.yml +237 -0
data/test/dummy/config.ru +4 -0
data/test/dummy/db/migrate/20111228211210_umlaut_init.rb +113 -0
data/test/dummy/db/schema.rb +124 -0
data/test/dummy/log/development.log +12981 -0
data/test/dummy/log/production.log +0 -0
data/test/dummy/public/404.html +26 -0
data/test/dummy/public/422.html +26 -0
data/test/dummy/public/500.html +26 -0
data/test/dummy/public/favicon.ico +0 -0
data/test/dummy/script/rails +6 -0
data/test/dummy/tmp/cache/assets/C5F/340/sprockets%2F99692920160b7a279b86a80415b79db7 +0 -0
data/test/dummy/tmp/cache/assets/C70/4D0/sprockets%2F034ad2036e623081bd352800786dfe80 +0 -0
data/test/dummy/tmp/cache/assets/C73/920/sprockets%2Fd371318f22900492fd180f17c5e2a504 +9268 -0
data/test/dummy/tmp/cache/assets/C80/980/sprockets%2Fc94807409c1523d43e18d25f35d93c41 +0 -0
data/test/dummy/tmp/cache/assets/C8F/780/sprockets%2Fe47e28558116fb5f8038754e60d1961d +11769 -0
data/test/dummy/tmp/cache/assets/CAA/EB0/sprockets%2F1d179210e8b76f1ea63c802688a015e4 +9271 -0
data/test/dummy/tmp/cache/assets/CBB/9C0/sprockets%2F706f28923fb754cad04b9107c89986a1 +0 -0
data/test/dummy/tmp/cache/assets/CBF/B60/sprockets%2F08ca89671549936265dcb673bf02e36f +0 -0
data/test/dummy/tmp/cache/assets/CC9/9F0/sprockets%2F306166316e2cafd13c15e62b51a2339d +0 -0
data/test/dummy/tmp/cache/assets/CF6/F20/sprockets%2F5b2ffa1103079dfd555197838f87a99f +0 -0
data/test/dummy/tmp/cache/assets/CF7/2B0/sprockets%2F25a7c73655bd3598173b39d9f98bcd46 +862 -0
data/test/dummy/tmp/cache/assets/CFE/080/sprockets%2F37fe9f4255baddbd549a659914929398 +0 -0
data/test/dummy/tmp/cache/assets/D22/060/sprockets%2F9aec77b768e91a802d284271c58e2f7e +21357 -0
data/test/dummy/tmp/cache/assets/D32/A10/sprockets%2F13fe41fee1fe35b49d145bcc06610705 +0 -0
data/test/dummy/tmp/cache/assets/D33/6D0/sprockets%2F500129c57f1146e556ec3aacd6cd38c1 +0 -0
data/test/dummy/tmp/cache/assets/D33/FD0/sprockets%2F2ba0b4e6334a77b923e5f770381bb2bf +0 -0
data/test/dummy/tmp/cache/assets/D42/C20/sprockets%2Fbcf14e437b1582bf93b77670acf8e090 +21353 -0
data/test/dummy/tmp/cache/assets/D50/A30/sprockets%2F7d8b294ac433db5d056538f8cf7c66b9 +0 -0
data/test/dummy/tmp/cache/assets/D54/ED0/sprockets%2F71c9fa01091d432b131da3bb73faf3d4 +872 -0
data/test/dummy/tmp/cache/assets/D65/590/sprockets%2Fc1bb92fc3406a126b7dd302edc96d629 +0 -0
data/test/dummy/tmp/cache/assets/D71/6B0/sprockets%2Fde558b71b494cf09b1bf055c8dff0353 +0 -0
data/test/dummy/tmp/cache/assets/D72/610/sprockets%2Fa8c708eeb30ef93de34d755d4f45d023 +859 -0
data/test/dummy/tmp/cache/assets/D76/AD0/sprockets%2Fe2158cde93188cf5ab6457bc6d6602ec +0 -0
data/test/dummy/tmp/cache/assets/D7A/E40/sprockets%2F9622ffcc499a57627cd1bb18fe31b8e4 +11772 -0
data/test/dummy/tmp/cache/assets/D84/210/sprockets%2Fabd0103ccec2b428ac62c94e4c40b384 +0 -0
data/test/dummy/tmp/cache/assets/D9B/770/sprockets%2F8aacf02eb7dbb0949704b28f27b87e0b +0 -0
data/test/dummy/tmp/cache/assets/DA6/A80/sprockets%2F92e26d8e58d5bcc8b8f6c25d1b05b9c1 +0 -0
data/test/dummy/tmp/cache/assets/DE8/790/sprockets%2Fd1333bde2b9aafcc712d11dd09ab35d8 +0 -0
data/test/dummy/tmp/cache/assets/DF7/F30/sprockets%2F7bc16c4109b17fabe29f8ddbbf732d1c +374 -0
data/test/dummy/tmp/cache/assets/E03/570/sprockets%2F493bdc0ac14cd4f57fdfe4253f992bde +0 -0
data/test/dummy/tmp/cache/assets/E04/890/sprockets%2F2f5173deea6c795b8fdde723bb4b63af +0 -0
data/test/dummy/tmp/cache/assets/E0B/4B0/sprockets%2F7988df51a61c81ce6ede4a2d4c8cce4f +377 -0
data/test/dummy/tmp/cache/assets/E5F/960/sprockets%2Fdc007b6cad5c7ef08e33ec28cfff0ef6 +0 -0
data/test/fixtures/dispatched_services.yml +5 -0
data/test/fixtures/permalinks.yml +5 -0
data/test/fixtures/referent_values.yml +1734 -0
data/test/fixtures/referents.yml +156 -0
data/test/fixtures/requests.yml +284 -0
data/test/fixtures/service_responses.yml +5 -0
data/test/fixtures/sfx_urls.yml +4 -0
data/test/performance/browsing_test.rb +9 -0
data/test/test_helper.rb +10 -0
data/test/umlaut_test.rb +7 -0
data/test/unit/aleph_patron_test.rb +39 -0
data/test/unit/aleph_record_benchmarks.rb +28 -0
data/test/unit/aleph_record_test.rb +30 -0
data/test/unit/aws_product_sign_test.rb +93 -0
data/test/unit/collection_test.rb +76 -0
data/test/unit/google_book_search_test.rb +101 -0
data/test/unit/primo_searcher_test.rb +403 -0
data/test/unit/primo_service_test.rb +939 -0
data/test/unit/primo_ws_test.rb +131 -0
data/test/unit/service_response_test.rb +9 -0
data/test/unit/service_test.rb +33 -0
metadata +580 -0

data/lib/service_adaptors/elsevier_cover.rb ADDED Viewed

@@ -0,0 +1,57 @@
+# Elsevier provides publically available and linkable sample cover images
+# for journals they publish. Thanks Elsevier! This service does nothing
+# more than take an ISSN and look for a match from Elsevier.
+class ElsevierCover < Service
+  require 'open-uri'
+  def service_types_generated
+    return [ServiceTypeValue[:cover_image]]
+  end
+  def initialize(config)
+    #@base_url = "http://www1.elsevier.com/inca/covers/store/issn/"
+    @base_url = "http://www.extranet.elsevier.com/inca_covers_store/issn/"
+    super(config)
+  end
+  def handle(request)
+    issn = request.referent.issn
+    # We need an ISSN
+    return request.dispatched(self, true) unless issn
+    # No hyphens please
+    issn = issn.gsub(/[^0-9X]/, '')
+    check_url = @base_url + issn + '.gif'
+    # does it exist?
+    if ( url_resolves(check_url)   )
+       request.add_service_response(:service => self,
+                                    :service_type_value => ServiceTypeValue[:cover_image] ,
+                                    :url => check_url,
+                                    :size => "medium" )
+    end
+    return request.dispatched(self, true)
+  end
+  def url_resolves(url)
+    uri_obj = URI.parse(url)
+    response = Net::HTTP.start(uri_obj.host, uri_obj.port) {|http|
+      http.head(uri_obj.request_uri)
+    }
+    if (response.kind_of?( Net::HTTPSuccess  ))
+      return true
+    elsif ( response.kind_of?(Net::HTTPNotFound))
+      return false
+    else
+      # unexpected condition, raise
+      response.value
+    end
+  end
+end

data/lib/service_adaptors/email_export.rb ADDED Viewed

@@ -0,0 +1,10 @@
+class EmailExport < AjaxExport
+  def initialize(config)
+    @display_text ||= "Email"
+    @form_controller ||= "export_email"
+    @form_action ||= "email"
+    super(config)
+  end
+end

data/lib/service_adaptors/ezproxy.rb ADDED Viewed

@@ -0,0 +1,171 @@
+#  By default, proxies a URL after checking the EZProxy API to see if
+#  it's proxy-able. But you can set the config param precheck_with_api
+#  to false, and then this will simply automatically proxy all links
+#  from umlaut responses.  That is useful if you have your EZProxy
+#  server set to automatically redirect non-proxyable URLs to the original
+#  non-proxied version, the API check may not be neccesary.
+# Required parameters:
+#   proxy_server: hostname of EZProxy instance (no "http://", just hostname)
+#
+#   optional params:
+#   proxy_password (the ProxyURLPassword  parameter in ezproxy.cfg; must be set
+#                   to turn on proxy url api feature ).
+#   proxy_url_path: defaults to /proxy_url, the default ezproxy path to call api
+#   exclude_hosts: array of hosts to exclude from proxying _even if_ found in
+#                  ezproxy config. Each entry can be a string, in which
+#                  case it must match host portion of url exactly. Or it can
+#                  be a regexp, which will be tested against entire url.
+#                  (supply a string inside // markers. eg '/regexp/' ).
+#
+#   This service is a link_out_filter service, it must be setup in your
+#   services.yml with "task: link_out_filter ".
+class Ezproxy < Service
+  required_config_params :proxy_server
+  require 'rexml/document'
+  require 'uri'
+  require 'net/http'
+  require 'cgi'
+  def initialize(config)
+    @precheck_with_api = true
+    @display_name = "EZProxy"
+    @proxy_login_path = "/login"
+    super(config)
+    @proxy_url_path ||= "/proxy_url"
+    @proxy_url_path = "/" + @proxy_url_path unless @proxy_url_path[0,1] = '/'
+    @exclude ||= []
+  end
+  # This is meant to be called as task:link_out_filter, it doesn't have an
+  # implementation for handle, it implements link_out_filter() instead.
+  def handle(request)
+     raise "Not implemented."
+  end
+  # Hook method called by Umlaut.
+  # Returns a proxied url if it should be proxied, or nil if the url
+  # can not or does not need to be proxied.
+  def link_out_filter(orig_url, service_response, other_args = {})
+    # remove trailing or leading whitespace from url, it makes it
+    # an illegal URL anyway, but maybe we can rescue it? Marc 856's
+    # sometimes have accidental trailing whitespace.
+    orig_url = orig_url.strip
+    # bad uri? Forget it.
+    return nil unless valid_url?( orig_url )
+    # If it's already proxied, leave it alone.
+    return nil if already_proxied(orig_url)
+    return nil if excluded?(orig_url)
+    new_url = nil
+    if @precheck_with_api
+      new_url =  check_proxy_urls( [orig_url] ).values[0]
+    else
+      new_url =  auto_proxy_url(orig_url)
+    end
+    return new_url
+  end
+  def valid_url?(url)
+    begin
+      raise Exception.new("Empty url!") if url.blank?
+      URI.parse( url )
+      return true
+    rescue Exception => e
+      Rails.logger.error("Bad uri sent to ezproxy service. Can not parse. url: <#{url}>")
+      return false
+    end
+  end
+  # see @exclude config parameter.
+  def excluded?(url)
+    return false if @exclude.blank?
+    @exclude.each do |entry|
+      if ((entry[0,1] == '/') && (entry[entry.length()-1 ,1 ] == '/'))
+        # regexp. Match against entire url.
+        re = Regexp.new( entry )
+        return true if re =~ url
+      elsif (entry.kind_of? Regexp)
+        return true if entry =~ url
+      else
+        # ordinary string. Just match against host.
+        host = URI.parse(url).host
+        return true if host == entry
+      end
+    end
+    # looped through them all, no match?
+    return false
+  end
+  # pass in a url, this just mindlessly sends it through your
+  # ezproxy instance.
+  def auto_proxy_url(url)
+    return "http://" + @proxy_server + @proxy_login_path + "?qurl=" + CGI.escape(url)
+  end
+  # Pass in an array of URLs. Will determine if they are proxyable by EZProxy.
+  # Returns a hash, where the key is the original URL, and the value is the
+  # proxied url---or nil if could not be proxied.
+  def check_proxy_urls(urls)
+    url_doc = REXML::Document.new
+    doc_root = url_doc.add_element "proxy_url_request", {"password"=>@proxy_password}
+    urls_elem = doc_root.add_element "urls"
+    urls.each { | link |
+      url_elem = urls_elem.add_element "url"
+      url_elem.text = link
+    }
+    begin
+      resp = Net::HTTP.post_form(URI.parse('http://' + @proxy_server+@proxy_url_path), {"xml"=>url_doc.to_s})
+      proxy_doc = REXML::Document.new resp.body
+    rescue Timeout::Error
+      Rails.logger.error "Timed out connecting to EZProxy"
+      return proxy_links
+    rescue Exception => e
+      Rails.logger.error "EZProxy error, NOT proxying URL + #{e}"
+    end
+    return_hash = {}
+    REXML::XPath.each(proxy_doc, "/proxy_url_response/proxy_urls/url") { | u |
+      unless (u && u.get_text) # if u is empty... weird, but skip it.
+        Rails.logger.error "EZProxy response seems to be missing some pieces.\n   Urls requested: #{urls.join(',')}\n   EZProxy api request xml: #{url_doc.to_s}\n   EZProxy response: #{proxy_doc.to_s}"
+      end
+      orig_url = u.get_text.value
+      return_hash[orig_url] = nil
+      if u.attributes["proxy"] == "true"
+        proxied_url = u.attributes["scheme"]+"://"+u.attributes["hostname"]+":"+u.attributes["port"]+u.attributes["login_path"]
+        if u.attributes["encode"] == "true"
+          proxied_url += CGI::escape(u.get_text.value)
+        else
+          proxied_url += u.get_text.value
+        end
+        return_hash[orig_url] = proxied_url
+      end
+    }
+    return return_hash
+  end
+  # pass in url as a string. Return true if the
+  # url is already pointing to the proxy server
+  # configured.
+  def already_proxied(url)
+    uri_obj = URI.parse(url)
+    return uri_obj.host == @proxy_server && uri_obj.path == @proxy_login_path
+  end
+end

data/lib/service_adaptors/google_book_search.rb ADDED Viewed

@@ -0,0 +1,442 @@
+# Service that searches Google Book Search to determine viewability.
+# It searches by ISBN, OCLCNUM and/or LCCN.
+#
+# Uses Google Books API, http://code.google.com/apis/books/docs/v1/getting_started.html
+# http://code.google.com/apis/books/docs/v1/using.html
+#
+# If a full view is available it returns a fulltext service response.
+# If partial view is available, return as "limited experts".
+# If no view at all, still includes a link in highlighted_links, to pay
+#   lip service to google branding requirements.
+# Unfortunately there is no way tell which of the noview
+# books provide search, although some do -- search is advertised if full or
+# partial view is available.
+#
+# If a thumbnail_url is returned in the responses, a cover image is displayed.
+#
+# = Google API Key
+#
+# Setting an api key in :api_key STRONGLY recommended, or you'll
+# probably get rate limited (not clear what the limit is with no api
+# key supplied). You may have to ask for higher rate limit for your api
+# key than the default 1000/day, which you can do through the google
+# api console:
+# https://code.google.com/apis/console
+#
+# I requested 50k with this message, and was quickly approved with no questions
+# "Services for academic library (Johns Hopkins Libraries) web applications  to match Google Books availability to items presented by our catalog, OpenURL link resolver,  and other software. "
+#
+# Recommend setting your 'per user limit' to something crazy high, as well
+# as requesting more quota.
+class GoogleBookSearch < Service
+  require 'multi_json'
+  # Identifiers used in API response to indicate viewability level
+  ViewFullValue = 'ALL_PAGES'
+  ViewPartialValue = 'PARTIAL'
+  # None might also be 'snippet', but Google doesn't want to distinguish
+  ViewNoneValue = 'NO_PAGES'
+  ViewUnknownValue = 'UNKNOWN'
+  include MetadataHelper
+  include UmlautHttp
+  # required params
+  # attr_reader is important for tests
+  attr_reader :url, :display_name, :num_full_views
+  def service_types_generated
+    types= [
+      ServiceTypeValue[:fulltext],
+      ServiceTypeValue[:cover_image],
+      ServiceTypeValue[:highlighted_link],
+      ServiceTypeValue[:search_inside],
+      ServiceTypeValue[:excerpts]]
+    types.push(ServiceTypeValue[:referent_enhance]) if @referent_enhance
+    return types
+  end
+  def initialize(config)
+    @url = 'https://www.googleapis.com/books/v1/volumes?q='
+    @display_name = 'Google Books'
+    # number of full views to show
+    @num_full_views = 1
+    # default on, to enhance our metadata with stuff from google
+    @referent_enhance = true
+    # google api key strongly recommended, otherwise you'll
+    # probably get rate limited.
+    @api_key = nil
+    @credits = {
+      "Google Books" => "http://books.google.com/"
+    }
+    super(config)
+  end
+  def handle(request)
+    bibkeys = get_bibkeys(request.referent)
+    return request.dispatched(self, true) if bibkeys.nil?
+    data = do_query(bibkeys, request)
+    if data.blank? || data["error"]
+      # fail fatal
+      return request.dispatched(self, false)
+    end
+    # 0 hits, return.
+    return request.dispatched(self, true) if data["totalItems"] == 0
+    enhance_referent(request, data) if @referent_enhance
+    #return full views first
+    full_views_shown = create_fulltext_service_response(request, data)
+    # Add search_inside link if appropriate
+    add_search_inside(request, data)
+    # only if no full view is shown, add links for partial view or noview
+    unless full_views_shown
+      do_web_links(request, data)
+    end
+    thumbnail_url = find_thumbnail_url(data)
+    if thumbnail_url
+      add_cover_image(request, thumbnail_url)
+    end
+    return request.dispatched(self, true)
+  end
+  # Take the FIRST hit from google, and use it's values to enhance
+  # our metadata. Will NOT overwrite existing data.
+  def enhance_referent(request, data)
+    entry = data["items"].first
+    if (volumeInfo = entry["volumeInfo"])
+      title = volumeInfo["title"]
+      title += ": #{volumeInfo["subtitle"]}" if (title && volumeInfo["subtitle"])
+      element_enhance(request, "title", title)
+      element_enhance(request, "au", volumeInfo["authors"].first) if volumeInfo["authors"]
+      element_enhance(request, "pub", volumeInfo["publisher"])
+      element_enhance(request, "tpages", volumeInfo["pageCount"])
+      if (date = volumeInfo["publishedDate"] && date =~ /^(\d\d\d\d)/)
+        element_enhance(request, "date", $1)
+      end
+      # LCCN is only rarely included, but is sometimes, eg:
+      # "industryIdentifiers"=>[{"type"=>"OTHER", "identifier"=>"LCCN:72627172"}],
+      # Also "LCCN:76630875"
+      #
+      # And sometimes OCLC number like:
+      # "industryIdentifiers"=>[{"type"=>"OTHER", "identifier"=>"OCLC:12345678"}],
+      #
+      (volumeInfo["industryIdentifiers"] || []).each do |hash|
+        if hash["type"] == "ISBN_13"
+          element_enhance(request, "isbn", hash["identifier"])
+        elsif hash["type"] == "OTHER" && hash["identifier"].starts_with?("LCCN:")
+          lccn = normalize_lccn(  hash["identifier"].slice(5, hash["identifier"].length)  )
+          request.referent.add_identifier("info:lccn/#{lccn}")
+        elsif hash["type"] == "OTHER" && hash["identifier"].starts_with?("OCLC:")
+          oclcnum = normalize_lccn(  hash["identifier"].slice(5, hash["identifier"].length)  )
+          request.referent.add_identifier("info:oclcnum/#{oclcnum}")
+        end
+      end
+    end
+  end
+  # Will not over-write existing referent values.
+  def element_enhance(request, rft_key, value)
+    if (value)
+      request.referent.enhance_referent(rft_key, value.to_s, true, false, :overwrite => false)
+    end
+  end
+  # returns nil or escaped string of bibkeys
+  # to increase the chances of good hit, we send all available bibkeys
+  # and later dedupe by id.
+  # FIXME Assumes we only have one of each kind of identifier.
+  def get_bibkeys(rft)
+    isbn = get_identifier(:urn, "isbn", rft)
+    oclcnum = get_identifier(:info, "oclcnum", rft)
+    lccn = get_lccn(rft)
+    # Google doesn't officially support oclc/lccn search, but does
+    # index as token with prefix smashed up right with identifier
+    # eg http://books.google.com/books/feeds/volumes?q=OCLC32012617
+    #
+    # Except turns out doing it as a phrase search is important! Or
+    # google's normalization/tokenization does odd things.
+    keys = []
+    keys << ('isbn:' + isbn) if isbn
+    keys << ('"' + "OCLC" + oclcnum + '"') if oclcnum
+    # Only use LCCN if we've got nothing else, it returns many
+    # false positives.
+    keys << ('"' + 'LCCN' + lccn + '"') if lccn && keys.length == 0
+    return nil if keys.empty?
+    keys = CGI.escape( keys.join(' OR ') )
+    return keys
+  end
+  def do_query(bibkeys, request)
+    headers = build_headers(request)
+    link = @url + bibkeys
+    if @api_key
+      link += "&key=#{@api_key}"
+    end
+    # Add on limit to only request books, not magazines.
+    link += "&printType=books"
+    Rails.logger.debug("GoogleBookSearch requesting: #{link}")
+    response = http_fetch(link, :headers => headers, :raise_on_http_error_code => false)
+    data = MultiJson.decode(response.body)
+    # If Google gives us an error cause it says it can't geo-locate,
+    # remove the IP, log warning, and try again.
+    if (data["error"] && data["error"]["errors"] &&
+        data["error"]["errors"].find {|h| h["reason"] == "unknownLocation"} )
+      Rails.logger.warn("GoogleBookSearch: geo-locate error, retrying without X-Forwarded-For: '#{link}' headers: #{headers.inspect} #{response.inspect}\n    #{data.inspect}")
+      response = http_fetch(link, :raise_on_http_error_code => false)
+      data = MultiJson.decode(response.body)
+    end
+    if (! response.kind_of?(Net::HTTPSuccess)) || data["error"]
+      Rails.logger.error("GoogleBookSearch error: '#{link}' headers: #{headers.inspect} #{response.inspect}\n    #{data.inspect}")
+    end
+    return data
+  end
+  # We don't need to fake a proxy request anymore, but we still
+  # include X-Forwarded-For so google can return location-appropriate
+  # availability. If there's an existing X-Forwarded-For, we respect
+  # it and add on to it.
+  def build_headers(request)
+    original_forwarded_for = nil
+    if (request.http_env && request.http_env['HTTP_X_FORWARDED_FOR'])
+      original_forwarded_for = request.http_env['HTTP_X_FORWARDED_FOR']
+    end
+    # we used to prepare a comma seperated list in x-forwarded-for if
+    # we had multiple requests, as per the x-forwarded-for spec, but I
+    # think Google doesn't like it.
+    ip_address = (original_forwarded_for ?
+        original_forwarded_for  :
+        request.client_ip_addr.to_s)
+    return {} if ip_address.blank?
+    # If we've got a comma-seperated list from an X-Forwarded-For, we
+    # can't send it on to google, google won't accept that, just take
+    # the first one in the list, which is actually the ultimate client
+    # IP. split returns the whole string if seperator isn't found, convenient.
+    ip_address = ip_address.split(",").first
+    # If all we have is an internal/private IP from the internal network,
+    # do NOT send that to Google, or Google will give you a 503 error
+    # and refuse to process your request, as of 7 sep 2011. sigh.
+    # Also if it doesn't look like an IP at all, forget it, don't send it.
+    if ((! ip_address =~ /^\d+\.\d+\.\d+\/\d$/) ||
+       ip_address.start_with?("10.") ||
+       ip_address.start_with?("172.16") ||
+       ip_address.start_with?("192.168"))
+       return {}
+    else
+      return {'X-Forwarded-For' => ip_address }
+    end
+  end
+  def find_entries(gbs_response, viewabilities)
+    unless (viewabilities.kind_of?(Array))
+      viewabilities = [viewabilities]
+    end
+    entries = gbs_response["items"].find_all do |entry|
+      viewability = entry["accessInfo"]["viewability"]
+      (viewability && viewabilities.include?(viewability))
+    end
+    return entries
+  end
+  # We only create a fulltext service response if we have a full view.
+  # We create only as many full views as are specified in config.
+  def create_fulltext_service_response(request, data)
+    display_name = @display_name
+    full_views = find_entries(data, ViewFullValue)
+    return nil if full_views.empty?
+    count = 0
+    full_views.each do |fv|
+      uri = fv["volumeInfo"]["previewLink"]
+      request.add_service_response(
+          :service => self,
+          :display_text => display_name,
+          :url => remove_query_context(uri),
+          :service_type_value =>  :fulltext
+      )
+      count += 1
+      break if count == @num_full_views
+    end
+    return true
+  end
+  def add_search_inside(request, data)
+    # Just take the first one we find, if multiple
+    searchable_view = find_entries(data, [ViewFullValue, ViewPartialValue])[0]
+    if ( searchable_view )
+      url = searchable_view["volumeInfo"]["infoLink"]
+      request.add_service_response(
+        :service => self,
+        :display_text=>@display_name,
+        :url=> remove_query_context(url),
+        :service_type_value => :search_inside
+       )
+    end
+  end
+  # create highlighted_link service response for partial and noview
+  # Only show one web link. prefer a partial view over a noview.
+  # Some noviews have a snippet/search, but we have no way to tell.
+  def do_web_links(request, data)
+    # some noview items will have a snippet view, but we have no way to tell
+    info_views = find_entries(data, ViewPartialValue)
+    viewability = ViewPartialValue
+    if info_views.blank?
+      info_views = find_entries(data, ViewNoneValue)
+      viewability = ViewNoneValue
+    end
+    # Shouldn't ever get to this point, but just in case
+    return nil if info_views.blank?
+    url = ''
+    iv = info_views.first
+    type = nil
+    if (viewability == ViewPartialValue &&
+        url = iv["volumeInfo"]["previewLink"])
+      display_text = @display_name
+      type = ServiceTypeValue[:excerpts]
+    else
+      url = url = iv["volumeInfo"]["infoLink"]
+      display_text = "Book Information"
+      type = ServiceTypeValue[:highlighted_link]
+    end
+    request.add_service_response(
+        :service=>self,
+        :url=> remove_query_context(url),
+        :display_text=>display_text,
+        :service_type_value => type
+     )
+  end
+  # Not all responses have a thumbnail_url. We look for them and return the 1st.
+  def find_thumbnail_url(data)
+    entries = data["items"].collect do |entry|
+      entry["volumeInfo"]["imageLinks"]["thumbnail"] if entry["volumeInfo"] && entry["volumeInfo"]["imageLinks"]
+    end
+    # removenill values
+    entries.compact!
+    # pick the first of the available thumbnails, or nil
+    return entries[0]
+  end
+  def add_cover_image(request, url)
+    zoom_url = url.clone
+    # if we're sent to a page other than the frontcover then strip out the
+    # page number and insert front cover
+    zoom_url.sub!(/&pg=.*?&/, '&printsec=frontcover&')
+    # hack out the 'curl' if we can
+    zoom_url.sub!('&edge=curl', '')
+    request.add_service_response(
+        :service=>self,
+        :display_text => 'Cover Image',
+        :url => zoom_url,
+        :size => "medium",
+        :service_type_value => :cover_image
+    )
+  end
+  # Google gives us URL to the book that contains a 'dq' param
+  # with the original query, which for us is an ISSN/LCCN/OCLCnum query,
+  # which we don't actually want to leave in there.
+  def remove_query_context(url)
+    url.sub(/&dq=[^&]+/, '')
+  end
+  # Catch url_for call for search_inside, because we're going to redirect
+  def response_url(service_response, submitted_params)
+    if ( ! (service_response.service_type_value.name == "search_inside" ))
+      return super(service_response, submitted_params)
+    else
+      # search inside!
+      base = service_response[:url]
+      query = CGI.escape(submitted_params["query"] || "")
+      # attempting to reverse engineer a bit to get 'snippet'
+      # style results instead of 'onepage' style results.
+      # snippet seem more user friendly, and are what google's own
+      # interface seems to give you by default. but 'onepage' is the
+      # default from our deep link, but if we copy the JS hash data,
+      # it looks like we can get Google to 'snippet'.
+      url = base + "&q=#{query}#v=snippet&q=#{query}&f=false"
+      return url
+    end
+  end
+end
+# Important to quote search, see: "OCLC1246014"
+# Test WorldCat links
+# FIXME: This produces two 'noview' links because the ids don't match.
+#   This might be as good as we can do though, unless we want to only ever show
+#   one 'noview' link. Notice that the metadata does differ between the two.
+# http://localhost:3000/resolve?url_ver=Z39.88-2004&rfr_id=info%3Asid%2Fworldcat.org%3Aworldcat&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&req_dat=%3Csessionid%3E&rft_id=info%3Aoclcnum%2F34576818&rft_id=urn%3AISBN%3A9780195101386&rft_id=urn%3AISSN%3A&rft.aulast=Twain&rft.aufirst=Mark&rft.auinitm=&rft.btitle=The+prince+and+the+pauper&rft.atitle=&rft.date=1996&rft.tpages=&rft.isbn=9780195101386&rft.aucorp=&rft.place=New+York&rft.pub=Oxford+University+Press&rft.edition=&rft.series=&rft.genre=book&url_ver=Z39.88-2004
+#
+# Snippet view returns noview through the API
+# http://localhost:3000/resolve?rft.isbn=0155374656
+#
+# full view example, LCCN 07020699  ; OCLC: 1246014