RubyGems - gonzui - Versions diffs - 1.2 - Mend

gonzui 1.2

Files changed (116) hide show

data/AUTHORS.txt +9 -0
data/History.txt +5539 -0
data/Manifest.txt +115 -0
data/PostInstall.txt +17 -0
data/README.rdoc +149 -0
data/Rakefile +28 -0
data/bin/gonzui-db +167 -0
data/bin/gonzui-import +177 -0
data/bin/gonzui-remove +58 -0
data/bin/gonzui-search +68 -0
data/bin/gonzui-server +176 -0
data/bin/gonzui-update +53 -0
data/data/gonzui/catalog/catalog.ja +80 -0
data/data/gonzui/doc/favicon.ico +0 -0
data/data/gonzui/doc/folder.png +0 -0
data/data/gonzui/doc/gonzui.css +279 -0
data/data/gonzui/doc/gonzui.js +111 -0
data/data/gonzui/doc/text.png +0 -0
data/data/gonzuirc.sample +29 -0
data/ext/autopack/autopack.c +88 -0
data/ext/autopack/extconf.rb +3 -0
data/ext/delta/delta.c +147 -0
data/ext/delta/extconf.rb +5 -0
data/ext/texttokenizer/extconf.rb +5 -0
data/ext/texttokenizer/texttokenizer.c +93 -0
data/ext/xmlformatter/extconf.rb +5 -0
data/ext/xmlformatter/xmlformatter.c +207 -0
data/lib/gonzui.rb +59 -0
data/lib/gonzui/apt.rb +193 -0
data/lib/gonzui/bdbdbm.rb +118 -0
data/lib/gonzui/cmdapp.rb +14 -0
data/lib/gonzui/cmdapp/app.rb +175 -0
data/lib/gonzui/cmdapp/search.rb +134 -0
data/lib/gonzui/config.rb +117 -0
data/lib/gonzui/content.rb +19 -0
data/lib/gonzui/dbm.rb +673 -0
data/lib/gonzui/deindexer.rb +162 -0
data/lib/gonzui/delta.rb +49 -0
data/lib/gonzui/extractor.rb +347 -0
data/lib/gonzui/fetcher.rb +309 -0
data/lib/gonzui/gettext.rb +144 -0
data/lib/gonzui/importer.rb +84 -0
data/lib/gonzui/indexer.rb +316 -0
data/lib/gonzui/info.rb +80 -0
data/lib/gonzui/license.rb +100 -0
data/lib/gonzui/logger.rb +48 -0
data/lib/gonzui/monitor.rb +177 -0
data/lib/gonzui/progressbar.rb +235 -0
data/lib/gonzui/remover.rb +38 -0
data/lib/gonzui/searcher.rb +330 -0
data/lib/gonzui/searchquery.rb +235 -0
data/lib/gonzui/searchresult.rb +111 -0
data/lib/gonzui/updater.rb +254 -0
data/lib/gonzui/util.rb +415 -0
data/lib/gonzui/vcs.rb +128 -0
data/lib/gonzui/webapp.rb +25 -0
data/lib/gonzui/webapp/advsearch.rb +123 -0
data/lib/gonzui/webapp/filehandler.rb +24 -0
data/lib/gonzui/webapp/jsfeed.rb +61 -0
data/lib/gonzui/webapp/markup.rb +445 -0
data/lib/gonzui/webapp/search.rb +269 -0
data/lib/gonzui/webapp/servlet.rb +319 -0
data/lib/gonzui/webapp/snippet.rb +155 -0
data/lib/gonzui/webapp/source.rb +37 -0
data/lib/gonzui/webapp/stat.rb +137 -0
data/lib/gonzui/webapp/top.rb +63 -0
data/lib/gonzui/webapp/uri.rb +140 -0
data/lib/gonzui/webapp/webrick.rb +48 -0
data/script/console +10 -0
data/script/destroy +14 -0
data/script/generate +14 -0
data/script/makemanifest.rb +21 -0
data/tasks/extconf.rake +13 -0
data/tasks/extconf/autopack.rake +43 -0
data/tasks/extconf/delta.rake +43 -0
data/tasks/extconf/texttokenizer.rake +43 -0
data/tasks/extconf/xmlformatter.rake +43 -0
data/test/_external_tools.rb +13 -0
data/test/_test-util.rb +142 -0
data/test/foo/Makefile.foo +66 -0
data/test/foo/bar.c +5 -0
data/test/foo/bar.h +6 -0
data/test/foo/foo.c +25 -0
data/test/foo/foo.spec +33 -0
data/test/test_apt.rb +42 -0
data/test/test_autopack_extn.rb +7 -0
data/test/test_bdbdbm.rb +79 -0
data/test/test_cmdapp-app.rb +35 -0
data/test/test_cmdapp-search.rb +99 -0
data/test/test_config.rb +28 -0
data/test/test_content.rb +15 -0
data/test/test_dbm.rb +171 -0
data/test/test_deindexer.rb +50 -0
data/test/test_delta.rb +66 -0
data/test/test_extractor.rb +78 -0
data/test/test_fetcher.rb +75 -0
data/test/test_gettext.rb +50 -0
data/test/test_gonzui.rb +11 -0
data/test/test_helper.rb +10 -0
data/test/test_importer.rb +56 -0
data/test/test_indexer.rb +37 -0
data/test/test_info.rb +82 -0
data/test/test_license.rb +49 -0
data/test/test_logger.rb +60 -0
data/test/test_monitor.rb +23 -0
data/test/test_searcher.rb +37 -0
data/test/test_searchquery.rb +27 -0
data/test/test_searchresult.rb +43 -0
data/test/test_texttokenizer.rb +47 -0
data/test/test_updater.rb +95 -0
data/test/test_util.rb +149 -0
data/test/test_vcs.rb +61 -0
data/test/test_webapp-markup.rb +42 -0
data/test/test_webapp-util.rb +19 -0
data/test/test_webapp-xmlformatter.rb +19 -0
metadata +291 -0

@@ -0,0 +1,309 @@
+#
+# fetcher.rb - fetch contents from various sources
+#
+# Copyright (C) 2004-2005 Satoru Takabayashi <satoru@namazu.org>
+#     All rights reserved.
+#     This is free software with ABSOLUTELY NO WARRANTY.
+#
+# You can redistribute it and/or modify it under the terms of
+# the GNU General Public License version 2.
+#
+require 'open-uri'
+require 'webrick/httputils'
+require 'ftools'
+module Gonzui
+  class FetcherError < GonzuiError; end
+  class FetchFailed < FetcherError; end
+  module Fetcher
+    extend Util
+    FetcherRegistory = {}
+    module_function
+    def new(config, source_uri, options = {})
+      klass = FetcherRegistory[source_uri.scheme]
+      if klass.nil?
+        raise FetcherError.new("#{source_uri.scheme}: unsupported scheme")
+      end
+      if source_uri.path.nil?
+        raise FetcherError.new("#{source_uri.to_s}: malformed URI")
+      end
+      fetcher = klass.new(config, source_uri, options)
+      if fetcher.need_extraction? # fallback to FileFetcher
+        extractor = fetcher.get_extractor
+        directory = extractor.extract
+        fetcher.finish
+        source_uri = URI.from_path(directory)
+        fetcher = FileFetcher.new(config, source_uri, options)
+        fetcher.add_finishing_proc(lambda { extractor.clean })
+      end
+      return fetcher
+    end
+    def register(klass)
+      FetcherRegistory[klass.scheme] = klass
+    end
+  end
+  class AbstractFetcher
+    include Util
+    def initialize(config, source_uri, options = {})
+      @config = config
+      @source_uri = source_uri
+      @exclude_pattern = (options[:exclude_pattern] or @config.exclude_pattern)
+      @finishing_procs = []
+      @base_uri = source_uri
+    end
+    public
+    def add_finishing_proc (proc)
+      @finishing_procs.push(proc)
+    end
+    def collect
+      raise NotImplementedError.new
+    end
+    def exclude?(relative_path)
+      @exclude_pattern.match(relative_path)
+    end
+    def fetch(relative_path)
+      raise NotImplementedError.new
+    end
+    def finish
+      @finishing_procs.each {|proc| proc.call }
+    end
+    def get_extractor
+      raise NotImplementedError.new
+    end
+    def need_extraction?
+      raise NotImplementedError.new
+    end
+    def package_name
+      File.basename(@base_uri.path)
+    end
+  end
+  class FileFetcher < AbstractFetcher
+    def self.scheme
+      "file"
+    end
+    def initialize(config, source_uri, options)
+      super(config, source_uri, options)
+      begin
+        File.ftype(source_uri.path)
+      rescue => e
+        raise FetchFailed.new(e.message)
+      end
+    end
+    private
+    def restore_path(relative_path)
+      File.join(@base_uri.path, relative_path)
+    end
+    public
+    def need_extraction?
+      not File.directory?(@source_uri.path)
+    end
+    def get_extractor
+      return Extractor.new(@config, @source_uri.path)
+    end
+    def fetch(relative_path)
+      path = restore_path(relative_path)
+      content = File.read(path)
+      mtime = File.mtime(path)
+      return Content.new(content, mtime, path)
+    end
+    def collect
+      directory = @base_uri.path
+      relative_paths = []
+      Dir.all_files(directory).map {|file_name|
+        next if exclude?(file_name)
+        relative_path = File.relative_path(file_name, directory)
+        relative_paths.push(relative_path)
+      }
+      return relative_paths
+    end
+    Fetcher.register(self)
+  end
+  # FIXME: very ad hoc implementation
+  class HTTPFetcher < AbstractFetcher
+    include TemporaryDirectoryUtil
+    def self.scheme
+      "http"
+    end
+    def initialize(config, source_uri, options)
+      super(config, source_uri, options)
+      begin
+        open(source_uri.to_s) {|f|
+          @content = f.read
+          @content_type = f.content_type
+          @base_uri = f.base_uri
+        }
+      rescue OpenURI::HTTPError => e
+        raise FetchFailed.new("#{source_uri.to_s}: #{e.message}")
+      end
+      # http://example.com/foo/index.html => http://example.com/foo/
+      unless /\/$/.match(@base_uri.path) #/
+        @base_uri.path = File.dirname(@base_uri.path) + "/"
+      end
+      set_temporary_directory(@config.temporary_directory)
+    end
+    def restore_uri(relative_path)
+      u = @base_uri.to_s + relative_path
+      URI.parse(u)
+    end
+    public
+    def need_extraction?
+      @content_type != "text/html"
+    end
+    def get_extractor
+      prepare_temporary_directory
+      tmp_name = File.join(self.temporary_directory,
+                           File.basename(@source_uri.path))
+      File.open(tmp_name, "w") {|f| f.write(@content) }
+      add_finishing_proc(lambda { clean_temporary_directory })
+      return Extractor.new(@config, tmp_name)
+    end
+    def fetch(relative_path)
+      uri = restore_uri(relative_path)
+      content = mtime = nil
+      open(uri.to_s) {|f|
+        content = f.read
+        mtime = f.last_modified
+      }
+      return Content.new(content, mtime)
+    end
+    def collect
+      relative_paths = []
+      @content.scan(/href=(["'])(.*?)\1/i).each {|qmark, link|
+        u = URI.parse(link)
+        next if u.path.nil?
+        u.path.chomp!("/")
+        next unless u.relative?
+        next if /^\./.match(u.path)
+        next if exclude?(u.path)
+        relative_paths.push(u.path)
+      }
+      return relative_paths
+    end
+    Fetcher.register(self)
+  end
+  class AptFetcher < AbstractFetcher
+    def self.scheme
+      "apt-get"
+    end
+    def need_extraction?
+      true
+    end
+    def get_extractor
+      package_name = @source_uri.path.prechop
+      return AptGet.new(@config, package_name)
+    end
+    Fetcher.register(self)
+  end
+  class CVSFetcher < AbstractFetcher
+    def self.scheme
+      "cvs"
+    end
+    def need_extraction?
+      true
+    end
+    def get_extractor
+      query = WEBrick::HTTPUtils.parse_query(@source_uri.query)
+      prefix = query["prefix"]
+      mozule = query["module"]
+      assert_non_nil(mozule)
+      root = @source_uri.path
+      root = @source_uri.host + ":" + root if @source_uri.host
+      root = prefix + "@" + root if prefix
+      return CVS.new(@config, root, mozule)
+    end
+    Fetcher.register(self)
+  end
+  class SubversionFetcher < AbstractFetcher
+    def self.scheme
+      "svn"
+    end
+    def need_extraction?
+      true
+    end
+    def get_extractor
+      query = WEBrick::HTTPUtils.parse_query(@source_uri.query)
+      mozule = query["module"]
+      assert_non_nil(mozule)
+      uri = @source_uri.dup
+      uri.scheme = query["original_scheme"] if query["original_scheme"]
+      uri.query = nil
+      root = uri.to_s
+      # FIXME: kludge for replacing file:/home/... ->
+      # file:///home/... because subversion doesn't allow
+      # the former URI.
+      root.gsub!(%r!^file:/+!, "file:///") if uri.scheme == "file"
+      return Subversion.new(@config, root, mozule)
+    end
+    Fetcher.register(self)
+  end
+  class GitFetcher < AbstractFetcher
+    def self.scheme
+      "git"
+    end
+    def need_extraction?
+      true
+    end
+    def get_extractor
+      query = WEBrick::HTTPUtils.parse_query(@source_uri.query)
+      mozule = query["module"]
+      uri = @source_uri.dup
+      uri.scheme = query["original_scheme"] if query["original_scheme"]
+      uri.query = nil
+      root = uri.to_s
+      # FIXME: kludge for replacing file:/home/... ->
+      # file:///home/... because git doesn't allow
+      # the former URI.
+      root.gsub!(%r!^file:/+!, "file:///") if uri.scheme == "file"
+      return Git.new(@config, root, mozule)
+    end
+    Fetcher.register(self)
+  end
+end

data/lib/gonzui/gettext.rb ADDED

@@ -0,0 +1,144 @@
+#
+# gettext.rb - a simple gettext-like module
+#
+# Copyright (C) 2004-2005 Satoru Takabayashi <satoru@namazu.org>
+#     All rights reserved.
+#     This is free software with ABSOLUTELY NO WARRANTY.
+#
+# You can redistribute it and/or modify it under the terms of
+# the GNU General Public License version 2.
+#
+module Gonzui
+  module GetText
+    def gettext(text)
+      return text unless @gettext_catalog
+      return (@gettext_catalog[text] or text)
+    end
+    alias :_ :gettext
+    def gettext_noop(text)
+      text
+    end
+    alias :N_ :gettext_noop
+    def set_catalog(catalog)
+      @gettext_catalog = catalog
+    end
+    def load_catalog(file_name)
+      return eval(File.read(file_name))
+    end
+  end
+  class CatalogRepository
+    include GetText
+    def initialize(directory)
+      @catalogs = {}
+      Dir.entries(directory).each {|entry|
+        file_name = File.join(directory, entry)
+        if m = /^catalog\.([\w.-]+)$/.match(File.basename(file_name))
+          lang = m[1]
+          catalog = load_catalog(file_name)
+          @catalogs[lang] = catalog
+        end
+      }
+      @catalogs["en"] = Hash.new {|h, k| k }
+    end
+    public
+    def choose(lang_name)
+      @catalogs[lang_name]
+    end
+    def each
+      @catalogs.each {|lang_name, catalog|
+        yield(lang_name, catalog)
+      }
+    end
+  end
+  class CatalogValidator
+    def initialize(source_file_name, messages)
+      @source_file_name  = source_file_name
+      @gettext_catalog = messages
+      @error_messages = []
+    end
+    attr_reader :error_messages
+    def read_file_with_numbering(file_name)
+      content = ''
+      File.open(file_name).each_with_index {|line, idx|
+        lineno = idx + 1
+        content << line.gsub(/\bN?_\(/, "_[#{lineno}](")
+      }
+      content
+    end
+    def collect_messages(content)
+      messages = []
+      while content.sub!(/\bN?_\[(\d+)\]\(("(?:\\"|.)*?").*?\)/m, "")
+        lineno  = $1.to_i
+        message = eval($2)
+        messages.push([lineno, message])
+      end
+      messages
+    end
+    def validate
+      @gettext_catalog or return
+      content = read_file_with_numbering(@source_file_name)
+      messages = collect_messages(content)
+      messages.each {|lineno, message|
+        translated_message = @gettext_catalog[message]
+        if not translated_message
+          message =
+            sprintf("%s:%d: %s", @source_file_name, lineno, message.inspect)
+          @error_messages.push(message)
+        elsif message.count("%") != translated_message.count("%")
+          message = sprintf("%s:%d: %s => # of %% mismatch.",
+                            @source_file_name,
+                            lineno, message.inspect, translated_message)
+          @error_messages.push(message)
+        end
+      }
+    end
+    def ok?
+      @error_messages.empty?
+    end
+  end
+end
+if __FILE__ == $0
+  include Gonzui
+  include Gonzui::GetText
+  def main
+    if ARGV.length < 2
+      puts "usage: ruby catalog-validator.rb <catalog directory> <source...>"
+      exit
+    end
+    catalog_directory = ARGV.shift
+    catalog_repository = CatalogRepository.new(catalog_directory)
+    ok = true
+    catalog_repository.each {|lang_name, catalog|
+      set_catalog(catalog)
+      ARGV.each {|source_file|
+        validator = CatalogValidator.new(source_file, catalog)
+        validator.validate
+        validator.error_messages.each {|message|
+          printf("%s: %s\n", lang_name, message)
+        }
+        ok = (ok and validator.ok?)
+      }
+    }
+    if ok then exit else exit(1) end
+  end
+  main
+end