RubyGems - grammar_cop - Versions diffs - 0.1.0 - Mend

grammar_cop 0.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (344) hide show

data/.DS_Store +0 -0
data/.gitignore +4 -0
data/Gemfile +4 -0
data/Rakefile +8 -0
data/data/.DS_Store +0 -0
data/data/Makefile +511 -0
data/data/Makefile.am +4 -0
data/data/Makefile.in +511 -0
data/data/de/.DS_Store +0 -0
data/data/de/4.0.affix +7 -0
data/data/de/4.0.dict +474 -0
data/data/de/Makefile +387 -0
data/data/de/Makefile.am +9 -0
data/data/de/Makefile.in +387 -0
data/data/en/.DS_Store +0 -0
data/data/en/4.0.affix +26 -0
data/data/en/4.0.batch +1002 -0
data/data/en/4.0.biolg.batch +411 -0
data/data/en/4.0.constituent-knowledge +127 -0
data/data/en/4.0.dict +8759 -0
data/data/en/4.0.dict.m4 +6928 -0
data/data/en/4.0.enwiki.batch +14 -0
data/data/en/4.0.fixes.batch +2776 -0
data/data/en/4.0.knowledge +306 -0
data/data/en/4.0.regex +225 -0
data/data/en/4.0.voa.batch +114 -0
data/data/en/Makefile +554 -0
data/data/en/Makefile.am +19 -0
data/data/en/Makefile.in +554 -0
data/data/en/README +173 -0
data/data/en/tiny.dict +157 -0
data/data/en/words/.DS_Store +0 -0
data/data/en/words/Makefile +456 -0
data/data/en/words/Makefile.am +78 -0
data/data/en/words/Makefile.in +456 -0
data/data/en/words/currency +205 -0
data/data/en/words/currency.p +28 -0
data/data/en/words/entities.given-bisex.sing +39 -0
data/data/en/words/entities.given-female.sing +4141 -0
data/data/en/words/entities.given-male.sing +1633 -0
data/data/en/words/entities.locations.sing +68 -0
data/data/en/words/entities.national.sing +253 -0
data/data/en/words/entities.organizations.sing +7 -0
data/data/en/words/entities.us-states.sing +11 -0
data/data/en/words/units.1 +45 -0
data/data/en/words/units.1.dot +4 -0
data/data/en/words/units.3 +2 -0
data/data/en/words/units.4 +5 -0
data/data/en/words/units.4.dot +1 -0
data/data/en/words/words-medical.adv.1 +1191 -0
data/data/en/words/words-medical.prep.1 +67 -0
data/data/en/words/words-medical.v.4.1 +2835 -0
data/data/en/words/words-medical.v.4.2 +2848 -0
data/data/en/words/words-medical.v.4.3 +3011 -0
data/data/en/words/words-medical.v.4.4 +3036 -0
data/data/en/words/words-medical.v.4.5 +3050 -0
data/data/en/words/words.adj.1 +6794 -0
data/data/en/words/words.adj.2 +638 -0
data/data/en/words/words.adj.3 +667 -0
data/data/en/words/words.adv.1 +1573 -0
data/data/en/words/words.adv.2 +67 -0
data/data/en/words/words.adv.3 +157 -0
data/data/en/words/words.adv.4 +80 -0
data/data/en/words/words.n.1 +11464 -0
data/data/en/words/words.n.1.wiki +264 -0
data/data/en/words/words.n.2.s +2017 -0
data/data/en/words/words.n.2.s.biolg +1 -0
data/data/en/words/words.n.2.s.wiki +298 -0
data/data/en/words/words.n.2.x +65 -0
data/data/en/words/words.n.2.x.wiki +10 -0
data/data/en/words/words.n.3 +5717 -0
data/data/en/words/words.n.t +23 -0
data/data/en/words/words.v.1.1 +1038 -0
data/data/en/words/words.v.1.2 +1043 -0
data/data/en/words/words.v.1.3 +1052 -0
data/data/en/words/words.v.1.4 +1023 -0
data/data/en/words/words.v.1.p +17 -0
data/data/en/words/words.v.10.1 +14 -0
data/data/en/words/words.v.10.2 +15 -0
data/data/en/words/words.v.10.3 +88 -0
data/data/en/words/words.v.10.4 +17 -0
data/data/en/words/words.v.2.1 +1253 -0
data/data/en/words/words.v.2.2 +1304 -0
data/data/en/words/words.v.2.3 +1280 -0
data/data/en/words/words.v.2.4 +1285 -0
data/data/en/words/words.v.2.5 +1287 -0
data/data/en/words/words.v.4.1 +2472 -0
data/data/en/words/words.v.4.2 +2487 -0
data/data/en/words/words.v.4.3 +2441 -0
data/data/en/words/words.v.4.4 +2478 -0
data/data/en/words/words.v.4.5 +2483 -0
data/data/en/words/words.v.5.1 +98 -0
data/data/en/words/words.v.5.2 +98 -0
data/data/en/words/words.v.5.3 +103 -0
data/data/en/words/words.v.5.4 +102 -0
data/data/en/words/words.v.6.1 +388 -0
data/data/en/words/words.v.6.2 +401 -0
data/data/en/words/words.v.6.3 +397 -0
data/data/en/words/words.v.6.4 +405 -0
data/data/en/words/words.v.6.5 +401 -0
data/data/en/words/words.v.8.1 +117 -0
data/data/en/words/words.v.8.2 +118 -0
data/data/en/words/words.v.8.3 +118 -0
data/data/en/words/words.v.8.4 +119 -0
data/data/en/words/words.v.8.5 +119 -0
data/data/en/words/words.y +104 -0
data/data/lt/.DS_Store +0 -0
data/data/lt/4.0.affix +6 -0
data/data/lt/4.0.constituent-knowledge +24 -0
data/data/lt/4.0.dict +135 -0
data/data/lt/4.0.knowledge +38 -0
data/data/lt/Makefile +389 -0
data/data/lt/Makefile.am +11 -0
data/data/lt/Makefile.in +389 -0
data/ext/.DS_Store +0 -0
data/ext/link_grammar/.DS_Store +0 -0
data/ext/link_grammar/extconf.rb +2 -0
data/ext/link_grammar/link-grammar/.DS_Store +0 -0
data/ext/link_grammar/link-grammar/.deps/analyze-linkage.Plo +198 -0
data/ext/link_grammar/link-grammar/.deps/and.Plo +202 -0
data/ext/link_grammar/link-grammar/.deps/api.Plo +244 -0
data/ext/link_grammar/link-grammar/.deps/build-disjuncts.Plo +212 -0
data/ext/link_grammar/link-grammar/.deps/command-line.Plo +201 -0
data/ext/link_grammar/link-grammar/.deps/constituents.Plo +201 -0
data/ext/link_grammar/link-grammar/.deps/count.Plo +202 -0
data/ext/link_grammar/link-grammar/.deps/disjunct-utils.Plo +126 -0
data/ext/link_grammar/link-grammar/.deps/disjuncts.Plo +123 -0
data/ext/link_grammar/link-grammar/.deps/error.Plo +121 -0
data/ext/link_grammar/link-grammar/.deps/expand.Plo +133 -0
data/ext/link_grammar/link-grammar/.deps/extract-links.Plo +198 -0
data/ext/link_grammar/link-grammar/.deps/fast-match.Plo +200 -0
data/ext/link_grammar/link-grammar/.deps/idiom.Plo +200 -0
data/ext/link_grammar/link-grammar/.deps/jni-client.Plo +217 -0
data/ext/link_grammar/link-grammar/.deps/link-parser.Po +1 -0
data/ext/link_grammar/link-grammar/.deps/massage.Plo +202 -0
data/ext/link_grammar/link-grammar/.deps/post-process.Plo +202 -0
data/ext/link_grammar/link-grammar/.deps/pp_knowledge.Plo +202 -0
data/ext/link_grammar/link-grammar/.deps/pp_lexer.Plo +201 -0
data/ext/link_grammar/link-grammar/.deps/pp_linkset.Plo +200 -0
data/ext/link_grammar/link-grammar/.deps/prefix.Plo +102 -0
data/ext/link_grammar/link-grammar/.deps/preparation.Plo +202 -0
data/ext/link_grammar/link-grammar/.deps/print-util.Plo +200 -0
data/ext/link_grammar/link-grammar/.deps/print.Plo +201 -0
data/ext/link_grammar/link-grammar/.deps/prune.Plo +202 -0
data/ext/link_grammar/link-grammar/.deps/read-dict.Plo +223 -0
data/ext/link_grammar/link-grammar/.deps/read-regex.Plo +123 -0
data/ext/link_grammar/link-grammar/.deps/regex-morph.Plo +131 -0
data/ext/link_grammar/link-grammar/.deps/resources.Plo +203 -0
data/ext/link_grammar/link-grammar/.deps/spellcheck-aspell.Plo +1 -0
data/ext/link_grammar/link-grammar/.deps/spellcheck-hun.Plo +115 -0
data/ext/link_grammar/link-grammar/.deps/string-set.Plo +198 -0
data/ext/link_grammar/link-grammar/.deps/tokenize.Plo +160 -0
data/ext/link_grammar/link-grammar/.deps/utilities.Plo +222 -0
data/ext/link_grammar/link-grammar/.deps/word-file.Plo +201 -0
data/ext/link_grammar/link-grammar/.deps/word-utils.Plo +212 -0
data/ext/link_grammar/link-grammar/.libs/analyze-linkage.o +0 -0
data/ext/link_grammar/link-grammar/.libs/and.o +0 -0
data/ext/link_grammar/link-grammar/.libs/api.o +0 -0
data/ext/link_grammar/link-grammar/.libs/build-disjuncts.o +0 -0
data/ext/link_grammar/link-grammar/.libs/command-line.o +0 -0
data/ext/link_grammar/link-grammar/.libs/constituents.o +0 -0
data/ext/link_grammar/link-grammar/.libs/count.o +0 -0
data/ext/link_grammar/link-grammar/.libs/disjunct-utils.o +0 -0
data/ext/link_grammar/link-grammar/.libs/disjuncts.o +0 -0
data/ext/link_grammar/link-grammar/.libs/error.o +0 -0
data/ext/link_grammar/link-grammar/.libs/expand.o +0 -0
data/ext/link_grammar/link-grammar/.libs/extract-links.o +0 -0
data/ext/link_grammar/link-grammar/.libs/fast-match.o +0 -0
data/ext/link_grammar/link-grammar/.libs/idiom.o +0 -0
data/ext/link_grammar/link-grammar/.libs/jni-client.o +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar-java-symbols.expsym +31 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar-java.4.dylib +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar-java.4.dylib.dSYM/Contents/Info.plist +20 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar-java.4.dylib.dSYM/Contents/Resources/DWARF/liblink-grammar-java.4.dylib +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar-java.a +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar-java.dylib +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar-symbols.expsym +194 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar.4.dylib +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar.4.dylib.dSYM/Contents/Info.plist +20 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar.4.dylib.dSYM/Contents/Resources/DWARF/liblink-grammar.4.dylib +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar.a +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar.dylib +0 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar.la +41 -0
data/ext/link_grammar/link-grammar/.libs/liblink-grammar.lai +41 -0
data/ext/link_grammar/link-grammar/.libs/massage.o +0 -0
data/ext/link_grammar/link-grammar/.libs/post-process.o +0 -0
data/ext/link_grammar/link-grammar/.libs/pp_knowledge.o +0 -0
data/ext/link_grammar/link-grammar/.libs/pp_lexer.o +0 -0
data/ext/link_grammar/link-grammar/.libs/pp_linkset.o +0 -0
data/ext/link_grammar/link-grammar/.libs/prefix.o +0 -0
data/ext/link_grammar/link-grammar/.libs/preparation.o +0 -0
data/ext/link_grammar/link-grammar/.libs/print-util.o +0 -0
data/ext/link_grammar/link-grammar/.libs/print.o +0 -0
data/ext/link_grammar/link-grammar/.libs/prune.o +0 -0
data/ext/link_grammar/link-grammar/.libs/read-dict.o +0 -0
data/ext/link_grammar/link-grammar/.libs/read-regex.o +0 -0
data/ext/link_grammar/link-grammar/.libs/regex-morph.o +0 -0
data/ext/link_grammar/link-grammar/.libs/resources.o +0 -0
data/ext/link_grammar/link-grammar/.libs/spellcheck-aspell.o +0 -0
data/ext/link_grammar/link-grammar/.libs/spellcheck-hun.o +0 -0
data/ext/link_grammar/link-grammar/.libs/string-set.o +0 -0
data/ext/link_grammar/link-grammar/.libs/tokenize.o +0 -0
data/ext/link_grammar/link-grammar/.libs/utilities.o +0 -0
data/ext/link_grammar/link-grammar/.libs/word-file.o +0 -0
data/ext/link_grammar/link-grammar/.libs/word-utils.o +0 -0
data/ext/link_grammar/link-grammar/Makefile +900 -0
data/ext/link_grammar/link-grammar/Makefile.am +202 -0
data/ext/link_grammar/link-grammar/Makefile.in +900 -0
data/ext/link_grammar/link-grammar/analyze-linkage.c +1317 -0
data/ext/link_grammar/link-grammar/analyze-linkage.h +24 -0
data/ext/link_grammar/link-grammar/and.c +1603 -0
data/ext/link_grammar/link-grammar/and.h +27 -0
data/ext/link_grammar/link-grammar/api-structures.h +362 -0
data/ext/link_grammar/link-grammar/api-types.h +72 -0
data/ext/link_grammar/link-grammar/api.c +1887 -0
data/ext/link_grammar/link-grammar/api.h +96 -0
data/ext/link_grammar/link-grammar/autoit/.DS_Store +0 -0
data/ext/link_grammar/link-grammar/autoit/README +10 -0
data/ext/link_grammar/link-grammar/autoit/_LGTest.au3 +22 -0
data/ext/link_grammar/link-grammar/autoit/_LinkGrammar.au3 +545 -0
data/ext/link_grammar/link-grammar/build-disjuncts.c +487 -0
data/ext/link_grammar/link-grammar/build-disjuncts.h +21 -0
data/ext/link_grammar/link-grammar/command-line.c +458 -0
data/ext/link_grammar/link-grammar/command-line.h +15 -0
data/ext/link_grammar/link-grammar/constituents.c +1836 -0
data/ext/link_grammar/link-grammar/constituents.h +26 -0
data/ext/link_grammar/link-grammar/corpus/.DS_Store +0 -0
data/ext/link_grammar/link-grammar/corpus/.deps/cluster.Plo +1 -0
data/ext/link_grammar/link-grammar/corpus/.deps/corpus.Plo +1 -0
data/ext/link_grammar/link-grammar/corpus/Makefile +527 -0
data/ext/link_grammar/link-grammar/corpus/Makefile.am +46 -0
data/ext/link_grammar/link-grammar/corpus/Makefile.in +527 -0
data/ext/link_grammar/link-grammar/corpus/README +17 -0
data/ext/link_grammar/link-grammar/corpus/cluster.c +286 -0
data/ext/link_grammar/link-grammar/corpus/cluster.h +32 -0
data/ext/link_grammar/link-grammar/corpus/corpus.c +483 -0
data/ext/link_grammar/link-grammar/corpus/corpus.h +46 -0
data/ext/link_grammar/link-grammar/count.c +828 -0
data/ext/link_grammar/link-grammar/count.h +25 -0
data/ext/link_grammar/link-grammar/disjunct-utils.c +261 -0
data/ext/link_grammar/link-grammar/disjunct-utils.h +27 -0
data/ext/link_grammar/link-grammar/disjuncts.c +138 -0
data/ext/link_grammar/link-grammar/disjuncts.h +13 -0
data/ext/link_grammar/link-grammar/error.c +92 -0
data/ext/link_grammar/link-grammar/error.h +35 -0
data/ext/link_grammar/link-grammar/expand.c +67 -0
data/ext/link_grammar/link-grammar/expand.h +13 -0
data/ext/link_grammar/link-grammar/externs.h +22 -0
data/ext/link_grammar/link-grammar/extract-links.c +625 -0
data/ext/link_grammar/link-grammar/extract-links.h +16 -0
data/ext/link_grammar/link-grammar/fast-match.c +309 -0
data/ext/link_grammar/link-grammar/fast-match.h +17 -0
data/ext/link_grammar/link-grammar/idiom.c +373 -0
data/ext/link_grammar/link-grammar/idiom.h +15 -0
data/ext/link_grammar/link-grammar/jni-client.c +779 -0
data/ext/link_grammar/link-grammar/jni-client.h +236 -0
data/ext/link_grammar/link-grammar/liblink-grammar-java.la +42 -0
data/ext/link_grammar/link-grammar/liblink-grammar.la +41 -0
data/ext/link_grammar/link-grammar/link-features.h +37 -0
data/ext/link_grammar/link-grammar/link-features.h.in +37 -0
data/ext/link_grammar/link-grammar/link-grammar-java.def +31 -0
data/ext/link_grammar/link-grammar/link-grammar.def +194 -0
data/ext/link_grammar/link-grammar/link-includes.h +465 -0
data/ext/link_grammar/link-grammar/link-parser.c +849 -0
data/ext/link_grammar/link-grammar/massage.c +329 -0
data/ext/link_grammar/link-grammar/massage.h +13 -0
data/ext/link_grammar/link-grammar/post-process.c +1113 -0
data/ext/link_grammar/link-grammar/post-process.h +45 -0
data/ext/link_grammar/link-grammar/pp_knowledge.c +376 -0
data/ext/link_grammar/link-grammar/pp_knowledge.h +14 -0
data/ext/link_grammar/link-grammar/pp_lexer.c +1920 -0
data/ext/link_grammar/link-grammar/pp_lexer.h +19 -0
data/ext/link_grammar/link-grammar/pp_linkset.c +158 -0
data/ext/link_grammar/link-grammar/pp_linkset.h +20 -0
data/ext/link_grammar/link-grammar/prefix.c +482 -0
data/ext/link_grammar/link-grammar/prefix.h +139 -0
data/ext/link_grammar/link-grammar/preparation.c +412 -0
data/ext/link_grammar/link-grammar/preparation.h +20 -0
data/ext/link_grammar/link-grammar/print-util.c +87 -0
data/ext/link_grammar/link-grammar/print-util.h +32 -0
data/ext/link_grammar/link-grammar/print.c +1085 -0
data/ext/link_grammar/link-grammar/print.h +16 -0
data/ext/link_grammar/link-grammar/prune.c +1864 -0
data/ext/link_grammar/link-grammar/prune.h +17 -0
data/ext/link_grammar/link-grammar/read-dict.c +1785 -0
data/ext/link_grammar/link-grammar/read-dict.h +29 -0
data/ext/link_grammar/link-grammar/read-regex.c +161 -0
data/ext/link_grammar/link-grammar/read-regex.h +12 -0
data/ext/link_grammar/link-grammar/regex-morph.c +126 -0
data/ext/link_grammar/link-grammar/regex-morph.h +17 -0
data/ext/link_grammar/link-grammar/resources.c +180 -0
data/ext/link_grammar/link-grammar/resources.h +23 -0
data/ext/link_grammar/link-grammar/sat-solver/.DS_Store +0 -0
data/ext/link_grammar/link-grammar/sat-solver/.deps/fast-sprintf.Plo +1 -0
data/ext/link_grammar/link-grammar/sat-solver/.deps/sat-encoder.Plo +1 -0
data/ext/link_grammar/link-grammar/sat-solver/.deps/util.Plo +1 -0
data/ext/link_grammar/link-grammar/sat-solver/.deps/variables.Plo +1 -0
data/ext/link_grammar/link-grammar/sat-solver/.deps/word-tag.Plo +1 -0
data/ext/link_grammar/link-grammar/sat-solver/Makefile +527 -0
data/ext/link_grammar/link-grammar/sat-solver/Makefile.am +29 -0
data/ext/link_grammar/link-grammar/sat-solver/Makefile.in +527 -0
data/ext/link_grammar/link-grammar/sat-solver/clock.hpp +33 -0
data/ext/link_grammar/link-grammar/sat-solver/fast-sprintf.cpp +26 -0
data/ext/link_grammar/link-grammar/sat-solver/fast-sprintf.hpp +7 -0
data/ext/link_grammar/link-grammar/sat-solver/guiding.hpp +244 -0
data/ext/link_grammar/link-grammar/sat-solver/matrix-ut.hpp +79 -0
data/ext/link_grammar/link-grammar/sat-solver/sat-encoder.cpp +2811 -0
data/ext/link_grammar/link-grammar/sat-solver/sat-encoder.h +11 -0
data/ext/link_grammar/link-grammar/sat-solver/sat-encoder.hpp +381 -0
data/ext/link_grammar/link-grammar/sat-solver/trie.hpp +118 -0
data/ext/link_grammar/link-grammar/sat-solver/util.cpp +23 -0
data/ext/link_grammar/link-grammar/sat-solver/util.hpp +14 -0
data/ext/link_grammar/link-grammar/sat-solver/variables.cpp +5 -0
data/ext/link_grammar/link-grammar/sat-solver/variables.hpp +829 -0
data/ext/link_grammar/link-grammar/sat-solver/word-tag.cpp +159 -0
data/ext/link_grammar/link-grammar/sat-solver/word-tag.hpp +162 -0
data/ext/link_grammar/link-grammar/spellcheck-aspell.c +148 -0
data/ext/link_grammar/link-grammar/spellcheck-hun.c +136 -0
data/ext/link_grammar/link-grammar/spellcheck.h +34 -0
data/ext/link_grammar/link-grammar/string-set.c +169 -0
data/ext/link_grammar/link-grammar/string-set.h +16 -0
data/ext/link_grammar/link-grammar/structures.h +498 -0
data/ext/link_grammar/link-grammar/tokenize.c +1049 -0
data/ext/link_grammar/link-grammar/tokenize.h +15 -0
data/ext/link_grammar/link-grammar/utilities.c +847 -0
data/ext/link_grammar/link-grammar/utilities.h +281 -0
data/ext/link_grammar/link-grammar/word-file.c +124 -0
data/ext/link_grammar/link-grammar/word-file.h +15 -0
data/ext/link_grammar/link-grammar/word-utils.c +526 -0
data/ext/link_grammar/link-grammar/word-utils.h +152 -0
data/ext/link_grammar/link_grammar.c +202 -0
data/ext/link_grammar/link_grammar.h +99 -0
data/grammar_cop.gemspec +24 -0
data/lib/.DS_Store +0 -0
data/lib/grammar_cop.rb +9 -0
data/lib/grammar_cop/.DS_Store +0 -0
data/lib/grammar_cop/dictionary.rb +19 -0
data/lib/grammar_cop/linkage.rb +30 -0
data/lib/grammar_cop/parse_options.rb +32 -0
data/lib/grammar_cop/sentence.rb +36 -0
data/lib/grammar_cop/version.rb +3 -0
data/test/.DS_Store +0 -0
data/test/grammar_cop_test.rb +27 -0
metadata +407 -0

data/ext/link_grammar/link-grammar/extract-links.h ADDED Viewed

@@ -0,0 +1,16 @@
+/*************************************************************************/
+/* Copyright (c) 2004                                                    */
+/* Daniel Sleator, David Temperley, and John Lafferty                    */
+/* All rights reserved                                                   */
+/*                                                                       */
+/* Use of the link grammar parsing system is subject to the terms of the */
+/* license set forth in the LICENSE file included with this software,    */
+/* and also available at http://www.link.cs.cmu.edu/link/license.html    */
+/* This license allows free redistribution and use in source and binary  */
+/* forms, with or without modification, subject to certain conditions.   */
+/*                                                                       */
+/*************************************************************************/
+Parse_info parse_info_new(int nwords);
+void free_parse_info(Parse_info);
+int   build_parse_set(Sentence sent, int cost, Parse_Options opts);
+void  extract_links(int index, int cost, Parse_info pi);

data/ext/link_grammar/link-grammar/fast-match.c ADDED Viewed

@@ -0,0 +1,309 @@
+/**************************************************************************/
+/* Copyright (c) 2004                                                     */
+/* Daniel Sleator, David Temperley, and John Lafferty                     */
+/* All rights reserved                                                    */
+/*                                                                        */
+/* Use of the link grammar parsing system is subject to the terms of the  */
+/* license set forth in the LICENSE file included with this software,     */
+/* and also available at http://www.link.cs.cmu.edu/link/license.html     */
+/* This license allows free redistribution and use in source and binary   */
+/* forms, with or without modification, subject to certain conditions.    */
+/*                                                                        */
+/**************************************************************************/
+#include "api.h"
+#include "fast-match.h"
+/**
+ * returns the number of disjuncts in the list that have non-null
+ * left connector lists.
+ */
+static int left_disjunct_list_length(Disjunct * d)
+{
+	int i;
+	for (i=0; d!=NULL; d=d->next) {
+		if (d->left != NULL) i++;
+	}
+	return i;
+}
+static int right_disjunct_list_length(Disjunct * d)
+{
+	int i;
+	for (i=0; d!=NULL; d=d->next) {
+		if (d->right != NULL) i++;
+	}
+	return i;
+}
+struct match_context_s
+{
+	int match_cost;
+	int l_table_size[MAX_SENTENCE];  /* the sizes of the hash tables */
+	int r_table_size[MAX_SENTENCE];
+	/* the beginnings of the hash tables */
+	Match_node ** l_table[MAX_SENTENCE];
+	Match_node ** r_table[MAX_SENTENCE];
+   /* I'll pedantically maintain my own list of these cells */
+	Match_node * mn_free_list;
+};
+/**
+ * Return a match node to be used by the caller
+ */
+static Match_node * get_match_node(match_context_t *ctxt)
+{
+	Match_node * m;
+	if (ctxt->mn_free_list != NULL)
+	{
+		m = ctxt->mn_free_list;
+		ctxt->mn_free_list = m->next;
+	}
+	else
+	{
+		m = (Match_node *) xalloc(sizeof(Match_node));
+	}
+	return m;
+}
+/**
+ * Put these nodes back onto my free list
+ */
+void put_match_list(Sentence sent, Match_node *m)
+{
+	Match_node * xm;
+	match_context_t *ctxt = sent->match_ctxt;
+	for (; m != NULL; m = xm)
+	{
+		xm = m->next;
+		m->next = ctxt->mn_free_list;
+		ctxt->mn_free_list = m;
+	}
+}
+static void free_match_list(Match_node * t)
+{
+	Match_node *xt;
+	for (; t!=NULL; t=xt) {
+		xt = t->next;
+		xfree((char *)t, sizeof(Match_node));
+	}
+}
+/**
+ * Free all of the hash tables and Match_nodes
+ */
+void free_fast_matcher(Sentence sent)
+{
+	int w;
+	int i;
+	match_context_t *ctxt = sent->match_ctxt;
+	if (verbosity > 1) printf("%d Match cost\n", ctxt->match_cost);
+	for (w = 0; w < sent->length; w++)
+	{
+		for (i = 0; i < ctxt->l_table_size[w]; i++)
+		{
+			free_match_list(ctxt->l_table[w][i]);
+		}
+		xfree((char *)ctxt->l_table[w], ctxt->l_table_size[w] * sizeof (Match_node *));
+		for (i = 0; i < ctxt->r_table_size[w]; i++)
+		{
+			free_match_list(ctxt->r_table[w][i]);
+		}
+		xfree((char *)ctxt->r_table[w], ctxt->r_table_size[w] * sizeof (Match_node *));
+	}
+	free_match_list(ctxt->mn_free_list);
+	ctxt->mn_free_list = NULL;
+	free(ctxt);
+	sent->match_ctxt = NULL;
+}
+/**
+ * Adds the match node m to the sorted list of match nodes l.
+ * The parameter dir determines the order of the sorting to be used.
+ * Makes the list sorted from smallest to largest.
+ */
+static Match_node * add_to_right_table_list(Match_node * m, Match_node * l)
+{
+	if (l == NULL) return m;
+	if ((m->d->right->word) <= (l->d->right->word)) {
+		m->next = l;
+		return m;
+	} else {
+		l->next = add_to_right_table_list(m, l->next);
+		return l;
+	}
+}
+/**
+ * Adds the match node m to the sorted list of match nodes l.
+ * The parameter dir determines the order of the sorting to be used.
+ * Makes the list sorted from largest to smallest
+ */
+static Match_node * add_to_left_table_list(Match_node * m, Match_node * l)
+{
+	if (l==NULL) return m;
+	if ((m->d->left->word) >= (l->d->left->word)) {
+		m->next = l;
+		return m;
+	} else {
+		l->next = add_to_left_table_list(m, l->next);
+		return l;
+	}
+}
+/**
+ * The disjunct d (whose left or right pointer points to c) is put
+ *  into the appropriate hash table
+ * dir =  1, we're putting this into a right table.
+ * dir = -1, we're putting this into a left table.
+ */
+static void put_into_match_table(int size, Match_node ** t,
+								 Disjunct * d, Connector * c, int dir )
+{
+	int h;
+	Match_node * m;
+	h = connector_hash(c) & (size-1);
+	m = (Match_node *) xalloc (sizeof(Match_node));
+	m->next = NULL;
+	m->d = d;
+	if (dir == 1) {
+		t[h] = add_to_right_table_list(m, t[h]);
+	} else {
+		t[h] = add_to_left_table_list(m, t[h]);
+	}
+}
+void init_fast_matcher(Sentence sent)
+{
+	int w, len, size, i;
+	Match_node ** t;
+	Disjunct * d;
+	match_context_t *ctxt;
+	ctxt = (match_context_t *) malloc(sizeof(match_context_t));
+	sent->match_ctxt = ctxt;
+	ctxt->match_cost = 0;
+	ctxt->mn_free_list = NULL;
+	for (w=0; w<sent->length; w++)
+	{
+		len = left_disjunct_list_length(sent->word[w].d);
+		size = next_power_of_two_up(len);
+		ctxt->l_table_size[w] = size;
+		t = ctxt->l_table[w] = (Match_node **) xalloc(size * sizeof(Match_node *));
+		for (i = 0; i < size; i++) t[i] = NULL;
+		for (d = sent->word[w].d; d != NULL; d = d->next)
+		{
+			if (d->left != NULL)
+			{
+				put_into_match_table(size, t, d, d->left, -1);
+			}
+		}
+		len = right_disjunct_list_length(sent->word[w].d);
+		size = next_power_of_two_up(len);
+		ctxt->r_table_size[w] = size;
+		t = ctxt->r_table[w] = (Match_node **) xalloc(size * sizeof(Match_node *));
+		for (i = 0; i < size; i++) t[i] = NULL;
+		for (d = sent->word[w].d; d != NULL; d = d->next)
+		{
+			if (d->right != NULL)
+			{
+				put_into_match_table(size, t, d, d->right, 1);
+			}
+		}
+	}
+}
+/**
+ * Forms and returns a list of disjuncts that might match lc or rc or both.
+ * lw and rw are the words from which lc and rc came respectively.
+ * The list is formed by the link pointers of Match_nodes.
+ * The list contains no duplicates.  A quadratic algorithm is used to
+ * eliminate duplicates.  In practice the match_cost is less than the
+ * parse_cost (and the loop is tiny), so there's no reason to bother
+ * to fix this.
+ */
+Match_node *
+form_match_list(Sentence sent, int w,
+                Connector *lc, int lw, Connector *rc, int rw)
+{
+	Match_node *ml, *mr, *mx, *my, * mz, *front, *free_later;
+	match_context_t *ctxt = sent->match_ctxt;
+	if (lc != NULL) {
+		ml = ctxt->l_table[w][connector_hash(lc) & (ctxt->l_table_size[w]-1)];
+	} else {
+		ml = NULL;
+	}
+	if (rc != NULL) {
+		mr = ctxt->r_table[w][connector_hash(rc) & (ctxt->r_table_size[w]-1)];
+	} else {
+		mr = NULL;
+	}
+	front = NULL;
+	for (mx = ml; mx != NULL; mx = mx->next)
+	{
+		if (mx->d->left->word < lw) break;
+		my = get_match_node(ctxt);
+		my->d = mx->d;
+		my->next = front;
+		front = my;
+	}
+	ml = front;   /* ml is now the list of things that could match the left */
+	front = NULL;
+	for (mx = mr; mx != NULL; mx = mx->next)
+	{
+		if (mx->d->right->word > rw) break;
+		my = get_match_node(ctxt);
+		my->d = mx->d;
+		my->next = front;
+		front = my;
+	}
+	mr = front;   /* mr is now the list of things that could match the right */
+	/* now we want to eliminate duplicates from the lists */
+	free_later = NULL;
+	front = NULL;
+	for (mx = mr; mx != NULL; mx = mz)
+	{
+		/* see if mx in first list, put it in if its not */
+		mz = mx->next;
+		ctxt->match_cost++;
+		for (my=ml; my!=NULL; my=my->next) {
+			ctxt->match_cost++;
+			if (mx->d == my->d) break;
+		}
+		if (my != NULL) { /* mx was in the l list */
+			mx->next = free_later;
+			free_later = mx;
+		}
+		if (my==NULL) {  /* it was not there */
+			mx->next = front;
+			front = mx;
+		}
+	}
+	mr = front;  /* mr is now the abbreviated right list */
+	put_match_list(sent, free_later);
+	/* now catenate the two lists */
+	if (mr == NULL) return ml;
+	for (mx = mr; mx->next != NULL; mx = mx->next)
+	  ;
+	mx->next = ml;
+	return mr;
+}

data/ext/link_grammar/link-grammar/fast-match.h ADDED Viewed

@@ -0,0 +1,17 @@
+/*************************************************************************/
+/* Copyright (c) 2004                                                    */
+/* Daniel Sleator, David Temperley, and John Lafferty                    */
+/* All rights reserved                                                   */
+/*                                                                       */
+/* Use of the link grammar parsing system is subject to the terms of the */
+/* license set forth in the LICENSE file included with this software,    */
+/* and also available at http://www.link.cs.cmu.edu/link/license.html    */
+/* This license allows free redistribution and use in source and binary  */
+/* forms, with or without modification, subject to certain conditions.   */
+/*                                                                       */
+/*************************************************************************/
+void init_fast_matcher(Sentence sent);
+void free_fast_matcher(Sentence sent);
+void put_match_list(Sentence, Match_node *);
+Match_node * form_match_list(Sentence, int, Connector *, int, Connector *, int);

data/ext/link_grammar/link-grammar/idiom.c ADDED Viewed

@@ -0,0 +1,373 @@
+/*************************************************************************/
+/* Copyright (c) 2004                                                    */
+/* Daniel Sleator, David Temperley, and John Lafferty                    */
+/* All rights reserved                                                   */
+/*                                                                       */
+/* Use of the link grammar parsing system is subject to the terms of the */
+/* license set forth in the LICENSE file included with this software,    */
+/* and also available at http://www.link.cs.cmu.edu/link/license.html    */
+/* This license allows free redistribution and use in source and binary  */
+/* forms, with or without modification, subject to certain conditions.   */
+/*                                                                       */
+/*************************************************************************/
+#include "api.h"
+#include "error.h"
+/**
+ * Returns TRUE if the string contains an underbar character.
+ */
+int contains_underbar(const char * s)
+{
+	while(*s != '\0') {
+		if (*s == '_') return TRUE;
+		s++;
+	}
+	return FALSE;
+}
+/**
+ * Returns FALSE if it is not a correctly formed idiom string.
+ * Such a string is correct if it:
+ *   () contains no "."
+ *   () non-empty strings separated by _
+ */
+static int is_idiom_string(const char * s)
+{
+	size_t len;
+	const char * t;
+	for (t = s; *t != '\0'; t++)
+	{
+		if (*t == '.') return FALSE;
+	}
+	len = strlen(s);
+	if ((s[0] == '_') || (s[len-1] == '_'))
+	{
+		return FALSE;
+	}
+	for (t = s; *t != '\0'; t++)
+	{
+		if ((*t == '_') && (*(t+1) == '_')) return FALSE;
+	}
+	return TRUE;
+}
+/**
+ * return TRUE if the string s is a sequence of digits.
+ */
+static int is_number_idiom(const char *s)
+{
+	int nb;
+	while(*s != '\0') {
+		nb = is_utf8_digit(s);
+		if (!nb) return FALSE;
+		s += nb;
+	}
+	return TRUE;
+}
+/**
+ * If the string contains a single ".", and ends in ".Ix" where
+ * x is a number, return x.  Return -1 if not of this form.
+ */
+static int numberfy(const char * s)
+{
+	for (; (*s != '\0') && (*s != '.'); s++)
+	  ;
+	if (*s++ != '.') return -1;
+	if (*s++ != 'I') return -1;
+	if (!is_number_idiom(s)) return -1;
+	return atoi(s);
+}
+/**
+ * Look for words that end in ".Ix" where x is a number.
+ * Return the largest x found.
+ */
+static int max_postfix_found(Dict_node * d)
+{
+	int i, j;
+	i = 0;
+	while(d != NULL) {
+		j = numberfy(d->string);
+		if (j > i) i = j;
+		d = d->right;
+	}
+	return i;
+}
+/**
+ * build_idiom_word_name() -- return idiomized name of given string.
+ *
+ * Allocates string space and returns a pointer to it.
+ * In this string is placed the idiomized name of the given string s.
+ * This is the same as s, but with a postfix of ".Ix", where x is an
+ * appropriate number.  x is the minimum number that distinguishes
+ * this word from others in the dictionary.
+ */
+static const char * build_idiom_word_name(Dictionary dict, const char * s)
+{
+	char buff[2*MAX_WORD];
+	char *x;
+	int count;
+	Dict_node *dn = dictionary_lookup_list(dict, s);
+	count = max_postfix_found(dn)+1;
+	free_lookup_list(dn);
+	x = buff;
+	while((*s != '\0') && (*s != '.'))
+	{
+		*x = *s;
+		x++;
+		s++;
+	}
+	sprintf(x, ".I%d",count);
+	return string_set_add(buff, dict->string_set);
+}
+/**
+ * Tear the idiom string apart.
+ * Put the parts into a list of Dict_nodes (connected by their right pointers)
+ * Sets the string fields of these Dict_nodes pointing to the
+ * fragments of the string s.  Later these will be replaced by
+ * correct names (with .Ix suffixes).
+ * The list is reversed from the way they occur in the string.
+ * A pointer to this list is returned.
+ */
+static Dict_node * make_idiom_Dict_nodes(Dictionary dict, const char * string)
+{
+	Dict_node * dn, * dn_new;
+	char * t, *s, *p;
+	int more, sz;
+	dn = NULL;
+	sz = strlen(string)+1;
+	p = s = (char *) xalloc(sz);
+	strcpy(s, string);
+	while (*s != '\0') {
+		t = s;
+		while((*s != '\0') && (*s != '_')) s++;
+		if (*s == '_') {
+			more = TRUE;
+			*s = '\0';
+		} else {
+			more = FALSE;
+		}
+		dn_new = (Dict_node *) xalloc(sizeof (Dict_node));
+		dn_new->right = dn;
+		dn = dn_new;
+		dn->string = string_set_add(t, dict->string_set);
+		dn->file = NULL;
+		if (more) s++;
+	}
+	xfree(p, sz);
+	return dn;
+}
+static char current_name[] = "AAAAAAAA";
+#define CN_size (sizeof(current_name)-1)
+static void increment_current_name(void)
+{
+	int i, carry;
+	i = CN_size-1;
+	carry = 1;
+	while (carry == 1) {
+		current_name[i]++;
+		if (current_name[i] == 'Z'+1) {
+			current_name[i] = 'A';
+			carry = 1;
+		} else {
+			carry = 0;
+		}
+		i--;
+	}
+}
+/**
+ * Generate a new connector name obtained from the current_name.
+ * allocate string space for it.
+ * @return a pointer to connector name.
+ */
+static const char * generate_id_connector(Dictionary dict)
+{
+	char buff[2*MAX_WORD];
+	unsigned int i;
+	char * t;
+	for (i=0; current_name[i] == 'A'; i++)
+	  ;
+	/* i is now the number of characters of current_name to skip */
+	t = buff;
+	/* All idiom connector names start with the two letters "ID" */
+	*t++ = 'I';
+	*t++ = 'D';
+	for (; i < CN_size; i++ )
+	{
+		*t++ = current_name[i] ;
+	}
+	*t++ = '\0';
+	return string_set_add(buff, dict->string_set);
+}
+/**
+ * Takes as input a pointer to a Dict_node.
+ * The string of this Dict_node is an idiom string.
+ * This string is torn apart, and its components are inserted into the
+ * dictionary as special idiom words (ending in .I*, where * is a number).
+ * The expression of this Dict_node (its node field) has already been
+ * read and constructed.  This will be used to construct the special idiom
+ * expressions.
+ * The given dict node is freed.  The string is also freed.
+ */
+void insert_idiom(Dictionary dict, Dict_node * dn)
+{
+	Exp * nc, * no, * n1;
+	E_list *ell, *elr;
+	const char * s;
+	int s_length;
+	Dict_node * dn_list, * xdn, * start_dn_list;
+	no = dn->exp;
+	s = dn->string;
+	s_length = strlen(s);
+	if (!is_idiom_string(s))
+	{
+		prt_error("Warning: Word \"%s\" on line %d "
+		          "is not a correctly formed idiom string.\n"
+		          "\tThis word will be ignored\n",
+		          s, dict->line_number);
+		xfree((char *)dn, sizeof (Dict_node));
+		return;
+	}
+	dn_list = start_dn_list = make_idiom_Dict_nodes(dict, s);
+	xfree((char *)dn, sizeof (Dict_node));
+	if (dn_list->right == NULL) {
+	  prt_error("Fatal Error: Idiom string with only one connector -- should have been caught");
+		exit(1);
+	}
+	/* first make the nodes for the base word of the idiom (last word) */
+	/* note that the last word of the idiom is first in our list */
+	/* ----- this code just sets up the node fields of the dn_list ----*/
+	nc = Exp_create(dict);
+	nc->u.string = generate_id_connector(dict);
+	nc->dir = '-';
+	nc->multi = FALSE;
+	nc->type = CONNECTOR_type;
+	nc->cost = 0;
+	n1 = Exp_create(dict);
+	n1->u.l = ell = (E_list *) xalloc(sizeof(E_list));
+	ell->next = elr = (E_list *) xalloc(sizeof(E_list));
+	elr->next = NULL;
+	ell->e = nc;
+	elr->e = no;
+	n1->type = AND_type;
+	n1->cost = 0;
+	dn_list->exp = n1;
+	dn_list = dn_list->right;
+	while(dn_list->right != NULL) {
+		/* generate the expression for a middle idiom word */
+		n1 = Exp_create(dict);
+		n1->u.string = NULL;
+		n1->type = AND_type;
+		n1->cost = 0;
+		n1->u.l = ell = (E_list *) xalloc(sizeof(E_list));
+		ell->next = elr = (E_list *) xalloc(sizeof(E_list));
+		elr->next = NULL;
+		nc = Exp_create(dict);
+		nc->u.string = generate_id_connector(dict);
+		nc->dir = '+';
+		nc->multi = FALSE;
+		nc->type = CONNECTOR_type;
+		nc->cost = 0;
+		elr->e = nc;
+		increment_current_name();
+		nc = Exp_create(dict);
+		nc->u.string = generate_id_connector(dict);
+		nc->dir = '-';
+		nc->multi = FALSE;
+		nc->type = CONNECTOR_type;
+		nc->cost = 0;
+		ell->e = nc;
+		dn_list->exp = n1;
+		dn_list = dn_list->right;
+	}
+	/* now generate the last one */
+	nc = Exp_create(dict);
+	nc->u.string = generate_id_connector(dict);
+	nc->dir = '+';
+	nc->multi = FALSE;
+	nc->type = CONNECTOR_type;
+	nc->cost = 0;
+	dn_list->exp = nc;
+	increment_current_name();
+	/* ---- end of the code alluded to above ---- */
+	/* now its time to insert them into the dictionary */
+	dn_list = start_dn_list;
+	while (dn_list != NULL) {
+		xdn = dn_list->right;
+		dn_list->left = dn_list->right = NULL;
+		dn_list->string = build_idiom_word_name(dict, dn_list->string);
+		dict->root = insert_dict(dict, dict->root, dn_list);
+		dict->num_entries++;
+		dn_list = xdn;
+	}
+	/* xfree((char *)s, s_length+1); strings are handled by string_set */
+}
+/**
+ * returns TRUE if this is a word ending in ".Ix", where x is a number.
+ */
+int is_idiom_word(const char * s)
+{
+	return (numberfy(s) != -1) ;
+}
+#ifdef THIS_IS_NOT_USED
+/*
+  returns TRUE if the list of words contains only words that are
+  idiom words.  This is useful, because under this condition you want
+   to be able to insert the word anyway, as long as it doesn't match
+   exactly.
+*/
+int only_idiom_words(Dict_node * dn)
+{
+	while(dn != NULL) {
+		if (!is_idiom_word(dn->string)) return FALSE;
+		dn = dn->right;
+	}
+	return TRUE;
+}
+#endif