interscript-maps 2.0.5

Sign up to get free protection for your applications and to get access to all the features.
Files changed (291) hide show
  1. checksums.yaml +7 -0
  2. data/README.adoc +28 -0
  3. data/interscript-maps.gemspec +28 -0
  4. data/interscript-maps.yaml +235 -0
  5. data/libs/posix.iml +11 -0
  6. data/libs/unicode.iml +13 -0
  7. data/libs/var-Cyrl.iml +7 -0
  8. data/libs/var-kor.iml +17 -0
  9. data/maps-staging/royin-tha-Thai-Latn-1939-generic.imp +98 -0
  10. data/maps-staging/royin-tha-Thai-Latn-1968.imp +156 -0
  11. data/maps-staging/royin-tha-Thai-Latn-1999-chained.imp +161 -0
  12. data/maps-staging/royin-tha-Thai-Latn-1999.imp +78 -0
  13. data/maps-staging/var-tha-Thai-Thai-phonemic.imp +53 -0
  14. data/maps-staging/var-tha-Thai-Zsym-ipa.imp +273 -0
  15. data/maps/acadsin-zho-Hani-Latn-2002.imp +27515 -0
  16. data/maps/alalc-amh-Ethi-Latn-1997.imp +392 -0
  17. data/maps/alalc-amh-Ethi-Latn-2011.imp +85 -0
  18. data/maps/alalc-ara-Arab-Latn-1997.imp +1171 -0
  19. data/maps/alalc-asm-Deva-Latn-1997.imp +214 -0
  20. data/maps/alalc-asm-Deva-Latn-2012.imp +53 -0
  21. data/maps/alalc-aze-Arab-Latn-1997.imp +321 -0
  22. data/maps/alalc-aze-Cyrl-Latn-1997.imp +101 -0
  23. data/maps/alalc-bel-Cyrl-Latn-1997.imp +118 -0
  24. data/maps/alalc-ben-Beng-Latn-1997.imp +225 -0
  25. data/maps/alalc-ben-Beng-Latn-2017.imp +135 -0
  26. data/maps/alalc-bul-Cyrl-Latn-1997.imp +110 -0
  27. data/maps/alalc-div-Thaa-Latn-1997.imp +171 -0
  28. data/maps/alalc-ell-Grek-Latn-1997.imp +381 -0
  29. data/maps/alalc-ell-Grek-Latn-2010.imp +382 -0
  30. data/maps/alalc-guj-Gujr-Latn-1997.imp +223 -0
  31. data/maps/alalc-guj-Gujr-Latn-2011.imp +57 -0
  32. data/maps/alalc-hin-Deva-Latn-1997.imp +248 -0
  33. data/maps/alalc-hin-Deva-Latn-2011.imp +63 -0
  34. data/maps/alalc-kan-Kana-Latn-1997.imp +233 -0
  35. data/maps/alalc-kan-Kana-Latn-2011.imp +58 -0
  36. data/maps/alalc-kat-Geok-Latn-1997.imp +109 -0
  37. data/maps/alalc-kat-Geor-Latn-1997.imp +104 -0
  38. data/maps/alalc-kor-Hang-Latn-1997.imp +68 -0
  39. data/maps/alalc-mal-Mlym-Latn-1997.imp +260 -0
  40. data/maps/alalc-mal-Mlym-Latn-2012.imp +65 -0
  41. data/maps/alalc-mar-Deva-Latn-1997.imp +178 -0
  42. data/maps/alalc-mar-Deva-Latn-2011.imp +51 -0
  43. data/maps/alalc-mkd-Cyrl-Latn-1997.imp +125 -0
  44. data/maps/alalc-mkd-Cyrl-Latn-2013.imp +113 -0
  45. data/maps/alalc-mon-Cyrl-Latn-1997.imp +161 -0
  46. data/maps/alalc-ori-Orya-Latn-1997.imp +234 -0
  47. data/maps/alalc-ori-Orya-Latn-2011.imp +59 -0
  48. data/maps/alalc-pan-Guru-Latn-1997.imp +241 -0
  49. data/maps/alalc-pan-Guru-Latn-2011.imp +71 -0
  50. data/maps/alalc-per-Arab-Latn-1997.imp +318 -0
  51. data/maps/alalc-pli-Deva-Latn-2012.imp +140 -0
  52. data/maps/alalc-pra-Deva-Latn-2012.imp +52 -0
  53. data/maps/alalc-rus-Cyrl-Latn-1997.imp +165 -0
  54. data/maps/alalc-rus-Cyrl-Latn-2012.imp +107 -0
  55. data/maps/alalc-san-Deva-Latn-2012.imp +207 -0
  56. data/maps/alalc-sin-Sinh-Latn-1997.imp +246 -0
  57. data/maps/alalc-sin-Sinh-Latn-2011.imp +63 -0
  58. data/maps/alalc-srp-Cyrl-Latn-1997.imp +124 -0
  59. data/maps/alalc-srp-Cyrl-Latn-2013.imp +115 -0
  60. data/maps/alalc-tam-Taml-Latn-1997.imp +52 -0
  61. data/maps/alalc-tam-Taml-Latn-2011.imp +49 -0
  62. data/maps/alalc-tel-Telu-Latn-1997.imp +237 -0
  63. data/maps/alalc-tel-Telu-Latn-2011.imp +58 -0
  64. data/maps/alalc-ukr-Cyrl-Latn-1997.imp +123 -0
  65. data/maps/alalc-ukr-Cyrl-Latn-2011.imp +32 -0
  66. data/maps/apcbg-bul-Cyrl-Latn-1995.imp +194 -0
  67. data/maps/az-aze-Cyrl-Latn-1939.imp +105 -0
  68. data/maps/az-aze-Cyrl-Latn-1958.imp +50 -0
  69. data/maps/bas-rus-Cyrl-Latn-2017-bss.imp +160 -0
  70. data/maps/bas-rus-Cyrl-Latn-2017-oss.imp +165 -0
  71. data/maps/bgn-jpn-Hrkt-Latn-1962.imp +288 -0
  72. data/maps/bgn-kor-Hang-Latn-1943.imp +31 -0
  73. data/maps/bgn-kor-Kore-Latn-1943.imp +33 -0
  74. data/maps/bgna-bul-Cyrl-Latn-2006.imp +119 -0
  75. data/maps/bgna-bul-Cyrl-Latn-2009.imp +119 -0
  76. data/maps/bgnpcgn-amh-Ethi-Latn-1967.imp +393 -0
  77. data/maps/bgnpcgn-ara-Arab-Latn-1956.imp +472 -0
  78. data/maps/bgnpcgn-arm-Armn-Latn-1981.imp +125 -0
  79. data/maps/bgnpcgn-aze-Cyrl-Latn-1993.imp +111 -0
  80. data/maps/bgnpcgn-bak-Cyrl-Latn-2007.imp +169 -0
  81. data/maps/bgnpcgn-bal-Arab-Latn-2008.imp +296 -0
  82. data/maps/bgnpcgn-bel-Cyrl-Latn-1979.imp +200 -0
  83. data/maps/bgnpcgn-bul-Cyrl-Latn-1952.imp +137 -0
  84. data/maps/bgnpcgn-bul-Cyrl-Latn-2013.imp +38 -0
  85. data/maps/bgnpcgn-che-Cyrl-Latn-2008.imp +176 -0
  86. data/maps/bgnpcgn-deu-Latn-Latn-2000.imp +56 -0
  87. data/maps/bgnpcgn-div-Thaa-Latn-1972.imp +90 -0
  88. data/maps/bgnpcgn-div-Thaa-Latn-1988.imp +71 -0
  89. data/maps/bgnpcgn-ell-Grek-Latn-1962.imp +443 -0
  90. data/maps/bgnpcgn-ell-Grek-Latn-1996.imp +269 -0
  91. data/maps/bgnpcgn-fao-Latn-Latn-1964.imp +41 -0
  92. data/maps/bgnpcgn-fao-Latn-Latn-1968.imp +28 -0
  93. data/maps/bgnpcgn-fas-Arab-Latn-1956.imp +111 -0
  94. data/maps/bgnpcgn-isl-Latn-Latn-1964.imp +42 -0
  95. data/maps/bgnpcgn-isl-Latn-Latn-1968.imp +32 -0
  96. data/maps/bgnpcgn-jpn-Hrkt-Latn-1976.imp +191 -0
  97. data/maps/bgnpcgn-kat-Geor-Latn-1981.imp +116 -0
  98. data/maps/bgnpcgn-kat-Geor-Latn-2009.imp +43 -0
  99. data/maps/bgnpcgn-kaz-Cyrl-Latn-1979.imp +193 -0
  100. data/maps/bgnpcgn-kir-Cyrl-Latn-1979.imp +170 -0
  101. data/maps/bgnpcgn-kor-Hang-Latn-kn-1945.imp +177 -0
  102. data/maps/bgnpcgn-kor-Hang-Latn-rok-2011.imp +40 -0
  103. data/maps/bgnpcgn-kor-Kore-Latn-rok-2011.imp +41 -0
  104. data/maps/bgnpcgn-kur-Arab-Latn-2007.imp +240 -0
  105. data/maps/bgnpcgn-mkd-Cyrl-Latn-1981.imp +132 -0
  106. data/maps/bgnpcgn-mkd-Cyrl-Latn-2013.imp +174 -0
  107. data/maps/bgnpcgn-mon-Cyrl-Latn-1964.imp +168 -0
  108. data/maps/bgnpcgn-nep-Deva-Latn-2011.imp +208 -0
  109. data/maps/bgnpcgn-per-Arab-Latn-1958.imp +312 -0
  110. data/maps/bgnpcgn-prs-Arab-Latn-2007.imp +552 -0
  111. data/maps/bgnpcgn-prs-Arab-Latn-yaghoubi.imp +445 -0
  112. data/maps/bgnpcgn-pus-Arab-Latn-1968.imp +289 -0
  113. data/maps/bgnpcgn-ron-cyrl-latn-2002.imp +165 -0
  114. data/maps/bgnpcgn-rue-Cyrl-Latn-2016.imp +133 -0
  115. data/maps/bgnpcgn-rus-Cyrl-Latn-1947.imp +195 -0
  116. data/maps/bgnpcgn-sme-Latn-Latn-1984.imp +48 -0
  117. data/maps/bgnpcgn-srp-Cyrl-Latn-1962.imp +55 -0
  118. data/maps/bgnpcgn-srp-Cyrl-Latn-2005.imp +146 -0
  119. data/maps/bgnpcgn-tat-Cyrl-Latn-2007.imp +185 -0
  120. data/maps/bgnpcgn-tgk-Cyrl-Latn-1994.imp +188 -0
  121. data/maps/bgnpcgn-ukr-Cyrl-Latn-1965.imp +136 -0
  122. data/maps/bgnpcgn-ukr-Cyrl-Latn-2019.imp +88 -0
  123. data/maps/bgnpcgn-urd-Arab-Latn-2007.imp +333 -0
  124. data/maps/bgnpcgn-uzb-Cyrl-Latn-1979.imp +145 -0
  125. data/maps/bgnpcgn-uzb-Cyrl-Latn-2000.imp +74 -0
  126. data/maps/bgnpcgn-zho-Hans-Latn-1979.imp +7463 -0
  127. data/maps/bis-asm-Beng-Latn-13194-1991.imp +154 -0
  128. data/maps/bis-ben-Beng-Latn-13194-1991.imp +151 -0
  129. data/maps/bis-dev-Deva-Latn-13194-1991.imp +178 -0
  130. data/maps/bis-guj-Gujr-Latn-13194-1991.imp +172 -0
  131. data/maps/bis-kan-Kana-Latn-13194-1991.imp +166 -0
  132. data/maps/bis-mlm-Mlym-Latn-13194-1991.imp +170 -0
  133. data/maps/bis-ori-Orya-Latn-13194-1991.imp +168 -0
  134. data/maps/bis-pnj-Guru-Latn-13194-1991.imp +169 -0
  135. data/maps/bis-tel-Telu-Latn-13194-1991.imp +165 -0
  136. data/maps/bis-tml-Taml-Latn-13194-1991.imp +149 -0
  137. data/maps/by-bel-Cyrl-Latn-1998.imp +123 -0
  138. data/maps/by-bel-Cyrl-Latn-2007.imp +77 -0
  139. data/maps/din-grc-Grek-Latn-31634-2011-t1.imp +627 -0
  140. data/maps/din-hin-Deva-Latn-33904-2018.imp +101 -0
  141. data/maps/din-kat-Geor-Latn-32707-2010.imp +103 -0
  142. data/maps/din-mar-Deva-Latn-33904-2018.imp +83 -0
  143. data/maps/din-nep-Deva-Latn-33904-2018.imp +110 -0
  144. data/maps/din-pli-Deva-Latn-33904-2018.imp +72 -0
  145. data/maps/din-pra-Deva-Latn-33904-2018.imp +66 -0
  146. data/maps/din-san-Deva-Latn-33904-2018.imp +294 -0
  147. data/maps/din-tam-Taml-Latn-33903-2016.imp +187 -0
  148. data/maps/dos-nep-Deva-Latn-1997.imp +47 -0
  149. data/maps/elot-ell-Grek-Latn-743-1982-tl.imp +399 -0
  150. data/maps/elot-ell-Grek-Latn-743-1982-ts.imp +397 -0
  151. data/maps/elot-ell-Grek-Latn-743-2001-tl.imp +34 -0
  152. data/maps/elot-ell-Grek-Latn-743-2001-ts.imp +178 -0
  153. data/maps/ggg-kat-Geor-Latn-2002.imp +75 -0
  154. data/maps/gki-bel-Cyrl-Latn-1992.imp +44 -0
  155. data/maps/gki-bel-Cyrl-Latn-2000.imp +159 -0
  156. data/maps/gost-rus-Cyrl-Latn-16876-71-1983.imp +179 -0
  157. data/maps/gost-rus-Cyrl-Latn-7.79-2000-2002.imp +132 -0
  158. data/maps/hk-yue-Hani-Latn-1888.imp +29201 -0
  159. data/maps/icao-bel-Cyrl-Latn-9303.imp +136 -0
  160. data/maps/icao-bul-Cyrl-Latn-9303.imp +127 -0
  161. data/maps/icao-fas-Arab-Latn-9303.imp +112 -0
  162. data/maps/icao-heb-Hebr-Latn-9303.imp +160 -0
  163. data/maps/icao-mkd-Cyrl-Latn-9303.imp +126 -0
  164. data/maps/icao-rus-Cyrl-Latn-9303.imp +126 -0
  165. data/maps/icao-srp-Cyrl-Latn-9303.imp +126 -0
  166. data/maps/icao-ukr-Cyrl-Latn-9303.imp +127 -0
  167. data/maps/iso-ara-Arab-Latn-233-1984.imp +301 -0
  168. data/maps/iso-asm-Beng-Latn-15919-2001.imp +73 -0
  169. data/maps/iso-ben-Beng-Latn-15919-2001.imp +171 -0
  170. data/maps/iso-ell-Grek-Latn-843-1997-t1.imp +365 -0
  171. data/maps/iso-ell-Grek-Latn-843-1997-t2.imp +43 -0
  172. data/maps/iso-guj-Gujr-Latn-15919-2001.imp +214 -0
  173. data/maps/iso-hin-Deva-Latn-15919-2001.imp +73 -0
  174. data/maps/iso-inc-Deva-Latn-15919-2001.imp +61 -0
  175. data/maps/iso-jpn-Hrkt-Latn-3602-1989.imp +59 -0
  176. data/maps/iso-kan-Kana-Latn-15919-2001.imp +212 -0
  177. data/maps/iso-kat-Geor-Latn-9984-1996.imp +103 -0
  178. data/maps/iso-kor-Hang-Latn-1996-method1.imp +140 -0
  179. data/maps/iso-kor-Hang-Latn-1996-method2.imp +132 -0
  180. data/maps/iso-mal-Mlym-Latn-15919-2001.imp +276 -0
  181. data/maps/iso-mar-Deva-Latn-15919-2001.imp +68 -0
  182. data/maps/iso-nep-Deva-Latn-15919-2001.imp +75 -0
  183. data/maps/iso-ori-Orya-Latn-15919-2001.imp +188 -0
  184. data/maps/iso-pan-Guru-Latn-15919-2001.imp +217 -0
  185. data/maps/iso-pli-Beng-Latn-15919-2001.imp +66 -0
  186. data/maps/iso-pli-Deva-Latn-15919-2001.imp +68 -0
  187. data/maps/iso-pli-Sinh-Latn-15919-2001.imp +211 -0
  188. data/maps/iso-pli-Thai-Latn-15919-2001.imp +47 -0
  189. data/maps/iso-pra-Deva-Latn-15919-2001.imp +60 -0
  190. data/maps/iso-prs-Arab-Latn-233-3-1999.imp +352 -0
  191. data/maps/iso-rus-Cyrl-Latn-9-1995.imp +279 -0
  192. data/maps/iso-san-Deva-Latn-15919-2001.imp +215 -0
  193. data/maps/iso-tam-Taml-Latn-15919-2001.imp +153 -0
  194. data/maps/iso-tel-Telu-Latn-15919-2001.imp +214 -0
  195. data/maps/iso-tha-Thai-Latn-11940-1998.imp +114 -0
  196. data/maps/kp-kor-Hang-Latn-2002.imp +540 -0
  197. data/maps/lshk-yue-Hani-Latn-jyutping-1993.imp +29005 -0
  198. data/maps/masm-mon-Cyrl-Latn-5217-2012.imp +136 -0
  199. data/maps/masm-mon-Latn-Cyrl-5217-2012.imp +162 -0
  200. data/maps/mext-jpn-Hrkt-Latn-1954.imp +403 -0
  201. data/maps/moct-kor-Hang-Latn-2000.imp +475 -0
  202. data/maps/mofa-jpn-Hrkt-Latn-1989.imp +484 -0
  203. data/maps/mv-div-Thaa-Latn-1987.imp +144 -0
  204. data/maps/mvd-bel-Cyrl-Latn-2008.imp +224 -0
  205. data/maps/mvd-bel-Cyrl-Latn-2010.imp +64 -0
  206. data/maps/mvd-rus-Cyrl-Latn-2008.imp +110 -0
  207. data/maps/mvd-rus-Cyrl-Latn-2010.imp +40 -0
  208. data/maps/odni-ara-Arab-Latn-2004.imp +106 -0
  209. data/maps/odni-ara-Arab-Latn-2015.imp +281 -0
  210. data/maps/odni-aze-Cyrl-Latn-2015.imp +158 -0
  211. data/maps/odni-bel-Cyrl-Latn-2015.imp +138 -0
  212. data/maps/odni-bul-Cyrl-Latn-2005.imp +90 -0
  213. data/maps/odni-bul-Cyrl-Latn-2015.imp +103 -0
  214. data/maps/odni-che-Cyrl-Latn-2015.imp +165 -0
  215. data/maps/odni-fas-Arab-Latn-2004.imp +268 -0
  216. data/maps/odni-fas-Arab-Latn-2015.imp +398 -0
  217. data/maps/odni-hin-Deva-Latn-2004.imp +180 -0
  218. data/maps/odni-hin-Deva-Latn-2015.imp +256 -0
  219. data/maps/odni-kat-Geor-Latn-2015.imp +76 -0
  220. data/maps/odni-kaz-Cyrl-Latn-2015.imp +164 -0
  221. data/maps/odni-kir-Cyrl-Latn-2015.imp +149 -0
  222. data/maps/odni-kor-Hang-Latn-2015.imp +307 -0
  223. data/maps/odni-mkd-Cyrl-Latn-2005.imp +28 -0
  224. data/maps/odni-mkd-Cyrl-Latn-2015.imp +124 -0
  225. data/maps/odni-prs-Arab-Latn-2004.imp +120 -0
  226. data/maps/odni-prs-Arab-Latn-2015.imp +225 -0
  227. data/maps/odni-pus-Arab-Latn-2011.imp +327 -0
  228. data/maps/odni-rus-Cyrl-Latn-2015.imp +79 -0
  229. data/maps/odni-srp-Cyrl-Latn-2005.imp +35 -0
  230. data/maps/odni-srp-Cyrl-Latn-2015.imp +130 -0
  231. data/maps/odni-tat-Cyrl-Latn-2015.imp +157 -0
  232. data/maps/odni-tgk-Cyrl-Latn-2015.imp +161 -0
  233. data/maps/odni-tuk-Cyrl-Latn-2015.imp +159 -0
  234. data/maps/odni-uig-Cyrl-Latn-2015.imp +151 -0
  235. data/maps/odni-ukr-Cyrl-Latn-2015.imp +136 -0
  236. data/maps/odni-urd-Arab-Latn-2015.imp +220 -0
  237. data/maps/odni-uzb-Cyrl-Latn-2015.imp +165 -0
  238. data/maps/sac-zho-Hans-Latn-1979.imp +20940 -0
  239. data/maps/sasm-mon-Mong-Latn-general-1978.imp +294 -0
  240. data/maps/sasm-mon-Mong-Latn-phonetic-1978.imp +261 -0
  241. data/maps/ses-ara-Arab-Latn-1930.imp +225 -0
  242. data/maps/stategeocadastre-ukr-Cyrl-Latn-1993.imp +171 -0
  243. data/maps/ua-ukr-Cyrl-Latn-1996.imp +149 -0
  244. data/maps/ua-ukr-Cyrl-Latn-2007.imp +69 -0
  245. data/maps/ua-ukr-Cyrl-Latn-2010.imp +128 -0
  246. data/maps/un-amh-Ethi-Latn-2016.imp +483 -0
  247. data/maps/un-ara-Arab-Latn-1971.imp +137 -0
  248. data/maps/un-ara-Arab-Latn-1972.imp +155 -0
  249. data/maps/un-ara-Arab-Latn-2017.imp +375 -0
  250. data/maps/un-asm-Beng-Latn-1972.imp +188 -0
  251. data/maps/un-bel-Cyrl-Latn-2007.imp +78 -0
  252. data/maps/un-ben-Beng-Latn-2016.imp +516 -0
  253. data/maps/un-ell-Grek-Latn-1987-phonetic.imp +437 -0
  254. data/maps/un-ell-Grek-Latn-1987-tl.imp +27 -0
  255. data/maps/un-ell-Grek-Latn-1987-ts.imp +269 -0
  256. data/maps/un-guj-Gujr-Latn-1972.imp +196 -0
  257. data/maps/un-hin-Deva-Latn-2016.imp +356 -0
  258. data/maps/un-kan-Kana-Latn-2016.imp +214 -0
  259. data/maps/un-mal-Mlym-Latn-1972.imp +215 -0
  260. data/maps/un-mar-Deva-Latn-2016.imp +96 -0
  261. data/maps/un-mon-Mong-Latn-general-2013.imp +170 -0
  262. data/maps/un-mon-Mong-Latn-phonetic-2013.imp +170 -0
  263. data/maps/un-nep-Deva-Latn-1972.imp +295 -0
  264. data/maps/un-nep-Deva-Latn-2013.imp +62 -0
  265. data/maps/un-ori-Orya-Latn-1972.imp +208 -0
  266. data/maps/un-pan-Guru-Latn-1972.imp +321 -0
  267. data/maps/un-prs-Arab-Latn-1967.imp +214 -0
  268. data/maps/un-rus-Cyrl-Latn-1987.imp +96 -0
  269. data/maps/un-sin-Sinh-Latn-1972.imp +193 -0
  270. data/maps/un-tam-Taml-Latn-1972.imp +173 -0
  271. data/maps/un-tel-Telu-Latn-1972.imp +229 -0
  272. data/maps/un-ukr-Cyrl-Latn-1998.imp +58 -0
  273. data/maps/un-ukr-Cyrl-Latn-2012.imp +95 -0
  274. data/maps/un-urd-Arab-Latn-1972.imp +290 -0
  275. data/maps/var-amh-Ethi-Latn-eae-2003.imp +414 -0
  276. data/maps/var-gez-Ethi-Latn-eae-2003.imp +54 -0
  277. data/maps/var-hin-Deva-Latn-hunterian-1872.imp +212 -0
  278. data/maps/var-jpn-Hrkt-Latn-hepburn-1886.imp +399 -0
  279. data/maps/var-jpn-Hrkt-Latn-hepburn-1954.imp +382 -0
  280. data/maps/var-kor-Hang-Hang-jamo.imp +11196 -0
  281. data/maps/var-kor-Hang-Latn-mr-1939.imp +574 -0
  282. data/maps/var-kor-Kore-Hang-2013.imp +59764 -0
  283. data/maps/var-kor-Kore-Latn-mr-1939.imp +36 -0
  284. data/maps/var-mar-Deva-Latn-hunterian-1872.imp +39 -0
  285. data/maps/var-mon-Mong-Latn-1930.imp +101 -0
  286. data/maps/var-mon-Mong-Latn-lessing.imp +181 -0
  287. data/maps/var-mon-Mong-Latn-vpmc.imp +182 -0
  288. data/maps/var-pra-Deva-Latn-iast-1912.imp +36 -0
  289. data/maps/var-san-Deva-Latn-iast-1912.imp +147 -0
  290. data/maps/var-zho-Hani-Latn-wd-1979.imp +27549 -0
  291. metadata +335 -0
@@ -0,0 +1,54 @@
1
+ metadata {
2
+ authority_id: var
3
+ id: 2003
4
+ language: gez
5
+ source_script: Ethi
6
+ destination_script: Latn
7
+ name: Encyclopaedia Aethiopica Amharic transliteration system (2003)
8
+ url: https://brill.com/view/book/edcoll/9789004419582/front-11.xml?language=en
9
+ creation_date: 2003
10
+ description: |
11
+ The Encyclopaedia Aethiopica (EAe) is a basic encyclopedia for Ethiopian and Eritrean studies. It employs an in-house form of romanization of Geez, Amharic, and other languages, which varies greatly from standard formats, such as BGN/PCGN: the emperor Menelek II's name, for example, is written as "Mənilək II".
12
+ }
13
+
14
+ tests {
15
+ test "በቀዳሚ ገብረ እግዚአብሔር ሰማየ ወምድረ", "bäqädami gäbərä ʾəgəziʾabəḥerə sämayä wämədərä"
16
+ test "ወምድርሰ ኢታስተርኢ ወኢኮነት ድሉተ ወጽልመት መልዕልተ ቀላይ ወመንፈሰ እግዚአብሔር ይጼልል መልዕልተ ማይ", "wämədərəsä ʾitasətärəʾi wäʾikonätə dəlutä wäṣələmätə mäləʿələtä qälayə wämänəfäsä ʾəgəziʾabəḥerə yəṣelələ mäləʿələtä mayə"
17
+ test "ወይቤ እግዚአብሔር ለይኩን ብርሃን ወኮነ ብርሃን", "wäyəbe ʾəgəziʾabəḥerə läyəkunə bərəhanə wäkonä bərəhanə"
18
+ test "ወርእዮ እግዚአብሔር ለብርሃን ከመ ሠናይ ወፈለጠ እግዚአብሔር ማእከለ ብርሃን ወማእከለ ጽልመት", "wärəʾəyo ʾəgəziʾabəḥerə läbərəhanə kämä śänayə wäfäläṭä ʾəgəziʾabəḥerə maʾəkälä bərəhanə wämaʾəkälä ṣələmätə"
19
+ test "ወሰመዮ እግዚአብሔር ለብርሃን ዕለተ ወለጽልመት ሌሊተ ወኮነ ሌሊተ ወጸብሐ ወኮነ መዓልተ ፩", "wäsämäyo ʾəgəziʾabəḥerə läbərəhanə ʿəlätä wäläṣələmätə lelitä wäkonä lelitä wäṣäbəḥa wäkonä mäʿalətä 1"
20
+ test "ወይቤ እግዚአብሔር ለይኩን ጠፈር ማእከለ ማይ ከመ ይፍልጥ ማእከለ ማይ ወኮነ ከማሁ", "wäyəbe ʾəgəziʾabəḥerə läyəkunə ṭäfärə maʾəkälä mayə kämä yəfələṭə maʾəkälä mayə wäkonä kämahu"
21
+ test "ወገብረ እግዚአብሔር ጠፈረ ወፈለጠ እግዚአብሔር ማእብለ ማይ ዘታሕተ ጠፈር ወማእከለ ማይ ዘመልዕልተ ጠፈር", "wägäbərä ʾəgəziʾabəḥerə ṭäfärä wäfäläṭä ʾəgəziʾabəḥerə maʾəbəlä mayə zätaḥətä ṭäfärə wämaʾəkälä mayə zämäləʿələtä ṭäfärə"
22
+ test "ወሰመዮ እግዚአብሔር ለውእቱ ጠፈር ሰማየ ወርእየ እግዚአብሔር ከመ ሠናይ ወኮነ ሌሊተ ወጸብሐ ወኮነ ካልእተ ዕለተ", "wäsämäyo ʾəgəziʾabəḥerə läwəʾətu ṭäfärə sämayä wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə wäkonä lelitä wäṣäbəḥa wäkonä kaləʾətä ʿəlätä"
23
+ test "ወይቤ እግዚአብሔር ለይትጋባእ ማይ ዘመትሕተ ሰማይ ውስተ አሐዱ መካን ወያስተርኢ የብስ ወኮነ ከማሁ ውተጋብአ ማይ ውስተ ምእላዲሁ ወአስተርአየ የብስ", "wäyəbe ʾəgəziʾabəḥerə läyətəgabaʾə mayə zämätəḥətä sämayə wəsətä ʾaḥadu mäkanə wäyasətärəʾi yäbəsə wäkonä kämahu wətägabəʾa mayə wəsətä məʾəladihu wäʾasətärəʾayä yäbəsə"
24
+ test "ወሰመዮ እግዚአብሔር ለየብስ ምድረ ወለምእላዲሁ ለማይ ሰመዮ ባሕረ ወርእየ እግዚአብሔር ከመ ሠናይ", "wäsämäyo ʾəgəziʾabəḥerə läyäbəsə mədərä wäläməʾəladihu lämayə sämäyo baḥərä wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə"
25
+ test "ወይቤ እግዚአብሔር ለታብቍል ምድር ሐመልማለ ሣዕር ዘይዘራእ በበዘርኡ ወበበዘመዱ ወዘበበ አምሳሊሁ ወዕፀወ ዘይፈሪ ወይገብር ፋሬሁ ዘእምውስቴቱ ዘርኡ ዘይወጽእ ዘይከውን በበዘመዱ ዲበ ምድር ወኮነ ከማሁ", "wäyəbe ʾəgəziʾabəḥerə lätabəqʷələ mədərə ḥamäləmalä śaʿərə zäyəzäraʾə bäbäzärəʾu wäbäbäzämädu wäzäbäbä ʾaməsalihu wäʿəṣ̓äwä zäyəfäri wäyəgäbərə farehu zäʾəməwəsətetu zärəʾu zäyəwäṣəʾə zäyəkäwənə bäbäzämädu dibä mədərə wäkonä kämahu"
26
+ test "ወአውጽአት ምድር ሐመልማለ ሣዕር ዘይዘራእ ዘርኡ ዘበበዘመዱ ወበበአርአያሁ ወዕፀወ ዘይፈሪ ወይገብር ፍሬሁ ዘእምውስቴቱ ዘርእ ዘይከውን በበዘመዱ መልዕልተ ምድር ወርእየ እግዚአብሔር ከመ ሠናይ", "wäʾawəṣəʾatə mədərə ḥamäləmalä śaʿərə zäyəzäraʾə zärəʾu zäbäbäzämädu wäbäbäʾarəʾayahu wäʿəṣ̓äwä zäyəfäri wäyəgäbərə fərehu zäʾəməwəsətetu zärəʾə zäyəkäwənə bäbäzämädu mäləʿələtä mədərə wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə"
27
+ test "ወኮነ ሌሊተ ወጸብሐ ወኮነ ሣልስተ ዕለት", "wäkonä lelitä wäṣäbəḥa wäkonä śaləsətä ʿəlätə"
28
+ test "ወይቤ እግዚአብሔር ይኩኑ ብርሃናት ውስተ ጠፈረ ሰማይ ከመ ያብርሁ ዲበ ምድር ወይፍልጡ ማእከለ ዕለት ወማእከለ ሌሊት ወይኩኑ ለተአምር ወለዘመን ወለመዋዕል ወለዓመታት", "wäyəbe ʾəgəziʾabəḥerə yəkunu bərəhanatə wəsətä ṭäfärä sämayə kämä yabərəhu dibä mədərə wäyəfələṭu maʾəkälä ʿəlätə wämaʾəkälä lelitə wäyəkunu lätäʾamərə wäläzämänə wälämäwaʿələ wäläʿamätatə"
29
+ test "ወይኩኑ ለአብርሆ ውስተ ጠፈረ ሰማይ ከመ ያብርሁ ዲበ ምድር ወኮነ ከማሁ", "wäyəkunu läʾabərəho wəsətä ṭäfärä sämayə kämä yabərəhu dibä mədərə wäkonä kämahu"
30
+ test "ወገብረ እግዚአብሔር ብርሃናተ ክልኤተ ዐበይተ ዘየዐቢ ብርሃን ከመ ይምልክ መዐልተ ወዘይንእስ ብርሃን ከመ ይምልክ ሌሊተ ምስለ ከዋክብቲሁ", "wägäbərä ʾəgəziʾabəḥerə bərəhanatä kələʾetä ʿabäyətä zäyäʿabi bərəhanə kämä yəmələkə mäʿalətä wäzäyənəʾəsə bərəhanə kämä yəmələkə lelitä məsəlä käwakəbətihu"
31
+ test "ወሤሞሙ እግዚአብሔር ውስተ ጠፈረ ሰማይ ከመ ያብርሁ ዲበ ምድር 18ወይኰንንዋ ለዕለት ወለሌሊትኒ ወይፍልጡ ማእከለ ሌሊት ወማእከለ ብርሃን ወርእየ እግዚአብሔር ከመ ሠናይ", "wäśemomu ʾəgəziʾabəḥerə wəsətä ṭäfärä sämayə kämä yabərəhu dibä mədərə 18wäyəkʷänənəwa läʿəlätə wälälelitəni wäyəfələṭu maʾəkälä lelitə wämaʾəkälä bərəhanə wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə"
32
+ test "ወኮነ ሌሊተ ወጸብሐ ወኮነ ራብዕተ ዕለተ", "wäkonä lelitä wäṣäbəḥa wäkonä rabəʿətä ʿəlätä"
33
+ test "ወይቤ እግዚአብሔር ለታውጽእ ማይ ዘይትሐወስ ዘቦ መንፈሰ ሕይወት ወአዕዋፈ ዘይሠርር መልዕልተ ምድር ወመትሕት ሰማይ ወኮነ ከማሁ", "wäyəbe ʾəgəziʾabəḥerə lätawəṣəʾə mayə zäyətəḥawäsə zäbo mänəfäsä ḥəyəwätə wäʾaʿəwafä zäyəśärərə mäləʿələtä mədərə wämätəḥətə sämayə wäkonä kämahu"
34
+ test "ወገብረ እግዚአብሔር ዐናብርተ ዐበይተ ወኵሎ ነፍሰ ሕይወት ዘይትሐወስ ዘአውጽአ ማይ በበዘመዱ ወኵሎ ዖፈ ዘይሠርር በበዘመዱ ወርእየ እግዚአብሔር ከመ ሠናይ", "wägäbərä ʾəgəziʾabəḥerə ʿanabərətä ʿabäyətä wäkʷəlo näfəsä ḥəyəwätə zäyətəḥawäsə zäʾawəṣəʾa mayə bäbäzämädu wäkʷəlo ʿofä zäyəśärərə bäbäzämädu wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə"
35
+ test "ወባረኮሙ እግዚአብሔር ወይቤ ብዝኁ ወተባዝኁ ወምልእዋ ለምድር ወአዕዋፍኒ ይብዝኁ ውስተ ምድር", "wäbaräkomu ʾəgəziʾabəḥerə wäyəbe bəzəḫu wätäbazəḫu wämələʾəwa lämədərə wäʾaʿəwafəni yəbəzəḫu wəsətä mədərə"
36
+ test "ወኮነ ሌሊተ ወጸብሐ ወኮነ ኃምስተ ዕለተ", "wäkonä lelitä wäṣäbəḥa wäkonä ḫaməsətä ʿəlätä"
37
+ test "ወይቤ እግዚአብሔር ለታውጽእ ምድር ዘመደ እንስሳ ወዘይትሐወስ ወአራዊተ ምድር ዘበበ ዘመዱ ወኮነ ከማሁ", "wäyəbe ʾəgəziʾabəḥerə lätawəṣəʾə mədərə zämädä ʾənəsəsa wäzäyətəḥawäsə wäʾarawitä mədərə zäbäbä zämädu wäkonä kämahu"
38
+ test "ወገብረ እግዚአብሔር እንስሳ ዘበበ ዘመዱ ወኵሎ ዘይትሐወስ ውስተ ምድር በበዘመዱ ወአራዊተ ምድር በበዘመዱ ወርእየ እግዚአብሔር ከመ ሠናይ", "wägäbərä ʾəgəziʾabəḥerə ʾənəsəsa zäbäbä zämädu wäkʷəlo zäyətəḥawäsə wəsətä mədərə bäbäzämädu wäʾarawitä mədərə bäbäzämädu wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə"
39
+ test "ወይቤ እግዚአብሔር ንግበር ሰብአ በአርአያነ ወበአምሳሊነ ወይኰንን ዐሣተ ባሕር ወአራዊተ ምድር ወአዕዋፈ ሰማይ ወእንስሳሂ ወኵሎ ምድረ ወአራዊተ ዘይትሐወስ ዲበ ምድር", "wäyəbe ʾəgəziʾabəḥerə nəgəbärə säbəʾa bäʾarəʾayanä wäbäʾaməsalinä wäyəkʷänənə ʿaśatä baḥərə wäʾarawitä mədərə wäʾaʿəwafä sämayə wäʾənəsəsahi wäkʷəlo mədərä wäʾarawitä zäyətəḥawäsə dibä mədərə"
40
+ test "ወገብሮ እግዚአብሔር ለእጓለ እመሕያው በአምሳለ እግዚአብሔር ተባዕተ ወአንስተ ገብሮሙ", "wägäbəro ʾəgəziʾabəḥerə läʾəgʷalä ʾəmäḥəyawə bäʾaməsalä ʾəgəziʾabəḥerə täbaʿətä wäʾanəsətä gäbəromu"
41
+ test "ወባረኮሙ እግዚአብሔር ወይቤሎሙ ብዝኁ ወተባዝኁ ወምልእዋ ለምድር ወቅንይዋ ወኰንንዎሙ ለዓሣተ ባሕር ወለአዕዋፈ ሰማይ ወለኵሉ እንስሳ ወለኵሉ ዘይትሐወስ ዲበ ምድር", "wäbaräkomu ʾəgəziʾabəḥerə wäyəbelomu bəzəḫu wätäbazəḫu wämələʾəwa lämədərə wäqənəyəwa wäkʷänənəwomu läʿaśatä baḥərə wäläʾaʿəwafä sämayə wäläkʷəlu ʾənəsəsa wäläkʷəlu zäyətəḥawäsə dibä mədərə"
42
+ test "ወይቤ እግዚአብሔር ናሁ ወሀብኩክሙ ኵሎ ሣዕረ ዘይዘራእ ወይበቍል በዘርኡ ተዘሪኦ ዲበ ኵሉ ምድር ወኵሉ ዕፀው ዘሀሎ ውስቴቱ ዘርኡ ዘይዘራእ በፍሬሁ ለክሙ ውእቱ መብልዕ", "wäyəbe ʾəgəziʾabəḥerə nahu wähabəkukəmu kʷəlo śaʿərä zäyəzäraʾə wäyəbäqʷələ bäzärəʾu täzäriʾo dibä kʷəlu mədərə wäkʷəlu ʿəṣ̓äwə zähalo wəsətetu zärəʾu zäyəzäraʾə bäfərehu läkəmu wəʾətu mäbələʿə"
43
+ test "ወለኵሉ አራዊተ ምድር ወለኵሉ አዕዋፈ ሰማይ ወለኵሉ ዘይትሐወስ ውስተ ምድር ዘቦ መንፈሰ ሕይወት ወኵሉ ሐመልማለ ሣዕር ይኩንክሙ መብልዐ ወኮነ ከማሁ", "wäläkʷəlu ʾarawitä mədərə wäläkʷəlu ʾaʿəwafä sämayə wäläkʷəlu zäyətəḥawäsə wəsətä mədərə zäbo mänəfäsä ḥəyəwätə wäkʷəlu ḥamäləmalä śaʿərə yəkunəkəmu mäbələʿa wäkonä kämahu"
44
+ test "ወርእየ እግዚአብሔር ኵሎ ዘገብረ ከመ ጥቀ ሠናይ ወኮነ ሌሊተ ወጸብሐ ወኮነ ሳድስተ ዕለተ", "wärəʾəyä ʾəgəziʾabəḥerə kʷəlo zägäbərä kämä ṭəqä śänayə wäkonä lelitä wäṣäbəḥa wäkonä sadəsətä ʿəlätä"
45
+ }
46
+
47
+ dependency "var-amh-Ethi-Latn-eae-2003", as: ethilatn
48
+
49
+ stage {
50
+
51
+ run map.ethilatn.stage.main
52
+
53
+ }
54
+
@@ -0,0 +1,212 @@
1
+ metadata {
2
+ authority_id: var
3
+ id: 1872
4
+ language: iso-639-2:hin
5
+ source_script: Deva
6
+ destination_script: Latn
7
+ name: Hindi Hunterian system
8
+ url: https://transliteration.eki.ee/pdf/Hindi-Marathi-Nepali.pdf
9
+ creation_date: 1872
10
+ description:
11
+ The Hunterian system is the national system of romanization in India.
12
+
13
+ notes:
14
+
15
+ - a, i and u are used in word-final position. The a in gaon and the u in pur are not accented.
16
+ - ज्ञ is transliterated gy.
17
+ - v is used before i.
18
+ }
19
+
20
+ tests {
21
+ test "परिपक्क", "paraipakka"
22
+ test "जगत्", "jagat"
23
+ test "संख्या", "sankhyaā"
24
+ test "गंभीर मरीजों के मामले में भारत दूसरे नंबर पर", "ganbhaīra maraījaon kae maāmalae maen bhaārata daūsarae nanbara para"
25
+ test "कोरोना अपडेट्स", "kaoraonaā apadaetsa"
26
+ test "सीडीसी चीफ का बयान अहम", "saīdaīsaī chaīpha kaā bayaāna ahama"
27
+ test "गूगल प्ले स्टोर पर पेटीएम की वापसी", "gaūgala plae staora para paetaīema kaī waāpasaī"
28
+ test "भारत में गैंबलिंग की इजाजत नहीं", "bhaārata maen gaainbalainga kaī ijaājata nahaīn"
29
+ test "कोरोना वैक्सीन मुद्दे पर घिरे राष्ट्रपति; जो बाइडेन बोले- मुझे और देश को वैज्ञानिकों पर भरोसा है, डोनाल्ड ट्रम्प पर नहीं", "kaoraonaā waaiksaīna mauddae para ghairae raāshtrapatai; jao baāidaena baolae- maujhae aura daesa kao waaigyānaikaon para bharaosaā haai, daonaālda trampa para nahaīn"
30
+ test "गूगल की कार्रवाई पर पेटीएम ने कहा था कि ऐप को अस्थायी तौर पर प्ले-स्टोर से हटाया गया है, आपके पैसे सुरक्षित हैं", "gaūgala kaī kaārrawaāi para paetaīema nae kahaā thaā kai aipa kao asthaāyaī taaura para plae-staora sae hataāyaā gayaā haai, āpakae paaisae saurakshaita haain"
31
+ }
32
+
33
+ stage {
34
+
35
+ # RULES
36
+ # note[1]
37
+ sub "\u0906", "a", after: boundary
38
+ sub "\u0908", "i", after: boundary
39
+ sub "\u090A", "u", after: boundary
40
+
41
+ # note[3]
42
+ sub "\u0935", "v", after: any("इई")
43
+
44
+
45
+ # CHARACTERS
46
+ parallel {
47
+
48
+ # I. Vowels and Diphthongs (see Note 1)
49
+
50
+ sub "अ", "a"
51
+ sub "आ", "ā"
52
+ sub "इ", "i"
53
+ sub "ई", "ī"
54
+ sub "उ", "u"
55
+ sub "ऊ", "ū"
56
+ sub "ऋ", "ri"
57
+ sub "ए", "e"
58
+ sub "ऐ", "ai"
59
+ sub "ओ", "o"
60
+ sub "औ", "au"
61
+
62
+ # II. Consonants (see Note 2)
63
+ # Gutturals
64
+ sub "क", "ka"
65
+ sub "ख", "kha"
66
+ sub "ग", "ga"
67
+ sub "घ", "gha"
68
+ sub "ङ", "nga"
69
+
70
+ # Palatals
71
+ sub "च", "cha"
72
+ sub "छ", "chha"
73
+ sub "ज", "ja"
74
+ sub "झ", "jha"
75
+ sub "ञ", "nya"
76
+
77
+ # Cerebrals
78
+ sub "ट", "ta"
79
+ sub "ठ", "tha"
80
+ sub "ड", "da"
81
+ sub "ढ", "dha"
82
+ sub "ण", "na"
83
+
84
+ # Dentals
85
+ sub "त", "ta"
86
+ sub "थ", "tha"
87
+ sub "द", "da"
88
+ sub "ध", "dha"
89
+ sub "न", "na"
90
+
91
+ # Labials
92
+ sub "प", "pa"
93
+ sub "फ", "pha"
94
+ sub "ब", "ba"
95
+ sub "भ", "bha"
96
+ sub "म", "ma"
97
+
98
+ # Semivowels
99
+ sub "य", "ya"
100
+ sub "र", "ra"
101
+ sub "ल", "la"
102
+ sub "व", "wa"
103
+
104
+ # Sibilants
105
+ sub "श", "sa"
106
+ sub "ष", "sha"
107
+ sub "स", "sa"
108
+
109
+ # Aspirate
110
+ sub "ह", "ha"
111
+
112
+
113
+ # Additional consonants
114
+ sub "क़", "qa"
115
+ sub "ख़", "kha"
116
+ sub "ग़", "ġa"
117
+ sub "ज़", "za"
118
+ sub "ड़", "ṙa"
119
+ sub "ढ़", "ṙha"
120
+ sub "फ़", "fa"
121
+ sub "ळ", "la"
122
+
123
+ # Anusvāra
124
+ sub "ं", "n"
125
+
126
+ # Bisarga
127
+ sub "ः", "h"
128
+
129
+ # Anunāsika
130
+ sub "ँ", "m"
131
+
132
+ # Note 2
133
+ sub "ज्ञ", "gy"
134
+
135
+
136
+ # Medials # Needed for connecting constants
137
+ sub "ा", "ā"
138
+ sub "ि", "i"
139
+ sub "ी", "ī"
140
+ sub "ु", "u"
141
+ sub "ू", "ū"
142
+ sub "ृ", "ri"
143
+ sub "े", "e"
144
+ sub "ै", "ai"
145
+ sub "ो", "o"
146
+ sub "ौ", "au"
147
+ sub "‍", "" # Used for joining
148
+
149
+
150
+ #V. Vowelless with halanta (्)
151
+
152
+ # Gutturals
153
+ sub "क्", "k"
154
+ sub "ख्", "kh"
155
+ sub "ग्", "g"
156
+ sub "घ्", "gh"
157
+ sub "ङ्", "ng"
158
+
159
+ # Palatals
160
+ sub "च्", "ch"
161
+ sub "छ्", "chh"
162
+ sub "ज्", "j"
163
+ sub "झ्", "jh"
164
+ sub "ञ्", "ny"
165
+
166
+ # Cerebrals
167
+ sub "ट्", "t"
168
+ sub "ठ्", "th"
169
+ sub "ड्", "d"
170
+ sub "ढ्", "dh"
171
+ sub "ण्", "n"
172
+
173
+ # Dentals
174
+ sub "त्", "t"
175
+ sub "थ्", "th"
176
+ sub "द्", "d"
177
+ sub "ध्", "dh"
178
+ sub "न्", "n"
179
+
180
+ # Labials
181
+ sub "प्", "p"
182
+ sub "फ्", "ph"
183
+ sub "ब्", "b"
184
+ sub "भ्", "bh"
185
+ sub "म्", "m"
186
+
187
+ # Semivowels
188
+ sub "य्", "y"
189
+ sub "र्", "r"
190
+ sub "ल्", "l"
191
+ sub "व्", "w"
192
+
193
+ # Sibilants
194
+ sub "श्", "s"
195
+ sub "ष्", "sh"
196
+ sub "स्", "s"
197
+
198
+ # Aspirate
199
+ sub "ह्", "h"
200
+
201
+ # Additional consonants
202
+ sub "क़्", "q"
203
+ sub "ख़्", "kh"
204
+ sub "ग़्", "ġ"
205
+ sub "ज़्", "z"
206
+ sub "ड़्", "ṙ"
207
+ sub "ढ़्", "ṙh"
208
+ sub "फ़्", "f"
209
+ sub "ळ्", "l"
210
+ }
211
+
212
+ }
@@ -0,0 +1,399 @@
1
+ metadata {
2
+ authority_id: var
3
+ id: hepburn-1886
4
+ language: iso-639-2:jpn
5
+ source_script: Hrkt
6
+ destination_script: Latn
7
+ name: Traditional Hepburn
8
+ url: http://www.ab.cyberhome.ne.jp/~kaizu/roomazi/doc/hep3.html
9
+ creation_date: 1886
10
+ adoption_date:
11
+ description:
12
+ This is a traditional version of Hepburn romanization.
13
+
14
+ notes:
15
+ "
16
+ The book was published before the Japanese orthographic reform,
17
+ and this map takes the reformed orthography in Kana as the source
18
+ form.
19
+ https://en.wikipedia.org/wiki/Historical_kana_orthography
20
+
21
+ The distinction for long-vowel vs. repeating vowels has not been
22
+ implemented.
23
+ For example, the consecutive o's in these words are considered
24
+ a case of long vowel, and is transliterated as ō:
25
+
26
+ 氷 (こおり) - kōri, 大阪(おおさか)- Ōsaka
27
+
28
+ If there are two consecutive o's in a string, but they belong to
29
+ different morpheme, then they should be transliterated separately.
30
+
31
+ 小躍り(こおどり)- koodori
32
+
33
+ The same goes for the combinations o+u, u+u as well.
34
+
35
+ However, this cannot be easily determined from the Kana.
36
+ Lexical knowledge is needed, and sometimes the Kanji representation
37
+ will give more hints about morpheme boundary.
38
+
39
+ For now, this map will assume that all o+o, o+u, u+u combinations to
40
+ be instances of long vowels.
41
+ "
42
+ }
43
+
44
+ tests {
45
+ test "ぐんま", "gumma"
46
+ test "しんよう", "shin-yō"
47
+ test "きんようび", "kin-yōbi"
48
+ test "とうきょう", "tōkyō"
49
+ test "しんばし", "shimbashi"
50
+ }
51
+
52
+ stage {
53
+
54
+ # RULES
55
+ # Add a dash (-) between ん and a vowel sound or ya, yu, yo
56
+ sub none, "-", before: any("んン"), after: any("あいうえおやゆよアイウエオヤユヨ")
57
+
58
+ # Convert ん into m before b, m, p
59
+ sub any("んン"), "m", after: any("ばびぶべぼまみむめもぱぴぷぺぽバビブベボマミムメモパピプペポ")
60
+
61
+
62
+
63
+ # CHARACTERS
64
+ parallel {
65
+
66
+ # Hiragana
67
+
68
+ sub "あ", "a"
69
+ sub "い", "i"
70
+ sub "う", "u"
71
+ sub "え", "e"
72
+ sub "お", "o"
73
+ sub "おう", "ō"
74
+
75
+ sub "か", "ka"
76
+ sub "き", "ki"
77
+ sub "く", "ku"
78
+ sub "け", "ke"
79
+ sub "こ", "ko"
80
+ sub "きゃ", "kya"
81
+ sub "きゅ", "kyu"
82
+ sub "きょ", "kyo"
83
+ sub "きょう", "kyō"
84
+ sub "こう", "kō"
85
+
86
+ sub "さ", "sa"
87
+ sub "し", "shi"
88
+ sub "す", "su"
89
+ sub "せ", "se"
90
+ sub "そ", "so"
91
+ sub "しゃ", "sha"
92
+ sub "しゅ", "shu"
93
+ sub "しょ", "sho"
94
+ sub "しょう", "shō"
95
+ sub "そう", "sō"
96
+
97
+ sub "た", "ta"
98
+ sub "ち", "chi"
99
+ sub "つ", "tsu"
100
+ sub "て", "te"
101
+ sub "と", "to"
102
+ sub "ちゃ", "cha"
103
+ sub "ちゅ", "chu"
104
+ sub "ちょ", "cho"
105
+ sub "とう", "tō"
106
+ sub "ちょう", "chō"
107
+
108
+ sub "な", "na"
109
+ sub "に", "ni"
110
+ sub "ぬ", "nu"
111
+ sub "ね", "ne"
112
+ sub "の", "no"
113
+ sub "にゃ", "nya"
114
+ sub "にゅ", "nyu"
115
+ sub "にょ", "nyo"
116
+ sub "にょう", "nyō"
117
+ sub "のう", "nō"
118
+
119
+ sub "は", "ha"
120
+ sub "ひ", "hi"
121
+ sub "ふ", "fu"
122
+ sub "へ", "he"
123
+ sub "ほ", "ho"
124
+ sub "ひゃ", "hya"
125
+ sub "ひゅ", "hyu"
126
+ sub "ひょ", "hyo"
127
+ sub "ひょう", "hyō"
128
+ sub "ほう", "hō"
129
+
130
+ sub "ま", "ma"
131
+ sub "み", "mi"
132
+ sub "む", "mu"
133
+ sub "め", "me"
134
+ sub "も", "mo"
135
+ sub "みゃ", "mya"
136
+ sub "みゅ", "myu"
137
+ sub "みょ", "myo"
138
+ sub "みょう", "myō"
139
+ sub "もう", "mō"
140
+
141
+ sub "や", "ya"
142
+ sub "ゆ", "yu"
143
+ sub "よ", "yo"
144
+ sub "よう", "yō"
145
+
146
+ sub "ら", "ra"
147
+ sub "り", "ri"
148
+ sub "る", "ru"
149
+ sub "れ", "re"
150
+ sub "ろ", "ro"
151
+ sub "りゃ", "rya"
152
+ sub "りゅ", "ryu"
153
+ sub "りょ", "ryo"
154
+ sub "りょう", "ryō"
155
+ sub "ろう", "rō"
156
+
157
+ sub "わ", "wa"
158
+ sub "を", "wo"
159
+
160
+ sub "が", "ga"
161
+ sub "ぎ", "gi"
162
+ sub "ぐ", "gu"
163
+ sub "げ", "ge"
164
+ sub "ご", "go"
165
+ sub "ぎゃ", "gya"
166
+ sub "ぎゅ", "gyu"
167
+ sub "ぎょ", "gyo"
168
+ sub "ぎょう", "gyō"
169
+ sub "ごう", "gō"
170
+
171
+ sub "ざ", "za"
172
+ sub "じ", "ji"
173
+ sub "ず", "zu"
174
+ sub "ぜ", "ze"
175
+ sub "ぞ", "zo"
176
+ sub "じゃ", "ja"
177
+ sub "じゅ", "ju"
178
+ sub "じょ", "jo"
179
+ sub "じょう", "jō"
180
+ sub "ぞう", "zō"
181
+
182
+ sub "だ", "da"
183
+ sub "ぢ", "ji"
184
+ sub "づ", "zu"
185
+ sub "で", "de"
186
+ sub "ど", "do"
187
+ sub "ぢゃ", "ja"
188
+ sub "ぢゅ", "ju"
189
+ sub "ぢょ", "jo"
190
+ sub "どう", "dō"
191
+
192
+ sub "ば", "ba"
193
+ sub "び", "bi"
194
+ sub "ぶ", "bu"
195
+ sub "べ", "be"
196
+ sub "ぼ", "bo"
197
+ sub "びゃ", "bya"
198
+ sub "びゅ", "byu"
199
+ sub "びょ", "byo"
200
+ sub "びょう", "byō"
201
+ sub "ぼう", "bō"
202
+
203
+ sub "ぱ", "pa"
204
+ sub "ぴ", "pi"
205
+ sub "ぷ", "pu"
206
+ sub "ぺ", "pe"
207
+ sub "ぽ", "po"
208
+ sub "ぴゃ", "pya"
209
+ sub "ぴゅ", "pyu"
210
+ sub "ぴょ", "pyo"
211
+ sub "ぴょう", "pyō"
212
+ sub "ぽう", "pō"
213
+
214
+ sub "ん", "n"
215
+
216
+ # Katakana
217
+
218
+ sub "ア", "a"
219
+ sub "イ", "i"
220
+ sub "ウ", "u"
221
+ sub "エ", "e"
222
+ sub "オ", "o"
223
+ sub "オウ", "ō"
224
+
225
+ sub "カ", "ka"
226
+ sub "キ", "ki"
227
+ sub "ク", "ku"
228
+ sub "ケ", "ke"
229
+ sub "コ", "ko"
230
+ sub "キャ", "kya"
231
+ sub "キュ", "kyu"
232
+ sub "キョ", "kyo"
233
+ sub "キョウ", "kyō"
234
+ sub "コウ", "kō"
235
+
236
+ sub "サ", "sa"
237
+ sub "シ", "shi"
238
+ sub "ス", "su"
239
+ sub "セ", "se"
240
+ sub "ソ", "so"
241
+ sub "シャ", "sha"
242
+ sub "シュ", "shu"
243
+ sub "ショ", "sho"
244
+ sub "ショウ", "shō"
245
+ sub "ソウ", "sō"
246
+
247
+ sub "タ", "ta"
248
+ sub "チ", "chi"
249
+ sub "ツ", "tsu"
250
+ sub "テ", "te"
251
+ sub "ト", "to"
252
+ sub "チャ", "cha"
253
+ sub "チュ", "chu"
254
+ sub "チョ", "cho"
255
+ sub "チョウ", "chō"
256
+ sub "トウ", "tō"
257
+
258
+ sub "ナ", "na"
259
+ sub "ニ", "ni"
260
+ sub "ヌ", "nu"
261
+ sub "ネ", "ne"
262
+ sub "ノ", "no"
263
+ sub "ニャ", "nya"
264
+ sub "ニュ", "nyu"
265
+ sub "ニョ", "nyo"
266
+ sub "ニョウ", "nyō"
267
+ sub "ノウ", "nō"
268
+
269
+ sub "ハ", "ha"
270
+ sub "ヒ", "hi"
271
+ sub "フ", "fu"
272
+ sub "ヘ", "he"
273
+ sub "ホ", "ho"
274
+ sub "ヒャ", "hya"
275
+ sub "ヒュ", "hyu"
276
+ sub "ヒョ", "hyo"
277
+ sub "ヒョウ", "hyō"
278
+ sub "ホウ", "hō"
279
+
280
+ sub "マ", "ma"
281
+ sub "ミ", "mi"
282
+ sub "ム", "mu"
283
+ sub "メ", "me"
284
+ sub "モ", "mo"
285
+ sub "ミャ", "mya"
286
+ sub "ミュ", "myu"
287
+ sub "ミョ", "myo"
288
+ sub "ミョウ", "myō"
289
+ sub "モウ", "mō"
290
+
291
+ sub "ヤ", "ya"
292
+ sub "ユ", "yu"
293
+ sub "ヨ", "yo"
294
+ sub "ヨウ", "yō"
295
+
296
+ sub "ラ", "ra"
297
+ sub "リ", "ri"
298
+ sub "ル", "ru"
299
+ sub "レ", "re"
300
+ sub "ロ", "ro"
301
+ sub "リャ", "rya"
302
+ sub "リュ", "ryu"
303
+ sub "リョ", "ryo"
304
+ sub "リョウ", "ryō"
305
+ sub "ロウ", "rō"
306
+
307
+ sub "ワ", "wa"
308
+ sub "ヲ", "wo"
309
+
310
+ sub "ガ", "ga"
311
+ sub "ギ", "gi"
312
+ sub "グ", "gu"
313
+ sub "ゲ", "ge"
314
+ sub "ゴ", "go"
315
+ sub "ギャ", "gya"
316
+ sub "ギュ", "gyu"
317
+ sub "ギョ", "gyo"
318
+ sub "ギョウ", "gyō"
319
+ sub "ゴウ", "gō"
320
+
321
+ sub "ザ", "za"
322
+ sub "ジ", "ji"
323
+ sub "ズ", "zu"
324
+ sub "ゼ", "ze"
325
+ sub "ゾ", "zo"
326
+ sub "ジャ", "ja"
327
+ sub "ジュ", "ju"
328
+ sub "ジョ", "jo"
329
+ sub "ジョウ", "jō"
330
+ sub "ゾウ", "zō"
331
+
332
+ sub "ダ", "da"
333
+ sub "ヂ", "ji"
334
+ sub "ヅ", "zu"
335
+ sub "デ", "de"
336
+ sub "ド", "do"
337
+ sub "ヂャ", "ja"
338
+ sub "ヂュ", "ju"
339
+ sub "ヂョ", "jo"
340
+ sub "ドウ", "dō"
341
+
342
+ sub "バ", "ba"
343
+ sub "ビ", "bi"
344
+ sub "ブ", "bu"
345
+ sub "ベ", "be"
346
+ sub "ボ", "bo"
347
+ sub "ビャ", "bya"
348
+ sub "ビュ", "byu"
349
+ sub "ビョ", "byo"
350
+ sub "ビョウ", "byō"
351
+ sub "ボウ", "bō"
352
+
353
+ sub "パ", "pa"
354
+ sub "ピ", "pi"
355
+ sub "プ", "pu"
356
+ sub "ペ", "pe"
357
+ sub "ポ", "po"
358
+ sub "ピャ", "pya"
359
+ sub "ピュ", "pyu"
360
+ sub "ピョ", "pyo"
361
+ sub "ピョウ", "pyō"
362
+ sub "ポウ", "pō"
363
+
364
+ sub "ン", "n"
365
+ }
366
+
367
+ # POSTRULES
368
+ # Handling of っ/ッ
369
+ #
370
+ # The kana っ/ッ is a geminate marker.
371
+ # When followed by a consonant, repeat the first letter of
372
+ # the following syllable. Exception: the combination -cch-
373
+ # should be transliterated as -tch-
374
+ #
375
+ # If っ/ッ is not followed by a consonant, then it is usually
376
+ # phonetically realised as an abrupt stop or shorterning of
377
+ # the previous syllable. There is no documented or commonly
378
+ # accepted way to transliterate this sound.
379
+
380
+ sub any("っッ") + capture(any("BbDdFfGgHhJjKkLlMmNnPpQqRrSsTtVvWwXxYyZz")), ref( 1 ) + ref( 1 )
381
+ sub any("っッ") + capture(any("Cc")), "t" + ref( 1 ) # ッ followed by ch-
382
+ sub any("っッ"), "" # drop all other っッ.
383
+
384
+ # In Traditional Hepburn, long o (which can be o+o or o+u), and long u
385
+ # are transliterated as ō and ū.
386
+ #
387
+ # Macron should not be used if two repeating letters split across
388
+ # a morpheme boundary.
389
+ #
390
+ # Long vowels in loanwords are indicated with a macron instead
391
+ # of letter doubling.
392
+
393
+ sub "a" + any("ー"), "ā"
394
+ sub "i" + any("ー"), "ī"
395
+ sub "u" + any("ーu"), "ū"
396
+ sub "e" + any("ー"), "ē"
397
+ sub "o" + any("ーo"), "ō"
398
+
399
+ }