interscript 0.1.3 → 0.1.9

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (294) hide show
  1. checksums.yaml +4 -4
  2. data/README.adoc +10 -11
  3. data/aliases.json +1 -0
  4. data/lib/interscript.rb +62 -59
  5. data/lib/interscript/command.rb +3 -2
  6. data/lib/interscript/fs.rb +96 -0
  7. data/lib/interscript/mapping.rb +36 -17
  8. data/lib/interscript/opal.rb +196 -0
  9. data/lib/interscript/opal/entrypoint.rb +20 -0
  10. data/lib/interscript/opal/exports.rb +11 -0
  11. data/lib/interscript/opal/maps.js.erb +8 -0
  12. data/lib/interscript/version.rb +1 -1
  13. data/maps/acadsin-zho-Hani-Latn-2002.yaml +6 -2
  14. data/maps/alalc-amh-Ethi-Latn-1997.yaml +513 -0
  15. data/maps/alalc-amh-Ethi-Latn-2011.yaml +138 -0
  16. data/maps/alalc-ara-Arab-Latn-1997.yaml +1287 -0
  17. data/maps/alalc-asm-Deva-Latn-1997.yaml +259 -0
  18. data/maps/alalc-asm-Deva-Latn-2012.yaml +55 -0
  19. data/maps/alalc-aze-Arab-Latn-1997.yaml +376 -0
  20. data/maps/alalc-aze-Cyrl-Latn-1997.yaml +145 -0
  21. data/maps/{alalc-bel-cyrl-latn-1997.yaml → alalc-bel-Cyrl-Latn-1997.yaml} +7 -3
  22. data/maps/alalc-ben-Beng-Latn-1997.yaml +291 -0
  23. data/maps/alalc-ben-Beng-Latn-2017.yaml +1 -1
  24. data/maps/alalc-bul-Cyrl-Latn-1997.yaml +5 -1
  25. data/maps/alalc-div-Thaa-Latn-1997.yaml +211 -0
  26. data/maps/alalc-ell-Grek-Latn-1997.yaml +7 -4
  27. data/maps/alalc-ell-Grek-Latn-2010.yaml +3 -5
  28. data/maps/alalc-guj-Gujr-Latn-1997.yaml +266 -0
  29. data/maps/alalc-guj-Gujr-Latn-2011.yaml +64 -0
  30. data/maps/alalc-hin-Deva-Latn-1997.yaml +303 -0
  31. data/maps/alalc-hin-Deva-Latn-2011.yaml +65 -0
  32. data/maps/alalc-kan-Kana-Latn-1997.yaml +274 -0
  33. data/maps/alalc-kan-Kana-Latn-2011.yaml +63 -0
  34. data/maps/alalc-kat-Geok-Latn-1997.yaml +2 -3
  35. data/maps/alalc-kat-Geor-Latn-1997.yaml +5 -1
  36. data/maps/alalc-kor-Hang-Latn-1997.yaml +6 -2
  37. data/maps/alalc-mal-Mlym-Latn-1997.yaml +303 -0
  38. data/maps/alalc-mal-Mlym-Latn-2012.yaml +73 -0
  39. data/maps/alalc-mar-Deva-Latn-1997.yaml +189 -0
  40. data/maps/alalc-mar-Deva-Latn-2011.yaml +45 -0
  41. data/maps/{alalc-mkd-cyrl-latn-1997.yaml → alalc-mkd-Cyrl-Latn-1997.yaml} +1 -1
  42. data/maps/alalc-mkd-Cyrl-Latn-2013.yaml +1 -1
  43. data/maps/alalc-mon-Cyrl-Latn-1997.yaml +220 -0
  44. data/maps/alalc-ori-Orya-Latn-1997.yaml +284 -0
  45. data/maps/alalc-ori-Orya-Latn-2011.yaml +67 -0
  46. data/maps/alalc-pan-Guru-Latn-1997.yaml +256 -0
  47. data/maps/alalc-pan-Guru-Latn-2011.yaml +78 -0
  48. data/maps/alalc-per-Arab-Latn-1997.yaml +375 -0
  49. data/maps/alalc-pli-Deva-Latn-2012.yaml +144 -0
  50. data/maps/alalc-pra-Deva-Latn-2012.yaml +47 -0
  51. data/maps/alalc-rus-Cyrl-Latn-1997.yaml +225 -0
  52. data/maps/alalc-rus-Cyrl-Latn-2012.yaml +162 -0
  53. data/maps/alalc-san-Deva-Latn-2012.yaml +241 -0
  54. data/maps/alalc-sin-Sinh-Latn-1997.yaml +292 -0
  55. data/maps/alalc-sin-Sinh-Latn-2011.yaml +71 -0
  56. data/maps/alalc-srp-Cyrl-Latn-1997.yaml +5 -1
  57. data/maps/{alalc-srp-cyrl-latn-2013.yaml → alalc-srp-Cyrl-Latn-2013.yaml} +1 -1
  58. data/maps/alalc-tam-Taml-Latn-1997.yaml +62 -0
  59. data/maps/alalc-tam-Taml-Latn-2011.yaml +58 -0
  60. data/maps/alalc-tel-Telu-Latn-1997.yaml +284 -0
  61. data/maps/alalc-tel-Telu-Latn-2011.yaml +64 -0
  62. data/maps/alalc-ukr-Cyrl-Latn-1997.yaml +5 -1
  63. data/maps/alalc-ukr-Cyrl-Latn-2011.yaml +1 -1
  64. data/maps/apcbg-bul-Cyrl-Latn-1995.yaml +1 -1
  65. data/maps/az-aze-Cyrl-Latn-1939.yaml +105 -0
  66. data/maps/az-aze-Cyrl-Latn-1958.yaml +45 -0
  67. data/maps/bas-rus-Cyrl-Latn-2017-bss.yaml +1 -2
  68. data/maps/bas-rus-Cyrl-Latn-2017-oss.yaml +1 -1
  69. data/maps/bgn-jpn-Hrkt-Latn-1962.yaml +1 -3
  70. data/maps/bgn-kor-Hang-Latn-1943.yaml +8 -4
  71. data/maps/bgn-kor-Kore-Latn-1943.yaml +4 -4
  72. data/maps/bgna-bul-Cyrl-Latn-2006.yaml +1 -1
  73. data/maps/bgna-bul-Cyrl-Latn-2009.yaml +1 -1
  74. data/maps/bgnpcgn-amh-Ethi-Latn-1967.yaml +532 -0
  75. data/maps/bgnpcgn-ara-Arab-Latn-1956.yaml +598 -0
  76. data/maps/bgnpcgn-arm-Armn-Latn-1981.yaml +1 -1
  77. data/maps/bgnpcgn-aze-Cyrl-Latn-1993.yaml +111 -104
  78. data/maps/bgnpcgn-bak-Cyrl-Latn-2007.yaml +188 -0
  79. data/maps/bgnpcgn-bal-Arab-Latn-2008.yaml +329 -0
  80. data/maps/{bgnpcgn-bel-cyrl-latn-1979.yaml → bgnpcgn-bel-Cyrl-Latn-1979.yaml} +5 -1
  81. data/maps/bgnpcgn-bul-Cyrl-Latn-1952.yaml +14 -10
  82. data/maps/bgnpcgn-bul-Cyrl-Latn-2013.yaml +5 -1
  83. data/maps/bgnpcgn-che-Cyrl-Latn-2008.yaml +184 -0
  84. data/maps/bgnpcgn-div-Thaa-Latn-1988.yaml +75 -0
  85. data/maps/bgnpcgn-ell-Grek-Latn-1962.yaml +8 -5
  86. data/maps/bgnpcgn-ell-Grek-Latn-1996.yaml +5 -2
  87. data/maps/bgnpcgn-far-Latn-Latn-1964.yaml +28 -0
  88. data/maps/{bgnpcgn-per-Arab-Latn-1956.yaml → bgnpcgn-fas-Arab-Latn-1956.yaml} +5 -2
  89. data/maps/bgnpcgn-isl-Latn-Latn-1964.yaml +37 -0
  90. data/maps/bgnpcgn-jpn-Hrkt-Latn-1976.yaml +1 -1
  91. data/maps/bgnpcgn-kat-Geor-Latn-1981.yaml +5 -1
  92. data/maps/bgnpcgn-kat-Geor-Latn-2009.yaml +1 -2
  93. data/maps/bgnpcgn-kaz-Cyrl-Latn-1979.yaml +247 -0
  94. data/maps/bgnpcgn-kir-Cyrl-Latn-1979.yaml +218 -0
  95. data/maps/bgnpcgn-kor-Hang-Latn-kn-1945.yaml +18 -18
  96. data/maps/bgnpcgn-kor-Hang-Latn-rok-2011.yaml +3 -3
  97. data/maps/bgnpcgn-kor-Kore-Latn-rok-2011.yaml +3 -3
  98. data/maps/bgnpcgn-kur-Arab-Latn-2007.yaml +249 -0
  99. data/maps/bgnpcgn-mkd-Cyrl-Latn-1981.yaml +5 -1
  100. data/maps/bgnpcgn-mkd-Cyrl-Latn-2013.yaml +2 -2
  101. data/maps/bgnpcgn-mon-Cyrl-Latn-1964.yaml +223 -0
  102. data/maps/bgnpcgn-nep-Deva-Latn-2011.yaml +230 -0
  103. data/maps/bgnpcgn-per-Arab-Latn-1958.yaml +338 -0
  104. data/maps/bgnpcgn-prs-Arab-Latn-2007.yaml +673 -0
  105. data/maps/bgnpcgn-prs-Arab-Latn-yaghoubi.yaml +459 -0
  106. data/maps/bgnpcgn-pus-Arab-Latn-1968.yaml +377 -0
  107. data/maps/bgnpcgn-rue-Cyrl-Latn-2016.yaml +168 -0
  108. data/maps/bgnpcgn-rus-Cyrl-Latn-1947.yaml +5 -1
  109. data/maps/bgnpcgn-srp-Cyrl-Latn-1962.yaml +73 -0
  110. data/maps/bgnpcgn-srp-Cyrl-Latn-2005.yaml +5 -1
  111. data/maps/bgnpcgn-tat-Cyrl-Latn-2007.yaml +220 -0
  112. data/maps/bgnpcgn-tgk-Cyrl-Latn-1994.yaml +240 -0
  113. data/maps/bgnpcgn-ukr-Cyrl-Latn-1965.yaml +5 -2
  114. data/maps/bgnpcgn-ukr-Cyrl-Latn-2019.yaml +3 -92
  115. data/maps/bgnpcgn-urd-Arab-Latn-2007.yaml +459 -0
  116. data/maps/bgnpcgn-uzb-Cyrl-Latn-1979.yaml +127 -0
  117. data/maps/bgnpcgn-uzb-Cyrl-Latn-2000.yaml +82 -0
  118. data/maps/{bgnpcgn-chn-Hans-Latn-1979.yaml → bgnpcgn-zho-Hans-Latn-1979.yaml} +1 -1
  119. data/maps/bis-asm-Beng-Latn-13194-1991.yaml +159 -0
  120. data/maps/bis-ben-Beng-Latn-13194-1991.yaml +156 -0
  121. data/maps/bis-dev-Deva-Latn-13194-1991.yaml +184 -0
  122. data/maps/bis-guj-Gujr-Latn-13194-1991.yaml +181 -0
  123. data/maps/bis-kan-Kana-Latn-13194-1991.yaml +173 -0
  124. data/maps/bis-mlm-Mlym-Latn-13194-1991.yaml +176 -0
  125. data/maps/bis-ori-Orya-Latn-13194-1991.yaml +175 -0
  126. data/maps/bis-pnj-Guru-Latn-13194-1991.yaml +175 -0
  127. data/maps/bis-tel-Telu-Latn-13194-1991.yaml +170 -0
  128. data/maps/bis-tml-Taml-Latn-13194-1991.yaml +155 -0
  129. data/maps/by-bel-Cyrl-Latn-1998.yaml +9 -5
  130. data/maps/by-bel-Cyrl-Latn-2007.yaml +4 -4
  131. data/maps/din-grc-Grek-Latn-31634-2011-t1.yaml +899 -0
  132. data/maps/din-hin-Deva-Latn-33904-2018.yaml +100 -0
  133. data/maps/din-kat-Geor-Latn-32707-2010.yaml +145 -0
  134. data/maps/din-mar-Deva-Latn-33904-2018.yaml +84 -0
  135. data/maps/din-nep-Deva-Latn-33904-2018.yaml +119 -0
  136. data/maps/din-pli-Deva-Latn-33904-2018.yaml +75 -0
  137. data/maps/din-pra-Deva-Latn-33904-2018.yaml +63 -0
  138. data/maps/din-san-Deva-Latn-33904-2018.yaml +338 -0
  139. data/maps/din-tam-Taml-Latn-33903-2016.yaml +213 -0
  140. data/maps/dos-nep-Deva-Latn-1997.yaml +47 -0
  141. data/maps/elot-ell-Grek-Latn-743-1982-tl.yaml +7 -8
  142. data/maps/elot-ell-Grek-Latn-743-1982-ts.yaml +6 -7
  143. data/maps/elot-ell-Grek-Latn-743-2001-tl.yaml +2 -3
  144. data/maps/elot-ell-Grek-Latn-743-2001-ts.yaml +2 -3
  145. data/maps/ggg-kat-Geor-Latn-2002.yaml +5 -2
  146. data/maps/{gki-bel-cyrl-latn-1992.yaml → gki-bel-Cyrl-Latn-1992.yaml} +2 -2
  147. data/maps/{gki-bel-cyrl-latn-2000.yaml → gki-bel-Cyrl-Latn-2000.yaml} +2 -2
  148. data/maps/{gost-rus-cyrl-latn-16876-71-1983.yaml → gost-rus-Cyrl-Latn-16876-71-1983.yaml} +8 -4
  149. data/maps/gost-rus-Cyrl-Latn-7.79-2000-2002.yaml +157 -0
  150. data/maps/hk-yue-Hani-Latn-1888.yaml +1 -1
  151. data/maps/icao-bel-Cyrl-Latn-9303.yaml +1 -6
  152. data/maps/icao-bul-Cyrl-Latn-9303.yaml +1 -5
  153. data/maps/{icao-per-Arab-Latn-9303.yaml → icao-fas-Arab-Latn-9303.yaml} +1 -2
  154. data/maps/icao-heb-Hebr-Latn-9303.yaml +1 -1
  155. data/maps/icao-mkd-Cyrl-Latn-9303.yaml +1 -1
  156. data/maps/icao-rus-Cyrl-Latn-9303.yaml +1 -2
  157. data/maps/icao-srp-Cyrl-Latn-9303.yaml +1 -1
  158. data/maps/icao-ukr-Cyrl-Latn-9303.yaml +1 -2
  159. data/maps/iso-ara-Arab-Latn-233-1984.yaml +323 -0
  160. data/maps/iso-asm-Beng-Latn-15919-2001.yaml +75 -0
  161. data/maps/iso-ben-Beng-Latn-15919-2001.yaml +175 -0
  162. data/maps/iso-ell-Grek-Latn-843-1997-t1.yaml +11 -8
  163. data/maps/iso-ell-Grek-Latn-843-1997-t2.yaml +8 -5
  164. data/maps/iso-guj-Gujr-Latn-15919-2001.yaml +220 -0
  165. data/maps/iso-hin-Deva-Latn-15919-2001.yaml +87 -0
  166. data/maps/iso-inc-Deva-Latn-15919-2001.yaml +61 -0
  167. data/maps/iso-jpn-Hrkt-Latn-3602-1989.yaml +10 -6
  168. data/maps/iso-kan-Kana-Latn-15919-2001.yaml +220 -0
  169. data/maps/iso-kat-Geor-Latn-9984-1996.yaml +145 -0
  170. data/maps/iso-kor-Hang-Latn-1996-method1.yaml +240 -0
  171. data/maps/iso-kor-Hang-Latn-1996-method2.yaml +226 -0
  172. data/maps/iso-mal-Mlym-Latn-15919-2001.yaml +281 -0
  173. data/maps/iso-mar-Deva-Latn-15919-2001.yaml +75 -0
  174. data/maps/iso-nep-Deva-Latn-15919-2001.yaml +87 -0
  175. data/maps/iso-ori-Orya-Latn-15919-2001.yaml +193 -0
  176. data/maps/iso-pan-Guru-Latn-15919-2001.yaml +222 -0
  177. data/maps/iso-pli-Beng-Latn-15919-2001.yaml +73 -0
  178. data/maps/iso-pli-Deva-Latn-15919-2001.yaml +74 -0
  179. data/maps/iso-pli-Sinh-Latn-15919-2001.yaml +219 -0
  180. data/maps/iso-pli-Thai-Latn-15919-2001.yaml +55 -0
  181. data/maps/iso-pra-Deva-Latn-15919-2001.yaml +59 -0
  182. data/maps/iso-prs-Arab-Latn-233-3-1999.yaml +366 -0
  183. data/maps/iso-rus-Cyrl-Latn-9-1995.yaml +3 -4
  184. data/maps/iso-san-Deva-Latn-15919-2001.yaml +220 -0
  185. data/maps/iso-tam-Taml-Latn-15919-2001.yaml +159 -0
  186. data/maps/iso-tel-Telu-Latn-15919-2001.yaml +220 -0
  187. data/maps/iso-tha-Thai-Latn-11940-1998.yaml +2 -2
  188. data/maps/kp-kor-Hang-Latn-2002.yaml +29 -21
  189. data/maps/lshk-yue-Hani-Latn-jyutping-1993.yaml +3 -3
  190. data/maps/masm-mon-Cyrl-Latn-5217-2012.yaml +163 -0
  191. data/maps/masm-mon-Latn-Cyrl-5217-2012.yaml +200 -0
  192. data/maps/mext-jpn-Hrkt-Latn-1954.yaml +1 -1
  193. data/maps/moct-kor-Hang-Latn-2000.yaml +6 -2
  194. data/maps/mofa-jpn-Hrkt-Latn-1989.yaml +1 -1
  195. data/maps/mv-div-Thaa-Latn-1987.yaml +200 -0
  196. data/maps/mvd-bel-Cyrl-Latn-2008.yaml +225 -0
  197. data/maps/mvd-bel-Cyrl-Latn-2010.yaml +63 -0
  198. data/maps/mvd-rus-Cyrl-Latn-2008.yaml +109 -0
  199. data/maps/mvd-rus-Cyrl-Latn-2010.yaml +37 -0
  200. data/maps/odni-ara-Arab-Latn-2004.yaml +137 -0
  201. data/maps/odni-ara-Arab-Latn-2015.yaml +315 -0
  202. data/maps/odni-aze-Cyrl-Latn-2015.yaml +144 -0
  203. data/maps/odni-bel-Cyrl-Latn-2015.yaml +148 -0
  204. data/maps/odni-bul-Cyrl-Latn-2005.yaml +90 -0
  205. data/maps/odni-bul-Cyrl-Latn-2015.yaml +96 -0
  206. data/maps/odni-che-Cyrl-Latn-2015.yaml +169 -0
  207. data/maps/odni-fas-Arab-Latn-2004.yaml +276 -0
  208. data/maps/odni-fas-Arab-Latn-2015.yaml +406 -0
  209. data/maps/odni-hin-Deva-Latn-2004.yaml +182 -0
  210. data/maps/odni-hin-Deva-Latn-2015.yaml +258 -0
  211. data/maps/odni-kat-Geor-Latn-2015.yaml +2 -3
  212. data/maps/odni-kaz-Cyrl-Latn-2015.yaml +148 -0
  213. data/maps/odni-kir-Cyrl-Latn-2015.yaml +136 -0
  214. data/maps/odni-kor-Hang-Latn-2015.yaml +375 -0
  215. data/maps/odni-mkd-Cyrl-Latn-2005.yaml +21 -0
  216. data/maps/odni-mkd-Cyrl-Latn-2015.yaml +122 -0
  217. data/maps/odni-prs-Arab-Latn-2004.yaml +123 -0
  218. data/maps/odni-prs-Arab-Latn-2015.yaml +228 -0
  219. data/maps/odni-rus-Cyrl-Latn-2015.yaml +77 -0
  220. data/maps/odni-srp-Cyrl-Latn-2005.yaml +36 -0
  221. data/maps/odni-srp-Cyrl-Latn-2015.yaml +129 -0
  222. data/maps/odni-tat-Cyrl-Latn-2015.yaml +142 -0
  223. data/maps/odni-tgk-Cyrl-Latn-2015.yaml +148 -0
  224. data/maps/odni-tuk-Cyrl-Latn-2015.yaml +170 -0
  225. data/maps/odni-uig-Cyrl-Latn-2015.yaml +138 -0
  226. data/maps/odni-ukr-Cyrl-Latn-2015.yaml +6 -2
  227. data/maps/odni-urd-Arab-Latn-2015.yaml +221 -0
  228. data/maps/odni-uzb-Cyrl-Latn-2015.yaml +166 -0
  229. data/maps/royin-tha-Thai-Latn-1939-generic.yaml +5 -5
  230. data/maps/royin-tha-Thai-Latn-1968.yaml +9 -5
  231. data/maps/royin-tha-Thai-Latn-1999-chained.yaml +5 -5
  232. data/maps/royin-tha-Thai-Latn-1999.yaml +8 -4
  233. data/maps/sac-zho-Hans-Latn-1979.yaml +5 -1
  234. data/maps/sasm-mon-Mong-Latn-general-1978.yaml +389 -0
  235. data/maps/sasm-mon-Mong-Latn-phonetic-1978.yaml +354 -0
  236. data/maps/ses-ara-Arab-Latn-1930.yaml +283 -0
  237. data/maps/stategeocadastre-ukr-Cyrl-Latn-1993.yaml +1 -1
  238. data/maps/ua-ukr-Cyrl-Latn-1996.yaml +6 -2
  239. data/maps/ua-ukr-Cyrl-Latn-2007.yaml +75 -0
  240. data/maps/ua-ukr-Cyrl-Latn-2010.yaml +192 -0
  241. data/maps/un-amh-Ethi-Latn-2016.yaml +602 -0
  242. data/maps/un-ara-Arab-Latn-1971.yaml +139 -0
  243. data/maps/un-ara-Arab-Latn-1972.yaml +159 -0
  244. data/maps/un-ara-Arab-Latn-2017.yaml +420 -0
  245. data/maps/un-asm-Beng-Latn-1972.yaml +223 -0
  246. data/maps/un-bel-Cyrl-Latn-2007.yaml +4 -4
  247. data/maps/un-ben-Beng-Latn-2016.yaml +1 -1
  248. data/maps/{un-ell-Grek-Latn-phonetic-1987.yaml → un-ell-Grek-Latn-1987-phonetic.yaml} +44 -44
  249. data/maps/un-ell-Grek-Latn-1987-tl.yaml +3 -4
  250. data/maps/un-ell-Grek-Latn-1987-ts.yaml +3 -4
  251. data/maps/un-guj-Gujr-Latn-1972.yaml +229 -0
  252. data/maps/un-hin-Deva-Latn-2016.yaml +316 -0
  253. data/maps/un-kan-Kana-Latn-2016.yaml +254 -0
  254. data/maps/un-mal-Mlym-Latn-1972.yaml +251 -0
  255. data/maps/un-mar-Deva-Latn-2016.yaml +102 -0
  256. data/maps/un-mon-Mong-Latn-general-2013.yaml +264 -0
  257. data/maps/un-mon-Mong-Latn-phonetic-2013.yaml +264 -0
  258. data/maps/un-nep-Deva-Latn-1972.yaml +269 -0
  259. data/maps/un-nep-Deva-Latn-2013.yaml +74 -0
  260. data/maps/un-ori-Orya-Latn-1972.yaml +247 -0
  261. data/maps/un-pan-Guru-Latn-1972.yaml +402 -0
  262. data/maps/un-prs-Arab-Latn-1967.yaml +236 -0
  263. data/maps/un-rus-Cyrl-Latn-1987.yaml +2 -2
  264. data/maps/un-tam-Taml-Latn-1972.yaml +194 -0
  265. data/maps/un-tel-Telu-Latn-1972.yaml +270 -0
  266. data/maps/un-ukr-Cyrl-Latn-1998.yaml +53 -0
  267. data/maps/un-ukr-Cyrl-Latn-2012.yaml +162 -0
  268. data/maps/un-urd-Arab-Latn-1972.yaml +405 -0
  269. data/maps/var-amh-Ethi-Latn-eae-2003.yaml +466 -0
  270. data/maps/var-gez-Ethi-Latn-eae-2003.yaml +76 -0
  271. data/maps/var-hin-Deva-Latn-hunterian-1872.yaml +221 -0
  272. data/maps/var-jpn-Hrkt-Latn-hepburn-1886.yaml +1 -1
  273. data/maps/var-jpn-Hrkt-Latn-hepburn-1954.yaml +1 -1
  274. data/maps/{nil-kor-Hang-Hang-jamo.yaml → var-kor-Hang-Hang-jamo.yaml} +4 -4
  275. data/maps/var-kor-Hang-Latn-mr-1939.yaml +4 -4
  276. data/maps/var-kor-Kore-Hang-2013.yaml +2 -2
  277. data/maps/var-kor-Kore-Latn-mr-1939.yaml +2 -3
  278. data/maps/var-mar-Deva-Latn-hunterian-1872.yaml +43 -0
  279. data/maps/var-mon-Mong-Latn-1930.yaml +102 -0
  280. data/maps/var-mon-Mong-Latn-lessing.yaml +272 -0
  281. data/maps/var-mon-Mong-Latn-vpmc.yaml +274 -0
  282. data/maps/var-pra-Deva-Latn-iast-1912.yaml +30 -0
  283. data/maps/var-san-Deva-Latn-iast-1912.yaml +149 -0
  284. data/maps/var-tha-Thai-Thai-phonemic.yaml +6 -6
  285. data/maps/var-tha-Thai-Zsym-ipa.yaml +13 -13
  286. data/maps/{var-zho-Hani-Latn-1979.yaml → var-zho-Hani-Latn-wd-1979.yaml} +13 -9
  287. data/spec/interscript/filenames_spec.rb +21 -0
  288. data/spec/interscript_spec.rb +16 -5
  289. metadata +275 -27
  290. data/bin/interscript +0 -41
  291. data/bin/rspec +0 -29
  292. data/bin/setup +0 -8
  293. data/maps/un-mon-Mong-Latn-2013.yaml +0 -93
  294. data/maps/un-ukr-cyrl-latn-1998.yaml +0 -30
@@ -0,0 +1,76 @@
1
+ ---
2
+ authority_id: var
3
+ id: 2003
4
+ language: gez
5
+ source_script: Ethi
6
+ destination_script: Latn
7
+ name: Encyclopaedia Aethiopica Amharic transliteration system (2003)
8
+ url: https://brill.com/view/book/edcoll/9789004419582/front-11.xml?language=en
9
+ creation_date: 2003
10
+ description: |
11
+ The Encyclopaedia Aethiopica (EAe) is a basic encyclopedia for Ethiopian and Eritrean studies. It employs an in-house form of romanization of Geez, Amharic, and other languages, which varies greatly from standard formats, such as BGN/PCGN: the emperor Menelek II's name, for example, is written as "Mənilək II".
12
+
13
+ tests:
14
+ - source: በቀዳሚ ገብረ እግዚአብሔር ሰማየ ወምድረ
15
+ expected: bäqädami gäbərä ʾəgəziʾabəḥerə sämayä wämədərä
16
+ - source: ወምድርሰ ኢታስተርኢ ወኢኮነት ድሉተ ወጽልመት መልዕልተ ቀላይ ወመንፈሰ እግዚአብሔር ይጼልል መልዕልተ ማይ
17
+ expected: wämədərəsä ʾitasətärəʾi wäʾikonätə dəlutä wäṣələmätə mäləʿələtä qälayə wämänəfäsä ʾəgəziʾabəḥerə yəṣelələ mäləʿələtä mayə
18
+ - source: ወይቤ እግዚአብሔር ለይኩን ብርሃን ወኮነ ብርሃን
19
+ expected: wäyəbe ʾəgəziʾabəḥerə läyəkunə bərəhanə wäkonä bərəhanə
20
+ - source: ወርእዮ እግዚአብሔር ለብርሃን ከመ ሠናይ ወፈለጠ እግዚአብሔር ማእከለ ብርሃን ወማእከለ ጽልመት
21
+ expected: wärəʾəyo ʾəgəziʾabəḥerə läbərəhanə kämä śänayə wäfäläṭä ʾəgəziʾabəḥerə maʾəkälä bərəhanə wämaʾəkälä ṣələmätə
22
+ - source: ወሰመዮ እግዚአብሔር ለብርሃን ዕለተ ወለጽልመት ሌሊተ ወኮነ ሌሊተ ወጸብሐ ወኮነ መዓልተ ፩
23
+ expected: wäsämäyo ʾəgəziʾabəḥerə läbərəhanə ʿəlätä wäläṣələmätə lelitä wäkonä lelitä wäṣäbəḥa wäkonä mäʿalətä 1
24
+ - source: ወይቤ እግዚአብሔር ለይኩን ጠፈር ማእከለ ማይ ከመ ይፍልጥ ማእከለ ማይ ወኮነ ከማሁ
25
+ expected: wäyəbe ʾəgəziʾabəḥerə läyəkunə ṭäfärə maʾəkälä mayə kämä yəfələṭə maʾəkälä mayə wäkonä kämahu
26
+ - source: ወገብረ እግዚአብሔር ጠፈረ ወፈለጠ እግዚአብሔር ማእብለ ማይ ዘታሕተ ጠፈር ወማእከለ ማይ ዘመልዕልተ ጠፈር
27
+ expected: wägäbərä ʾəgəziʾabəḥerə ṭäfärä wäfäläṭä ʾəgəziʾabəḥerə maʾəbəlä mayə zätaḥətä ṭäfärə wämaʾəkälä mayə zämäləʿələtä ṭäfärə
28
+ - source: ወሰመዮ እግዚአብሔር ለውእቱ ጠፈር ሰማየ ወርእየ እግዚአብሔር ከመ ሠናይ ወኮነ ሌሊተ ወጸብሐ ወኮነ ካልእተ ዕለተ
29
+ expected: wäsämäyo ʾəgəziʾabəḥerə läwəʾətu ṭäfärə sämayä wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə wäkonä lelitä wäṣäbəḥa wäkonä kaləʾətä ʿəlätä
30
+ - source: ወይቤ እግዚአብሔር ለይትጋባእ ማይ ዘመትሕተ ሰማይ ውስተ አሐዱ መካን ወያስተርኢ የብስ ወኮነ ከማሁ ውተጋብአ ማይ ውስተ ምእላዲሁ ወአስተርአየ የብስ
31
+ expected: wäyəbe ʾəgəziʾabəḥerə läyətəgabaʾə mayə zämätəḥətä sämayə wəsətä ʾaḥadu mäkanə wäyasətärəʾi yäbəsə wäkonä kämahu wətägabəʾa mayə wəsətä məʾəladihu wäʾasətärəʾayä yäbəsə
32
+ - source: ወሰመዮ እግዚአብሔር ለየብስ ምድረ ወለምእላዲሁ ለማይ ሰመዮ ባሕረ ወርእየ እግዚአብሔር ከመ ሠናይ
33
+ expected: wäsämäyo ʾəgəziʾabəḥerə läyäbəsə mədərä wäläməʾəladihu lämayə sämäyo baḥərä wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə
34
+ - source: ወይቤ እግዚአብሔር ለታብቍል ምድር ሐመልማለ ሣዕር ዘይዘራእ በበዘርኡ ወበበዘመዱ ወዘበበ አምሳሊሁ ወዕፀወ ዘይፈሪ ወይገብር ፋሬሁ ዘእምውስቴቱ ዘርኡ ዘይወጽእ ዘይከውን በበዘመዱ ዲበ ምድር ወኮነ ከማሁ
35
+ expected: wäyəbe ʾəgəziʾabəḥerə lätabəqʷələ mədərə ḥamäləmalä śaʿərə zäyəzäraʾə bäbäzärəʾu wäbäbäzämädu wäzäbäbä ʾaməsalihu wäʿəṣ̓äwä zäyəfäri wäyəgäbərə farehu zäʾəməwəsətetu zärəʾu zäyəwäṣəʾə zäyəkäwənə bäbäzämädu dibä mədərə wäkonä kämahu
36
+ - source: ወአውጽአት ምድር ሐመልማለ ሣዕር ዘይዘራእ ዘርኡ ዘበበዘመዱ ወበበአርአያሁ ወዕፀወ ዘይፈሪ ወይገብር ፍሬሁ ዘእምውስቴቱ ዘርእ ዘይከውን በበዘመዱ መልዕልተ ምድር ወርእየ እግዚአብሔር ከመ ሠናይ
37
+ expected: wäʾawəṣəʾatə mədərə ḥamäləmalä śaʿərə zäyəzäraʾə zärəʾu zäbäbäzämädu wäbäbäʾarəʾayahu wäʿəṣ̓äwä zäyəfäri wäyəgäbərə fərehu zäʾəməwəsətetu zärəʾə zäyəkäwənə bäbäzämädu mäləʿələtä mədərə wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə
38
+ - source: ወኮነ ሌሊተ ወጸብሐ ወኮነ ሣልስተ ዕለት
39
+ expected: wäkonä lelitä wäṣäbəḥa wäkonä śaləsətä ʿəlätə
40
+ - source: ወይቤ እግዚአብሔር ይኩኑ ብርሃናት ውስተ ጠፈረ ሰማይ ከመ ያብርሁ ዲበ ምድር ወይፍልጡ ማእከለ ዕለት ወማእከለ ሌሊት ወይኩኑ ለተአምር ወለዘመን ወለመዋዕል ወለዓመታት
41
+ expected: wäyəbe ʾəgəziʾabəḥerə yəkunu bərəhanatə wəsətä ṭäfärä sämayə kämä yabərəhu dibä mədərə wäyəfələṭu maʾəkälä ʿəlätə wämaʾəkälä lelitə wäyəkunu lätäʾamərə wäläzämänə wälämäwaʿələ wäläʿamätatə
42
+ - source: ወይኩኑ ለአብርሆ ውስተ ጠፈረ ሰማይ ከመ ያብርሁ ዲበ ምድር ወኮነ ከማሁ
43
+ expected: wäyəkunu läʾabərəho wəsətä ṭäfärä sämayə kämä yabərəhu dibä mədərə wäkonä kämahu
44
+ - source: ወገብረ እግዚአብሔር ብርሃናተ ክልኤተ ዐበይተ ዘየዐቢ ብርሃን ከመ ይምልክ መዐልተ ወዘይንእስ ብርሃን ከመ ይምልክ ሌሊተ ምስለ ከዋክብቲሁ
45
+ expected: wägäbərä ʾəgəziʾabəḥerə bərəhanatä kələʾetä ʿabäyətä zäyäʿabi bərəhanə kämä yəmələkə mäʿalətä wäzäyənəʾəsə bərəhanə kämä yəmələkə lelitä məsəlä käwakəbətihu
46
+ - source: ወሤሞሙ እግዚአብሔር ውስተ ጠፈረ ሰማይ ከመ ያብርሁ ዲበ ምድር 18ወይኰንንዋ ለዕለት ወለሌሊትኒ ወይፍልጡ ማእከለ ሌሊት ወማእከለ ብርሃን ወርእየ እግዚአብሔር ከመ ሠናይ
47
+ expected: wäśemomu ʾəgəziʾabəḥerə wəsətä ṭäfärä sämayə kämä yabərəhu dibä mədərə 18wäyəkʷänənəwa läʿəlätə wälälelitəni wäyəfələṭu maʾəkälä lelitə wämaʾəkälä bərəhanə wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə
48
+ - source: ወኮነ ሌሊተ ወጸብሐ ወኮነ ራብዕተ ዕለተ
49
+ expected: wäkonä lelitä wäṣäbəḥa wäkonä rabəʿətä ʿəlätä
50
+ - source: ወይቤ እግዚአብሔር ለታውጽእ ማይ ዘይትሐወስ ዘቦ መንፈሰ ሕይወት ወአዕዋፈ ዘይሠርር መልዕልተ ምድር ወመትሕት ሰማይ ወኮነ ከማሁ
51
+ expected: wäyəbe ʾəgəziʾabəḥerə lätawəṣəʾə mayə zäyətəḥawäsə zäbo mänəfäsä ḥəyəwätə wäʾaʿəwafä zäyəśärərə mäləʿələtä mədərə wämätəḥətə sämayə wäkonä kämahu
52
+ - source: ወገብረ እግዚአብሔር ዐናብርተ ዐበይተ ወኵሎ ነፍሰ ሕይወት ዘይትሐወስ ዘአውጽአ ማይ በበዘመዱ ወኵሎ ዖፈ ዘይሠርር በበዘመዱ ወርእየ እግዚአብሔር ከመ ሠናይ
53
+ expected: wägäbərä ʾəgəziʾabəḥerə ʿanabərətä ʿabäyətä wäkʷəlo näfəsä ḥəyəwätə zäyətəḥawäsə zäʾawəṣəʾa mayə bäbäzämädu wäkʷəlo ʿofä zäyəśärərə bäbäzämädu wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə
54
+ - source: ወባረኮሙ እግዚአብሔር ወይቤ ብዝኁ ወተባዝኁ ወምልእዋ ለምድር ወአዕዋፍኒ ይብዝኁ ውስተ ምድር
55
+ expected: wäbaräkomu ʾəgəziʾabəḥerə wäyəbe bəzəḫu wätäbazəḫu wämələʾəwa lämədərə wäʾaʿəwafəni yəbəzəḫu wəsətä mədərə
56
+ - source: ወኮነ ሌሊተ ወጸብሐ ወኮነ ኃምስተ ዕለተ
57
+ expected: wäkonä lelitä wäṣäbəḥa wäkonä ḫaməsətä ʿəlätä
58
+ - source: ወይቤ እግዚአብሔር ለታውጽእ ምድር ዘመደ እንስሳ ወዘይትሐወስ ወአራዊተ ምድር ዘበበ ዘመዱ ወኮነ ከማሁ
59
+ expected: wäyəbe ʾəgəziʾabəḥerə lätawəṣəʾə mədərə zämädä ʾənəsəsa wäzäyətəḥawäsə wäʾarawitä mədərə zäbäbä zämädu wäkonä kämahu
60
+ - source: ወገብረ እግዚአብሔር እንስሳ ዘበበ ዘመዱ ወኵሎ ዘይትሐወስ ውስተ ምድር በበዘመዱ ወአራዊተ ምድር በበዘመዱ ወርእየ እግዚአብሔር ከመ ሠናይ
61
+ expected: wägäbərä ʾəgəziʾabəḥerə ʾənəsəsa zäbäbä zämädu wäkʷəlo zäyətəḥawäsə wəsətä mədərə bäbäzämädu wäʾarawitä mədərə bäbäzämädu wärəʾəyä ʾəgəziʾabəḥerə kämä śänayə
62
+ - source: ወይቤ እግዚአብሔር ንግበር ሰብአ በአርአያነ ወበአምሳሊነ ወይኰንን ዐሣተ ባሕር ወአራዊተ ምድር ወአዕዋፈ ሰማይ ወእንስሳሂ ወኵሎ ምድረ ወአራዊተ ዘይትሐወስ ዲበ ምድር
63
+ expected: wäyəbe ʾəgəziʾabəḥerə nəgəbärə säbəʾa bäʾarəʾayanä wäbäʾaməsalinä wäyəkʷänənə ʿaśatä baḥərə wäʾarawitä mədərə wäʾaʿəwafä sämayə wäʾənəsəsahi wäkʷəlo mədərä wäʾarawitä zäyətəḥawäsə dibä mədərə
64
+ - source: ወገብሮ እግዚአብሔር ለእጓለ እመሕያው በአምሳለ እግዚአብሔር ተባዕተ ወአንስተ ገብሮሙ
65
+ expected: wägäbəro ʾəgəziʾabəḥerə läʾəgʷalä ʾəmäḥəyawə bäʾaməsalä ʾəgəziʾabəḥerə täbaʿətä wäʾanəsətä gäbəromu
66
+ - source: ወባረኮሙ እግዚአብሔር ወይቤሎሙ ብዝኁ ወተባዝኁ ወምልእዋ ለምድር ወቅንይዋ ወኰንንዎሙ ለዓሣተ ባሕር ወለአዕዋፈ ሰማይ ወለኵሉ እንስሳ ወለኵሉ ዘይትሐወስ ዲበ ምድር
67
+ expected: wäbaräkomu ʾəgəziʾabəḥerə wäyəbelomu bəzəḫu wätäbazəḫu wämələʾəwa lämədərə wäqənəyəwa wäkʷänənəwomu läʿaśatä baḥərə wäläʾaʿəwafä sämayə wäläkʷəlu ʾənəsəsa wäläkʷəlu zäyətəḥawäsə dibä mədərə
68
+ - source: ወይቤ እግዚአብሔር ናሁ ወሀብኩክሙ ኵሎ ሣዕረ ዘይዘራእ ወይበቍል በዘርኡ ተዘሪኦ ዲበ ኵሉ ምድር ወኵሉ ዕፀው ዘሀሎ ውስቴቱ ዘርኡ ዘይዘራእ በፍሬሁ ለክሙ ውእቱ መብልዕ
69
+ expected: wäyəbe ʾəgəziʾabəḥerə nahu wähabəkukəmu kʷəlo śaʿərä zäyəzäraʾə wäyəbäqʷələ bäzärəʾu täzäriʾo dibä kʷəlu mədərə wäkʷəlu ʿəṣ̓äwə zähalo wəsətetu zärəʾu zäyəzäraʾə bäfərehu läkəmu wəʾətu mäbələʿə
70
+ - source: ወለኵሉ አራዊተ ምድር ወለኵሉ አዕዋፈ ሰማይ ወለኵሉ ዘይትሐወስ ውስተ ምድር ዘቦ መንፈሰ ሕይወት ወኵሉ ሐመልማለ ሣዕር ይኩንክሙ መብልዐ ወኮነ ከማሁ
71
+ expected: wäläkʷəlu ʾarawitä mədərə wäläkʷəlu ʾaʿəwafä sämayə wäläkʷəlu zäyətəḥawäsə wəsətä mədərə zäbo mänəfäsä ḥəyəwätə wäkʷəlu ḥamäləmalä śaʿərə yəkunəkəmu mäbələʿa wäkonä kämahu
72
+ - source: ወርእየ እግዚአብሔር ኵሎ ዘገብረ ከመ ጥቀ ሠናይ ወኮነ ሌሊተ ወጸብሐ ወኮነ ሳድስተ ዕለተ
73
+ expected: wärəʾəyä ʾəgəziʾabəḥerə kʷəlo zägäbərä kämä ṭəqä śänayə wäkonä lelitä wäṣäbəḥa wäkonä sadəsətä ʿəlätä
74
+
75
+ map:
76
+ inherit: 'var-amh-Ethi-Latn-eae-2003'
@@ -0,0 +1,221 @@
1
+ ---
2
+ authority_id: var
3
+ id: 1872
4
+ language: iso-639-2:hin
5
+ source_script: Deva
6
+ destination_script: Latn
7
+ name: Hindi Hunterian system
8
+ url: https://transliteration.eki.ee/pdf/Hindi-Marathi-Nepali.pdf
9
+ creation_date: 1872
10
+ description:
11
+ The Hunterian system is the national system of romanization in India.
12
+
13
+ notes:
14
+
15
+ - a, i and u are used in word-final position. The a in gaon and the u in pur are not accented.
16
+ - ज्ञ is transliterated gy.
17
+ - v is used before i.
18
+
19
+ tests:
20
+ - source: "परिपक्क"
21
+ expected: "paraipakka"
22
+ - source: "जगत्"
23
+ expected: "jagat"
24
+ - source: "संख्या"
25
+ expected: "sankhyaā"
26
+ - source: "गंभीर मरीजों के मामले में भारत दूसरे नंबर पर"
27
+ expected: "ganbhaīra maraījaon kae maāmalae maen bhaārata daūsarae nanbara para"
28
+ - source: "कोरोना अपडेट्स"
29
+ expected: "kaoraonaā apadaetsa"
30
+ - source: "सीडीसी चीफ का बयान अहम"
31
+ expected: "saīdaīsaī chaīpha kaā bayaāna ahama"
32
+ - source: "गूगल प्ले स्टोर पर पेटीएम की वापसी"
33
+ expected: "gaūgala plae staora para paetaīema kaī waāpasaī"
34
+ - source: "भारत में गैंबलिंग की इजाजत नहीं"
35
+ expected: "bhaārata maen gaainbalainga kaī ijaājata nahaīn"
36
+ - source: "कोरोना वैक्सीन मुद्दे पर घिरे राष्ट्रपति; जो बाइडेन बोले- मुझे और देश को वैज्ञानिकों पर भरोसा है, डोनाल्ड ट्रम्प पर नहीं"
37
+ expected: "kaoraonaā waaiksaīna mauddae para ghairae raāshtrapatai; jao baāidaena baolae- maujhae aura daesa kao waaigyānaikaon para bharaosaā haai, daonaālda trampa para nahaīn"
38
+ - source: "गूगल की कार्रवाई पर पेटीएम ने कहा था कि ऐप को अस्थायी तौर पर प्ले-स्टोर से हटाया गया है, आपके पैसे सुरक्षित हैं"
39
+ expected: "gaūgala kaī kaārrawaāi para paetaīema nae kahaā thaā kai aipa kao asthaāyaī taaura para plae-staora sae hataāyaā gayaā haai, āpakae paaisae saurakshaita haain"
40
+
41
+ map:
42
+
43
+ rules:
44
+ # note[1]
45
+ - pattern: (?<=)\u0906(?=\b)
46
+ result: "a"
47
+ - pattern: (?<=)\u0908(?=\b)
48
+ result: "i"
49
+ - pattern: (?<=)\u090A(?=\b)
50
+ result: "u"
51
+
52
+ # note[3]
53
+ - pattern: \u0935(?=[इई])
54
+ result: "v"
55
+
56
+
57
+
58
+ characters:
59
+
60
+ # I. Vowels and Diphthongs (see Note 1)
61
+
62
+ 'अ': 'a'
63
+ 'आ': 'ā'
64
+ 'इ': 'i'
65
+ 'ई': 'ī'
66
+ 'उ': 'u'
67
+ 'ऊ': 'ū'
68
+ 'ऋ': 'ri'
69
+ 'ए': 'e'
70
+ 'ऐ': 'ai'
71
+ 'ओ': 'o'
72
+ 'औ': 'au'
73
+
74
+ # II. Consonants (see Note 2)
75
+ # Gutturals
76
+ 'क': 'ka'
77
+ 'ख': 'kha'
78
+ 'ग': 'ga'
79
+ 'घ': 'gha'
80
+ 'ङ': 'nga'
81
+
82
+ # Palatals
83
+ 'च': 'cha'
84
+ 'छ': 'chha'
85
+ 'ज': 'ja'
86
+ 'झ': 'jha'
87
+ 'ञ': 'nya'
88
+
89
+ # Cerebrals
90
+ 'ट': 'ta'
91
+ 'ठ': 'tha'
92
+ 'ड': 'da'
93
+ 'ढ': 'dha'
94
+ 'ण': 'na'
95
+
96
+ # Dentals
97
+ 'त': 'ta'
98
+ 'थ': 'tha'
99
+ 'द': 'da'
100
+ 'ध': 'dha'
101
+ 'न': 'na'
102
+
103
+ # Labials
104
+ 'प': 'pa'
105
+ 'फ': 'pha'
106
+ 'ब': 'ba'
107
+ 'भ': 'bha'
108
+ 'म': 'ma'
109
+
110
+ # Semivowels
111
+ 'य': 'ya'
112
+ 'र': 'ra'
113
+ 'ल': 'la'
114
+ 'व': 'wa'
115
+
116
+ # Sibilants
117
+ 'श': 'sa'
118
+ 'ष': 'sha'
119
+ 'स': 'sa'
120
+
121
+ # Aspirate
122
+ 'ह': 'ha'
123
+
124
+
125
+ # Additional consonants
126
+ 'क़': 'qa'
127
+ 'ख़': 'kha'
128
+ 'ग़': 'ġa'
129
+ 'ज़': 'za'
130
+ 'ड़': 'ṙa'
131
+ 'ढ़': 'ṙha'
132
+ 'फ़': 'fa'
133
+ 'ळ': 'la'
134
+
135
+ # Anusvāra
136
+ 'ं': 'n'
137
+
138
+ # Bisarga
139
+ 'ः': 'h'
140
+
141
+ # Anunāsika
142
+ 'ँ': 'm'
143
+
144
+ # Note 2
145
+ 'ज्ञ': 'gy'
146
+
147
+
148
+ # Medials # Needed for connecting constants
149
+ 'ा': "ā"
150
+ 'ि': "i"
151
+ 'ी': "ī"
152
+ 'ु': "u"
153
+ 'ू': "ū"
154
+ 'ृ': "ri"
155
+ 'े': "e"
156
+ 'ै': "ai"
157
+ 'ो': "o"
158
+ 'ौ': "au"
159
+ '‍': ''# Used for joining
160
+
161
+
162
+ #V. Vowelless with halanta (्)
163
+
164
+ # Gutturals
165
+ 'क्': 'k'
166
+ 'ख्': 'kh'
167
+ 'ग्': 'g'
168
+ 'घ्': 'gh'
169
+ 'ङ्': 'ng'
170
+
171
+ # Palatals
172
+ 'च्': 'ch'
173
+ 'छ्': 'chh'
174
+ 'ज्': 'j'
175
+ 'झ्': 'jh'
176
+ 'ञ्': 'ny'
177
+
178
+ # Cerebrals
179
+ 'ट्': 't'
180
+ 'ठ्': 'th'
181
+ 'ड्': 'd'
182
+ 'ढ्': 'dh'
183
+ 'ण्': 'n'
184
+
185
+ # Dentals
186
+ 'त्': 't'
187
+ 'थ्': 'th'
188
+ 'द्': 'd'
189
+ 'ध्': 'dh'
190
+ 'न्': 'n'
191
+
192
+ # Labials
193
+ 'प्': 'p'
194
+ 'फ्': 'ph'
195
+ 'ब्': 'b'
196
+ 'भ्': 'bh'
197
+ 'म्': 'm'
198
+
199
+ # Semivowels
200
+ 'य्': 'y'
201
+ 'र्': 'r'
202
+ 'ल्': 'l'
203
+ 'व्': 'w'
204
+
205
+ # Sibilants
206
+ 'श्': 's'
207
+ 'ष्': 'sh'
208
+ 'स्': 's'
209
+
210
+ # Aspirate
211
+ 'ह्': 'h'
212
+
213
+ # Additional consonants
214
+ 'क़्': 'q'
215
+ 'ख़्': 'kh'
216
+ 'ग़्': 'ġ'
217
+ 'ज़्': 'z'
218
+ 'ड़्': 'ṙ'
219
+ 'ढ़्': 'ṙh'
220
+ 'फ़्': 'f'
221
+ 'ळ्': 'l'
@@ -1,7 +1,7 @@
1
1
  ---
2
2
  authority_id: var
3
3
  id: hepburn-1886
4
- language: jpn
4
+ language: iso-639-2:jpn
5
5
  source_script: Hrkt
6
6
  destination_script: Latn
7
7
  name: Traditional Hepburn
@@ -1,7 +1,7 @@
1
1
  ---
2
2
  authority_id: var
3
3
  id: hepburn-1954
4
- language: jpn
4
+ language: iso-639-2:jpn
5
5
  source_script: Hrkt
6
6
  destination_script: Latn
7
7
  name: Modified Hepburn
@@ -1,13 +1,13 @@
1
1
  ---
2
2
  authority_id: nil
3
3
  id: jamo
4
- language: kor
4
+ language: iso-639-2:kor
5
5
  source_script: Hang
6
6
  destination_script: Hang
7
7
  name: Hangul to Jamo decomposition
8
- url:
9
- creation_date:
10
- adoption_date:
8
+ url:
9
+ creation_date:
10
+ adoption_date:
11
11
  description:
12
12
 
13
13
  notes:
@@ -1,11 +1,11 @@
1
1
  ---
2
2
  authority_id: bgn
3
3
  id: mr-1939
4
- language: kor
4
+ language: iso-639-2:kor
5
5
  source_script: Hang
6
6
  destination_script: Latn
7
7
  name: McCune-Reischauer System
8
- url:
8
+ url:
9
9
  creation_date: 1939
10
10
  adoption_date:
11
11
  description:
@@ -310,7 +310,7 @@ map:
310
310
  character_separator: ""
311
311
  word_separator: " "
312
312
  title_case: False
313
- inherit: nil-kor-Hang-Hang-jamo
313
+ inherit: var-kor-Hang-Hang-jamo
314
314
 
315
315
  rules:
316
316
 
@@ -1051,4 +1051,4 @@ map:
1051
1051
  # This is based on Jamo
1052
1052
 
1053
1053
  dictionary:
1054
- #
1054
+ #
@@ -1,12 +1,12 @@
1
1
  ---
2
2
  authority_id: var
3
3
  id: 2013
4
- language: kor
4
+ language: iso-639-2:kor
5
5
  source_script: Kore
6
6
  destination_script: Hang
7
7
  name: Hanja Hangul Converter 0.0.7
8
8
  url: http://blog.daum.net/masoris20/69
9
- creation_date:
9
+ creation_date:
10
10
  adoption_date:
11
11
  description:
12
12
  This is a Hanja-Hangul map available in the public domain.
@@ -1,11 +1,11 @@
1
1
  ---
2
2
  authority_id: bgn
3
3
  id: mr-1939
4
- language: kor
4
+ language: iso-639-2:kor
5
5
  source_script: Hang
6
6
  destination_script: Latn
7
7
  name: McCune-Reischauer System
8
- url:
8
+ url:
9
9
  creation_date: 1939
10
10
  adoption_date:
11
11
  description:
@@ -34,4 +34,3 @@ map:
34
34
  word_separator: " "
35
35
  title_case: True
36
36
  inherit: [var-kor-Kore-Hang-2013, var-kor-Hang-Latn-mr-1939]
37
-
@@ -0,0 +1,43 @@
1
+ ---
2
+ authority_id: var
3
+ id: 1872
4
+ language: iso-639-2:mar
5
+ source_script: Deva
6
+ destination_script: Latn
7
+ name: Marathi Hunterian system
8
+ url: https://transliteration.eki.ee/pdf/Hindi-Marathi-Nepali.pdf
9
+ creation_date: 1872
10
+ description:
11
+ The Hunterian system is the national system of romanization in India.
12
+
13
+ notes:
14
+
15
+ - a, i and u are used in word-final position. The a in gaon and the u in pur are not accented.
16
+ - ज्ञ is transliterated gy.
17
+ - v is used before i.
18
+
19
+ tests:
20
+ - source: "ठाणे - जिल्ह्यात बुधवारी एक हजार रुग्णांची वाढ, तर जणांच्या मृत्यूची नोंद"
21
+ expected: "thaānae - jailhyaāta baudhawaāraī eka hajaāra raugnaānchaī waādha, tara janaānchyaā marityaūchaī naonda"
22
+ - source: "एकता कपूर पुन्हा अडकली वादात, वेबसीरिजमधल्या 'त्या' सीनमुळे जमावाची घरावर दगडफेक"
23
+ expected: "ekataā kapaūra paunhaā adakalaī waādaāta, waebasaīraijamadhalyaā 'tyaā' saīnamaulae jamaāwaāchaī gharaāwara dagadaphaeka"
24
+ - source: "जाणून घ्या, बीएमसीच्या अधिकाऱ्यांनी कंगना राणौतच्या ऑफिसमधले नक्की काय- काय तोडलं"
25
+ expected: "jaānaūna ghyaā, baīemasaīchyaā adhaikaāऱ्yaānnaī kanganaā raānaautachyaā ऑphaisamadhalae nakkaī kaāya- kaāya taodalan"
26
+ - source: "कंगना मुंबईत दाखल होण्यापूर्वी 'मातोश्री'वरून फर्मान सुटले; प्रवक्त्यांना सक्त आदेश"
27
+ expected: "kanganaā maunbaīta daākhala haonyaāpaūrwaī 'maātaosraī'waraūna pharmaāna sautalae; prawaktyaānnaā sakta ādaesa"
28
+ - source: "मराठा आरक्षणास तात्पुरती स्थगिती; सर्वोच्च न्यायालयाचा निर्णय"
29
+ expected: "maraāthaā ārakshanaāsa taātpaurataī sthagaitaī; sarwaochcha nyaāyaālayaāchaā nairnaya"
30
+ - source: "भारताच्या तिन्ही लशींचा पहिला टप्पा यशस्वी, वाचा कधी येणार बाजारात"
31
+ expected: "bhaārataāchyaā tainhaī lasaīnchaā pahailaā tappaā yasaswaī, waāchaā kadhaī yaenaāra baājaāraāta"
32
+ - source: "रुग्णवाढीमुळे खाटांची चणचण"
33
+ expected: "raugnawaādhaīmaulae khaātaānchaī chanachana"
34
+ - source: "पीएम स्वनिधी कर्ज योजनेला मुंबईतून अल्प प्रतिसाद"
35
+ expected: "paīema swanaidhaī karja yaojanaelaā maunbaītaūna alpa prataisaāda"
36
+ - source: "सांताक्रूझ-चेंबूर लिंक रोडवरील उन्नत मार्गाला स्थगिती"
37
+ expected: "saāntaākraūjha-chaenbaūra lainka raodawaraīla unnata maārgaālaā sthagaitaī"
38
+ - source: "संपादक अर्णब गोस्वामी यांच्याविरूद्ध खडक पोलिस ठाण्यात तक्रार"
39
+ expected: "sanpaādaka arnaba gaoswaāmaī yaānchyaāwairaūddha khadaka paolaisa thaānyaāta takraāra"
40
+
41
+ map:
42
+
43
+ inherit: 'var-hin-Deva-Latn-hunterian-1872'
@@ -0,0 +1,102 @@
1
+ ---
2
+ authority_id: var
3
+ id: 1930
4
+ language: iso-639-2:mon
5
+ source_script: Mong
6
+ destination_script: Latn
7
+ name: Mongolian Latin alphabet
8
+ url: https://en.m.wikipedia.org/wiki/Mongolian_Latin_alphabet
9
+ creation_date:
10
+ description: |
11
+ Latin alphabet was using "y" as feminine "u", with additional
12
+ feminine "o" ("ө") and with additional consonants "ç" for "ch", "ş"
13
+ for "sh" and "ƶ" for "j", it successfully served in printing books
14
+ and newspapers. A few of the letters (f, k, p, v) were rarely used,
15
+ being found only in borrowings, while q, w and x were excluded
16
+ altogether. Since k transcribed [h] in loans, it is unclear how loans
17
+ in [kʰ] were written. "j" is used for vowel combinations of the [ja]
18
+ type. Letter "c" is used for the sound [ts] and "k" is used for the
19
+ ound [h]. The first version was inspired by the Yanalif script used
20
+ for the Soviet Union's Turkic languages.
21
+
22
+ The orthography of the Mongolian Latin is based on the orthography of
23
+ the Classical Mongolian script. It preserves short final vowels. It
24
+ does not drop unstressed vowels in the closing syllables when the word
25
+ is conjugated. The suffixes and inflections without long or i-coupled
26
+ vowels are made open syllables ending with a vowel, which is harmonized
27
+ with the stressed vowel. The rule for the vowel harmony for unstressed
28
+ vowels is similar to that of the Mongolian Cyrillic. It does not use
29
+ consonant combinations to denote new consonant sounds. For both of the
30
+ version, letter "b" is used both in the beginning and in the middle of
31
+ the word. Because it phonetically assimilates into sound [w], no
32
+ ambiguity is caused.
33
+
34
+ notes:
35
+ - A separated final form of vowels a or e is common, and can appear at the end
36
+ of a word, word stem, or suffix. This form requires a final-shaped preceding
37
+ consonant and an inter-word gap in between. The vowels themselves appear as ᠎ᠠ,
38
+ and with consonants as ‍ᠬ᠎ᠠ q‑a, ‍ᠷ᠎ᠠ r‑a/r‑e, etc. This gap can be transliterated
39
+ with a hyphen. In digital typesetting, these forms are triggered by inserting
40
+ a U+180E ᠎ MONGOLIAN VOWEL SEPARATOR (HTML &#6158; · MVS) between the consonant
41
+ and vowel.
42
+ - All case suffixes, as well as any plural suffixes consisting of one or two
43
+ syllables are likewise separated by a preceding and hyphen-transliterated gap.
44
+ In digital typesetting, this gap is represented by a U+202F   NARROW NO-BREAK SPACE
45
+ (HTML &#8239; · NNBSP). A maximum of two case suffixes can be added to a stem.
46
+ Single-letter vowel suffixes appear with the final-shaped forms of a/e, i, or u/ü,
47
+ as in ᠭᠠᠵᠠᠷ ᠠ γaǰar‑a 'to the country' and ᠡᠳᠦᠷ ᠡ edür‑e 'on the day', or ᠤᠯᠤᠰ ᠢ ulus‑i
48
+ 'the state' etc. Multi-letter suffixes most often start with an initial- (consonants),
49
+ medial- (vowels), or variant-shaped form.
50
+
51
+ # Note: Provedid sample of "Latin 1931-1939" in https://en.m.wikipedia.org/wiki/Mongolian_Latin_alphabet is not actual transliteration.
52
+ # It's kind of buggy transliteration that mixes Cyrillic and Traditional Mongolian script into Latin based on phonetic sound.
53
+ # There is no expected transliteration sources found for the tests.
54
+
55
+ # Latin 1931-1939
56
+ # Manai ulasiin niislel koto Ulaanbaatar bol 80 000 şakam kyntei, ulasiin olon niitiin, aƶi akuin tөb gazaruud oroşison jikeeken oron bolno.
57
+ # Tus ulasiin dotoroos garka tyykii zuiliig bolbosruulka aƶi yildberiin gazaruudiig baiguulka ni çukala.
58
+
59
+ tests:
60
+ - source: |
61
+ ᠮᠠᠨ ᠤ ᠤᠯᠤᠰ ᠤᠨ ᠨᠡᠶᠢᠰᠯᠡᠯ ᠬᠣᠲᠠ ᠤᠯᠠᠭᠠᠨᠪᠠᠭᠠᠲᠤᠷ ᠪᠣᠯ 80 000 ᠰᠢᠬᠠᠮ ᠬᠦᠮᠦᠨ ᠲᠡᠢ᠂ ᠤᠯᠤᠰ ᠤᠨ ᠣᠯᠠᠨ ᠨᠡᠶᠢᠲᠡ ᠶᠢᠨ᠂ ᠠᠵᠤ ᠠᠬᠤᠢ ᠶᠢᠨ ᠲᠥᠪ ᠭᠠᠵᠠᠷ ᠤᠳ ᠣᠷᠣᠰᠢᠭᠰᠠᠨ ᠶᠡᠬᠡᠬᠡᠨ ᠣᠷᠣᠨ ᠪᠣᠯᠤᠨ᠎ᠠ᠃
62
+ ᠲᠤᠰ ᠤᠯᠤᠰ ᠤᠨ ᠳᠣᠲᠣᠷ᠎ᠠ ᠠᠴᠠ ᠭᠠᠷᠬᠤ ᠲᠦᠭᠦᠬᠡᠢ ᠵᠤᠶᠢᠯ ᠢ ᠪᠣᠯᠪᠠᠰᠤᠷᠠᠭᠤᠯᠬᠤ ᠠᠵᠤ ᠦᠢᠯᠡᠳᠪᠦᠷᠢ ᠶᠢᠨ ᠭᠠᠵᠠᠷ ᠤᠳ ᠢ ᠪᠠᠶᠢᠭᠤᠯᠬᠤ ᠨᠢ ᠴᠢᠬᠤᠯᠠ᠃
63
+ expected: |
64
+ man-u ulus-un nejislel kota ulaganbagatur bol 80 000 sikam kymyn-tei, ulus-un olan nejite-jin, aƶu akui-jin tөb gaƶar-ud orosigsan jekeken oron bolun-a.
65
+ tus ulus-un dotor-a-aça garku tygykei ƶujil-i bolbasuragulku aƶu yiledbyri-jin gaƶar-ud-i bajigulku ni çikula.
66
+
67
+ map:
68
+
69
+ characters:
70
+ "ᠠ": "a" # \u1820
71
+ "ᠡ": "e" # \u1821
72
+ "ᠢ": "i" # \u1822
73
+ "ᠣ": "o" # \u1823
74
+ "ᠤ": "u" # \u1824
75
+ "ᠥ": "ө" # \u1825
76
+ "ᠦ": "y" # \u1826
77
+ "ᠨ": "n" # \u1828
78
+ "ᠮ": "m" # \u182e
79
+ "ᠯ": "l" # \u182f
80
+ "ᠪ": "b" # \u182a
81
+ "ᠫ": "p" # \u182b
82
+ "ᠹ": "f" # \u1839
83
+ "ᠻ": "k" # \u183b
84
+ "ᠬ": "k" # \u182c
85
+ "ᠭ": "g" # \u182d
86
+ "ᠰ": "s" # \u1830
87
+ "ᠱ": "ş" # \u1831
88
+ "ᠲ": "t" # \u1832
89
+ "ᠳ": "d" # \u1833
90
+ "ᠴ": "c" # \u1834
91
+ "ᠴ": "ç" # \u1834
92
+ "ᠵ": "z" # \u1835
93
+ "ᠵ": "ƶ" # \u1835
94
+ "ᠶ": "j" # \u1836
95
+ "ᠷ": "r" # \u1837
96
+ "ᠾ": "h" # \u183e
97
+ "᠁": "..." # \u1801
98
+ "᠂": "," # \u1802
99
+ "᠃": "." # \u1803
100
+ "᠄": ":" # \u1804
101
+ "\u180e": "-" # MVS
102
+ "\u202f": "-" # NNBSP