interscript-maps 2.0.5

Sign up to get free protection for your applications and to get access to all the features.
Files changed (291) hide show
  1. checksums.yaml +7 -0
  2. data/README.adoc +28 -0
  3. data/interscript-maps.gemspec +28 -0
  4. data/interscript-maps.yaml +235 -0
  5. data/libs/posix.iml +11 -0
  6. data/libs/unicode.iml +13 -0
  7. data/libs/var-Cyrl.iml +7 -0
  8. data/libs/var-kor.iml +17 -0
  9. data/maps-staging/royin-tha-Thai-Latn-1939-generic.imp +98 -0
  10. data/maps-staging/royin-tha-Thai-Latn-1968.imp +156 -0
  11. data/maps-staging/royin-tha-Thai-Latn-1999-chained.imp +161 -0
  12. data/maps-staging/royin-tha-Thai-Latn-1999.imp +78 -0
  13. data/maps-staging/var-tha-Thai-Thai-phonemic.imp +53 -0
  14. data/maps-staging/var-tha-Thai-Zsym-ipa.imp +273 -0
  15. data/maps/acadsin-zho-Hani-Latn-2002.imp +27515 -0
  16. data/maps/alalc-amh-Ethi-Latn-1997.imp +392 -0
  17. data/maps/alalc-amh-Ethi-Latn-2011.imp +85 -0
  18. data/maps/alalc-ara-Arab-Latn-1997.imp +1171 -0
  19. data/maps/alalc-asm-Deva-Latn-1997.imp +214 -0
  20. data/maps/alalc-asm-Deva-Latn-2012.imp +53 -0
  21. data/maps/alalc-aze-Arab-Latn-1997.imp +321 -0
  22. data/maps/alalc-aze-Cyrl-Latn-1997.imp +101 -0
  23. data/maps/alalc-bel-Cyrl-Latn-1997.imp +118 -0
  24. data/maps/alalc-ben-Beng-Latn-1997.imp +225 -0
  25. data/maps/alalc-ben-Beng-Latn-2017.imp +135 -0
  26. data/maps/alalc-bul-Cyrl-Latn-1997.imp +110 -0
  27. data/maps/alalc-div-Thaa-Latn-1997.imp +171 -0
  28. data/maps/alalc-ell-Grek-Latn-1997.imp +381 -0
  29. data/maps/alalc-ell-Grek-Latn-2010.imp +382 -0
  30. data/maps/alalc-guj-Gujr-Latn-1997.imp +223 -0
  31. data/maps/alalc-guj-Gujr-Latn-2011.imp +57 -0
  32. data/maps/alalc-hin-Deva-Latn-1997.imp +248 -0
  33. data/maps/alalc-hin-Deva-Latn-2011.imp +63 -0
  34. data/maps/alalc-kan-Kana-Latn-1997.imp +233 -0
  35. data/maps/alalc-kan-Kana-Latn-2011.imp +58 -0
  36. data/maps/alalc-kat-Geok-Latn-1997.imp +109 -0
  37. data/maps/alalc-kat-Geor-Latn-1997.imp +104 -0
  38. data/maps/alalc-kor-Hang-Latn-1997.imp +68 -0
  39. data/maps/alalc-mal-Mlym-Latn-1997.imp +260 -0
  40. data/maps/alalc-mal-Mlym-Latn-2012.imp +65 -0
  41. data/maps/alalc-mar-Deva-Latn-1997.imp +178 -0
  42. data/maps/alalc-mar-Deva-Latn-2011.imp +51 -0
  43. data/maps/alalc-mkd-Cyrl-Latn-1997.imp +125 -0
  44. data/maps/alalc-mkd-Cyrl-Latn-2013.imp +113 -0
  45. data/maps/alalc-mon-Cyrl-Latn-1997.imp +161 -0
  46. data/maps/alalc-ori-Orya-Latn-1997.imp +234 -0
  47. data/maps/alalc-ori-Orya-Latn-2011.imp +59 -0
  48. data/maps/alalc-pan-Guru-Latn-1997.imp +241 -0
  49. data/maps/alalc-pan-Guru-Latn-2011.imp +71 -0
  50. data/maps/alalc-per-Arab-Latn-1997.imp +318 -0
  51. data/maps/alalc-pli-Deva-Latn-2012.imp +140 -0
  52. data/maps/alalc-pra-Deva-Latn-2012.imp +52 -0
  53. data/maps/alalc-rus-Cyrl-Latn-1997.imp +165 -0
  54. data/maps/alalc-rus-Cyrl-Latn-2012.imp +107 -0
  55. data/maps/alalc-san-Deva-Latn-2012.imp +207 -0
  56. data/maps/alalc-sin-Sinh-Latn-1997.imp +246 -0
  57. data/maps/alalc-sin-Sinh-Latn-2011.imp +63 -0
  58. data/maps/alalc-srp-Cyrl-Latn-1997.imp +124 -0
  59. data/maps/alalc-srp-Cyrl-Latn-2013.imp +115 -0
  60. data/maps/alalc-tam-Taml-Latn-1997.imp +52 -0
  61. data/maps/alalc-tam-Taml-Latn-2011.imp +49 -0
  62. data/maps/alalc-tel-Telu-Latn-1997.imp +237 -0
  63. data/maps/alalc-tel-Telu-Latn-2011.imp +58 -0
  64. data/maps/alalc-ukr-Cyrl-Latn-1997.imp +123 -0
  65. data/maps/alalc-ukr-Cyrl-Latn-2011.imp +32 -0
  66. data/maps/apcbg-bul-Cyrl-Latn-1995.imp +194 -0
  67. data/maps/az-aze-Cyrl-Latn-1939.imp +105 -0
  68. data/maps/az-aze-Cyrl-Latn-1958.imp +50 -0
  69. data/maps/bas-rus-Cyrl-Latn-2017-bss.imp +160 -0
  70. data/maps/bas-rus-Cyrl-Latn-2017-oss.imp +165 -0
  71. data/maps/bgn-jpn-Hrkt-Latn-1962.imp +288 -0
  72. data/maps/bgn-kor-Hang-Latn-1943.imp +31 -0
  73. data/maps/bgn-kor-Kore-Latn-1943.imp +33 -0
  74. data/maps/bgna-bul-Cyrl-Latn-2006.imp +119 -0
  75. data/maps/bgna-bul-Cyrl-Latn-2009.imp +119 -0
  76. data/maps/bgnpcgn-amh-Ethi-Latn-1967.imp +393 -0
  77. data/maps/bgnpcgn-ara-Arab-Latn-1956.imp +472 -0
  78. data/maps/bgnpcgn-arm-Armn-Latn-1981.imp +125 -0
  79. data/maps/bgnpcgn-aze-Cyrl-Latn-1993.imp +111 -0
  80. data/maps/bgnpcgn-bak-Cyrl-Latn-2007.imp +169 -0
  81. data/maps/bgnpcgn-bal-Arab-Latn-2008.imp +296 -0
  82. data/maps/bgnpcgn-bel-Cyrl-Latn-1979.imp +200 -0
  83. data/maps/bgnpcgn-bul-Cyrl-Latn-1952.imp +137 -0
  84. data/maps/bgnpcgn-bul-Cyrl-Latn-2013.imp +38 -0
  85. data/maps/bgnpcgn-che-Cyrl-Latn-2008.imp +176 -0
  86. data/maps/bgnpcgn-deu-Latn-Latn-2000.imp +56 -0
  87. data/maps/bgnpcgn-div-Thaa-Latn-1972.imp +90 -0
  88. data/maps/bgnpcgn-div-Thaa-Latn-1988.imp +71 -0
  89. data/maps/bgnpcgn-ell-Grek-Latn-1962.imp +443 -0
  90. data/maps/bgnpcgn-ell-Grek-Latn-1996.imp +269 -0
  91. data/maps/bgnpcgn-fao-Latn-Latn-1964.imp +41 -0
  92. data/maps/bgnpcgn-fao-Latn-Latn-1968.imp +28 -0
  93. data/maps/bgnpcgn-fas-Arab-Latn-1956.imp +111 -0
  94. data/maps/bgnpcgn-isl-Latn-Latn-1964.imp +42 -0
  95. data/maps/bgnpcgn-isl-Latn-Latn-1968.imp +32 -0
  96. data/maps/bgnpcgn-jpn-Hrkt-Latn-1976.imp +191 -0
  97. data/maps/bgnpcgn-kat-Geor-Latn-1981.imp +116 -0
  98. data/maps/bgnpcgn-kat-Geor-Latn-2009.imp +43 -0
  99. data/maps/bgnpcgn-kaz-Cyrl-Latn-1979.imp +193 -0
  100. data/maps/bgnpcgn-kir-Cyrl-Latn-1979.imp +170 -0
  101. data/maps/bgnpcgn-kor-Hang-Latn-kn-1945.imp +177 -0
  102. data/maps/bgnpcgn-kor-Hang-Latn-rok-2011.imp +40 -0
  103. data/maps/bgnpcgn-kor-Kore-Latn-rok-2011.imp +41 -0
  104. data/maps/bgnpcgn-kur-Arab-Latn-2007.imp +240 -0
  105. data/maps/bgnpcgn-mkd-Cyrl-Latn-1981.imp +132 -0
  106. data/maps/bgnpcgn-mkd-Cyrl-Latn-2013.imp +174 -0
  107. data/maps/bgnpcgn-mon-Cyrl-Latn-1964.imp +168 -0
  108. data/maps/bgnpcgn-nep-Deva-Latn-2011.imp +208 -0
  109. data/maps/bgnpcgn-per-Arab-Latn-1958.imp +312 -0
  110. data/maps/bgnpcgn-prs-Arab-Latn-2007.imp +552 -0
  111. data/maps/bgnpcgn-prs-Arab-Latn-yaghoubi.imp +445 -0
  112. data/maps/bgnpcgn-pus-Arab-Latn-1968.imp +289 -0
  113. data/maps/bgnpcgn-ron-cyrl-latn-2002.imp +165 -0
  114. data/maps/bgnpcgn-rue-Cyrl-Latn-2016.imp +133 -0
  115. data/maps/bgnpcgn-rus-Cyrl-Latn-1947.imp +195 -0
  116. data/maps/bgnpcgn-sme-Latn-Latn-1984.imp +48 -0
  117. data/maps/bgnpcgn-srp-Cyrl-Latn-1962.imp +55 -0
  118. data/maps/bgnpcgn-srp-Cyrl-Latn-2005.imp +146 -0
  119. data/maps/bgnpcgn-tat-Cyrl-Latn-2007.imp +185 -0
  120. data/maps/bgnpcgn-tgk-Cyrl-Latn-1994.imp +188 -0
  121. data/maps/bgnpcgn-ukr-Cyrl-Latn-1965.imp +136 -0
  122. data/maps/bgnpcgn-ukr-Cyrl-Latn-2019.imp +88 -0
  123. data/maps/bgnpcgn-urd-Arab-Latn-2007.imp +333 -0
  124. data/maps/bgnpcgn-uzb-Cyrl-Latn-1979.imp +145 -0
  125. data/maps/bgnpcgn-uzb-Cyrl-Latn-2000.imp +74 -0
  126. data/maps/bgnpcgn-zho-Hans-Latn-1979.imp +7463 -0
  127. data/maps/bis-asm-Beng-Latn-13194-1991.imp +154 -0
  128. data/maps/bis-ben-Beng-Latn-13194-1991.imp +151 -0
  129. data/maps/bis-dev-Deva-Latn-13194-1991.imp +178 -0
  130. data/maps/bis-guj-Gujr-Latn-13194-1991.imp +172 -0
  131. data/maps/bis-kan-Kana-Latn-13194-1991.imp +166 -0
  132. data/maps/bis-mlm-Mlym-Latn-13194-1991.imp +170 -0
  133. data/maps/bis-ori-Orya-Latn-13194-1991.imp +168 -0
  134. data/maps/bis-pnj-Guru-Latn-13194-1991.imp +169 -0
  135. data/maps/bis-tel-Telu-Latn-13194-1991.imp +165 -0
  136. data/maps/bis-tml-Taml-Latn-13194-1991.imp +149 -0
  137. data/maps/by-bel-Cyrl-Latn-1998.imp +123 -0
  138. data/maps/by-bel-Cyrl-Latn-2007.imp +77 -0
  139. data/maps/din-grc-Grek-Latn-31634-2011-t1.imp +627 -0
  140. data/maps/din-hin-Deva-Latn-33904-2018.imp +101 -0
  141. data/maps/din-kat-Geor-Latn-32707-2010.imp +103 -0
  142. data/maps/din-mar-Deva-Latn-33904-2018.imp +83 -0
  143. data/maps/din-nep-Deva-Latn-33904-2018.imp +110 -0
  144. data/maps/din-pli-Deva-Latn-33904-2018.imp +72 -0
  145. data/maps/din-pra-Deva-Latn-33904-2018.imp +66 -0
  146. data/maps/din-san-Deva-Latn-33904-2018.imp +294 -0
  147. data/maps/din-tam-Taml-Latn-33903-2016.imp +187 -0
  148. data/maps/dos-nep-Deva-Latn-1997.imp +47 -0
  149. data/maps/elot-ell-Grek-Latn-743-1982-tl.imp +399 -0
  150. data/maps/elot-ell-Grek-Latn-743-1982-ts.imp +397 -0
  151. data/maps/elot-ell-Grek-Latn-743-2001-tl.imp +34 -0
  152. data/maps/elot-ell-Grek-Latn-743-2001-ts.imp +178 -0
  153. data/maps/ggg-kat-Geor-Latn-2002.imp +75 -0
  154. data/maps/gki-bel-Cyrl-Latn-1992.imp +44 -0
  155. data/maps/gki-bel-Cyrl-Latn-2000.imp +159 -0
  156. data/maps/gost-rus-Cyrl-Latn-16876-71-1983.imp +179 -0
  157. data/maps/gost-rus-Cyrl-Latn-7.79-2000-2002.imp +132 -0
  158. data/maps/hk-yue-Hani-Latn-1888.imp +29201 -0
  159. data/maps/icao-bel-Cyrl-Latn-9303.imp +136 -0
  160. data/maps/icao-bul-Cyrl-Latn-9303.imp +127 -0
  161. data/maps/icao-fas-Arab-Latn-9303.imp +112 -0
  162. data/maps/icao-heb-Hebr-Latn-9303.imp +160 -0
  163. data/maps/icao-mkd-Cyrl-Latn-9303.imp +126 -0
  164. data/maps/icao-rus-Cyrl-Latn-9303.imp +126 -0
  165. data/maps/icao-srp-Cyrl-Latn-9303.imp +126 -0
  166. data/maps/icao-ukr-Cyrl-Latn-9303.imp +127 -0
  167. data/maps/iso-ara-Arab-Latn-233-1984.imp +301 -0
  168. data/maps/iso-asm-Beng-Latn-15919-2001.imp +73 -0
  169. data/maps/iso-ben-Beng-Latn-15919-2001.imp +171 -0
  170. data/maps/iso-ell-Grek-Latn-843-1997-t1.imp +365 -0
  171. data/maps/iso-ell-Grek-Latn-843-1997-t2.imp +43 -0
  172. data/maps/iso-guj-Gujr-Latn-15919-2001.imp +214 -0
  173. data/maps/iso-hin-Deva-Latn-15919-2001.imp +73 -0
  174. data/maps/iso-inc-Deva-Latn-15919-2001.imp +61 -0
  175. data/maps/iso-jpn-Hrkt-Latn-3602-1989.imp +59 -0
  176. data/maps/iso-kan-Kana-Latn-15919-2001.imp +212 -0
  177. data/maps/iso-kat-Geor-Latn-9984-1996.imp +103 -0
  178. data/maps/iso-kor-Hang-Latn-1996-method1.imp +140 -0
  179. data/maps/iso-kor-Hang-Latn-1996-method2.imp +132 -0
  180. data/maps/iso-mal-Mlym-Latn-15919-2001.imp +276 -0
  181. data/maps/iso-mar-Deva-Latn-15919-2001.imp +68 -0
  182. data/maps/iso-nep-Deva-Latn-15919-2001.imp +75 -0
  183. data/maps/iso-ori-Orya-Latn-15919-2001.imp +188 -0
  184. data/maps/iso-pan-Guru-Latn-15919-2001.imp +217 -0
  185. data/maps/iso-pli-Beng-Latn-15919-2001.imp +66 -0
  186. data/maps/iso-pli-Deva-Latn-15919-2001.imp +68 -0
  187. data/maps/iso-pli-Sinh-Latn-15919-2001.imp +211 -0
  188. data/maps/iso-pli-Thai-Latn-15919-2001.imp +47 -0
  189. data/maps/iso-pra-Deva-Latn-15919-2001.imp +60 -0
  190. data/maps/iso-prs-Arab-Latn-233-3-1999.imp +352 -0
  191. data/maps/iso-rus-Cyrl-Latn-9-1995.imp +279 -0
  192. data/maps/iso-san-Deva-Latn-15919-2001.imp +215 -0
  193. data/maps/iso-tam-Taml-Latn-15919-2001.imp +153 -0
  194. data/maps/iso-tel-Telu-Latn-15919-2001.imp +214 -0
  195. data/maps/iso-tha-Thai-Latn-11940-1998.imp +114 -0
  196. data/maps/kp-kor-Hang-Latn-2002.imp +540 -0
  197. data/maps/lshk-yue-Hani-Latn-jyutping-1993.imp +29005 -0
  198. data/maps/masm-mon-Cyrl-Latn-5217-2012.imp +136 -0
  199. data/maps/masm-mon-Latn-Cyrl-5217-2012.imp +162 -0
  200. data/maps/mext-jpn-Hrkt-Latn-1954.imp +403 -0
  201. data/maps/moct-kor-Hang-Latn-2000.imp +475 -0
  202. data/maps/mofa-jpn-Hrkt-Latn-1989.imp +484 -0
  203. data/maps/mv-div-Thaa-Latn-1987.imp +144 -0
  204. data/maps/mvd-bel-Cyrl-Latn-2008.imp +224 -0
  205. data/maps/mvd-bel-Cyrl-Latn-2010.imp +64 -0
  206. data/maps/mvd-rus-Cyrl-Latn-2008.imp +110 -0
  207. data/maps/mvd-rus-Cyrl-Latn-2010.imp +40 -0
  208. data/maps/odni-ara-Arab-Latn-2004.imp +106 -0
  209. data/maps/odni-ara-Arab-Latn-2015.imp +281 -0
  210. data/maps/odni-aze-Cyrl-Latn-2015.imp +158 -0
  211. data/maps/odni-bel-Cyrl-Latn-2015.imp +138 -0
  212. data/maps/odni-bul-Cyrl-Latn-2005.imp +90 -0
  213. data/maps/odni-bul-Cyrl-Latn-2015.imp +103 -0
  214. data/maps/odni-che-Cyrl-Latn-2015.imp +165 -0
  215. data/maps/odni-fas-Arab-Latn-2004.imp +268 -0
  216. data/maps/odni-fas-Arab-Latn-2015.imp +398 -0
  217. data/maps/odni-hin-Deva-Latn-2004.imp +180 -0
  218. data/maps/odni-hin-Deva-Latn-2015.imp +256 -0
  219. data/maps/odni-kat-Geor-Latn-2015.imp +76 -0
  220. data/maps/odni-kaz-Cyrl-Latn-2015.imp +164 -0
  221. data/maps/odni-kir-Cyrl-Latn-2015.imp +149 -0
  222. data/maps/odni-kor-Hang-Latn-2015.imp +307 -0
  223. data/maps/odni-mkd-Cyrl-Latn-2005.imp +28 -0
  224. data/maps/odni-mkd-Cyrl-Latn-2015.imp +124 -0
  225. data/maps/odni-prs-Arab-Latn-2004.imp +120 -0
  226. data/maps/odni-prs-Arab-Latn-2015.imp +225 -0
  227. data/maps/odni-pus-Arab-Latn-2011.imp +327 -0
  228. data/maps/odni-rus-Cyrl-Latn-2015.imp +79 -0
  229. data/maps/odni-srp-Cyrl-Latn-2005.imp +35 -0
  230. data/maps/odni-srp-Cyrl-Latn-2015.imp +130 -0
  231. data/maps/odni-tat-Cyrl-Latn-2015.imp +157 -0
  232. data/maps/odni-tgk-Cyrl-Latn-2015.imp +161 -0
  233. data/maps/odni-tuk-Cyrl-Latn-2015.imp +159 -0
  234. data/maps/odni-uig-Cyrl-Latn-2015.imp +151 -0
  235. data/maps/odni-ukr-Cyrl-Latn-2015.imp +136 -0
  236. data/maps/odni-urd-Arab-Latn-2015.imp +220 -0
  237. data/maps/odni-uzb-Cyrl-Latn-2015.imp +165 -0
  238. data/maps/sac-zho-Hans-Latn-1979.imp +20940 -0
  239. data/maps/sasm-mon-Mong-Latn-general-1978.imp +294 -0
  240. data/maps/sasm-mon-Mong-Latn-phonetic-1978.imp +261 -0
  241. data/maps/ses-ara-Arab-Latn-1930.imp +225 -0
  242. data/maps/stategeocadastre-ukr-Cyrl-Latn-1993.imp +171 -0
  243. data/maps/ua-ukr-Cyrl-Latn-1996.imp +149 -0
  244. data/maps/ua-ukr-Cyrl-Latn-2007.imp +69 -0
  245. data/maps/ua-ukr-Cyrl-Latn-2010.imp +128 -0
  246. data/maps/un-amh-Ethi-Latn-2016.imp +483 -0
  247. data/maps/un-ara-Arab-Latn-1971.imp +137 -0
  248. data/maps/un-ara-Arab-Latn-1972.imp +155 -0
  249. data/maps/un-ara-Arab-Latn-2017.imp +375 -0
  250. data/maps/un-asm-Beng-Latn-1972.imp +188 -0
  251. data/maps/un-bel-Cyrl-Latn-2007.imp +78 -0
  252. data/maps/un-ben-Beng-Latn-2016.imp +516 -0
  253. data/maps/un-ell-Grek-Latn-1987-phonetic.imp +437 -0
  254. data/maps/un-ell-Grek-Latn-1987-tl.imp +27 -0
  255. data/maps/un-ell-Grek-Latn-1987-ts.imp +269 -0
  256. data/maps/un-guj-Gujr-Latn-1972.imp +196 -0
  257. data/maps/un-hin-Deva-Latn-2016.imp +356 -0
  258. data/maps/un-kan-Kana-Latn-2016.imp +214 -0
  259. data/maps/un-mal-Mlym-Latn-1972.imp +215 -0
  260. data/maps/un-mar-Deva-Latn-2016.imp +96 -0
  261. data/maps/un-mon-Mong-Latn-general-2013.imp +170 -0
  262. data/maps/un-mon-Mong-Latn-phonetic-2013.imp +170 -0
  263. data/maps/un-nep-Deva-Latn-1972.imp +295 -0
  264. data/maps/un-nep-Deva-Latn-2013.imp +62 -0
  265. data/maps/un-ori-Orya-Latn-1972.imp +208 -0
  266. data/maps/un-pan-Guru-Latn-1972.imp +321 -0
  267. data/maps/un-prs-Arab-Latn-1967.imp +214 -0
  268. data/maps/un-rus-Cyrl-Latn-1987.imp +96 -0
  269. data/maps/un-sin-Sinh-Latn-1972.imp +193 -0
  270. data/maps/un-tam-Taml-Latn-1972.imp +173 -0
  271. data/maps/un-tel-Telu-Latn-1972.imp +229 -0
  272. data/maps/un-ukr-Cyrl-Latn-1998.imp +58 -0
  273. data/maps/un-ukr-Cyrl-Latn-2012.imp +95 -0
  274. data/maps/un-urd-Arab-Latn-1972.imp +290 -0
  275. data/maps/var-amh-Ethi-Latn-eae-2003.imp +414 -0
  276. data/maps/var-gez-Ethi-Latn-eae-2003.imp +54 -0
  277. data/maps/var-hin-Deva-Latn-hunterian-1872.imp +212 -0
  278. data/maps/var-jpn-Hrkt-Latn-hepburn-1886.imp +399 -0
  279. data/maps/var-jpn-Hrkt-Latn-hepburn-1954.imp +382 -0
  280. data/maps/var-kor-Hang-Hang-jamo.imp +11196 -0
  281. data/maps/var-kor-Hang-Latn-mr-1939.imp +574 -0
  282. data/maps/var-kor-Kore-Hang-2013.imp +59764 -0
  283. data/maps/var-kor-Kore-Latn-mr-1939.imp +36 -0
  284. data/maps/var-mar-Deva-Latn-hunterian-1872.imp +39 -0
  285. data/maps/var-mon-Mong-Latn-1930.imp +101 -0
  286. data/maps/var-mon-Mong-Latn-lessing.imp +181 -0
  287. data/maps/var-mon-Mong-Latn-vpmc.imp +182 -0
  288. data/maps/var-pra-Deva-Latn-iast-1912.imp +36 -0
  289. data/maps/var-san-Deva-Latn-iast-1912.imp +147 -0
  290. data/maps/var-zho-Hani-Latn-wd-1979.imp +27549 -0
  291. metadata +335 -0
@@ -0,0 +1,165 @@
1
+ metadata {
2
+ authority_id: bgnpcgn
3
+ id: 2002
4
+ language: iso-639-2:ron
5
+ source_script: Cyrl
6
+ destination_script: Latn
7
+ name: CYRILLIC - ROMAN BGN/PCGN 2002 Agreement
8
+ url: https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/816780/TABLE_OF_CORRESPONDENCES_FOR_MOLDOVAN.pdf
9
+ creation_date: 2002
10
+ confirmation_date: 2019
11
+ description: |
12
+ In 1990, the Moldovan authorities adopted the Roman alphabet to replace the existing Cyrillic
13
+ alphabet. The presentation below provides a table of correspondences between the former Cyrillic alphabet
14
+ and the current Roman alphabet. When Moldovan Roman-alphabet spellings are not available, this table
15
+ can be used to convert Moldovan Cyrillic spellings. It should be noted that Moldovan is little used as a
16
+ language label now, and is usually considered as Romanian.
17
+
18
+ notes:
19
+ - | # 1
20
+ This Roman-script form is used before e, i and iu.
21
+
22
+ - | # 2
23
+ This Roman-script form is used before a.
24
+
25
+ - | # 3
26
+ The letter ‘i’ is used to represent Ь at the end of a word.
27
+
28
+ - | # 4
29
+ An inventory of letter-diacritic combinations, with their Unicode encoding, in addition to the
30
+ unmodified letters of the basic Roman script is:
31
+ Ț (U+021A) ț (U+021B)
32
+ Ș (U+0218) ș (U+0219)
33
+ Î (U+00CE) î (U+00EE)
34
+ Ă (U+0102) ă (U+0103)
35
+
36
+ - | # 5
37
+ The Roman-script columns show only lowercase forms but, when applying the table, uppercase and
38
+ lowercase Roman letters as appropriate should be used.
39
+ }
40
+
41
+ tests {
42
+ # https://www.tourister.ru/world/europe/moldova-republic-of/publications/507
43
+ test "Бунэ диминеа'ца!", "Bună diminea'ţa!"
44
+ test "Ну неам вэзут де ун кар де ань!", "Nu neam văzut de un car de ani!" # note[3]
45
+ test "Перми'тецимь сэ вэ салут ын нумеле...", "Permi'teţimi să vă salut în numele..." # note[3]
46
+ test "Сэ фий сэнэтос!", "Să fii sănătos!"
47
+ test "Ку ун груп де туришть", "Cu un grup de turişti" # note[3]
48
+ test "Пе соци'я меа", "Pe soţi'ea mea"
49
+ test "хотелул", "hotelul"
50
+ test "Че са ынтымплат?", "Ce sa întîmplat?"
51
+ test "Драджь", "Dradzhi" # note[3]
52
+ test "Че есте ачаста?", "Ce este aceasta?" # note[1] note[2]
53
+ test "черюрй", "ceriuri" # note[1]
54
+ test "феричире!", "fericire!"
55
+ test "ӂэужык", "giăuzhîc"
56
+
57
+ test "БУНЭ ДИМИНЕА'ЦА!", "BUNĂ DIMINEA'ŢA!"
58
+ test "НУ НЕАМ ВЭЗУТ ДЕ УН КАР ДЕ АНЬ!", "NU NEAM VĂZUT DE UN CAR DE ANI!" # note[3]
59
+ test "ПЕРМИ'ТЕЦИМЬ СЭ ВЭ САЛУТ ЫН НУМЕЛЕ...", "PERMI'TEŢIMI SĂ VĂ SALUT ÎN NUMELE..." # note[3]
60
+ test "СЭ ФИЙ СЭНЭТОС!", "SĂ FII SĂNĂTOS!"
61
+ test "КУ УН ГРУП ДЕ ТУРИШТЬ", "CU UN GRUP DE TURIŞTI" # note[3]
62
+ test "ПЕ СОЦИ'Я МЕА", "PE SOŢI'EA MEA"
63
+ test "ХОТЕЛУЛ", "HOTELUL"
64
+ test "ЧЕ СА ЫНТЫМПЛАТ?", "CE SA ÎNTÎMPLAT?"
65
+ test "ДРАДЖЬ", "DRADZHI" # note[3]
66
+ test "ЧЕ ЕСТЕ АЧАСТА?", "CE ESTE ACEASTA?" # note[1] note[2]
67
+ test "ЧЕРЮРЙ", "CERIURI" # note[1]
68
+ test "ФЕРИЧИРЕ!", "FERICIRE!"
69
+ test "Ӂэужык", "GIăuzhîc"
70
+ }
71
+
72
+ stage {
73
+
74
+ # RULES
75
+ # note[1]
76
+ sub "\u0413", "Gh", after: any("ЕеИиЙйЮю") # Г[ЕеИиЙйЮю]
77
+ sub "\u0433", "gh", after: any("ЕеИиЙйЮю") # г[ЕеИиЙйЮю]
78
+ sub "\u04C1", "Gh", after: any("ЕеИиЙйЮю") # Ӂ[ЕеИиЙйЮю]
79
+ sub "\u04C1", "gh", after: any("ЕеИиЙйЮю") # ӂ[ЕеИиЙйЮю]
80
+ sub "\u041A", "Ch", after: any("ЕеИиЙйЮю") # К[ЕеИиЙйЮю]
81
+ sub "\u043A", "ch", after: any("ЕеИиЙйЮю") # к[ЕеИиЙйЮю]
82
+ sub "\u0427", "C", after: any("ЕеИиЙйЮю") # Ч[ЕеИиЙйЮю]
83
+ sub "\u0447", "c", after: any("ЕеИиЙйЮю") # ч[ЕеИиЙйЮю]
84
+
85
+ # note[2]
86
+ sub "\u04C1", "Ge", after: any("Аа") # Ӂ[Aa]
87
+ sub "\u04C1", "ge", after: any("Аа") # ӂ[Aa]
88
+ sub "\u0427", "CE", after: any("А") # Ч[A]
89
+ sub "\u0427", "Ce", after: any("а") # Ч[a]
90
+ sub "\u0447", "ce", after: any("Аа") # ч[Aa]
91
+
92
+ # note[3]
93
+ sub "\u042C", "I", after: boundary # Ь$
94
+ sub "\u044C", "i", after: boundary # ь$
95
+
96
+
97
+ # CHARACTERS
98
+ parallel {
99
+ sub "\u0410", "A" # А
100
+ sub "\u0411", "B" # Б
101
+ sub "\u0412", "V" # B
102
+ sub "\u0413", "G" # Г note[1]
103
+ sub "\u0414", "D" # Д
104
+ sub "\u0415", "E" # Е
105
+ sub "\u0416", "ZH" # Ж
106
+ sub "\u04C1", "GI" # Ӂ note[1] note[2]
107
+ sub "\u0417", "Z" # З
108
+ sub "\u0418", "I" # И
109
+ sub "\u0419", "I" # Й
110
+ sub "\u041A", "C" # К note[1]
111
+ sub "\u041B", "L" # Л
112
+ sub "\u041C", "M" # М
113
+ sub "\u041D", "N" # Н
114
+ sub "\u041E", "O" # О
115
+ sub "\u041F", "P" # П
116
+ sub "\u0420", "R" # Р
117
+ sub "\u0421", "S" # С
118
+ sub "\u0422", "T" # Т
119
+ sub "\u0423", "U" # У
120
+ sub "\u0424", "F" # Ф
121
+ sub "\u0425", "H" # Х
122
+ sub "\u0426", "Ţ" # Ц
123
+ sub "\u0427", "CI" # Ч note[1] note[2]
124
+ sub "\u0428", "Ş" # Ш
125
+ sub "\u042B", "Î" # Ы
126
+ sub "\u042C", "’" # Ь note[3]
127
+ sub "\u042D", "Ă" # Э
128
+ sub "\u042E", "IU" # Ю
129
+ sub "\u042F", "EA" # Я
130
+
131
+ sub "\u0430", "a" # а
132
+ sub "\u0431", "b" # б
133
+ sub "\u0432", "v" # b
134
+ sub "\u0433", "g" # г note[1]
135
+ sub "\u0434", "d" # д
136
+ sub "\u0435", "e" # е
137
+ sub "\u0436", "zh" # ж
138
+ sub "\u04C2", "gi" # ӂ note[1] note[2]
139
+ sub "\u0437", "z" # з
140
+ sub "\u0438", "i" # и
141
+ sub "\u0439", "i" # й
142
+ sub "\u043A", "c" # к note[1]
143
+ sub "\u043B", "l" # л
144
+ sub "\u043C", "m" # м
145
+ sub "\u043D", "n" # н
146
+ sub "\u043E", "o" # о
147
+ sub "\u043F", "p" # п
148
+ sub "\u0440", "r" # р
149
+ sub "\u0441", "s" # с
150
+ sub "\u0442", "t" # т
151
+ sub "\u0443", "u" # у
152
+ sub "\u0444", "f" # ф
153
+ sub "\u0445", "h" # х
154
+ sub "\u0446", "ţ" # ц
155
+ sub "\u0447", "ci" # ч note[1] note[2]
156
+ sub "\u0448", "ş" # ш
157
+ sub "\u044B", "î" # ы
158
+ sub "\u044C", "’" # ь note[3]
159
+ sub "\u044D", "ă" # э
160
+ sub "\u044E", "iu" # ю
161
+ sub "\u044F", "ea" # я
162
+ }
163
+
164
+ }
165
+
@@ -0,0 +1,133 @@
1
+ metadata {
2
+ authority_id: bgnpcgn
3
+ id: 2016
4
+ language: iso-639-2:rue
5
+ source_script: Cyrl
6
+ destination_script: Latn
7
+ name: ROMANIZATION OF RUSYN, BGN/PCGN 2016 System
8
+ url: https://geonames.nga.mil/gns/html/Romanization/ROMANIZATION%20OF%20RUSYN.pdf
9
+ creation_date: 2016
10
+ confirmation_date: 2017
11
+ description: |
12
+ The BGN/PCGN system for Rusyn was designed for use in romanizing names written in the Rusyn
13
+ alphabet. There are two primary dialects of the Rusyn language: Carpatho‐Rusyn and Pannonian Rusyn.
14
+ The Rusyn alphabet is almost identical to the Ukrainian alphabet, but contains three characters not
15
+ present in the Ukrainian alphabet: ё, ы, and ъ. These letters are also absent from the alphabet used by
16
+ Pannonian Rusyn. This table applies to both dialects of Rusyn.
17
+
18
+ notes:
19
+ - |
20
+ The letters ё, ы, and ъ are present in the orthography of the Carpatho‐Rusyn variant of the Rusyn
21
+ language. This variant is predominant among Rusyn speakers in Ukraine, Poland, Slovakia, Hungary, and
22
+ Romania. The letters are absent from the orthography of Pannonian Rusyn, which is predominant in
23
+ Serbia and Croatia.
24
+
25
+ - |
26
+ Unicode for Latin‐script characters: Ž/ž (017D, 017E); Č/č (010C, 010D); Š/š (0160, 0161); ’ (0027).
27
+
28
+ - |
29
+ The Romanization columns show only lowercase forms but, when romanizing, uppercase and
30
+ lowercase Roman letters as appropriate should be used.
31
+ }
32
+
33
+ tests {
34
+ # Based on https://ru.wikipedia.org/wiki/Русинский_язык#Примеры_текста
35
+ test "русиньскый язык", "rusyn'skyj yazyk"
36
+ test "руська бисіда", "rus'ka bysida"
37
+ test "руснацькый язык", "rusnac'kyj yazyk"
38
+ test "руски язик", "rusky yazyk"
39
+ test "Чоловік найчастїше споминать на молоды часы. Є то цалком нормалне.\nТадь то рокы, кідь зазнаме всякого. І доброго, і планого. В тім часї ся чоловік находить, як кібы в скаралущі.\nРозвивать ся, як цвіт на черешни. Выпхати ся мож з того обалу лем тогды, як прийде час, кідь цалком дозріє.\nДаколи стачіть ся неограбаным способом дотулити білого домику, такой ся пораниш, што ті буде тякнути на цілый жывот.\nА кідь ся народиш в теплї, обколесеный ласков, розвиваш ся в добрых условіях, выпадеш із скаралущі, як міцна істота.\nТакым потім буде і твій далшый жывот. Із добрї заложеным фундаментом. Было бы смішно сі робити надїй, же жывот є лем єдна рівна путь…\nКібы то так чоловік знав… Кібы ся міг іщі раз народити і піти по тій істій пути…", "Čolovik najčastjiše spomynat' na molody časy. Je to calkom normalne.\nTad' to roky, kid' zazname vsyakogo. I dobrogo, i planogo. V tim časji sya čolovik nachodyt', yak kiby v skaralušči.\nRozvyvat' sya, yak cvit na čerešny. Vypchaty sya mož z togo obalu lem togdy, yak pryjde čas, kid' calkom dozrije.\nDakoly stačit' sya neograbanym sposobom dotulyty bilogo domyku, takoj sya poranyš, što ti bude tyaknuty na cilyj žyvot.\nA kid' sya narodyš v teplji, obkolesenyj laskov, rozvyvaš sya v dobrych usloviyach, vypadeš iz skaralušči, yak micna istota.\nTakym potim bude i tvij dalšyj žyvot. Iz dobrji založenym fundamentom. Bylo by smišno si robyty nadjij, že žyvot je lem jedna rivna put'…\nKiby to tak čolovik znav… Kiby sya mig išči raz narodyty i pity po tij istij puty…"
40
+ # Based on http://www.philology.ru/linguistics3/suprun-89.htm
41
+ test "Вишло слунко красне, ясне,\nи цму швета розогнало -\nжем желену, били хмарки\nяк зоз златом да обцагло.", "Vyšlo slunko krasne, yasne,\ny cmu šveta rozognalo -\nžem želenu, byly chmarky\nyak zoz zlatom da obcaglo."
42
+ test "шнїг", "šnjig"
43
+ test "жем", "žem"
44
+ test "дзень", "dzen'"
45
+ test "спомнуц", "spomnuc"
46
+ test "крава", "krava"
47
+ # Based on https://lingvoforum.net/index.php?topic=43545.0
48
+ test "дївка", "djivka"
49
+ test "дрыв", "dryv"
50
+ test "фёрд", "fjord"
51
+ test "Ёзеф", "Jozef"
52
+ test "пастырї", "pastyrji"
53
+ }
54
+
55
+ stage {
56
+
57
+ # CHARACTERS
58
+ parallel {
59
+ sub "А", "A" # А
60
+ sub "Б", "B" # Б
61
+ sub "В", "V" # В
62
+ sub "Г", "H" # Г
63
+ sub "Д", "D" # Д
64
+ sub "Е", "E" # Е
65
+ sub "Є", "Je" # Є
66
+ sub "Ё", "Jo" # Ё
67
+ sub "Ж", "Ž" # Ж => Ž note[2]
68
+ sub "З", "Z" # З
69
+ sub "И", "Y" # И
70
+ sub "І", "I" # І
71
+ sub "Ы", "Y" # Ы
72
+ sub "Ї", "Ji" # Ї
73
+ sub "Й", "J" # Й
74
+ sub "К", "K" # К
75
+ sub "Л", "L" # Л
76
+ sub "М", "M" # М
77
+ sub "Н", "N" # Н
78
+ sub "О", "O" # О
79
+ sub "П", "P" # П
80
+ sub "Р", "R" # Р
81
+ sub "С", "S" # С
82
+ sub "Т", "T" # Т
83
+ sub "У", "U" # У
84
+ sub "Ф", "F" # Ф
85
+ sub "Х", "Ch" # Х
86
+ sub "Ц", "C" # Ц
87
+ sub "Ч", "Č" # Ч => Č note[2]
88
+ sub "Ш", "Š" # Ш => Š note[2]
89
+ sub "Щ", "ŠČ" # Щ => ŠČ
90
+ sub "Ю", "Yu" # Ю
91
+ sub "Я", "Ya" # Я
92
+ sub "Ь", "'" # Ь => '
93
+ sub "Ъ", "'" # Ъ => '
94
+
95
+ sub "а", "a" # а
96
+ sub "б", "b" # б
97
+ sub "в", "v" # в
98
+ sub "г", "g" # г
99
+ sub "д", "d" # д
100
+ sub "е", "e" # е
101
+ sub "є", "je" # є
102
+ sub "ё", "jo" # ё
103
+ sub "ж", "ž" # ж => ž note[2]
104
+ sub "з", "z" # з
105
+ sub "и", "y" # и
106
+ sub "і", "i" # і
107
+ sub "ы", "y" # ы
108
+ sub "ї", "ji" # ї
109
+ sub "й", "j" # й
110
+ sub "к", "k" # к
111
+ sub "л", "l" # л
112
+ sub "м", "m" # м
113
+ sub "н", "n" # н
114
+ sub "о", "o" # о
115
+ sub "п", "p" # п
116
+ sub "р", "r" # р
117
+ sub "с", "s" # с
118
+ sub "т", "t" # т
119
+ sub "у", "u" # у
120
+ sub "ф", "f" # ф
121
+ sub "х", "ch" # х
122
+ sub "ц", "c" # ц
123
+ sub "ч", "č" # ч => č note[2]
124
+ sub "ш", "š" # ш => š note[2]
125
+ sub "щ", "šč" # щ => šč
126
+ sub "ю", "yu" # ю
127
+ sub "я", "ya" # я
128
+ sub "ь", "'" # ь => '
129
+ sub "ъ", "'" # ъ => '
130
+ }
131
+
132
+ }
133
+
@@ -0,0 +1,195 @@
1
+ metadata {
2
+ authority_id: bgnpcgn
3
+ id: 1947
4
+ language: iso-639-2:rus
5
+ source_script: Cyrl
6
+ destination_script: Latn
7
+ name: ROMANIZATION OF RUSSIAN, BGN/PCGN 1947 System
8
+ url: https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/807920/ROMANIZATION_OF_RUSSIAN.pdf
9
+ creation_date: 1947
10
+ confirmation_date: 2019-06
11
+ description: |
12
+ The BGN/PCGN system for Russian was adopted by the BGN in 1944 and by the
13
+ PCGN in 1947 for use in romanizing names written in the Russian Cyrillic
14
+ alphabet.
15
+
16
+ notes:
17
+ - The character e should be romanized ye initially, after the vowel
18
+ characters a, e, ё, и, о, у, ы, э, ю, and я, and after й, ъ, and ь. In
19
+ all other instances, it should be romanized e.
20
+
21
+ - The character ё is not considered a separate character of the
22
+ Russian alphabet and the dieresis is generally not shown. When the
23
+ dieresis is shown, the character should be romanized yë initially,
24
+ after the vowel characters a, e, ё, и, о, у, ы, э, ю, and я, and after
25
+ й, ъ, and ь. In all other instances, it should be romanized ё. When the
26
+ dieresis is not shown, the character may still be romanized in the
27
+ preceding manner or, alternatively, in accordance with note 1.
28
+
29
+ - |
30
+ Unusual Russian character sequences occurring primarily in
31
+ non-Russian-language names may be romanized as shown below in order to
32
+ provide differentiation from regularly- occurring digraphs and
33
+ character sequences.
34
+ й before а, у, ы, or э у·
35
+ ы before а, у, ы, or э у·
36
+ ы after any vowel character ·у
37
+ э after any consonant character except й ·е
38
+ TC t·s шч sh·ch
39
+
40
+ - Unicode values are shown with the uppercase Cyrillic character first,
41
+ followed by the lowercase character.
42
+
43
+ - |
44
+ An inventory of letter-diacritic combinations, with their Unicode
45
+ encoding, in addition to the unmodified letters of the basic Roman
46
+ script is:
47
+ All apostrophes appearing in romanization are U+2019 Ë (U+00CB)
48
+ ë (U+00EB)
49
+ - The Romanization column shows only lowercase forms but, when
50
+ romanizing, uppercase and lowercase Roman letters as appropriate should
51
+ be used.
52
+ }
53
+
54
+ tests {
55
+ test "Выборы депутатов Государственной Думы Федерального Собрания Российской Федерации седьмого созыва\nДата голосования: 18.09.2016\n\nНаименование Избирательной комиссии: ЦИК России\n\nСводная таблица результатов выборов по федеральному избирательному округу\n\n\nЧисло избирателей, внесенных в список избирателей на момент окончания голосования\nЧисло избирательных бюллетеней, полученных участковой избирательной комиссией\nЧисло избирательных бюллетеней, выданных избирателям, проголосовавшим досрочно\nЧисло избирательных бюллетеней, выданных в помещении для голосования в день голосования\nЧисло избирательных бюллетеней, выданных вне помещения для голосования в день голосования\nЧисло погашенных избирательных бюллетеней\nЧисло избирательных бюллетеней, содержащихся в переносных ящиках для голосования\nЧисло избирательных бюллетеней, содержащихся в стационарных ящиках для голосования\nЧисло недействительных избирательных бюллетеней\nЧисло действительных избирательных бюллетеней\nЧисло открепительных удостоверений, полученных участковой избирательной комиссией\nЧисло открепительных удостоверений, выданных на избирательном участке до дня голосования\nЧисло избирателей, проголосовавших по открепительным удостоверениям на избирательном участке\nЧисло погашенных неиспользованных открепительных удостоверений\nЧисло открепительных удостоверений, выданных избирателям территориальной избирательной комиссией\nЧисло утраченных открепительных удостоверений\nЧисло утраченных избирательных бюллетеней\nЧисло избирательных бюллетеней, не учтенных при получении\n1. ВСЕРОССИЙСКАЯ ПОЛИТИЧЕСКАЯ ПАРТИЯ \"РОДИНА\"\n2. Политическая партия КОММУНИСТИЧЕСКАЯ ПАРТИЯ КОММУНИСТЫ РОССИИ\n3. Политическая партия \"Российская партия пенсионеров за справедливость\"\n4. Всероссийская политическая партия \"ЕДИНАЯ РОССИЯ\"\n5. Политическая партия \"Российская экологическая партия \"Зеленые\"\n6. Политическая партия \"Гражданская Платформа\"\n7. Политическая партия ЛДПР - Либерально-демократическая партия России\n8. Политическая партия \"Партия народной свободы\" (ПАРНАС)\n9. Всероссийская политическая партия \"ПАРТИЯ РОСТА\"\n10. Общественная организация Всероссийская политическая партия \"Гражданская Сила\"\n11. Политическая партия \"Российская объединенная демократическая партия \"ЯБЛОКО\"\n12. Политическая партия \"КОММУНИСТИЧЕСКАЯ ПАРТИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ\"\n13. Политическая партия \"ПАТРИОТЫ РОССИИ\"\n14. Политическая партия СПРАВЕДЛИВАЯ РОССИЯ\n\nДанные окружных избирательных комиссий о числе открепительных удостоверений\n\n\nЧисло открепительных удостоверений, полученных окружной избирательной комиссией\nЧисло открепительных удостоверений, выданных территориальным избирательным комиссиям\nЧисло неиспользованных открепительных удостоверений, погашенных окружной избирательной комиссией\nЧисло открепительных удостоверений, утраченных в окружной избирательной комиссии", "Vybory deputatov Gosudarstvennoy Dumy Federal’nogo Sobraniya Rossiyskoy Federatsii sed’mogo sozyva\nData golosovaniya: 18.09.2016\n\nNaimenovaniye Izbiratel’noy komissii: TSIK Rossii\n\nSvodnaya tablitsa rezul’tatov vyborov po federal’nomu izbiratel’nomu okrugu\n\n\nChislo izbirateley, vnesennykh v spisok izbirateley na moment okonchaniya golosovaniya\nChislo izbiratel’nykh byulleteney, poluchennykh uchastkovoy izbiratel’noy komissiyey\nChislo izbiratel’nykh byulleteney, vydannykh izbiratelyam, progolosovavshim dosrochno\nChislo izbiratel’nykh byulleteney, vydannykh v pomeshchenii dlya golosovaniya v den’ golosovaniya\nChislo izbiratel’nykh byulleteney, vydannykh vne pomeshcheniya dlya golosovaniya v den’ golosovaniya\nChislo pogashennykh izbiratel’nykh byulleteney\nChislo izbiratel’nykh byulleteney, soderzhashchikhsya v perenosnykh yashchikakh dlya golosovaniya\nChislo izbiratel’nykh byulleteney, soderzhashchikhsya v statsionarnykh yashchikakh dlya golosovaniya\nChislo nedeystvitel’nykh izbiratel’nykh byulleteney\nChislo deystvitel’nykh izbiratel’nykh byulleteney\nChislo otkrepitel’nykh udostovereniy, poluchennykh uchastkovoy izbiratel’noy komissiyey\nChislo otkrepitel’nykh udostovereniy, vydannykh na izbiratel’nom uchastke do dnya golosovaniya\nChislo izbirateley, progolosovavshikh po otkrepitel’nym udostovereniyam na izbiratel’nom uchastke\nChislo pogashennykh neispol’zovannykh otkrepitel’nykh udostovereniy\nChislo otkrepitel’nykh udostovereniy, vydannykh izbiratelyam territorial’noy izbiratel’noy komissiyey\nChislo utrachennykh otkrepitel’nykh udostovereniy\nChislo utrachennykh izbiratel’nykh byulleteney\nChislo izbiratel’nykh byulleteney, ne uchtennykh pri poluchenii\n1. VSEROSSIYSKAYA POLITICHESKAYA PARTIYA \"RODINA\"\n2. Politicheskaya partiya KOMMUNISTICHESKAYA PARTIYA KOMMUNISTY ROSSII\n3. Politicheskaya partiya \"Rossiyskaya partiya pensionerov za spravedlivost’\"\n4. Vserossiyskaya politicheskaya partiya \"YEDINAYA ROSSIYA\"\n5. Politicheskaya partiya \"Rossiyskaya ekologicheskaya partiya \"Zelenyye\"\n6. Politicheskaya partiya \"Grazhdanskaya Platforma\"\n7. Politicheskaya partiya LDPR - Liberal’no-demokraticheskaya partiya Rossii\n8. Politicheskaya partiya \"Partiya narodnoy svobody\" (PARNAS)\n9. Vserossiyskaya politicheskaya partiya \"PARTIYA ROSTA\"\n10. Obshchestvennaya organizatsiya Vserossiyskaya politicheskaya partiya \"Grazhdanskaya Sila\"\n11. Politicheskaya partiya \"Rossiyskaya ob\"yedinennaya demokraticheskaya partiya \"YABLOKO\"\n12. Politicheskaya partiya \"KOMMUNISTICHESKAYA PARTIYA ROSSIYSKOY FEDERATSII\"\n13. Politicheskaya partiya \"PATRIOTY ROSSII\"\n14. Politicheskaya partiya SPRAVEDLIVAYA ROSSIYA\n\nDannyye okruzhnykh izbiratel’nykh komissiy o chisle otkrepitel’nykh udostovereniy\n\n\nChislo otkrepitel’nykh udostovereniy, poluchennykh okruzhnoy izbiratel’noy komissiyey\nChislo otkrepitel’nykh udostovereniy, vydannykh territorial’nym izbiratel’nym komissiyam\nChislo neispol’zovannykh otkrepitel’nykh udostovereniy, pogashennykh okruzhnoy izbiratel’noy komissiyey\nChislo otkrepitel’nykh udostovereniy, utrachennykh v okruzhnoy izbiratel’noy komissii"
56
+ test "ДЛИННОЕ ПОКРЫВАЛО", "DLINNOYE POKRYVALO"
57
+ test "Еловая шишка", "Yelovaya shishka"
58
+ test "ЕЛОВАЯ ШИШКА", "YELOVAYA SHISHKA"
59
+ test "Длинное покрывало", "Dlinnoye pokryvalo"
60
+ test "В лесу еловые шишки", "V lesu yelovyye shishki"
61
+ test "OН ВИДЕЛ ЕЁ В ПЕРВЫЙ РАЗ", "ON VIDEL YEYË V PERVYY RAZ"
62
+ test "Ёж колючий", "Yëzh kolyuchiy"
63
+ test "ЁЖ КОЛЮЧИЙ", "YËZH KOLYUCHIY"
64
+ test "Он видел её в первый раз", "On videl yeyë v pervyy raz"
65
+ test "У ёжа колючки", "U yëzha kolyuchki"
66
+ test "ЙА Йа йа", "Y·A Y·a y·a"
67
+ test "ЫУ Ыу ыу", "Y·U Y·u y·u"
68
+ test "ОЫ Оы оы", "O·Y O·y o·y"
69
+ test "ОЫУ Оыу оыу", "O·Y·U O·y·u o·y·u"
70
+ test "СЭ Сэ сэ", "S·E S·e s·e"
71
+ test "ТС тс Тс тС", "T·S t·s T·s t·S"
72
+ test "ШЧ шч Шч шЧ", "SH·CH sh·ch Sh·ch sh·Ch"
73
+ }
74
+
75
+ aliases {
76
+ def_alias rus_extvowel, any("АаЕеЁёИиОоУуЫыЭэЮюЯяЙйЪъЬь")
77
+ def_alias rus_vowel, any("АаЕеЁёИиОоУуЫыЭэЮюЯя")
78
+ def_alias rus_limvowel, any("АаУуЫыЭэ")
79
+ def_alias rus_cons, any("БбВвГгДдЖжЗзКкЛлМмНнПпРрСсТтФфХхЦцЧчШшЩщ")
80
+
81
+ def_alias rus_latupper, any([any("A".."Z"), any("Ë")])
82
+
83
+ def_alias rus_multichar, any(["Ye", "Yë", "Sh", "Ch", "Shch", "Ya", "Zh", "Yu", "Ts"])
84
+ }
85
+
86
+ stage {
87
+
88
+ # RULES
89
+ sub "\u0401", "Yë", before: rus_extvowel # Ё after a, e, ё, и, о, у, ы, э, ю, я, й, ъ, ь
90
+ sub "\u0451", "yë", before: rus_extvowel # ё after a, e, ё, и, о, у, ы, э, ю, я, й, ъ, ь
91
+ sub "\u0415", "YЕ", before: rus_extvowel # Е after a, e, ё, и, о, у, ы, э, ю, я, й, ъ, ь
92
+ sub "\u0415", "Yе", before: boundary # Е initially
93
+ sub "\u0435", "yе", before: rus_extvowel # е after a, e, ё, и, о, у, ы, э, ю, я, й, ъ, ь
94
+ sub "\u0435", "yе", before: boundary # е initially
95
+ sub "\u0401", "Yë", before: rus_extvowel # Ё after a, e, ё, и, о, у, ы, э, ю, я, й, ъ, ь
96
+ sub "\u0401", "Yë", before: boundary
97
+ sub "\u0451", "yë", before: rus_extvowel # ё after a, e, ё, и, о, у, ы, э, ю, я, й, ъ, ь
98
+ sub "\u0451", "yë", before: boundary
99
+ sub "\u0419", "Y·", after: rus_limvowel # Й before а, у, ы, or э
100
+ sub "\u0439", "y·", after: rus_limvowel # й before а, у, ы, or э
101
+ sub "\u042b", "·Y·", before: rus_vowel, after: rus_limvowel # Ы after any vowel character and before а, у, ы, or э
102
+ sub "\u044b", "·y·", before: rus_vowel, after: rus_limvowel # ы after any vowel character and before а, у, ы, or э
103
+ sub "\u042b", "Ы·", after: rus_limvowel # Ы before а, у, ы, or э
104
+ sub "\u044b", "ы·", after: rus_limvowel # ы before а, у, ы, or э
105
+ sub "\u042b", "·Y", before: any("Оо") # Ы after о
106
+ sub "\u044b", "·y", before: any("Оо") # ы after о
107
+ sub "\u0401", "Yë", before: boundary
108
+ sub "\u0451", "yë", before: boundary
109
+ sub "\u042d", "·E", before: rus_cons # Э after any consonant character except й
110
+ sub "\u044d", "·e", before: rus_cons # э after any consonant character except й
111
+ sub none, "·", before: any("Тт"), after: any("Сс") # тс => t·s
112
+ sub none, "·", before: any("Шш"), after: any("Чч") # шч => sh·ch
113
+
114
+ # CHARACTERS
115
+ parallel {
116
+ sub "А", "A"
117
+ sub "Б", "B"
118
+ sub "В", "V"
119
+ sub "Г", "G"
120
+ sub "Д", "D"
121
+ sub "Е", "E"
122
+ sub "Ё", "Ë" # Ё
123
+ sub "Ж", "Zh"
124
+ sub "З", "Z"
125
+ sub "И", "I"
126
+ sub "Й", "Y"
127
+ sub "К", "K"
128
+ sub "Л", "L"
129
+ sub "М", "M"
130
+ sub "Н", "N"
131
+ sub "О", "O"
132
+ sub "П", "P"
133
+ sub "Р", "R"
134
+ sub "С", "S"
135
+ sub "Т", "T"
136
+ sub "У", "U"
137
+ sub "Ф", "F"
138
+ sub "Х", "Kh"
139
+ sub "Ц", "Ts"
140
+ sub "Ч", "Ch"
141
+ sub "Ш", "Sh"
142
+ sub "Щ", "Shch"
143
+ sub "Ъ", "\"" # Ъ
144
+ sub "Ы", "Y"
145
+ sub "Ь", "’" # Ь => ’
146
+ sub "Э", "E"
147
+ sub "Ю", "Yu"
148
+ sub "Я", "Ya"
149
+ sub "а", "a"
150
+ sub "б", "b"
151
+ sub "в", "v"
152
+ sub "г", "g"
153
+ sub "д", "d"
154
+ sub "е", "e"
155
+ sub "ё", "ë" # ё
156
+ sub "ж", "zh"
157
+ sub "з", "z"
158
+ sub "и", "i"
159
+ sub "й", "y"
160
+ sub "к", "k"
161
+ sub "л", "l"
162
+ sub "м", "m"
163
+ sub "н", "n"
164
+ sub "о", "o"
165
+ sub "п", "p"
166
+ sub "р", "r"
167
+ sub "с", "s"
168
+ sub "т", "t"
169
+ sub "у", "u"
170
+ sub "ф", "f"
171
+ sub "х", "kh"
172
+ sub "ц", "ts"
173
+ sub "ч", "ch"
174
+ sub "ш", "sh"
175
+ sub "щ", "shch"
176
+ sub "ъ", "\"" # ъ
177
+ sub "ы", "y"
178
+ sub "ь", "’" # ь => ’
179
+ sub "э", "e"
180
+ sub "ю", "yu"
181
+ sub "я", "ya"
182
+ }
183
+
184
+ # POSTRULES
185
+ sub rus_multichar, upcase, before: rus_latupper
186
+ sub rus_multichar, upcase, before: rus_latupper + "·"
187
+ sub rus_multichar, upcase, after: "·" + rus_latupper
188
+ sub rus_multichar, upcase, after: rus_latupper
189
+
190
+ # Run twice to find more cases
191
+ sub rus_multichar, upcase, before: rus_latupper
192
+ sub rus_multichar, upcase, before: rus_latupper + "·"
193
+ sub rus_multichar, upcase, after: "·" + rus_latupper
194
+ sub rus_multichar, upcase, after: rus_latupper
195
+ }