RubyGems - interscript - Versions diffs - 0.1.5 → 0.1.6 - Mend

interscript 0.1.5 → 0.1.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (116) hide show

checksums.yaml +4 -4
data/lib/__pycache__/g2pwrapper.cpython-38.pyc +0 -0
data/lib/interscript.rb +5 -1
data/lib/interscript/fs.rb +3 -1
data/lib/interscript/mapping.rb +2 -2
data/lib/interscript/opal.rb +5 -1
data/lib/interscript/opal/maps.js.erb +7 -4
data/lib/interscript/version.rb +1 -1
data/maps/acadsin-zho-Hani-Latn-2002.yaml +1 -1
data/maps/alalc-amh-Ethi-Latn-1997.yaml +509 -0
data/maps/alalc-amh-Ethi-Latn-2011.yaml +138 -0
data/maps/alalc-ara-Arab-Latn-1997.yaml +1283 -0
data/maps/alalc-asm-Deva-Latn-1997.yaml +159 -0
data/maps/alalc-aze-Cyrl-Latn-1997.yaml +1 -1
data/maps/{alalc-bel-cyrl-latn-1997.yaml → alalc-bel-Cyrl-Latn-1997.yaml} +2 -2
data/maps/alalc-ell-Grek-Latn-1997.yaml +2 -3
data/maps/alalc-ell-Grek-Latn-2010.yaml +2 -3
data/maps/alalc-hin-Deva-Latn-2020.yaml +159 -0
data/maps/alalc-kat-Geok-Latn-1997.yaml +1 -2
data/maps/alalc-kor-Hang-Latn-1997.yaml +1 -1
data/maps/alalc-mar-Deva-Latn-1997.yaml +170 -0
data/maps/{alalc-mkd-cyrl-latn-1997.yaml → alalc-mkd-Cyrl-Latn-1997.yaml} +0 -0
data/maps/alalc-pan-Deva-Latn-1997.yaml +237 -0
data/maps/alalc-rus-Cyrl-Latn-1997.yaml +1 -2
data/maps/alalc-rus-Cyrl-Latn-2012.yaml +2 -2
data/maps/{alalc-srp-cyrl-latn-2013.yaml → alalc-srp-Cyrl-Latn-2013.yaml} +0 -0
data/maps/bas-rus-Cyrl-Latn-2017-bss.yaml +0 -1
data/maps/bgn-jpn-Hrkt-Latn-1962.yaml +0 -2
data/maps/bgn-kor-Hang-Latn-1943.yaml +1 -1
data/maps/bgn-kor-Kore-Latn-1943.yaml +1 -1
data/maps/bgnpcgn-amh-Ethi-Latn-1967.yaml +528 -0
data/maps/bgnpcgn-ara-Arab-Latn-1956.yaml +592 -0
data/maps/bgnpcgn-bak-Cyrl-Latn-2007.yaml +5 -5
data/maps/{bgnpcgn-bel-cyrl-latn-1979.yaml → bgnpcgn-bel-Cyrl-Latn-1979.yaml} +0 -0
data/maps/bgnpcgn-ell-Grek-Latn-1962.yaml +3 -4
data/maps/bgnpcgn-ell-Grek-Latn-1996.yaml +0 -1
data/maps/bgnpcgn-kat-Geor-Latn-2009.yaml +0 -1
data/maps/bgnpcgn-kor-Hang-Latn-kn-1945.yaml +17 -17
data/maps/bgnpcgn-kor-Hang-Latn-rok-2011.yaml +2 -2
data/maps/bgnpcgn-kor-Kore-Latn-rok-2011.yaml +2 -2
data/maps/bgnpcgn-mkd-Cyrl-Latn-2013.yaml +1 -1
data/maps/bgnpcgn-nep-Deva-Latn-2011.yaml +200 -0
data/maps/bgnpcgn-per-Arab-Latn-1956.yaml +0 -1
data/maps/bgnpcgn-ukr-Cyrl-Latn-1965.yaml +0 -1
data/maps/bis-asm-Beng-Latn-13194-1991.yaml +159 -0
data/maps/bis-ben-Beng-Latn-13194-1991.yaml +156 -0
data/maps/bis-dev-Deva-Latn-13194-1991.yaml +184 -0
data/maps/bis-gjr-Gujr-Latn-13194-1991.yaml +166 -0
data/maps/bis-knd-Knda-Latn-13194-1991.yaml +173 -0
data/maps/bis-mlm-Mlym-Latn-13194-1991.yaml +176 -0
data/maps/bis-ori-Orya-Latn-13194-1991.yaml +160 -0
data/maps/bis-pnj-Guru-Latn-13194-1991.yaml +175 -0
data/maps/bis-tel-Telu-Latn-13194-1991.yaml +170 -0
data/maps/bis-tml-Taml-Latn-13194-1991.yaml +155 -0
data/maps/by-bel-Cyrl-Latn-1998.yaml +4 -4
data/maps/by-bel-Cyrl-Latn-2007.yaml +3 -3
data/maps/dos-nep-Deva-Latn-1997.yaml +33 -0
data/maps/elot-ell-Grek-Latn-743-1982-tl.yaml +4 -5
data/maps/elot-ell-Grek-Latn-743-1982-ts.yaml +4 -5
data/maps/elot-ell-Grek-Latn-743-2001-tl.yaml +0 -1
data/maps/elot-ell-Grek-Latn-743-2001-ts.yaml +0 -1
data/maps/ggg-kat-Geor-Latn-2002.yaml +0 -1
data/maps/{gki-bel-cyrl-latn-1992.yaml → gki-bel-Cyrl-Latn-1992.yaml} +1 -1
data/maps/{gki-bel-cyrl-latn-2000.yaml → gki-bel-Cyrl-Latn-2000.yaml} +1 -1
data/maps/{gost-rus-cyrl-latn-16876-71-1983.yaml → gost-rus-Cyrl-Latn-16876-71-1983.yaml} +1 -1
data/maps/icao-bel-Cyrl-Latn-9303.yaml +0 -5
data/maps/icao-bul-Cyrl-Latn-9303.yaml +0 -4
data/maps/icao-per-Arab-Latn-9303.yaml +0 -1
data/maps/icao-rus-Cyrl-Latn-9303.yaml +0 -1
data/maps/icao-ukr-Cyrl-Latn-9303.yaml +0 -1
data/maps/iso-ara-Arab-Latn-233-1984.yaml +323 -0
data/maps/iso-ell-Grek-Latn-843-1997-t1.yaml +4 -5
data/maps/iso-ell-Grek-Latn-843-1997-t2.yaml +1 -2
data/maps/iso-rus-Cyrl-Latn-9-1995.yaml +0 -1
data/maps/iso-tha-Thai-Latn-11940-1998.yaml +1 -1
data/maps/kp-kor-Hang-Latn-2002.yaml +4 -4
data/maps/lshk-yue-Hani-Latn-jyutping-1993.yaml +2 -2
data/maps/mvd-bel-Cyrl-Latn-2008.yaml +4 -4
data/maps/mvd-bel-Cyrl-Latn-2010.yaml +4 -4
data/maps/mvd-rus-Cyrl-Latn-2008.yaml +1 -2
data/maps/mvd-rus-Cyrl-Latn-2010.yaml +4 -4
data/maps/nil-kor-Hang-Hang-jamo.yaml +3 -3
data/maps/odni-aze-Cyrl-Latn-2015.yaml +1 -1
data/maps/odni-bel-Cyrl-Latn-2015.yaml +1 -1
data/maps/odni-bul-Cyrl-Latn-2015.yaml +3 -3
data/maps/odni-hin-Deva-Latn-2015.yaml +258 -0
data/maps/odni-kat-Geor-Latn-2015.yaml +0 -1
data/maps/{odni-mkd-cyrl-latn-2015.yaml → odni-mkd-Cyrl-Latn-2015.yaml} +0 -0
data/maps/odni-rus-Cyrl-Latn-2015.yaml +1 -1
data/maps/odni-srp-Cyrl-Latn-2015.yaml +2 -2
data/maps/odni-urd-Arab-Latn-2015.yaml +221 -0
data/maps/odni-uzb-Cyrl-Latn-2015.yaml +1 -2
data/maps/royin-tha-Thai-Latn-1939-generic.yaml +4 -4
data/maps/royin-tha-Thai-Latn-1968.yaml +4 -4
data/maps/royin-tha-Thai-Latn-1999-chained.yaml +4 -4
data/maps/royin-tha-Thai-Latn-1999.yaml +3 -3
data/maps/{ses-ara-arab-latn-1930.yaml → ses-ara-Arab-Latn-1930.yaml} +7 -3
data/maps/un-ara-Arab-Latn-1971.yaml +16 -4
data/maps/un-ara-Arab-Latn-1972.yaml +14 -7
data/maps/un-ara-Arab-Latn-2017.yaml +56 -19
data/maps/un-bel-Cyrl-Latn-2007.yaml +3 -3
data/maps/un-ell-Grek-Latn-1987-tl.yaml +1 -2
data/maps/un-ell-Grek-Latn-1987-ts.yaml +0 -1
data/maps/un-ell-Grek-Latn-phonetic-1987.yaml +42 -42
data/maps/un-mon-Mong-Latn-2013.yaml +9 -3
data/maps/un-nep-Deva-Latn-1972.yaml +163 -0
data/maps/un-rus-Cyrl-Latn-1987.yaml +1 -1
data/maps/{un-ukr-cyrl-latn-1998.yaml → un-ukr-Cyrl-Latn-1998.yaml} +1 -1
data/maps/ungegn-amh-Ethi-Latn-2016.yaml +575 -0
data/maps/var-kor-Hang-Latn-mr-1939.yaml +2 -2
data/maps/var-kor-Kore-Hang-2013.yaml +1 -1
data/maps/var-kor-Kore-Latn-mr-1939.yaml +1 -2
data/maps/var-tha-Thai-Thai-phonemic.yaml +5 -5
data/maps/var-tha-Thai-Zsym-ipa.yaml +12 -12
data/maps/var-zho-Hani-Latn-1979.yaml +7 -7
metadata +41 -15

data/maps/alalc-asm-Deva-Latn-1997.yaml ADDED

@@ -0,0 +1,159 @@
+---
+authority_id: alalc
+id: 1997
+language: asm
+source_script: Deva
+destination_script: Latn
+name: Assamese Romanization, 1997
+url: https://www.loc.gov/catdir/cpso/romanization/assamese.pdf
+creation_date: 1997
+description: |
+  ALA-LC Romanization table for Assamese
+notes:
+  - Only the vowel forms that appear at the beginning of a syllable are listed; the forms used for
+    vowels following a consonant can be found in grammars; no distinction between the two is
+    made in transliteration.
+  - |
+    The vowel a is implicit after all consonants and consonant clusters and is supplied in
+    transliteration, with the following exceptions:
+    a) when another vowel is indicated by its appropriate sign; and
+    b) when the absence of any vowel is indicated by the subscript sign ( ◌् ) called halanta or
+       birāma.
+  - Candrabindu before guttural, palatal, cerebral, and dental occlusives is transliterated n̐. Before
+    labials, sibilants, semivowels, aspirates, vowels, and in final position it is transliterated m̐.
+  - When doubled, avagraha is transliterated by two apostrophes ( ’’ ).
+tests:
+  - source: "অসমীয়া কবিতা"
+    expected: "asamaīẏaā kabaitaā"
+  - source: "কবিৰ আজি জন্মদিন"
+    expected: "kabaira ājai janamadaina"
+  - source: "বেৰুটত এমাহৰ পাছতে পুনৰ ভয়ংকৰ অগ্নিকাণ্ড"
+    expected: "baerauṭata emaāhara paāchatae paunara bhayaṃkara aganaikaāṇaḍa"
+  - source: "ভঙাৰ বিৰুদ্ধে আৱেদন দাখিল কংগনাৰ"
+    expected: "bhaṅaāra bairaudadhae āwaedana daākhaila kaṃganaāra"
+  - source: "আপুনি পঢ়ি ভাল পাব পৰা বাতৰি"
+    expected: "āpaunai paṛhai bhaāla paāba paraā baātarai"
+  - source: "শ্ৰীৰামপুৰত গৰুভৰ্তি ট্ৰাক জব্দ, দুজনক আটক"
+    expected: "śaraīraāmapaurata garaubharatai ṭaraāka jabada, daujanaka āṭaka"
+  - source: "কেনে আছে প্ৰাক্তন"
+    expected: "kaenae āchae paraākatana"
+  - source: "কমুম্বাইৰ মেয়ৰৰ দেহত কোভিড পজিটিভ"
+    expected: "kamaumabaāira maeẏarara daehata kaobhaiḍa pajaiṭaibha"
+  - source: "টুইটাৰযোগে খোদ সদৰী কৰে এই কথা"
+    expected: "ṭauiṭaāraযogae khaoda sadaraī karae ei kathaā"
+  - source: "লখিমপুৰ জিলাৰ নাৰায়ণপুৰৰ বৰপথাৰত আজি প্ৰশান্তি ধাম নামেৰে এখন বৃদ্ধাশ্ৰমৰ শুভাৰম্ভ কৰা হয়"
+    expected: "lakhaimapaura jailaāra naāraāẏaṇapaurara barapathaārata ājai paraśaānatai dhaāma naāmaerae ekhana baṛdadhaāśaramara śaubhaāramabha karaā haẏa"
+map:
+  rules:
+    # note[3]
+    - pattern: \u0981(?=[কখগঘঙচছজঝঞটঠডড়ঢঢ়ণতৎথদধন])    # ঁ before guttural, palatal, cerebral, and dental
+      result: ṅ
+  characters:
+    #Vowels and Diphthongs (see Note 1)
+    'অ': 'a'
+    'আ': 'ā'
+    'ই': 'i'
+    'ঈ': 'ī'
+    'উ': 'u'
+    'ঊ': 'ū'
+    'ঋ': 'ṛ'
+    'ৠ': 'ṝ'
+    'ঌ': 'ḹ'
+    'এ': 'e'
+    'ঐ': 'ai'
+    'ও': 'o'
+    'ঔ': 'au'
+   # Consonant characters
+    #Gutturals
+    'ক': 'ka'
+    'খ': 'kha'
+    'গ': 'ga'
+    'ঘ': 'gha'
+    'ঙ': 'ṅa'
+    #Palatals
+    'চ': 'ca'
+    'ছ': 'cha'
+    'জ': 'ja'
+    'ঝ': 'jha'
+    'ঞ': 'ña'
+    #Cerebrals
+    'ট': 'ṭa'
+    'ঠ': 'ṭha'
+    'ড': 'ḍa'
+    'ড়': 'ṛa'
+    'ঢ': 'ḍha'
+    'ঢ়': 'ṛha'
+    'ণ': 'ṇa'
+    #Dentals
+    'ত': 'ta'
+    'ৎ': 'ṭ'
+    'থ': 'tha'
+    'দ': 'da'
+    'ধ': 'dha'
+    'ন': 'na'
+    #Labials
+    'প': 'pa'
+    'ফ': 'pha'
+    'ব': 'ba'
+    'ভ': 'bha'
+    'ম': 'ma'
+    #Semivowels
+    'য়': 'ya'
+    'য়': 'ẏa'
+    'ৰ': 'ra'
+    'ল': 'la'
+    'ৱ': 'wa'
+    #Sibilants
+    'শ': 'śa'
+    'ষ': 'sha'
+    'স': 'sa'
+    #Aspirate
+    'হ': 'ha'
+    # Anusvāra
+    'ং': 'ṃ'
+    # Bisarga
+    'ঃ': 'ḥ'
+    # Candrabindu (see Note 3)
+    'ঁ': 'm̐'
+    # Abagraha  (see Note 4)
+    'ऽ': '’' # (apostrophe)
+    # Medials # Needed for connecting constants
+    '\u09be': 'ā'
+    '\u09bf': 'i'
+    '\u09c0': 'ī'
+    '\u09c1': 'u'
+    '\u09c2': 'ū'
+    '\u09c3': 'ṛ'
+    '\u09c7': 'e'
+    '\u09c8': 'ai'
+    '\u09cb': 'o'
+    '\u09cc': 'au'
+    '\u09CD': '' # Used for joining

data/maps/alalc-aze-Cyrl-Latn-1997.yaml CHANGED

@@ -103,7 +103,7 @@ map:
     '\u0427': 'Ch'      # Ч
     '\u04B8': 'J'       # Ҹ
     '\u0428': 'Sh'      # Ш
     '\u0430': 'a'       # а
     '\u0431': 'b'       # б
     '\u0432': 'v'       # в

data/maps/{alalc-bel-cyrl-latn-1997.yaml → alalc-bel-Cyrl-Latn-1997.yaml} RENAMED

@@ -9,8 +9,8 @@ url: http://catdir.loc.gov/catdir/cpso/romanization/beloruss.pdf
 creation_date: 1997
 notes:
-  - Ґ letter found in Old Belarusian and in modern publications in Tarashkevitsa orthography.
-  - Do not confuse with the digraph кг (also romanized as “kh”). Manual review may be needed when transcribing data in vernacular characters in order to distinguish х from кг.
+  - Ґ letter found in Old Belarusian and in modern publications in Tarashkevitsa orthography.
+  - Do not confuse with the digraph кг (also romanized as “kh”). Manual review may be needed when transcribing data in vernacular characters in order to distinguish х from кг.
   - The apostrophe (´) is not transliterated.
   - Soft sign (prime) is USMARC hexadecimal code A7 ~ U+02B9 Unicode character

data/maps/alalc-ell-Grek-Latn-1997.yaml CHANGED

@@ -15,7 +15,7 @@ note:
   - This table presupposes monotonic accentuation; rough breathings are accordingly not addressed.
   - The diphthong definition for upsilon is taken from the 2010 version
   - Generalised gramma digraph rule to capitals
 tests:
   - source: |
@@ -25,7 +25,7 @@ tests:
     expected: |
         Ena prama monon me parakinēse ki emena na grapsō oti toutēn tēn patrida tēn echomen oloi mazi, kai sophoi ki amatheis kai plousioi kai phtōchoi kai politikoi kai stratiōtikoi kai oi pleon mikroteroi anthrōpoi; osoi agōnistēkamen, analogōs o katheis, echomen na zēsomen edō. To loipon doulepsamen oloi mazi, na tēn phylamen ki oloi mazi kai na mēn legei oute o dynatos «egō» oute o adynatos. Xerete pote na legei o katheis «egō»? Otan agōnistei monos tou kai phkiasei ē chalasei, na legei «egō»; otan omōs agōnizontai polloi kai phkianoun, tote na lene «emeis». Eimaste eis to «emeis» ki ochi eis to «egō». Kai eis to exēs na mathomen gnōsē, an thelomen na phkiasomen chōrion, na zēsomen oloi mazi.
         Giannēs Makrygiannēs.
@@ -622,4 +622,3 @@ map:
     "\u0387": ";"   # ·
     "\u00B7": ";"   # ·

data/maps/alalc-ell-Grek-Latn-2010.yaml CHANGED

@@ -14,7 +14,7 @@ note:
   - Applies to texts after 1453 (Modern Greek)
   - This table presupposes monotonic accentuation; rough breathings are accordingly not addressed.
   - Generalised gramma digraph rule to capitals
 tests:
   - source: |
@@ -24,7 +24,7 @@ tests:
     expected: |
         Ena prama monon me parakinēse ki emena na grapsō oti toutēn tēn patrida tēn echomen oloi mazi, kai sophoi ki amatheis kai plousioi kai phtōchoi kai politikoi kai stratiōtikoi kai oi pleon mikroteroi anthrōpoi; osoi agōnistēkamen, analogōs o katheis, echomen na zēsomen edō. To loipon doulepsamen oloi mazi, na tēn phylamen ki oloi mazi kai na mēn legei oute o dynatos «egō» oute o adynatos. Xerete pote na legei o katheis «egō»? Otan agōnistei monos tou kai phkiasei ē chalasei, na legei «egō»; otan omōs agōnizontai polloi kai phkianoun, tote na lene «emeis». Eimaste eis to «emeis» ki ochi eis to «egō». Kai eis to exēs na mathomen gnōsē, an thelomen na phkiasomen chōrion, na zēsomen oloi mazi.
         Giannēs Makrygiannēs.
@@ -625,4 +625,3 @@ map:
     "\u0387": ";"   # ·
     "\u00B7": ";"   # ·

data/maps/alalc-hin-Deva-Latn-2020.yaml ADDED

@@ -0,0 +1,159 @@
+---
+authority_id: alalc
+id: 2020
+language: hin
+source_script: Deva
+destination_script: Latn
+name: Hindi Romanization, 2020
+url: https://www.loc.gov/catdir/cpso/romanization/hindi.pdf
+creation_date: 2020
+description: |
+  ALA-LC Romanization table for Hindi
+notes:
+  - Only the vowel forms that appear at the beginning of a syllable are listed; the forms used for
+    vowels following a consonant can be found in grammars; no distinction between the two is
+    made in transliteration.
+  - |
+    The vowel a is implicit after all consonants and consonant clusters and is supplied in
+    transliteration, with the following exceptions:
+    a) when another vowel is indicated by its appropriate sign; and
+    b) when the absence of any vowel is indicated by the subscript sign ( ◌् ) called halanta or
+       virāma.
+  - |
+    Exception: Anusvāra is transliterated by:
+    a) ṅ before gutturals,
+    b) ñ before palatals,
+    c) ṇ before cerebrals,
+    d) n before dentals, and
+    e) m before labials.
+  - Anunāsika before guttural, palatal, cerebral, and dental occlusives is transliterated n̐. Before
+    labials, sibilants, semivowels, aspirates, vowels, and in final position it is transliterated m̐.
+  - When doubled, avagraha is transliterated by two apostrophes ( ’’ ).
+tests:
+  - source: "हम"
+    expected: "hama"
+  - source: "मीन"
+    expected: "maīna"
+  - source: "औसत"
+    expected: "ăusata"
+  - source: "माँऽऽऽ!"
+    expected: "maān̐’’’!"
+  - source: "माँ"
+    expected: "maām̐"
+map:
+  rules:
+    # note[4]
+    - pattern: (?<=)\u0901(?=\b)
+      result: "m̐"
+  characters:
+    # I. Vowels and Diphthongs (see Note 1)
+    'अ': 'a'
+    'आ': 'ā'
+    'इ': 'i'
+    'ई': 'ī'
+    'उ': 'u'
+    'ऊ': 'ū'
+    'ऋ': 'ṛ'
+    'ॠ': 'ṝ'
+    'ऌ': 'ḹ'
+    'ॳ': 'ĕ'
+    'ए': 'e'
+    'ॲ': 'ê'
+    'अै': 'ai'
+    'ऐ': 'ai'
+    'ऒ': 'ŏ'
+    'ओ': 'o'
+    'ऑ': 'ô'
+    'औ': 'ău'
+    # II. Consonants (see Note 2)
+    # Gutturals
+    'क': 'ka'
+    'ख': 'kha'
+    'ग': 'ga'
+    'घ': 'gha'
+    'ङ': 'ṅa'
+    # Palatals
+    'च': 'ca'
+    'छ': 'cha'
+    'ज': 'ja'
+    'झ': 'jha'
+    'ञ': 'ña'
+    # Cerebrals
+    'ट': 'ṭa'
+    'ठ': 'ṭha'
+    'ड': 'ḍa'
+    'ड़': 'ṛa'
+    'ढ': 'ḍha'
+    'ढ़': 'ṛha'
+    'ण': 'ṇa'
+    # Dentals
+    'त': 'ta'
+    'थ': 'tha'
+    'द': 'da'
+    'ध': 'dha'
+    'न': 'na'
+    # Labials
+    'प': 'pa'
+    'फ': 'pha'
+    'ब': 'ba'
+    'भ': 'bha'
+    'म': 'ma'
+    # Semivowels
+    'य': 'ya'
+    'र': 'ra'
+    'ल': 'la'
+    'व': 'ba'
+    # Sibilants
+    'श': 'śa'
+    'ष': 'sha'
+    'स': 'sa'
+    # Aspirate
+    'ह': 'ha'
+    # Anusvāra
+    'ं': 'ṃ'
+    # Bisarga
+    'ः ': 'ḥ'
+    # Anunāsika
+    'ँ': 'n̐' # ঁ : n̐, m̐
+    # Abagraha
+    'ऽ': '’' # (apostrophe)
+    # Medials # Needed for connecting constants
+    'ा': "ā"
+    'ि': "i"
+    'ी': "ī"
+    'ु': "u"
+    'ू': "ū"
+    'ृ': "ṛi"
+    'ॄ': "rī"
+    'े': "e"
+    'ॊ': "o"
+    'ौ': "au"

data/maps/alalc-kat-Geok-Latn-1997.yaml CHANGED

@@ -70,7 +70,7 @@ map:
     '\u10c3' : 'W' # Ⴣ
     '\u10c4' : 'X̣' # Ⴤ
     '\u10c5' : 'Ō' # Ⴥ
     '\u2d00' : 'a' # ⴀ
     '\u2d01' : 'b' # ⴁ
     '\u2d02' : 'g' # ⴂ
@@ -109,4 +109,3 @@ map:
     '\u2d23' : 'w' # ⴣ
     '\u2d24' : 'x̣' # ⴤ
     '\u2d25' : 'ō' # ⴥ

data/maps/alalc-kor-Hang-Latn-1997.yaml CHANGED

@@ -7,7 +7,7 @@ destination_script: Latn
 name: ALA-LC Romanization Table -- Korean (1997)
 url: http://catdir.loc.gov/catdir/cpso/romanization/korean.pdf
 creation_date: 1997
-adoption_date:
+adoption_date:
 description:
   "1. General Practice
 The Library of Congress will continue to follow the McCune-Reischauer system

data/maps/alalc-mar-Deva-Latn-1997.yaml ADDED

@@ -0,0 +1,170 @@
+---
+authority_id: alalc
+id: 1997
+language: hin
+source_script: Deva
+destination_script: Latn
+name: Marathi Romanization, 1997
+url: https://www.loc.gov/catdir/cpso/romanization/marathi.pdf
+creation_date: 1997
+description: |
+  ALA-LC Romanization table for Marathi
+notes:
+  - Only the vowel forms that appear at the beginning of a syllable are listed; the forms used for
+    vowels following a consonant can be found in grammars; no distinction between the two is
+    made in transliteration.
+  - |
+    The vowel a is implicit after all consonants and consonant clusters and is supplied in
+    transliteration, with the following exceptions:
+    a) when another vowel is indicated by its appropriate sign; and
+    b) when the absence of any vowel is indicated by the subscript sign ( ् ) called halanta or
+       virāma.
+  - |
+    Exception: Anusvāra is transliterated by:
+    a) ṅ before gutturals,
+    b) ñ before palatals,
+    c) ṇ before cerebrals,
+    d) n before dentals, and
+    e) m before labials.
+    In other circumstances it is transliterated by a tilde (~) over the vowel.
+  - When doubled, avagraha is transliterated by two apostrophes ( ’’ ).
+tests:
+  - source: "ठाणे - जिल्ह्यात बुधवारी एक हजार रुग्णांची वाढ, तर जणांच्या मृत्यूची नोंद"
+    expected: "ṭhaāṇae - jailahayaāta baudhavaāraī eka hajaāra raugaṇaāñcaī vaāḍha, tara jaṇaāñcayaā maṛitayaūcaī naonda"
+  - source: "एकता कपूर पुन्हा अडकली वादात, वेबसीरिजमधल्या 'त्या' सीनमुळे जमावाची घरावर दगडफेक"
+    expected: "ekataā kapaūra paunahaā aḍakalaī vaādaāta, vaebasaīraijamadhalayaā 'tayaā' saīnamaulae jamaāvaācaī gharaāvara dagaḍaphaeka"
+  - source: "जाणून घ्या, बीएमसीच्या अधिकाऱ्यांनी कंगना राणौतच्या ऑफिसमधले नक्की काय- काय तोडलं"
+    expected: "jaāṇaūna ghayaā, baīemasaīcayaā adhaikaāऱyaānnaī kaṅganaā raāṇaautacayaā ôphaisamadhalae nakakaī kaāya- kaāya taoḍalam"
+  - source: "कंगना मुंबईत दाखल होण्यापूर्वी 'मातोश्री'वरून फर्मान सुटले; प्रवक्त्यांना सक्त आदेश"
+    expected: "kaṅganaā maumbaīta daākhala haoṇayaāpaūravaī 'maātaośaraī'varaūna pharamaāna sauṭalae; paravakatayaānnaā sakata ādaeśa"
+  - source: "मराठा आरक्षणास तात्पुरती स्थगिती; सर्वोच्च न्यायालयाचा निर्णय"
+    expected: "maraāṭhaā ārakashaṇaāsa taātapaurataī sathagaitaī; saravaocaca nayaāyaālayaācaā nairaṇaya"
+  - source: "भारताच्या तिन्ही लशींचा पहिला टप्पा यशस्वी, वाचा कधी येणार बाजारात"
+    expected: "bhaārataācayaā tainahaī laśaīñcaā pahailaā ṭapapaā yaśasavaī, vaācaā kadhaī yaeṇaāra baājaāraāta"
+  - source: "रुग्णवाढीमुळे खाटांची चणचण"
+    expected: "raugaṇavaāḍhaīmaulae khaāṭaāñcaī caṇacaṇa"
+  - source: "पीएम स्वनिधी कर्ज योजनेला मुंबईतून अल्प प्रतिसाद"
+    expected: "paīema savanaidhaī karaja yaojanaelaā maumbaītaūna alapa parataisaāda"
+  - source: "सांताक्रूझ-चेंबूर लिंक रोडवरील उन्नत मार्गाला स्थगिती"
+    expected: "saāntaākaraūjha-caembaūra laiṅka raoḍavaraīla unanata maāragaālaā sathagaitaī"
+  - source: "संपादक अर्णब गोस्वामी यांच्याविरूद्ध खडक पोलिस ठाण्यात तक्रार"
+    expected: "sampaādaka araṇaba gaosavaāmaī yaāñcayaāvairaūdadha khaḍaka paolaisa ṭhaāṇayaāta takaraāra"
+map:
+  rules:
+    # note[3]
+    - pattern: \u0902(?=[कखगघङ])
+      result: ṅ
+    - pattern: \u0902(?=[चछजझञ])
+      result: ñ
+    - pattern: \u0902(?=[टठडढण])
+      result: ṇ
+    - pattern: \u0902(?=[तथदधन])
+      result: n
+  characters:
+    # I. Vowels and Diphthongs (see Note 1)
+    'अ': 'a'
+    'आ': 'ā'
+    'इ': 'i'
+    'ई': 'ī'
+    'उ': 'u'
+    'ऊ': 'ū'
+    'ऋ': 'ṛ'
+    'ॠ': 'ṝ'
+    'ऌ': 'ḹ'
+    #'ॳ': 'ĕ'
+    'ए': 'e'
+    'ॲ': 'ê'
+    #'अै': 'ai'
+    'ऐ': 'ai'
+    #'ऒ': 'ŏ'
+    'ओ': 'o'
+    'ऑ': 'ô'
+    'औ': 'ău'
+    # II. Consonants
+    # Gutturals
+    'क': 'ka'
+    'ख': 'kha'
+    'ग': 'ga'
+    'घ': 'gha'
+    'ङ': 'ṅa'
+    # Palatals
+    'च': 'ca'
+    'छ': 'cha'
+    'ज': 'ja'
+    'झ': 'jha'
+    'ञ': 'ña'
+    # Cerebrals
+    'ट': 'ṭa'
+    'ठ': 'ṭha'
+    'ड': 'ḍa'
+    #'ड़': 'ṛa'
+    'ढ': 'ḍha'
+    #'ढ़': 'ṛha'
+    'ण': 'ṇa'
+    # Dentals
+    'त': 'ta'
+    'थ': 'tha'
+    'द': 'da'
+    'ध': 'dha'
+    'न': 'na'
+    # Labials
+    'प': 'pa'
+    'फ': 'pha'
+    'ब': 'ba'
+    'भ': 'bha'
+    'म': 'ma'
+    # Semivowels
+    'य': 'ya'
+    'र': 'ra'
+    'ल': 'la'
+    'ळ': 'la'
+    'व': 'va'
+    # Sibilants
+    'श': 'śa'
+    'ष': 'sha'
+    'स': 'sa'
+    # Aspirate
+    'ह': 'ha'
+    # Anusvāra
+    'ं': 'm'
+    # Bisarga
+    'ः ': 'ḥ'
+    # Abagraha
+    'ऽ': '’' # (apostrophe)
+    # Medials # Needed for connecting constants
+    'ा': "ā"
+    'ि': "i"
+    'ी': "ī"
+    'ु': "u"
+    'ू': "ū"
+    'ृ': "ṛi"
+    'ॄ': "rī"
+    'े': "e"
+    'ो': "o"
+    'ौ': "au"
+    '्': ''