cchardet 0.2.0
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- checksums.yaml +7 -0
- data/.gitignore +8 -0
- data/.gitmodules +3 -0
- data/.rubocop.yml +11 -0
- data/CHANGELOG.md +5 -0
- data/Gemfile +10 -0
- data/README.md +35 -0
- data/Rakefile +15 -0
- data/cchardet.gemspec +30 -0
- data/ext/cchardet/extconf.rb +26 -0
- data/ext/uchardet/.gitignore +1 -0
- data/ext/uchardet/.gitlab-ci.yml +106 -0
- data/ext/uchardet/AUTHORS +16 -0
- data/ext/uchardet/CMakeLists.txt +74 -0
- data/ext/uchardet/COPYING +1316 -0
- data/ext/uchardet/INSTALL +26 -0
- data/ext/uchardet/README.md +295 -0
- data/ext/uchardet/build-mac/uchardet.cpp +7 -0
- data/ext/uchardet/build-mac/uchardet.xcodeproj/project.pbxproj +543 -0
- data/ext/uchardet/build-mac/uchardet.xcodeproj/project.xcworkspace/contents.xcworkspacedata +7 -0
- data/ext/uchardet/build-mac/uchardet.xcodeproj/project.xcworkspace/xcshareddata/uchardet.xccheckout +41 -0
- data/ext/uchardet/build-mac/uchardet.xcodeproj/xcshareddata/xcschemes/uchardet-ios.xcscheme +77 -0
- data/ext/uchardet/build-mac/uchardet.xcodeproj/xcshareddata/xcschemes/uchardet.xcscheme +77 -0
- data/ext/uchardet/doc/CMakeLists.txt +6 -0
- data/ext/uchardet/doc/README.maintainer +59 -0
- data/ext/uchardet/doc/uchardet.1 +18 -0
- data/ext/uchardet/script/BuildLangModel.py +533 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangArabicModel.log +142 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangCroatianModel.log +157 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangCzechModel.log +161 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangDanishModel.log +158 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangEsperantoModel.log +110 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangEstonianModel.log +159 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangFinnishModel.log +156 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangFrenchModel.log +116 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangGermanModel.log +159 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangGreekModel.log +272 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangHungarianModel.log +109 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangIrishModel.log +156 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangItalianModel.log +162 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangLatvianModel.log +162 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangLithuanianModel.log +162 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangMalteseModel.log +147 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangPolishModel.log +154 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangPortugueseModel.log +166 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangRomanianModel.log +153 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangSlovakModel.log +158 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangSloveneModel.log +148 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangSpanishModel.log +109 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangSwedishModel.log +151 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangThaiModel.log +141 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangTurkishModel.log +113 -0
- data/ext/uchardet/script/BuildLangModelLogs/LangVietnameseModel.log +121 -0
- data/ext/uchardet/script/README +63 -0
- data/ext/uchardet/script/charsets/codepoints.py +53 -0
- data/ext/uchardet/script/charsets/db.py +73 -0
- data/ext/uchardet/script/charsets/ibm852.py +72 -0
- data/ext/uchardet/script/charsets/iso-8859-1.py +85 -0
- data/ext/uchardet/script/charsets/iso-8859-10.py +73 -0
- data/ext/uchardet/script/charsets/iso-8859-11.py +77 -0
- data/ext/uchardet/script/charsets/iso-8859-13.py +72 -0
- data/ext/uchardet/script/charsets/iso-8859-15.py +80 -0
- data/ext/uchardet/script/charsets/iso-8859-16.py +83 -0
- data/ext/uchardet/script/charsets/iso-8859-2.py +73 -0
- data/ext/uchardet/script/charsets/iso-8859-3.py +75 -0
- data/ext/uchardet/script/charsets/iso-8859-4.py +73 -0
- data/ext/uchardet/script/charsets/iso-8859-6.py +73 -0
- data/ext/uchardet/script/charsets/iso-8859-7.py +73 -0
- data/ext/uchardet/script/charsets/iso-8859-9.py +76 -0
- data/ext/uchardet/script/charsets/mac-centraleurope.py +72 -0
- data/ext/uchardet/script/charsets/tis-620.py +77 -0
- data/ext/uchardet/script/charsets/viscii.py +72 -0
- data/ext/uchardet/script/charsets/windows-1250.py +75 -0
- data/ext/uchardet/script/charsets/windows-1252.py +76 -0
- data/ext/uchardet/script/charsets/windows-1253.py +72 -0
- data/ext/uchardet/script/charsets/windows-1256.py +75 -0
- data/ext/uchardet/script/charsets/windows-1257.py +72 -0
- data/ext/uchardet/script/charsets/windows-1258.py +72 -0
- data/ext/uchardet/script/debug.sh +9 -0
- data/ext/uchardet/script/header-template.cpp +38 -0
- data/ext/uchardet/script/langs/ar.py +59 -0
- data/ext/uchardet/script/langs/cs.py +80 -0
- data/ext/uchardet/script/langs/da.py +69 -0
- data/ext/uchardet/script/langs/de.py +69 -0
- data/ext/uchardet/script/langs/el.py +55 -0
- data/ext/uchardet/script/langs/eo.py +67 -0
- data/ext/uchardet/script/langs/es.py +69 -0
- data/ext/uchardet/script/langs/et.py +57 -0
- data/ext/uchardet/script/langs/fi.py +60 -0
- data/ext/uchardet/script/langs/fr.py +79 -0
- data/ext/uchardet/script/langs/ga.py +60 -0
- data/ext/uchardet/script/langs/hr.py +59 -0
- data/ext/uchardet/script/langs/hu.py +66 -0
- data/ext/uchardet/script/langs/it.py +56 -0
- data/ext/uchardet/script/langs/lt.py +70 -0
- data/ext/uchardet/script/langs/lv.py +69 -0
- data/ext/uchardet/script/langs/mt.py +80 -0
- data/ext/uchardet/script/langs/pl.py +81 -0
- data/ext/uchardet/script/langs/pt.py +80 -0
- data/ext/uchardet/script/langs/ro.py +65 -0
- data/ext/uchardet/script/langs/sk.py +80 -0
- data/ext/uchardet/script/langs/sl.py +59 -0
- data/ext/uchardet/script/langs/sv.py +56 -0
- data/ext/uchardet/script/langs/th.py +55 -0
- data/ext/uchardet/script/langs/tr.py +67 -0
- data/ext/uchardet/script/langs/vi.py +64 -0
- data/ext/uchardet/script/release.sh +8 -0
- data/ext/uchardet/script/win32.sh +7 -0
- data/ext/uchardet/src/Big5Freq.tab +943 -0
- data/ext/uchardet/src/CMakeLists.txt +160 -0
- data/ext/uchardet/src/CharDistribution.cpp +109 -0
- data/ext/uchardet/src/CharDistribution.h +242 -0
- data/ext/uchardet/src/EUCKRFreq.tab +614 -0
- data/ext/uchardet/src/EUCTWFreq.tab +447 -0
- data/ext/uchardet/src/GB2312Freq.tab +491 -0
- data/ext/uchardet/src/JISFreq.tab +589 -0
- data/ext/uchardet/src/JpCntx.cpp +230 -0
- data/ext/uchardet/src/JpCntx.h +140 -0
- data/ext/uchardet/src/LangModels/LangArabicModel.cpp +267 -0
- data/ext/uchardet/src/LangModels/LangBulgarianModel.cpp +249 -0
- data/ext/uchardet/src/LangModels/LangCroatianModel.cpp +298 -0
- data/ext/uchardet/src/LangModels/LangCzechModel.cpp +285 -0
- data/ext/uchardet/src/LangModels/LangDanishModel.cpp +201 -0
- data/ext/uchardet/src/LangModels/LangEsperantoModel.cpp +142 -0
- data/ext/uchardet/src/LangModels/LangEstonianModel.cpp +268 -0
- data/ext/uchardet/src/LangModels/LangFinnishModel.cpp +297 -0
- data/ext/uchardet/src/LangModels/LangFrenchModel.cpp +209 -0
- data/ext/uchardet/src/LangModels/LangGermanModel.cpp +170 -0
- data/ext/uchardet/src/LangModels/LangGreekModel.cpp +231 -0
- data/ext/uchardet/src/LangModels/LangHebrewModel.cpp +220 -0
- data/ext/uchardet/src/LangModels/LangHungarianModel.cpp +171 -0
- data/ext/uchardet/src/LangModels/LangIrishModel.cpp +234 -0
- data/ext/uchardet/src/LangModels/LangItalianModel.cpp +269 -0
- data/ext/uchardet/src/LangModels/LangLatvianModel.cpp +210 -0
- data/ext/uchardet/src/LangModels/LangLithuanianModel.cpp +209 -0
- data/ext/uchardet/src/LangModels/LangMalteseModel.cpp +138 -0
- data/ext/uchardet/src/LangModels/LangPolishModel.cpp +304 -0
- data/ext/uchardet/src/LangModels/LangPortugueseModel.cpp +241 -0
- data/ext/uchardet/src/LangModels/LangRomanianModel.cpp +236 -0
- data/ext/uchardet/src/LangModels/LangRussianModel.cpp +367 -0
- data/ext/uchardet/src/LangModels/LangSlovakModel.cpp +293 -0
- data/ext/uchardet/src/LangModels/LangSloveneModel.cpp +264 -0
- data/ext/uchardet/src/LangModels/LangSpanishModel.cpp +204 -0
- data/ext/uchardet/src/LangModels/LangSwedishModel.cpp +266 -0
- data/ext/uchardet/src/LangModels/LangThaiModel.cpp +267 -0
- data/ext/uchardet/src/LangModels/LangTurkishModel.cpp +175 -0
- data/ext/uchardet/src/LangModels/LangVietnameseModel.cpp +249 -0
- data/ext/uchardet/src/nsBig5Prober.cpp +88 -0
- data/ext/uchardet/src/nsBig5Prober.h +75 -0
- data/ext/uchardet/src/nsCharSetProber.cpp +125 -0
- data/ext/uchardet/src/nsCharSetProber.h +77 -0
- data/ext/uchardet/src/nsCodingStateMachine.h +105 -0
- data/ext/uchardet/src/nsEUCJPProber.cpp +99 -0
- data/ext/uchardet/src/nsEUCJPProber.h +79 -0
- data/ext/uchardet/src/nsEUCKRProber.cpp +91 -0
- data/ext/uchardet/src/nsEUCKRProber.h +81 -0
- data/ext/uchardet/src/nsEUCTWProber.cpp +91 -0
- data/ext/uchardet/src/nsEUCTWProber.h +75 -0
- data/ext/uchardet/src/nsEscCharsetProber.cpp +101 -0
- data/ext/uchardet/src/nsEscCharsetProber.h +70 -0
- data/ext/uchardet/src/nsEscSM.cpp +267 -0
- data/ext/uchardet/src/nsGB2312Prober.cpp +96 -0
- data/ext/uchardet/src/nsGB2312Prober.h +77 -0
- data/ext/uchardet/src/nsHebrewProber.cpp +194 -0
- data/ext/uchardet/src/nsHebrewProber.h +177 -0
- data/ext/uchardet/src/nsLatin1Prober.cpp +182 -0
- data/ext/uchardet/src/nsLatin1Prober.h +73 -0
- data/ext/uchardet/src/nsMBCSGroupProber.cpp +242 -0
- data/ext/uchardet/src/nsMBCSGroupProber.h +81 -0
- data/ext/uchardet/src/nsMBCSSM.cpp +513 -0
- data/ext/uchardet/src/nsPkgInt.h +89 -0
- data/ext/uchardet/src/nsSBCSGroupProber.cpp +343 -0
- data/ext/uchardet/src/nsSBCSGroupProber.h +71 -0
- data/ext/uchardet/src/nsSBCharSetProber.cpp +160 -0
- data/ext/uchardet/src/nsSBCharSetProber.h +258 -0
- data/ext/uchardet/src/nsSJISProber.cpp +98 -0
- data/ext/uchardet/src/nsSJISProber.h +81 -0
- data/ext/uchardet/src/nsUTF8Prober.cpp +87 -0
- data/ext/uchardet/src/nsUTF8Prober.h +66 -0
- data/ext/uchardet/src/nsUniversalDetector.cpp +339 -0
- data/ext/uchardet/src/nsUniversalDetector.h +91 -0
- data/ext/uchardet/src/nscore.h +59 -0
- data/ext/uchardet/src/prmem.h +49 -0
- data/ext/uchardet/src/symbols.cmake +41 -0
- data/ext/uchardet/src/tools/CMakeLists.txt +23 -0
- data/ext/uchardet/src/tools/uchardet.cpp +254 -0
- data/ext/uchardet/src/uchardet.cpp +274 -0
- data/ext/uchardet/src/uchardet.h +136 -0
- data/ext/uchardet/test/CMakeLists.txt +47 -0
- data/ext/uchardet/test/ar/iso-8859-6.txt +3 -0
- data/ext/uchardet/test/ar/utf-8.txt +3 -0
- data/ext/uchardet/test/ar/windows-1256.txt +3 -0
- data/ext/uchardet/test/bg/windows-1251.txt +3 -0
- data/ext/uchardet/test/cs/ibm852.txt +4 -0
- data/ext/uchardet/test/cs/iso-8859-2.txt +4 -0
- data/ext/uchardet/test/cs/mac-centraleurope.txt +4 -0
- data/ext/uchardet/test/cs/utf-8.txt +4 -0
- data/ext/uchardet/test/cs/windows-1250.txt +4 -0
- data/ext/uchardet/test/da/iso-8859-1.txt +7 -0
- data/ext/uchardet/test/da/iso-8859-15.txt +10 -0
- data/ext/uchardet/test/da/utf-8.txt +10 -0
- data/ext/uchardet/test/da/windows-1252.txt +10 -0
- data/ext/uchardet/test/de/iso-8859-1.txt +11 -0
- data/ext/uchardet/test/de/windows-1252.txt +11 -0
- data/ext/uchardet/test/el/iso-8859-7.txt +3 -0
- data/ext/uchardet/test/el/utf-8.txt +3 -0
- data/ext/uchardet/test/el/windows-1253.txt +5 -0
- data/ext/uchardet/test/en/ascii.txt +4 -0
- data/ext/uchardet/test/eo/iso-8859-3.txt +7 -0
- data/ext/uchardet/test/es/iso-8859-1.txt +5 -0
- data/ext/uchardet/test/es/iso-8859-15.txt +5 -0
- data/ext/uchardet/test/es/utf-8.txt +5 -0
- data/ext/uchardet/test/es/windows-1252.txt +5 -0
- data/ext/uchardet/test/et/iso-8859-13.txt +6 -0
- data/ext/uchardet/test/et/iso-8859-15.txt +6 -0
- data/ext/uchardet/test/et/iso-8859-4.txt +6 -0
- data/ext/uchardet/test/et/utf-8.txt +6 -0
- data/ext/uchardet/test/et/windows-1252.txt +6 -0
- data/ext/uchardet/test/et/windows-1257.txt +6 -0
- data/ext/uchardet/test/fi/iso-8859-1.txt +8 -0
- data/ext/uchardet/test/fi/utf-8.txt +8 -0
- data/ext/uchardet/test/fr/iso-8859-1.txt +5 -0
- data/ext/uchardet/test/fr/iso-8859-15.txt +16 -0
- data/ext/uchardet/test/fr/utf-16.be +0 -0
- data/ext/uchardet/test/fr/utf-32.le +0 -0
- data/ext/uchardet/test/fr/utf-8.txt +14 -0
- data/ext/uchardet/test/fr/windows-1252.txt +3 -0
- data/ext/uchardet/test/ga/iso-8859-1.txt +6 -0
- data/ext/uchardet/test/ga/utf-8.txt +6 -0
- data/ext/uchardet/test/ga/windows-1252.txt +6 -0
- data/ext/uchardet/test/he/iso-8859-8.txt +2 -0
- data/ext/uchardet/test/he/utf-8.txt +3 -0
- data/ext/uchardet/test/he/windows-1255.txt +1 -0
- data/ext/uchardet/test/hr/ibm852.txt +4 -0
- data/ext/uchardet/test/hr/iso-8859-13.txt +4 -0
- data/ext/uchardet/test/hr/iso-8859-16.txt +4 -0
- data/ext/uchardet/test/hr/iso-8859-2.txt +4 -0
- data/ext/uchardet/test/hr/mac-centraleurope.txt +4 -0
- data/ext/uchardet/test/hr/utf-8.txt +4 -0
- data/ext/uchardet/test/hr/windows-1250.txt +4 -0
- data/ext/uchardet/test/hu/iso-8859-2.txt +3 -0
- data/ext/uchardet/test/hu/windows-1250.txt +1 -0
- data/ext/uchardet/test/it/iso-8859-1.txt +18 -0
- data/ext/uchardet/test/it/utf-8.txt +18 -0
- data/ext/uchardet/test/ja/euc-jp.txt +10 -0
- data/ext/uchardet/test/ja/iso-2022-jp.txt +8 -0
- data/ext/uchardet/test/ja/shift_jis.txt +1 -0
- data/ext/uchardet/test/ja/utf-16be.txt +0 -0
- data/ext/uchardet/test/ja/utf-16le.txt +0 -0
- data/ext/uchardet/test/ja/utf-8.txt +9 -0
- data/ext/uchardet/test/ko/iso-2022-kr.txt +8 -0
- data/ext/uchardet/test/ko/uhc.smi +16 -0
- data/ext/uchardet/test/ko/utf-16.le +0 -0
- data/ext/uchardet/test/ko/utf-32.be +0 -0
- data/ext/uchardet/test/ko/utf-8.txt +3 -0
- data/ext/uchardet/test/lt/iso-8859-10.txt +3 -0
- data/ext/uchardet/test/lt/iso-8859-13.txt +3 -0
- data/ext/uchardet/test/lt/iso-8859-4.txt +3 -0
- data/ext/uchardet/test/lt/utf-8.txt +3 -0
- data/ext/uchardet/test/lv/iso-8859-10.txt +6 -0
- data/ext/uchardet/test/lv/iso-8859-13.txt +6 -0
- data/ext/uchardet/test/lv/iso-8859-4.txt +6 -0
- data/ext/uchardet/test/lv/utf-8.txt +6 -0
- data/ext/uchardet/test/mt/iso-8859-3.txt +4 -0
- data/ext/uchardet/test/mt/utf-8.txt +4 -0
- data/ext/uchardet/test/pl/ibm852.txt +3 -0
- data/ext/uchardet/test/pl/iso-8859-13.txt +3 -0
- data/ext/uchardet/test/pl/iso-8859-16.txt +3 -0
- data/ext/uchardet/test/pl/iso-8859-2.txt +3 -0
- data/ext/uchardet/test/pl/mac-centraleurope.txt +3 -0
- data/ext/uchardet/test/pl/utf-8.txt +3 -0
- data/ext/uchardet/test/pl/windows-1250.txt +3 -0
- data/ext/uchardet/test/pt/iso-8859-1.txt +6 -0
- data/ext/uchardet/test/pt/utf-8.txt +6 -0
- data/ext/uchardet/test/ro/ibm852.txt +9 -0
- data/ext/uchardet/test/ro/iso-8859-16.txt +9 -0
- data/ext/uchardet/test/ro/utf-8.txt +9 -0
- data/ext/uchardet/test/ro/windows-1250.txt +9 -0
- data/ext/uchardet/test/ru/ibm855.txt +5 -0
- data/ext/uchardet/test/ru/ibm866.txt +11 -0
- data/ext/uchardet/test/ru/iso-8859-5.txt +3 -0
- data/ext/uchardet/test/ru/koi8-r.txt +1 -0
- data/ext/uchardet/test/ru/mac-cyrillic.txt +9 -0
- data/ext/uchardet/test/ru/windows-1251.txt +4 -0
- data/ext/uchardet/test/sk/ibm852.txt +3 -0
- data/ext/uchardet/test/sk/iso-8859-2.txt +3 -0
- data/ext/uchardet/test/sk/mac-centraleurope.txt +3 -0
- data/ext/uchardet/test/sk/utf-8.txt +3 -0
- data/ext/uchardet/test/sk/windows-1250.txt +3 -0
- data/ext/uchardet/test/sl/ibm852.txt +9 -0
- data/ext/uchardet/test/sl/iso-8859-16.txt +9 -0
- data/ext/uchardet/test/sl/iso-8859-2.txt +9 -0
- data/ext/uchardet/test/sl/mac-centraleurope.txt +9 -0
- data/ext/uchardet/test/sl/utf-8.txt +9 -0
- data/ext/uchardet/test/sl/windows-1250.txt +9 -0
- data/ext/uchardet/test/sv/iso-8859-1.txt +10 -0
- data/ext/uchardet/test/sv/utf-8.txt +10 -0
- data/ext/uchardet/test/sv/windows-1252.txt +10 -0
- data/ext/uchardet/test/th/iso-8859-11.txt +5 -0
- data/ext/uchardet/test/th/tis-620.txt +5 -0
- data/ext/uchardet/test/th/utf-8.txt +1 -0
- data/ext/uchardet/test/tr/iso-8859-3.txt +13 -0
- data/ext/uchardet/test/tr/iso-8859-9.txt +13 -0
- data/ext/uchardet/test/uchardet-tests.c +130 -0
- data/ext/uchardet/test/vi/utf-8.txt +4 -0
- data/ext/uchardet/test/vi/viscii.txt +4 -0
- data/ext/uchardet/test/vi/windows-1258.txt +4 -0
- data/ext/uchardet/test/zh/big5.txt +1 -0
- data/ext/uchardet/test/zh/euc-tw.txt +1 -0
- data/ext/uchardet/test/zh/gb18030.txt +1 -0
- data/ext/uchardet/test/zh/utf-8.txt +1 -0
- data/ext/uchardet/uchardet.doap +51 -0
- data/ext/uchardet/uchardet.pc.in +10 -0
- data/lib/cchardet.rb +56 -0
- data/lib/cchardet/lib_finder.rb +32 -0
- data/lib/cchardet/version.rb +5 -0
- metadata +362 -0
|
@@ -0,0 +1,8 @@
|
|
|
1
|
+
ISO/IEC 2022$B!J5l>N(B ISO 2022$B!K$O!"(B
|
|
2
|
+
|
|
3
|
+
$BJ8;z=89g$r(B7$B%S%C%HId9f$^$?$O(B8$B%S%C%HId9f$GI=8=$9$k$?$a$N5;=Q!"$*$h$S(B
|
|
4
|
+
$BJ#?t$NJ8;z=89g$rC10l$NJ8;zId9f2=J}<0$K4^$a$k5;=Q(B
|
|
5
|
+
|
|
6
|
+
$B$r5,Dj$9$k(BISO$B5,3J$G$"$k!#(BJIS$B$NBP1~5,3J$O(BJIS X 0202 $B!V>pJs5;=Q(B-$BJ8;zId9f$N9=B$5Z$S3HD%K!!W(B[1]$B!#(BEcma International$B$NBP1~5,3J$O(BECMA-35$B!#(B
|
|
7
|
+
|
|
8
|
+
ISO/IEC 2022 $B$NId9f2=J}<0$O!"0lHL$K!"(B1$BJ8;z$K(B1$B%P%$%H$+(B2$B%P%$%H0J>e$r;H$&2DJQD9$NJ8;zId9f2=J}<0$G$"$k!#$$$/$D$+$NId9f2=I=8=$,(BISO/IEC 2022$B$N5!9=$r;H$C$F$$$k!#$?$H$($P!"(BISO-2022-JP$B$OF|K\8l$G9-$/;H$o$l$F$$$kId9f2=I=8=$G$"$j!"$$$o$f$k!V(BJIS$B%3!<%I!W$H$$$&$N$b$3$l$r;X$9$3$H$,0lHLE*$G$"$k!#(B
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
���{����{����{����{����{����{����{����{����{����{����{����{����{����{����{����{����{����{����{��
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。
|
|
2
|
+
|
|
3
|
+
正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある[1]。
|
|
4
|
+
|
|
5
|
+
2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。
|
|
6
|
+
|
|
7
|
+
データ交換方式、ファイル形式として、一般的にUTF-8は使われる傾向にある。
|
|
8
|
+
|
|
9
|
+
当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された
|
|
@@ -0,0 +1,8 @@
|
|
|
1
|
+
$)CISO/IEC 20224B
|
|
2
|
+
|
|
3
|
+
9.@Z A}GU@; 7:qF. :NH# 6G4B 8:qF. :NH#7N G%GvGO1b @'GQ 1b<z
|
|
4
|
+
5Q @L;s@G 9.@Z A}GU@; GO3*@G 9.@Z :NH#H- 9f=D@87N 8p5N G%GvGO4B 1b<z
|
|
5
|
+
|
|
6
|
+
@; 1TA$GO4B ISO G%AX@L4Y.
|
|
7
|
+
|
|
8
|
+
ISO/IEC 2022@G :NH#H- 9f=D@: Ek;s 9.@Z GO3*?! 19Y@LF.3* 29Y@LF. @L;s@; >24B 0!:/ 9.@Z :NH#H- 9f=D@L8g GQ19>n@G 0f?l EUC-KR@L @L :NH#H- 9f=D@; ;g?kGQ4Y.
|
|
@@ -0,0 +1,16 @@
|
|
|
1
|
+
<SAMI>
|
|
2
|
+
<HEAD>
|
|
3
|
+
<TITLE>EUC-KR.smi</TITLE>
|
|
4
|
+
<STYLE TYPE="text/css">
|
|
5
|
+
</STYLE>
|
|
6
|
+
</HEAD>
|
|
7
|
+
<BODY>
|
|
8
|
+
<SYNC Start=0000><P>EUC-KR
|
|
9
|
+
<SYNC Start=1000><P>EUC-KR�� KS X 1001�� KS X 1003�� ����ϴ� 8��Ʈ ���� ���ڵ�����, EUC�� �����̸� ��ǥ���� �ѱ� �ϼ��� ���ڵ��̱� ������ ���� �ϼ����̶�� �Ҹ���.
|
|
10
|
+
<SYNC Start=2000><P>EUC-KR ���ڵ��� ������ ���� �����ȴ�.
|
|
11
|
+
<SYNC Start=3000><P>128���� ���� ����Ʈ�� KS X 1003�� ����Ѵ�.
|
|
12
|
+
<SYNC Start=4000><P>128���� ũ�ų� ���� ����Ʈ�� KS X 1001�� ����Ѵ�. �� ���ڴ� ��� ���� 128�� ���� �ڵ尪�� ����Ͽ� 2����Ʈ�� ǥ���ȴ�.
|
|
13
|
+
<SYNC Start=5000><P>���� KS X 1001�� 40-27�� ���� "��"��� ���ڴ� EUC-KR���� C0 A7��� ����Ʈ ���� ǥ���ȴ�.
|
|
14
|
+
<SYNC Start=6000><P>KS X 1001���� �ѱ� ä�� ���ڸ� ����Ͽ� ���� ���� ���տ� ���Ե��� ���� �ѱ��� ǥ���ϴ� Ȯ�� ����� ������, ��κ��� ��� �� ����� EUC-KR���� ������ �ʰ� ��� CP949�� ���� �ٸ� ����� ����Ͽ� KS X 1001 �ٱ��� ���� �ѱ��� ǥ���Ѵ�.
|
|
15
|
+
</BODY>
|
|
16
|
+
</SAMI>
|
|
Binary file
|
|
Binary file
|
|
@@ -0,0 +1,3 @@
|
|
|
1
|
+
UTF-8은 유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나로, 켄 톰프슨과 롭 파이크가 만들었다. 본래는 FSS-UTF(File System Safe UCS/Unicode Transformation Format)라는 이름으로 제안되었다.
|
|
2
|
+
|
|
3
|
+
UTF-8 인코딩은 유니코드 한 문자를 나타내기 위해 1바이트에서 4바이트까지를 사용한다. 예를 들어서, U+0000부터 U+007F 범위에 있는 ASCII 문자들은 UTF-8에서 1바이트만으로 표시된다. 4바이트로 표현되는 문자는 모두 기본 다국어 평면(BMP) 바깥의 유니코드 문자이며, 거의 사용되지 않는다. UTF-16과 UTF-8 중 어느 인코딩이 더 적은 바이트를 사용하는지는 문자열에서 사용된 코드 포인트에 따라 달라지며, 실제로 DEFLATE와 같은 일반적인 압축 알고리즘을 사용할 경우 이 차이는 무시할 수 있을 정도이다. 이러한 압축 알고리즘을 사용하기 힘들고 크기가 중요할 경우 유니코드 표준 압축 방식을 대신 사용할 수 있다.
|
|
@@ -0,0 +1,6 @@
|
|
|
1
|
+
Vinsents Villems van Gogs (n�derlandie�u: Vincent Willem van Gogh, dzimis 1853.
|
|
2
|
+
gada 30. mart�, miris 1890. gada 29. j�lij�) bija n�derlandie�u gleznot�js,
|
|
3
|
+
postimpresionisma p�rst�vis. Kopum� van Gogs rad�ja vair�k nek� 2000 darbu, to
|
|
4
|
+
skait� 900 gleznu un 1100 z�m�jumu un ski�u. Savus slaven�kos darbus vi� rad�ja
|
|
5
|
+
p�d�jo divu dz�ves gadu laik�. Tiek uzskat�ts, ka van Gogs b�tiski ir ietekm�jis
|
|
6
|
+
20. gadsimta m�kslu, tostarp ekspresionismu un fovismu.
|
|
@@ -0,0 +1,6 @@
|
|
|
1
|
+
Vinsents Villems van Gogs (n�derlandie�u: Vincent Willem van Gogh, dzimis 1853.
|
|
2
|
+
gada 30. mart�, miris 1890. gada 29. j�lij�) bija n�derlandie�u gleznot�js,
|
|
3
|
+
postimpresionisma p�rst�vis. Kopum� van Gogs rad�ja vair�k nek� 2000 darbu, to
|
|
4
|
+
skait� 900 gleznu un 1100 z�m�jumu un ski�u. Savus slaven�kos darbus vi�� rad�ja
|
|
5
|
+
p�d�jo divu dz�ves gadu laik�. Tiek uzskat�ts, ka van Gogs b�tiski ir ietekm�jis
|
|
6
|
+
20. gadsimta m�kslu, tostarp ekspresionismu un fovismu.
|
|
@@ -0,0 +1,6 @@
|
|
|
1
|
+
Vinsents Villems van Gogs (n�derlandie�u: Vincent Willem van Gogh, dzimis 1853.
|
|
2
|
+
gada 30. mart�, miris 1890. gada 29. j�lij�) bija n�derlandie�u gleznot�js,
|
|
3
|
+
postimpresionisma p�rst�vis. Kopum� van Gogs rad�ja vair�k nek� 2000 darbu, to
|
|
4
|
+
skait� 900 gleznu un 1100 z�m�jumu un ski�u. Savus slaven�kos darbus vi� rad�ja
|
|
5
|
+
p�d�jo divu dz�ves gadu laik�. Tiek uzskat�ts, ka van Gogs b�tiski ir ietekm�jis
|
|
6
|
+
20. gadsimta m�kslu, tostarp ekspresionismu un fovismu.
|
|
@@ -0,0 +1,6 @@
|
|
|
1
|
+
Vinsents Villems van Gogs (nīderlandiešu: Vincent Willem van Gogh, dzimis 1853.
|
|
2
|
+
gada 30. martā, miris 1890. gada 29. jūlijā) bija nīderlandiešu gleznotājs,
|
|
3
|
+
postimpresionisma pārstāvis. Kopumā van Gogs radīja vairāk nekā 2000 darbu, to
|
|
4
|
+
skaitā 900 gleznu un 1100 zīmējumu un skiču. Savus slavenākos darbus viņš radīja
|
|
5
|
+
pēdējo divu dzīves gadu laikā. Tiek uzskatīts, ka van Gogs būtiski ir ietekmējis
|
|
6
|
+
20. gadsimta mākslu, tostarp ekspresionismu un fovismu.
|
|
@@ -0,0 +1,6 @@
|
|
|
1
|
+
Albertossauro (Albertosaurus sp., que significa "lagarto de Alberta" no Canad�),
|
|
2
|
+
foi um g�nero de dinossauro carn�voro e b�pede presente no fim do per�odo
|
|
3
|
+
Cret�ceo. Media cerca de 8 a 9 metros de comprimento, 3 metros de altura e
|
|
4
|
+
pesava menos de 2 toneladas. O Albertossauro viveu na Am�rica do Norte e foi
|
|
5
|
+
descoberto no ano de 1884 por Joseph Burr Tyrrell em Alberta, no Canad�, local
|
|
6
|
+
ao qual deve seu nome.
|
|
@@ -0,0 +1,6 @@
|
|
|
1
|
+
Albertossauro (Albertosaurus sp., que significa "lagarto de Alberta" no Canadá),
|
|
2
|
+
foi um género de dinossauro carnívoro e bípede presente no fim do período
|
|
3
|
+
Cretáceo. Media cerca de 8 a 9 metros de comprimento, 3 metros de altura e
|
|
4
|
+
pesava menos de 2 toneladas. O Albertossauro viveu na América do Norte e foi
|
|
5
|
+
descoberto no ano de 1884 por Joseph Burr Tyrrell em Alberta, no Canadá, local
|
|
6
|
+
ao qual deve seu nome.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Danemarca (�n danez� Sunet Danmark), oficial Regatul Danemarcei (�n
|
|
2
|
+
danez� Sunet Kongeriget Danmark), este un stat suveran din
|
|
3
|
+
Europa de Nord, av�nd si dou� t�ri constituente de peste m�ri, care fac parte
|
|
4
|
+
integrant� din regat: Insulele Feroe �n Atlanticul de Nord si Groenlanda �n
|
|
5
|
+
America de Nord. Danemarca propriu-zis�[a] este cea mai de sud dintre t�rile
|
|
6
|
+
nordice, aflat� la sud-vest de Suedia si la sud de Norvegia, �nvecin�ndu-se la
|
|
7
|
+
sud cu Germania. Tara const� dintr-o peninsul� mare, Iutlanda, si mai multe
|
|
8
|
+
insule, dintre care cele mai mari sunt Zealand, Funen, Lolland, Falster si
|
|
9
|
+
Bornholm, precum si sute de insulite denumite �n general ,,Arhipelagul Danez".
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Danemarca (�n danez� Sunet Danmark), oficial Regatul Danemarcei (�n
|
|
2
|
+
danez� Sunet Kongeriget Danmark), este un stat suveran din
|
|
3
|
+
Europa de Nord, av�nd �i dou� ��ri constituente de peste m�ri, care fac parte
|
|
4
|
+
integrant� din regat: Insulele Feroe �n Atlanticul de Nord �i Groenlanda �n
|
|
5
|
+
America de Nord. Danemarca propriu-zis�[a] este cea mai de sud dintre ��rile
|
|
6
|
+
nordice, aflat� la sud-vest de Suedia �i la sud de Norvegia, �nvecin�ndu-se la
|
|
7
|
+
sud cu Germania. �ara const� dintr-o peninsul� mare, Iutlanda, �i mai multe
|
|
8
|
+
insule, dintre care cele mai mari sunt Zealand, Funen, Lolland, Falster �i
|
|
9
|
+
Bornholm, precum �i sute de insuli�e denumite �n general �Arhipelagul Danez�.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Danemarca (în daneză Sunet Danmark), oficial Regatul Danemarcei (în
|
|
2
|
+
daneză Sunet Kongeriget Danmark), este un stat suveran din
|
|
3
|
+
Europa de Nord, având și două țări constituente de peste mări, care fac parte
|
|
4
|
+
integrantă din regat: Insulele Feroe în Atlanticul de Nord și Groenlanda în
|
|
5
|
+
America de Nord. Danemarca propriu-zisă[a] este cea mai de sud dintre țările
|
|
6
|
+
nordice, aflată la sud-vest de Suedia și la sud de Norvegia, învecinându-se la
|
|
7
|
+
sud cu Germania. Țara constă dintr-o peninsulă mare, Iutlanda, și mai multe
|
|
8
|
+
insule, dintre care cele mai mari sunt Zealand, Funen, Lolland, Falster și
|
|
9
|
+
Bornholm, precum și sute de insulițe denumite în general „Arhipelagul Danez”.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Danemarca (�n danez� Sunet Danmark), oficial Regatul Danemarcei (�n
|
|
2
|
+
danez� Sunet Kongeriget Danmark), este un stat suveran din
|
|
3
|
+
Europa de Nord, av�nd si dou� t�ri constituente de peste m�ri, care fac parte
|
|
4
|
+
integrant� din regat: Insulele Feroe �n Atlanticul de Nord si Groenlanda �n
|
|
5
|
+
America de Nord. Danemarca propriu-zis�[a] este cea mai de sud dintre t�rile
|
|
6
|
+
nordice, aflat� la sud-vest de Suedia si la sud de Norvegia, �nvecin�ndu-se la
|
|
7
|
+
sud cu Germania. Tara const� dintr-o peninsul� mare, Iutlanda, si mai multe
|
|
8
|
+
insule, dintre care cele mai mari sunt Zealand, Funen, Lolland, Falster si
|
|
9
|
+
Bornholm, precum si sute de insulite denumite �n general �Arhipelagul Danez�.
|
|
@@ -0,0 +1,5 @@
|
|
|
1
|
+
CP855 -- Ʒ��з���Ơ� �֦��� ���Է�� ��� MS-DOS � �֦֢�� �� �بᠤ����� ����. ��М���� �� ������ �� Ԡ��� ISO 8859-5.
|
|
2
|
+
|
|
3
|
+
ը�֬�� ������ ���������Р�� � �ᢷ�, Ӡƨ��Է� � ��Ь�᷷, �� � ���㷷 Ԩ ���Р��.
|
|
4
|
+
|
|
5
|
+
ݨ��� �����Ԡ �֦��ֽ 堢з�� ���ؠ���� � ASCII. ���Р �֦ ����ҷ ֢��Ԡ���� ����Ԡ�������� �֦ ����� � �Է�֦�.
|
|
@@ -0,0 +1,11 @@
|
|
|
1
|
+
<<����ୠ⨢��� ������>> (<<����ୠ⨢��� ������ ����>>) -- �᭮������ ��
|
|
2
|
+
CP437 ������� ��࠭��, ��� �� ᯥ���᪨� ��ய��᪨� ᨬ���� �� ��ன
|
|
3
|
+
�������� �������� �� ��ਫ����, ��⠢��� �ᥢ������᪨� ᨬ���� �����묨.
|
|
4
|
+
�������⥫쭮, �� �� ����� ��� �ணࠬ�, �ᯮ������ ��� ࠡ��� ⥪�⮢�
|
|
5
|
+
����, � ⠪�� ���ᯥ稢��� �ᯮ�짮����� � ��� ᨬ����� ��ਫ����.
|
|
6
|
+
|
|
7
|
+
�����᪨ ����⢮���� ����� ��ਠ�⮢ ����ୠ⨢��� ������, �� ��
|
|
8
|
+
ࠧ���� ������� ⮫쪮 ������ 0xF0 -- 0xFF (240--255). �ᯮ�짮������
|
|
9
|
+
�ᥢ������� ���䨪����-ᠬ������, ��ᠢ訥�� ������ᨬ� ���묨
|
|
10
|
+
�ணࠬ���⠬�, �����࠭���� �� ��������� � �१ ।��� ���������
|
|
11
|
+
業���.
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
���-8 (��� ������ �����������, 8 �����), KOI8 - ������������� ������� ��������, ����������� � ASCII. ����������� ��� ����������� ���� ������������� ���������. ���� ������ �������������� ��� �������� ������� ��������� � Unix-����������� �� � � ����������� �����, ������ ����� � 2010 ����, � ���������������� �������, ���������� ������� �� ������������.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
��������� MacCyrillic ������������ ������ �� ����������� nj��������.
|
|
2
|
+
|
|
3
|
+
��������� ���������� ������������� � ��������� ����������� �������� ���
|
|
4
|
+
��������� �������� �������� ����� �������� ��������; ����� ����, ������������
|
|
5
|
+
��� �������������� �����, ����������� ��� ������ ����������� (����� �),
|
|
6
|
+
������������, ������������ � ��������� ������.
|
|
7
|
+
|
|
8
|
+
������ ����� ������� ��������� (��������) ��������� ������������� ���������
|
|
9
|
+
ASCII. ����� ��� ������� ���������� ����������������� ��� ����� � �������.
|
|
@@ -0,0 +1,4 @@
|
|
|
1
|
+
Windows-1251
|
|
2
|
+
����� �������� � ���������, ���������� ����������� 8-������ ���������� ��� ���� ������� ������ Microsoft Windows. ���������� �������� ������� �������������. ���� ������� �� ���� ���������, ���������������� � ������ ������������� ������������� Windows � 1990�1991 ��. ��������� ��������������� ����������, �������� � ����������� ��������� Microsoft. �������������� ������� ��������� ������ ��������� �� ��������������� ���� � ������� (� ���������, ��� ���� ������������ ����� ������ ������).
|
|
3
|
+
|
|
4
|
+
Windows-1251 ������� ���������� �� ������ 8-������ ������������� ��������� (����� ��� CP866, KOI8-R � ISO 8859-5) �������� ����������� ���� ��������, �������������� � ������� ����������� ��� �������� ������ (����������� ������ ������ ��������); ��� ����� �������� ��� ������� ��� ������ ���������� ������: �����������, ������������, ���������, ������������ � �����������.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Naselj�vi plan�t je planet ali naravni satelit (redkeje tudi asteroid[1]), ki je
|
|
2
|
+
zmo�en razviti in ohranjati �ivljenje.
|
|
3
|
+
|
|
4
|
+
Ker je obstoj nezemeljskega �ivljenja trenutno negotov, je raziskovanje
|
|
5
|
+
naseljivih planetov v glavnem ekstrapolacija razmer na Zemlji in zna�ilnosti
|
|
6
|
+
Sonca in celotnega Oson�ja, ki govorijo v prid razvitju �ivljenja. �e posebej so
|
|
7
|
+
pomembni faktorji, ki so ohranili zapletene, mnogoceli�ne organizme in ne le
|
|
8
|
+
preprosta, enoceli�na �iva bitja, mikroorganizme. Raziskovanje in teorija v tej
|
|
9
|
+
smeri je del planetologije in razvijajo�e astrobiologije.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Naselj�vi plan�t je planet ali naravni satelit (redkeje tudi asteroid[1]), ki je
|
|
2
|
+
zmo�en razviti in ohranjati �ivljenje.
|
|
3
|
+
|
|
4
|
+
Ker je obstoj nezemeljskega �ivljenja trenutno negotov, je raziskovanje
|
|
5
|
+
naseljivih planetov v glavnem ekstrapolacija razmer na Zemlji in zna�ilnosti
|
|
6
|
+
Sonca in celotnega Oson�ja, ki govorijo v prid razvitju �ivljenja. �e posebej so
|
|
7
|
+
pomembni faktorji, ki so ohranili zapletene, mnogoceli�ne organizme in ne le
|
|
8
|
+
preprosta, enoceli�na �iva bitja, mikroorganizme. Raziskovanje in teorija v tej
|
|
9
|
+
smeri je del planetologije in razvijajo�e astrobiologije.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Naselj�vi plan�t je planet ali naravni satelit (redkeje tudi asteroid[1]), ki je
|
|
2
|
+
zmo�en razviti in ohranjati �ivljenje.
|
|
3
|
+
|
|
4
|
+
Ker je obstoj nezemeljskega �ivljenja trenutno negotov, je raziskovanje
|
|
5
|
+
naseljivih planetov v glavnem ekstrapolacija razmer na Zemlji in zna�ilnosti
|
|
6
|
+
Sonca in celotnega Oson�ja, ki govorijo v prid razvitju �ivljenja. �e posebej so
|
|
7
|
+
pomembni faktorji, ki so ohranili zapletene, mnogoceli�ne organizme in ne le
|
|
8
|
+
preprosta, enoceli�na �iva bitja, mikroorganizme. Raziskovanje in teorija v tej
|
|
9
|
+
smeri je del planetologije in razvijajo�e astrobiologije.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Naselj�vi plan�t je planet ali naravni satelit (redkeje tudi asteroid[1]), ki je
|
|
2
|
+
zmo�en razviti in ohranjati �ivljenje.
|
|
3
|
+
|
|
4
|
+
Ker je obstoj nezemeljskega �ivljenja trenutno negotov, je raziskovanje
|
|
5
|
+
naseljivih planetov v glavnem ekstrapolacija razmer na Zemlji in zna�ilnosti
|
|
6
|
+
Sonca in celotnega Oson�ja, ki govorijo v prid razvitju �ivljenja. �e posebej so
|
|
7
|
+
pomembni faktorji, ki so ohranili zapletene, mnogoceli�ne organizme in ne le
|
|
8
|
+
preprosta, enoceli�na �iva bitja, mikroorganizme. Raziskovanje in teorija v tej
|
|
9
|
+
smeri je del planetologije in razvijajo�e astrobiologije.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Naseljívi planét je planet ali naravni satelit (redkeje tudi asteroid[1]), ki je
|
|
2
|
+
zmožen razviti in ohranjati življenje.
|
|
3
|
+
|
|
4
|
+
Ker je obstoj nezemeljskega življenja trenutno negotov, je raziskovanje
|
|
5
|
+
naseljivih planetov v glavnem ekstrapolacija razmer na Zemlji in značilnosti
|
|
6
|
+
Sonca in celotnega Osončja, ki govorijo v prid razvitju življenja. Še posebej so
|
|
7
|
+
pomembni faktorji, ki so ohranili zapletene, mnogocelične organizme in ne le
|
|
8
|
+
preprosta, enocelična živa bitja, mikroorganizme. Raziskovanje in teorija v tej
|
|
9
|
+
smeri je del planetologije in razvijajoče astrobiologije.
|
|
@@ -0,0 +1,9 @@
|
|
|
1
|
+
Naselj�vi plan�t je planet ali naravni satelit (redkeje tudi asteroid[1]), ki je
|
|
2
|
+
zmo�en razviti in ohranjati �ivljenje.
|
|
3
|
+
|
|
4
|
+
Ker je obstoj nezemeljskega �ivljenja trenutno negotov, je raziskovanje
|
|
5
|
+
naseljivih planetov v glavnem ekstrapolacija razmer na Zemlji in zna�ilnosti
|
|
6
|
+
Sonca in celotnega Oson�ja, ki govorijo v prid razvitju �ivljenja. �e posebej so
|
|
7
|
+
pomembni faktorji, ki so ohranili zapletene, mnogoceli�ne organizme in ne le
|
|
8
|
+
preprosta, enoceli�na �iva bitja, mikroorganizme. Raziskovanje in teorija v tej
|
|
9
|
+
smeri je del planetologije in razvijajo�e astrobiologije.
|
|
@@ -0,0 +1,10 @@
|
|
|
1
|
+
M�lle �r en t�tort p� Kullahalv�n i Brunnby socken i H�gan�s kommun, Sk�ne l�n.
|
|
2
|
+
|
|
3
|
+
Samh�llet var fr�n b�rjan ett fiskel�ge, men kom att spela en stor roll i den
|
|
4
|
+
framv�xande turismen i Sverige i slutet av 1800-talet. Till detta bidrog - och
|
|
5
|
+
bidrar - M�lles natursk�na l�ge invid �resunds norra utlopp, med Kullaberg som
|
|
6
|
+
bakgrund. Gemensamhetsbad f�r m�n och kvinnor introducerades i Ransvik i b�rjan
|
|
7
|
+
av 1900-talet. Storhetstiden som turistort intr�ffade strax f�re f�rsta
|
|
8
|
+
v�rldskriget, men �ven under mellankrigstiden var turiststr�mmarna stora.
|
|
9
|
+
Fortfarande �r M�lle en popul�r turistort med en tredubbling av inv�narantalet
|
|
10
|
+
under sommarm�naderna.
|
|
@@ -0,0 +1,10 @@
|
|
|
1
|
+
Mölle är en tätort på Kullahalvön i Brunnby socken i Höganäs kommun, Skåne län.
|
|
2
|
+
|
|
3
|
+
Samhället var från början ett fiskeläge, men kom att spela en stor roll i den
|
|
4
|
+
framväxande turismen i Sverige i slutet av 1800-talet. Till detta bidrog – och
|
|
5
|
+
bidrar – Mölles natursköna läge invid Öresunds norra utlopp, med Kullaberg som
|
|
6
|
+
bakgrund. Gemensamhetsbad för män och kvinnor introducerades i Ransvik i början
|
|
7
|
+
av 1900-talet. Storhetstiden som turistort inträffade strax före första
|
|
8
|
+
världskriget, men även under mellankrigstiden var turistströmmarna stora.
|
|
9
|
+
Fortfarande är Mölle en populär turistort med en tredubbling av invånarantalet
|
|
10
|
+
under sommarmånaderna.
|
|
@@ -0,0 +1,10 @@
|
|
|
1
|
+
M�lle �r en t�tort p� Kullahalv�n i Brunnby socken i H�gan�s kommun, Sk�ne l�n.
|
|
2
|
+
|
|
3
|
+
Samh�llet var fr�n b�rjan ett fiskel�ge, men kom att spela en stor roll i den
|
|
4
|
+
framv�xande turismen i Sverige i slutet av 1800-talet. Till detta bidrog � och
|
|
5
|
+
bidrar � M�lles natursk�na l�ge invid �resunds norra utlopp, med Kullaberg som
|
|
6
|
+
bakgrund. Gemensamhetsbad f�r m�n och kvinnor introducerades i Ransvik i b�rjan
|
|
7
|
+
av 1900-talet. Storhetstiden som turistort intr�ffade strax f�re f�rsta
|
|
8
|
+
v�rldskriget, men �ven under mellankrigstiden var turiststr�mmarna stora.
|
|
9
|
+
Fortfarande �r M�lle en popul�r turistort med en tredubbling av inv�narantalet
|
|
10
|
+
under sommarm�naderna.
|
|
@@ -0,0 +1,5 @@
|
|
|
1
|
+
TIS-620
|
|
2
|
+
|
|
3
|
+
��ҵðҹ��Ե�ѳ���ص��ˡ��� 620-2533, �͡.620-2533, ���ͷ�����ѡ�ѹ�������� TIS-620 �繪ش�ѡ����ҵðҹ�ص��ˡ����ͧ�� �ժ��������� ��������Ѻ�ѡ����·����Ѻ����������
|
|
4
|
+
|
|
5
|
+
���� TIS-620 ����������´��������� ISO-8859-11 �ҡ ᵡ��ҧ�ѹ����§��� ISO-8859-11 ��˹���� A0 �� "�����äẺ���Ѵ��" (no-break space) ��ǹ TIS-620 �������ʧǹ���˹� A0 ������ ���������˹����� � ���
|
|
@@ -0,0 +1,5 @@
|
|
|
1
|
+
TIS-620
|
|
2
|
+
|
|
3
|
+
�ҵðҹ��Ե�ѳ���ص��ˡ��� 620-2533, �͡.620-2533, ���ͷ�����ѡ�ѹ�������� TIS-620 �繪ش�ѡ����ҵðҹ�ص��ˡ����ͧ�� �ժ��������� ��������Ѻ�ѡ����·����Ѻ����������
|
|
4
|
+
|
|
5
|
+
���� TIS-620 ����������´��������� ISO-8859-11 �ҡ ᵡ��ҧ�ѹ����§��� ISO-8859-11 ��˹���� A0 �� "�����äẺ���Ѵ��" (no-break space) ��ǹ TIS-620 �������ʧǹ���˹� A0 ������ ���������˹����� � ���
|
|
@@ -0,0 +1 @@
|
|
|
1
|
+
ยูนิโคด (อังกฤษ: Unicode) คือมาตรฐานอุตสาหกรรมที่ช่วยให้คอมพิวเตอร์แสดงผลและจัดการข้อความธรรมดาที่ใช้ในระบบการเขียนของภาษาส่วนใหญ่ในโลกได้อย่างสอดคล้องกัน ยูนิโคดประกอบด้วยรายการอักขระที่แสดงผลได้มากกว่า 100,000 ตัว พัฒนาต่อยอดมาจากมาตรฐานชุดอักขระสากล (Universal Character Set: UCS) และมีการตีพิมพ์ลงในหนังสือ The Unicode Standard เป็นแผนผังรหัสเพื่อใช้เป็นรายการอ้างอิง นอกจากนั้นยังมีการอธิบายวิธีการที่ใช้เข้ารหัสและการนำเสนอมาตรฐานของการเข้ารหัสอักขระอีกจำนวนหนึ่ง การเรียงลำดับอักษร กฎเกณฑ์ของการรวมและการแยกอักขระ รวมไปถึงลำดับการแสดงผลของอักขระสองทิศทาง (เช่นอักษรอาหรับหรืออักษรฮีบรูที่เขียนจากขวาไปซ้าย)
|
|
@@ -0,0 +1,13 @@
|
|
|
1
|
+
T�rk�e, T�rk dili ya da T�rkiye T�rk�esi, bat�da Balkanlar'dan ba�lay�p do�uda
|
|
2
|
+
Hazar Denizi sahas�na kadar konu�ulan Altay dillerinden biridir. Ya��, en eski
|
|
3
|
+
hesaplara g�re 8500 olan T�rk�e, bug�n ya�ayan D�nya dilleri aras�nda en eski
|
|
4
|
+
yaz�l� belgelere sahip olan dildir. Bu belgeler, �ivi yaz�l� S�merce
|
|
5
|
+
tabletlerdeki al�nt� kelimelerdir.[12] T�rk yaz� dilleri i�inde O�uz sahas� yaz�
|
|
6
|
+
dillerinden Osmanl� T�rk�esinin devam�n� olu�turur. Ba�ta T�rkiye olmak �zere
|
|
7
|
+
eski Osmanl� �mparatorlu�u co�rafyas�nda konu�ulan T�rk�e, d�nyada en fazla
|
|
8
|
+
konu�ulan 5. dildir. T�rk�e sondan eklemeli bir dildir.[13] Bundan �t�r�
|
|
9
|
+
kullan�lan herhangi bir eylem �zerinden istenildi�i kadar s�zc�k
|
|
10
|
+
t�retilebilir.[14] T�rkiye T�rk�esi bu y�n�nden dolay� di�er T�rk dilleriyle
|
|
11
|
+
ortak ya da ayr�k bulunan onlarca eke sahiptir.[15] T�rk�e �ok geni�
|
|
12
|
+
kullan�m�yla birlikte zengin bir dil olmas�n�n yan� s�ra, genel itibar�yla
|
|
13
|
+
"�zne-nesne-y�klem" bi�imindeki c�mle kurulu�una sahiptir.
|
|
@@ -0,0 +1,13 @@
|
|
|
1
|
+
T�rk�e, T�rk dili ya da T�rkiye T�rk�esi, bat�da Balkanlar'dan ba�lay�p do�uda
|
|
2
|
+
Hazar Denizi sahas�na kadar konu�ulan Altay dillerinden biridir. Ya��, en eski
|
|
3
|
+
hesaplara g�re 8500 olan T�rk�e, bug�n ya�ayan D�nya dilleri aras�nda en eski
|
|
4
|
+
yaz�l� belgelere sahip olan dildir. Bu belgeler, �ivi yaz�l� S�merce
|
|
5
|
+
tabletlerdeki al�nt� kelimelerdir.[12] T�rk yaz� dilleri i�inde O�uz sahas� yaz�
|
|
6
|
+
dillerinden Osmanl� T�rk�esinin devam�n� olu�turur. Ba�ta T�rkiye olmak �zere
|
|
7
|
+
eski Osmanl� �mparatorlu�u co�rafyas�nda konu�ulan T�rk�e, d�nyada en fazla
|
|
8
|
+
konu�ulan 5. dildir. T�rk�e sondan eklemeli bir dildir.[13] Bundan �t�r�
|
|
9
|
+
kullan�lan herhangi bir eylem �zerinden istenildi�i kadar s�zc�k
|
|
10
|
+
t�retilebilir.[14] T�rkiye T�rk�esi bu y�n�nden dolay� di�er T�rk dilleriyle
|
|
11
|
+
ortak ya da ayr�k bulunan onlarca eke sahiptir.[15] T�rk�e �ok geni�
|
|
12
|
+
kullan�m�yla birlikte zengin bir dil olmas�n�n yan� s�ra, genel itibar�yla
|
|
13
|
+
"�zne-nesne-y�klem" bi�imindeki c�mle kurulu�una sahiptir.
|