TSCII
TSCII (Tamil Script Code for Information Interchange、情報交換用タミル文字符号) はタミル文字を表現するための符号化方式である。下位128個の符号位置は純粋なASCIIで、上位128個の符号位置はTSCII特有である。インターネットでは長い間私的な合意にのみ基づいて使われていたが、2007年にIANAへの登録に成功した[1]。
TSCIIはタミル文字タイプライタを使うときと同様、文字を視覚的な (書かれる) 順序で符号化する。
UnicodeはISCIIに従い、タミル文字の符号化戦略に論理順序を使ってきた。これはTIS-620が採用していた視覚順序の符号化を引き継いだタイ文字の場合とは対照的である。
タミル・ナードゥ州政府は8ビット文字コードとその他のために独自のTAB/TAM規格を推進しているが、他の符号化方式もまだWWW上に見られる。
フリーな電子テキストの収集計画であるProject MaduraiはTSCII符号化を使っているが、すでにUnicode版の提供を開始した。
表
[編集]TSCII | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
8x | ௦ | ௧ | ஸ்ரீ | ஜ | ஷ | ஸ | ஹ | க்ஷ | ஜ் | ஷ் | ஸ் | ஹ் | க்ஷ் | ௨ | ௩ | ௪ |
9x | ௫ | ‘ | ’ | “ | ” | ௬ | ௭ | ௮ | ௯ | ஙு | ஞு | ஙூ | ஞூ | ௰ | ௱ | ௲ |
Ax | NBSP | ா | ி | ீ | ு | ூ | ெ | ே | ை | © | ௗ | அ | ஆ | ஈ | உ | |
Bx | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | ஃ | க | ங | ச | ஞ | ட | ண | த | ந |
Cx | ப | ம | ய | ர | ல | வ | ழ | ள | ற | ன | டி | டீ | கு | சு | டு | ணு |
Dx | து | நு | பு | மு | யு | ரு | லு | வு | ழு | ளு | று | னு | கூ | சூ | டூ | ணூ |
Ex | தூ | நூ | பூ | மூ | யூ | ரூ | லூ | வூ | ழூ | ளூ | றூ | னூ | க் | ங் | ச் | ஞ் |
Fx | ட் | ண் | த் | ந் | ப் | ம் | ய் | ர் | ல் | வ் | ழ் | ள் | ற் | ன் | இ |
上記の表で80は、Unicodeバージョン4.1で受理されたU+0BE6 TAMIL DIGIT ZEROである。A0はNO-BREAK SPACEである。 符号ADとFFは未割り当てである。
参考文献
[編集]外部リンク
[編集]- TSCIIスタートページ (英語)
- Unicode Technical Note #15 Text conversion From TSCII 1.7 to Unicode (TSCII 1.7からUnicodeへのテキスト変換; 英語)
- INFITT (International Forum for Information Technology in Tamil) (タミル情報技術国際フォーラム; 英語)
- TSCIIからUnicodeへのオンライン&Webページ変換 (英語)
- Padma - TSCIIをUnicodeに変換するMozilla拡張