TSCII

TSCII (Tamil Script Code for Information Interchange、情報交換用タミル文字符号) はタミル文字を表現するための符号化方式である。下位128個の符号位置は純粋なASCIIで、上位128個の符号位置はTSCII特有である。インターネットでは長い間私的な合意にのみ基づいて使われていたが、2007年にIANAへの登録に成功した[1]

TSCIIはタミル文字タイプライタを使うときと同様、文字を視覚的な (書かれる) 順序で符号化する。

UnicodeISCIIに従い、タミル文字の符号化戦略に論理順序を使ってきた。これはTIS-620が採用していた視覚順序の符号化を引き継いだタイ文字の場合とは対照的である。

タミル・ナードゥ州政府は8ビット文字コードとその他のために独自のTAB/TAM規格を推進しているが、他の符号化方式もまだWWW上に見られる。

フリーな電子テキストの収集計画であるProject MaduraiTSCII符号化を使っているが、すでにUnicode版の提供を開始した。

[編集]
TSCII
  x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
8x ஸ்ரீ க்ஷ ஜ்‌ ஷ்‌ ஸ்‌ ஹ்‌ க்ஷ்‌
9x ஙு ஞு ஙூ ஞூ
Ax NBSP  ா  ி  ீ  ு  ூ  ெ  ே  ை ©  ௗ  
Bx
Cx டி டீ கு சு டு ணு
Dx து நு பு மு யு ரு லு வு ழு ளு று னு கூ சூ டூ ணூ
Ex தூ நூ பூ மூ யூ ரூ லூ வூ ழூ ளூ றூ னூ க்‌ ங்‌ ச்‌ ஞ்‌
Fx ட்‌ ண்‌ த்‌ ந்‌ ப்‌ ம்‌ ய்‌ ர்‌ ல்‌ வ்‌ ழ்‌ ள்‌ ற்‌ ன்‌  

上記の表で80は、Unicodeバージョン4.1で受理されたU+0BE6 TAMIL DIGIT ZEROである。A0はNO-BREAK SPACEである。 符号ADFFは未割り当てである。

参考文献

[編集]
  1. ^ https://www.iana.org/assignments/charset-reg/TSCII

外部リンク

[編集]