Shift-JIS (SJIS) est un codage de caractères pour la langue japonaise. Comme son nom l'indique, il est basé sur l'encodage ISO-2022-JP (JIS), mais avec un nombre plus importants d'octets permettant l'utilisation de 64 katakana entre les codes hexadécimaux 0xA0 et 0xDF.
Au contraire de JIS, Shift-JIS nécessite un médium de 8 bits pour la transmission. Cependant, face au format 8 bits EUC, Shift-JIS garantit uniquement que le premier octet sera dans la plage [0x80,0xFF] ; la valeur du second octet peut alors être quelconque. Ceci rend difficile une détection sûre de ce codage.
Pour un code JIS de deux octets
, la transformation vers le code Shift-JIS correspondants
est :
![{\displaystyle 33\leq j_{1}\leq 96\Rightarrow s_{1}={\frac {j_{1}+1}{2}}+112}](https://wikimedia.org/api/rest_v1/media/math/render/svg/34d65d645de0377e1240ddd762ff0feb61d0262c)
![{\displaystyle 97\leq j_{1}\leq 126\Rightarrow s_{1}={\frac {j_{1}+1}{2}}+176}](https://wikimedia.org/api/rest_v1/media/math/render/svg/516d2f092990498b0eee52272965d535fb6c6664)
![{\displaystyle j_{1}{\mbox{ est impair }}\Rightarrow s_{2}=j_{2}+31+\operatorname {trunc} \left({\frac {j_{2}}{95}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8daac364fc039e5168197fd30b7ebc38eeb61748)
![{\displaystyle j_{1}{\mbox{ est pair}}\Rightarrow s_{2}=j_{2}+126}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f60abe4299f754a4aa7928f0dd995489c26ff114)
Shift-JIS est utilisé essentiellement dans les pages Web japonaises.
Jeux de caractères codés |
Multi-octets | | ![Ancienne encodeuse de texte sur ruban perforé](//upload.wikimedia.org/wikipedia/commons/thumb/a/ad/Paper_tape_34637.jpg/100px-Paper_tape_34637.jpg) |
8 bits | ISO/CEI 8859 | - -1 (Latin-1)
- -2 (Latin-2)
- -3 (Latin-3)
- -4 (Latin-4)
- -5 (Cyrillique)
- -6 (Arabe)
- -7 (Grec)
- -8 (Hébreu)
- -9 (Latin-5)
- -10 (Latin-6)
- -11 (Thaï)
- -12 (Devanagari)
- -13 (Latin-7)
- -14 (Latin-8)
- -15 (Latin-9)
- -16 (Latin-10)
| Pages de code Windows | | Pages de code Mac OS | MacRoman | Pages de code DOS | | Pages de code diverses | | Non basés sur ISO/IEC 646 | | |
7 bits | |
Moins de 7 bits | |
|