КОІ-8 — Вікіпедія
КОІ-8 (код обміну інформацією, 8 бітів; рос. КОИ-8) — восьмибітова ASCII-сумісна кодова таблиця, розроблена для кодування букв кириличних алфавітів.
Існує також семибітова версія кодування, не повністю сумісна з ASCII — КОІ-7. КОІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз нечинний).
Розробники КОІ-8 помістили символи російського алфавіту у верхній частині кодової таблиці таким чином, що позиції кириличних символів відповідають їхнім фонетичним аналогам в англійському алфавіті, в нижній частині таблиці. Це означає, що якщо в тексті, закодованому КОІ-8, прибрати восьмий біт кожного символу, то вийде прочитний текст, хоча й записаний латинськими символами. Наприклад, слова «Русский Текст» перетворяться на «rUSSKIJ tEKST». Як наслідок, символи кирилиці в таблиці виявилися розташованими не в алфавітному порядку.
Існує декілька варіантів кодування КОІ-8 для різних кириличних алфавітів. Російський алфавіт описується в кодуванні KOI8-R, український — у KOI8-U. KOI8-R став фактично стандартом для російської кирилиці в юнікс-подібних операційних системах і електронній пошті.
Андрій Чернов створив документ RFC 1489 («Registration of а Cyrillic Character Set»), який, проте, не належить до категорії RFC-стандартів. Існує RFC 2319 на KOI8-U.
RFC-2319. Стандарт кодування української мови сформований у RFC. Створено ініціативною групою - Павло Гульчук, Юрко Демченко, Євген Шерстобітов, Борис Мостовий, Ігор Романенко, Олександр Єременко, Андрій Стесін.[1]
За набором символів KOI8-R відповідає одному з варіантів альтернативного кодування. Стандарт RFC 1489 також стверджує наявність графічних символів «рамок» (псевдографіки), проте ця вимога виконується досить рідко.
Нижня частина таблиці кодування (латиниця) повністю відповідає кодуванню ASCII.
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9− | ░ 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √ 221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | A0 | ⌡ 2321 | ° B0 | ² B2 | · B7 | ÷ F7 |
A− | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | ╓ 2553 | ╔ 2554 | ╕ 2555 | ╖ 2556 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ╜ 255C | ╝ 255D | ╞ 255E |
B− | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | ╢ 2562 | ╣ 2563 | ╤ 2564 | ╥ 2565 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | ╫ 256B | ╬ 256C | © A9 |
C− | ю 44E | а 430 | б 431 | ц 446 | д 434 | е 435 | ф 444 | г 433 | х 445 | и 438 | й 439 | к 43A | л 43B | м 43C | н 43D | о 43E |
D− | п 43F | я 44F | р 440 | с 441 | т 442 | у 443 | ж 436 | в 432 | ь 44C | ы 44B | з 437 | ш 448 | э 44D | щ 449 | ч 447 | ъ 44A |
E− | Ю 42E | А 410 | Б 411 | Ц 426 | Д 414 | Е 415 | Ф 424 | Г 413 | Х 425 | И 418 | Й 419 | К 41A | Л 41B | М 41C | Н 41D | О 41E |
F− | П 41F | Я 42F | Р 420 | С 421 | Т 422 | У 423 | Ж 416 | В 412 | Ь 42C | Ы 42B | З 417 | Ш 428 | Э 42D | Щ 429 | Ч 427 | Ъ 42A |
показані лише неоднакові рядки таблиць, оскільки решта збігається
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ╝ 255D | ╞ 255E |
B− | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | ╬ 256C | © A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− | ═ 2550 | ║ 2551 | ╒ 2552 | ё 451 | є 454 | ╔ 2554 | і 456 | ї 457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 491 | ў 45E | ╞ 255E |
B− | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 401 | Є 404 | ╣ 2563 | І 406 | Ї 407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 490 | Ў 40E | © A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ғ 493 | җ 497 | қ 49B | ҝ 49D | ң 4A3 | ү 4AF | ұ 4B1 | ҳ 4B3 | ҷ 4B7 | ҹ 4B9 | һ 4BB | ▀ 2580 | ҝ 49D | ӣ 4E3 | ө 4E9 | ӯ 4EF |
9. | Ғ 492 | Җ 496 | Қ 49A | Ҝ 49C | Ң 4A2 | Ү 4AE | Ұ 4B0 | Ҳ 4B2 | Ҷ 4B6 | Ҹ 4B8 | Һ 4BA | ⌡ 2321 | Ә 4D8 | Ӣ 4E2 | Ө 4E8 | Ӯ 4EE |
A. | A0 | ђ 452 | ѓ 453 | ё 451 | є 454 | ѕ 455 | і 456 | ї 457 | ј 458 | љ 459 | њ 45A | ћ 45B | ќ 45C | ґ 491 | ў 45E | џ 45F |
B. | № 2116 | Ђ 402 | Ѓ 403 | Ё 401 | Є 404 | Ѕ 405 | І 406 | Ї 407 | Ј 408 | Љ 409 | Њ 40A | Ћ 40B | Ќ 40C | Ґ 490 | Ў 40E | Џ 40F |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | қ 49B | ғ 493 | ‚ 201A | Ғ 492 | „ 201E | … 2026 | † 2020 | ‡ 2021 | ‰ 2030 | ҳ 4B3 | ‹ 2039 | Ҳ 4B2 | ҷ 4B7 | Ҷ 4B6 | ||
9. | Қ 49A | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | ™ 2122 | › 203A | ||||||
A. | ӯ 4EF | Ӯ 4EE | ё 451 | ¤ A4 | ӣ 4E3 | ¦ A6 | § A7 | « AB | ¬ AC | AD | ® AE | |||||
B. | ° B0 | ± B1 | ² B2 | Ё 401 | Ӣ 4E2 | ¶ B6 | · B7 | № 2116 | » BB | © A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− | Ђ 0402 | Ѓ 0403 | ¸ 00B8 | ѓ 0453 | „ 201E | … 2026 | † 2020 | § 00A7 | € 20AC | ¨ 00A8 | Љ 0409 | ‹ 2039 | Њ 040A | Ќ 040C | Ћ 040B | Џ 040F |
9− | ђ 0452 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | £ 00A3 | · 00B7 | љ 0459 | › 203A | њ 045A | ќ 045C | ћ 045B | џ 045F |
A− | 00A0 | ѵ 0475 | ѣ 0463 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | ® 00AE | ™ 2122 | « 00AB | ѳ 0473 | ґ 0491 | ў 045E | ´ 00B4 |
B− | ° 00B0 | Ѵ 0474 | Ѣ 0462 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | № 2116 | ¢ 00A2 | » 00BB | Ѳ 0472 | Ґ 0490 | Ў 040E | © 00A9 |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | 00AD | ў 045E | џ 045F |
B− | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | ¤ 00A4 | Ў 040E | Џ 040F |
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9− | ░ 2591 | ‘ 2018 | ’ 2019 | “ 201C | ” 201D | • 2022 | – 2013 | — 2014 | © 00A9 | ™ 2122 | 00A0 | » 00BB | ® 00AE | « 00AB | · 00B7 | ¤ 00A4 |
A− | 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | ґ 0491 | ў 045E | џ 045F |
B− | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | Ґ 0490 | Ў 040E | Џ 040F |
В деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама : при «зрізанні» восьмого біта текст мав лишатися більш-менш зрозумілим. Наприклад, в чеському варіанті КОІ-8 букви Čč повинні перетворюватися на cC, Žž — на zZ тощо. В наш час[коли?] ці кодування не використовуються.
- ↑ KOI8-U: Як це було. Архів оригіналу за 23 травня 2017. Процитовано 22 січня 2017.
- Офіційний сайт кодування КОІ-8 [Архівовано 18 березня 2022 у Wayback Machine.]
- RFC 1489
- RFC 2319