代碼頁437 - 维基百科,自由的百科全书
代碼頁437(Code page 437)是始祖IBM PC(個人電腦)或MS-DOS使用的字元編碼。又名為CP437、OEM 437[1] PC-8[2]、或MS-DOS Latin US[3]。該字集包含ASCII由32–126的字碼、附加符號、一些希臘字母、圖示以及製圖符號。其有時也稱為「OEM字型」或「high ASCII」或「extended ASCII」[2](互不兼容的眾多ASCII擴充字集之一)。
嚴格來說,此字元集並非打算用來做什麼「代碼頁」;而只不過是在當時的IBM PC用來圖像化的表現字形而已。此字元集仍然是所有EGA以及VGA相容顯示卡核心的主要字型。當電腦開機時,在加載任何儲存媒體之前所使用的就是此「代碼頁」。[4]。大多數在IBM PC時代開發的檔案格式,例如.nfo,都是內定以此為預設編碼。
顯示卡
[编辑]最初的IBM PC以每個字元9×14像素的形式儲存在MDA顯示卡旳唯讀記憶體,以及以每個字元8×8像素的形式儲存在CGA顯示卡。EGA包含的是8×14像素的版本,而VGA包含的是9×16像素的版本。
此等顯示卡全都有文字模式,當中每個字元方塊包含8位元的字元碼位,亦即提供一共256個字元。所有256個碼位都分配予唯讀記憶體中的圖像字元,當中0至31的碼位保留予ASCII用作非圖像控制字元。
代碼頁
[编辑]代碼頁有兩個主要功:
- 作為資訊交換碼(以檔案和電訊形式),當中0至127碼位擔當的角式與ASCII的相同,而128至175碼位代表國際文字字元(見下表);
- 作為用於螢幕和印表機的圖像資源(該字元可用於顯示或打印),整段256個碼位範圍都可用作圖像字元。
字元
[编辑]以下字表顯示代碼頁437的字元。每個字元同時顯示其對應的Unicode碼位及其十進位值。
1–31和127碼位的解讀
[编辑]1–31和127碼位(00–1Fhex和7Fhex)可用作控制或圖像字元,視情況而定。[5]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | ☺ 263A 1 | ☻ 263B 2 | ♥ 2665 3 | ♦ 2666 4 | ♣ 2663 5 | ♠ 2660 6 | • 2022 7 | ◘ 25D8 8 | ○ 25CB 9 | ◙ 25D9 10 | ♂ 2642 11 | ♀ 2640 12 | ♪ 266A 13 | ♫ 266B 14 | ☼ 263C 15 | |
1_ | ► 25BA 16 | ◄ 25C4 17 | ↕ 2195 18 | ‼ 203C 19 | ¶ 00B6 20 | § 00A7 21 | ▬ 25AC 22 | ↨ 21A8 23 | ↑ 2191 24 | ↓ 2193 25 | → 2192 26 | ← 2190 27 | ∟ 221F 28 | ↔ 2194 29 | ▲ 25B2 30 | ▼ 25BC 31 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
7_ | ⌂ 2302 127 |
標準代碼頁
[编辑]_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 0 | SOH 0001 1 | STX 0002 2 | ETX 0003 3 | EOT 0004 4 | ENQ 0005 5 | ACK 0006 6 | BEL 0007 7 | BS 0008 8 | HT 0009 9 | LF 000A 10 | VT 000B 11 | FF 000C 12 | CR 000D 13 | SO 000E 14 | SI 000F 15 |
1_ | DLE 0010 16 | DC1 0011 17 | DC2 0012 18 | DC3 0013 19 | DC4 0014 20 | NAK 0015 21 | SYN 0016 22 | ETB 0017 23 | CAN 0018 24 | EM 0019 25 | SUB 001A 26 | ESC 001B 27 | FS 001C 28 | GS 001D 29 | RS 001E 30 | US 001F 31 |
2_ | SP 0020 32 | ! 0021 33 | " 0022 34 | # 0023 35 | $ 0024 36 | % 0025 37 | & 0026 38 | ' 0027 39 | ( 0028 40 | ) 0029 41 | * 002A 42 | + 002B 43 | , 002C 44 | - 002D 45 | . 002E 46 | / 002F 47 |
3_ | 0 0030 48 | 1 0031 49 | 2 0032 50 | 3 0033 51 | 4 0034 52 | 5 0035 53 | 6 0036 54 | 7 0037 55 | 8 0038 56 | 9 0039 57 | : 003A 58 | ; 003B 59 | < 003C 60 | = 003D 61 | > 003E 62 | ? 003F 63 |
4_ | @ 0040 64 | A 0041 65 | B 0042 66 | C 0043 67 | D 0044 68 | E 0045 69 | F 0046 70 | G 0047 71 | H 0048 72 | I 0049 73 | J 004A 74 | K 004B 75 | L 004C 76 | M 004D 77 | N 004E 78 | O 004F 79 |
5_ | P 0050 80 | Q 0051 81 | R 0052 82 | S 0053 83 | T 0054 84 | U 0055 85 | V 0056 86 | W 0057 87 | X 0058 88 | Y 0059 89 | Z 005A 90 | [ 005B 91 | \ 005C 92 | ] 005D 93 | ^ 005E 94 | _ 005F 95 |
6_ | ` 0060 96 | a 0061 97 | b 0062 98 | c 0063 99 | d 0064 100 | e 0065 101 | f 0066 102 | g 0067 103 | h 0068 104 | i 0069 105 | j 006A 106 | k 006B 107 | l 006C 108 | m 006D 109 | n 006E 110 | o 006F 111 |
7_ | p 0070 112 | q 0071 113 | r 0072 114 | s 0073 115 | t 0074 116 | u 0075 117 | v 0076 118 | w 0077 119 | x 0078 120 | y 0079 121 | z 007A 122 | { 007B 123 | | 007C 124 | } 007D 125 | ~ 007E 126 | DEL 007F 127 |
8_ | Ç 00C7 128 | ü 00FC 129 | é 00E9 130 | â 00E2 131 | ä 00E4 132 | à 00E0 133 | å 00E5 134 | ç 00E7 135 | ê 00EA 136 | ë 00EB 137 | è 00E8 138 | ï 00EF 139 | î 00EE 140 | ì 00EC 141 | Ä 00C4 142 | Å 00C5 143 |
9_ | É 00C9 144 | æ 00E6 145 | Æ 00C6 146 | ô 00F4 147 | ö 00F6 148 | ò 00F2 149 | û 00FB 150 | ù 00F9 151 | ÿ 00FF 152 | Ö 00D6 153 | Ü 00DC 154 | ¢ 00A2 155 | £ 00A3 156 | ¥ 00A5 157 | ₧ 20A7 158 | ƒ 0192 159 |
A_ | á 00E1 160 | í 00ED 161 | ó 00F3 162 | ú 00FA 163 | ñ 00F1 164 | Ñ 00D1 165 | ª 00AA 166 | º 00BA 167 | ¿ 00BF 168 | ⌐ 2310 169 | ¬ 00AC 170 | ½ 00BD 171 | ¼ 00BC 172 | ¡ 00A1 173 | « 00AB 174 | » 00BB 175 |
B_ | ░ 2591 176 | ▒ 2592 177 | ▓ 2593 178 | │ 2502 179 | ┤ 2524 180 | ╡ 2561 181 | ╢ 2562 182 | ╖ 2556 183 | ╕ 2555 184 | ╣ 2563 185 | ║ 2551 186 | ╗ 2557 187 | ╝ 255D 188 | ╜ 255C 189 | ╛ 255B 190 | ┐ 2510 191 |
C_ | └ 2514 192 | ┴ 2534 193 | ┬ 252C 194 | ├ 251C 195 | ─ 2500 196 | ┼ 253C 197 | ╞ 255E 198 | ╟ 255F 199 | ╚ 255A 200 | ╔ 2554 201 | ╩ 2569 202 | ╦ 2566 203 | ╠ 2560 204 | ═ 2550 205 | ╬ 256C 206 | ╧ 2567 207 |
D_ | ╨ 2568 208 | ╤ 2564 209 | ╥ 2565 210 | ╙ 2559 211 | ╘ 2558 212 | ╒ 2552 213 | ╓ 2553 214 | ╫ 256B 215 | ╪ 256A 216 | ┘ 2518 217 | ┌ 250C 218 | █ 2588 219 | ▄ 2584 220 | ▌ 258C 221 | ▐ 2590 222 | ▀ 2580 223 |
E_ | α 03B1 224 | ß 00DF 225 | Γ 0393 226 | π 03C0 227 | Σ 03A3 228 | σ 03C3 229 | µ 00B5 230 | τ 03C4 231 | Φ 03A6 232 | Θ 0398 233 | Ω 03A9 234 | δ 03B4 235 | ∞ 221E 236 | φ 03C6 237 | ε 03B5 238 | ∩ 2229 239 |
F_ | ≡ 2261 240 | ± 00B1 241 | ≥ 2265 242 | ≤ 2264 243 | ⌠ 2320 244 | ⌡ 2321 245 | ÷ 00F7 246 | ≈ 2248 247 | ° 00B0 248 | ∙ 2219 249 | · 00B7 250 | √ 221A 251 | ⁿ 207F 252 | ² 00B2 253 | ■ 25A0 254 | NBSP 00A0 255 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
除了0至31(00hex至1Fhex)可用作ASCII控制碼及圖像dingbat以外,某些字元也有多於一個意義。對應的Unicode有可能多於一個,視情況而定:
- 0和255(FFhex)都會產生空格;32(20hex)也是。將255用作U+00A0不換行空格(NBSP)在IBM PC時代的文書處理軟件已有先例。
- 176至223(B0hex至DFhex)为方框绘制字符
- 225(E1hex)是德文的sharp S(U+00DF, ß),也是希臘文的小階beta(U+03B2, β)。
- 227(E3hex)是希臘文小階的pi(U+03C0, π),但早期的字型,例如Terminal使用的字型並不明確,有可能是希臘文大階的pi(U+03A0, Π),也可以是「n次積符號」(U+220F, ∏)。
- 228(E4hex)是「n次疊加符號」(U+2211, ∑),也是希臘文大寫的sigma(U+03A3, Σ)。
- 230(E6hex)是微的符號(U+00B5, µ),也是希臘文小寫的mu(U+03BC, μ)。
- 234(EAhex)是歐姆符號(U+2126, Ω),也是希臘文大寫的omega(U+03A9, Ω)。(Unicode將歐姆符號等同大寫omega,並建議兩種情況都用後者)[7]).
- 235(EBhex)是希臘文小寫delta(U+03B4, δ),但也用作冰島文小寫的 eth(U+00F0, ð)和偏微分符號(U+2202, ∂)的替代品。
- 237(EDhex)應當用作希臘文小寫的phi,但現在主要用作空集符號(U+2205, ),還用作用來表示角度的斜體希臘文phi符號(U+03D5, )、直徑符號(U+2300, )以及拉丁文小寫「帶斜線的小寫O」(U+00F8, ø)的替代品。
- 238(EEhex)既是希臘文小寫的epsilon(U+03B5, ε),也是element-of符號(U+2208, ∈)。後來還用作歐元符號(U+20AC, €)。
另見
[编辑]參考資料
[编辑]- ^ 1.0 1.1 OEM 437. Go Global Developer Center. Microsoft. [22 Sep 2011]. (原始内容存档于2016-06-09).
- ^ 2.0 2.1 OEM font. Encyclopedia. PCmag.com. [15 Nov 2011]. (原始内容存档于2012-10-13).
- ^ Code Page 437 MS-DOS Latin US. Developing International Software. Microsoft. [14 Nov 2011]. (原始内容存档于2016-03-17).
- ^ 東歐、阿拉伯以及亞洲使用的電腦可能會用不同的字集。「OEM」,即「原始設備製造商(original equipment manufacturer)」代表該製造商在唯讀記憶體(ROM)提供的「原生」硬件字元集,以符合不同市場的要求。
- ^ 00437. Code pages by CPGID. IBM. [14 Nov 2011]. (原始内容存档于2016-06-09).
- ^ cp437_DOSLatinUS to Unicode table (TXT). The Unicode Consortium. [14 Nov 2011]. (原始内容存档于2016-06-09).
- ^ The Unicode Consortium, The Unicode Standard 4.0, Chapter 7, "European Alphabetic Scripts", p176. PDF version (页面存档备份,存于互联网档案馆)
外部連結
[编辑]- IBM Code Page 437 reference chart[失效連結]
- IBM PC memory-mapped video graphics to Unicode(页面存档备份,存于互联网档案馆) on official Unicode site