Der Zeichensatz KOI8-R - Kyrillische Schrift für die russische SpracheStand der Bearbeitung: So., 10.06.2007 KOI8 ist die russische Abkürzung für "Kod Obmena Informazijei, 8 bit" (Код Обмена Информацией; 8 Бит), übersetzt "Code für Informationsaustausch, 8 Bit". KOI8-R ist eine weit verbreitete Zeichenkodierung für das kyrillisch Alphabet. Dieses "Character Set" kann - außer für die russische Sprache - etwa auch für Bulgarisch benutzt werden, während für Ukrainisch eine verwandte Zeichenkodierung namens KOI8-U entworfen wurde, die zusätzlich vier für Ukrainisch erforderliche Zeichen enthält. Im KOI8-R-Zeichensatz sind die kyrillischen Buchstaben nicht in ihrer üblichen alphabetischen Reihenfolge angeordnet, sondern in der alphabetischen Ordnung der lateinischen Buchstaben, die den kyrillischen Buchstaben (grob) entsprechen. Die Reihenfolge der kyrillischen Zeichen in KOI8-R stimmt auch nicht mit der Reihenfolge der kyrillischen Zeichen im Unicode überein. Im Unicode ist Kyrillisch in den Bereichen U+0400-04FF (Cyrillic) und U+0500-052F (Cyrillic Supplement) kodiert. KOI8-R ist ein "Single Byte"-Zeichensatz, in dem jedes Zeichen mit 8 Bit kodiert wird; stellt also 256 Codepoints bereit. KOI8-R umfasst an seinen 'unteren' 128 Code-Points den "American Standard Code for Information Interchange" (ASCII) und enthält somit unter anderem auch die 26 Grundbuchstaben des lateinischen Alphabets. Neben KOI8-R gibt es weitere Codepages mit kyrillischem Zeichensatz, darunter die Windows-Codepage 1251 (für Windows), ISO-8859-5 (für Sun und andere), die DOS-Codepage CP 866 (für DOS) und X-Mac-Cyrillic (für Mac). KOI8 ist vermutlich weiter verbreitet als der ISO-Zeichensatz 8859-5 für Kyrillisch. Die am weitesten verbreitete 8 Bit-Kodierung für Russisch dürfte jedoch die Microsoft Windows Codepage 1251 sein. KOI8-R ist beschrieben in RFC 1489. Der Zeichensatz ist bei der IANA registriert und für MIME zugelassen. Die HTML-Zeichensatzdeklaration für KOI8-R im Kopf von Web-Seiten lautet:
Während gemäß RFC 1489 das KOI8-R-Zeichen 0x95 dem Unicode-Zeichen U+2219 (∙) entsprechen soll, wird dieser Codepoint mit Rücksicht auf die Kompatibilität mit Codepage 1251 oft in das Unicode-Zeichen U+2022 (•) umgesetzt. In der folgenden Tabelle sind nur die 'oberen' 128 Code-Punkte berücksichtigt, in denen KOI8-R über den ASCII hinausgeht, also die Zeichen Nr. 128 bis Nr. 255. |
Nr. | Zeichen | KOI8-R hex | Entspr. Unicode hex | Bezeichnung |
128 | ─ | € | x2500 | FORMS LIGHT HORIZONTAL |
129 | │ |  | x2502 | FORMS LIGHT VERTICAL |
130 | ┌ | ‚ | x250C | FORMS LIGHT DOWN AND RIGHT |
131 | ┐ | ƒ | x2510 | FORMS LIGHT DOWN AND LEFT |
132 | └ | „ | x2514 | FORMS LIGHT UP AND RIGHT |
133 | ┘ | … | x2518 | FORMS LIGHT UP AND LEFT |
134 | ├ | † | x251C | FORMS LIGHT VERTICAL AND RIGHT |
135 | ┤ | ‡ | x2524 | FORMS LIGHT VERTICAL AND LEFT |
136 | ┬ | ˆ | x252C | FORMS LIGHT DOWN AND HORIZONTAL |
137 | ┴ | ‰ | x2534 | FORMS LIGHT UP AND HORIZONTAL |
138 | ┼ | Š | x253C | FORMS LIGHT VERTICAL AND HORIZONTAL |
139 | ▀ | ‹ | x2580 | UPPER HALF BLOCK |
140 | ▄ | Œ | x2584 | LOWER HALF BLOCK |
141 | █ |  | x2588 | FULL BLOCK |
142 | ▌ | Ž | x258C | LEFT HALF BLOCK |
143 | ▐ |  | x2590 | RIGHT HALF BLOCK |
144 | ░ |  | x2591 | LIGHT SHADE |
145 | ▒ | ‘ | x2592 | MEDIUM SHADE |
146 | ▓ | ’ | x2593 | DARK SHADE |
147 | ⌠ | “ | x2320 | TOP HALF INTEGRAL |
148 | ■ | ” | x25A0 | BLACK SMALL SQUARE |
149 | ∙ | • | x2219 | BULLET OPERATOR |
150 | √ | – | x221A | SQUARE ROOT |
151 | ≈ | — | x2248 | ALMOST EQUAL TO |
152 | ≤ | ˜ | x2264 | LESS THAN OR EQUAL TO |
153 | ≥ | ™ | x2265 | GREATER THAN OR EQUAL TO |
154 | š | x00A0 | NON-BREAKING SPACE | |
155 | ⌡ | › | x2321 | BOTTOM HALF INTEGRAL |
156 | ° | œ | x00B0 | DEGREE SIGN |
157 | ² |  | x00B2 | SUPERSCRIPT DIGIT TWO |
158 | · | ž | x00B7 | MIDDLE DOT |
159 | ÷ | Ÿ | x00F7 | DIVISION SIGN |
160 | ═ |   | x2550 | FORMS DOUBLE HORIZONTAL |
161 | ║ | ¡ | x2551 | FORMS DOUBLE VERTICAL |
162 | ╒ | ¢ | x2552 | FORMS DOWN SINGLE AND RIGHT DOUBLE |
163 | ё | £ | x0451 | CYRILLIC SMALL LETTER IO |
164 | ╓ | ¤ | x2553 | FORMS DOWN DOUBLE AND RIGHT SINGLE |
165 | ╔ | ¥ | x2554 | FORMS DOUBLE DOWN AND RIGHT |
166 | ╕ | ¦ | x2555 | FORMS DOWN SINGLE AND LEFT DOUBLE |
167 | ╖ | § | x2556 | FORMS DOWN DOUBLE AND LEFT SINGLE |
168 | ╗ | ¨ | x2557 | FORMS DOUBLE DOWN AND LEFT |
169 | ╘ | © | x2558 | FORMS UP SINGLE AND RIGHT DOUBLE |
170 | ╙ | ª | x2559 | FORMS UP DOUBLE AND RIGHT SINGLE |
171 | ╚ | « | x255A | FORMS DOUBLE UP AND RIGHT |
172 | ╛ | ¬ | x255B | FORMS UP SINGLE AND LEFT DOUBLE |
173 | ╜ | ­ | x255C | FORMS UP DOUBLE AND LEFT SINGLE |
174 | ╝ | ® | x255D | FORMS DOUBLE UP AND LEFT |
175 | ╞ | ¯ | x255E | FORMS VERTICAL SINGLE AND RIGHT DOUBLE |
176 | ╟ | ° | x255F | FORMS VERTICAL DOUBLE AND RIGHT SINGLE |
177 | ╠ | ± | x2560 | FORMS DOUBLE VERTICAL AND RIGHT |
178 | ╡ | ² | x2561 | FORMS VERTICAL SINGLE AND LEFT DOUBLE |
179 | Ё | ³ | x0401 | CYRILLIC CAPITAL LETTER IO |
180 | ╢ | ´ | x2562 | FORMS VERTICAL DOUBLE AND LEFT SINGLE |
181 | ╣ | µ | x2563 | FORMS DOUBLE VERTICAL AND LEFT |
182 | ╤ | ¶ | x2564 | FORMS DOWN SINGLE AND HORIZONTAL DOUBLE |
183 | ╥ | · | x2565 | FORMS DOWN DOUBLE AND HORIZONTAL SINGLE |
184 | ╦ | ¸ | x2566 | FORMS DOUBLE DOWN AND HORIZONTAL |
185 | ╧ | ¹ | x2567 | FORMS UP SINGLE AND HORIZONTAL DOUBLE |
186 | ╨ | º | x2568 | FORMS UP DOUBLE AND HORIZONTAL SINGLE |
187 | ╩ | » | x2569 | FORMS DOUBLE UP AND HORIZONTAL |
188 | ╪ | ¼ | x256A | FORMS VERTICAL SINGLE AND HORIZONTAL DOUBLE |
189 | ╫ | ½ | x256B | FORMS VERTICAL DOUBLE AND HORIZONTAL SINGLE |
190 | ╬ | ¾ | x256C | FORMS DOUBLE VERTICAL AND HORIZONTAL |
191 | © | ¿ | x00A9 | COPYRIGHT SIGN |
192 | ю | À | x044E | CYRILLIC SMALL LETTER IU |
193 | а | Á | x0430 | CYRILLIC SMALL LETTER A |
194 | б | Â | x0431 | CYRILLIC SMALL LETTER BE |
195 | ц | Ã | x0446 | CYRILLIC SMALL LETTER TSE |
196 | д | Ä | x0434 | CYRILLIC SMALL LETTER DE |
197 | е | Å | x0435 | CYRILLIC SMALL LETTER IE |
198 | ф | Æ | x0444 | CYRILLIC SMALL LETTER EF |
199 | г | Ç | x0433 | CYRILLIC SMALL LETTER GE |
200 | х | È | x0445 | CYRILLIC SMALL LETTER KHA |
201 | и | É | x0438 | CYRILLIC SMALL LETTER II |
202 | й | Ê | x0439 | CYRILLIC SMALL LETTER SHORT II |
203 | к | Ë | x043A | CYRILLIC SMALL LETTER KA |
204 | л | Ì | x043B | CYRILLIC SMALL LETTER EL |
205 | м | Í | x043C | CYRILLIC SMALL LETTER EM |
206 | н | Î | x043D | CYRILLIC SMALL LETTER EN |
207 | о | Ï | x043E | CYRILLIC SMALL LETTER O |
208 | п | Ð | x043F | CYRILLIC SMALL LETTER PE |
209 | я | Ñ | x044F | CYRILLIC SMALL LETTER IA |
210 | р | Ò | x0440 | CYRILLIC SMALL LETTER ER |
211 | с | Ó | x0441 | CYRILLIC SMALL LETTER ES |
212 | т | Ô | x0442 | CYRILLIC SMALL LETTER TE |
213 | у | Õ | x0443 | CYRILLIC SMALL LETTER U |
214 | ж | Ö | x0436 | CYRILLIC SMALL LETTER ZHE |
215 | в | × | x0432 | CYRILLIC SMALL LETTER VE |
216 | ь | Ø | x044C | CYRILLIC SMALL LETTER SOFT SIGN |
217 | ы | Ù | x044B | CYRILLIC SMALL LETTER YERI |
218 | з | Ú | x0437 | CYRILLIC SMALL LETTER ZE |
219 | ш | Û | x0448 | CYRILLIC SMALL LETTER SHA |
220 | э | Ü | x044D | CYRILLIC SMALL LETTER REVERSED E |
221 | щ | Ý | x0449 | CYRILLIC SMALL LETTER SHCHA |
222 | ч | Þ | x0447 | CYRILLIC SMALL LETTER CHE |
223 | ъ | ß | x044A | CYRILLIC SMALL LETTER HARD SIGN |
224 | Ю | à | x042E | CYRILLIC CAPITAL LETTER IU |
225 | А | á | x0410 | CYRILLIC CAPITAL LETTER A |
226 | Б | â | x0411 | CYRILLIC CAPITAL LETTER BE |
227 | Ц | ã | x0426 | CYRILLIC CAPITAL LETTER TSE |
228 | Д | ä | x0414 | CYRILLIC CAPITAL LETTER DE |
229 | Е | å | x0415 | CYRILLIC CAPITAL LETTER IE |
230 | Ф | æ | x0424 | CYRILLIC CAPITAL LETTER EF |
231 | Г | ç | x0413 | CYRILLIC CAPITAL LETTER GE |
232 | Х | è | x0425 | CYRILLIC CAPITAL LETTER KHA |
233 | И | é | x0418 | CYRILLIC CAPITAL LETTER II |
234 | Й | ê | x0419 | CYRILLIC CAPITAL LETTER SHORT II |
235 | К | ë | x041A | CYRILLIC CAPITAL LETTER KA |
236 | Л | ì | x041B | CYRILLIC CAPITAL LETTER EL |
237 | М | í | x041C | CYRILLIC CAPITAL LETTER EM |
238 | Н | î | x041D | CYRILLIC CAPITAL LETTER EN |
239 | О | ï | x041E | CYRILLIC CAPITAL LETTER O |
240 | П | ð | x041F | CYRILLIC CAPITAL LETTER PE |
241 | Я | ñ | x042F | CYRILLIC CAPITAL LETTER IA |
242 | Р | ò | x0420 | CYRILLIC CAPITAL LETTER ER |
243 | С | ó | x0421 | CYRILLIC CAPITAL LETTER ES |
244 | Т | ô | x0422 | CYRILLIC CAPITAL LETTER TE |
245 | У | õ | x0423 | CYRILLIC CAPITAL LETTER U |
246 | Ж | ö | x0416 | CYRILLIC CAPITAL LETTER ZHE |
247 | В | ÷ | x0412 | CYRILLIC CAPITAL LETTER VE |
248 | Ь | ø | x042C | CYRILLIC CAPITAL LETTER SOFT SIGN |
249 | Ы | ù | x042B | CYRILLIC CAPITAL LETTER YERI |
250 | З | ú | x0417 | CYRILLIC CAPITAL LETTER ZE |
251 | Ш | û | x0428 | CYRILLIC CAPITAL LETTER SHA |
252 | Э | ü | x042D | CYRILLIC CAPITAL LETTER REVERSED E |
253 | Щ | ý | x0429 | CYRILLIC CAPITAL LETTER SHCHA |
254 | Ч | þ | x0427 | CYRILLIC CAPITAL LETTER CHE |
255 | Ъ | ÿ | x042A | CYRILLIC CAPITAL LETTER HARD SIGN |
Links und Quellen zu KOI8-RKOI8-R ist beschrieben in RFC 1489 Wikipedia.de, Stichwort: "Kyrillisches Alphabet" KOI8-R - Russian Net Character Set KOI8-R References (engl./russ.) |