Der Zeichensatz KOI8-R - Kyrillische Schrift für die russische Sprache

Stand der Bearbeitung: So., 10.06.2007

KOI8 ist die russische Abkürzung für "Kod Obmena Informazijei, 8 bit" (Код Обмена Информацией; 8 Бит), übersetzt "Code für Informationsaustausch, 8 Bit".

KOI8-R ist eine weit verbreitete Zeichenkodierung für das kyrillisch Alphabet. Dieses "Character Set" kann - außer für die russische Sprache - etwa auch für Bulgarisch benutzt werden, während für Ukrainisch eine verwandte Zeichenkodierung namens KOI8-U entworfen wurde, die zusätzlich vier für Ukrainisch erforderliche Zeichen enthält.

Im KOI8-R-Zeichensatz sind die kyrillischen Buchstaben nicht in ihrer üblichen alphabetischen Reihenfolge angeordnet, sondern in der alphabetischen Ordnung der lateinischen Buchstaben, die den kyrillischen Buchstaben (grob) entsprechen.

Die Reihenfolge der kyrillischen Zeichen in KOI8-R stimmt auch nicht mit der Reihenfolge der kyrillischen Zeichen im Unicode überein. Im Unicode ist Kyrillisch in den Bereichen U+0400-04FF (Cyrillic) und U+0500-052F (Cyrillic Supplement) kodiert.

KOI8-R ist ein "Single Byte"-Zeichensatz, in dem jedes Zeichen mit 8 Bit kodiert wird; stellt also 256 Codepoints bereit. KOI8-R umfasst an seinen 'unteren' 128 Code-Points den "American Standard Code for Information Interchange" (ASCII) und enthält somit unter anderem auch die 26 Grundbuchstaben des lateinischen Alphabets.

Neben KOI8-R gibt es weitere Codepages mit kyrillischem Zeichensatz, darunter die Windows-Codepage 1251 (für Windows), ISO-8859-5 (für Sun und andere), die DOS-Codepage CP 866 (für DOS) und X-Mac-Cyrillic (für Mac).

KOI8 ist vermutlich weiter verbreitet als der ISO-Zeichensatz 8859-5 für Kyrillisch. Die am weitesten verbreitete 8 Bit-Kodierung für Russisch dürfte jedoch die Microsoft Windows Codepage 1251 sein.

KOI8-R ist beschrieben in RFC 1489. Der Zeichensatz ist bei der IANA registriert und für MIME zugelassen.

Die HTML-Zeichensatzdeklaration für KOI8-R im Kopf von Web-Seiten lautet:

<meta http-equiv="content-type" content="text/html; charset=koi8-r">

Während gemäß RFC 1489 das KOI8-R-Zeichen 0x95 dem Unicode-Zeichen U+2219 (∙) entsprechen soll, wird dieser Codepoint mit Rücksicht auf die Kompatibilität mit Codepage 1251 oft in das Unicode-Zeichen U+2022 (•) umgesetzt.

In der folgenden Tabelle sind nur die 'oberen' 128 Code-Punkte berücksichtigt, in denen KOI8-R über den ASCII hinausgeht, also die Zeichen Nr. 128 bis Nr. 255.


Nr.ZeichenKOI8-R hexEntspr. Unicode hexBezeichnung
128&#x0080;x2500FORMS LIGHT HORIZONTAL
129&#x0081;x2502FORMS LIGHT VERTICAL
130&#x0082;x250CFORMS LIGHT DOWN AND RIGHT
131&#x0083;x2510FORMS LIGHT DOWN AND LEFT
132&#x0084;x2514FORMS LIGHT UP AND RIGHT
133&#x0085;x2518FORMS LIGHT UP AND LEFT
134&#x0086;x251CFORMS LIGHT VERTICAL AND RIGHT
135&#x0087;x2524FORMS LIGHT VERTICAL AND LEFT
136&#x0088;x252CFORMS LIGHT DOWN AND HORIZONTAL
137&#x0089;x2534FORMS LIGHT UP AND HORIZONTAL
138&#x008A;x253CFORMS LIGHT VERTICAL AND HORIZONTAL
139&#x008B;x2580UPPER HALF BLOCK
140&#x008C;x2584LOWER HALF BLOCK
141&#x008D;x2588FULL BLOCK
142&#x008E;x258CLEFT HALF BLOCK
143&#x008F;x2590RIGHT HALF BLOCK
144&#x0090;x2591LIGHT SHADE
145&#x0091;x2592MEDIUM SHADE
146&#x0092;x2593DARK SHADE
147&#x0093;x2320TOP HALF INTEGRAL
148&#x0094;x25A0BLACK SMALL SQUARE
149&#x0095;x2219BULLET OPERATOR
150&#x0096;x221ASQUARE ROOT
151&#x0097;x2248ALMOST EQUAL TO
152&#x0098;x2264LESS THAN OR EQUAL TO
153&#x0099;x2265GREATER THAN OR EQUAL TO
154 &#x009A;x00A0NON-BREAKING SPACE
155&#x009B;x2321BOTTOM HALF INTEGRAL
156°&#x009C;x00B0DEGREE SIGN
157²&#x009D;x00B2SUPERSCRIPT DIGIT TWO
158·&#x009E;x00B7MIDDLE DOT
159÷&#x009F;x00F7DIVISION SIGN
160&#x00A0;x2550FORMS DOUBLE HORIZONTAL
161&#x00A1;x2551FORMS DOUBLE VERTICAL
162&#x00A2;x2552FORMS DOWN SINGLE AND RIGHT DOUBLE
163ё&#x00A3;x0451CYRILLIC SMALL LETTER IO
164&#x00A4;x2553FORMS DOWN DOUBLE AND RIGHT SINGLE
165&#x00A5;x2554FORMS DOUBLE DOWN AND RIGHT
166&#x00A6;x2555FORMS DOWN SINGLE AND LEFT DOUBLE
167&#x00A7;x2556FORMS DOWN DOUBLE AND LEFT SINGLE
168&#x00A8;x2557FORMS DOUBLE DOWN AND LEFT
169&#x00A9;x2558FORMS UP SINGLE AND RIGHT DOUBLE
170&#x00AA;x2559FORMS UP DOUBLE AND RIGHT SINGLE
171&#x00AB;x255AFORMS DOUBLE UP AND RIGHT
172&#x00AC;x255BFORMS UP SINGLE AND LEFT DOUBLE
173&#x00AD;x255CFORMS UP DOUBLE AND LEFT SINGLE
174&#x00AE;x255DFORMS DOUBLE UP AND LEFT
175&#x00AF;x255EFORMS VERTICAL SINGLE AND RIGHT DOUBLE
176&#x00B0;x255FFORMS VERTICAL DOUBLE AND RIGHT SINGLE
177&#x00B1;x2560FORMS DOUBLE VERTICAL AND RIGHT
178&#x00B2;x2561FORMS VERTICAL SINGLE AND LEFT DOUBLE
179Ё&#x00B3;x0401CYRILLIC CAPITAL LETTER IO
180&#x00B4;x2562FORMS VERTICAL DOUBLE AND LEFT SINGLE
181&#x00B5;x2563FORMS DOUBLE VERTICAL AND LEFT
182&#x00B6;x2564FORMS DOWN SINGLE AND HORIZONTAL DOUBLE
183&#x00B7;x2565FORMS DOWN DOUBLE AND HORIZONTAL SINGLE
184&#x00B8;x2566FORMS DOUBLE DOWN AND HORIZONTAL
185&#x00B9;x2567FORMS UP SINGLE AND HORIZONTAL DOUBLE
186&#x00BA;x2568FORMS UP DOUBLE AND HORIZONTAL SINGLE
187&#x00BB;x2569FORMS DOUBLE UP AND HORIZONTAL
188&#x00BC;x256AFORMS VERTICAL SINGLE AND HORIZONTAL DOUBLE
189&#x00BD;x256BFORMS VERTICAL DOUBLE AND HORIZONTAL SINGLE
190&#x00BE;x256CFORMS DOUBLE VERTICAL AND HORIZONTAL
191©&#x00BF;x00A9COPYRIGHT SIGN
192ю&#x00C0;x044ECYRILLIC SMALL LETTER IU
193а&#x00C1;x0430CYRILLIC SMALL LETTER A
194б&#x00C2;x0431CYRILLIC SMALL LETTER BE
195ц&#x00C3;x0446CYRILLIC SMALL LETTER TSE
196д&#x00C4;x0434CYRILLIC SMALL LETTER DE
197е&#x00C5;x0435CYRILLIC SMALL LETTER IE
198ф&#x00C6;x0444CYRILLIC SMALL LETTER EF
199г&#x00C7;x0433CYRILLIC SMALL LETTER GE
200х&#x00C8;x0445CYRILLIC SMALL LETTER KHA
201и&#x00C9;x0438CYRILLIC SMALL LETTER II
202й&#x00CA;x0439CYRILLIC SMALL LETTER SHORT II
203к&#x00CB;x043ACYRILLIC SMALL LETTER KA
204л&#x00CC;x043BCYRILLIC SMALL LETTER EL
205м&#x00CD;x043CCYRILLIC SMALL LETTER EM
206н&#x00CE;x043DCYRILLIC SMALL LETTER EN
207о&#x00CF;x043ECYRILLIC SMALL LETTER O
208п&#x00D0;x043FCYRILLIC SMALL LETTER PE
209я&#x00D1;x044FCYRILLIC SMALL LETTER IA
210р&#x00D2;x0440CYRILLIC SMALL LETTER ER
211с&#x00D3;x0441CYRILLIC SMALL LETTER ES
212т&#x00D4;x0442CYRILLIC SMALL LETTER TE
213у&#x00D5;x0443CYRILLIC SMALL LETTER U
214ж&#x00D6;x0436CYRILLIC SMALL LETTER ZHE
215в&#x00D7;x0432CYRILLIC SMALL LETTER VE
216ь&#x00D8;x044CCYRILLIC SMALL LETTER SOFT SIGN
217ы&#x00D9;x044BCYRILLIC SMALL LETTER YERI
218з&#x00DA;x0437CYRILLIC SMALL LETTER ZE
219ш&#x00DB;x0448CYRILLIC SMALL LETTER SHA
220э&#x00DC;x044DCYRILLIC SMALL LETTER REVERSED E
221щ&#x00DD;x0449CYRILLIC SMALL LETTER SHCHA
222ч&#x00DE;x0447CYRILLIC SMALL LETTER CHE
223ъ&#x00DF;x044ACYRILLIC SMALL LETTER HARD SIGN
224Ю&#x00E0;x042ECYRILLIC CAPITAL LETTER IU
225А&#x00E1;x0410CYRILLIC CAPITAL LETTER A
226Б&#x00E2;x0411CYRILLIC CAPITAL LETTER BE
227Ц&#x00E3;x0426CYRILLIC CAPITAL LETTER TSE
228Д&#x00E4;x0414CYRILLIC CAPITAL LETTER DE
229Е&#x00E5;x0415CYRILLIC CAPITAL LETTER IE
230Ф&#x00E6;x0424CYRILLIC CAPITAL LETTER EF
231Г&#x00E7;x0413CYRILLIC CAPITAL LETTER GE
232Х&#x00E8;x0425CYRILLIC CAPITAL LETTER KHA
233И&#x00E9;x0418CYRILLIC CAPITAL LETTER II
234Й&#x00EA;x0419CYRILLIC CAPITAL LETTER SHORT II
235К&#x00EB;x041ACYRILLIC CAPITAL LETTER KA
236Л&#x00EC;x041BCYRILLIC CAPITAL LETTER EL
237М&#x00ED;x041CCYRILLIC CAPITAL LETTER EM
238Н&#x00EE;x041DCYRILLIC CAPITAL LETTER EN
239О&#x00EF;x041ECYRILLIC CAPITAL LETTER O
240П&#x00F0;x041FCYRILLIC CAPITAL LETTER PE
241Я&#x00F1;x042FCYRILLIC CAPITAL LETTER IA
242Р&#x00F2;x0420CYRILLIC CAPITAL LETTER ER
243С&#x00F3;x0421CYRILLIC CAPITAL LETTER ES
244Т&#x00F4;x0422CYRILLIC CAPITAL LETTER TE
245У&#x00F5;x0423CYRILLIC CAPITAL LETTER U
246Ж&#x00F6;x0416CYRILLIC CAPITAL LETTER ZHE
247В&#x00F7;x0412CYRILLIC CAPITAL LETTER VE
248Ь&#x00F8;x042CCYRILLIC CAPITAL LETTER SOFT SIGN
249Ы&#x00F9;x042BCYRILLIC CAPITAL LETTER YERI
250З&#x00FA;x0417CYRILLIC CAPITAL LETTER ZE
251Ш&#x00FB;x0428CYRILLIC CAPITAL LETTER SHA
252Э&#x00FC;x042DCYRILLIC CAPITAL LETTER REVERSED E
253Щ&#x00FD;x0429CYRILLIC CAPITAL LETTER SHCHA
254Ч&#x00FE;x0427CYRILLIC CAPITAL LETTER CHE
255Ъ&#x00FF;x042ACYRILLIC CAPITAL LETTER HARD SIGN

Links und Quellen zu KOI8-R

KOI8-R ist beschrieben in RFC 1489
http://tools.ietf.org/html/rfc1489

Wikipedia.de, Stichwort: "Kyrillisches Alphabet"
http://de.wikipedia.org/wiki/Kyrillisches_Alphabet#Zeichenkodierung

KOI8-R - Russian Net Character Set
http://koi8.pp.ru/main.html

KOI8-R References (engl./russ.)
http://www.nagual.pp.ru/~ache/koi8/main.html