- Windows-1251
-
Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Пользуется довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах Windows в 1990—1991 гг. совместно представителями «Параграфа», «Диалога» и российского отделения Microsoft. Первоначальный вариант кодировки сильно отличался от представленного ниже в таблице (в частности, там было значительное число «белых пятен»).
Windows-1251 выгодно отличается от других 8‑битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только значок ударения); она также содержит все символы для близких к русскому языку языков: украинского, белорусского, сербского и болгарского.
Имеет два недостатка:
- строчная буква «я» имеет код 0xFF (255 в десятичной системе). Она является «виновницей» ряда неожиданных проблем в программах без поддержки чистого 8-го бита, а также (гораздо более частый случай) использующих этот код как служебный (в CP437 он обозначает «неразрывный пробел», в Windows-1252 — ÿ, оба варианта практически не используются; число же
-1
, в дополнительном коде длиной 8 бит представляющееся числом255
, часто используется в программировании как специальное значение, например, индикатор конца файла EOF часто представляется значением-1
). - отсутствуют символы псевдографики, имеющиеся в CP866 и KOI8 (хотя для самих Windows, для которых она предназначена, в них не было нужды, это делало несовместимость двух использовавшихся в них кодировок заметнее).
Содержание
Таблицы
Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. Числа под буквами обозначают 16-ричный код подходящего символа в Юникоде.
Кодировка Windows-1251 (синоним CP1251)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
Ђ
402Ѓ
403‚
201Aѓ
453„
201E…
2026†
2020‡
2021€
20AC‰
2030Љ
409‹
2039Њ
40AЌ
40CЋ
40BЏ
40F
9.
ђ
452‘
2018’
2019“
201C”
201D•
2022–
2013—
2014™
2122љ
459›
203Aњ
45Aќ
45Cћ
45Bџ
45F
A.
A0Ў
40Eў
45EЈ
408¤
A4Ґ
490¦
A6§
A7Ё
401©
A9Є
404«
AB¬
AC
AD®
AEЇ
407
B.
°
B0±
B1І
406і
456ґ
491µ
B5¶
B6·
B7ё
451№
2116є
454»
BBј
458Ѕ
405ѕ
455ї
457
C.
А
410Б
411В
412Г
413Д
414Е
415Ж
416З
417И
418Й
419К
41AЛ
41BМ
41CН
41DО
41EП
41F
D.
Р
420С
421Т
422У
423Ф
424Х
425Ц
426Ч
427Ш
428Щ
429Ъ
42AЫ
42BЬ
42CЭ
42DЮ
42EЯ
42F
E.
а
430б
431в
432г
433д
434е
435ж
436з
437и
438й
439к
43Aл
43Bм
43Cн
43Dо
43Eп
43F
F.
р
440с
441т
442у
443ф
444х
445ц
446ч
447ш
448щ
449ъ
44Aы
44Bь
44Cэ
44Dю
44Eя
44FДругие варианты
(Показаны только отличающиеся строки, поскольку всё остальное совпадает)
Кодировка CP1251-k (KazWin, казахская кодировка)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
Ұ
4B0Ғ
492‚
201Aғ
493„
201E…
2026†
2020‡
2021€
20AC‰
2030Ө
4E8‹
2039Ң
4A2Қ
49AҺ
4BAҮ
4AE
9.
ұ
4B1‘
2018’
2019“
201C”
201D•
2022–
2013—
2014™
2122ө
4E9›
203Aң
4A3қ
49Bһ
4BBү
4AF
A.
A0Ў
40Eў
45EҖ
496¤
A4Ҳ
4B2¦
A6§
A7Ё
401©
A9Є
404«
AB¬
AC
AD®
AEЇ
407
B.
°
B0±
B1І
406і
456ҳ
4B3µ
B5¶
B6·
B7ё
451№
2116є
454»
BBҗ
497Ә
4D8ә
4D9ї
457Кодировка Windows-1251 (чувашский вариант)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
Ђ
402Ѓ
403‚
201Aѓ
453„
201E…
2026†
2020‡
2021€
20AC‰
2030Љ
409‹
2039Ӑ
4D0Ӗ
4D6Ҫ
4AAӲ
4F2
9.
ђ
452‘
2018’
2019“
201C”
201D•
2022–
2013—
2014™
2122љ
459›
203Aӑ
4D1ӗ
4D7ҫ
4ABӳ
4F3Татарский вариант
Эта кодировка была официально принята в Татарстане в 1996 г.
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
Ә
4D8Ѓ
403‚
201Aѓ
453„
201E…
2026†
2020‡
2021€
20AC‰
2030Ө
4E8‹
2039Ү
4AEҖ
496Ң
4A2Һ
4BA
9.
ә
4D9‘
2018’
2019“
201C”
201D•
2022–
2013—
2014™
2122ө
4E9›
203Aү
4AFҗ
497ң
4A3һ
4BBСсылки
- Информация о кодировке на Microsoft GlobalDev
- История создании кодировки в сообщении Игоря Семенюка в эхоконференции SU.LAN от 14 января 1996
- Юникод-коды символов на unicode.org
Кодировки символов Основы → алфавит • текст ( файл • данные ) • набор символов • конверсия Исторические кодировки → Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2 Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646 совре-
менное
8-битное
представ-
лениесимволы → ASCII ( управляющие • печатные ) не-ASCII ( псевдографика ) 8бит. код.стр. Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16 Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4 IBM&DOS → 437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ ) Много-
байтныеТрадиционные → DBCS ( GB2312 ) • HTML Unicode → UTF-16 • UTF-8 • список символов ( кириллица ) Связанные
темы →интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение Утилиты: iconv • recode Категории:- Кодировки кириллицы
- Компьютерные кодировки
- строчная буква «я» имеет код 0xFF (255 в десятичной системе). Она является «виновницей» ряда неожиданных проблем в программах без поддержки чистого 8-го бита, а также (гораздо более частый случай) использующих этот код как служебный (в CP437 он обозначает «неразрывный пробел», в Windows-1252 — ÿ, оба варианта практически не используются; число же
Wikimedia Foundation. 2010.