В Юникоде зарезервировано 1 112 064 (= 220 + 216 − 211) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859-1 («Латиница-1»).
Кодовое пространство разделено на 17 «плоскостей» по 65 536 (= 216) символов:
- Плоскость 0 (0000—FFFF): Базовая многоязыковая плоскость (Basic Multilingual Plane, BMP)
- Плоскость 1 (10000—1FFFF): Дополнительная многоязыковая плоскость (Supplementary Multilingual Plane, SMP)
- Плоскость 2 (20000—2FFFF): Дополнительная иероглифическая плоскость (Supplementary Ideographic Plane, SIP)
- Плоскость 3 (30000—3FFFF): Третичная иероглифическая плоскость (Tertiary Ideographic Plane, TIP)
- Плоскости 4—13 (40000—DFFFF) не используются
- Плоскость 14 (E0000—EFFFF): Дополнительная плоскость особого назначения (Supplementary Special-purpose Plane, SSP)
- Плоскость 15 (F0000—FFFFF) используется как дополнительная область-A для частного использования (Supplementary Private Use Area-A, SPUA-A)
- Плоскость 16 (100000—10FFFF) используется как дополнительная область-B для частного использования (Supplementary Private Use Area-B, SPUA-B)
Базовая многоязыковая плоскость
|
Базовая плоскость UNICODE
Чёрный — расширенный латинский алфавит;
Голубой — лингвистические символы международного фонетического алфавита IPA;
Синий — другие европейские алфавиты;
Оранжевый — письменности Ближнего Востока;
Светло-оранжевый — письменности Африки;
Зелёный — письменности Южной Азии;
Фиолетовый — письменности Юго-восточной Азии;
Красный — письменности Восточной Азии;
Розовый — унифицированные китайско-японско-корейские символы;
Жёлтый — письменности аборигенов Северной Америки;
Пурпурный — символы;
Тёмно-серый — диакритики;
Светло-серый — суррогатные пары UTF-16 и области для частного использования;
Циан — другие знаки;
Белый — не используется.
|
Плоскость 0 (Основная многоязыковая плоскость, англ. Basic Multilingual Plane, BMP) содержит символы практически для всех современных письменностей и большое число специальных символов. Большая часть таблицы занята китайско-японскими иероглифами и своеобразными корейскими буквами.
В Unicode 5.2 в этой плоскости представлены следующие наборы символов:
Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:
Дополнительная многоязыковая плоскость
Плоскость 1 (дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена, в первую очередь, для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.
Дополнительная многоязыковая плоскость разделена на следующие поддиапазоны:
- U+10000—U+100FF Линейное письмо Б
- U+10100—U+1018F Древние системы счисления
- U+10190—U+107FF Алфавиты, слоговые письменности и наборы символов с направлением письма слева направо
- U+10800—U+10FFF Алфавиты и слоговые письменности с направлением письма справа налево
- U+11000—U+11D7F Брахмические письменности
- U+11D80—U+12FFF Клинопись и другие древние письменности
- U+13000—U+15BFF Иероглифы древних египтян и майя
- U+15C00—U+15FFF Ацтекские пиктограммы
- U+16000—U+167FF Вновь созданные письменности
- U+16800—U+16FFF Африканские и другие письменности
- U+17000—U+1B4FF Большие азиатские письменности
- U+1B500—U+1BBFF Протоэламская письменность
- U+1BC00—U+1BFFF Стенография
- U+1C000—U+1CA7F Иероглифы микмак
- U+1CA80—U+1CDFF Ронго-ронго
- U+1CE00—U+1CFFF Не используется
- U+1D000—U+1DFFF Системы условных обозначений
- U+1E000—U+1E7FF Не используется
- U+1E800—U+1EFFF Письменности с направлением справа налево
- U+1F000—U+1F0FF Игровые символы
- U+1F100—U+1F2FF Наборы буквенно-цифровых и иероглифических символов
- U+1F300—U+1F7FF Наборы пиктограмм
- U+1F800—U+1FFFF Не используется
В Unicode 5.2 в этой плоскости представлены следующие наборы символов:
- Линейное письмо Б:
- Слоги линейного письма Б (10000-1007F)
- Идеограммы линейного письма Б (10080-100FF)
- Древние системы счисления:
- Эгейские цифры (10100-1013F)
- Древнегреческие цифры (10140-1018F)
- Алфавиты, слоговые письменности и наборы символов с направлением письма слева направо:
- Алфавиты и слоговые письменности с направлением письма справа налево:
|
- Брахмические письменности:
- Клинопись и другие древние письменности:
- Клинопись (12000-123FF)
- Клинописные цифры (12400-1247F)
- Иероглифы древних египтян и майя:
- Системы условных обозначений:
- Византийские музыкальные символы (1D000-1D0FF)
- Музыкальные символы (1D100-1D1FF)
- Древнегреческие музыкальные символы (1D200-1D24F)
- Символы Тай Сюань Цзин (1D300-1D35F)
- Восточноазиатские счётные палочки (1D360-1D37F)
- Математические буквенно-цифровые символы (1D400-1D7FF)
- Игровые символы:
- Наборы буквенно-цифровых и иероглифических символов:
- Набор дополнительных вложенных буквенно-цифровых символов (1F100-1F1FF)
- Набор дополнительных вложенных иероглифических символов (1F200-1F2FF)
|
Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:
- Алфавиты, слоговые письменности и наборы символов с направлением письма слева направо:
- Алфавиты и слоговые письменности с направлением письма справа налево:
- Брахмические письменности:
- Клинопись и другие древние письменности:
|
- Иероглифы древних египтян и майя:
- Ацтекские пиктограммы (15C00-15FFF)
- Вновь созданные письменности и наборы символов:
- Африканские и другие письменности:
- Большие азиатские письменности:
- Протоэламская письменность (1B500-1BBFF)
- Стенография (1BC00-1BFFF)
- Иероглифическая письменность микмак (1C000-1CA7F)
- Ронго-ронго (1CA80-1CDCF)
- Системы условных обозначений:
- Письменности с направлением письма справа налево:
- Письменность менде (1E800-1E8CF)
- Персидские числовые символы сияк (1ED80-1EDFF)
- Арабские математические буквенные символы (1EE00-1EEFF)
- Числовые символы сияк (1EF00-1EFFF)
- Игровые символы:
- Символы игральных карт (1F0A0-1F0FF)
- Наборы пиктограмм:
- Различные пиктографические символы (1F300-1F5FF)
- Смайлики (1F600-1F64F)
- Транспортные и картографические символы (1F680-1F6FF)
- Алхимические символы (1F700-1F77F)
|
Дополнительная иероглифическая плоскость
Плоскость 2 (Дополнительная иероглифическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.
В Unicode 5.2 в этой плоскости представлены следующие наборы иероглифов:
Наборы иероглифов, предложенные для кодирования и находящиеся на стадии рассмотрения:
Третичная иероглифическая плоскость
Плоскость 3 (Третичная иероглифическая плоскость, англ. Tertiary Ideographic Plane, TIP) зарезервирована для архаичных китайских иероглифов.
Третичная иероглифическая плоскость предварительно разделена на следующие поддиапазоны:
В вышеперечисленные диапазоны предполагается включить следующие наборы иероглифов:
- в диапазон U+30000—U+317FF — древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях черепах и костях животных.
- в диапазон U+32000—U+32FFF — иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах.
- в диапазон U+34000—U+368FF — иероглифы в стиле «малая печать» (сяочжуань, 小篆).
В будущем также предполагается включить наборы иероглифов Периода Сражающихся царств.
В настоящее время в Консорциуме Юникод поставлен вопрос о будущем названии плоскости 3.
Дополнительная плоскость особого назначения
Плоскость 14 (Дополнительная плоскость особого назначения, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.
В Unicode 5.2 в этой плоскости представлены следующие наборы символов:
- Символы тегов (E0000—E007F)
- Дополнительные селекторы вариантов начертания (E0100—E01EF)
Области для частного использования
Некоторые диапазоны Юникода выделены для частного использования и экспериментов. Они включают:
- Частную область в Базовой многоязыковой плоскости U+E000—U+F8FF
- Дополнительные плоскости 15 (U+F0000—U+FFFFF) и 16 (U+100000—U+10FFFF)
Ссылки
- The Unicode Standard Latest Version (англ.) — последняя версия стандарта.
- The Unicode Standard 5.0 (англ.)
- Изображения всех Unicode символов в PDF-файлах (англ.)