Как ввести юникод с клавиатуры виндовс

Как набирать Unicode с помощью Alt+Numpad

Спросили во френдленте, как можно «вручную» набирать символы такого типа:
⁰⁰⁸ ⏝⎛⎝⎷⎝
Я не знаю, зачем ему это понадобилось — в лирушечку, что ли, ударился, но все же стало интересно.

Поиск кода

Для начала, нужно знать Unicode-код символа, который есть желание напечатать. Поскольку ЖЖ пользуется UTF-8, придется переводить из одной кодировки в другую. Имеем такую таблицу:

Unicode UTF-8
0x00000000 — 0x0000007F 0xxxxxxx
0x00000080 — 0x000007FF 110xxxxx 10xxxxxx
0x00000800 — 0x0000FFFF 1110xxxx 10xxxxxx 10xxxxxx

Сохраняем страничку ЖЖ, открываем в чем-нибудь, что показывает ее в шестнадцатеричном виде (просмотрщики FAR и Total Commander это умеют) и ищем нужный код (беру в пример первый символ, который маленький полукружие снизу):

Зная, что перед ним пробел (hex-код 20), получаем первый байт Unicode-кода:
E2
Переводим его в двоичную запись (стандартный калькулятор в инженерном режиме хорошо помогает):
11100010
Три единицы в начале, согласно таблицы, означают, что Unicode-код трехбайтовый. Значит, дописываем следующие два байта:
E2 8F 9D
Пишем их в двоичной записи:
11100010 10001111 10011101
Согласно таблице, выделяем значащие цифры:
11100010 10001111 10011101
Получаем Unicode-код в двоичной записи:
00100011 11011101
Калькулятор — наш друг, шестнадцатеричный код:
23DD

Теперь можно ввести его в каком-нибудь преобразователе кода в символ и проверить, все ли правильно. Например, здесь . Кстати, там же, если код неизвестен, но хочется найти что-то интересное, можно и табличку себе сделать для любых диапазонов кодов, например . Видно, что наши символы — математические, и предназначены для записи матриц, кроме одного, который, похоже, корень. То же самое — и для циферок в верхнем индексе (хотя у меня странно как-то оно отображается).

Печать вручную

Сайт MSDN утверждает, что вариантов для ручного ввода символа по коду есть три:

Alt+Numpad: A method of entering characters by typing in the character’s decimal code with the Numeric Pad keys (Num Lock turned on). In Windows:
* Alt+<xxx>, where xxx is the decimal value of a code point, generates an OEM-encoded character.
* Alt+<0xxx>, where xxx is the decimal value of a code point, generates a Windows-encoded character.
* Alt+<+>+<xxxx>, where xxxx is the hexadecimal Unicode code point, generates a Unicode-encoded (UTF-16) character.

То бишь, можно вводить в OEM-кодировке (DOS), в Windows-кодировке, и в Unicode. В первых случаях код вводится в десятичной записи, во втором к нему слева приписывается 0. Оба варианта работают, а вот третий почему-то работать не захотел. Пришлось искать дальше, и вот решение — третий (шестнадцатеричный) способ ввода нужно активировать, и он работает не везде.
Активируется Unicode-ввод записью в реестре с последующей перезагрузкой, вот .reg-файл:

Затем открываем блокнот (у меня в нем работало, в броузерах — нет, выскакивало в адресную строку), зажимаем Alt и <+> на цифровой клавиатуре, и вводим шестнадцатеричный Unicode-код символа. Неудобно до чертиков, да. Получаем квадратик, который можно скопировать в браузер и получить там нужный символ.

Источник

Как ввести юникод с клавиатуры виндовс

Юникод ввод является вставкой определенного символа Unicode на компьютер с помощью пользователя ; это распространенный способ ввода символов, который напрямую не поддерживается физической клавиатурой . Символы Unicode могут быть созданы либо путем выбора их на дисплее, либо путем набора определенной последовательности клавиш на физической клавиатуре. Кроме того, символ, созданный одним из этих методов на одной веб-странице или в документе, может быть скопирован в другой. В отличие от 96-элементного набора символов ASCII (который он содержит), Unicode кодирует сотни тысяч графем (символов) почти всех письменных языков мира, а также многие другие знаки и символы.

Система ввода Unicode должна обеспечивать большой набор символов, в идеале все допустимые кодовые точки Unicode. Это отличается от раскладки клавиатуры, которая определяет клавиши и их комбинации только для ограниченного числа символов, подходящих для определенной локали .

СОДЕРЖАНИЕ

Числа Unicode

Символы Unicode различаются кодовыми точками , которые обычно обозначаются буквой «U +», за которой следуют четыре, пять или шесть шестнадцатеричных цифр , например U + 00AE или U + 1D310. Символы в базовой многоязычной плоскости (BMP), содержащие современные шрифты, в том числе многие китайские и японские символы, и многие символы, имеют 4-значный код. Исторические сценарии, а также многие современные символы и пиктограммы (например, смайлики , эмодзи , игральные карты и многие символы CJK ) имеют 5-значные коды.

Доступность

Приложение может отображать символ, только если оно может получить доступ к шрифту, который содержит глиф для символа. Очень немногие шрифты имеют полное покрытие Unicode; большинство из них содержат только глифы, необходимые для поддержки нескольких систем письма . Однако большинство современных браузеров и других приложений для обработки текста могут отображать многоязычный контент, поскольку они выполняют замену шрифта , автоматически переключаясь на резервный шрифт, когда это необходимо для отображения символов, которые не поддерживаются в текущем шрифте. Какие шрифты используются для отката, и степень покрытия Unicode зависит от программного обеспечения и операционной системы; некоторые программы будут искать подходящий глиф во всех установленных шрифтах, другие — только в определенных шрифтах.

Если приложение не имеет доступа к глифу, этот символ обычно отображается как глиф шрифта «.notdef» ⟨􏿮⟩, который часто отображается как пустое поле (получившее название «тофу» в зависимости от формы), поле с X или квадрат со знаком вопроса. Современные реализации используют .notdef для неподдерживаемых символов, а символ замены ⟨ ⟩ — только для ошибок кодирования.

Выбор с экрана

Многие системы предоставляют возможность визуального выбора символов Юникода. ISO / IEC 14755 называет это методом ввода с экрана .

Microsoft Windows предоставила Unicode-версию программы Character Map , появившуюся в потребительской версии начиная с XP. Это ограничено символами в базовой многоязычной плоскости (BMP). Символы доступны для поиска по имени символа Unicode, и таблица может быть ограничена конкретным блоком кода. Также доступны более продвинутые сторонние инструменты того же типа (заметным примером бесплатного программного обеспечения является BabelMap , который поддерживает все символы Unicode). В большинстве окружений рабочего стола Linux доступны эквивалентные инструменты, такие как gucharmap (GNOME) или kcharselect (KDE).

Обычно эти инструменты позволяют пользователю «копировать» выбранные символы в буфер обмена, а затем вставлять их в документ, вместо того, чтобы делать вид, что набирает их напрямую.

Часто бывает удобно просто найти нужный символ в Интернете или в другом документе, скопировать и вставить его оттуда.

Десятичный ввод

Некоторые программы, работающие в Microsoft Windows , в том числе последние версии Word и Wordpad , могут создавать символы из своих кодовых точек Unicode, выраженные в десятичном формате и вводимые с цифровой клавиатуры при Alt нажатой клавише. Например, знак евро € имеет шестнадцатеричный код 20AC, который в десятичном виде равен 8364, поэтому Alt + 8 3 6 4 будет создавать символ. Точно так же, Alt + 1 2 0 1 3 2 производит двойной пораженный характер 𝕄 .

Читайте также:  Отзывы про DEFENDER Stainless steel GK 150DL

Десятичные кодовые точки в диапазоне 160–255 должны вводиться с начальным нулем (чтобы была выбрана кодовая страница Windows ), и, кроме того, кодовая страница Windows должна быть настроена в соответствии с Unicode ( необходимо использовать CP1252 ). Например, Alt + 0 2 4 7 дает ÷ , что соответствует его кодовой точке, но символ, создаваемый Alt +, 2 4 7 зависит от кодовой страницы OEM , такой как Кодовая страница 437 , и может давать ≈ .

В программах, в которых коды Alt больше 255 не работают, полученный символ обычно соответствует остатку от деления числа на 256.

Текстовый редактор Vim позволяет указывать символы с помощью двухсимвольной мнемоники ( разработчики Vim ошибочно называют ее «диграфами» ). Установленный набор может быть дополнен пользовательской мнемоникой, определенной для произвольных кодовых точек, указанных в десятичной системе. Например, поскольку десятичное число 9881 равно шестнадцатеричному 2699, dig Gr 9881 «Gr» связывается с U + 2699 ⚙ GEAR .

См. Ниже использование десятичных кодовых точек в HTML.

Шестнадцатеричный ввод

В пункте 5.1 ИСО / МЭК 14755 описан базовый метод, при котором за начальной последовательностью следует шестнадцатеричное представление кодовой точки и конечной последовательности . В большинстве современных систем есть некоторый метод для имитации этого, иногда ограниченный четырьмя цифрами (таким образом, только базовая многоязычная плоскость ).

В Microsoft Windows

Ввод шестнадцатеричных Unicode может быть включен путем добавления значения строкового типа (REG_SZ) с именем EnableHexNumpad в реестре ключ HKEY_CURRENT_USER\Control Panel\Input Method и присвоения данных значений 1 к нему. Чтобы этот метод ввода начал работать, пользователям потребуется выйти из системы и снова войти в нее после редактирования реестра. (В версиях, предшествующих Vista, пользователям необходимо было перезагрузить компьютер, чтобы он начал работать.)

Затем символы Unicode можно вводить, удерживая Alt и набирая + на цифровой клавиатуре, а затем шестнадцатеричный код — используя цифровую клавиатуру для цифр от 0 до 9 и буквенные клавиши для A — F, а затем отпуская Alt . Это может не работать для 5-значных шестнадцатеричных кодов, например U+1F937 .

Если кто-то предпочитает не редактировать реестр или если, как на многих ноутбуках, цифровая клавиатура недоступна, можно использовать стороннее программное обеспечение, такое как UnicodeInput .

Сценарии AutoHotkey поддерживают замену нажатий клавиш символами Unicode. Например, команда Send вставит длинное тире в текстовое поле активного окна.

В некоторых приложениях (программы Word , WordPad и LibreOffice ) поддерживается более простой метод: сначала вводится код символа (от двух до шести шестнадцатеричных цифр), затем вводится Alt +, X который заменяет цифры на символ Unicode. Например, ввод f1 и последующее нажатие комбинации приведет к появлению символа «ñ».

Если код не состоит из шести шестнадцатеричных цифр, ему не должны предшествовать цифры или буквы a – f, поскольку они могут рассматриваться как часть преобразуемого кода. Например, ввод с af1 последующим Alt + X даст «» (U + 0AF1), а ввод с a0000f1 последующим Alt + X даст «añ» («a», за которым следует символ U + 00F1).

С помощью этого метода можно сгенерировать нужный символ в Word (например), а затем скопировать и вставить его в приложение, которое напрямую не поддерживает этот метод.

В MacOS

Должен быть включен шестнадцатеричный ввод Unicode. В Mac OS 8.5 и новее можно выбрать раскладку клавиатуры Unicode Hex Input ; в OS X (10.10) Yosemite это можно добавить в Клавиатура → Источники ввода.

Удерживая нажатой ⌥ Option , вводится четырехзначный шестнадцатеричный код Unicode, и появляется эквивалентный символ; затем можно отпустить ⌥ Option ключ. Символы за пределами BMP (базовой многоязычной плоскости) превышают четырехзначный предел шестнадцатеричного механизма ввода Unicode, но могут быть введены с помощью суррогатных пар : удерживая ⌥ Option клавишу при вводе первого суррогата + , второго суррогата, затем отпустите клавишу Option.

В X11 (Linux и другие варианты Unix, включая Chrome OS)

Во многих приложениях для прямого ввода символов Юникода работают один или оба следующих метода:

  • Удерживая Ctrl +, ⇧ Shift введите u шестнадцатеричные цифры и отпустите Ctrl + ⇧ Shift .
  • Ввод Ctrl + ⇧ Shift + u , отпускание, затем ввод шестнадцатеричных цифр и нажатие ↵ Enter ( Space или даже, в некоторых системах, нажатие и отпускание ⇧ Shift или Ctrl ).

Это поддерживается приложениями GTK и Qt и, возможно, другими. В Chrome OS это функция операционной системы.

В платформенно-независимых приложениях

  • В Emacs , Ctrl + x 8 ↵ Enter или Meta + x insert-char .
  • В LibreOffice 5.1 и далее, Alt + X описанный выше метод для работы Windows.
  • В версиях Opera , использующих механизм компоновки Presto, то есть до версии 12.xx включительно, введите шестнадцатеричное число желаемого символа или символа и затем нажмите Ctrl + ⇧ Shift + x (альтернативный ярлык Meta + ⇧ Shift + + x в macOS ).
  • В редакторе Vim в режиме вставки пользователь сначала набирает Ctrl + V u (для кодовых точек длиной до 4 шестнадцатеричных цифр; используя Ctrl + V ⇧ Shift + U дольше), затем вводит шестнадцатеричное число желаемого символа или символа, и оно будет преобразовано в символ. (В Microsoft Windows Ctrl + Q может потребоваться вместо Ctrl + V .)
  • В AutoCAD \U2300 или трех клавиш %%c , %%d , %%p .

В HTML и XML коды символов, которые должны отображаться как символы, имеют префикс амперсанда и знака числа (& #), за которыми следует точка с запятой (;). Кодовая точка может быть десятичной или шестнадцатеричной ; в последнем случае ему предшествует «х». Начальные нули можно опустить. Ряд символов может быть представлен именованной сущностью .

Пример: в HTML / XML знак авторского права © ( U+00A9 ) может быть закодирован как:

  • &#169; (десятичный код)
  • &#xa9; (шестнадцатеричный код)
  • &copy; (имя сущности)

Это работает во многих программах, поддерживающих HTML-разметку, таких как Thunderbird и редактирование Википедии.

Источник



Как вводить символы Unicode с помощью шестнадцатеричных кодов?

Это в Windows, но ответы для других операционных систем могут быть полезны другим.

В большинстве руководств говорится о том, что «удерживайте клавишу Alt и введите код на клавиатуре». Это отлично подходит для десятичных кодов (например, 65 для «A»), но не для шестнадцатеричных кодов ( например U + 0041 для «A»).

В некоторых приложениях предусмотрены другие возможности, которые позволят ввести шестнадцатеричные коды символов Юникода и затем преобразовать. Word позволяет ввести код (например, 200f), а затем преобразовать его в Юникод, набрав Alt-X.

Я ищу общий метод выполнения этого, который будет работать со стандартным вводом.

8 ответов

Ответ harrymc хорош, если вы в состоянии /можете изменить настройки реестра.

Если нет, вы можете использовать аксессуар калькулятора Windows для преобразования из шестнадцатеричного в десятичный. Режим по умолчанию не будет делать этого: XP и Vista имеют «научный режим», тогда как Windows 7, 8, 8.1 и 10 имеют режим «Программист».

Читайте также:  Игры кроссворды разные и интересные

Выберите Hex базу, а затем введите шестнадцатеричное число. Затем перейдите в базу Dec , чтобы увидеть эквивалентное значение в десятичной системе. Это номер, который вам нужно ввести в цифровую клавиатуру, удерживая клавишу Alt .

Этот может зависеть от языка ввода, и вам может потребоваться префикс от нуля до десятичного значения.

  1. Нажмите и удерживайте клавишу Alt.
  2. Нажмите клавишу + (плюс) на цифровой клавиатуре.
  3. Введите значение шестнадцатеричного уникода.
  4. Отпустите клавишу Alt.

Вы должны выйти из системы, затем войти в систему после изменения реестра или даже перезагрузить.

В Mac OS X: откройте International в системных настройках и в меню ввода выберите «Unicode Hex Input», чтобы добавить эту опцию в меню ввода. Звучит очевидно, но это хорошо скрыто в длинном списке языков, между украинским и вьетнамским. Когда выбрано, удержите опцию и введите шестизначный шестнадцатеричный код.

Также в OS X: Калькулятор может быть установлен в режим программирования (Cmd-3), который позволяет вводить десятичные, восьмеричные и шестнадцатеричные коды, которые затем отображаются как ASCII или Unicode. Тем не менее, Копия даст один код, а не эквивалент (ы) символа. Кто-нибудь?

И здесь, на Super User:

И чтобы перейти в крайности:

В Ubuntu (и его вариантах, например LinuxMint) вы можете ввести значения Unicode, нажав Ctrl + Shift + u , за которым следует Unicode значение и Enter, например:

Ctrl + Shift + u 2 6 3 a , затем введите yields:

º
Снимок экрана: alt text

Возможно, вы сможете связать это с AutoHotkey для упрощения ввода или возможного ввода в Windows.

Я написал небольшой файл AutoHotkey Инструмент ввода Unicode , потому что я не нашел лучшего решение. Вы можете вставлять символы Unicode с помощью Shift + Ctrl + U .

 Unicode dialog

В основном, он преобразует запись в символ юникода и «типы» в позиции курсора.

Он не поддерживает шестизначные символы юникода. Кроме того, если у вас есть поле ввода, где весь текст выбран при потере фокуса, весь текст будет перезаписан (я думаю, что я помню, что в старой версии Firefox было показано это поведение).

В качестве ссылки, здесь AutoHotkey источник, если вы хотите скомпилировать его самостоятельно:

Это также зависит от того, где вы хотите использовать специальные символы. В приложениях MS Office вам не нужно прибегать к знанию кодов ASCII для определенных символов — например, для ввода диарейиса (т. Е. Двух точек, которые вы видите над некоторыми символами в словах, таких как naó¯ve), в Word /Outlook /etc вы можете нажать Ctrl + ‘:’ (т. Е. Ctrl + Shift +;), за которым следует ‘i’.

Список ярлыков доступен в http://word.mvps.org/Часто задаваемые вопросы /Общие /InsertSpecChars.htm . просто прокрутите вниз до «Международные символы».

Я не знаю, поддерживают ли какие-либо приложения не для Office аналогичные ярлыки.

Linux (включая приложения Qt /KDE)

Как упоминалось в JMD, вы можете удерживать Ctrl — Shift , введите u1f4a9 и отпустите, чтобы ввести U + 1F4A9 в GTK + приложений (включая программы GNOME, Firefox, Chromium и LibreOffice, даже в KDE). Некоторые программы также поддерживают типизацию в последовательности Ctrl — Shift — U , 1 , f , 4 , a , 9 , Введите .

К сожалению, это не работает в Qt-приложениях (включая программы KDE, Mathematica и VLC). Для символов BMP существует метод ввода Unicode IBus. Чтобы включить, откройте настройки IBus и добавьте метод ввода «Other — unicode (m17n)» (должны быть установлены два пакета ibus-m17n и ibus-qt4 ). Когда курсор находится в текстовой области, активируйте метод ввода (с помощью панели инструментов IBus или сочетания клавиш). При активном методе ввода вы можете ввести Ctrl — Shift — U , а затем 4 шестнадцатеричных цифры, чтобы ввести соответствующий символ Юникода. Однако это работает только для символов BMP.

(проверено под Ubuntu.)

Возможно, не совсем то, что вы просите, но это то, что я искал. В Windows 10 вы можете нажать Win + . или Win + ; , чтобы открыть браузер emoji:

Источник

Ввод Unicode — Unicode input

Юникод ввод является вставкой определенного символа Unicode на компьютер с помощью пользователя ; это распространенный способ ввода символов, который напрямую не поддерживается физической клавиатурой . Символы Unicode могут быть созданы либо путем выбора их на дисплее, либо путем набора определенной последовательности клавиш на физической клавиатуре. Кроме того, символ, созданный одним из этих методов на одной веб-странице или в документе, может быть скопирован в другой. В отличие от 96-элементного набора символов ASCII (который он содержит), Unicode кодирует сотни тысяч графем (символов) почти всех письменных языков мира, а также многие другие знаки и символы.

Система ввода Unicode должна обеспечивать большой набор символов, в идеале все допустимые кодовые точки Unicode. Это отличается от раскладки клавиатуры, которая определяет клавиши и их комбинации только для ограниченного числа символов, подходящих для определенной локали .

СОДЕРЖАНИЕ

Числа Unicode

Символы Unicode различаются кодовыми точками , которые обычно обозначаются буквой «U +», за которой следуют четыре, пять или шесть шестнадцатеричных цифр , например U + 00AE или U + 1D310. Символы в базовой многоязычной плоскости (BMP), содержащие современные шрифты, в том числе многие китайские и японские символы, и многие символы, имеют 4-значный код. Исторические сценарии, а также многие современные символы и пиктограммы (например, смайлики , эмодзи , игральные карты и многие символы CJK ) имеют 5-значные коды.

Доступность

Приложение может отображать символ, только если оно может получить доступ к шрифту, который содержит глиф для символа. Очень немногие шрифты имеют полное покрытие Unicode; большинство из них содержат только глифы, необходимые для поддержки нескольких систем письма . Однако большинство современных браузеров и других приложений для обработки текста могут отображать многоязычный контент, поскольку они выполняют замену шрифта , автоматически переключаясь на резервный шрифт, когда это необходимо для отображения символов, которые не поддерживаются в текущем шрифте. Какие шрифты используются для отката, и степень покрытия Unicode зависит от программного обеспечения и операционной системы; некоторые программы будут искать подходящий глиф во всех установленных шрифтах, другие — только в определенных шрифтах.

Если приложение не имеет доступа к глифу, этот символ обычно отображается как глиф шрифта «.notdef» ⟨􏿮⟩, который часто отображается как пустое поле (получившее название «тофу» в зависимости от формы), поле с X или квадрат со знаком вопроса. Современные реализации используют .notdef для неподдерживаемых символов, а символ замены ⟨ ⟩ — только для ошибок кодирования.

Выбор с экрана

Многие системы предоставляют возможность визуального выбора символов Юникода. ISO / IEC 14755 называет это методом ввода с экрана .

Microsoft Windows предоставила Unicode-версию программы Character Map , появившуюся в потребительской версии начиная с XP. Это ограничено символами в базовой многоязычной плоскости (BMP). Символы доступны для поиска по имени символа Unicode, и таблица может быть ограничена конкретным блоком кода. Также доступны более продвинутые сторонние инструменты того же типа (заметным примером бесплатного программного обеспечения является BabelMap , который поддерживает все символы Unicode). В большинстве окружений рабочего стола Linux доступны эквивалентные инструменты, такие как gucharmap (GNOME) или kcharselect (KDE).

Читайте также:  Клавиатура с быстрым набором использует аккорды для написания слов

Обычно эти инструменты позволяют пользователю «копировать» выбранные символы в буфер обмена, а затем вставлять их в документ, вместо того, чтобы делать вид, что набирает их напрямую.

Часто бывает удобно просто найти нужный символ в Интернете или в другом документе, скопировать и вставить его оттуда.

Десятичный ввод

Некоторые программы, работающие в Microsoft Windows , в том числе последние версии Word и Wordpad , могут создавать символы из своих кодовых точек Unicode, выраженные в десятичном формате и вводимые с цифровой клавиатуры при Alt нажатой клавише. Например, знак евро € имеет шестнадцатеричный код 20AC, который в десятичном виде равен 8364, поэтому Alt + 8 3 6 4 будет создавать символ. Точно так же, Alt + 1 2 0 1 3 2 производит двойной пораженный характер 𝕄 .

Десятичные кодовые точки в диапазоне 160–255 должны вводиться с начальным нулем (чтобы была выбрана кодовая страница Windows ), и, кроме того, кодовая страница Windows должна быть настроена в соответствии с Unicode ( необходимо использовать CP1252 ). Например, Alt + 0 2 4 7 дает ÷ , что соответствует его кодовой точке, но символ, создаваемый Alt +, 2 4 7 зависит от кодовой страницы OEM , такой как Кодовая страница 437 , и может давать ≈ .

В программах, в которых коды Alt больше 255 не работают, полученный символ обычно соответствует остатку от деления числа на 256.

Текстовый редактор Vim позволяет указывать символы с помощью двухсимвольной мнемоники ( разработчики Vim ошибочно называют ее «диграфами» ). Установленный набор может быть дополнен пользовательской мнемоникой, определенной для произвольных кодовых точек, указанных в десятичной системе. Например, поскольку десятичное число 9881 равно шестнадцатеричному 2699, dig Gr 9881 «Gr» связывается с U + 2699 ⚙ GEAR .

См. Ниже использование десятичных кодовых точек в HTML.

Шестнадцатеричный ввод

В пункте 5.1 ИСО / МЭК 14755 описан базовый метод, при котором за начальной последовательностью следует шестнадцатеричное представление кодовой точки и конечной последовательности . В большинстве современных систем есть некоторый метод для имитации этого, иногда ограниченный четырьмя цифрами (таким образом, только базовая многоязычная плоскость ).

В Microsoft Windows

Ввод шестнадцатеричных Unicode может быть включен путем добавления значения строкового типа (REG_SZ) с именем EnableHexNumpad в реестре ключ HKEY_CURRENT_USER\Control Panel\Input Method и присвоения данных значений 1 к нему. Чтобы этот метод ввода начал работать, пользователям потребуется выйти из системы и снова войти в нее после редактирования реестра. (В версиях, предшествующих Vista, пользователям необходимо было перезагрузить компьютер, чтобы он начал работать.)

Затем символы Unicode можно вводить, удерживая Alt и набирая + на цифровой клавиатуре, а затем шестнадцатеричный код — используя цифровую клавиатуру для цифр от 0 до 9 и буквенные клавиши для A — F, а затем отпуская Alt . Это может не работать для 5-значных шестнадцатеричных кодов, например U+1F937 .

Если кто-то предпочитает не редактировать реестр или если, как на многих ноутбуках, цифровая клавиатура недоступна, можно использовать стороннее программное обеспечение, такое как UnicodeInput .

Сценарии AutoHotkey поддерживают замену нажатий клавиш символами Unicode. Например, команда Send вставит длинное тире в текстовое поле активного окна.

В некоторых приложениях (программы Word , WordPad и LibreOffice ) поддерживается более простой метод: сначала вводится код символа (от двух до шести шестнадцатеричных цифр), затем вводится Alt +, X который заменяет цифры на символ Unicode. Например, ввод f1 и последующее нажатие комбинации приведет к появлению символа «ñ».

Если код не состоит из шести шестнадцатеричных цифр, ему не должны предшествовать цифры или буквы a – f, поскольку они могут рассматриваться как часть преобразуемого кода. Например, ввод с af1 последующим Alt + X даст «» (U + 0AF1), а ввод с a0000f1 последующим Alt + X даст «añ» («a», за которым следует символ U + 00F1).

С помощью этого метода можно сгенерировать нужный символ в Word (например), а затем скопировать и вставить его в приложение, которое напрямую не поддерживает этот метод.

В MacOS

Должен быть включен шестнадцатеричный ввод Unicode. В Mac OS 8.5 и новее можно выбрать раскладку клавиатуры Unicode Hex Input ; в OS X (10.10) Yosemite это можно добавить в Клавиатура → Источники ввода.

Удерживая нажатой ⌥ Option , вводится четырехзначный шестнадцатеричный код Unicode, и появляется эквивалентный символ; затем можно отпустить ⌥ Option ключ. Символы за пределами BMP (базовой многоязычной плоскости) превышают четырехзначный предел шестнадцатеричного механизма ввода Unicode, но могут быть введены с помощью суррогатных пар : удерживая ⌥ Option клавишу при вводе первого суррогата + , второго суррогата, затем отпустите клавишу Option.

В X11 (Linux и другие варианты Unix, включая Chrome OS)

Во многих приложениях для прямого ввода символов Юникода работают один или оба следующих метода:

  • Удерживая Ctrl +, ⇧ Shift введите u шестнадцатеричные цифры и отпустите Ctrl + ⇧ Shift .
  • Ввод Ctrl + ⇧ Shift + u , отпускание, затем ввод шестнадцатеричных цифр и нажатие ↵ Enter ( Space или даже, в некоторых системах, нажатие и отпускание ⇧ Shift или Ctrl ).

Это поддерживается приложениями GTK и Qt и, возможно, другими. В Chrome OS это функция операционной системы.

В платформенно-независимых приложениях

  • В Emacs , Ctrl + x 8 ↵ Enter или Meta + x insert-char .
  • В LibreOffice 5.1 и далее, Alt + X описанный выше метод для работы Windows.
  • В версиях Opera , использующих механизм компоновки Presto, то есть до версии 12.xx включительно, введите шестнадцатеричное число желаемого символа или символа и затем нажмите Ctrl + ⇧ Shift + x (альтернативный ярлык Meta + ⇧ Shift + + x в macOS ).
  • В редакторе Vim в режиме вставки пользователь сначала набирает Ctrl + V u (для кодовых точек длиной до 4 шестнадцатеричных цифр; используя Ctrl + V ⇧ Shift + U дольше), затем вводит шестнадцатеричное число желаемого символа или символа, и оно будет преобразовано в символ. (В Microsoft Windows Ctrl + Q может потребоваться вместо Ctrl + V .)
  • В AutoCAD \U2300 или трех клавиш %%c , %%d , %%p .

В HTML и XML коды символов, которые должны отображаться как символы, имеют префикс амперсанда и знака числа (& #), за которыми следует точка с запятой (;). Кодовая точка может быть десятичной или шестнадцатеричной ; в последнем случае ему предшествует «х». Начальные нули можно опустить. Ряд символов может быть представлен именованной сущностью .

Пример: в HTML / XML знак авторского права © ( U+00A9 ) может быть закодирован как:

  • &#169; (десятичный код)
  • &#xa9; (шестнадцатеричный код)
  • &copy; (имя сущности)

Это работает во многих программах, поддерживающих HTML-разметку, таких как Thunderbird и редактирование Википедии.

Источник