Конвертер Unicode в HTML-сущности
Гид
Конвертер Unicode в HTML-сущности
Специальные символы в HTML могут нарушить отображение, вызвать проблемы с кодировкой или отображаться некорректно в разных браузерах. Преобразование символов Unicode в HTML-сущности гарантирует, что ваш контент будет отображаться правильно везде — от шаблонов электронной почты до устаревших CMS-платформ. Этот инструмент обрабатывает преобразование в обоих направлениях, полностью в вашем браузере.
Вставьте ваш текст и мгновенно получите HTML-сущности, или вставьте сущности, чтобы декодировать их обратно в читаемый текст. Выбирайте между именованными, десятичными или шестнадцатеричными форматами сущностей в зависимости от ваших потребностей.
Как использовать
Вставьте текст Unicode в поле ввода, чтобы закодировать его в HTML-сущности, или переключитесь в режим декодирования и вставьте HTML-сущности, чтобы преобразовать их обратно в читаемый текст. Выберите предпочтительный формат сущностей (именованный, десятичный или шестнадцатеричный) и решите, кодировать ли все символы или только не-ASCII. Результаты появляются мгновенно по мере ввода.
Функции
- Три формата сущностей – Именованные сущности (©), десятичные (©) или шестнадцатеричные (©) — выберите то, что нужно вашему проекту
- Двунаправленное преобразование – Кодировать Unicode в сущности или декодировать сущности обратно в текст Unicode
- Выборочное кодирование – Кодировать только не-ASCII символы (рекомендуется) или кодировать все, включая базовые ASCII
- Поддержка именованных сущностей HTML5 – Комплексная таблица поиска, охватывающая ~250 именованных HTML-сущностей
- Таблица информации о символах – Просмотр кодовой точки и имени каждого преобразованного символа Unicode
- Автоматическая обработка – Результаты обновляются мгновенно по мере ввода — никаких нажатий кнопок не требуется
- Только на стороне клиента – Все преобразование происходит в вашем браузере, ничего не отправляется на сервер
Когда использовать этот инструмент
Используйте его при встраивании специальных символов в HTML-письма, при работе с устаревшими системами, не поддерживающими UTF-8, для обеспечения кроссбраузерной совместимости символов валют и специальных знаков препинания, или при отладке проблем с кодировкой в веб-контенте. Режим декодирования удобен для того, чтобы снова сделать HTML с большим количеством сущностей читаемым.
Часто задаваемые вопросы
-
Какова разница между именованными, десятичными и шестнадцатеричными HTML-сущностями?
Именованные сущности используют удобочитаемые метки, такие как © для символа авторского права. Десятичные сущности используют кодовую точку Unicode в 10-чной системе счисления, такую как ©. Шестнадцатеричные сущности используют 16-ричную систему, такую как ©. Все три одинаково отображаются в браузерах. Именованные сущности легче читать в исходном коде, но они существуют только для распространенных символов (~250 в HTML5). Десятичные и шестнадцатеричные сущности работают для любого символа Unicode, что делает их более универсальными.
-
Когда следует использовать HTML-сущности вместо необработанных символов Unicode?
Используйте HTML-сущности, когда кодировка вашего документа может быть не UTF-8 (устаревшие системы, некоторые почтовые клиенты), когда символ имеет особое значение в HTML (например, & и кавычки), когда вам нужно обеспечить совместимость со старыми браузерами или парсерами, или при работе с системами управления контентом, которые удаляют или искажают Unicode. Для современных веб-сайтов с кодировкой UTF-8 необработанный Unicode в целом подходит для большинства символов, но сущности по-прежнему необходимы для символов, зарезервированных в HTML.
-
Какие наиболее часто используемые HTML-сущности?
Наиболее часто используемые сущности: & (амперсанд), < и > (угловые скобки), " (двойные кавычки), (неразрывный пробел), © (авторское право), ® (зарегистрированный товарный знак), € (знак евро), — (длинное тире) и … (многоточие). Первые пять являются обязательными, поскольку они предотвращают конфликты с синтаксисом HTML — необработанный амперсанд или угловая скобка могут нарушить ваш разметку.
-
Какова связь между Unicode и HTML-сущностями?
Unicode — это универсальный стандарт кодирования символов, который присваивает уникальный номер (кодовую точку) каждому символу на любом языке. HTML-сущности — это способ представления этих кодовых точек Unicode в HTML-разметке. Десятичная сущность, такая как ©, напрямую ссылается на кодовую точку Unicode U+00A9 (знак авторского права). Именованные сущности, такие как ©, являются псевдонимами, определенными в спецификации HTML, которые соответствуют тем же кодовым точкам. По сути, HTML-сущности — это просто синтаксис, специфичный для HTML, для ссылки на символы Unicode.
-
Поддерживают ли все браузеры все HTML-сущности?
Все современные браузеры поддерживают полный набор именованных сущностей HTML5 и все десятичные/шестнадцатеричные сущности для символов в Основной многоязычной плоскости (от U+0000 до U+FFFF). Поддержка символов за пределами BMP (эмодзи, исторические шрифты, математические символы выше U+FFFF) с использованием суррогатных пар сущностей незначительно различается в старых браузерах, но является универсальной в текущих версиях. Именованные сущности — лучший выбор для распространенных символов, поскольку они имеют самую долгую историю поддержки браузерами.
Установите наши расширения
Добавьте инструменты ввода-вывода в свой любимый браузер для мгновенного доступа и более быстрого поиска
恵 Табло результатов прибыло!
Табло результатов — это интересный способ следить за вашими играми, все данные хранятся в вашем браузере. Скоро появятся новые функции!
Подписаться на новости
все Новые поступления
всеОбновлять: Наш последний инструмент был добавлен 1 апр. 2026 г.
