Реклама мешает? Идти Без рекламы Сегодня 

Конвертер Unicode в HTML-сущности

РазработчикТекст

РЕКЛАМА · УДАЛЯТЬ?

ВХОД

Автоматический процесс

ВЫХОД

Клиентская сторона

РЕКЛАМА · УДАЛЯТЬ?

Гид

Конвертер Unicode в HTML-сущности

Специальные символы в HTML могут нарушить отображение, вызвать проблемы с кодировкой или отображаться некорректно в разных браузерах. Преобразование символов Unicode в HTML-сущности гарантирует, что ваш контент будет отображаться правильно везде — от шаблонов электронной почты до устаревших CMS-платформ. Этот инструмент обрабатывает преобразование в обоих направлениях, полностью в вашем браузере.

Вставьте ваш текст и мгновенно получите HTML-сущности, или вставьте сущности, чтобы декодировать их обратно в читаемый текст. Выбирайте между именованными, десятичными или шестнадцатеричными форматами сущностей в зависимости от ваших потребностей.

Как использовать

Вставьте текст Unicode в поле ввода, чтобы закодировать его в HTML-сущности, или переключитесь в режим декодирования и вставьте HTML-сущности, чтобы преобразовать их обратно в читаемый текст. Выберите предпочтительный формат сущностей (именованный, десятичный или шестнадцатеричный) и решите, кодировать ли все символы или только не-ASCII. Результаты появляются мгновенно по мере ввода.

РЕКЛАМА · УДАЛЯТЬ?

Функции

Три формата сущностей – Именованные сущности (©), десятичные (©) или шестнадцатеричные (©) — выберите то, что нужно вашему проекту
Двунаправленное преобразование – Кодировать Unicode в сущности или декодировать сущности обратно в текст Unicode
Выборочное кодирование – Кодировать только не-ASCII символы (рекомендуется) или кодировать все, включая базовые ASCII
Поддержка именованных сущностей HTML5 – Комплексная таблица поиска, охватывающая ~250 именованных HTML-сущностей
Таблица информации о символах – Просмотр кодовой точки и имени каждого преобразованного символа Unicode
Автоматическая обработка – Результаты обновляются мгновенно по мере ввода — никаких нажатий кнопок не требуется
Только на стороне клиента – Все преобразование происходит в вашем браузере, ничего не отправляется на сервер

Когда использовать этот инструмент

Используйте его при встраивании специальных символов в HTML-письма, при работе с устаревшими системами, не поддерживающими UTF-8, для обеспечения кроссбраузерной совместимости символов валют и специальных знаков препинания, или при отладке проблем с кодировкой в веб-контенте. Режим декодирования удобен для того, чтобы снова сделать HTML с большим количеством сущностей читаемым.

 Часто задаваемые вопросы

Какова разница между именованными, десятичными и шестнадцатеричными HTML-сущностями?

Именованные сущности используют удобочитаемые метки, такие как © для символа авторского права. Десятичные сущности используют кодовую точку Unicode в 10-чной системе счисления, такую как ©. Шестнадцатеричные сущности используют 16-ричную систему, такую как ©. Все три одинаково отображаются в браузерах. Именованные сущности легче читать в исходном коде, но они существуют только для распространенных символов (~250 в HTML5). Десятичные и шестнадцатеричные сущности работают для любого символа Unicode, что делает их более универсальными.
Когда следует использовать HTML-сущности вместо необработанных символов Unicode?

Используйте HTML-сущности, когда кодировка вашего документа может быть не UTF-8 (устаревшие системы, некоторые почтовые клиенты), когда символ имеет особое значение в HTML (например, & и кавычки), когда вам нужно обеспечить совместимость со старыми браузерами или парсерами, или при работе с системами управления контентом, которые удаляют или искажают Unicode. Для современных веб-сайтов с кодировкой UTF-8 необработанный Unicode в целом подходит для большинства символов, но сущности по-прежнему необходимы для символов, зарезервированных в HTML.
Какие наиболее часто используемые HTML-сущности?

Наиболее часто используемые сущности: & (амперсанд), < и > (угловые скобки), " (двойные кавычки), (неразрывный пробел), © (авторское право), ® (зарегистрированный товарный знак), € (знак евро), — (длинное тире) и … (многоточие). Первые пять являются обязательными, поскольку они предотвращают конфликты с синтаксисом HTML — необработанный амперсанд или угловая скобка могут нарушить ваш разметку.
Какова связь между Unicode и HTML-сущностями?

Unicode — это универсальный стандарт кодирования символов, который присваивает уникальный номер (кодовую точку) каждому символу на любом языке. HTML-сущности — это способ представления этих кодовых точек Unicode в HTML-разметке. Десятичная сущность, такая как ©, напрямую ссылается на кодовую точку Unicode U+00A9 (знак авторского права). Именованные сущности, такие как ©, являются псевдонимами, определенными в спецификации HTML, которые соответствуют тем же кодовым точкам. По сути, HTML-сущности — это просто синтаксис, специфичный для HTML, для ссылки на символы Unicode.
Поддерживают ли все браузеры все HTML-сущности?

Все современные браузеры поддерживают полный набор именованных сущностей HTML5 и все десятичные/шестнадцатеричные сущности для символов в Основной многоязычной плоскости (от U+0000 до U+FFFF). Поддержка символов за пределами BMP (эмодзи, исторические шрифты, математические символы выше U+FFFF) с использованием суррогатных пар сущностей незначительно различается в старых браузерах, но является универсальной в текущих версиях. Именованные сущности — лучший выбор для распространенных символов, поскольку они имеют самую долгую историю поддержки браузерами.