Анализатор частоты символов
Гид
Анализатор частоты символов
Вставьте любой текст и сразу увидите, сколько раз появляется каждый символ. Анализатор частот символов подсчитывает каждую букву, цифру или символ, упорядочивает их, показывает проценты и отображает визуальный столбчатый график, чтобы вы могли быстро заметить закономерности. Это удобный инструмент для криптографического анализа, лингвистических заданий, проверки паролей, анализа контента и любых случаев, когда нужно точно определить, какие символы присутствуют в тексте.
В отличие от счётчика слов, этот инструмент работает на уровне символов. Это делает его особенно полезным для расшифровки простых шифров замены, когда нужно сравнить распределение букв с ожидаемым распределением в исходном языке. Включите «Сравнение с английским базовым уровнем» и инструмент покажет для каждой буквы стандартные частоты в английском языке и отклонение вашего текста от них.
Как использовать
- Вставьте свой текст в ящик ввода, или нажмите «Попробовать пример» для загрузки образца.
- Выберите, что вы хотите подсчитывать: Только буквы, Буквы и цифры, Распечатываемые (без пробелов), или Все символы.
- Переключать С учётом регистра если A и a должны считаться отдельно.
- Для анализа шифров замены, оставьте Сравнение с английским базовым уровнем включенным, чтобы увидеть отклонения от стандартного распределения ETAOIN.
- Сортировка столбца осуществляется по клику на заголовке. Используйте Копировать CSV, Скачать CSV, или Копировать JSON для экспорта таблицы.
Возможности
- Таблица частот — Ранг, символ, количество, процент и пропорциональный столбец для каждого уникального символа.
- Четыре режима подсчёта — Только буквы, буквы и цифры, распечатываемые символы (без пробелов) или все кодовые точки, включая пробелы и пунктуацию.
- Переключение чувствительности к регистру — Считать A и a как один символ или отдельно.
- Сравнение с английским базовым уровнем — При подсчёте букв увидите ожидаемые проценты в английском языке и отклонение с учётом знака, цветом отображаемое как выше или ниже.
- Энтропия Шеннона — Увидите энтропию в битах на символ вашего текста вместе с теоретическим максимумом для размера алфавита, полезную для проверки силы пароля и проверки случайности.
- Сортируемые столбцы — Нажмите на любой заголовок, чтобы отсортировать по рангу, символу, количеству, проценту или отклонению.
- Поддержка Unicode — Обрабатывает любые кодовые точки, с дружелюбными метками для пробелов и контрольных символов.
- Экспорт в CSV и JSON — Скопируйте или скачайте таблицу в любом из этих форматов, включая кодовые точки символов, для дальнейшего анализа.
- – вывод и проверка обновляются в реальном времени при вводе или изменении параметров. — Результаты обновляются автоматически при вводе текста или изменении настроек.
- Индивидуальный подход — Все работает в браузере. Ваш текст никогда не загружается.
Часто задаваемые вопросы
-
Что такое анализ частот символов?
Анализ частот символов — это практика подсчёта, сколько раз появляется каждый символ в тексте, и сравнение этого распределения с базовым ожидаемым уровнем. Этот метод восходит к 9-му веку, когда арабский математик Аль-Кинди использовал его для расшифровки шифров замены, и он остаётся основой классической криптографии, статистической лингвистики и многих современных алгоритмов сжатия и распознавания языка.
-
Какие буквы наиболее часто встречаются в английском языке?
В стандартном английском тексте порядок приблизительно такой: E, T, A, O, I, N, S, H, R, D, L, U — часто запоминается как ETAOIN SHRDLU. E — самая частая, около 12,7%, за ней следует T — 9,1%, а затем A — 8,2%. Наименее частые буквы — J, Q, X и Z, каждая из которых менее 0,2%. Реальные частоты могут немного варьироваться в зависимости от корпуса, но общий порядок остаётся стабильным в современных текстах на английском языке.
-
Как расшифровать шифр Цезаря или шифр замены с помощью анализа частот?
Для монографических шифров подсчитайте буквы в шифрованном тексте и упорядочьте их. Сопоставьте самую частую букву шифрованного текста с E, следующую — с T, и так далее, затем уточните соответствие с помощью часто встречающихся пар (TH, HE, IN), троек (THE, AND, ING) и коротких слов. При достаточном объёме текста исходный язык станет очевидным. Полиграфические шифры, такие как Виженер, ослабляют этот метод, размывая распределение по нескольким алфавитам, однако периодическую структуру можно обнаружить с помощью индекса совпадения и анализа Касиски.
-
Что такое энтропия Шеннона и зачем она показана здесь?
Энтропия Шеннона измеряет среднее количество информации, содержащейся в символе источника, выраженное в битах на символ. В идеальном равномерном алфавите максимальная энтропия равна log2(N) для N символов. Реальный текст намного менее случайный — английский текст примерно 1,0 до 1,5 бит на букву, с учётом контекста. Сравнение наблюдаемой энтропии с максимальной показывает, насколько предсказуем строка, что полезно для проверки случайности, оценки силы пароля и обнаружения необычного содержимого.
-
Почему мой текст отклоняется от английского базового уровня?
Несколько причин: короткие образцы содержат шум и естественно отклоняются от средних значений; технические тексты смещают распределение букв в сторону согласных, используемых в профессиональной лексике; непривычные слова, имена или коды вносят буквы с нестандартными частотами; а также намеренные стилистические решения, такие как липограммы, могут полностью исключить определённые буквы. Значительные отклонения в длинных, обычных текстах могут быть признаком обфускации, шифрования или использования языка, отличного от английского.
Установите наши расширения
Добавьте инструменты ввода-вывода в свой любимый браузер для мгновенного доступа и более быстрого поиска
恵 Табло результатов прибыло!
Табло результатов — это интересный способ следить за вашими играми, все данные хранятся в вашем браузере. Скоро появятся новые функции!
Подписаться на новости
все Новые поступления
всеОбновлять: Наш последний инструмент was added on Май 26, 2026
