Анализатор частоты символов

ДанныеБезопасностьТекст
Реклама · УДАЛИТЬ?

Параметры

Статистика

Таблица частотности

Реклама · УДАЛИТЬ?

Гид

Анализатор частот символов

Анализатор частоты символов

Вставьте любой текст и сразу увидите, сколько раз появляется каждый символ. Анализатор частот символов подсчитывает каждую букву, цифру или символ, упорядочивает их, показывает проценты и отображает визуальный столбчатый график, чтобы вы могли быстро заметить закономерности. Это удобный инструмент для криптографического анализа, лингвистических заданий, проверки паролей, анализа контента и любых случаев, когда нужно точно определить, какие символы присутствуют в тексте.

В отличие от счётчика слов, этот инструмент работает на уровне символов. Это делает его особенно полезным для расшифровки простых шифров замены, когда нужно сравнить распределение букв с ожидаемым распределением в исходном языке. Включите «Сравнение с английским базовым уровнем» и инструмент покажет для каждой буквы стандартные частоты в английском языке и отклонение вашего текста от них.

Как использовать

  1. Вставьте свой текст в ящик ввода, или нажмите «Попробовать пример» для загрузки образца.
  2. Выберите, что вы хотите подсчитывать: Только буквы, Буквы и цифры, Распечатываемые (без пробелов), или Все символы.
  3. Переключать С учётом регистра если A и a должны считаться отдельно.
  4. Для анализа шифров замены, оставьте Сравнение с английским базовым уровнем включенным, чтобы увидеть отклонения от стандартного распределения ETAOIN.
  5. Сортировка столбца осуществляется по клику на заголовке. Используйте Копировать CSV, Скачать CSV, или Копировать JSON для экспорта таблицы.

Возможности

  • Таблица частот — Ранг, символ, количество, процент и пропорциональный столбец для каждого уникального символа.
  • Четыре режима подсчёта — Только буквы, буквы и цифры, распечатываемые символы (без пробелов) или все кодовые точки, включая пробелы и пунктуацию.
  • Переключение чувствительности к регистру — Считать A и a как один символ или отдельно.
  • Сравнение с английским базовым уровнем — При подсчёте букв увидите ожидаемые проценты в английском языке и отклонение с учётом знака, цветом отображаемое как выше или ниже.
  • Энтропия Шеннона — Увидите энтропию в битах на символ вашего текста вместе с теоретическим максимумом для размера алфавита, полезную для проверки силы пароля и проверки случайности.
  • Сортируемые столбцы — Нажмите на любой заголовок, чтобы отсортировать по рангу, символу, количеству, проценту или отклонению.
  • Поддержка Unicode — Обрабатывает любые кодовые точки, с дружелюбными метками для пробелов и контрольных символов.
  • Экспорт в CSV и JSON — Скопируйте или скачайте таблицу в любом из этих форматов, включая кодовые точки символов, для дальнейшего анализа.
  • – вывод и проверка обновляются в реальном времени при вводе или изменении параметров. — Результаты обновляются автоматически при вводе текста или изменении настроек.
  • Индивидуальный подход — Все работает в браузере. Ваш текст никогда не загружается.

Реклама · УДАЛИТЬ?

Часто задаваемые вопросы

  1. Что такое анализ частот символов?

    Анализ частот символов — это практика подсчёта, сколько раз появляется каждый символ в тексте, и сравнение этого распределения с базовым ожидаемым уровнем. Этот метод восходит к 9-му веку, когда арабский математик Аль-Кинди использовал его для расшифровки шифров замены, и он остаётся основой классической криптографии, статистической лингвистики и многих современных алгоритмов сжатия и распознавания языка.

  2. Какие буквы наиболее часто встречаются в английском языке?

    В стандартном английском тексте порядок приблизительно такой: E, T, A, O, I, N, S, H, R, D, L, U — часто запоминается как ETAOIN SHRDLU. E — самая частая, около 12,7%, за ней следует T — 9,1%, а затем A — 8,2%. Наименее частые буквы — J, Q, X и Z, каждая из которых менее 0,2%. Реальные частоты могут немного варьироваться в зависимости от корпуса, но общий порядок остаётся стабильным в современных текстах на английском языке.

  3. Как расшифровать шифр Цезаря или шифр замены с помощью анализа частот?

    Для монографических шифров подсчитайте буквы в шифрованном тексте и упорядочьте их. Сопоставьте самую частую букву шифрованного текста с E, следующую — с T, и так далее, затем уточните соответствие с помощью часто встречающихся пар (TH, HE, IN), троек (THE, AND, ING) и коротких слов. При достаточном объёме текста исходный язык станет очевидным. Полиграфические шифры, такие как Виженер, ослабляют этот метод, размывая распределение по нескольким алфавитам, однако периодическую структуру можно обнаружить с помощью индекса совпадения и анализа Касиски.

  4. Что такое энтропия Шеннона и зачем она показана здесь?

    Энтропия Шеннона измеряет среднее количество информации, содержащейся в символе источника, выраженное в битах на символ. В идеальном равномерном алфавите максимальная энтропия равна log2(N) для N символов. Реальный текст намного менее случайный — английский текст примерно 1,0 до 1,5 бит на букву, с учётом контекста. Сравнение наблюдаемой энтропии с максимальной показывает, насколько предсказуем строка, что полезно для проверки случайности, оценки силы пароля и обнаружения необычного содержимого.

  5. Почему мой текст отклоняется от английского базового уровня?

    Несколько причин: короткие образцы содержат шум и естественно отклоняются от средних значений; технические тексты смещают распределение букв в сторону согласных, используемых в профессиональной лексике; непривычные слова, имена или коды вносят буквы с нестандартными частотами; а также намеренные стилистические решения, такие как липограммы, могут полностью исключить определённые буквы. Значительные отклонения в длинных, обычных текстах могут быть признаком обфускации, шифрования или использования языка, отличного от английского.

Хотите убрать рекламу? Откажитесь от рекламы сегодня

Установите наши расширения

Добавьте инструменты ввода-вывода в свой любимый браузер для мгновенного доступа и более быстрого поиска

в Расширение Chrome в Расширение края в Расширение Firefox в Расширение Opera

Табло результатов прибыло!

Табло результатов — это интересный способ следить за вашими играми, все данные хранятся в вашем браузере. Скоро появятся новые функции!

Реклама · УДАЛИТЬ?
Реклама · УДАЛИТЬ?
Реклама · УДАЛИТЬ?

новости с техническими моментами

Примите участие

Помогите нам продолжать предоставлять ценные бесплатные инструменты

Купи мне кофе
Реклама · УДАЛИТЬ?