Anúncios incomodam? Ir Sem anúncios Hoje 

Analizador de Frequência de Caracteres

DadosSegurançaTexto

ANUNCIADO Remover?

ENTRADA

Processo Automático

SAÍDA

Lado cliente

ANUNCIADO Remover?

Guia

Analizador de Frequência de Caracteres

Cole qualquer texto e veja imediatamente quantas vezes cada caractere aparece. O Analisador de Frequência de Caracteres conta cada letra, dígito ou símbolo, os classifica, exibe porcentagens e gera um gráfico de barras para que você possa identificar padrões de forma rápida. É uma ferramenta essencial para análise cibernética, trabalhos de lingüística, auditorias de senhas, auditorias de conteúdo e em qualquer situação em que seja necessário um contador preciso do que está presente em um texto.

Diferente de um contador de palavras, esta ferramenta atua no nível de caractere. Isso torna especialmente útil para quebrar códigos de substituição simples, onde o truque é comparar a distribuição observada de letras com a distribuição esperada da língua de origem. Ative a opção 'Comparar com a base inglesa' e a ferramenta mostrará, para cada letra, a frequência padrão em inglês e o quão seu texto se desvia dela.

Como usar

Cole seu texto no campo de entrada ou clique em 'Tente um exemplo' para carregar um modelo.
Escolha o que deseja contar: Letras apenas, Letras e dígitos, Imprimíveis (sem espaços em branco), ou Todos os caracteres.
Alternar Sensível a Maiúsculas/Minúsculas se A e a devem ser contados separadamente.
Para trabalhos com códigos de substituição, deixe Comparar com a base inglesa ligado para ver desvios da distribuição padrão ETAOIN.
Ordene qualquer coluna clicando no cabeçalho. Use Copiar CSV, Descarregar CSV, ou Copiar JSON para exportar a tabela.

Características

Tabela de frequência – Classificação, caractere, contagem, porcentagem e uma barra proporcional para cada caractere único.
Quatro modos de contagem – Letras apenas, letras e dígitos, caracteres imprimíveis (sem espaços em branco) ou todos os pontos de código, incluindo espaços e pontuação.
Alternância de caso – Trate A e a como o mesmo caractere ou conte-os separadamente.
Comparação com a base inglesa – Quando contar letras, veja as porcentagens esperadas em inglês e a diferença assinada na mesma linha, colorida acima e abaixo.
Entropia de Shannon – Veja a entropia em bits por caractere do seu texto ao lado do valor teórico máximo para o tamanho do alfabeto, útil para verificação de força de senha e análises de aleatoriedade.
Colunas ordenáveis – Clique em qualquer cabeçalho para ordenar por classificação, caractere, contagem, porcentagem ou desvio.
Compatível com Unicode – Trata qualquer ponto de código, com rótulos amigáveis para espaços em branco e caracteres de controle.
Exportação em CSV e JSON – Copie ou baixe a tabela em qualquer formato, incluindo códigos de caracteres, para análise posterior.
Atualizações em tempo real – Os resultados atualizam automaticamente enquanto você digita ou altera as opções.
Privado por design – Tudo funciona no seu navegador. Seu texto nunca é enviado.

ANUNCIADO Remover?

 Perguntas frequentes

O que é análise de frequência de caracteres?

A análise de frequência de caracteres é a prática de contar quantas vezes cada caractere aparece em um corpo de texto e comparar essa distribuição com uma base esperada. Data para o século IX, com o matemático árabe Al-Kindi, que o usou para quebrar códigos de substituição, e continua sendo a base da criptografia clássica, linguística estatística e de muitos algoritmos modernos de compressão e detecção de linguagem.
Quais são as letras mais comuns no inglês?

No texto padrão em inglês, a ordem é aproximadamente E, T, A, O, I, N, S, H, R, D, L, U — frequentemente lembrada como ETAOIN SHRDLU. O E é o mais comum, com cerca de 12,7 por cento, seguido por T com 9,1 por cento e A com 8,2 por cento. As letras menos comuns são J, Q, X e Z, cada uma abaixo de 0,2 por cento. As frequências no mundo real variam ligeiramente com o corpus de origem, mas a classificação geral é notavelmente estável em textos modernos em inglês.
Como quebrar um cifra de César ou de substituição com análise de frequência?

Para códigos monoalfabéticos, conte as letras no texto cifrado e ordene-as. Associe a letra mais frequente no texto cifrado com E, a próxima com T, e assim por diante, depois refine a correspondência usando bigramas (TH, HE, IN), trigramas (THE, AND, ING) e palavras curtas. Com um volume suficiente de texto, a língua original surge. Códigos polialfabéticos, como o Vigenère, dificultam esse ataque ao espalhar a distribuição entre vários alfabetos, mas a estrutura periódica ainda pode ser detectada com o índice de coincidência e exame de Kasiski.
O que é entropia de Shannon e por que é exibida aqui?

A entropia de Shannon mede o conteúdo médio de informação de um símbolo de uma fonte dada, expresso em bits por caractere. Um alfabeto perfeitamente uniforme tem entropia máxima igual a log2(N) para N símbolos. Textos reais são muito menos aleatórios — o prosa inglês é de cerca de 1,0 a 1,5 bits por letra quando o contexto é considerado. Comparar a entropia observada com o máximo indica a previsibilidade de uma string, útil para verificar a aleatoriedade, avaliar a força de senha e detectar conteúdo anômalo.
Por que meu texto se desvia da base inglesa?

Vários motivos: amostras curtas são ruídas e naturalmente se desviam dos valores populacionais; textos técnicos desequilibrar a distribuição de letras em direção a consoantes usadas em jargões; palavras, nomes ou códigos não em inglês introduzem letras com frequências atípicas; e escolhas estilísticas intencionais, como lipogramas, podem suprimir completamente certas letras. Desvios significativos em textos longos e comuns podem ser um sinal de obstrução, criptografia ou língua diferente do inglês.