Les pubs vous déplaisent ? Aller Sans pub Auj.

Analyseur de fréquence des caractères

DonnéesSécuritéTexte
ANNONCE · Supprimer ?

Options

Statistiques

Tableau de fréquence

ANNONCE · Supprimer ?

Guide

Analyseur de fréquence des caractères

Analyseur de fréquence des caractères

Collez du texte et voyez immédiatement combien de fois chaque caractère apparaît. L'analyseur de fréquence des caractères compte chaque lettre, chiffre ou symbole, les classe, affiche les pourcentages et génère un graphique à barres pour vous permettre de repérer rapidement des motifs. Il s'agit d'un outil de référence pour l'analyse cryptographique, les devoirs de linguistique, les audits de mots de passe, les audits de contenu, et en tout cas quand vous avez besoin d'un compte précis de ce qui se trouve dans un texte.

Contrairement à un compteur de mots, cet outil fonctionne au niveau du caractère. Cela le rend particulièrement utile pour déchiffrer des ciphers de substitution simples, où il faut comparer la distribution des lettres observées à celle attendue dans la langue source. Activez « Comparer avec la base anglaise » et l'outil affichera, pour chaque lettre, la fréquence standard en anglais et la différence par rapport à celle de votre texte.

Comment utiliser

  1. Collez votre texte dans la zone d'entrée, ou cliquez sur « Essayer un exemple » pour charger un exemple.
  2. Choisissez ce que vous souhaitez compter : Lettres uniquement, Lettres et chiffres, Imprimables (sans espaces), ou Tous les caractères.
  3. Basculer Sensible à la casse si A et a doivent être comptés séparément.
  4. Pour le déchiffrement par substitution, laissez Comparer avec la base anglaise allumé pour observer les déviations par rapport à la distribution standard ETAOIN.
  5. Trier une colonne en cliquant sur son en-tête. Utilisez Copier en CSV, Télécharger CSV, ou Copier en JSON pour exporter le tableau.

Caractéristiques

  • Tableau de fréquences – Classement, caractère, compte, pourcentage, et une barre proportionnelle pour chaque caractère unique.
  • Quatre modes de comptage – Lettres uniquement, lettres et chiffres, caractères imprimables (sans espaces), ou tous les points de code, y compris les espaces et les ponctuations.
  • Sensibilité de cas – Traiter A et a comme un même caractère ou les compter séparément.
  • Comparaison avec la base anglaise – Lors du comptage des lettres, voir les pourcentages attendus en anglais et la déviation signée dans la même ligne, colorée en dessus et en dessous.
  • Entropie de Shannon – Voir l'entropie en bits par caractère de votre texte comparée à la valeur théorique maximale pour la taille de son alphabet, utile pour évaluer la force d'un mot de passe ou la randomisation.
  • Colonnes triables – Cliquez sur n'importe quelle en-tête pour trier par classement, caractère, compte, pourcentage ou déviation.
  • Consciente du Unicode – Gère tous les points de code, avec des étiquettes amicales pour les espaces et les caractères de contrôle.
  • Exportation en CSV et JSON – Copier ou télécharger le tableau dans l'un de ces formats, y compris les codes de caractères, pour une analyse ultérieure.
  • Mises à jour en temps réel – Les résultats se mettent à jour automatiquement quand vous tapez ou modifiez les options.
  • Privé par design – Tout se déroule dans votre navigateur. Votre texte n'est jamais envoyé.

ANNONCE · Supprimer ?

FAQ

  1. Qu'est-ce que l'analyse de fréquence des caractères ?

    L'analyse de fréquence des caractères consiste à compter le nombre de fois où chaque caractère apparaît dans un texte et à comparer cette distribution à une base attendue. Elle remonte au mathématicien arabe Al-Kindi du 9e siècle, qui l'a utilisée pour déchiffrer des ciphers de substitution, et elle reste la base de l'analyse cryptographique classique, de la linguistique statistique, et de nombreux algorithmes modernes de compression et de détection de langage.

  2. Quels sont les lettres les plus fréquentes en anglais ?

    Dans un texte standard en anglais, l'ordre est environ E, T, A, O, I, N, S, H, R, D, L, U — souvent mémorisé comme ETAOIN SHRDLU. L'E est bien le plus fréquent, à environ 12,7 %, suivi par le T à 9,1 % et l'A à 8,2 %. Les lettres les moins fréquentes sont J, Q, X et Z, chacune sous 0,2 %. Les fréquences réelles varient légèrement selon le corpus, mais l'ordre global reste remarquablement stable dans les textes modernes en anglais.

  3. Comment déchiffrer un chiffre de Caesar ou de substitution par analyse de fréquence ?

    Pour les ciphers monoalphabétiques, comptez les lettres dans le texte chiffré et classez-les. Associez la lettre la plus fréquente du texte chiffré à E, la suivante à T, et ainsi de suite, puis affinez la correspondance en utilisant des bigrammes (TH, HE, IN), des trigrammes (THE, AND, ING) et des mots courts. Avec assez de texte, la langue sous-jacente apparaît. Les ciphers polialphabétiques comme Vigenère affaiblissent cette attaque en diffusant la distribution sur plusieurs alphabets, mais une structure périodique peut encore être détectée grâce à l'indice de coïncidence et à l'examen de Kasiski.

  4. Qu'est-ce que l'entropie de Shannon et pourquoi est-elle affichée ici ?

    L'entropie de Shannon mesure le contenu moyen d'information d'un symbole d'une source donnée, exprimé en bits par caractère. Un alphabet parfaitement uniforme a une entropie maximale égale à log2(N) pour N symboles. Le texte réel est bien moins aléatoire — le prose anglaise est d'environ 1,0 à 1,5 bits par lettre une fois que le contexte est pris en compte. Comparer l'entropie observée à la valeur maximale permet de savoir à quel point un texte est prédicible, ce qui est utile pour vérifier la randomisation, évaluer la force d'un mot de passe, et détecter du contenu inhabituel.

  5. Pourquoi mon texte dévie-t-il de la base anglaise ?

    Plusieurs raisons : les échantillons courts sont bruyants et dévient naturellement des moyennes de population ; les textes techniques déplacent la distribution des lettres vers les consonnes utilisées dans le jargon ; les mots, noms ou codes non anglophones introduisent des lettres avec des fréquences atypiques ; et des choix stylistiques intentionnels, comme les lipogrammes, peuvent supprimer entièrement certaines lettres. Des déviations importantes sur un texte long et ordinaire peuvent être un indice d'obfuscation, de chiffrement ou d'un langage différent de l'anglais.

Envie d'une expérience sans pub ? Passez à la version sans pub

Installez nos extensions

Ajoutez des outils IO à votre navigateur préféré pour un accès instantané et une recherche plus rapide

Sur Extension Chrome Sur Extension de bord Sur Extension Firefox Sur Extension de l'opéra

Le Tableau de Bord Est Arrivé !

Tableau de Bord est une façon amusante de suivre vos jeux, toutes les données sont stockées dans votre navigateur. D'autres fonctionnalités arrivent bientôt !

ANNONCE · Supprimer ?
ANNONCE · Supprimer ?
ANNONCE · Supprimer ?

Coin des nouvelles avec points forts techniques

Impliquez-vous

Aidez-nous à continuer à fournir des outils gratuits et précieux

Offre-moi un café
ANNONCE · Supprimer ?