Tidak suka iklan? Pergi Bebas Iklan Hari ini 

Analisis Frekuensi Karakter

DataKeamananTeks

IKLAN · HAPUS?

MEMASUKKAN

Proses Otomatis

KELUARAN

Sisi klien

IKLAN · HAPUS?

Memandu

Analisis Frekuensi Karakter

Tempel teks apa saja dan segera lihat seberapa sering setiap karakter muncul. Analisis Frekuensi Karakter menghitung setiap huruf, angka, atau simbol, mengurutkannya, menampilkan persentase, dan membuat grafik batang visual sehingga Anda dapat melihat pola secara langsung. Ini adalah teman utama untuk analisis kriptografi, tugas bahasa, audit kata sandi, audit konten, dan setiap waktu Anda membutuhkan jumlah tepat dari apa yang ada dalam teks.

Berbeda dengan penghitung kata, alat ini bekerja pada tingkat karakter. Hal ini membuatnya sangat berguna untuk memecahkan kode substitusi sederhana, di mana triknya adalah membandingkan distribusi huruf yang diamati dengan distribusi yang diharapkan dari bahasa sumber. Aktifkan 'Bandingkan dengan dasar bahasa Inggris' dan alat ini akan menampilkan, untuk setiap huruf, frekuensi standar bahasa Inggris dan seberapa jauh teks Anda berbeda dari itu.

Cara Penggunaan

Tempel teks Anda ke kotak masukan, atau klik 'Coba contoh' untuk memuat contoh.
Pilih apa yang ingin dihitung: Hanya huruf, Huruf dan angka, Cetak (tidak ada spasi), atau Semua karakter.
Beralih Case Sensitive jika A dan a harus dihitung secara terpisah.
Untuk pekerjaan kode substitusi, biarkan Bandingkan dengan dasar bahasa Inggris menyala untuk melihat penyimpangan dari distribusi standar ETAOIN.
Urutkan kolom apa saja dengan mengklik header-nya. Gunakan Salin CSV, Unduh CSV, atau Salin JSON untuk mengunduh tabel.

Fitur

Tabel frekuensi – Peringkat, karakter, jumlah, persentase, dan batang proporsional untuk setiap karakter unik.
Empat mode penghitungan – Hanya huruf, huruf dan angka, karakter cetak (tidak ada spasi), atau semua kode titik termasuk spasi dan tanda baca.
Pengaturan sensitivitas huruf – Pertimbangkan A dan a sebagai karakter yang sama atau hitung secara terpisah.
Pembandingan dasar bahasa Inggris – Saat menghitung huruf, lihat persentase bahasa Inggris yang diharapkan dan penyimpangan tanda di baris yang sama, dengan warna yang berbeda di atas dan di bawah.
Entropi Shannon – Lihat entropi per karakter dari teks Anda bersama dengan nilai maksimum teoritis untuk ukuran alfabet, berguna untuk pengecekan kekuatan kata sandi dan keacakan.
Kolom yang dapat diurutkan – Klik header apa saja untuk diurutkan berdasarkan peringkat, karakter, jumlah, persentase, atau penyimpangan.
Sensitif terhadap Unicode – Menangani setiap kode titik, dengan label yang ramah pengguna untuk spasi dan karakter kendali.
Ekspor ke CSV dan JSON – Salin atau unduh tabel dalam format apa saja, termasuk kode karakter, untuk analisis lebih lanjut.
Pembaruan langsung – Hasil secara otomatis diperbarui saat Anda mengetik atau mengubah opsi.
Privat secara dirancang – Semua fitur berjalan di browser Anda. Teks Anda tidak pernah diunggah.

IKLAN · HAPUS?

 Tanya Jawab Umum

Apa itu analisis frekuensi karakter?

Analisis frekuensi karakter adalah praktik menghitung seberapa sering setiap karakter muncul dalam teks dan membandingkannya dengan dasar yang diharapkan. Ini sudah ada sejak abad ke-9 oleh matematikawan Arab Al-Kindi yang menggunakan metode ini untuk memecahkan kode substitusi, dan tetap menjadi dasar dari kriptografi klasik, linguistik statistik, dan banyak algoritma kompresi dan deteksi bahasa modern.
Apa yang paling umum dalam bahasa Inggris?

Dalam teks standar bahasa Inggris urutan hampir E, T, A, O, I, N, S, H, R, D, L, U — sering dihafal sebagai ETAOIN SHRDLU. E jauh lebih umum dengan sekitar 12,7 persen, diikuti oleh T pada 9,1 persen dan A pada 8,2 persen. Huruf yang paling jarang adalah J, Q, X, dan Z, masing-masing di bawah 0,2 persen. Frekuensi dunia nyata sedikit berbeda tergantung pada korpus, tetapi peringkat secara umum sangat stabil di berbagai teks bahasa Inggris modern.
Bagaimana cara memecahkan kode Caesar atau kode substitusi dengan analisis frekuensi?

Untuk kode monoalfabetik, hitung huruf-huruf dalam teks terenkripsi dan urutkan. Peta huruf terbanyak dalam teks terenkripsi ke E, huruf berikutnya ke T, dan seterusnya, lalu perbaiki peta tersebut dengan menggunakan digram (TH, HE, IN), trigram (THE, AND, ING), dan kata pendek. Dengan cukup banyak teks, bahasa bawahnya akan muncul. Kode polialfabetik seperti Vigenère mengurangi serangan ini dengan menyebar distribusi ke berbagai alfabet, tetapi struktur periodik masih dapat dideteksi dengan indeks kecocokan dan eksaminasi Kasiski.
Apa itu entropi Shannon dan mengapa ditampilkan di sini?

Entropi Shannon mengukur konten rata-rata dari simbol dari sumber tertentu, dinyatakan dalam bit per karakter. Aljabar sempurna memiliki entropi maksimum sama dengan log2(N) untuk N simbol. Teks nyata jauh lebih tidak acak — prosa bahasa Inggris sekitar 1,0 hingga 1,5 bit per huruf setelah mempertimbangkan konteks. Membandingkan entropi yang diamati dengan maksimum menunjukkan seberapa dapat ditebak suatu string, yang berguna untuk memeriksa keacakan, mengevaluasi kekuatan kata sandi, dan mendeteksi konten tidak biasa.
Mengapa teks saya berbeda dari dasar bahasa Inggris?

Beberapa alasan: sampel pendek memiliki gangguan dan secara alami menyimpang dari rata-rata populasi; tulisan teknis menyimpang distribusi huruf ke konsonan yang digunakan dalam jargon; kata, nama, atau kode dalam bahasa yang bukan Inggris memperkenalkan huruf dengan frekuensi tidak biasa; dan pilihan gaya yang disengaja seperti lipogram dapat menghilangkan huruf secara total. Penyimpangan besar pada teks panjang dan biasa dapat menjadi jejak dari obfusikasi, enkripsi, atau bahasa selain bahasa Inggris.