Tidak suka iklan? Pergi Bebas Iklan Hari ini

Parser Sitemap XML & Ekstrak URL

DataPengembang
IKLAN · HAPUS?
MEMASUKKAN

Pilihan

Tempel sitemap di atas untuk mengekstrak URL dan metadata.

IKLAN · HAPUS?

Memandu

Parsing Sitemap XML & Ekstraksi URL

Parser Sitemap XML & Ekstrak URL

Tempelkan apa pun sitemap.xml atau file sitemap index dan segera ambil setiap URL bersama dengan lastmod, changefreqdan priority. Pemarsing berjalan sepenuhnya di browser Anda menggunakan DOMParser bawaan, sehingga tidak ada data yang meninggalkan halaman. Filter berdasarkan kebaruan, urutkan berdasarkan kolom apa saja, ekspor ke Markdown, CSV, JSON, atau daftar URL sederhana, dan tangkap prioritas tidak valid atau tanggal tidak benar sebelum mencapai mesin pencari.

Cara Penggunaan

  1. Tempel isi sitemap ke kotak masukan, atau unggah sebuah .xml file.
  2. Alat ini mendeteksi apakah elemen akar adalah <urlset> atau <sitemapindex> dan memarsing setiap entri.
  3. Pilih format keluaran — tabel Markdown untuk dokumen SEO, CSV untuk spreadsheet, JSON untuk skrip, atau daftar URL sederhana untuk pengecekan cepat.
  4. Gunakan filter lastmod untuk menemukan halaman yang diperbarui dalam 7/30/90/365 hari terakhir, atau untuk menampilkan entri yang tidak memiliki lastmod seluruhnya.
  5. Urutkan berdasarkan URL, lastmod, priority, atau changefreq untuk mengidentifikasi pola atau outlier.
  6. Periksa ringkasan validasi, lalu klik Menyalin atau Unduh untuk menyimpan hasilnya.

Fitur

  • Deteksi otomatis jenis sitemap – Menangani kedua <urlset> sitemap dan <sitemapindex> indeks yang terkandung.
  • Ekstraksi metadata lengkap – Mengambil loc, lastmod, changefreqdan priority untuk setiap entri.
  • Beberapa Format Keluaran – Tabel Markdown, CSV, JSON, atau daftar URL sederhana, semua dihasilkan secara langsung.
  • Pengaturan tanggal – Batasi hasil hanya untuk entri yang diperbarui dalam 7, 30, 90, atau 365 hari terakhir, atau isolasi entri yang tidak memiliki lastmod.
  • Pengurutan cerdas – Urutkan berdasarkan URL, lastmod (terbaru atau paling tua terlebih dahulu), priority, atau changefreq.
  • Validasi bawaan – Menandai URL yang tidak valid, format waktu W3C yang tidak benar, nilai tidak dikenal, prioritas di luar rentang, dan entri yang melebihi batas 50.000 sesuai spesifikasi sitemaps.org. changefreq – Menggunakan DOMParser bawaan browser; sitemap Anda tidak pernah meninggalkan halaman.
  • Hanya sisi klien – Muat contoh
  • Contoh satu klik untuk melihat alat ini berfungsi. urlset atau sitemapindex Apa perbedaan antara sitemap dan sitemap index?

Tanya Jawab Umum

  1. Sebuah sitemap biasa (elemen akar

    ) mencantumkan URL halaman individu yang ingin diakses oleh mesin pencari. Sitemap index (elemen akar <urlset>) tidak mencantumkan halaman secara langsung — ia mencantumkan pointer ke file sitemap lainnya. Indeks digunakan ketika situs memiliki lebih dari 50.000 URL atau ketika sitemap dibagi berdasarkan bagian (postingan, halaman, produk, dll), karena spesifikasi sitemaps.org membatasi satu sitemap hanya sampai 50.000 URL dan 50 MB yang tidak dikompresi. <sitemapindex>Apa format yang diminta oleh field lastmod?

  2. Protokol sitemaps.org memerlukan

    untuk menggunakan format W3C Datetime, yang merupakan profil dari ISO 8601. Bentuk terpendek yang valid adalah tanggal seperti lastmod ; Anda juga dapat mencantumkan waktu dan perbedaan waktu zona, misalnya 2025-11-04. Format lain seperti 2025-11-04T15:30:00+00:00 atau 2025-11-04T15:30:00Ztidak sesuai dan mungkin diabaikan oleh pencari. 11/04/2025 atau Nov 4, 2025 Apa nilai yang valid untuk changefreq dan priority?

  3. Elemen

    Itu changefreq menerima salah satu nilai literal berikut: always, hourly, daily, weekly, monthly, yearly, atau never. Nilai priority Elemen

  4. adalah desimal antara 0.0 dan 1.0 yang menunjukkan pentingnya relatif dalam situs Anda; nilai default jika tidak disebutkan adalah 0.5. Perlu dicatat bahwa Google telah secara publik menyatakan bahwa ia sebagian besar mengabaikan kedua elemen ini saat menentukan peringkat, tetapi keduanya tetap bagian dari spesifikasi dan dapat menjadi sinyal yang berguna bagi pencari lain dan audit SEO internal.

    Apakah mesin pencari benar-benar menggunakan nilai priority dan changefreq? priority dan changefreq Google telah mengonfirmasi bahwa ia mengabaikan kedua lastmod untuk peringkat dan penjadwalan pencarian. Bing dan mesin pencari lainnya hanya menganggapnya sebagai petunjuk terbaik. Elemen priority dan changefreq sangat digunakan sebagai sinyal kefreshness konten, selama nilai tersebut akurat dan tidak diatur ke tanggal hari ini untuk setiap URL. Banyak alur audit SEO masih memeriksa

  5. secara internal untuk memverifikasi logika generasi sitemap situs Anda, bahkan ketika nilai-nilai tersebut tidak secara langsung memengaruhi perilaku pencarian.

    Mengapa XML saya gagal diparsing meskipun tampak benar? &amp;Kebanyakan kesalahan parsing berasal dari beberapa sumber: ampersand yang tidak diescaped dalam URL (harus menjadi <?xml ?> ), tanda byte order UTF-8 atau spasi sebelum

Ingin bebas iklan? Bebas Iklan Hari Ini

Instal Ekstensi Kami

Tambahkan alat IO ke browser favorit Anda untuk akses instan dan pencarian lebih cepat

Ke Ekstensi Chrome Ke Ekstensi Tepi Ke Ekstensi Firefox Ke Ekstensi Opera

Papan Skor Telah Tiba!

Papan Skor adalah cara yang menyenangkan untuk melacak permainan Anda, semua data disimpan di browser Anda. Lebih banyak fitur akan segera hadir!

IKLAN · HAPUS?
IKLAN · HAPUS?
IKLAN · HAPUS?

Pojok Berita dengan Sorotan Teknologi

Terlibat

Bantu kami untuk terus menyediakan alat gratis yang berharga

Belikan aku kopi
IKLAN · HAPUS?