Реклама мешает? Идти Без рекламы Сегодня 

Разборщик Sitemap XML и извлечитель URL

ДанныеРазработчик

Реклама · УДАЛИТЬ?

ВХОД

Автоматический процесс

Sitemap XML

Параметры

Формат вывода

Фильтрация по lastmod

Сортировка по

Показывать предупреждения о валидации (отсутствующие поля, недопустимые приоритеты, искажённые даты)

ВЫХОД

Клиентская сторона

Вставьте sitemap выше, чтобы извлечь URL и метаданные.

Извлеченные URL

Реклама · УДАЛИТЬ?

Гид

Разборщик Sitemap XML и извлечитель URL

Вставьте любой sitemap.xml или файл sitemap index и мгновенно извлеките каждый URL вместе с его lastmod, changefreqи priority. Парсер работает полностью в вашем браузере с использованием встроенного DOMParser, поэтому ничего не покидает страницу. Фильтруйте по свежести, сортируйте по любому столбцу, экспортируйте в Markdown, CSV, JSON или простой список URL, и устраняйте недопустимые приоритеты или искажённые даты до того, как они достигнут поисковых систем.

Как использовать

Вставьте содержимое sitemap в поле ввода или загрузите файл .xml файл.
Инструмент определяет, является ли корневым элементом <urlset> или <sitemapindex> и парсит каждую запись.
Выберите формат вывода — таблица Markdown для SEO-документов, CSV для таблиц, JSON для скриптов или простой список URL для быстрого сканирования.
Используйте фильтр lastmod, чтобы найти страницы, обновлённые за последние 7/30/90/365 дней, или чтобы выявить записи, у которых отсутствует lastmod полностью.
Сортируйте по URL, lastmod, приоритету или changefreq, чтобы выявить паттерны или выбросы.
Проверьте обзор валидации, затем нажмите Копировать или Скачать сохранить результат.

Возможности

Автоматическое определение типа sitemap – Обрабатывает как <urlset> sitemap и <sitemapindex> вложенные индексы.
Полная извлечение метаданных – Извлекает loc, lastmod, changefreqи priority для каждой записи.
Несколько форматов вывода – Таблица Markdown, CSV, JSON или простой список URL, все генерируются на лету.
Фильтрация дат – Ограничивает результаты записями, обновлёнными за последние 7, 30, 90 или 365 дней, или изолирует записи без lastmod.
Умная сортировка – Сортирует по URL, lastmod (новейшие или старейшие первыми), приоритету или changefreq.
Встроенная валидация – Выделяет искажённые URL, недопустимые форматы W3C Datetime, неизвестные changefreq значения, приоритеты вне диапазона и записи, превышающие лимит в 50 000 по спецификации sitemaps.org.
Только на стороне клиента – Использует встроенный DOMParser браузера; ваш sitemap никогда не покидает страницу.
Простые примеры – Загрузите образец urlset или sitemapindex чтобы увидеть инструмент в действии.

 Часто задаваемые вопросы

Какова разница между sitemap и sitemap index?

Обычный sitemap (корневой элемент <urlset>) перечисляет отдельные URL страниц, которые вы хотите, чтобы поисковые системы проходили. Sitemap index (корневой элемент <sitemapindex>) не перечисляет страницы напрямую — он перечисляет указатели на другие файлы sitemap. Индексы используются, когда сайт имеет более 50 000 URL или когда sitemaps разделяются по разделам (посты, страницы, товары и т.д.), поскольку спецификация sitemaps.org ограничивает один sitemap до 50 000 URL и 50 МБ несжатых данных.
Какой формат должен использоваться в поле lastmod?

Спецификация sitemaps.org требует использования формата W3C Datetime, который является профилем ISO 8601. Самый короткий допустимый формат — это дата, например lastmod ; вы также можете включить время и смещение часового пояса, например 2025-11-04. Другие форматы, такие как 2025-11-04T15:30:00+00:00 или 2025-11-04T15:30:00Zне соответствуют спецификации и могут быть проигнорированы поисковыми роботами. 11/04/2025 или Nov 4, 2025 Каковы допустимые значения для changefreq и priority?
элемент принимает один из этих буквальных значений:

The changefreq элемент — это десятичное число от 0,0 до 1,0, указывающее на относительную важность внутри вашего сайта; значение по умолчанию, если не указано, — 0,5. Обратите внимание, что Google официально заявил, что в основном игнорирует оба поля при ранжировании, но они остаются частью спецификации и могут быть полезными сигналами для других роботов и для внутренних аудитов SEO. always, hourly, daily, weekly, monthly, yearly, или never. Значение priority Используют ли поисковые системы значения priority и changefreq?
Google подтвердил, что игнорирует оба элемента

для ранжирования и планирования прохода. Bing и другие поисковые системы рассматривают их как подсказки. Однако элемент priority и changefreq широко используется как сигнал свежести контента, при условии, что он точен и не установлен на сегодняшнюю дату для каждого URL. Многие рабочие процессы по SEO-аудиту всё ещё проверяют lastmod внутренне, чтобы убедиться в корректности логики генерации sitemap на сайте, даже если эти значения не влияют напрямую на поведение поиска. priority и changefreq Почему мой XML не проходит парсинг, хотя он выглядит корректно?
Большинство ошибок парсинга возникают из-за нескольких причин: неправильный экранированный амперсанд в URL (должен быть

), байтовый порядок UTF-8 или пробелы перед декларацией &, несоответствующие или незакрытые теги, или декларация кодировки, не совпадающая с реальной кодировкой файла. Парсер, используемый этим инструментом, следует тем же правилам, что и браузеры, поэтому любой XML, который не проходит валидацию здесь, также не пройдёт в строгом парсере. Самый быстрый способ локализовать ошибку — вставить проблемный блок в XML-валидатор и уменьшить файл на половину. <?xml ?> объявление, несоответствующие или незакрытые теги, или объявление кодировки, не совпадающее с фактической кодировкой файла. DOMParser, используемый этим инструментом, следует тем же правилам, что и браузеры, поэтому любое XML, которое не проходит валидацию здесь, также не пройдёт в строгом парсер. Самый быстрый способ локализации ошибки — вставить проблемный блок в валидатор XML и удалять файл на половину за половину.