Parser de Sitemap XML y Extracción de URLs
Guía
Parser de Sitemap XML y Extracción de URLs
Pegar cualquier sitemap.xml o archivo de índice de mapa de sitio y extrae inmediatamente todas las URLs junto con sus lastmod, changefreqy priority. El analizador se ejecuta completamente en tu navegador usando el analizador DOM nativo, así que nada abandona la página. Filtra por recencia, ordena por cualquier columna, exporta a Markdown, CSV, JSON o una lista de URLs simples, y captura prioridades inválidas o fechas mal formadas antes de que lleguen a los motores de búsqueda.
Cómo Usar
- Pega el contenido de un mapa de sitio en el cuadro de entrada o sube un
.xmlarchivo. - La herramienta detecta si el elemento raíz es
<urlset>o<sitemapindex>y analiza cada entrada. - Elige un formato de salida — tabla en Markdown para documentos de SEO, CSV para hojas de cálculo, JSON para scripts, o una lista de URLs simples para el crawling rápido.
- Usa el filtro de lastmod para encontrar páginas actualizadas en los últimos 7/30/90/365 días, o para mostrar entradas que faltan un
lastmodenteramente. - Ordena por URL, lastmod, prioridad o frecuencia de cambio para detectar patrones o outliers.
- Revisa el resumen de validación, luego haz clic en Copiar o Descargar para guardar el resultado.
Características
- Detecta automáticamente el tipo de mapa de sitio – Maneja tanto
<urlset>mapas de sitio como<sitemapindex>índices anidados. - Extracción completa de metadatos – Extrae
loc,lastmod,changefreqyprioritypara cada entrada. - Múltiples formatos de salida – Tabla en Markdown, CSV, JSON o lista de URLs simples, todas generadas en tiempo real.
- Filtrado de fechas – Limita los resultados a entradas actualizadas en los últimos 7, 30, 90 o 365 días, o aisladas entradas que faltan
lastmod. - Inteligente ordenación – Ordena por URL, lastmod (nuevo o antiguo primero), prioridad o frecuencia de cambio.
- Validación integrada – Marca URLs mal formadas, formatos de fecha W3C no válidos, valores desconocidos, prioridades fuera de rango y entradas que exceden el límite de 50.000 según el especificación de sitemaps.org.
changefreq– Utiliza el analizador DOM nativo del navegador; tu mapa de sitio nunca abandona la página. - Solo del lado del cliente – Carga un ejemplo
- Ejemplos en un solo clic para ver la herramienta en acción.
urlsetositemapindex¿Cuál es la diferencia entre un mapa de sitio y un índice de mapas de sitio?
Preguntas frecuentes
-
Un mapa de sitio regular (elemento raíz
) lista URLs individuales de páginas que deseas que los motores de búsqueda recorran. Un índice de mapas de sitio (elemento raíz
<urlset>) no lista páginas directamente — lista enlaces a otros archivos de mapas de sitio. Los índices se usan cuando un sitio tiene más de 50.000 URLs o cuando los mapas de sitio se dividen por sección (artículos, páginas, productos, etc.), ya que la especificación de sitemaps.org limita un solo mapa de sitio a 50.000 URLs y 50 MB descomprimidos.<sitemapindex>¿Qué formato requiere el campo lastmod? -
El protocolo de sitemaps.org requiere
para usar el formato de fecha W3C, que es un perfil de ISO 8601. La forma más corta válida es una fecha como
lastmod; también puedes incluir una hora y un desplazamiento horario, por ejemplo2025-11-04. Otros formatos como2025-11-04T15:30:00+00:00o2025-11-04T15:30:00Zno son compatibles y pueden ser ignorados por los crawlers.11/04/2025oNov 4, 2025¿Cuáles son los valores válidos para changefreq y priority? -
El elemento acepta uno de estos valores literales:
El
changefreqEl elemento es un decimal entre 0.0 y 1.0 que indica la importancia relativa dentro de tu propio sitio; el valor predeterminado si no se especifica es 0.5. Nota que Google ha declarado públicamente que ignora ambos campos al clasificar y programar el recorrido, pero siguen siendo parte del especificación y pueden ser señales útiles para otros crawlers y para auditorías internas de SEO.always,hourly,daily,weekly,monthly,yearly, onever. Elpriority¿Usan realmente los motores de búsqueda los valores de prioridad y changefreq? -
Google ha confirmado que ignora ambos
para clasificación y programación de recorrido. Bing y otros motores de búsqueda los tratan como sugerencias a lo sumo. El elemento
priorityychangefreqsin embargo, se utiliza ampliamente como señal de frescura del contenido, siempre que sea preciso y no se establezca en la fecha de hoy para cada URL. Muchos flujos de auditoría de SEO aún inspeccionanlastmodinternamente para verificar la lógica de generación de mapas de sitio de un sitio, incluso cuando esos valores no influyen directamente en el comportamiento de búsqueda.priorityychangefreq¿Por qué mi XML falla en parsear aunque parezca correcto? -
La mayoría de los errores de parseo provienen de fuentes como un ampersand no escapado en una URL (debe ser
), una marca de orden UTF-8 o espacios en blanco antes de la
&declaración, etiquetas mal coincidentes o no cerradas, o una declaración de codificación que no coincida con la codificación real del archivo. El DOMParser utilizado por esta herramienta sigue las mismas reglas que los navegadores, por lo que cualquier XML que falle aquí también fallará en un crawler estricto. Pegar el bloque problemático en un validador de XML y eliminar el archivo en mitades es la forma más rápida de localizar el error.<?xml ?>Pega tu sitemap.xml o sitemap index XML aquí, o sube un archivo abajo...
Instalar extensiones
Agregue herramientas IO a su navegador favorito para obtener acceso instantáneo y búsquedas más rápidas
恵 ¡El marcador ha llegado!
Marcador es una forma divertida de llevar un registro de tus juegos, todos los datos se almacenan en tu navegador. ¡Próximamente habrá más funciones!
Herramientas clave
Ver todo Los recién llegados
Ver todoActualizar: Nuestro última herramienta fue agregado el 19 de junio de 2026
