Seguro ya te has encontrado a estas alturas con una página no encontrada, la cual se te ha notificado como Error 404 página no encontrada.
Bueno, si como usuario, esto de sacaba algunos pelos de la cabeza, como dueño de un sitio web, puede dejarte calvo.
Pero vamos a ir un poco más sobre el error 404 y un tipo de éste al que se le llama soft.
¿Primera vez que lees sobre esto del error soft 404?
A ver, profundicemos.
Generalmente, cualquier código entre 400 y 499 indica que la página no se ha cargado. El código de respuesta 404 es el único que lleva un significado específico – que la página ha desaparecido y probablemente no volverá pronto.
¿Qué es un error suave 404?
Un error suave 404 no es un código de respuesta oficial enviado a un navegador web. Es sólo una etiqueta que Google agrega a una página dentro de su índice.
A medida que Google rastrea las páginas, asigna recursos cuidadosamente asegurando que no se pierda tiempo al rastrear las páginas que faltan y que no necesitan ser indexadas.
Sin embargo, hay algunos servidores que están mal configurados y su página faltante carga un código 200 cuando debe mostrar un código de 404.
Si el encabezado HTTP invisible muestra un código 200 incluso si la página web indica claramente que la página no se encuentra, la página puede estar indexada, lo que representa un desperdicio de recursos para Google.
Para combatir este problema, Google observa las características de las páginas 404 e intenta discernir si la página 404 realmente es una página 404. En otras palabras…
Google aprendió que si se parece a un 404, huele a un 404, y actúa como un 404, entonces es probablemente una página 404 genuina.
Cómo funcionan los errores suaves 404
También hay casos en los que la página no está realmente ausente, pero ciertas características ha activado Google para clasificarlo como una página que no se encuentra.
Algunas de estas características incluyen una pequeña cantidad o falta de contenido en la página y tener demasiadas páginas similares en el sitio.
Estas características también son similares a los factores que aborda el algoritmo Panda. La actualización de Panda considera contenido corto y duplicado como factores de clasificación negativos.
Por lo tanto, la solución a estos problemas ayudará a evitar los errores suaves 404 y los que Panda vigila.
Los errores 404 tienen dos causas principales:
- Un error en el vínculo, que dirige a los usuarios a una página que no existe.
- Un enlace a una página que solía existir y de repente desapareció.
Error de vinculación
Si la causa del error 404 es de un enlace, sólo tienes que arreglar los enlaces.
La parte difícil de esta tarea es encontrar todos los enlaces rotos en un sitio.
Puede ser más difícil para sitios grandes y complejos que tienen miles o millones de páginas. En casos como éste, las herramientas de rastreo son muy útiles. Puedes probar con software como Xenu, DeepCrawl, Screaming Frog o Botify.
Una página que ya no existe
Cuando una página ya no existe, tienes dos opciones:
- Restaura la página si se extrajo accidentalmente.
- Hacer una redirección 301 a la página relacionada más cercana si se eliminó intencionalmente.
En primer lugar, tienes que localizar todos los errores de enlaces rotos en el sitio. Puede utilizar herramientas de rastreo. Sin embargo, las herramientas de rastreo no pueden encontrar páginas huérfanas, que son páginas que no están enlazadas desde ninguna parte de los vínculos de navegación ni de ninguna de las páginas.
Las páginas huérfanas pueden existir si solían formar parte del sitio web, y luego, después de un rediseño del sitio web, el vínculo a esta página antigua desapareció, pero los enlaces externos de otros sitios web podrían estar vinculados a ellos. Para comprobar si existen estos tipos de páginas en tu sitio, puedes utilizar una variedad de herramientas.
1. Consola de búsqueda de Google
La consola de búsqueda informará de las páginas 404 mientras el rastreador de Google pasa por todas las páginas que pueden encontrar. Esto puede incluir enlaces de otros sitios que van a una página que solía existir en tu sitio web.
2. Google Analytics
De forma predeterminada, no encontrarás un informe de página que falte en Google Analytics. Sin embargo, puedes rastrearlos de varias maneras.
Por ejemplo, puedes crear un informe personalizado y segmentar las páginas que tienen un título de página que menciona Error 404 – Página no encontrada .
Otra forma de encontrar páginas huérfanas en Google Analytics es crear agrupaciones de contenido personalizadas y asignar las páginas 404 a un grupo de contenido.
3. Comando de búsqueda del operador Site:
Al buscar en Google “site: example.com” se enumerarán todas las páginas indexadas por Google. A continuación, puedes comprobar individualmente si las páginas se están cargando o si están dando errores 404.
Cómo solucionar errores Soft 404
Las herramientas de rastreo no detectan un error 404 suave porque no es realmente un error 404. Pero puede utilizar herramientas de rastreo para detectar otra cosa. Aquí hay algunas cosas que se puede encontrar:
- Contenido pobre: Algunas herramientas de rastreo no solo reportan páginas que tienen contenido pobre, sino que también muestran un recuento total de palabras. Desde allí, puedes ordenar las URL según el número de palabras de tu contenido. Comienza con las páginas que tienen la menor cantidad de palabras y evalúa si la página tiene contenido pobre.
- Contenido duplicado: Algunas herramientas de rastreo son lo suficientemente sofisticadas como para determinar qué porcentaje de la página es contenido de la plantilla. Si el contenido principal es casi el mismo que muchas otras páginas, deben buscar en estas páginas y determinar por qué existe contenido duplicado en tu sitio.
Aparte de las herramientas de rastreo, también puedes utilizar Google Search Console y comprobar en errores de rastreo para encontrar páginas que se enumeran bajo soft 404.
Rastrear un sitio entero para encontrar problemas que causan 404 suaves te permite localizar y corregir problemas antes de que Google los detecte.
Después de detectar estos problemas 404 suaves, necesitarás corregirlos.
La mayoría de las veces, las soluciones parecen ser de sentido común. Esto puede incluir cosas simples como incrementar la calidad de las páginas con contenido pobre o reemplazar contenido duplicado con otro contenido nuevo y único.
A lo largo de este proceso, aquí hay algunas cosas a considerar:
- Consolidar Páginas: A veces, el contenido pobre se debe a que es demasiado específico con el tema de la página, lo que puede dejarlo con poco que decir.
La fusión de varias páginas pobres en una página puede ser más apropiada si los temas están relacionados. Esto no solo soluciona problemas de contenido pobre, sino que también puede solucionar problemas de contenido duplicado.
Por ejemplo, un sitio de comercio electrónico que vende zapatos que vienen en diferentes colores y tamaños puede tener una URL diferente para cada tamaño y combinación de colores. Esto deja un gran número de páginas con contenido que es pobre y relativamente idéntico. El enfoque más eficaz es poner todo esto en una página en su lugar y enumerar las opciones disponibles.
- Buscar problemas técnicos que causan contenido duplicado: Utilizando incluso la herramienta de rastreo web más simple, como Xenu (que no mira el contenido, sino sólo las URL, los códigos de respuesta y las etiquetas de título), puede encontrar problemas de contenido duplicado mirando las URL.
Esto incluye cosas como URLs www y no www, http y https, con index.html y sin ello, con parámetros de seguimiento y sin ellos, etc.
Google trata 404 errores y Soft 404 errores de la misma manera
Un error 404 suave no es error real 404, pero Google deindexa esas páginas si no se arreglan rápidamente. Lo mejor es rastrear tu sitio regularmente para ver si ocurren errores 404 o del tipo suaves.
¿Ya sabes cuántos errores 404 suaves tiene tu sitio web?