Un search engine optimisation publicó detalles sobre una auditoría del sitio en la que criticó el uso de un rel = canónico para controlar qué páginas están indexadas en un sitio. El search engine optimisation propuso usar noindex para obtener las páginas del índice de Google y luego agregar las URL individuales a robots.txt. John Mueller de Google sugirió una solución que va en una dirección diferente.
La auditoría del sitio revela un agregado indexado a las URL de carrito
Una auditoría de search engine optimisation descubrió que más de la mitad de las 1.43k páginas indexadas del cliente estaban paginadas y las URL de “agregar al carrito de compras” (del tipo con signos de interrogación al closing de ellas). Google ignoró los atributos Rel = Canonical Hyperlink e indexó las páginas, lo que ilustra el punto de que Rel = Canonical es solo una pista y no una directiva. Paginado en este caso solo significa las URL generadas dinámicamente relacionadas con cuando un visitante del sitio ordena una página por marca o tamaño o lo que sea (esto generalmente se conoce como navegación facetada).
Las URL de sumar a los carritos de compras se veían así:
instance.com/product/page-5/?add-to-cart=instance
El cliente había implementado un atributo Rel = Canonical Hyperlink para decirle a Google que otra URL period la URL correcta para indexar.
La solución del search engine optimisation:
“La forma en que planeo arreglar esto es para no indexar todas estas páginas y una vez que se hace, bloquearlas en los robots.txt”
Las decisiones de search engine optimisation dependen de los detalles
Uno de los chistes de papá search engine optimisation más cansados y aburridos es “Depende”. Pero decir “depende” no es broma cuando es seguido de lo que depende algo y ese es el detalle essential que John Mueller agregó a una discusión de LinkedIn que ya tenía 83 respuestas.
La discusión authentic, de un search engine optimisation que acababa de terminar una auditoría, aborda los desafíos técnicos asociados con el management de lo que Google se arrastra e indexa y por qué REL = Canonical no es una solución poco confiable porque es una sugerencia y no una directiva.
Una directiva es un comando que Google está obligado a seguir, como una regla meta noindex. Un atributo Rel = Canonical Hyperlink no es una directiva, se trata como una pista para que Google use para decidir qué indexar.
El problema que la publicación authentic describió fue sobre la gestión de un gran número de publicaciones generadas dinámicamente que se estaban deslizando en el índice de Google.
John Mueller al tratar con URL indexadas no deseadas
La opinión de Mueller sobre el problema period sugerir la importancia de revisar las URL para los patrones que pueden dar una pista de por qué las URL no deseadas se están indexando y luego aplicar una solución más granular (específica).
Él aconsejó:
“Parece que ya tienes muchos comentarios aquí, por lo que mis 2 centavos son más como espectador al azar …
– Revisaría las URL en busca de patrones y analizaría los detalles, en lugar de tratar esto como una lista aleatoria de URL que desea canónica. Estos no son aleatorios, el uso de una solución genérica no será óptima para ningún sitio, idealmente haría algo específico para esta situación specific. AKA “Depende”.
– En specific, parece tener muchas URL de ‘agregar a carro’, puede bloquearlas con el patrón de URL a través de robots.txt. No necesita canonicalizarlos, idealmente no deberían arrastrarse durante un rastreo regular (también arruina sus métricas).
– Hay cierta cantidad de paginación, filtrándose en los parámetros de URL también: consulte nuestra documentación sobre las opciones para eso.
-Para obtener más hoyos técnicos de conejos, consulte https://search-off-the-record.libsyn.com/handling-dupes-same-same- or-diferent “
¿Por qué Google indexó las URL con parámetros de consulta?
Un tema planteado por varias personas en la discusión de LinkedIn es el problema de las URL de los carros de compras de indexación de Google (agregar a las URL de carreras de compras). No se proporcionaron respuestas, pero puede ser algo specific para la plataforma del carrito de compras y la resolución que puede limitarse a las soluciones descritas anteriormente.