jue. Jul 31st, 2025

Google dice que podría tener sentido usar el encabezado noindex con llms.txt


John Mueller de Google respondió una pregunta sobre LLMS.TXT relacionada con el contenido duplicado, afirmando que no tiene sentido que se vea como contenido duplicado, pero además declaró que podría tener sentido tomar medidas para evitar la indexación.

Llms.txt

LLMS.TXT es una propuesta para crear un nuevo normalizado de formato de contenido que los modelos de jerigonza ilustre pueden usar para recuperar el contenido principal de una página web sin tener que guerrear con otros datos sin contenido, como publicidad, navegación y cualquier otra cosa que no sea el contenido principal. Ofrece a los editores web la capacidad de proporcionar una traducción seleccionada y formatada del contenido más importante. El archivo LLMS.TXT se encuentra en el nivel raíz de un sitio web (ejemplo.com/llms.txt).

Al contrario de algunas afirmaciones hechas sobre LLMS.txt, no es de ninguna guisa similar a Robots.txt. El propósito de Robots.txt es controlar el comportamiento del autómata, mientras que el propósito de LLMS.txt es proporcionar contenido a modelos de idiomas grandes.

¿Google verá llms.txt como contenido duplicado?

Cierto en Bluesky preguntó si LLMS.txt podría ser conocido por Google como contenido duplicado, lo cual es una buena pregunta. Podría suceder que determinado fuera del sitio web pueda vincular a LLMS.TXT y que Google pueda comenzar a surgir ese contenido en motivo o encima del contenido HTML.

Esta es la pregunta preguntó:

“¿Google verán los archivos LLMS.txt como contenido duplicado? Parece que se cuello rígido hacerlo, legado que saben que no lo es, y para qué es positivamente.

¿Debo ampliar un encabezado “noindex” para LLMS.txt para Googlebot? “

John Mueller de Google respondió:

“Solo sería contenido duplicado si el contenido fuera el mismo que una página HTML, lo que no tendría sentido (suponiendo que el archivo en sí fuera útil).

Dicho esto, usar noindex para él podría tener sentido, ya que los sitios podrían vincularse a él y de otra guisa podría indexarse, lo que sería extraño para los usuarios “.

Noindex para llms.txt

Usar un encabezado noindex para el LLMS.TXT es una buena idea porque evitará que el contenido ingrese al índice de Google. Usar un robots.txt para asediar Google no es necesario porque eso solo impedirá que Google rastree el archivo, lo que evitará que vea el noindex.

Imagen destacada de Shutterstock/Krakenimages.com

Related Post

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *