A medida que se expanda la disponibilidad de ChatGPT Search, comprender su mecanismo de indexación será important para la visibilidad digital.
Si bien el índice de Bing juega un papel clave, el sistema de OpenAI muestra contenido utilizando sus propios rastreadores y métodos de atribución.
A continuación se muestra un desglose de los requisitos técnicos para garantizar que su sitio internet esté indexado correctamente.
Marco técnico
Búsqueda de ChatGPT combina el índice de búsqueda de Bing con la tecnología patentada de OpenAI.
Según el técnico de OpenAI documentaciónla plataforma utiliza una versión mejorada de GPT-4o, mejorada con técnicas de generación de datos sintéticos e integración con su sistema de vista previa o1.
La plataforma emplea tres rastreadores distintos, cada uno de los cuales tiene diferentes propósitos.
El OAI-SearchBot sirve como rastreador principal para la funcionalidad de búsqueda, mientras que Usuario de ChatGPT maneja las solicitudes de los usuarios en tiempo actual y permite la interacción directa con aplicaciones externas.
El tercer rastreador, GPTBotgestiona el entrenamiento del modelo de IA y se puede bloquear sin afectar la visibilidad de la búsqueda.
Implementación
La indexación adecuada comienza con la configuración del archivo robots.txt.
El archivo robots.txt de su sitio internet debe permitir específicamente OAI-SearchBot manteniendo permisos separados para diferentes rastreadores OpenAI.
Además de esta configuración básica, los sitios internet deben garantizar una indexación adecuada por parte de Bing y mantener una arquitectura de sitio clara.
Vale la pena señalar que permitir OAI-SearchBot no significa automáticamente que el contenido se utilizará para el entrenamiento de IA.
Los sistemas de OpenAI pueden tardar aproximadamente 24 horas en adaptarse a las nuevas directivas de rastreo después de la actualización del archivo robots.txt de un sitio.
Atribución de contenido
ChatGPT Search incluye varias funciones clave para los editores de contenido:
- Atribución de fuente: Todo el contenido al que se hace referencia incluye la cita adecuada.
- Barra lateral de origen: Proporciona enlaces de referencia para verificación.
- Múltiples oportunidades de citas: Una sola consulta puede generar múltiples citas de fuentes
- Ubicaciones: Las búsquedas de ubicaciones específicas devolverán un mapa interactivo, como se muestra a continuación.
Consideraciones adicionales
Reciente pruebas ha revelado varios factores importantes:
- La frescura del contenido afecta la visibilidad
- Las páginas detrás de los muros de pago aún se pueden citar
- Las URL que devuelven errores 404 aún pueden aparecer en las citas
- Se puede hacer referencia a varias páginas del mismo dominio en una sola respuesta.
Recomendaciones
La indexación en ChatGPT requiere atención constante al estado técnico, incluida la verificación periódica del archivo robots.txt y el acceso del rastreador.
Los editores deben priorizar el mantenimiento de la precisión fáctica y la información actualizada al tiempo que implementan una estructura de contenido clara.
Esto garantiza que las páginas sigan siendo accesibles en los motores de búsqueda tradicionales y las plataformas impulsadas por IA, lo que ayuda a los sitios internet a lograr una visibilidad más amplia.
Imagen destacada: diseñokida/Shutterstock