Recientemente lanzamos nuestro nuevo detector de IA. Para casi cualquier página web, puede analizar la probabilidad de que la IA se usara para crearla, resaltar secciones de texto generadas por IA e incluso identificar los modelos de IA específicos utilizados para crear el texto.
Hay toneladas de detectores de IA disponibles. Y, mientras que el nuestro es el único que puede además Mostrarle los vínculos de retroceso de cualquier página web y el tráfico de búsqueda estimado, cómo el contenido de la página ha cambiado con el tiempo y cómo funciona en relación con otras páginas …
… Todavía queríamos aprender cómo se compara el detector de IA de Ahrefs con otros detectores populares. Entonces lo probamos.
Tomé una muestra de nueve artículos, que consta de tres escrito por humanos artículos, tres completamente Generado por IA artículos y tres híbrido Artículos que contienen una mezcla de 50% de contenido escrito humano y 50% generado por IA.
Analicé cada artículo con detectores de IA gratuitos de AHREFS (que somos nosotros), Scribbr, Grammarly, Zerogpt, CopyLeaks, Writer, Gptzero y Originality.ai. En algunos casos, era necesario truncar la muestra de texto probada.
Normalicé los resultados (por ejemplo, traduciendo una puntuación “24% humana” al equivalente “76% ai”) y los calificé usando la posterior rótulo:
- 2 puntos Si la puntuación del detector está internamente de ± 10 puntos porcentuales de lo vivo.
- 1 punto Si está internamente de ± 20 puntos.
- 0 puntos de lo contrario.
Es importante destacar que esta no es una prueba científica. Este es un tamaño de muestra muy pequeño, mi rótulo de puntuación es arbitraria, y todos estos son artículos que he escrito, generado o editado. Esto era necesario para afirmar que supiera la composición de cada artículo, pero significa que estas muestras están sesgadas cerca de un estilo particular de escritura (mía).
En cambio, piense en esto como una comprobación de pulso rápido del estado de los detectores de contenido de IA. Muchos de los principales detectores de IA funcionaban muy acertadamente.
Según mis pruebas, el detector de IA de AHREFS y los copyleks fueron los detectores de IA de mejor rendimiento, con GPTZero y Originalidad.Ai cerca. En el otro extremo de la escalera, Grammarly y Writer hicieron lo peor en mis pruebas.
Curiosamente, los falsos positivos no fueron un gran problema. Solo 2/24 pruebas se ejecutan en contenido escrito por humanos marcaron incorrectamente la muestra de texto como generada por AI. Todos los detectores de IA lucharon más con el contenido híbrido humano/IA (por razones explicadas a continuación).
En la tabla a continuación, puede ver el contenido de IA vivo de cada artículo de prueba, seguido del examen de cada aparejo:
Ai% vivo | Ahrefs | Copileaks | Gptzero | Originalidad.Ai | Scribbr | Zerogpt | Gramática | Escritor |
---|---|---|---|---|---|---|---|---|
100% | 100% | 100% | 92% | 100% | 94% | 99.62% | 59% | 24% |
100% | 100% | 100% | 100% | 100% | 100% | 98.99% | 57% | 23% |
100% | 86% | 83.8% | 52% | 64% | 0% | 67.76% | 7% | 15% |
0% | 2% | 0% | 0% | 0% | 0% | 0% | 0% | 2% |
0% | 6% | 0% | 0% | 0% | 0% | 2.76% | 0% | 2% |
0% | 0% | 0% | 4% | 0% | 0% | 91.69% | 0% | 27% |
50% | 13% | 46.4% | 42% | 46% | 0% | 39.06% | 0% | 0% |
50% | 32% | 0% | 28% | 4% | 0% | 29.4% | 0% | 5% |
50% | 70% | 100% | 86% | 4% | 83% | 83.21% | 0% | 6% |
Puntaje | 13 | 13 | 12 | 12 | 10 | 9 | 6 | 4 |
Detector de IA de Ahrefs
Puntaje: 13/18
URL: https://ahrefs.com/writing-tools/ai-content-detector
El detector de IA de AHREFS mostró una buena precisión en todos los ámbitos, sin falsos positivos para el contenido escrito por humanos y una buena detección para el contenido de IA. Todavía logró detectar los tipos de modelos específicos utilizados para el contenido de IA: GPT-4O y Meta’s Vehemencia.
Según mis criterios, falló una de las nueve pruebas, luchando por identificar el contenido de IA que se mezcló con la escritura humana. Esta es una demarcación conocida de todas las herramientas de detección de IA (más sobre eso a continuación), y era cierto para todos los modelos de detección.
El detector de IA de AHREFS se apoyo en nuestro propio maniquí de detección patentado, capacitado en una gran cantidad de contenido web. Es único entre los detectores de IA porque puede usarlo adyacente con toneladas de otros puntos de datos de Ahrefs para ver cómo el contenido positivamente funciona.
Puede usar el detector de IA de AHREFS para ver:
- ¿Qué modelos de IA son los mejores para Creación de contenido de entrada calidad.
- Con qué frecuencia Sus competidores publican contenido de IAy qué modelos usan.
- Cuanto es el contenido de IA presente en un SERP en particulary cuánto esfuerzo puede carecer cambiar para clasificar.
- Cómo las métricas de rendimiento orgánico correlacionarse con diferentes niveles de uso de IAcomo el tráfico de búsqueda, las clasificaciones de palabras esencia y los vínculos de retroceso.
- Si se usa el contenido de AI se correlaciona con caídas de tráfico en páginas particulares o en subcarpetas particulares.
Cómo usar el detector de IA de Ahrefs
Comienzo por dirigirse a Explorador de sitios y pegar la URL que desea analizar. De eso:
- Haga clic en el Inspeccionar la página Pestaña Mensaje en la mostrador fronterizo izquierda.
- Elija el Detector de IA pestaña.
- Consulte su referencia de nivel de contenido de IA en la mostrador fronterizo derecha. El texto que nuestro maniquí ha detectado como probable generado por IA se codificará en color de acuerdo con los colores en la tabla de pasteles
En este ejemplo, nuestro detector de IA ha contrario una sección de mi publicación de blog que utilicé el maniquí GPT-4O de ChatGPT para difundir:
A partir de ahí, además puede ver cómo el contenido de la página ha cambiado con el tiempo, cuántos vínculos de retroceso ha reses, cuántas palabras esencia se clasifica, cuánto tráfico orgánico estimado recibe …
Todavía puede probar el maniquí a través de nuestro Detector de contenido de IA sin cargo página. Todavía estamos agregando detección de contenido de IA a copioso al Las mejores páginas Mensaje en el explorador del sitio (próximamente).
Copileaks
Puntaje: 13/18
URL: https://copyleaks.com/ai-content-detector
CopyLeaks coincidió con la puntuación superior, mostrando una capacidad de detección sólida en los dos extremos del contenido de IA. Resultó especialmente efectivo para atrapar la escritura obvia de la IA, aunque ocasionalmente vacilaba en pasajes mixtos o confín.
Gptzero
Puntaje: 18/12
URL: https://gptzero.me
GPTZero ofreció resultados confiables en militar, con una fuerza clara para atrapar contenido de IA de stop porcentaje. Sin secuestro, a veces dudaba en asignar probabilidades de IA seguras a ejemplos de rango medio o híbridos, lo que afecta tenuemente su precisión total.
Originalidad.Ai
Puntaje: 18/12
URL: https://originality.ai/ai-checker
Originalidad. El funcionó acertadamente en la mayoría de los casos, marcando con precisión el texto pesado de AI pero mostrando una tendencia a sobreestimar la autoría humana cuando se enfrenta a un material generado por IA sutil o acertadamente editado.
Scribbr
Puntaje: 18/10
URL: https://www.scribbr.com/ai-detector/
Scribbr aterrizó en el medio del paquete, manejando el contenido de IA clara y cortada razonablemente acertadamente, pero mostrando una caída en el rendimiento en piezas más matizadas, donde sus predicciones tendían a ser inconsistentes o demasiado cautelosas.
Zerogpt
Puntaje: 18/09
URL: https://zerogpt.com
El rendimiento de Zerogpt fue desigual: ocasionalmente clavaba un stop contenido de AI pero con frecuencia mal clasificada parcial-AI y muestras de mengua AI. La sensibilidad de la aparejo parecía sesgada cerca de los extremos, lo que resultó en un perfil menos controlado.
Gramática
Puntaje: 6/18
URL: https://www.grammarly.com/ai-detector
El detector de IA libertado de Grammarly luchó con una detección precisa de IA, ofreciendo predicciones de mengua confianza o inexacta en muchos casos. A menudo no reconoció signos claros de la autoría de IA y no era confiable en el contenido compuesto o confín.
Escritor
Puntaje: 4/18
URL: https://writer.com/ai-content-detector/
El detector de IA sin cargo del escritor obtuvo el material más bajo, de identificación errónea o de modo incorrecta o que faltan por completo el material generado por IA. Carecía de precisión en todos los ámbitos y proporcionaba poca señal útil incluso cuando se comercio de contenido que estaba al 100% escrito por IA.
Todos los detectores de contenido de IA funcionan de la misma modo básica: buscan patrones o anormalidades en el texto que parecen tenuemente diferentes de los del texto escrito por humanos.
Para hacer eso, necesitas dos cosas: muchos ejemplos de texto escrito humano y generado por IA para comparar y un maniquí matemático para usar para el examen.
Texto de ejemplo | Frecuencias de palabras | Frecuencias N-gram | Estructuras sintácticas | Notas estilísticas |
---|---|---|---|---|
“El sagaz se sentó en el tapete. Luego el sagaz bostezó”. | el: 3 Astuto: 2 Sábado: 1 En: 1 Mat: 1 Entonces: 1 Bostezado: 1 |
Bigrams “El sagaz”: 2 “Cat Sat”: 1 “Sentado”: 1 “En el”: 1 “The Mat”: 1 “Entonces el”: 1 “Astuto bostezado”: 1 |
Contiene pares SV (sujeto-verbo) como “The Cat Sat” y “The Cat bostezó”. | Punto de sagacidad en tercera persona; tono neutro. |
La tabla susodicho proporciona ejemplos de los tipos de estructuras de escritura que los detectores de IA pueden identificar. Estos patrones parecerán diferentes entre el contenido generado por AI y el contenido escrito por humanos.
La mayoría de los detectores de IA hoy usan redes neuronales, sistemas informáticos que imitan independientemente cómo funciona el cerebro humano. Contienen neuronas artificiales y, a través de la praxis (conocidas como entrenamiento), las conexiones entre las neuronas se ajustan para mejorar en su objetivo previsto: identificar el texto generado por IA.
Incluso los modelos pequeños pueden hacer un buen trabajo en la detección de IA, siempre y cuando estén entrenados con suficientes datos (al menos unos pocos miles de ejemplos).
En la letras académica, los detectores de IA alcanzan rutinariamente Tasas de detección exitosas del 80% (o más). Pero todos los detectores de IA son modelos estadísticos. Se ocupan de probabilidades, no de certeza, y como lo muestran nuestras pruebas, pueden ser increíblemente precisos, pero ellos Siempre lleve el peligro de errores y falsos positivos.
Todos los detectores de IA, incluidos los mejores desempeños en esta prueba, el detector de IA AHREFS y los copilocos, las mismas limitaciones centrales:
- El contenido de IA muy editado o “humanizado” puede escamotear la detección. La estampado de contenido generado por IA interrumpe los patrones de escritura generados por la máquina que usan los detectores de IA para identificar el contenido de IA.
- Las versiones gratuitas o básicas a menudo carecen de características avanzadas y pueden tener una precisión más mengua. Todavía se requieren actualizaciones regulares para que los detectores de IA se mantengan al día con las nuevas técnicas de escritura de IA y derivación. La efectividad de la detección puede variar según el maniquí de IA o el idioma utilizado.
- Los detectores pueden batallar con el contenido escrito en idiomas o formatos menos comunes. La mayoría de los modelos de detección están capacitados en un tipo específico de contenido, o un idioma específico, y el contenido que queda fuera de estos será más difícil de probar con precisión.
- No siempre hay respuestas claras. A medida que los flujos de trabajo de escritura incorporan IA de modo más sutil y matizada, se hace más difícil objetar a la pregunta “¿Es esto generado por IA?” ¿Es poco generado por IA si fue escrito por un humano pero copiado por AI? ¿O describido por AI pero escrito por un humano? Estas son líneas cada vez más borrosas.
Esto importa porque muy pocas empresas publican contenido de IA “puro”. En nuestro referencia de investigación, El estado de la IA en el marketing de contenidosencontramos que solo el 4.04% de todo el contenido publicado era contenido de IA sin editar. Casi todo el contenido de IA contiene cierta cantidad de estampado humana, y eso puede hacer que la detección de IA sea difícil:
Adecuado a estas limitaciones, es importante usar detectores de IA de una modo reto y ética. Recomiendo seguir estas mejores prácticas para la detección de contenido de IA, escritas en conjunto con los científicos de datos que desarrollaron nuestro maniquí de detección de IA:
- Intente instruirse tanto sobre los datos de capacitación del detector como sea posible, y use modelos entrenados en material similar a lo que desea probar.
- Pruebe múltiples documentos del mismo autor. ¿El artículo de un escritor fue afectado como generado por AI? Ejecute todo su trabajo pasado a través de la misma aparejo para tener una mejor sensación de su tasa pulvínulo.
- Nunca use detectores de contenido de IA para tomar decisiones que afecten la carrera o la posición académica de algún. Siempre use sus resultados adyacente con otras formas de evidencia.
- Úselo con una buena dosis de desconfianza. Ningún detector de IA es 100% preciso. Siempre habrá falsos positivos.
Pensamientos finales
Utilizamos nuestro detector de IA para analizar 900,000 páginas web publicadas en abril de 2025 y encontramos que El 74% incluyó contenido generado por IA.
Está claro que el contenido de IA no va a desaparecer, por lo que es una buena idea usar una aparejo como el detector de IA de Ahrefs para comprender cómo el contenido de IA afecta el rendimiento de su sitio web. Para comenzar, diríjase a Explorador de sitios.