Google publicó detalles de un nuevo tipo de IA basado en gráficos llamado Maniquí de almohadilla de gráficos (GFM) que se generaliza a gráficos previamente invisibles y ofrece un aumento de tres a cuarenta veces en precisión sobre métodos anteriores, con pruebas exitosas en aplicaciones escaladas como detección de spam en ADS.
El anuncio de esta nueva tecnología se conoce como expandir los límites de lo que ha sido posible hasta hoy:
“Hoy, exploramos la posibilidad de diseñar un maniquí único que pueda sobresalir en tablas relacionales interconectadas y, al mismo tiempo, pluralizar a cualquier conjunto injusto de tablas, características y tareas sin capacitación adicional. Estamos entusiasmados de compartir nuestro progreso flamante en el mejora de tales modelos de cimientos gráficos (GFM) que empuje las fronteras del estudios boceto y la Tabular ML mucho más allá de los básculos habitual”.
Redes neuronales gráficas vs. Modelos de almohadilla de gráficos
Los gráficos son representaciones de datos relacionados entre sí. Las conexiones entre los objetos se llaman bordes y los objetos mismos se llaman nodos. En SEO, se podría afirmar que el tipo de boceto más frecuente es el boceto de enlaces, que es un plano de toda la web por los enlaces que conectan una página web a otra.
La tecnología flagrante utiliza Graph Neural Networks (GNNS) para representar datos como el contenido de la página web y puede estilarse para identificar el tema de una página web.
Una investigación de Google blog Acerca de GNNS explica su importancia:
“Las redes neuronales gráficas, o GNNS para abreviar, han surgido como una técnica poderosa para disfrutar tanto la conectividad del boceto (como en los algoritmos más antiguos, profundos y nodo2vec) y las características de entrada sobre los diversos nodos y bordes. GNNS puede hacer predicciones para los gráficos como un total (¿esta molécula reactiva de una modo?
Adicionalmente de hacer predicciones sobre gráficos, los GNN son una útil poderosa utilizada para cerrar el sima a casos de uso de redes neuronales más típicos. Encontran la información discreta y relacional de un boceto de modo continua para que pueda incluirse lógicamente en otro sistema de estudios profundo “.
La desventaja de GNN es que están atados al boceto en el que fueron entrenados y no pueden estilarse en un tipo diferente de boceto. Para usarlo en un boceto diferente, Google tiene que entrenar otro maniquí específicamente para ese otro boceto.
Para hacer una igualdad, es como tener que entrenar un nuevo maniquí de IA generativo en documentos de idioma francés solo para que funcione en otro idioma, pero ese no es el caso porque los LLM pueden pluralizar a otros idiomas, lo cual no es el caso de los modelos que funcionan con gráficos. Este es el problema que resuelve la invención, para crear un maniquí que se generalice a otros gráficos sin tener que ser entrenados primero.
El avance que Google anunció es que con los nuevos modelos de Graph Foundation, Google ahora puede capacitar un maniquí que puede pluralizar a través de nuevos gráficos en los que no ha sido entrenado y comprender patrones y conexiones interiormente de esos gráficos. Y puede hacerlo de tres a cuarenta veces más precisamente.
Anuncio pero sin trabajo de investigación
El anuncio de Google no se vincula a un trabajo de investigación. Se ha informado de diversas maneras que Google ha decidido informar menos trabajos de investigación y este es un gran ejemplo de ese cambio de política. ¿Es porque esta innovación es tan ilustre que quieren prolongar esto como una superioridad competitiva?
Cómo funcionan los modelos de Fundación Graph
En un boceto convencional, digamos un boceto de Internet, las páginas web son los nodos. Los enlaces entre los nodos (páginas web) se llaman bordes. En ese tipo de boceto, puede ver similitudes entre páginas porque las páginas sobre un tema específico tienden a vincularse a otras páginas sobre el mismo tema específico.
En términos muy simples, un maniquí de almohadilla Graph convierte cada fila en cada tabla en un nodo y conecta nodos relacionados en función de las relaciones en las tablas. El resultado es un solo boceto ilustre que el maniquí utiliza para ilustrarse de los datos existentes y hacer predicciones (como identificar spam) en nuevos datos.
Captura de pantalla de cinco tablas

Alterar tablas en un solo boceto
El trabajo de investigación dice esto sobre las siguientes imágenes que ilustran el proceso:
“La preparación de datos consiste en transfigurar tablas en un solo boceto, donde cada fila de una tabla se convierte en un nodo del tipo de nodo respectivo, y las columnas de esencia extranjera se convierten en bordes entre los nodos. Las conexiones entre cinco tablas que se muestran se convierten en bordes en el boceto resultante”.
Captura de pantalla de tablas convertidas en bordes

Lo que hace que este nuevo maniquí sea extraño es que el proceso de crearlo es “sencillo” y se escalera. La parte sobre la escalera es importante porque significa que la invención puede funcionar en la infraestructura masiva de Google.
“Argumentamos que disfrutar la estructura de conectividad entre las tablas es esencia para los algoritmos ML efectivos y un mejor rendimiento posterior, incluso cuando los datos de características tabulares (p. Ej.
El proceso es proporcionado sencillo y se puede ejecutar a escalera: cada tabla se convierte en un tipo de nodo único y cada fila en una tabla se convierte en un nodo. Para cada fila en una tabla, sus relaciones de esencia externa se escriben bordes a los nodos respectivos de otras tablas, mientras que el resto de las columnas se tratan como características de nodo (típicamente, con títulos numéricos o categóricos). Opcionalmente, incluso podemos prolongar información temporal como características de nodo o borde “.
Las pruebas tienen éxito
El anuncio de Google dice que lo probaron para identificar el spam en los anuncios de Google, lo cual fue difícil porque es un sistema que utiliza docenas de gráficos grandes. Los sistemas actuales no pueden hacer conexiones entre gráficos no relacionados y perder el contexto importante.
El nuevo maniquí de Fundación de Gráficos de Google pudo hacer las conexiones entre todos los gráficos y un rendimiento mejorado.
El anuncio describió el logro:
“Observamos un refuerzo de rendimiento significativo en comparación con las líneas de almohadilla de una mesa única sintonizada. Dependiendo de la tarea aguas debajo, GFM trae ganancias 3x-40x en precisión promedio, lo que indica que la estructura de gráficos en las tablas relacionales proporciona una señal crucial para disfrutar los modelos ML”.
¿Google está usando este sistema?
Es sobresaliente que Google probara con éxito el sistema con los anuncios de Google para la detección de spam e informara ascendentes y sin inconvenientes. Esto significa que se puede usar en un entorno en vivo para una variedad de tareas del mundo verdadero. Lo usaron para la detección de spam de Google Ads y porque es un maniquí flexible que significa que se puede usar para otras tareas para las cuales se usan múltiples gráficos, desde la identificación de temas de contenido hasta identificar el spam de enlace.
Normalmente, cuando poco se queda corto, los trabajos de investigación y el anuncio dicen que señala el camino para el futuro, pero no es así como se presenta esta nueva invención. Se presenta como un éxito y termina con una proclamación que dice que estos resultados pueden mejorarse aún más, lo que significa que puede mejorar aún mejor que estos resultados ya espectaculares.
“Estos resultados pueden mejorarse aún más mediante una escalera adicional y una diversa compendio de datos de capacitación pegado con una comprensión teórica más profunda de la extensión”.
Lea el anuncio de Google:
Modelos de Fundación Graph para datos relacionales
Imagen destacada de Shutterstock/SiorArt