El nuevo modelo de IA de Meta tiene como objetivo mejorar Wikipedia

| |

Se dice que el último modelo de IA de Meta puede verificar automáticamente cientos de miles de fuentes de Wikipedia al mismo tiempo y hacer mejores sugerencias si es necesario.

Wikipedia crece alrededor de 17.000 artículos al mes. Estos incluyen textos largos y cortos, pero tienen una cosa en común: cada afirmación en el texto debe ser verificada por una fuente verificada dos veces.

Cuanto más grande se vuelve Wikipedia, más exigente se vuelve para la comunidad cumplir con esta promesa de calidad y mantener las fuentes actualizadas. El último modelo de IA de Meta, «Side», podría admitir esto en el futuro.

Publicación Destacada

Fuentes de conocimiento de la web

Según Meta, el modelo de IA de código abierto Side puede comprobar automáticamente cientos de miles de fuentes y evaluar si la información disponible en la fuente verifica la afirmación del artículo de Wikipedia y en qué medida.

El sistema debería verificar automáticamente las fuentes en segundo plano y señalar fuentes posiblemente incorrectas o irrelevantes a los editores de Wikipedia. Esto debería ahorrarles a los editores el esfuerzo de revisar manualmente todas las fuentes. Side también puede hacer sugerencias para (mejores) fuentes en el caso de citas faltantes o desactualizadas.

Vídeo: Meta

Side extrae su conocimiento de un conjunto de datos de texto de información de 134 millones de sitios web disponibles públicamente. Los índices desarrollados para el proyecto Sphere contienen 40 veces más contenido que otros índices de Wikipedia, según Meta.

Meta enseñó la IA en entrenamiento, para cuatro millones de declaraciones de Wikipedia a la vez una sola fuente para averiguarlo en la gran cantidad de sitios web. Según Meta, al buscar fuentes, el modelo compara «representaciones matemáticas del significado de declaraciones completas» en lugar de solo palabras individuales. En el caso de textos extensos, el modelo debería poder encontrar solo los pasajes más relevantes para el sitio de Wikipedia antes de recomendar una URL de origen.

A largo plazo, Meta también quiere comprobar hechos y evaluar la calidad de la fuente.

En el próximo paso, Meta quiere expandir el principio de verificación. Los modelos correspondientes deben aprender a evaluar la calidad de los documentos recuperados, deben reconocer posibles contradicciones en las declaraciones y priorizar fuentes confiables y especificarlas de manera transparente si no hay evidencia convincente para una declaración.

«En el mundo real, estos modelos podrían detener el contenido dañino y, combinados con una interfaz de usuario bien diseñada, podrían impulsar la alfabetización digital y el pensamiento crítico de las personas», escribe Meta.

El sistema se puede integrar en futuros editores, por ejemplo, para verificar hechos, corregir errores y agregar texto. Idealmente, accede a la información de todos los formatos de medios en muchos idiomas diferentes.

Experimento de código abierto como componente básico para el futuro de la IA

El equipo de investigación de Meta también brinda una perspectiva sobre cómo el proyecto paralelo podría contribuir al progreso general de la IA: la IA puede ser parte de una capacitación integral con contenido complejo y complicado. desarrollar una mejor comprensión del mundo. El resultado son algoritmos más inteligentes y flexibles.

Como modelo básico preentrenado, el sistema de verificación de datos podría generar avances en el procesamiento del lenguaje, para la búsqueda de información en sistemas de preguntas y respuestas y en el aprendizaje de pocos intentos, es decir, el ajuste fino de un gran modelo de IA para aplicaciones específicas con pocos datos. .

Meta hace que Side esté disponible gratuitamente como código abierto . Una demostración de Wikipedia está en línea aquí . Meta no cooperó con el operador de Wikipedia Wikimedia para el proyecto paralelo. No se sabe si el sistema se usa para Wikipedia y cómo.

Lina
Lina García ha escrito sobre tecnología y marketing, cubriendo todo, desde la analítica hasta la realidad virtual, desde 2010. Antes de eso, obtuvo un doctorado en inglés, enseñó a escribir a nivel universitario y lanzó y publicó una revista en formato impreso y digital. Ahora es escritora, editora y consultora de marketing a tiempo completo.