Tus Buenas Noticias
Síguenos

Google presenta Minerva, una IA capaz de resolver complejos problemas matemáticos

La Inteligencia Artificial es capaz de solucionar problemas algebraicos con una precisión muy exacta

15 julio, 2022
Google presenta Minerva, una IA capaz de resolver complejos problemas matemáticos

Minerva, es así como es llamada una Inteligencia Artificial que es capaz de resolver problemas matemáticos y científicos con el razonamiento paso a paso en el que usa una combinación de lenguaje natural y notación matemática.

De acuerdo a Google, Minerva resuelve tales problemas generando soluciones que incluyen cálculos númericos y manipulación simbólica sin depender de herramientas externas como una calculadora. 

Minerva combina varias técnicas, que incluyen sugerencias paso a paso, cadena de pensamiento o sugerencias desde un bloc de notas en la cual realizan tareas cada vez más complejas que van desde largas sumas hasta la ejecución de programas arbitrarios, mejorando la capacidad de los modelos de lenguajes para realizar cálculos de varios pasos.

Problema resuelto por la IA Minerva. Foto: Google

Sigue leyendo: 51 cursos gratuitos de Google que puedes hacer desde casa, aprende e incrementa tus aprendizajes

Resolución de problemas complejos

Para promover el razonamiento cuantitativo, Minerva construye modelos de lenguaje en el que se mantienen los símbolos y formatos que son esenciales para el significado semántico de las expresiones matemáticas. Al mantener esta información en los datos de entrenamiento, el modelo aprende a conservar usando notación matemática estándar.

Minerva también incorpora ténicas recientes de asesoramiento y evaluación para resolver mejor las cuestiones matemáticas. Estos incluyen una cadena de pensamiento o sugerencias a través de bloc de notas, en donde se le solicita a Minerva varias soluciones paso a paso a las preguntas existentes antes de que se le presente una nueva pregunta, y la votación por mayoría.

Como la mayoría de los modelos de lenguaje, Minverva asigna probabilidades a diferentes salidas posibles. Al responder una pregunta, en lugar de tomar la solución única que Minerva califica como la más probable, se generan múltiples soluciones mediante el muestreo estocástico de todos los resultados posibles.

Estas soluciones son diferentes (por ejemplo, los pasos no son idénticos), pero la mayoría de las veces se llega a la misma respuesta final. Minerva usa la votación por mayoría en estas soluciones de muestra, tomando el resultado más común como la respuesta final concluyente.

Evaluación de la IA Minerva alcanza niveles por arriba del promedio

Para probar las habilidades de razonamiento cuantitativo de Minerva, evaluamos el modelo en puntos de referencia STEM que varían en dificultad desde problemas de nivel de escuela primaria hasta cursos de nivel de posgrado.

  • Matemáticas: Problemas de nivel de competencia de matemáticas de la escuela secundaria
  • MMLU-STEM: Un subconjutno del punto de referencia Massive Multitask Language Understanding centrado en STEM, que cubre temas como ingeniería, química, matemáticas y física a nivel de escuela secundaria y universidad.
  • GSM8k: Problemas matemáticos de nivel de escuela primaria que involucran operaciones aritméticas básicas que deberían ser resueltos por un estudiante talentoso de secundaria.

También se evaluó a Minverva en OCWCourses, una colección de problemas de nivel universitario y de posgrado que cubren una variedad de temas STEM como química del estado sólido, astronomía, ecuaciones diferenciales y relatividad especial que recopilamos de MIT OpenCourseWare.

En todos los casos, Minerva obtuvo resultados excepcionales, y en ocasiones con amplio margen por arriba del promedio.

Minerva todavía tiene algunos errores como "falsos positivos", lo cual es cuando se llega a la respuesta final correcta pero con un razonamiento erróneo, sin embargo la tasa de falsos positivos es relativamente baja (menos del 8% de falsos positivos).

Sigue leyendo: ¿Necesitas enviar emails desde Gmail por WhatsApp? Te enseñamos a hacerlo

Temas de esta nota
Enlaces patrocinados