Evaluación del uso de fine-tuning en modelos de lenguaje grande como herramienta de aprendizaje ajustada a las áreas de física y matemáticas en la educación.
Loading...
Date
2024
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad de Concepción
Abstract
El presente trabajo titulado “EVALUACIÓN DEL USO DE FINE-TUNING EN MODELOS DE LENGUAJE GRANDE COMO HERRAMIENTA DE APRENDIZAJE AJUSTADA A LAS ÁREAS DE FÍSICA Y MATEMÁTICAS EN LA EDUCACIÓN”, tiene como objetivo principal desarrollar estrategias de fine-tuning para modelos de lenguaje grande pre-entrenados, con el propósito de optimizar su desempeño en la resolución de problemas matemáticos y físicos en contextos educativos.
Se utilizó una metodología mixta que incluye la cuantización de modelos, preparación del entorno de desarrollo por limitaciones software, selección de modelos pre-entrenados, recopilación y preparación de datos, elección de técnicas de fine-tuning, y evaluación del rendimiento de los modelos entrenados. Se llevaron a cabo experimentos utilizando la técnica fine-tuning más adecuada para las herramientas disponibles, y para la tarea definida de mejorar el rendimiento de los LLMs en tareas específicas de matemáticas y física.
Se concluyó que el fine-tuning de LLMs es una técnica eficaz para adaptar modelos pre-entrenados a tareas educativas específicas, mejorando su rendimiento y utilidad en la enseñanza de matemáticas y física. Los resultados sugieren que el uso de LLMs ajustados puede ser una herramienta valiosa para el desarrollo educativo, proporcionando no solo respuestas precisas, sino también un medio para que los estudiantes comprendan mejor los conceptos y mejoren sus habilidades de resolución de problemas.
The present work, titled “EVALUACIÓN DEL USO DE FINE-TUNING EN MODELOS DE LEN- GUAJE GRANDE COMO HERRAMIENTA DE APRENDIZAJE AJUSTADA A LAS ÁREAS DE FÍSICA Y MATEMÁTICAS EN LA EDUCACIÓN”, has the main objective of developing fine-tuning strategies for pre-trained large language models in order to optimize their performance in solving mathematical and physical problems within educational contexts. A mixed methodology was used, including model quantization, setting up the development envi- ronment due to software limitations, selection of pre-trained models, data collection and preparation, choice of fine-tuning techniques, and evaluation of the trained models’ performance. Experiments were conducted using the most suitable fine-tuning technique for the available tools and for the defined task of improving LLM performance on specific mathematics and physics tasks. It was concluded that the fine-tuning of LLMs is an effective technique to adapt pre-trained models to specific educational tasks, improving their performance and usefulness in the teaching of mathematics and physics. The results suggest that fine-tuned LLMs can be a valuable tool for educational development, providing not only accurate answers but also a means for students to better understand concepts and improve their problem-solving skills.
The present work, titled “EVALUACIÓN DEL USO DE FINE-TUNING EN MODELOS DE LEN- GUAJE GRANDE COMO HERRAMIENTA DE APRENDIZAJE AJUSTADA A LAS ÁREAS DE FÍSICA Y MATEMÁTICAS EN LA EDUCACIÓN”, has the main objective of developing fine-tuning strategies for pre-trained large language models in order to optimize their performance in solving mathematical and physical problems within educational contexts. A mixed methodology was used, including model quantization, setting up the development envi- ronment due to software limitations, selection of pre-trained models, data collection and preparation, choice of fine-tuning techniques, and evaluation of the trained models’ performance. Experiments were conducted using the most suitable fine-tuning technique for the available tools and for the defined task of improving LLM performance on specific mathematics and physics tasks. It was concluded that the fine-tuning of LLMs is an effective technique to adapt pre-trained models to specific educational tasks, improving their performance and usefulness in the teaching of mathematics and physics. The results suggest that fine-tuned LLMs can be a valuable tool for educational development, providing not only accurate answers but also a means for students to better understand concepts and improve their problem-solving skills.
Description
Tesis presentada para optar al título de Ingeniero Civil Industrial
Keywords
Aprendizaje, Matemáticas, Redes neurales (ciencia de la computación)