Browsing by Author "Maldonado Trapp, Alejandra Marcela"
Now showing 1 - 3 of 3
Results Per Page
Sort Options
Item Capacidades y evaluación de Large Language Lodels de código abierto como herramientas de aprendizaje para ciencias matemáticas y físicas.(Universidad de Concepción, 2024) Villalobos Alfaro, Kevin Alejandro Andrés; Navarrete Lizama, Carlos Camilo; Maldonado Trapp, Alejandra MarcelaEste estudio analiza y caracteriza las principales capacidades, estrategias (Prompting), fortalezas, limitaciones y riesgos de los grandes modelos de lenguaje (LLMs) de código abierto con miras a su utilización como herramientas de aprendizaje en ciencias matemáticas y físicas. Se realizaron experimentos en dos fases para determinar las condiciones bajo las cuales los LLMs son más efectivos para este propósito. En la primera fase, se evaluaron las capacidades de los modelos de código abierto: LLaMA3-70b y Mixtral-8x7b frente a la prueba PAES Matemática 1 (2024), utilizando 30 preguntas extraídas de la misma. Se probaron ocho combinaciones de técnicas de ingeniería de prompt y configuracion de parámetros: sin técnica específica, con Chain of Thought (CoT) Zero Shot, con 5-Shot, con CoT + 5-Shot. Para cada una de estas cuatro luego se varió la temperatura del modelo (0 y 1). La combinación más efectiva fue LLaMA3-70b con CoT y temperatura 0, alcanzando un rendimiento consistente del 93,44 % [93,23 %, 93,66 %] con un intervalo de confianza del 95 %. Los errores más comunes identificados en matemáticas fueron principalmente errores de interpretación (donde el modelo confunde información intrínseca del problema o del enunciado) y cálculos numéricos (donde el modelo se equivoca en alguna operación matemática). En la segunda fase, se utilizó la mejor combinación antes mencionada para evaluar modelos adicionales de distintos tamaños: Mixtral-8x22b (2,5 veces más grande que LLaMA3-70b) y Phi-3mini (18,7 veces más pequeño). El modelo Phi-3-mini alcanzó un rendimiento promedio del 53,11 %, mientras que Mixtral-8x22b logró un 82,78 %. Esta diferencia de rendimiento, con Mixtral-8x22b superando a su contraparte en ocho puntos porcentuales bajo la misma técnica de prompt, demuestra cómo el tamaño del modelo influye en el desempeño dentro de la misma arquitectura. Para ampliar el análisis, se evaluó LLaMA3-70b utilizando CoT y temperatura 0 en las pruebas PAES-Física-2024 y PAES-Matemática-2-2024, obteniendo rendimientos promedio del 80,00 % y 84,89 %, respectivamente. Adicionalmente, se comparó el rendimiento del modelo comercial ChatGPT-3.5-Turbo, que alcanzó un 76,78 % en la PAES-M1-2024 empleando la misma combinación de CoT y temperatura 0. Finalmente, basándose en los descubrimientos de los experimentos anteriores, se diseñó un prototipo de aplicación web usando el framework “Next.js” y que está conectada al modelo LLaMA3-70b mediante la API de Groq. Este prototipo incorpora un prompt personalizado, creado en función de las fortalezas y limitaciones detectadas en los LLMs, cuyo objetivo es incentivar a los modelos a que generen una respuesta que logre guiar a los estudiantes en la resolución de problemas sin proporcionar cálculos detallados (en su mayoría solo expresiones y fórmulas), mitigando así los errores comunes de los LLMs. Con este prototipo, se ilustra un potencial uso comercial/académico de estas tecnologías como herramientas de aprendizaje en ciencias matemáticas y físicas.Item Correlations in quantum information protocols.(Universidad de Concepción, 2016) Maldonado Trapp, Alejandra Marcela; Roa Oppliger, LuisIn this thesis I present four works developed in collaboration during my PhD. The main topic in them was the study of correlations in quantum information protocols with particular emphasis in quantum discord and entanglement. In the article entitled Quantum Discord Underlies the Optimal Scheme for Modifying the Overlap between Two States J. Phys. Soc. Jpn. 83, 044006 (2014), we focused on quantum discord in the context of overlap modification between two non-orthogonal states. We showed that only discord is necessary to assist the probabilistic and deterministic protocols for overlap modification. In the article entitled A measure for maximum similarity between outcome states EPL, 109, 40001 (2015), we developed a new correlation, similarity degree (SD). Like discord, this quantity characterizes the effect of a local measurement on the other subsystem. We find and analytical expression to calculate it. Addionally, it can be directly measured in an optical setup.Item Evaluación del uso de fine-tuning en modelos de lenguaje grande como herramienta de aprendizaje ajustada a las áreas de física y matemáticas en la educación.(Universidad de Concepción, 2024) Melita Cruces, Luis Andrés; Navarrete Lizama, Carlos Camilo; Maldonado Trapp, Alejandra MarcelaEl presente trabajo titulado “EVALUACIÓN DEL USO DE FINE-TUNING EN MODELOS DE LENGUAJE GRANDE COMO HERRAMIENTA DE APRENDIZAJE AJUSTADA A LAS ÁREAS DE FÍSICA Y MATEMÁTICAS EN LA EDUCACIÓN”, tiene como objetivo principal desarrollar estrategias de fine-tuning para modelos de lenguaje grande pre-entrenados, con el propósito de optimizar su desempeño en la resolución de problemas matemáticos y físicos en contextos educativos. Se utilizó una metodología mixta que incluye la cuantización de modelos, preparación del entorno de desarrollo por limitaciones software, selección de modelos pre-entrenados, recopilación y preparación de datos, elección de técnicas de fine-tuning, y evaluación del rendimiento de los modelos entrenados. Se llevaron a cabo experimentos utilizando la técnica fine-tuning más adecuada para las herramientas disponibles, y para la tarea definida de mejorar el rendimiento de los LLMs en tareas específicas de matemáticas y física. Se concluyó que el fine-tuning de LLMs es una técnica eficaz para adaptar modelos pre-entrenados a tareas educativas específicas, mejorando su rendimiento y utilidad en la enseñanza de matemáticas y física. Los resultados sugieren que el uso de LLMs ajustados puede ser una herramienta valiosa para el desarrollo educativo, proporcionando no solo respuestas precisas, sino también un medio para que los estudiantes comprendan mejor los conceptos y mejoren sus habilidades de resolución de problemas.