Detección de depredadores sexuales utilizando grandes modelos de lenguaje.
Loading...
Date
2024
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad de Concepción
Abstract
La creciente utilización de las redes sociales y plataformas de mensajería ha abierto nuevas vías para la comisión de delitos en línea, entre ellos el grooming, que se refiere al acoso sexual hacia menores de edad mediante el engaño y la manipulación. Esta memoria presenta el desarrollo de un sistema de detección de grooming en conversaciones de chat, utilizando grandes modelos de lenguaje (LLM) para identificar patrones de comportamiento sospechoso y clasificar chats con posibles casos de grooming.
El sistema propuesto emplea una heurística iterativa, apoyada por un módulo de detección de fugas de privacidad (Presidio), que permite analizar y categorizar las conversaciones en diferentes etapas iniciales del grooming: Primer contacto, Generar confianza y Migrar de plataforma. A través de varias iteraciones, el sistema ha sido refinado para mejorar su precisión, reduciendo la dependencia de una única consulta al LLM y ajustando los puntajes de detección para minimizar falsos positivos y negativos.
Los resultados obtenidos muestran que el sistema es capaz de detectar con alta precisión los casos de grooming, especialmente cuando se ajustan los puntajes para dar mayor peso a la clasificación del LLM. Sin embargo, también se destacan los desafíos éticos y técnicos asociados a la implementación de este tipo de sistemas en tiempo real, así como la necesidad de futuras mejoras en la integración de modelos más específicos y el entrenamiento de estos.
Description
Tesis presentada para optar al título de Ingeniero Civil Informático
Keywords
Acoso sexual, Acoso cibernético, Aprendizaje de máquina