Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.udec.cl/jspui/handle/11594/6904
Título : Detección y búsqueda de noticias basado en información temática, temporal y espacial.
Autor : Rodríguez Tastets, María Andrea; supervisora de grado
Smith Bize, Simón Cristóbal
Palabras clave : Ciencias de la Información;Noticias;Temas Motivos;Recuperación de Información;WWW (Sistema de Recuperación de Información)
Fecha de publicación : 2006
Editorial : Universidad de Concepción.
Resumen : El fuerte crecimiento de la World Wide Web ha hecho más difícil la tarea de reconocer y recuperar información de interés para un usuario. Los métodos clásicos de recuperación de información para analizar textos no o semi-estructurados, en base a las ocurrencias de las palabras claves dentro de un documento, tienen limitantes que motivan el estudio de nuevos métodos que exploren la semántica del contenido en documentos textuales. Esta Tesis explora la combinación de métodos tradicionales de recuperación de información con el análisis de contenido espacial y temporal de documentos para lograr la detección de tópico y recuperación de noticias en la Web chilena. La detección de un tópico se refiere a la tarea de construir clusters de noticias que discutan el mismo tema. El trabajo propone analizar el documento de una noticia separando su texto en tres componentes: términos en el título, términos relevantes en el texto (p. ej. nombres propios) y los restantes términos en el documento. El componente temporal de una noticia es definido como su tiempo de publicación, donde se asume que una mayor cercanía temporal apoya la relación temática entre noticias. Similarmente, la referencia espacial de una noticia es asociada a la referencia geográfica, usualmente identificada en el encabezamiento de una noticia, y suponiendo que la cercanía geográfica apoya la relación temática de una noticia. Esta Tesis pretende complementar trabajos previos que incorporan parcialmente el tiempo en la detección tópicos, utilizando algoritmos de clustering jerárquico de tipo single-link. El sistema es comparado con un sistema actual de detección de tópico (TDT) obteniendo mejores resultados de rendimiento. Adicionalmente, los resultados del algoritmo de detección de tópico son utilizados en un proceso de recuperación de información como método de indexación que es capaz de detectar noticias relevantes a una consulta con una menor dependencia del uso, en la especificación de la consulta, de términos relevantes en los documentos. Estos resultados complementan un proceso de de navegación que permite recorrer noticias asociadas a un tópico de interés.
Descripción : Tesis para optar al grado de Magíster en Ciencias de la Computación.
URI : http://repositorio.udec.cl/jspui/handle/11594/6904
metadata.dc.source.uri: https://go.openathens.net/redirector/udec.cl?url=http://tesisencap.udec.cl/concepcion/smith_b_s/index.html
Aparece en las colecciones: Ingeniería Informática y Ciencias de la Computación - Tesis Magister

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Resumen.pdf132,2 kBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons