Vigo, 25 de Febreiro de 2006 - Nº 1024

HOXE ANTERIORES SUSCRICIÓNS WEBMASTER

SECCIÓNS

Coloquios Abertos na Escola Superior de Enxeñería Informática

A aplicación de filtrado de textos podería empregarse na supresión de contidos inadecuados para menores

Conferencia do profesor José Ramón Méndez Reboredo


José Ramón Méndez

Duvi

“A principal aplicación de filtrado de textos é a eliminación de correo spam ou correo non desexado, pero esta mesma tecnoloxía podería ser aplicada a outros contextos, como a supresión de contidos inadecuados para menores”. Con esta afirmación comezaba José Ramón Méndez Reboredo, profesor de Fundamentos de Programación na Universidade, a súa conferencia, enmarcada nos Coloquios Abertos da Escola Superior de Enxeñería Informática (ESEI) das Lagoas. A súa exposición versou sobre unha das liñas de investigación do grupo SING (Sistemas Informáticos de Nova Xeración), que consiste na detección e filtrado de contidos textuais. “Varios membros do persoal de docencia e investigación da Universidade, como Florentino Fernández Riverola, Eva Lorenzo Iglesias e eu mesmo, xunto con investigadores de outros centros, como Fernando Díaz Gómez, da Universidade de Valladolid, e Juan Manuel Corchado Rodríguez da Universidade de Salamanca, elaboramos unha tecnoloxía que soluciona varios problemas presentes neste ámbito”, comentou Méndez Reboredo. José Ramón continuou explicando que a presenza dun nivel de ruído alto e o “concept drift” constitúen as principais dificultades engadidas a este campo. “O primeiro fai referencia ás técnicas que usan os remitentes de correo spam para ocultar palabras clave, de forma que non poidan ser correctamente identificadas polos filtros de correo non desexado, como por exemplo usar v1agra o v¡agra en vez de viagra”, expuxo o profesor da ESEI . En canto ao “concept drift”, Méndez aclarou que fai referencia a que “o concepto spam é volátil, no sentido de que algunhas palabras que separan facilmente entre as clases spam e lexítimo, como Rolex, poden, co paso do tempo, deixar de ser representativas ou, incluso, empezar a ser representativas da clase contraria”. Diversas naturezas O profesor de Fundamentos de Programación comentou tamén as características máis importantes do concepto spam que se deben ter en conta para elaborar modelos de filtrado, como a naturalidade disxunta do correo non desexado, que fai referencia a que os correos spam teñen diversas naturezas. “Por exemplo, un correo spam ofrecendo préstamos cun tipo baixo de interese (Lowest Mortgage Rate), ten pouco que ver cun correo que ofrece réplicas de reloxos de determinadas marcas (Rolex Replica)”, apuntou José Ramón. Por outro lado, Méndez destacou a importancia do usuario final á hora de considerar unha mensaxe como lexítima ou spam, “só este é capaz de decidir se realmente o considera así”. Tamén sinalou a necesidade de ter en conta a importancia de clasificar ben as mensaxes lexítimas, xa que “si se borran estes correos, os usuarios finais poden chegar a perder información importante”. Durante a última etapa da charla, o profesor da ESEI fixo unha exposición da tecnoloxía desenvolvida polo grupo SING, baseada en CBR (Sistemas de Razoamento Baseado en Casos). “Esta tecnoloxía resulta a máis adecuada para operar neste tipo de contornos, xa que manexa conceptos disxuntos e soporta adecuadamente o ‘concept drift’. Os resultados obtidos experimentalmente gozan de maior exactitude que os xerados con calquera outra técnica”, sentenciou Méndez Reboredo.

ATIC
Área das Tecnoloxías da Información e da Comunicación

ORI
Relacións Internacionais

I+D
Oficina de

OMA
Oficina de Medio Ambiente

Deportes

ANL
Área de Normalización Lingüística

Biblioteca

Cátedras de Empresa

Extensión cultural

Cidade Universitaria

Powered by