Kaspersky Lab recibió la patente de los EE.UU. por su innovadora tecnología para identificar los mensajes de texto electrónico como spam.
El spam está causando tanto daño a las empresas y los consumidores. No deseados mensajes de correo electrónico suelen contener ofertas fraudulentas, archivos adjuntos o enlaces maliciosos a sitios web infectados.
Una de las maneras más populares y más eficaces para combatir el correo electrónico no deseado es clasificar los mensajes en función de si contienen palabras clave y frases típicas del spam. Esta práctica no sólo le permite configurar el sistema para ser bloqueado por los nuevos tipos de spam, sino que también proporciona una alta tasa de detección con un número mínimo de falsos positivos.
Patentado de mensajes de texto electrónicos se clasifican sobre la base de una lista jerárquica de categorías. Cada categoría se define por un conjunto de palabras clave y plantillas de texto. Un mensaje entrante se clasifica de la siguiente manera: en primer lugar, su peso se calcula con respecto a cada categoría que contiene palabras clave que se encuentran en el correo electrónico. Entonces se determina el grado de similitud con cada una de las plantillas. Si el mensaje contiene una serie de palabras clave o es suficientemente similar a una de las plantillas, se clasifica en una categoría, incluido el spam.
Categorías de Noticias también se pueden agregar manualmente, señalando las palabras clave y la creación de plantillas. Además, cada uno de ellos puede dividirse en subcategorías, que proporcionará una clasificación más detallada. Los mensajes de texto también se pueden utilizar técnicas de pre-procesado, como la detección automática del idioma, la eliminación de palabras de uso frecuente y filtrado de ruido.
No hay comentarios:
Publicar un comentario