Statistiche di Spam Terminator 3.0
Anche se la versione 2.4 è stata appena rilasciata, come molti attuali utenti
sanno stiamo sviluppando il "motore" di quello che sarà il nucleo del server
centrale di Spam Terminator 3.0 e che verrà poi utilizzato dai client ST 3.0.
Per poterlo "provare sul campo" e quindi migliorare ed affinarne l'innovativa
tecnica, stiamo analizzando da quasi 2 anni i messaggi di varie "spamtrap", al
ritmo di migliaia ogni mese (al 20 Settembre 2005 sono state analizzate ben
683.135 email, con una media mensile che ormai supera i 30.000 nuovi messaggi!).
Tale lavoro non è solamente mirato ad affinare gli algoritmi di
riconoscimento da parte del "motore", ma ci permette anche (e soprattutto) di
mantenere un database aggiornato sullo spam in circolazione. Da tale database
abbiamo voluto estrarre due grafici, per consentire a tutti voi di conoscere
qualcosa in più su Spam Terminator 3.0 e sullo spam in circolazione.
Categorie
Il server di ST3.0 effettua una categorizzazione dello spam rilevato,
suddividendolo in base al contenuto o al prodotto/servizio reclamizzato.

Come si può notare, il primo dato interessante è l'elevata percentuale (31%
ossia più di uno spam su tre!) della voce "salute" ovvero i soliti simil-viagra,
ma anche dimagranti, tranquillanti, cure per aumentare le prestazioni sessuali o
fisiche, eccetera. L'altra categoria rilevante (11%) e' quella dello spam "per
adulti". In terza posizione troviamo lo spam "Finanziario", ovvero
assicurazioni, mutui, "consigli" su cosa acquistare in Borsa, ma anche i
classici metodi per diventare ricchi.
Certamente vedere che medicinali (più o meno legali...) e argomenti per
adulti da soli raggiungono quasi la metà dello spam non è un aspetto molto
confortante.. Ovviamente vi invitiamo ad inserire anche le vostre valutazioni
nel web forum.
Tipologie di filtraggio
Per "tipologia di filtraggio" si intende quale metodo di filtraggio tra
quelli utilizzati da ST3.0 è stato più efficace. In questo grafico si tiene
comunque conto del fatto che un messaggio spam può ovviamente soddisfare una o
più delle condizioni (ossia può contenere parole "vietate" nel testo, ed anche
nell'oggetto), ognuna delle quali determina un "hit" ossia un conteggio su tale
tipologia..

In questo caso non ci sono molti commenti possibili, visto che la stragrande
maggioranza del filtraggio viene effettuato in base al corpo del messaggio.
Questo fatto è diretta conseguenza dei vari tentativi di "mascheramento" del
contenuto da parte degli spammer, i quali tendono a non inserire più parole
"pericolose" nell'oggetto o come mittente, ma anche delle "contromisure"
adottate nel motore del server ST 3.0 il quale è in grado di riconoscere molti
dei metodi di mascheramento.
Il secondo metodo (con quasi il 10%) è per "dominio indesiderato" ossia il
mittente o uno dei server per i quali il messaggio e' transitato appartiene (o
comunque contiene) ad uno dei nomi inseriti in lista.
Il "vecchio" metodo di filtraggio per oggetto risulta il terzo in ordine di
importanza poiché ST 3.0, grazie alle tecniche anti-mascheramento, è in grado di
decifrare oggetti codificati con base64 o quoted-printable, charset differenti
da quello predefinito, e tutti i trucchettini per mascherare le parole più
"pericolose" (ad esempio sostituendo una barra "|" o i caratteri "1" al posto
delle "l", accentate varie, e così via).
Attendiamo sul web forum i vostri commenti, consigli,
e domande!!
|