di: Andrea Cristaudo 27 Aprile 2006
Una soluzione più raffinata consiste nell'utilizzare una blacklist ma non di indirizzi Ip ma di termini. Gli spammer infatti si specializzano in determinati settori e utilizzano spesso le stesse parole o gli stessi url. Queste liste saranno quindi composte da un elenco di url pubblicizzati dallo spam e da termini spesso presenti in questi messaggi come ad esempio "casino", "sesso", "viagra", "cialis", "sex" e così via.
Il problema maggiore che deriva da questa tecnica consiste nel tenere aggiornata la lista dei termini già che gli spammer troveranno facilmente il modo di aggirarla (ad esempio inserendo "cia1is" al posto di "cialis"). Inoltre in determinati settori è possibile avere un alto numero di falsi positivi per determinati termini che possono rientrare nell'uso legittimo del sito web.
Nel 1763 dopo la morte di Thomas Bayes viene pubblicato un articolo illustrante quello che è oggi conosciuto come il teorema di Bayes. Questo teorema negli ultimi anni è diventata la base dei più efficaci filtri antispam in circolazione. Questi filtri si basano, semplificando, su elenchi di termini con le relative probabilità di essere contenuti in messaggi di spam e in messaggi legittimi. In base a queste probabilità è possibile quindi calcolare con relativa certezza se un certo messaggio sia spam o no semplicemente analizzandone il contenuto.
Un esempio di implementazione è dato da PHP Naive Bayesian Filter, una serie di classi da interfacciare con un database MySQL. Alternativamente è possibile interfacciarsi al celebre script in perl Spamassassin via linea di comando.
I filtri bayesiani necessitano di un impegno massiccio nella prima fase della loro implementazione per via del tirocinio da fare per farli funzionare correttamente. Dopo questa fase di apprendimento però i falsi positivi e i contenuti di spam non filtrati tenderanno fortemente a zero.
È difficile che uno spammer desideri espressamente i dati presenti sul vostro sito web. A tal proposito quanto più il sistema che utilizzate per proteggere i vostri dati è personalizzato e non standard tanto più sarà sicuro. Ma di contro, quanto più il vostro sistema sarà sicuro tanto più sarà preso a modello ed imitato. Questo circolo vizioso porta inesorabilmente a continuare la sfida con gli spammer ad aggiungere nuove barriere e aggiornarne di vecchie per impedire che vengano superate.
Guida Yii FrameworkCome creare applicazioni Web in modo semplice e veloce con il... |
Guida Zend FrameworkDiventate professionisti dello sviluppo Web. Zend Framework è lo... |
Guida Applicazioni Facebook con PHPCome realizzare un'applicazione per Facebook. Dalle basi della... |
Ogni lunedì, direttamente nella tua e-mail: script, articoli, guide e tutorial su PHP, MySQL e Apache.
Iscriviti alla newsletter
|
|
Corso PHP per Webmaster11 Giugno 2012 a Milano |
|
|
Corso Google AdWords Base25 Giugno 2012 a Milano |
|
|
Corso Google AdWords Base05 Giugno 2012 a Roma |