Gli svantaggi di bayesiano Filtro posta indesiderata

September 28

Gli svantaggi di bayesiano Filtro posta indesiderata


Con la posta elettronica arriva lo spam, fastidiosi annunci pubblicitari non richiesti inviati alla tua casella di posta. I primi filtri anti-spam affidamento su regole, come ad esempio "filtrare messaggi di posta elettronica che contengono le parole 'click'." Ma per ogni regola che potrebbe essere scritto, alcuni spammer intelligente ha trovato un modo intorno ad esso. Ad esempio, gli spammer potrebbero intenzionalmente errori ortografici parole, come la scrittura 'c1ick' invece di 'click', rendendo la regola di filtraggio inutile. L'aggiunta di filtraggio bayesiano, tuttavia, ha permesso programmi anti-spam per adattarsi alle caratteristiche mutevoli di spam.

Filtraggio bayesiano utilizza Probabilità

Bayesiano filtraggio dello spam ha un approccio probabilità. Si cataloga le parole e le altre caratteristiche predefinite di spam ed e-mail non spam ricevuti dall'utente. Quando arriva una nuova email, il filtro esegue la scansione per queste parole e le caratteristiche. Le più parole la nuova e-mail ha in comune con le parole si trovano nello spam precedente, più è probabile che la nuova e-mail saranno contrassegnati come spam dal filtro bayesiano.

Filtri Bayesiani imparare e adattarsi

L'approccio Bayesiano permette il filtro per "imparare" come le caratteristiche del cambiamento spam. In un primo momento, potrebbe perdere lo spam che ha l'errata "c1ick", per esempio. Ma come l'utente indica che la posta elettronica come spam, il filtro inizierà l'assegnazione di una maggiore probabilità che altre e-mail che contengono quella parola sono spam.

formazione necessaria

filtraggio Bayesiano è molto efficace, ma uno svantaggio è che il filtro deve essere "addestrato." In un primo momento, il database di e-mail è piccolo e l'utente deve continuare a segnare la posta in arrivo come "spam" al fine di "treno" del filtro. Gli utenti che ricevono un basso volume di e-mail dovranno aspettare più a lungo per stabilire una base di dati adeguata.

Avvelenamento bayesiano

Un altro svantaggio è che gli spammer continuano a cercare nuovi modi per "veleno" o ingannare i filtri in marcatura spam e-mail valido. Ad esempio, gli spammer potrebbero includere un blocco di testo normale da un libro o un sito web, nel tentativo di avere un'alta percentuale di parole "buoni" nella e-mail. Per fortuna, questo può essere limitato l'efficacia, perché il filtro Bayesiano definisce "buona e-mail" in modo diverso a seconda del database si costruisce di e-mail di ogni singolo utente.