
|
|
|||||||||
![]() I filtri bayesiani sono basati sulla regola di Bayes, descritta esaurientemente dalla Stanford enciclopedia o in italiano da una semplice spiegazione. Permettono il calcolo della probabilità che un testo ricevuto sia di un certo tipo, per esempio spam, basandosi sui messaggi ricevuti in precedenza e classificati da un essere umano. Innanzi tutto si suppongono le parole del testo indipendenti, cosa non vera ma che da buoni risultati pratici, il messaggio: X = [x1, ... ,xn]viene trattato come un vettore di v.a. (variabili aleatorie) indipendenti ed equidistribuite, ogni v.a. ha come realizzazione una parola del vocabolario. Dall'indipendenza segue che (considero l'evento spam): P[ X = spam | X=(a1, ... ,an) ] = ∏i P[ X = spam | ai = xi]Le ai sono semplicemente le parole del messaggio ricevuto. A questo punto si applica la regola di Bayes: P[ ai = xi | X = spam ]Si applica la teoria frequentista e si calcolano le frequenze delle parole contenute nei messaggi riconosciuti dall'utente come spam: P[ ai = xi | X = spam ] = frequenza della parola ai inLe frequenze delle parole a priori si possono trovare facilmente: P[ai] = frequenza a priori della parola ai Le frequenze dei messaggi di spam sono banalmente cacolabili: P[ X = spam ] = frequenza dello spamCredo che il mio procedimento sia corretto e che almeno sia una spiegazione didattica. Il procedimento usato per esempio da Thunderbird che usa i filtri bayesiani non lo conosco ma l'argomento mi ha incuriosito. Altri testi sullo stesso argomento li trovate elencati di seguito sotto l'argomento Matematica
|
![]() Firefox è stato scaricato (07/07/2010): 1 miliardo 312 milioni 797 mila 758 volte Statistiche Europee d'uso dei browser 04/02/2012 : Firefox..31% IE.......31% Chrome...28% Fonte: StatCounter Borsa valori della moneta Bitcoin (03/02/2012): prezzo di 1 bitcoin: 4.52 € Fonte: Bitmarket.eu Sostieni Wikileaks! Se hai qualche bitcoin fai una donazione a wikileaks all'indirizzo: 1HB5XMLmzFVj8ALj6 mfBsbifRoD4miY36v Queste sono le donazioni fatte fin'ora: 2230 bitcoin. Magliette e Merchandise di Wikileaks e di Julian Assange. Gattina deliziosa cerca casa in zona Caserta Post con immagine e indirizzo della micina sul social network Diaspora*
IL TUO 5 PER MILLE PER GLI OSPEDALI DI EMERGENCY codice fiscale: 971 471 101 55 |
|||||||||
|
argomento: Matematica, articoli: Anonymous Remailer (GnuPG e la posta elettronica), Palladium, Cifrario matriciale, Nozioni di Crittografia argomento: Spam, articoli: SPEWS (la Black List) argomento: Internet, articoli: Internet via GPRS Aggiornamento, Internet via GPRS, Spedire la posta con Telnet (di ViCisLAcK), Censura (bavaglio alla rete delle reti), Internet di una volta, Configurare una Internet key, Nastro per pagine web argomento: Thunderbird, articoli: Avatar |
||||||||||
|
||||||||||
|
||||||||||