Trasparenza, Glasnost, Transparency

Filtri Bayesiani

Data: 16 ott 2003


Sito on line dal 2003
Home page
email
Chi sono
Translation
ℐ filtri bayesiani sono basati sulla regola di Bayes, descritta esaurientemente dalla Stanford enciclopedia o in italiano da una semplice spiegazione. Permettono il calcolo della probabilità che un testo ricevuto sia di un certo tipo, per esempio spam, basandosi sui messaggi ricevuti in precedenza e classificati da un essere umano.

Innanzi tutto si suppongono le parole del testo indipendenti, cosa non vera ma che da buoni risultati pratici, il messaggio:
X = [x1, ... ,xn]
viene trattato come un vettore di v.a. (variabili aleatorie) indipendenti ed equidistribuite, ogni v.a. ha come realizzazione una parola del vocabolario. Dall'indipendenza segue che (considero l'evento spam):
P[ X = spam | X=(a1, ... ,an) ] = ∏i P[ X = spam | ai = xi]
Le ai sono semplicemente le parole del messaggio ricevuto. A questo punto si applica la regola di Bayes:



                         P[ ai = xi | X = spam ]
P[ X = spam | ai = xi] = ------------------------ * P[ X = spam ]
P[ai]
Si applica la teoria frequentista e si calcolano le frequenze delle parole contenute nei messaggi riconosciuti dall'utente come spam:
P[ ai = xi | X = spam ] = frequenza della parola ai in 
tutti i messaggi di spam
Le frequenze delle parole a priori si possono trovare facilmente:
P[ai] = frequenza a priori della parola ai Le frequenze dei messaggi di spam sono banalmente cacolabili:
P[ X = spam ] = frequenza dello spam
Credo che il mio procedimento sia corretto e che almeno sia una spiegazione didattica. Il procedimento usato per esempio da Thunderbird che usa i filtri bayesiani non lo conosco ma l'argomento mi ha incuriosito.



Non dimenticatevi di mettere la vostra opinione: scrivete il commento, premete "Inserisci" e il commento è immediatamente pubblicato: grazie!






Altri testi sullo stesso argomento li trovate elencati di seguito sotto l'argomento Matematica

Diaspora* button
-
Facebook button
0
Twitter button
-
Google+ button
0
LinkedIn button
0
TzeTze button
voti: 0
Data: 16 ott 2003
Letture di questo articolo: 3410
argomento: Matematica, articoli: Anonymous Remailer (GnuPG e la posta elettronica), Palladium, Cifrario matriciale, Nozioni di Crittografia, La precisione dei sondaggi, Sondaggi, Informazione di una Password

argomento: Spam, articoli: APEWS (la Black List)

argomento: Internet, articoli: Fiorello Cortiana (partito dei Verdi), L'arrivo dei Barbari, Internet via GPRS con Linux, Chiavetta Edge per Linux, Google Sidewiki, Cyperpunks, Backup sul Cloud

argomento: Thunderbird, articoli: Avatar, Le news su Thunderbird: seguire le discussioni








Firefox: Riprenditi il web




Statistiche Europee d'uso dei browser 21/11/2018 :
Chrome...68%
Firefox..12%
Safari...6%
IE.......5%

Fonte: StatCounter

Borsa valori della moneta Bitcoin (21/11/2018):

prezzo di 1 bitcoin:
BTC 3982.04 €
LTC 29.62 €
IOTA 0.28 €


Fonte: coinmarketcap.com

Sostieni Wikileaks!
Se hai qualche bitcoin fai una donazione a wikileaks all'indirizzo:
1HB5XMLmzFVj8ALj6 mfBsbifRoD4miY36v

Queste sono le donazioni fatte fin'ora: 4043 bitcoin.




L'intero sito kensan.it ha avuto questi Share:

facebook: 8654
twitter: -
google+: 0
linkedIn: 0




IL TUO 5 PER MILLE PER GLI OSPEDALI DI EMERGENCY codice fiscale:
971 471 101 55




Uomo di Cheddar di 9'000 anni fa

Inglese di 9 mila anni fa ricostruito in base al DNA del Cheddar man il cui scheletro completo e ben conservato e stato ritrovato in Gran Bretagna. Aveva la pelle scura e gli occhi azzurri in base al DNA.

L’Uomo di Cheddar era un Homo Sapiens, era alto 166 centimetri e quando morì era intorno ai 20 anni. Faceva parte di una popolazione di cacciatori-raccoglitori, era intollerante al lattosio e agli amidi, aveva un sistema immunitario che lo difendeva da molte malattie. Quest'uomo è distante da noi solo 450 generazioni.

Lo spagnolo Uomo di La Braña, analogo a questo (pelle scura e occhi azzurri), era distante da noi solo 350 generazioni (7 mila anni).

Fonte: Nature
kensan logo Licenza Creative Commons 3.0
I miei testi sono sotto la Licenza "Creative Commons 3.0 Italia": se sei interessato a pubblicare i miei articoli leggi le note aggiuntive (Licenza di kensan.it) dove troverai anche le attribuzioni dei diritti per tutte le immagini pubblicate.
Questo sito memorizza sul tuo pc uno o più cookie di tipo tecnico, leggi l'informativa estesa.
Kensan geek site

e-mail
e-mail cifrata