Egy irtó hatékony spamszűrő mp4



Hatékony védelem a spam ellen pdf ppt mp4




a spam könyv

http://mo.gyo.ro/

January 2008
M T W T F S S
« Dec   Feb »
 123456
78910111213
14151617181920
21222324252627
28293031  


Spam? Szinte már el is felejtettem mi az...

2008.01.24.

Az én adóforintjaimat ne add a Microsoft-nak!

Arról hallani egy ideje, hogy a magyar állam kb. 25 milliárd forintot készül a Microsoft-nak adni, hogy meghosszabbítsa az oktatásban résztvevők campus licenceit. Ez azért probléma, mert azért eléggé felháborító egy közbeszerzést egy bizonyos gyártóra kiírni, és különösen felháborító abban az esetben, ha közben az állam az én nadrágszíjamat szorosabbra húzza, mert ugye megszorítások vannak.

Szerencsére 3 hazai cég, akik szintén szoftverben utaznak, megtámadták ezt a meglehetősen ostoba (abba most ne menjünk bele, hogy vajon melyik korrupt politikust vette meg kilóra a Microsoft) és pazarló döntést. Azt követelik ugyanis, hogy az állam ne kivételezzen a Microsoft-tal, hanem legyen egyenlő feltétel, legyen verseny (ami köztudottan lefelé kényszeríti az árakat).

A problémát (és a költséget) csak fokozza, hogy a Windows Vista eléggé erőforrás igényes jószág, ami azt jelenti, hogy az iskolákban használt gépek jó részét le kell cserélni újabbra és drágábbra.

Megoldás persze van: a nyílt forrású termékek, pl. Linux és OpenOffice.org. Ezek előnye az is, hogy 0 forintért telepítheti ezeket a rendszergazda, nem fog érte kötekedni (ha jobban tetszik: ugatni) a BSA. Ha pedig valaki még fél a Linux-tól, akkor azt is megteheti, hogy fenn hagyja a Windows XP-ket, és arra telepíti a nyílt forrású irodai csomagot, amíg meg nem barátkozik vele. Egyébként ma már olyan Linux terjesztések is vannak, amelyeknek még a telepítőjük is teljesen grafikus, vezetik az ember kezét.

Szóval kedves döntéshozó, aki eme sorokat olvasod, ne költsd az én adóforintjaimat a Microsoft termékeire! Legyen egy kis eszed, és gondolkozz, hogy a fejlettebb világ kormányai, városai miért állnak át Linuxra: ár, függÅ‘ség és kiszolgáltatottság felszámolása, stabilitás, biztonság, … és nem utolsó sorban azért, mert ott el kell számolni a közpénzekkel. Ott ugyanis válaszolni kell arra a kérdésre is, hogy 2 hasonló tudású termék esetén miért adtál [egy vagon] pénzt az egyikre, miközben ugyanazt a funkcionaliást a másik teljesen ingyen nyújtja?

clapf adatbázis konszolidáció

Minden adatbázis háttér esetén az egyes tokenekhez egy időbélyeget is tárolok. Minden alkalommal, amikor a spamszűrő átnéz egy levelet, akkor a spam valószínűség kiszámítása után a levélben szereplő tokenek időbélyegét is frissíti. Ennek az a haszna, hogy idővel kiderül, hogy melyek a valóban fontos és használt tokenek, a többitől pedig meg lehet szabadulni egy törléssel. Ez azzal a haszonnal jár, hogy a token adatbázis mérete a szükséges minimumon tartható úgy, hogy a pontosság sem szenved csorbát.

A saját adatbázisomon ki is próbáltam ezt az optimalizálást. A jelenlegi adatbázis mérete 2.44 MB és 137k tokent tartalmazott. Törlés után pedig 54k token maradt benne, és ~870kB lett a mérete.

A törlés során megszabadultam az összes olyan tokentől, amelyiket:

  • 15 napja nem használtam, és csak 1 ham vagy 1 spam levélben szerepelt
  • 60 napja nem használtam, és legfeljebb 5 levélben szerepelt (2*ham+spam)
  • 90 napja nem szerepelt egy beérkezÅ‘ levélben sem

A pontosság olyannyira nem csökkent, hogy az összes decemberi spamet helyesen azonosította. Emellett a TUM tanítást is átgondoltam, mert az eddigi kicsit nem ügyes volt. Ezért a clapf akkor tanul meg egy levelet, ha

  • azt spamnek hiszi, de a spam valószínűsége 0.99 alatt van
  • a levél ham, de a spam valószínűsége 0.1 fölött van
  • a levél az aknamezÅ‘ címre érkezett, és nem ismerte fel spamként

Az új feature egyelőre a nightly build-ben szerepel. Ha már használod a clapf spamszűrőt, ne felejtsd el elolvasni a Changelog-ot!