Uncategorized

Nem keverve, szűrve!

A HVG 2008.04.19-ei melléklete a számítógépes adatbiztonságról szól, és a fenti címmel egy cikk a kéretlen elektronikus levelekről is megemlékezik. A megkérdezett szakértők persze most is mondtak néhány meredek állítást.

“… a spamek készítői olyan trükköket is bevethetnek, például komolynak tűnő szavakkal sépkelhetik meg az üzenetet, amelyek a gépi intelligenciát könnyen megtévesztik – mutat rá a gyenge pontra Fórján Tamás, az internetes védelemmel foglalkozó 2F 2000 Kft. operatív vezetője.”

Ez igaz lehet általában véve, de nem a statisztikai szűrők esetében. Ezek ugyanis immunisak a szósaláta támadással szemben.

Nemes Dániel érdekes tételt állított fel: “A felhasználó a sok szemetet mindenképpen észreveszi, de azt a fontosabb bajt nem feltétlenül, hogy nem érkeznek meg fontos e-mail-ek, pedig biztosan elküldték őket. […] A másik ok, hogy a legtöbb szűrő a Bayes-elvet használja. […] A spamküldők pedig szándékosan olyan szavakat helyeznek el a kéretlen levélben, amelyek a “valódi” levelekre jellemzőek. Ez pedig két bajt is okoz: nem csak azt, hogy az ily módon álcázott spameket átengedi a szűrő, hanem azt is, hogy az önmagát folyamatosan tanító spamszűrő adatbázisa megfertőződik a komoly levélnek látszó spamek szókincsével. E módszerrel hosszas tanítás után is 2 százaléknyi marad a tévesen karanténba helyezett e-mailek aránya.”

Én némileg másképpen látom a dolgot: a statisztikai elv olyannyira sikeres, hogy számos gyártó beépítette a termékeibe. Különben miért tettek volna így? A valószínűségszámítást használó spamszűrők egy olyan képességgel rendelkeznek, amilyennel egyik vetélytársuk sem: képesek megtanulni, hogy az adott felhasználó milyen leveleket szeret, és az ilyen levelekkel nagyon finoman bánnak, így aligha fordulhat az elő, hogy a jó levelek 2%-a a spam karanténban végzi.

Februárban ill. márciusban 2-2 levél került tévesen a spam karanténba, ez 0.17, ill. 0.13%, ~1200 levélből mindössze 2. A helyzet azonban még ennél is jobb, mert nem az üzleti levelezésemből került a karanténba 2 levél, hanem az egyik egy hírlevél volt, a másik pedig egy regisztráció visszaigazolása – 2 olyan levél, amit nagyon ritkán kapok, és nem érintett tragikusan, hogy a karanténból kellett visszaállítani.

Az a bizonyos megfertőződés pedig nem túl életszerű elképzelés: egyrészt a statisztikai spamszűrők nagy (>99.5%) pontossággal dolgoznak, így aligha lehet túl sok jó levélnek látszó spam, másrészt ha nagy néha át is csúszik egy spam, akkor azt 1 kattintással semlegesíteni lehet, ha a felhasználó tanítja vele a token adatbázist.

A cikkből kiderül a “biztosnak látszó védekezés is”, a fehérlista. Ehhez csak össze kell írni a levelezőpartnerek címeit, majd a levélszűrőt úgy beállítani, hogy utasítson vissza minden olyan levelet, amely ismeretlen címzettől érkezik. Az új ügyfelek sincsenek kizárva, de ők csak a céges honlap saját e-mailes űrlapjának kitöltésével üzenhetnek.

Ez ugyan jónak tűnik, de a spam ellen aligha védi meg a dolgozókat, hiszen az űrlapon keresztül bárki küldhet spamet, és ehhez még az email címeket sem kell kitalálnia. Ez azért is valószínű lehetőség, mert egyre több helyről érkezik hír, hogy a spammerek robot programjai képesk átjutni a népszerű CAPTCHA védelmen, amit pl. a Google vagy a Hotmail is használ. Egy másik probléma ezzel a megközelítéssel az, hogy mit csináljanak a “civil”/egyéni felhasználók, akiknek nincs céges honlapjuk?

Nemes Dániel egy furcsa képzavart vezet be: “Másik irány, hogy a valószínűség-számítással működő spamszűrő mellé a levelek tartalmát elemző szűrőt is vásárol az ember”.

Nem akarok túl nagy poént lelőni, de a statisztikai szűrők a tartalomelemző programok csoportjába tartoznak, ugyanis ezek elolvassák a leveleket, és a tartalmuk alapján döntenek felőle. Az meg felettébb különös megoldás, ha az embernek 2 programot is vennie kell egy feldatra. Én azt tanácsolom, próbálj ki egy statisztikai szűrőt, és nem fogod megbánni.

Ha nem elégít ki téged ez a nyúlfarknyi cikk a HVG-ben, és többet akarsz megtudni a spamről, ill. a védekezés lehetőségeiről, akkor olvasd el a SPAMtelenül című könyvemet, amely remélhetőleg már a jövő héten a boltokba kerül, és amelyben tételesen meg vannak cáfolva ezek az állítások. Ha pedig eljössz a jövő héten szombaton a XV. Könyvfesztiválra, akkor a G60-as standon (SZAK Kiadó) 20% kedvezménnyel juthatsz hozzá egy dedikált példányhoz (15:00-16:00 között). Igyekszem majd szépen írni… :-)