Egy irtó hatékony spamszűrő mp4



Hatékony védelem a spam ellen pdf ppt mp4




a spam könyv

http://mo.gyo.ro/

April 2008
M T W T F S S
« Mar   May »
 123456
78910111213
14151617181920
21222324252627
282930  


Spam? Szinte már el is felejtettem mi az...

A szórólap nem spam (?) | Home | facebook profil

2008.04.18.

Nem keverve, szűrve!

A HVG 2008.04.19-ei melléklete a számítógépes adatbiztonságról szól, és a fenti címmel egy cikk a kéretlen elektronikus levelekről is megemlékezik. A megkérdezett szakértők persze most is mondtak néhány meredek állítást.

“… a spamek készítÅ‘i olyan trükköket is bevethetnek, például komolynak tűnÅ‘ szavakkal sépkelhetik meg az üzenetet, amelyek a gépi intelligenciát könnyen megtévesztik – mutat rá a gyenge pontra Fórján Tamás, az internetes védelemmel foglalkozó 2F 2000 Kft. operatív vezetÅ‘je.”

Ez igaz lehet általában véve, de nem a statisztikai szűrők esetében. Ezek ugyanis immunisak a szósaláta támadással szemben.

Nemes Dániel érdekes tételt állított fel: “A felhasználó a sok szemetet mindenképpen észreveszi, de azt a fontosabb bajt nem feltétlenül, hogy nem érkeznek meg fontos e-mail-ek, pedig biztosan elküldték Å‘ket. [...] A másik ok, hogy a legtöbb szűrÅ‘ a Bayes-elvet használja. [...] A spamküldÅ‘k pedig szándékosan olyan szavakat helyeznek el a kéretlen levélben, amelyek a “valódi” levelekre jellemzÅ‘ek. Ez pedig két bajt is okoz: nem csak azt, hogy az ily módon álcázott spameket átengedi a szűrÅ‘, hanem azt is, hogy az önmagát folyamatosan tanító spamszűrÅ‘ adatbázisa megfertÅ‘zÅ‘dik a komoly levélnek látszó spamek szókincsével. E módszerrel hosszas tanítás után is 2 százaléknyi marad a tévesen karanténba helyezett e-mailek aránya.”

Én némileg másképpen látom a dolgot: a statisztikai elv olyannyira sikeres, hogy számos gyártó beépítette a termékeibe. Különben miért tettek volna így? A valószínűségszámítást használó spamszűrők egy olyan képességgel rendelkeznek, amilyennel egyik vetélytársuk sem: képesek megtanulni, hogy az adott felhasználó milyen leveleket szeret, és az ilyen levelekkel nagyon finoman bánnak, így aligha fordulhat az elő, hogy a jó levelek 2%-a a spam karanténban végzi.

Februárban ill. márciusban 2-2 levél került tévesen a spam karanténba, ez 0.17, ill. 0.13%, ~1200 levélbÅ‘l mindössze 2. A helyzet azonban még ennél is jobb, mert nem az üzleti levelezésembÅ‘l került a karanténba 2 levél, hanem az egyik egy hírlevél volt, a másik pedig egy regisztráció visszaigazolása – 2 olyan levél, amit nagyon ritkán kapok, és nem érintett tragikusan, hogy a karanténból kellett visszaállítani.

Az a bizonyos megfertőződés pedig nem túl életszerű elképzelés: egyrészt a statisztikai spamszűrők nagy (>99.5%) pontossággal dolgoznak, így aligha lehet túl sok jó levélnek látszó spam, másrészt ha nagy néha át is csúszik egy spam, akkor azt 1 kattintással semlegesíteni lehet, ha a felhasználó tanítja vele a token adatbázist.

A cikkbÅ‘l kiderül a “biztosnak látszó védekezés is”, a fehérlista. Ehhez csak össze kell írni a levelezÅ‘partnerek címeit, majd a levélszűrÅ‘t úgy beállítani, hogy utasítson vissza minden olyan levelet, amely ismeretlen címzettÅ‘l érkezik. Az új ügyfelek sincsenek kizárva, de Å‘k csak a céges honlap saját e-mailes űrlapjának kitöltésével üzenhetnek.

Ez ugyan jónak tűnik, de a spam ellen aligha védi meg a dolgozókat, hiszen az űrlapon keresztül bárki küldhet spamet, és ehhez még az email címeket sem kell kitalálnia. Ez azért is valószínű lehetÅ‘ség, mert egyre több helyrÅ‘l érkezik hír, hogy a spammerek robot programjai képesk átjutni a népszerű CAPTCHA védelmen, amit pl. a Google vagy a Hotmail is használ. Egy másik probléma ezzel a megközelítéssel az, hogy mit csináljanak a “civil”/egyéni felhasználók, akiknek nincs céges honlapjuk?

Nemes Dániel egy furcsa képzavart vezet be: “Másik irány, hogy a valószínűség-számítással működÅ‘ spamszűrÅ‘ mellé a levelek tartalmát elemzÅ‘ szűrÅ‘t is vásárol az ember”.

Nem akarok túl nagy poént lelőni, de a statisztikai szűrők a tartalomelemző programok csoportjába tartoznak, ugyanis ezek elolvassák a leveleket, és a tartalmuk alapján döntenek felőle. Az meg felettébb különös megoldás, ha az embernek 2 programot is vennie kell egy feldatra. Én azt tanácsolom, próbálj ki egy statisztikai szűrőt, és nem fogod megbánni.

Ha nem elégít ki téged ez a nyúlfarknyi cikk a HVG-ben, és többet akarsz megtudni a spamrÅ‘l, ill. a védekezés lehetÅ‘ségeirÅ‘l, akkor olvasd el a SPAMtelenül című könyvemet, amely remélhetÅ‘leg már a jövÅ‘ héten a boltokba kerül, és amelyben tételesen meg vannak cáfolva ezek az állítások. Ha pedig eljössz a jövÅ‘ héten szombaton a XV. Könyvfesztiválra, akkor a G60-as standon (SZAK Kiadó) 20% kedvezménnyel juthatsz hozzá egy dedikált példányhoz (15:00-16:00 között). Igyekszem majd szépen írni… :-)

2 Responses to “Nem keverve, szűrve!”

  1. Brod said:

    baromsag, ossze teccik keverni a spam szurest a tartalomszuressel – holott a spam szures csak kis szeletkeje a tartalomszuresnek. A leveleket meg nem elolvasni kell, hanem felismerni az adattartalmat – digitalis lenyomat, stb – tessek utana nezni a Websense DSS megoldasanak. Csak egy pelda. Szerveren egy doksi, a tartalomszuro tudja hogy abban a konyvtarban vedendo tartalmak vannak, rendszeresen felolvassa a doksikat, digitalis lenyomatokat keszit beloluk, majd ezeket tarolja. A kifele tarto level (webforgalom, stb) atmegy a szuresen, es ha a level tartalma egyezik bizonyos szazalekokban a lenyomati adatbazisokbol valamivel, akkor blokkol, stb. Tokmindegy hogy mi tortenik a kimeno levelben, fontokat allit hieroglifakra, vagy atrendezi a blokkokat, vagy csak bizonyos reszek kerulnek bele a levelbe, a tartalomszuro meg fogja fogni.

  2. sj said:

    Köszönöm a hozzászólást. Azonban nem értem, hogy jön ide a Websense DSS – ami a filtermax-ról letölthetÅ‘ pdf alapján egy adatszivárgás elleni alkalmazás – miközben itt spamszűrésrÅ‘l van szó? Az egyik alma, a másik körte…

    Nem tudom, mennyire vagy képben az ujjlenyomatok képzése terén, de szerintem az sem igazán működik anélkül, hogy pl. a DSS el ne olvasná a levelet, ill. a dokumentumot.

    Az említett statisztikai spamszűrÅ‘k pedig úgy működnek, hogy elolvassák a levelet, majd eldöntik a tartalom alapján, hogy a levél jó vagy sem. Azt meg nem tudom, hol állítottam, hogy a tartalomszűrés kimerül a spamszűrésben? Tessék egy kissé figyelmesebben olvasni …

Mondd el a véleményed