Anti Spam — Сборник ссылок на антиспамерские программы и краткое описание используемых антиспамерских техник.
Ведется c 2002 г Андреем Черезовым с помощью добровольцевДля занятых: испытал в реальной работе очень многие программы (серверные и клиентские), однозначно рекомендую PopFile и SpamProtexx. См. также AntiSpamNews.
Виды антиспам-защиты, и решение для почтового сервера Eserv (SMTP)
- EservAntiSpam — статья на нашем сайте
- См. также http://www.paulgraham.com/stopspam.html
Обучаемые фильтры, основанные на статистическом анализе текста с применением теоремы Байеса (или Бейеса подают наибольшие надежды на избавление от спама
- Теория: [mlg]: Paul Graham's anti-spam idea, its discussion, русское описание
- StatisticalSpamFiltering — статья о статистических фильтрах на нашем сайте
- Решение от самого ESR: http://www.tuxedo.org/~esr/bogofilter/ (Unix)
- BayesianSpamFilteringSoftware — большой список...
- http://popfile.sourceforge.net/ — PopFile — быстро "взлетевший" на SourceForge проект (с 2002г): использует ту же теорему Байеса, что и BogoFilter, но написан на Perl, имеет версию для Windows, работает как POP-proxy, и более универсален (не только для фильтрации спама, а для сортировки почты вообще — авто-классификации по заданным темам). Последние месяцы я использую именно PopFile, ОЧЕНЬ доволен До этого пробовал перечисленные ниже, особенно долго SpamAssassin. Авторы PopFile дали также хорошее описание теории — здесь (вместе с портретом математика и здесь ([~ac])
- EservPopFile — PopFile plugin для Eserv/3
- SpamProtexx — новый (2005) отечественный байесовый классификатор.
- http://www.upserve.com/spammunition/default.asp — Add-in для Outlook 2000
- http://www.hotpile.com/?id=49 — VB скрипт для Windows
- http://www.fourmilab.ch/annoyance-filter/ — консольная программа для Windows, годится для почтовых серверов
- (MaxWolf 19.05.2003): http://www.spampal.org/ — сам по себе spampal фильтрует по куче (настраиваемой) разных DNSBL-ей, но, помимо этого, у него него есть механизм плагинов, в рамках которого добрые люди написали плагин байесовского фильтра http://www.status3.i-r.co.uk/bayesian.htm Вместе с плагином, позволяющим фильтровать по регулярным выражениям (его можно найти на http://www.spampal.org/plugins.html) эта штука является, на мой взгляд, самым мощным, удобным, эффективным и простым в установке и настройке средством фильтрации спама под Win32 платформы. (комментарий [~ac] см. ниже)
- Mozilla 1.4 теперь имеет встроенный Bayesian spam filtering
- AnnoyanceFilter
Программы, использующие "хи-квадрат вероятности"
- SpamBayes (см. также ChiSquaredDistribution)
- PopFile (с сентября 2003)
Популярные программы фильтрации спама на почтовых серверах Unix
Менее популярные, тоже для Unix
- http://www.paganini.net/ask/ — ActiveSpamKiller — реализует популярную в последнее время идею (мне она нравится всё меньше : "This one works by holding mail from unknown addresses hostage, sending them a response and asking for confirmation. When confirmation is received, the mail is delivered and the sender added to a list so all subsequent mail from them will be delivered immediately." Т.е. робот не сразу принимает письмо от неизвестного ранее отправителя, а "вступает с ним в переписку". Отправитель должен подтвердить своё намерение доставить письмо, тогда это и последующие его письма пройдут без проблем (включается в белый список). Предполагается, что спамер либо использует несуществующий или чужой обратный адрес, либо просто не станет заниматься подтверждением миллиона писем Вот только что делать тому человеку, от чьего имени (email точнее) поспамил спамер — он получит тонны запросов на подтверждение (если идея подтверждений приживется на многих компьютерах)... Впрочем этот несчастный пострадает в любом случае — даже от незащищенных систем ему прийдет много почты — с сообщениями о невозможности доставки (отсутствует адрес и т.п.). Написано на Python. См. также SpamRipper и WinAntiSpam ниже — используется та же идея. 30.11.2003 поступила информация о том, что km.ru использует ту же идею (реализация e-Style ISP).
- http://tmda.net/ — TaggedMessageDeliveryAgent — еще на ту же тему. Написано на Python. http://sourceforge.net/projects/tmda
- http://www.rhyolite.com/anti-spam/dcc/ — DistributedChecksumClearinghouse Есть онлайновое демо, где можно проверить, какие спам-оценки выставляет система конкретным письмам (письмо отправляется через форму на странице): http://www.rhyolite.com/cgi-bin/dccproc-demo
Для почтовых клиентов Windows (конкретно для MS Outlook)
- Для PopFile есть plugin для Outlook (см. страницу PopFile)
- http://www.cloudmark.com/products/spamnet/overview/ — SpamNet — работает подобно DistributedChecksumClearinghouse, но с клиентских компьютеров.
- http://www.spampal.org/ — эта программа подсказана рассылкой с http://bugtraq.ru/. Для Windows. Работает, как и popfile, в виде POP3-proxy. Но для отсева спама использует разные DNSBL. По моему опыту (использую такую блокировку как фильтр в Eserv/3), это отсевает лишь небольшую часть спама (по моему опыту — около 10%, по [другим данным|http://www.nwfusion.com/research/2001/0910feat.html] 24% — в общем мизер), т.к. блокировать новые открытые релеи быстро не успевают. PopFile (см. ниже) сильнее этой программы по многим параметрам. 21.03.2003: Не верьте [статье уважаемого автора|http://www.runet.ru/analitika/2663.html], SpamPal не панацея. Хотя наличие русской версии — это, конечно, хорошо (MaxWolf 19.05.2003): — Да, лучше не верить, а проверить самому. Только не забыть поставить Bayesian Plugin и RegEx Filter (см. комментарии MaxWolf выше). [~ac]: А потом поставить POPfile, и сравнить . MaxWolf: И всё же, SpamPal в кооперации с Bayesian plugin (расширение для интеллектуального вероятностного опознавания спама) действует очень эффективно. На мой взгляд, отпадает даже необходимость в осуществлении запросов в какие-то сетевые базы данных спамерских адресов и релеев.
- http://www.spamripper.com/ — SpamRipper, как и ActiveSpamKiller, просит подтверждения у неизвестных отправителей. Свежая программа — сайт в разработке, цена неизвестна.
- http://www.winantispam.com/ — WinAntiSpam — российская программа. Принцип тот же, что и у ActiveSpamKiller и SpamRipper — запрос подтверждения у отправителя. Мне вот иногда приходится слать подтверждения за своего робота php@eserv.ru — иначе те клиенты, которые работают с магазином и форумом у нас на сайте, и при этом используют WinAntiSpam, не получают важные извещения с нашего сайта В общем, не всё складно в этой идее...
- (12.03.2006) http://sentry.com.ru/ — MailBox Sentry — российская программа. Тоже "запрос/ответ", но авторы считают свою реализацию более "идеологически правильной".
- http://rus.spamliquidator.com/ — SpamLiquidator — еще одна новая российская программа, использующая не новые, не самые эффективные идеи... Аналог DistributedChecksumClearinghouse.
Решение для случаев, когда нужен временный самоуничтожаемый Email для указания в "публичных местах"
- http://spamgourmet.org/ — там можно завести адрес, который после получения (и переправки вам) указанного количества писем самоудалится, и спамеры, даже достав этот адрес, не смогут вам досаждать более указанного к-ва раз
- http://www.spamgourmet.com/ — это тоже он. Уже есть русская версия сайта "СпамГурман".
Эти господа заплатили Google за рекламу их линков по слову "spam"
- http://eliminatespam.com/ — фильтр для Outlook
- http://www.gfi.com/mes/ — GFiMailEssentials — фильтр для SMTP-серверов под Windows
Базы данных спамерских IP (и открытых релеев), спамерских доменов и производителей спам-софта
- http://ordb.org/
- http://mail-abuse.org/
- http://dnsbl.org/
- http://spamsites.org/
- ... Эффективность большинства баз низкая, т.к. ip блокируются пост-фактум: уже после массовой рассылки кто-нибудь "доносит" на спамера (не обязательно человек, это могут быть и роботы ящиков-ловушек), и его ip блокируется на будущее. Но тем не менее какую-то долю почтового трафика сэкономить серверу способны. См. RBL, OpenRelay.
"Авторизация" домена отправителя
- SenderPolicyFramework (поддерживается в Eserv/3 с марта 2004)
- MS CallerID (поддерживается в Eserv/3 с марта 2004)
- YahooDomainKeys (поддерживается Eserv/3 с мая 2004)
HashCash
В связи с приближением "конца света" (завершения эпохи надежной доставки Email) можно еще раз подумать о "жизни после смерти" — моё мнение см. в HashCashСм.также (прочие интересные ссылки по Anti-Spam)
- http://www.paulgraham.com/spam.html — описание байесовых фильтров
- http://www.paulgraham.com/falsepositives.html — почему другие антиспамовые техники хуже
- http://www.paulgraham.com/wfks.html
- http://www.nwfusion.com/research/2001/0910feat.html
- http://directory.google.com/Top/Computers/Internet/Abuse/Spam/Filtering/
- http://messagewall.org/ (SMTP-прокси с антиспамерскими функциями)
- http://www.geocities.com/spamresources/filter-server-apps.htm
- EmailValidation
- http://www.maillist.ru/antispam.shtml
- http://www.mailinfo.ru/forum/index.php?act=ST&f=3&t=226
- Ложные срабатывания спам-фильтров
- Anti-Spamming Tips and Resources
- http://www.antispam.ru/
- http://www.computerra.ru/compunity/femida/24671/
- http://antispam.altnet.ru/ — антиспамерский манифест и способы юридической борьбы
- http://www.osios.org/ — спамерский манифест
- http://www.drbl.croco.net/faq.html — русский RBL
- TarProxy
- Symantec's New Tack to Fighting Spam — тоже маются без статистических фильтров
- http://www.spamtest.ru/ — онлайновый сервис фильтрации спама. На базе того же ядра работает и Kaspersky Anti-Spam
- http://antialc.narod.ru/ — Центр Борьбы с Центром Американского Английского (ALC) (одним из самых назойливых спамеров, если кто не в курсе
- http://www.cio-world.ru/offline/2003/12/24048/ — статья с оценками ущерба от спама и выгод прямого маркетинга
- "Серые списки", http://projects.puremagic.com/greylisting/
- GreyListing
- EservAntiSpam
- AntiSpamNews
- О спаме с точки зрения 'дерррской дивченки' :)
- http://www.spamsoap.com/
- http://wecanstopspam.org/
- http://www.compulenta.ru/news/story213/
- http://spamlinks.net/
- http://www.sapronov.com/ru/cabinet/spfltr/ (для Eserv/2)
- Проекты оплаты за Email
- Конец сетевой вольницы и андерграунда. Интернет на пороге перемен
- http://www.declude.com/
Google index c 11.09.2003 по 10.01.2004
- spamassassin.org 4000 -> 2570 (-36% !)
- rhyolite.com 1210 DCC -> 1250 (+ 3%)
- eserv.ru 446 (наш сайт просто для сравнения, мы не разрабатываем свой antispam -> 672 (+50%)
- popfile.sourceforge.net 329 -> 439 (+33%)
- spampal.org 252 -> 307 (+21%)
- spambayes.sourceforge.net 124 -> 201 (+62%)
- spamliquidator.com 7 -> 47 (+571%)
- winantispam.com 3 -> 6 (+100%) GoogleIndex вычисляется через ForthWiki:GoogleApi (SOAP)