Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Software (программное обеспечение) (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=107)
-   -   Программы для защиты от спама (http://www.aspirantura.spb.ru/forum/showthread.php?t=2637)

McLaud 24.08.2003 22:58

Программы для защиты от спама
 
Ну, простое "англ" в комбинациях режет и нормальные письма, тоже пробовали.
Регулярные выражения - это дело, но я в OutLooke не знаю как и куда их писать, только на РНР знаю (Может кто подскажет на конкретном примере?)
У них там телефон указан, вот тогда если убрать все что в заголовке или тексте содержит выражение типа *1*5*4*2*2*7*1*, где * - один-два пробела или тире или ничего, то тогда должно сработать.
Мне кажется, что надо именно телефоны искать, а не текст. Тогда это конкретно только на этого спамера будет. А вероятность появления чего подобного в нормальном письме будет - как авиакатастрофы.

Цитата:

работает по методу bayesian filter
По Байесу, млин... Помню, было дело... Деконволюция по Байесу - тоже хорошая штука. Видать умный был Байес.
Посмотрю. Спасибо.

Короче, у кого ума палата, напишите регулярное выражение с телефоном, а? Чего словеса разводить...

Цитата:

Получается, что самое ценное - это правила для стоп-листа
Да я давно согласная, что это самое ценное!
Дак и цитани свой стоп-лист, если опыт положительный, не будь жадной девочкой.
Если не будешь жадной девочкой, то вот тебе подарок:
http://mclaud.by.ru/presents/present2.html
А Эслера я не люблю, он глуповат на мой вкус и совсем неученый. А я ученых люблю.

Цитата:

И за 3 года пользования интернетом рекламных писем приходило максимум 8-10. Все в период последних месяцев, когда я разместил в интернете свои резюме.
Где разместил-то? Дай почтать, чего ученые про себя пишут.
Если бы в известном месте разместил, то тут же тебя бы и сосчитали.

lynx 25.08.2003 00:01

Программы для защиты от спама
 
Цитата:

один-два пробела или тире или ничего, то тогда должно сработать.
Вот регесп для:

Одна или несколько цифр,
за которыми идет ноль или несколько пробелов
или тире:


\d+((\s*)|(-))






Добавлено


А вот то же самое, только все это:

один или более раз: (Одна или несколько цифр,
за которыми идет ноль или несколько пробелов
или тире)


{1(\d+((\s*)|(-))),}




Кошки сами писали

Добавлено


Цитата:

цитани свой стоп-лист, если опыт положительный, не будь жадной девочкой.
Я про Амеркан цитанула, а остальное - у Экслера брала :)

Еще у меня стоит как регеспы по теме:

Цитата:

Symantec AVF detected*
Undeliverable Message*
DrWeb-DAEMON*
рассылк*
почтов*
магаз*
*купить*

По заголовкам как "любая строка найдена":

Цитата:

Гражданство
Предлагаем
санаторий
Турфирма
friend
ИTAЛ
Money
Business
офис
в и з и т к и
курсы
Meet people who want to meet you
работа
оптом
DVD
салон
продажа
руководителю
продается
ремонт
кредит
услуги
маркетинг
обучение
Бизнес
Free
бесплатно
patch
офис
аренд
Доставка
тамож
груз
заказ
полиграф
new mail
КВАРТИР
КОМАР
СОТОВ
семинар
НОВИНКА
Заказ
продаю
Хотите
Интернет
Обмен ссылками
Визитки
бархатный сезон
Туры
Thank you
предлагаем
Your application
Details
movie
Your details
screensaver
Кoндицuoнеpы
РЕКЛАМА
Но, надо признать, поскольку я руками вношу все это, часто повторы и неэффективно все, то есть можно все сократить, да так оно добавляется потихоньку, а сократить, написан рег. выражение руки не доходят, к тому же анализ быстро идет - время на анализ не критично, хоть сто строк хоть пять, примерно одни и то же время.

Пока я с вами болтала, мне юниксоиды регесп мой оптимизнули, последний вариант можно записать как:

(\d+((\s*)|(-)))+

Что аналогично

{1(\d+((\s*)|(-))),}

Цитата:

Фильтры по темам и/или заголовкам плохи тем, что их нужно постоянно дополнять, причем _думать_ над этим. П
Бяда... А что делать :)

Jacky 25.08.2003 02:12

Программы для защиты от спама
 
lynx
Цитата:

Бяда... А что делать
Да я уже вижу, что легких путей тут не ищут. Можно, конечно, поставить какой-нибудь анализатор, тот же POPFile и расслабиться, а можно сурово писать регэкспы а потом их оптимизировать. Фильтры руками править, опять же. Каждому свое. Мне в самом деле лень -- бо занятие малоинтересное.

McLaud 25.08.2003 05:33

Программы для защиты от спама
 
Спасибо.
Только я совсем не врубился, куда это писать все надо?
То есть к чему
(\d+((\s*)|(-)))+
присобачивать?
Это же на Перле так?
Или как?

Dubrovsky 25.08.2003 06:02

Программы для защиты от спама
 
Banned

DrVatson 25.08.2003 08:03

Программы для защиты от спама
 
banned

lynx 25.08.2003 14:09

Программы для защиты от спама
 
McLaud

Цитата:

к чему
(\d+((\s*)|(-)))+
присобачивать?
Это же на Перле так?
Нет, это на регекспе - Unix regexp

Писать надо лол... в стоп лист, если он у Вас понимает рег. выражения.

Я пишу рег. выражения в текстовый файл. По одному выражению в строку. Потом этот файл подключается к Бату (The_bat).


Jacky 13.09.2003 13:59

Программы для защиты от спама
 
Возвращаясь к истокам темы, еще немного о защите от спама. Для тех, кто не решил проблему, но колеблется в выборе варианта (или просто не знает, какие возможны варианты кроме бесполезного записывания обратных адресов спамеров, практически всегда фальшивых, в стоп-лист почтовой программы.

Итак, статистика работы POPFile с 23 августа по сегодняшний день.

Классифицированные письма: 766
Ошибки классификации: 1
Точность: 99.86%

На возможный комментарий типа "а, она все-таки ошиблась" отмечу, что здесь нет ничего страшного. Одно пропущенное спам-сообщение за 22 дня, вполне нормально. Более того, принцип работы байес-фильтра таков, что в будущем подобных ошибок больше не будет. В данном случае спамеру удалось придумать какой-то нестандартный ход, позволивший письму пройти сквозь фильтр, но теперь все письма подобного типа будут однозначно отфильтрованы. В этом и прелесть программы, она не просто использует фиксированный набор правил, а учится на каждой своей ошибке, совершенствуя защиту.

Линк на POPFile я давал на первой странице этой темы.

Philosof 30.04.2004 18:46

Программы для защиты от спама
 
Должен сказать, что за последнее время количество недоставленных писем - как мне, так и от меня - стало критическим. Редкий случай, когда удается что-то отправить/получить. Причем всякая ерунда, типа приглашения принять участие в розыгрыше подарков для клиентов, проходит свободно, а действительно нужные вещи если проходят, то с пометкой "спам".

lynx 01.05.2004 00:05

Программы для защиты от спама
 
Philosof
Цитата:

олжен сказать, что за последнее время количество недоставленных писем - как мне, так и от меня - стало критическим. Редкий случай, когда удается что-то отправить/получить. Причем всякая ерунда, типа приглашения принять участие в розыгрыше подарков для клиентов, проходит свободно, а действительно нужные вещи если проходят, то с пометкой "спам".
К сожалению да.
мейл.ру блокирует работу серверов безбожно. Сервер ру-борда забанен у них навно и прочно. Наш сервер забанен на рамблере. Ну, и т.д. Это иллюстрация того, что Джеки называл "нет проблем" - сплошные проблемы :(


Текущее время: 01:33. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»