1.1, Аноним (-), 10:22, 17/03/2018 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Интересно, насколько машинное обучение более точно классифицирует спам по сравнению с баесом и другими статистическими методами? Проводились ли какие-то сравнения или игра не стоит свеч?
http://rspamd.com/doc/modules/neural.html собирается отдельно от Rspamd или жестко пришит? Хотелось бы с ним поэкспериментировать на своих коллекциях (у меня не спам, но принцип тот же нужно вылавливать аномалии в тексте).
| |
|
2.2, Аноним (-), 11:21, 17/03/2018 [^] [^^] [^^^] [ответить]
| +3 +/– |
А байесовский классификатор разве не является одним из методов машинного обучения?
То есть речь следовало бы вести о сравнении различных методов машинного обучения, например, сравнивать байесовский классификатор с нейронными сетями.
| |
|
1.3, Аноним (-), 12:31, 17/03/2018 [ответить] [﹢﹢﹢] [ · · · ]
| –11 +/– |
А зачем фильтровать спам от нормальных писем? Я его не читаю обычно. Это что, какое-то новое извращение — читать спам? Стоит ли попробовать?
| |
|
2.4, Аноним (-), 12:46, 17/03/2018 [^] [^^] [^^^] [ответить]
| +2 +/– |
а представь, что тебе пришло миллион писем
и только одно из них не спам
сколько времени тебе понадобится чтобы его найти
| |
|
3.6, Аноним (-), 13:33, 17/03/2018 [^] [^^] [^^^] [ответить]
| –5 +/– |
А с фильтрой я буду точно знать что у меня в почте только спам? Круто!
| |
|
4.8, Аноним (-), 14:13, 17/03/2018 [^] [^^] [^^^] [ответить]
| +2 +/– |
С фильтром твоя попка окажется целой, когда главбух не получит важного письма из налоговой.
| |
|
5.21, Аноним (-), 18:56, 17/03/2018 [^] [^^] [^^^] [ответить]
| –3 +/– |
То есть она заставит главбуха читать спам?! О, это действительно новое слово в извращениях!
| |
|
|
|
|
1.5, CHERTS (??), 13:14, 17/03/2018 [ответить] [﹢﹢﹢] [ · · · ]
| –1 +/– |
Использую rspamd более года на 4 серверах - доволен как слон, спамассасин - гори в аду.
| |
|
2.9, Аноним (-), 14:16, 17/03/2018 [^] [^^] [^^^] [ответить]
| +1 +/– |
> Использую rspamd более года на 4 серверах - доволен как слон, спамассасин
> - гори в аду.
Интересный способ обосновать тех. специалистам необходимость перехода на rspamd.
Больше конкретики:
- почему SA должен гореть а аду?
- сколько нод rspamd у тебя работает в рамках одной почтовой системы, сколько нод было SA в рамках одной почтовой системы?
- сколько писем в секунду обрабатывает твоя почтовая система?
| |
|
3.16, kvaps (ok), 15:00, 17/03/2018 [^] [^^] [^^^] [ответить]
| +1 +/– |
В чем главное отличие Rspamd от Spamassasin?
1. Всё проверки в Rspamd полностью параллельны.
2. В отличии от SA использует milter протокол.
3. Легко масштабируется на большое количество серверов.
4. Имеет незамысловатый конфиг и какую-никакую веб-морду.
Использовал Rspamd для нескольких своих серверов, был тоже доволен как слон и тоже всем советую.
| |
|
4.30, Mikula7479 (?), 12:13, 18/03/2018 [^] [^^] [^^^] [ответить]
| +1 +/– |
>2. В отличии от SA использует milter протокол.
Странно, spamass-milter работает уже так давно, что уже и забыл в каком году устанавливал.
| |
|
|
2.51, StraNNicK (??), 10:21, 21/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
Подскажите, как ему сказать, что для вот этих получателей нужно пропускать всё?
Что-то я доки читал, но не осилил.
| |
|
1.7, ua9oas (ok), 13:46, 17/03/2018 [ответить] [﹢﹢﹢] [ · · · ] | +/– | И а что народу в спамерских письмах сейчас приходит Вот мне например лет 10-12 ... большой текст свёрнут, показать | |
|
2.10, Аноним (-), 14:21, 17/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
Для ответа на вопрос вам нужен системный админинстратор. Маловероятно, что кто-то будет в этом треде устраивать чат ради выяснения деталей конкретно вашей конфигурации.
| |
2.12, YetAnotherOnanym (ok), 14:46, 17/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
Да уж, тренинги и семинары доставали неимоверно. Ещё, помнится, были доставка сборных грузов, надувная акула, которая плавает под потолком, заработок в интернете... Ещё какая-то московская зубодёрня активно рекламировалась. Один раз прислали свеженький вирус, который не во всех базах был, разослал его всем производителям антивирусов, у кого есть бесплатные версии.
| |
|
3.15, Аноним (-), 14:54, 17/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
> надувная акула, которая плавает под потолком
что за акула, может мне такой прям щас не хватает?
(настраиваешь-настраиваешь фильтры, а потом жизнь проходит мимо тебя)
| |
|
2.14, Аноним (-), 14:52, 17/03/2018 [^] [^^] [^^^] [ответить] | +/– | так это от твоего профиля зависит да, у спаммеров есть на тебя профиль, а ты ду... большой текст свёрнут, показать | |
|
1.13, Некто (??), 14:50, 17/03/2018 [ответить] [﹢﹢﹢] [ · · · ]
| +2 +/– |
>доступны модули для проверки отправителя с использованием SPF, подтверждения домена отправителя через DKIM, формирования запросов в списки DNSBL
Народ совсем забыл "бритву Оккама" - не плоди сущности без надобности.
Все выше перечисленное уже встроено в современные MTA (exim из коробки, например). Нет разве только различного статистического анализа. Но вопрос допустимости анализа содержимого переписки - это не сколько технический, сколько этический вопрос. Тут не сложно переступить грань. Сбор предпочтений, поведенческих патернов и т.п. И вот уже нарисовался Гугл во всей красе - с чужим спамом успешно борется, при этом собирая всю возможную информацию о пользователях с целью продвижения своего гиганского рекламного бизнеса. По сравнению с Гуглом большинство спамеров - младшая группа детского сада.
| |
|
2.17, Аноним (-), 15:02, 17/03/2018 [^] [^^] [^^^] [ответить] | +2 +/– | современные mta обычно не умеют все вышеперечисленное использовать как _маркер_,... большой текст свёрнут, показать | |
|
3.19, angra (ok), 16:34, 17/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
> современные mta обычно не умеют все вышеперечисленное использовать как _маркер_, и принимать решение на основании комбинации маркеров с разными весами,
В exim это сделать вполне можно, как впрочем и много чего еще.
> или делать это очень неудобно.
Языки конфигов MTA придумывали инопланетяне, причем разные, тут не посопришь. Но если MTA всё равно придется настраивать и с этим извратом разбираться, то почему на нем же не сделать и подобные проверки. Другое дело, если используется дефолтный конфиг с минимальными изменениями, которые можно нагуглить, не вникая в суть, тогда внешняя проверка действительно будет удобней.
| |
|
4.22, пох (?), 00:02, 18/03/2018 [^] [^^] [^^^] [ответить]
| –1 +/– |
> В exim это сделать вполне можно, как впрочем и много чего еще.
наверное, можно, только очень неудобно - проверок много, выполняются они на разных этапах и по разному содержимому - что-то на коннекте, что-то на конверте, что-то по содержанию письма, промежуточный score надо где-то хранить и решение принимать в самом конце - оно вот тебе - надо?
(проверочный тест: "а теперь давайте relay reputation считать с другим весом, что-то он перестал надежно работать" - хочется тебе искать это место в здоровенном конфиге и править, чтоб ничего рядом не сломать?)
Я когда-то что-то подобное даже для sendmail делал (arith map наше всьо), но это был явный троллейбус из буханки.
mta предназначены для передачи почты - вот пусть они ее и передают. А анализом и сортировкой пусть занимается специальный софт. Даже если язык конфигов у него тоже феноменально дурацкий, сам конфиг, заточенный под другую задачу, все равно будет проще и удобочитаемей.
| |
|
5.26, angra (ok), 03:51, 18/03/2018 [^] [^^] [^^^] [ответить]
| +2 +/– |
> наверное, можно, только очень неудобно - проверок много, выполняются они на разных этапах и по разному содержимому - что-то на коннекте, что-то на конверте, что-то по содержанию письма, промежуточный score надо где-то хранить и решение принимать в самом конце - оно вот тебе - надо?
Оно неудобно только, если админ не разобрался с конфигурацией exim и правит ее копипастами. Если же он сам написал продуманный конфиг для более менее серьезной обработки почты, то добавление туда еще пары лишних проверок особой сложности не представляет.
> проверочный тест: "а теперь давайте relay reputation считать с другим весом, что-то он перестал надежно работать" - хочется тебе искать это место в здоровенном конфиге и править, чтоб ничего рядом не сломать?
Ну значит конфиги ты писать не умеешь. Веса выносятся в переменные, объявляемые в одном месте, или вообще в БД, если значения может тюнить каждый юзер под себя.
> mta предназначены для передачи почты - вот пусть они ее и передают. А анализом и сортировкой пусть занимается специальный софт.
Это при условии, что задача конкретного экземпляра MTA тривиальна: для своих доменов принимать, от своих посылать, остальное заворачивать. Но бывает, что она куда сложнее, тогда специальный софт только добавит проблем, так как вместо вникания в одну систему, придется вникать в две.
| |
|
6.28, пох (?), 08:10, 18/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
> Ну значит конфиги ты писать не умеешь. Веса выносятся в переменные, объявляемые в одном месте,
> или вообще в БД, если значения может тюнить каждый юзер под себя.
получаем вообще монстроидальную херь, в которой за пределами вынесенного в отдельные места (и далеко не только веса там будут) что-то поправить может только автор (потому что это уже не конфиг, а натуральная непростая программа - на очень неудобочитаемом языке программирования)
сравниваем с конфигом спам-фильтра (вряд ли нам понадобится лазить в его код), начинаем сомневаться в профпригодности автора, крайне гордого тем, что "умеет писать конфиги" - видимо, как одному-единственному языку научился, так и "умеет", человек-имеющий-молоток.
> так как вместо вникания в одну систему, придется вникать в две.
какой ужас!
Ничего, что работа админа обычно не в тщательной полировке единственной системы, и вникать надо не в две, а в двестидве? И желательно сохранять каждую в достаточно простом состоянии, дабы следующему не пришлось проходить спецкурс обучения "что мы тут на коленке необычного наслесарили"
(не говоря уже о возможности простой изоляции проблем или апгрейда/замены части системы, а не вот этого всего, заботливо выпиленного из монолитной глыбы чугуния)
| |
|
|
|
5.27, angra (ok), 03:56, 18/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
Да хоть десять, особенно разных, неплохая гимнастика для ума.
| |
|
|
3.36, scorry (ok), 19:24, 18/03/2018 [^] [^^] [^^^] [ответить]
| –1 +/– |
> современные mta обычно не умеют все вышеперечисленное использовать как _маркер_, и принимать решение на основании комбинации маркеров с разными весами, или делать это очень неудобно. Да и не их это задача.
Современному MTA при нормальных настройках антиспам не особо и нужен. 99% процентов спама в ящиках от гугла и прочих шаровых провайдеров обусловлена приёмом почты от серверов с подделкой обратного адреса. Нетрудно напрячь голову и рукм на полчаса и настроить почту, чтобы отсеивать этих кидди-спамеров. После этого так называемая борьба со спамом заключается в десяти-двадцати ленивых письмах хостерам на неосвоенных площадках, где более продвинутые горе-спамеры-рекламисты тщательно, с SPF, DKIM и легальным обратным адресом рассылают то, что остаётся из неотфильтрованного.
| |
|
|
3.29, пох (?), 08:24, 18/03/2018 [^] [^^] [^^^] [ответить]
| –1 +/– |
> Про "бритву Оккама" забыли писатели MTA, превращающие свои творения в комбайны с
> развесистыми фичами.
да нет, комбайн иногда нужен (не у всех почта только от крона руту локалхоста ходит) - но те его части, которые заменяются одной строчкой обращения к milter или аналогу - нафиг не.
поверь человеку, вынужденному пару лет прообниматься с развесистым экзимовским конфигом массхостера - выкинуть это и заменить чем-то более простым (вручную потом обеспечивая этой простоте интеграцию с биллингом и юзерфрендли "панелью") никто из моих товарищей по несчастью почему-то не хотел ;-)
| |
3.32, Аноним (-), 15:38, 18/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
> Про "бритву Оккама" забыли писатели MTA, превращающие свои творения в комбайны с развесистыми фичами.
Вообще-то есть MTA кроме exim.
| |
|
2.46, Vsevolod Stakhov (?), 14:16, 19/03/2018 [^] [^^] [^^^] [ответить]
| +2 +/– |
>>доступны модули для проверки отправителя с использованием SPF, подтверждения домена отправителя через DKIM, формирования запросов в списки DNSBL
> Народ совсем забыл "бритву Оккама" - не плоди сущности без надобности.
> Все выше перечисленное уже встроено в современные MTA (exim из коробки, например).
> Нет разве только различного статистического анализа. Но вопрос допустимости анализа содержимого
> переписки - это не сколько технический, сколько этический вопрос. Тут не
> сложно переступить грань. Сбор предпочтений, поведенческих патернов и т.п. И вот
> уже нарисовался Гугл во всей красе - с чужим спамом успешно
> борется, при этом собирая всю возможную информацию о пользователях с целью
> продвижения своего гиганского рекламного бизнеса. По сравнению с Гуглом большинство спамеров
> - младшая группа детского сада.
Все это хорошо, вот только Exim и производительность находятся где-то в разных участках вселенной. Ну и будучи мейнтейнером этого MTA во фре, я приобрел навык механического составления vulxml записей - так часто там находят дыры. А все из-за специфического стиля авторов, который при сборке вываливает более 9000 варнингов насчет dangling else и прочего. Уж не говоря о прекрасном файле globals.c (ознакомьтесь на досуге). Поэтому использовать Exim я не рекоммендую никому.
И да, заранее отвечая на возможную предъяву по поводу plain C и Rspamd: если бы я его начинал писать сейчас, то выбрал бы раст или хотя бы modern C++, но в 2007-м выбор средств для системного программирования был весьма ограничен. Поэтому сейчас вся логика пишется, где возможно, на Lua, и это, поверьте, не настолько инопланетянский язык, как та страшная помесь тикля и перла, используемая в Exim.
| |
|
|
2.31, A (?), 14:25, 18/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
Возможно, массовости не хватает OpenSMTPd. Массовости и возможностей. Кому не надо много - ставят Postfix, кому хочется глубоко и подробно - ставят Exim. А OpenSMTPd вроде и неплохой, но кто будет на него переходить просто так?
| |
|
3.37, Аноним (-), 21:28, 18/03/2018 [^] [^^] [^^^] [ответить]
| –4 +/– |
Exim больше не ставят это "Чёрный ящик", нефига не секюрно на весь интернет выставлять его,
| |
3.38, пох (?), 00:20, 19/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
> Кому не надо много - ставят Postfix
openrelay в каждой установке по умолчанию, ага, ага. Не говоря уже про дистрибутивные конфиги.
(только сегодня в очередной раз получил этот подарочек - а я-то думал, что это мне с этого хостера столько спама сыплется... ну да, ну да - mynetwork_style=subnet. сабнет там /24, и это только в самом дешевом инстансе. В дорогом включена вторая сетевая, а из-за бага в коде это автоматически добавляет весь интернет в mynetwork. И нет, это не умолчание (хотя это старая система и оно именно такое), это скрипты установщика потрудились, явно прописано.)
| |
|
|
5.47, пох (?), 00:10, 20/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
> Да ну?
ну да. http://www.postfix.org/BASIC_CONFIGURATION_README.html
mynetworks_style = subnet (default: authorize subnetworks)
[skip]
The default is to listen on all active interfaces.
при этом снять его с ручника в виде заботливо всунутого инсталлятором/пакетозаворачивателем inet_interfaces = localhost может каждый дурак, которому понадобилось принимать не только от крона руту локалхоста, а вот догадаться о смысле загадочной переменной и особенно - если ее в конфиге вообще нет - далеко не каждый и умный, но не сталкивавшийся с подобной подлянкой раньше.
"postfix - 20 лет рассылали спам!" (по-моему, в последних третьих все же уже host?)
и да, я знаю только один mta с похожими умолчаниями из коробки - qmail. Но тот хотя бы не релеит по-умолчанию. (впрочем, кого это останавливало...)
| |
|
6.50, _ (??), 22:19, 20/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
Да ладно, задокументированный баг - есть фича! (С) :)
| |
|
|
|
|
2.45, Vsevolod Stakhov (?), 14:09, 19/03/2018 [^] [^^] [^^^] [ответить]
| –1 +/– |
Это вопрос к OpenSMTPD, который три года обещал filters API, а потом там решили, что осилить это у них не выйдет. А так к Rspamd можно сходить по plain HTTP (не заморачиваясь поддержкой идиотского протокола milter'а), а ответ получить в виде JSON. Что может быть проще вообще?
| |
|
3.48, пох (?), 00:13, 20/03/2018 [^] [^^] [^^^] [ответить]
| +1 +/– |
> к Rspamd можно сходить по plain HTTP (не заморачиваясь поддержкой идиотского
> протокола milter'а), а ответ получить в виде JSON. Что может быть
> проще вообще?
э... ну да, ну да, современный программист. Что может быть проще сложного сетевого протокола, предназначенного совсем не для этой цели, и парсинга полутекстового формата, особенно если сделать то и другое, приляпав к mta пару вечнодырявых "стандартных" библиотек?
при всей долбанутости libmilter, лучше уж я буду дружить с ней.
| |
|
4.49, Vsevolod Stakhov (?), 12:53, 20/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
Это HTTP 1.0 сложный? Или JSON, описанный в RFC, парсер для которого есть на любом языке, кроме разве что эзотерических (https://www.json.org/)?
Нет, лучше использовать кривой stateful протокол, единственная спецификация к которому существует в виде корявой поделки Оллмана. Ну и поддерживается он аж целыми двумя MTA в мире, а мы говорили про OpenSMTPD изначально. Хотя можете попробовать предложить поддерживать milter авторам данного MTA - это будет смешно.
И да, расскажите нам про "вечнодырявые" библиотеки для обработки HTTP 1.0 и JSON, раз уж вступили в дискуссию. Например, про joyent http parser или picohttp для первого и jsmn для второго.
| |
|
|
|
1.39, SubGun (ok), 01:01, 19/03/2018 [ответить] [﹢﹢﹢] [ · · · ]
| –2 +/– |
Нет, мужик, не дожал ты, не дожал. Недостаточно хипстерская система получилась. Кроме эластика с редисом, нужен докер-образ и блокчейн прикрутить.
| |
|
|
3.52, SubGun (ok), 23:24, 22/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
> будто что-то плохое
Просто всему свое место. А тут слишком много пытаются напихать, все новомодные фишечки.
Логи спам фильтра-не логи почтаря, смысл их хранить на эластике? Типа удобный поиск? Ну да. А что, часто кто лазит в эти логи? Нет. Тогда нафиг?
Редис - это хорошо. Но я себе слабо представляю, что там можно хранить такого, что потребует скорости memory based db.
| |
|
4.53, www2 (??), 11:48, 23/03/2018 [^] [^^] [^^^] [ответить]
| +/– |
>Но я себе слабо представляю, что там можно хранить такого, что потребует скорости memory based db.
Я себе слабо представляю, что там можно хранить такого, чего нельзя хранить непосредственно в памяти самого процесса. Redis тут скорее к месту как средство межпроцессного взаимодействия, когда есть несколько экземпляров rspamd, запущенных на разных машинах, которым нужны одинаковые для всех данные.
| |
|
|
|
|