Доброго времени суток!История стара как мир, но много времени гугления, к сожалению, не дали результатов.
*** Общая схема работы почтового сервера по части антиспама: ***
На сервере стоит postfix + dovecot + amavis new + spamassassin.
Почтовый сервер те письма, которые помечены как spamassassin'ом "спам", автоматически кладет в папки .Spam клиентов.
Для spamassassin'а я написал cron-job, который по ночам схематически работает примерно так:
- скармливает sa-learn'у письма за последнюю неделю из всех каталогов .Spam как "spam";
- скармливает sa-learn'у прочитанные письма за последнюю неделю (кроме удаленных) из всех остальных каталогов как "ham";
- autolearn, соответственно, = disabled в конфигах.
В день получается примерно 10...30 новых ham-писем и порядка нескольких десятков-нескольких сотен spam-писем (когда как). Обучалка обучает spamassassin чуть больше месяца. Т.е. примерно скормлено порядка 400 ham-писем и несколько тысяч spam-писем.
У меня не стоят никакие русские правила для спамассасина (может это и неправильно, не знаю - если у кого есть ссылки на _свежие_ списки и отзывы по их использованию - буду признателен, потому что в сети я нашел только грубо говоря 2003го года, и побоялся их прикручивать).
*** Вопросы ***
Основной вопрос, собственно, таков: как увидеть, что bayes работает? Вот кусок из заголовков письма-спама:
X-Spam-Flag: Yes
X-Spam-Score: 5.112
tagged_above=-1000
required=3.5
tests=[FUZZY_XPILL=1.752, HTML_MESSAGE=0.001, URIBL_DBL_SPAM=1.7, URIBL_WS_SURBL=1.659]
autolearn=disabled
5.112 - это точная сумма всех спам-тестов, которые прошло письмо. Т.е. получается, что bayes как-то никак не используется, или как? Я подозреваю, что у меня тут большой провал в базовых знаниях по тематике, но я не сисадмин - просто надо было настроить всё, не бейте сильно :)
Вопрос 2: как bayes дружит с кириллицей? (и дружит ли вообще?)
В ответах просьба не сильно советовать что-то кардинально другое, ибо я и это-то настроил всё за несколько дней. А перестраивать будет гораздо сложнее, да и не вижу особого смысла.
В общем, помогите, пожалуйста, что-то "пнуть", чтобы эта система заработала, и в день не валилось по 50 писем спама в каждый ящик.
Заранее благодарю.