Дата | | Заголовок | Полезные лингвистические Perl модули, преобразование и определение кодировки |
Пояснение | Lingua::Ispell - проверка орфографии;
Lingua::Ident - автоопределение языка по отрывку текста;
Lingua::Num2Word - преобразование цифр в буквенное написание;
Lingua::RU::Number - буквенное написание денежной суммы (в рублях);
Lingua::RU::PhTranslit - преобразование текста в правильный транслит или другую русскую кодировку;
Lingua::DetectCharset, Lingua::DetectCyrillic - определение русской кодировки по отрывку текста;
PerlIO::locale - прозрачное перекодирование текста при чтении и записи в файл;
Convert::Cyrillic - преобразование из одной кодировки в другую (включая поддержку UTF-8);
Snowball Stemmer - работа с русскими словарными формами (стемминг, выделение корня убирая суффиксы и окончания). perl интерфейс (для стеммера любого языка) - "Lingua::Stem::Snowball".
В сети так-же доступны исходные тексты стеммера от Andrew Kovalenko, см. так же статью Вероятностный морфологический анализатор русского и украинского языков. |
Home URL | http://search.cpan.org/ |
Флаг | english |
Обновление | 26 Mar 2013 | Стаб. вер. | 5.16.3 |
Раздел | Полезные Perl модули.
|
Ключи | perl, ispell, charset, convert, text, translate, search, spell, rus, (найти похожие документы) |
|
|