The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Полезные лингвистические Perl модули, преобразование и определение кодировки

Дата
22 Dec 2003
ЗаголовокПолезные лингвистические Perl модули, преобразование и определение кодировки
Пояснение
  • Lingua::Ispell - проверка орфографии;
  • Lingua::Ident - автоопределение языка по отрывку текста;
  • Lingua::Num2Word - преобразование цифр в буквенное написание;
  • Lingua::RU::Number - буквенное написание денежной суммы (в рублях);
  • Lingua::RU::PhTranslit - преобразование текста в правильный транслит или другую русскую кодировку;
  • Lingua::DetectCharset, Lingua::DetectCyrillic - определение русской кодировки по отрывку текста;
  • PerlIO::locale - прозрачное перекодирование текста при чтении и записи в файл;
  • Convert::Cyrillic - преобразование из одной кодировки в другую (включая поддержку UTF-8);
  • Snowball Stemmer - работа с русскими словарными формами (стемминг, выделение корня убирая суффиксы и окончания). perl интерфейс (для стеммера любого языка) - "Lingua::Stem::Snowball".
  • В сети так-же доступны исходные тексты стеммера от Andrew Kovalenko, см. так же статью Вероятностный морфологический анализатор русского и украинского языков.
  • Home URLhttp://search.cpan.org/
    Флагenglish
    Обновление26 Mar 2013
    Стаб. вер.5.16.3
    РазделПолезные Perl модули.
    Ключи

     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    << Предыдущие 15 записей
    - 02.01.2018 Создания WiFi-ретрансляторов с поддержкой построения Mesh-сети
    - 27.12.2017 Как увеличить охват квартиры точкой доступа при помощи алюминиевой фольги
    - 12.12.2017 Обход ограничения доступа к материалам сайтов для платных подписчиков
    - 02.12.2017 Сборка ChromiumOS из исходных текстов для запуска в QEMU
    - 29.11.2017 Возвращение к жизни Skype 4.3 для Linux
    - 10.11.2017 Сборка системы виртуализации crosvm из Chrome OS в обычном дистрибутиве Linux
    - 24.10.2017 Еscape-последовательности в сеансе OpenSSH
    - 10.09.2017 Использование CAA записей в DNS для защиты от генерации фиктивных HTTPS-сертификатов
    - 08.09.2017 Настройка ротации логов MongoDB
    - 26.07.2017 Быстрый посмотр конфигурации GEOM во FreeBSD
    - 25.07.2017 Проверка безопасности беспроводной сети WPA/WPA2 при помощи Aircrack-ng и Hashcat
    - 08.07.2017 Наиболее простой способ получения и обновления сертификатов Let's Encrypt
    - 09.06.2017 Создание QR-кода в консоли, чтобы быстро перенести текст на смартфон
    - 24.05.2017 Просмотр подсказок/шпаргалок по командам UNIX/Linux в командной строке
    - 21.04.2017 Как подключить в Ubuntu диски Seagate Business NAS и восстановить данные
    Следующие 15 записей >>




    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру